Diff 508184

llvm/lib/Target/SystemZ/SystemZISelLowering.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 1,099 Lines • ▼ Show 20 Lines	getSingleConstraintMatchWeight(AsmOperandInfo &info,
default:		default:
weight = TargetLowering::getSingleConstraintMatchWeight(info, constraint);		weight = TargetLowering::getSingleConstraintMatchWeight(info, constraint);
break;		break;

case 'a': // Address register		case 'a': // Address register
case 'd': // Data register (equivalent to 'r')		case 'd': // Data register (equivalent to 'r')
case 'h': // High-part register		case 'h': // High-part register
case 'r': // General-purpose register		case 'r': // General-purpose register
if (CallOperandVal->getType()->isIntegerTy())		weight = CallOperandVal->getType()->isIntegerTy() ? CW_Register : CW_Default;
weight = CW_Register;
break;		break;

		uweigandUnsubmitted Done Reply Inline Actions All this `CW_Default` stuff is confusing - isn't this, well, the default? uweigand: All this `CW_Default` stuff is confusing - isn't this, well, the default?
		jonpaAuthorUnsubmitted Done Reply Inline Actions Yeah, I was just following the pattern in use, but I guess it's more readable this way. jonpa: Yeah, I was just following the pattern in use, but I guess it's more readable this way.
		uweigandUnsubmitted Not Done Reply Inline Actions Ah, sorry - I overlooked the default was `CW_Invalid`, not `CW_Default`. And in fact the default has to be `CW_Invalid`, since this is critical for the various constant constraints like `'I'`. If the argument is not an in-range constant, this has to be refused. uweigand: Ah, sorry - I overlooked the default was `CW_Invalid`, not `CW_Default`. And in fact the…
		jonpaAuthorUnsubmitted Done Reply Inline Actions ouch - yeah, I guess it needs to handle those cases as well. jonpa: ouch - yeah, I guess it needs to handle those cases as well.
case 'f': // Floating-point register		case 'f': // Floating-point register
if (type->isFloatingPointTy())		if (!useSoftFloat())
weight = CW_Register;		weight = type->isFloatingPointTy() ? CW_Register : CW_Default;
break;		break;
		uweigandUnsubmitted Not Done Reply Inline Actions Also, this makes me wonder now if we should return `CW_Invalid` here if soft-float (and similarly for 'v' and no-vector). uweigand: Also, this makes me wonder now if we should return `CW_Invalid` here if soft-float (and…
		jonpaAuthorUnsubmitted Done Reply Inline Actions IIUC, the multiple-alternative decision is the same for all operands, and if one of the operands is invalid in that alternative, the search continues still in other alternatives. So I guess it would make sense to return CW_Invalid and then perhaps end up with a legal alternative, rather than giving the error message in case it would end up with the illegal alternative. jonpa: IIUC, the multiple-alternative decision is the same for all operands, and if one of the…

case 'v': // Vector register		case 'v': // Vector register
if ((type->isVectorTy() \|\| type->isFloatingPointTy()) &&		if (Subtarget.hasVector())
Subtarget.hasVector())		weight = (type->isVectorTy() \|\| type->isFloatingPointTy()) ? CW_Register
weight = CW_Register;		: CW_Default;
break;		break;

case 'I': // Unsigned 8-bit constant		case 'I': // Unsigned 8-bit constant
if (auto *C = dyn_cast<ConstantInt>(CallOperandVal))		if (auto *C = dyn_cast<ConstantInt>(CallOperandVal))
if (isUInt<8>(C->getZExtValue()))		if (isUInt<8>(C->getZExtValue()))
weight = CW_Constant;		weight = CW_Constant;
break;		break;

▲ Show 20 Lines • Show All 45 Lines • ▼ Show 20 Lines
SystemZTargetLowering::getRegForInlineAsmConstraint(		SystemZTargetLowering::getRegForInlineAsmConstraint(
const TargetRegisterInfo *TRI, StringRef Constraint, MVT VT) const {		const TargetRegisterInfo *TRI, StringRef Constraint, MVT VT) const {
if (Constraint.size() == 1) {		if (Constraint.size() == 1) {
// GCC Constraint Letters		// GCC Constraint Letters
switch (Constraint[0]) {		switch (Constraint[0]) {
default: break;		default: break;
case 'd': // Data register (equivalent to 'r')		case 'd': // Data register (equivalent to 'r')
case 'r': // General-purpose register		case 'r': // General-purpose register
if (VT == MVT::i64)		if (VT.getSizeInBits() == 64)
return std::make_pair(0U, &SystemZ::GR64BitRegClass);		return std::make_pair(0U, &SystemZ::GR64BitRegClass);
else if (VT == MVT::i128)		else if (VT.getSizeInBits() == 128)
return std::make_pair(0U, &SystemZ::GR128BitRegClass);		return std::make_pair(0U, &SystemZ::GR128BitRegClass);
return std::make_pair(0U, &SystemZ::GR32BitRegClass);		return std::make_pair(0U, &SystemZ::GR32BitRegClass);

case 'a': // Address register		case 'a': // Address register
if (VT == MVT::i64)		if (VT == MVT::i64)
return std::make_pair(0U, &SystemZ::ADDR64BitRegClass);		return std::make_pair(0U, &SystemZ::ADDR64BitRegClass);
else if (VT == MVT::i128)		else if (VT == MVT::i128)
return std::make_pair(0U, &SystemZ::ADDR128BitRegClass);		return std::make_pair(0U, &SystemZ::ADDR128BitRegClass);
return std::make_pair(0U, &SystemZ::ADDR32BitRegClass);		return std::make_pair(0U, &SystemZ::ADDR32BitRegClass);

case 'h': // High-part register (an LLVM extension)		case 'h': // High-part register (an LLVM extension)
return std::make_pair(0U, &SystemZ::GRH32BitRegClass);		return std::make_pair(0U, &SystemZ::GRH32BitRegClass);

case 'f': // Floating-point register		case 'f': // Floating-point register
if (!useSoftFloat()) {		if (!useSoftFloat()) {
if (VT == MVT::f64)		if (VT.getSizeInBits() == 64)
return std::make_pair(0U, &SystemZ::FP64BitRegClass);		return std::make_pair(0U, &SystemZ::FP64BitRegClass);
else if (VT == MVT::f128)		else if (VT.getSizeInBits() == 128)
return std::make_pair(0U, &SystemZ::FP128BitRegClass);		return std::make_pair(0U, &SystemZ::FP128BitRegClass);
return std::make_pair(0U, &SystemZ::FP32BitRegClass);		return std::make_pair(0U, &SystemZ::FP32BitRegClass);
}		}
break;		break;

		uweigandUnsubmitted Done Reply Inline Actions Isn't this the same the original code (base class) already does? I don't think we need to change this here at all. uweigand: Isn't this the same the original code (base class) already does? I don't think we need to…
		jonpaAuthorUnsubmitted Done Reply Inline Actions ok jonpa: ok
case 'v': // Vector register		case 'v': // Vector register
if (Subtarget.hasVector()) {		if (Subtarget.hasVector()) {
if (VT == MVT::f32)		if (VT.getSizeInBits() == 32)
return std::make_pair(0U, &SystemZ::VR32BitRegClass);		return std::make_pair(0U, &SystemZ::VR32BitRegClass);
if (VT == MVT::f64)		if (VT.getSizeInBits() == 64)
return std::make_pair(0U, &SystemZ::VR64BitRegClass);		return std::make_pair(0U, &SystemZ::VR64BitRegClass);
return std::make_pair(0U, &SystemZ::VR128BitRegClass);		return std::make_pair(0U, &SystemZ::VR128BitRegClass);
}		}
break;		break;
}		}
}		}
if (Constraint.size() > 0 && Constraint[0] == '{') {		if (Constraint.size() > 0 && Constraint[0] == '{') {

		// A clobber constraint (e.g. ~{f0}) will have MVT::Other which is illegal
		// to check the size on.
		auto getVTSizeInBits = [&VT]() {
		return VT == MVT::Other ? 0 : VT.getSizeInBits();
		};

		uweigandUnsubmitted Done Reply Inline Actions However, I'm wondering if we shouldn't also make the same set of changes in this block, so enable the same logic for explicitly named register constraints like `{f0}`. uweigand: However, I'm wondering if we shouldn't also make the same set of changes in this block, so…
// We need to override the default register parsing for GPRs and FPRs		// We need to override the default register parsing for GPRs and FPRs
// because the interpretation depends on VT. The internal names of		// because the interpretation depends on VT. The internal names of
// the registers are also different from the external names		// the registers are also different from the external names
// (F0D and F0S instead of F0, etc.).		// (F0D and F0S instead of F0, etc.).
if (Constraint[1] == 'r') {		if (Constraint[1] == 'r') {
if (VT == MVT::i32)		if (getVTSizeInBits() == 32)
return parseRegisterNumber(Constraint, &SystemZ::GR32BitRegClass,		return parseRegisterNumber(Constraint, &SystemZ::GR32BitRegClass,
SystemZMC::GR32Regs, 16);		SystemZMC::GR32Regs, 16);
if (VT == MVT::i128)		if (getVTSizeInBits() == 128)
return parseRegisterNumber(Constraint, &SystemZ::GR128BitRegClass,		return parseRegisterNumber(Constraint, &SystemZ::GR128BitRegClass,
SystemZMC::GR128Regs, 16);		SystemZMC::GR128Regs, 16);
return parseRegisterNumber(Constraint, &SystemZ::GR64BitRegClass,		return parseRegisterNumber(Constraint, &SystemZ::GR64BitRegClass,
SystemZMC::GR64Regs, 16);		SystemZMC::GR64Regs, 16);
}		}
if (Constraint[1] == 'f') {		if (Constraint[1] == 'f') {
if (useSoftFloat())		if (useSoftFloat())
return std::make_pair(		return std::make_pair(
0u, static_cast<const TargetRegisterClass *>(nullptr));		0u, static_cast<const TargetRegisterClass *>(nullptr));
if (VT == MVT::f32)		if (getVTSizeInBits() == 32)
return parseRegisterNumber(Constraint, &SystemZ::FP32BitRegClass,		return parseRegisterNumber(Constraint, &SystemZ::FP32BitRegClass,
SystemZMC::FP32Regs, 16);		SystemZMC::FP32Regs, 16);
if (VT == MVT::f128)		if (getVTSizeInBits() == 128)
return parseRegisterNumber(Constraint, &SystemZ::FP128BitRegClass,		return parseRegisterNumber(Constraint, &SystemZ::FP128BitRegClass,
SystemZMC::FP128Regs, 16);		SystemZMC::FP128Regs, 16);
return parseRegisterNumber(Constraint, &SystemZ::FP64BitRegClass,		return parseRegisterNumber(Constraint, &SystemZ::FP64BitRegClass,
SystemZMC::FP64Regs, 16);		SystemZMC::FP64Regs, 16);
}		}
if (Constraint[1] == 'v') {		if (Constraint[1] == 'v') {
if (!Subtarget.hasVector())		if (!Subtarget.hasVector())
return std::make_pair(		return std::make_pair(
0u, static_cast<const TargetRegisterClass *>(nullptr));		0u, static_cast<const TargetRegisterClass *>(nullptr));
if (VT == MVT::f32)		if (getVTSizeInBits() == 32)
return parseRegisterNumber(Constraint, &SystemZ::VR32BitRegClass,		return parseRegisterNumber(Constraint, &SystemZ::VR32BitRegClass,
SystemZMC::VR32Regs, 32);		SystemZMC::VR32Regs, 32);
if (VT == MVT::f64)		if (getVTSizeInBits() == 64)
return parseRegisterNumber(Constraint, &SystemZ::VR64BitRegClass,		return parseRegisterNumber(Constraint, &SystemZ::VR64BitRegClass,
SystemZMC::VR64Regs, 32);		SystemZMC::VR64Regs, 32);
return parseRegisterNumber(Constraint, &SystemZ::VR128BitRegClass,		return parseRegisterNumber(Constraint, &SystemZ::VR128BitRegClass,
SystemZMC::VR128Regs, 32);		SystemZMC::VR128Regs, 32);
}		}
}		}
return TargetLowering::getRegForInlineAsmConstraint(TRI, Constraint, VT);		return TargetLowering::getRegForInlineAsmConstraint(TRI, Constraint, VT);
}		}
▲ Show 20 Lines • Show All 186 Lines • ▼ Show 20 Lines	SDValue Lo = DAG.getTargetExtractSubreg(SystemZ::subreg_l64,
DL, MVT::i64, In);		DL, MVT::i64, In);
return DAG.getNode(ISD::BUILD_PAIR, DL, MVT::i128, Lo, Hi);		return DAG.getNode(ISD::BUILD_PAIR, DL, MVT::i128, Lo, Hi);
}		}

bool SystemZTargetLowering::splitValueIntoRegisterParts(		bool SystemZTargetLowering::splitValueIntoRegisterParts(
SelectionDAG &DAG, const SDLoc &DL, SDValue Val, SDValue *Parts,		SelectionDAG &DAG, const SDLoc &DL, SDValue Val, SDValue *Parts,
unsigned NumParts, MVT PartVT, std::optional<CallingConv::ID> CC) const {		unsigned NumParts, MVT PartVT, std::optional<CallingConv::ID> CC) const {
EVT ValueVT = Val.getValueType();		EVT ValueVT = Val.getValueType();
assert((ValueVT != MVT::i128 \|\|		if (ValueVT.getSizeInBits() == 128 && NumParts == 1 && PartVT == MVT::Untyped) {
((NumParts == 1 && PartVT == MVT::Untyped) \|\|
(NumParts == 2 && PartVT == MVT::i64))) &&
"Unknown handling of i128 value.");
if (ValueVT == MVT::i128 && NumParts == 1) {
// Inline assembly operand.		// Inline assembly operand.
Parts[0] = lowerI128ToGR128(DAG, Val);		Parts[0] = lowerI128ToGR128(DAG, DAG.getBitcast(MVT::i128, Val));
return true;		return true;
}		}

		uweigandUnsubmitted Done Reply Inline Actions Maybe we should just merge the two if blocks into a something like: if (ValueVT.getSizeInBits() == 128 && NumParts == 1 && PartVT == MVT::Untyped) { if (ValueVT != MVT::i128) Val = DAG.getNode(ISD::BITCAST, SDLoc(Val), MVT::i128, Val); Parts[0] = lowerI128ToGR128(DAG, Val); } and similarly below. uweigand: Maybe we should just merge the two if blocks into a something like: ``` if (ValueVT.
		jonpaAuthorUnsubmitted Done Reply Inline Actions Yes - and the getBitcast() has the type check so even better. I removed the assertions because they didn't seem to be of much use anymore now that we are bitcasting ValueVT and also checking carefully in the if statement. jonpa: Yes - and the getBitcast() has the type check so even better. I removed the assertions because…
return false;		return false;
}		}

SDValue SystemZTargetLowering::joinRegisterPartsIntoValue(		SDValue SystemZTargetLowering::joinRegisterPartsIntoValue(
SelectionDAG &DAG, const SDLoc &DL, const SDValue *Parts, unsigned NumParts,		SelectionDAG &DAG, const SDLoc &DL, const SDValue *Parts, unsigned NumParts,
MVT PartVT, EVT ValueVT, std::optional<CallingConv::ID> CC) const {		MVT PartVT, EVT ValueVT, std::optional<CallingConv::ID> CC) const {
assert((ValueVT != MVT::i128 \|\|		if (ValueVT.getSizeInBits() == 128 && NumParts == 1 && PartVT == MVT::Untyped) {
((NumParts == 1 && PartVT == MVT::Untyped) \|\|
(NumParts == 2 && PartVT == MVT::i64))) &&
"Unknown handling of i128 value.");
if (ValueVT == MVT::i128 && NumParts == 1)
// Inline assembly operand.		// Inline assembly operand.
return lowerGR128ToI128(DAG, Parts[0]);		SDValue Res = lowerGR128ToI128(DAG, Parts[0]);
		return DAG.getBitcast(ValueVT, Res);
		}

return SDValue();		return SDValue();
		uweigandUnsubmitted Done Reply Inline Actions It's a bit confusing that this accepts any type with getSizeInBits 128, but then hardcodes `MVT::f128` as result type. Shouldn't this simply bitcast to `ValueVT` then? uweigand: It's a bit confusing that this accepts any type with getSizeInBits 128, but then hardcodes `MVT…
		jonpaAuthorUnsubmitted Done Reply Inline Actions Makes sense. jonpa: Makes sense.
}		}

SDValue SystemZTargetLowering::LowerFormalArguments(		SDValue SystemZTargetLowering::LowerFormalArguments(
SDValue Chain, CallingConv::ID CallConv, bool IsVarArg,		SDValue Chain, CallingConv::ID CallConv, bool IsVarArg,
const SmallVectorImpl<ISD::InputArg> &Ins, const SDLoc &DL,		const SmallVectorImpl<ISD::InputArg> &Ins, const SDLoc &DL,
SelectionDAG &DAG, SmallVectorImpl<SDValue> &InVals) const {		SelectionDAG &DAG, SmallVectorImpl<SDValue> &InVals) const {
MachineFunction &MF = DAG.getMachineFunction();		MachineFunction &MF = DAG.getMachineFunction();
MachineFrameInfo &MFI = MF.getFrameInfo();		MachineFrameInfo &MFI = MF.getFrameInfo();
▲ Show 20 Lines • Show All 7,608 Lines • Show Last 20 Lines

llvm/test/CodeGen/SystemZ/inline-asm-f-constraint-softfloat.ll

This file was added.

				; RUN: not llc -mtriple=s390x-linux-gnu -mcpu=z15 -mattr=soft-float < %s 2>&1 \| FileCheck %s

				; CHECK: error: couldn't allocate output register for constraint 'f'

				define signext i32 @int_and_f(i32 signext %cc_dep1) {
				entry:
				%0 = tail call i32 asm sideeffect "", "=f,0"(i32 %cc_dep1)
				ret i32 %0
				}

llvm/test/CodeGen/SystemZ/inline-asm-fp-int-casting-explicit-regs-zEC12.ll

This file was added.

				; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py UTC_ARGS: --version 2
				; RUN: llc -mtriple=s390x-linux-gnu -mcpu=zEC12 < %s \| FileCheck %s
				;
				; Test inline assembly where the operand is bitcasted.

				define signext i32 @int_and_f(i32 signext %cc_dep1) {
				; CHECK-LABEL: int_and_f:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: risbhg %r0, %r2, 0, 159, 32
				; CHECK-NEXT: ldgr %f1, %r0
				; CHECK-NEXT: # kill: def $f1s killed $f1s killed $f1d
				; CHECK-NEXT: #APP
				; CHECK-NEXT: #NO_APP
				; CHECK-NEXT: # kill: def $f1s killed $f1s def $f1d
				; CHECK-NEXT: lgdr %r0, %f1
				; CHECK-NEXT: risblg %r0, %r0, 0, 159, 32
				; CHECK-NEXT: lgfr %r2, %r0
				; CHECK-NEXT: br %r14
				entry:
				%0 = tail call i32 asm sideeffect "", "={f1},0"(i32 %cc_dep1)
				ret i32 %0
				}

				define i64 @long_and_f(i64 %cc_dep1) {
				; CHECK-LABEL: long_and_f:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: ldgr %f2, %r2
				; CHECK-NEXT: #APP
				; CHECK-NEXT: #NO_APP
				; CHECK-NEXT: lgdr %r2, %f2
				; CHECK-NEXT: br %r14
				entry:
				%0 = tail call i64 asm sideeffect "", "={f2},0"(i64 %cc_dep1)
				ret i64 %0
				}

				define void @__int128_and_f(ptr noalias nocapture writeonly sret(i128) align 8 %agg.result, ptr %0) {
				; CHECK-LABEL: __int128_and_f:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: ld %f1, 0(%r3)
				; CHECK-NEXT: ld %f3, 8(%r3)
				; CHECK-NEXT: #APP
				; CHECK-NEXT: #NO_APP
				; CHECK-NEXT: std %f1, 0(%r2)
				; CHECK-NEXT: std %f3, 8(%r2)
				; CHECK-NEXT: br %r14
				entry:
				%cc_dep1 = load i128, ptr %0, align 8
				%1 = tail call i128 asm sideeffect "", "={f1},0"(i128 %cc_dep1)
				store i128 %1, ptr %agg.result, align 8
				ret void
				}

				define float @float_and_r(float %cc_dep1) {
				; CHECK-LABEL: float_and_r:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: # kill: def $f0s killed $f0s def $f0d
				; CHECK-NEXT: lgdr %r0, %f0
				; CHECK-NEXT: risblg %r2, %r0, 0, 159, 32
				; CHECK-NEXT: #APP
				; CHECK-NEXT: #NO_APP
				; CHECK-NEXT: risbhg %r0, %r2, 0, 159, 32
				; CHECK-NEXT: ldgr %f0, %r0
				; CHECK-NEXT: # kill: def $f0s killed $f0s killed $f0d
				; CHECK-NEXT: br %r14
				entry:
				%0 = tail call float asm sideeffect "", "={r2},0"(float %cc_dep1)
				ret float %0
				}

				define double @double_and_r(double %cc_dep1) {
				; CHECK-LABEL: double_and_r:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: lgdr %r3, %f0
				; CHECK-NEXT: #APP
				; CHECK-NEXT: #NO_APP
				; CHECK-NEXT: ldgr %f0, %r3
				; CHECK-NEXT: br %r14
				entry:
				%0 = tail call double asm sideeffect "", "={r3},0"(double %cc_dep1)
				ret double %0
				}

				define void @longdouble_and_r(ptr noalias nocapture writeonly sret(fp128) align 8 %agg.result, ptr %0) {
				; CHECK-LABEL: longdouble_and_r:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: lg %r5, 8(%r3)
				; CHECK-NEXT: lg %r4, 0(%r3)
				; CHECK-NEXT: #APP
				; CHECK-NEXT: #NO_APP
				; CHECK-NEXT: stg %r5, 8(%r2)
				; CHECK-NEXT: stg %r4, 0(%r2)
				; CHECK-NEXT: br %r14
				entry:
				%cc_dep1 = load fp128, ptr %0, align 8
				%1 = tail call fp128 asm sideeffect "", "={r4},0"(fp128 %cc_dep1)
				store fp128 %1, ptr %agg.result, align 8
				ret void
				}

				define <2 x i16> @vec32_and_r(<2 x i16> %cc_dep1) {
				; CHECK-LABEL: vec32_and_r:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: # kill: def $r3l killed $r3l def $r3d
				; CHECK-NEXT: # kill: def $r2l killed $r2l def $r2d
				; CHECK-NEXT: risbgn %r3, %r2, 32, 47, 16
				; CHECK-NEXT: # kill: def $r3l killed $r3l killed $r3d
				; CHECK-NEXT: #APP
				; CHECK-NEXT: #NO_APP
				; CHECK-NEXT: srlk %r2, %r3, 16
				; CHECK-NEXT: br %r14
				entry:
				%0 = tail call <2 x i16> asm sideeffect "", "={r3},0"(<2 x i16> %cc_dep1)
				ret <2 x i16> %0
				}

				define <2 x i32> @vec64_and_r(<2 x i32> %cc_dep1) {
				; CHECK-LABEL: vec64_and_r:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: # kill: def $r2l killed $r2l def $r2d
				; CHECK-NEXT: sllg %r5, %r2, 32
				; CHECK-NEXT: lr %r5, %r3
				; CHECK-NEXT: #APP
				; CHECK-NEXT: #NO_APP
				; CHECK-NEXT: lgr %r3, %r5
				; CHECK-NEXT: srlg %r2, %r5, 32
				; CHECK-NEXT: # kill: def $r2l killed $r2l killed $r2d
				; CHECK-NEXT: # kill: def $r3l killed $r3l killed $r3d
				; CHECK-NEXT: br %r14
				entry:
				%0 = tail call <2 x i32> asm sideeffect "", "={r5},0"(<2 x i32> %cc_dep1)
				ret <2 x i32> %0
				}

				define <2 x i16> @vec32_and_f(<2 x i16> %cc_dep1) {
				; CHECK-LABEL: vec32_and_f:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: # kill: def $r3l killed $r3l def $r3d
				; CHECK-NEXT: # kill: def $r2l killed $r2l def $r2d
				; CHECK-NEXT: risbgn %r3, %r2, 32, 47, 16
				; CHECK-NEXT: risbhg %r0, %r3, 0, 159, 32
				; CHECK-NEXT: ldgr %f3, %r0
				; CHECK-NEXT: # kill: def $f3s killed $f3s killed $f3d
				; CHECK-NEXT: #APP
				; CHECK-NEXT: #NO_APP
				; CHECK-NEXT: # kill: def $f3s killed $f3s def $f3d
				; CHECK-NEXT: lgdr %r0, %f3
				; CHECK-NEXT: risblg %r3, %r0, 0, 159, 32
				; CHECK-NEXT: srlk %r2, %r3, 16
				; CHECK-NEXT: br %r14
				entry:
				%0 = tail call <2 x i16> asm sideeffect "", "={f3},0"(<2 x i16> %cc_dep1)
				ret <2 x i16> %0
				}

				define <2 x i32> @vec64_and_f(<2 x i32> %cc_dep1) {
				; CHECK-LABEL: vec64_and_f:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: # kill: def $r2l killed $r2l def $r2d
				; CHECK-NEXT: sllg %r0, %r2, 32
				; CHECK-NEXT: lr %r0, %r3
				; CHECK-NEXT: ldgr %f4, %r0
				; CHECK-NEXT: #APP
				; CHECK-NEXT: #NO_APP
				; CHECK-NEXT: lgdr %r3, %f4
				; CHECK-NEXT: srlg %r2, %r3, 32
				; CHECK-NEXT: # kill: def $r2l killed $r2l killed $r2d
				; CHECK-NEXT: # kill: def $r3l killed $r3l killed $r3d
				; CHECK-NEXT: br %r14
				entry:
				%0 = tail call <2 x i32> asm sideeffect "", "={f4},0"(<2 x i32> %cc_dep1)
				ret <2 x i32> %0
				}

				define <4 x i32> @vec128_and_f(<4 x i32> %cc_dep1) {
				; CHECK-LABEL: vec128_and_f:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: aghi %r15, -176
				; CHECK-NEXT: .cfi_def_cfa_offset 336
				; CHECK-NEXT: # kill: def $r4l killed $r4l def $r4d
				; CHECK-NEXT: sllg %r0, %r4, 32
				; CHECK-NEXT: lr %r0, %r5
				; CHECK-NEXT: # kill: def $r2l killed $r2l def $r2d
				; CHECK-NEXT: stg %r0, 168(%r15)
				; CHECK-NEXT: sllg %r0, %r2, 32
				; CHECK-NEXT: lr %r0, %r3
				; CHECK-NEXT: stg %r0, 160(%r15)
				; CHECK-NEXT: ld %f0, 160(%r15)
				; CHECK-NEXT: ld %f2, 168(%r15)
				; CHECK-NEXT: #APP
				; CHECK-NEXT: #NO_APP
				; CHECK-NEXT: lgdr %r3, %f0
				; CHECK-NEXT: lgdr %r5, %f2
				; CHECK-NEXT: srlg %r2, %r3, 32
				; CHECK-NEXT: srlg %r4, %r5, 32
				; CHECK-NEXT: # kill: def $r2l killed $r2l killed $r2d
				; CHECK-NEXT: # kill: def $r3l killed $r3l killed $r3d
				; CHECK-NEXT: # kill: def $r4l killed $r4l killed $r4d
				; CHECK-NEXT: # kill: def $r5l killed $r5l killed $r5d
				; CHECK-NEXT: aghi %r15, 176
				; CHECK-NEXT: br %r14
				entry:
				%0 = tail call <4 x i32> asm sideeffect "", "={f0},0"(<4 x i32> %cc_dep1)
				ret <4 x i32> %0
				}

llvm/test/CodeGen/SystemZ/inline-asm-fp-int-casting-explicit-regs.ll

This file was added.

				; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py UTC_ARGS: --version 2
				; RUN: llc -mtriple=s390x-linux-gnu -mcpu=z15 < %s \| FileCheck %s --check-prefixes=CHECK,Z15
				; RUN: llc -mtriple=s390x-linux-gnu -mcpu=z13 < %s \| FileCheck %s --check-prefixes=CHECK,Z13
				;
				; Test inline assembly where the operand is bitcasted.

				define signext i32 @int_and_f(i32 signext %cc_dep1) {
				; CHECK-LABEL: int_and_f:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: vlvgf %v0, %r2, 0
				; CHECK-NEXT: #APP
				; CHECK-NEXT: #NO_APP
				; CHECK-NEXT: vlgvf %r0, %v0, 0
				; CHECK-NEXT: lgfr %r2, %r0
				; CHECK-NEXT: br %r14
				entry:
				%0 = tail call i32 asm sideeffect "", "={f0},0"(i32 %cc_dep1)
				ret i32 %0
				}

				define i64 @long_and_f(i64 %cc_dep1) {
				; CHECK-LABEL: long_and_f:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: ldgr %f1, %r2
				; CHECK-NEXT: #APP
				; CHECK-NEXT: #NO_APP
				; CHECK-NEXT: lgdr %r2, %f1
				; CHECK-NEXT: br %r14
				entry:
				%0 = tail call i64 asm sideeffect "", "={f1},0"(i64 %cc_dep1)
				ret i64 %0
				}

				define void @__int128_and_f(ptr noalias nocapture writeonly sret(i128) align 8 %agg.result, ptr %0) {
				; Z15-LABEL: __int128_and_f:
				; Z15: # %bb.0: # %entry
				; Z15-NEXT: vl %v0, 0(%r3), 3
				; Z15-NEXT: vrepg %v6, %v0, 1
				; Z15-NEXT: vlr %v4, %v0
				; Z15-NEXT: #APP
				; Z15-NEXT: #NO_APP
				; Z15-NEXT: vmrhg %v0, %v4, %v6
				; Z15-NEXT: vst %v0, 0(%r2), 3
				; Z15-NEXT: br %r14
				;
				; Z13-LABEL: __int128_and_f:
				; Z13: # %bb.0: # %entry
				; Z13-NEXT: ld %f4, 0(%r3)
				; Z13-NEXT: ld %f6, 8(%r3)
				; Z13-NEXT: #APP
				; Z13-NEXT: #NO_APP
				; Z13-NEXT: std %f4, 0(%r2)
				; Z13-NEXT: std %f6, 8(%r2)
				; Z13-NEXT: br %r14
				entry:
				%cc_dep1 = load i128, ptr %0, align 8
				%1 = tail call i128 asm sideeffect "", "={f4},0"(i128 %cc_dep1)
				store i128 %1, ptr %agg.result, align 8
				ret void
				}

				define signext i32 @int_and_v(i32 signext %cc_dep1) {
				; CHECK-LABEL: int_and_v:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: vlvgf %v0, %r2, 0
				; CHECK-NEXT: #APP
				; CHECK-NEXT: #NO_APP
				; CHECK-NEXT: vlgvf %r0, %v0, 0
				; CHECK-NEXT: lgfr %r2, %r0
				; CHECK-NEXT: br %r14
				entry:
				%0 = tail call i32 asm sideeffect "", "={v0},0"(i32 %cc_dep1)
				ret i32 %0
				}

				define i64 @long_and_v(i64 %cc_dep1) {
				; CHECK-LABEL: long_and_v:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: ldgr %f1, %r2
				; CHECK-NEXT: #APP
				; CHECK-NEXT: #NO_APP
				; CHECK-NEXT: lgdr %r2, %f1
				; CHECK-NEXT: br %r14
				entry:
				%0 = tail call i64 asm sideeffect "", "={v1},0"(i64 %cc_dep1)
				ret i64 %0
				}

				define void @__int128_and_v(ptr noalias nocapture writeonly sret(i128) align 8 %agg.result, ptr %0) {
				; CHECK-LABEL: __int128_and_v:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: vl %v2, 0(%r3), 3
				; CHECK-NEXT: #APP
				; CHECK-NEXT: #NO_APP
				; CHECK-NEXT: vst %v2, 0(%r2), 3
				; CHECK-NEXT: br %r14
				entry:
				%cc_dep1 = load i128, ptr %0, align 8
				%1 = tail call i128 asm sideeffect "", "={v2},0"(i128 %cc_dep1)
				store i128 %1, ptr %agg.result, align 8
				ret void
				}

				define float @float_and_r(float %cc_dep1) {
				; CHECK-LABEL: float_and_r:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: vlgvf %r0, %v0, 0
				; CHECK-NEXT: # kill: def $r0l killed $r0l killed $r0d
				; CHECK-NEXT: #APP
				; CHECK-NEXT: #NO_APP
				; CHECK-NEXT: vlvgf %v0, %r0, 0
				; CHECK-NEXT: br %r14
				entry:
				%0 = tail call float asm sideeffect "", "={r0},0"(float %cc_dep1)
				ret float %0
				}

				define double @double_and_r(double %cc_dep1) {
				; CHECK-LABEL: double_and_r:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: lgdr %r1, %f0
				; CHECK-NEXT: #APP
				; CHECK-NEXT: #NO_APP
				; CHECK-NEXT: ldgr %f0, %r1
				; CHECK-NEXT: br %r14
				entry:
				%0 = tail call double asm sideeffect "", "={r1},0"(double %cc_dep1)
				ret double %0
				}

				define void @longdouble_and_r(ptr noalias nocapture writeonly sret(fp128) align 8 %agg.result, ptr %0) {
				; CHECK-LABEL: longdouble_and_r:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: lg %r5, 8(%r3)
				; CHECK-NEXT: lg %r4, 0(%r3)
				; CHECK-NEXT: #APP
				; CHECK-NEXT: #NO_APP
				; CHECK-NEXT: stg %r5, 8(%r2)
				; CHECK-NEXT: stg %r4, 0(%r2)
				; CHECK-NEXT: br %r14
				entry:
				%cc_dep1 = load fp128, ptr %0, align 8
				%1 = tail call fp128 asm sideeffect "", "={r4},0"(fp128 %cc_dep1)
				store fp128 %1, ptr %agg.result, align 8
				ret void
				}

				define float @float_and_v(float %cc_dep1) {
				; CHECK-LABEL: float_and_v:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: ldr %f3, %f0
				; CHECK-NEXT: #APP
				; CHECK-NEXT: #NO_APP
				; CHECK-NEXT: ldr %f0, %f3
				; CHECK-NEXT: br %r14
				entry:
				%0 = tail call float asm sideeffect "", "={v3},0"(float %cc_dep1)
				ret float %0
				}

				define double @double_and_v(double %cc_dep1) {
				; CHECK-LABEL: double_and_v:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: ldr %f4, %f0
				; CHECK-NEXT: #APP
				; CHECK-NEXT: #NO_APP
				; CHECK-NEXT: ldr %f0, %f4
				; CHECK-NEXT: br %r14
				entry:
				%0 = tail call double asm sideeffect "", "={v4},0"(double %cc_dep1)
				ret double %0
				}

				define void @longdouble_and_v(ptr noalias nocapture writeonly sret(fp128) align 8 %agg.result, ptr %0) {
				; CHECK-LABEL: longdouble_and_v:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: vl %v5, 0(%r3), 3
				; CHECK-NEXT: #APP
				; CHECK-NEXT: #NO_APP
				; CHECK-NEXT: vst %v5, 0(%r2), 3
				; CHECK-NEXT: br %r14
				entry:
				%cc_dep1 = load fp128, ptr %0, align 8
				%1 = tail call fp128 asm sideeffect "", "={v5},0"(fp128 %cc_dep1)
				store fp128 %1, ptr %agg.result, align 8
				ret void
				}

				define <2 x i16> @vec32_and_r(<2 x i16> %cc_dep1) {
				; CHECK-LABEL: vec32_and_r:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: vlgvf %r5, %v24, 0
				; CHECK-NEXT: # kill: def $r5l killed $r5l killed $r5d
				; CHECK-NEXT: #APP
				; CHECK-NEXT: #NO_APP
				; CHECK-NEXT: vlvgf %v24, %r5, 0
				; CHECK-NEXT: br %r14
				entry:
				%0 = tail call <2 x i16> asm sideeffect "", "={r5},0"(<2 x i16> %cc_dep1)
				ret <2 x i16> %0
				}

				define <2 x i32> @vec64_and_r(<2 x i32> %cc_dep1) {
				; CHECK-LABEL: vec64_and_r:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: vlgvg %r4, %v24, 0
				; CHECK-NEXT: #APP
				; CHECK-NEXT: #NO_APP
				; CHECK-NEXT: vlvgg %v24, %r4, 0
				; CHECK-NEXT: br %r14
				entry:
				%0 = tail call <2 x i32> asm sideeffect "", "={r4},0"(<2 x i32> %cc_dep1)
				ret <2 x i32> %0
				}

				define <4 x i32> @vec128_and_r(<4 x i32> %cc_dep1) {
				; CHECK-LABEL: vec128_and_r:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: vlgvg %r3, %v24, 1
				; CHECK-NEXT: vlgvg %r2, %v24, 0
				; CHECK-NEXT: #APP
				; CHECK-NEXT: #NO_APP
				; CHECK-NEXT: vlvgp %v24, %r2, %r3
				; CHECK-NEXT: br %r14
				entry:
				%0 = tail call <4 x i32> asm sideeffect "", "={r2},0"(<4 x i32> %cc_dep1)
				ret <4 x i32> %0
				}

				define <2 x i16> @vec32_and_f(<2 x i16> %cc_dep1) {
				; CHECK-LABEL: vec32_and_f:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: vlr %v4, %v24
				; CHECK-NEXT: # kill: def $f4s killed $f4s killed $v4
				; CHECK-NEXT: #APP
				; CHECK-NEXT: #NO_APP
				; CHECK-NEXT: # kill: def $f4s killed $f4s def $v4
				; CHECK-NEXT: vlr %v24, %v4
				; CHECK-NEXT: br %r14
				entry:
				%0 = tail call <2 x i16> asm sideeffect "", "={f4},0"(<2 x i16> %cc_dep1)
				ret <2 x i16> %0
				}

				define <2 x i32> @vec64_and_f(<2 x i32> %cc_dep1) {
				; CHECK-LABEL: vec64_and_f:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: vlr %v5, %v24
				; CHECK-NEXT: # kill: def $f5d killed $f5d killed $v5
				; CHECK-NEXT: #APP
				; CHECK-NEXT: #NO_APP
				; CHECK-NEXT: # kill: def $f5d killed $f5d def $v5
				; CHECK-NEXT: vlr %v24, %v5
				; CHECK-NEXT: br %r14
				entry:
				%0 = tail call <2 x i32> asm sideeffect "", "={f5},0"(<2 x i32> %cc_dep1)
				ret <2 x i32> %0
				}

				define <4 x i32> @vec128_and_f(<4 x i32> %cc_dep1) {
				; CHECK-LABEL: vec128_and_f:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: vrepg %v3, %v24, 1
				; CHECK-NEXT: vlr %v1, %v24
				; CHECK-NEXT: #APP
				; CHECK-NEXT: #NO_APP
				; CHECK-NEXT: vmrhg %v24, %v1, %v3
				; CHECK-NEXT: br %r14
				entry:
				%0 = tail call <4 x i32> asm sideeffect "", "={f1},0"(<4 x i32> %cc_dep1)
				ret <4 x i32> %0
				}

llvm/test/CodeGen/SystemZ/inline-asm-fp-int-casting-zEC12.ll

This file was added.

				; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py UTC_ARGS: --version 2
				; RUN: llc -mtriple=s390x-linux-gnu -mcpu=zEC12 < %s \| FileCheck %s
				;
				; Test inline assembly where the operand is bitcasted.

				define signext i32 @int_and_f(i32 signext %cc_dep1) {
				; CHECK-LABEL: int_and_f:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: risbhg %r0, %r2, 0, 159, 32
				; CHECK-NEXT: ldgr %f0, %r0
				; CHECK-NEXT: #APP
				; CHECK-NEXT: #NO_APP
				; CHECK-NEXT: lgdr %r0, %f0
				; CHECK-NEXT: risblg %r0, %r0, 0, 159, 32
				; CHECK-NEXT: lgfr %r2, %r0
				; CHECK-NEXT: br %r14
				entry:
				%0 = tail call i32 asm sideeffect "", "=f,0"(i32 %cc_dep1)
				ret i32 %0
				}

				define i64 @long_and_f(i64 %cc_dep1) {
				; CHECK-LABEL: long_and_f:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: ldgr %f0, %r2
				; CHECK-NEXT: #APP
				; CHECK-NEXT: #NO_APP
				; CHECK-NEXT: lgdr %r2, %f0
				; CHECK-NEXT: br %r14
				entry:
				%0 = tail call i64 asm sideeffect "", "=f,0"(i64 %cc_dep1)
				ret i64 %0
				}

				define void @__int128_and_f(ptr noalias nocapture writeonly sret(i128) align 8 %agg.result, ptr %0) {
				; CHECK-LABEL: __int128_and_f:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: ld %f0, 0(%r3)
				; CHECK-NEXT: ld %f2, 8(%r3)
				; CHECK-NEXT: #APP
				; CHECK-NEXT: #NO_APP
				; CHECK-NEXT: std %f0, 0(%r2)
				; CHECK-NEXT: std %f2, 8(%r2)
				; CHECK-NEXT: br %r14
				entry:
				%cc_dep1 = load i128, ptr %0, align 8
				%1 = tail call i128 asm sideeffect "", "=f,0"(i128 %cc_dep1)
				store i128 %1, ptr %agg.result, align 8
				ret void
				}

				define float @float_and_r(float %cc_dep1) {
				; CHECK-LABEL: float_and_r:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: # kill: def $f0s killed $f0s def $f0d
				; CHECK-NEXT: lgdr %r0, %f0
				; CHECK-NEXT: risblg %r0, %r0, 0, 159, 32
				; CHECK-NEXT: #APP
				; CHECK-NEXT: #NO_APP
				; CHECK-NEXT: risbhg %r0, %r0, 0, 159, 32
				; CHECK-NEXT: ldgr %f0, %r0
				; CHECK-NEXT: # kill: def $f0s killed $f0s killed $f0d
				; CHECK-NEXT: br %r14
				entry:
				%0 = tail call float asm sideeffect "", "=r,0"(float %cc_dep1)
				ret float %0
				}

				define double @double_and_r(double %cc_dep1) {
				; CHECK-LABEL: double_and_r:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: lgdr %r0, %f0
				; CHECK-NEXT: #APP
				; CHECK-NEXT: #NO_APP
				; CHECK-NEXT: ldgr %f0, %r0
				; CHECK-NEXT: br %r14
				entry:
				%0 = tail call double asm sideeffect "", "=r,0"(double %cc_dep1)
				ret double %0
				}

				define void @longdouble_and_r(ptr noalias nocapture writeonly sret(fp128) align 8 %agg.result, ptr %0) {
				; CHECK-LABEL: longdouble_and_r:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: lg %r1, 8(%r3)
				; CHECK-NEXT: lg %r0, 0(%r3)
				; CHECK-NEXT: #APP
				; CHECK-NEXT: #NO_APP
				; CHECK-NEXT: stg %r1, 8(%r2)
				; CHECK-NEXT: stg %r0, 0(%r2)
				; CHECK-NEXT: br %r14
				entry:
				%cc_dep1 = load fp128, ptr %0, align 8
				%1 = tail call fp128 asm sideeffect "", "=r,0"(fp128 %cc_dep1)
				store fp128 %1, ptr %agg.result, align 8
				ret void
				}

				define <2 x i16> @vec32_and_r(<2 x i16> %cc_dep1) {
				; CHECK-LABEL: vec32_and_r:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: # kill: def $r3l killed $r3l def $r3d
				; CHECK-NEXT: # kill: def $r2l killed $r2l def $r2d
				; CHECK-NEXT: risbgn %r3, %r2, 32, 47, 16
				; CHECK-NEXT: #APP
				; CHECK-NEXT: #NO_APP
				; CHECK-NEXT: srlk %r2, %r3, 16
				; CHECK-NEXT: # kill: def $r3l killed $r3l killed $r3d
				; CHECK-NEXT: br %r14
				entry:
				%0 = tail call <2 x i16> asm sideeffect "", "=r,0"(<2 x i16> %cc_dep1)
				ret <2 x i16> %0
				}

				define <2 x i32> @vec64_and_r(<2 x i32> %cc_dep1) {
				; CHECK-LABEL: vec64_and_r:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: # kill: def $r2l killed $r2l def $r2d
				; CHECK-NEXT: sllg %r0, %r2, 32
				; CHECK-NEXT: lr %r0, %r3
				; CHECK-NEXT: #APP
				; CHECK-NEXT: #NO_APP
				; CHECK-NEXT: lr %r3, %r0
				; CHECK-NEXT: srlg %r2, %r0, 32
				; CHECK-NEXT: # kill: def $r2l killed $r2l killed $r2d
				; CHECK-NEXT: br %r14
				entry:
				%0 = tail call <2 x i32> asm sideeffect "", "=r,0"(<2 x i32> %cc_dep1)
				ret <2 x i32> %0
				}

				define <2 x i16> @vec32_and_f(<2 x i16> %cc_dep1) {
				; CHECK-LABEL: vec32_and_f:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: # kill: def $r3l killed $r3l def $r3d
				; CHECK-NEXT: # kill: def $r2l killed $r2l def $r2d
				; CHECK-NEXT: risbgn %r3, %r2, 32, 47, 16
				; CHECK-NEXT: risbhg %r0, %r3, 0, 159, 32
				; CHECK-NEXT: ldgr %f0, %r0
				; CHECK-NEXT: #APP
				; CHECK-NEXT: #NO_APP
				; CHECK-NEXT: lgdr %r0, %f0
				; CHECK-NEXT: risblg %r3, %r0, 0, 159, 32
				; CHECK-NEXT: srlk %r2, %r3, 16
				; CHECK-NEXT: br %r14
				entry:
				%0 = tail call <2 x i16> asm sideeffect "", "=f,0"(<2 x i16> %cc_dep1)
				ret <2 x i16> %0
				}

				define <2 x i32> @vec64_and_f(<2 x i32> %cc_dep1) {
				; CHECK-LABEL: vec64_and_f:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: # kill: def $r2l killed $r2l def $r2d
				; CHECK-NEXT: sllg %r0, %r2, 32
				; CHECK-NEXT: lr %r0, %r3
				; CHECK-NEXT: ldgr %f0, %r0
				; CHECK-NEXT: #APP
				; CHECK-NEXT: #NO_APP
				; CHECK-NEXT: lgdr %r3, %f0
				; CHECK-NEXT: srlg %r2, %r3, 32
				; CHECK-NEXT: # kill: def $r2l killed $r2l killed $r2d
				; CHECK-NEXT: # kill: def $r3l killed $r3l killed $r3d
				; CHECK-NEXT: br %r14
				entry:
				%0 = tail call <2 x i32> asm sideeffect "", "=f,0"(<2 x i32> %cc_dep1)
				ret <2 x i32> %0
				}

				define <4 x i32> @vec128_and_f(<4 x i32> %cc_dep1) {
				; CHECK-LABEL: vec128_and_f:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: aghi %r15, -176
				; CHECK-NEXT: .cfi_def_cfa_offset 336
				; CHECK-NEXT: # kill: def $r4l killed $r4l def $r4d
				; CHECK-NEXT: sllg %r0, %r4, 32
				; CHECK-NEXT: lr %r0, %r5
				; CHECK-NEXT: # kill: def $r2l killed $r2l def $r2d
				; CHECK-NEXT: stg %r0, 168(%r15)
				; CHECK-NEXT: sllg %r0, %r2, 32
				; CHECK-NEXT: lr %r0, %r3
				; CHECK-NEXT: stg %r0, 160(%r15)
				; CHECK-NEXT: ld %f0, 160(%r15)
				; CHECK-NEXT: ld %f2, 168(%r15)
				; CHECK-NEXT: #APP
				; CHECK-NEXT: #NO_APP
				; CHECK-NEXT: lgdr %r3, %f0
				; CHECK-NEXT: lgdr %r5, %f2
				; CHECK-NEXT: srlg %r2, %r3, 32
				; CHECK-NEXT: srlg %r4, %r5, 32
				; CHECK-NEXT: # kill: def $r2l killed $r2l killed $r2d
				; CHECK-NEXT: # kill: def $r3l killed $r3l killed $r3d
				; CHECK-NEXT: # kill: def $r4l killed $r4l killed $r4d
				; CHECK-NEXT: # kill: def $r5l killed $r5l killed $r5d
				; CHECK-NEXT: aghi %r15, 176
				; CHECK-NEXT: br %r14
				entry:
				%0 = tail call <4 x i32> asm sideeffect "", "=f,0"(<4 x i32> %cc_dep1)
				ret <4 x i32> %0
				}

llvm/test/CodeGen/SystemZ/inline-asm-fp-int-casting.ll

This file was added.

				; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py UTC_ARGS: --version 2
				; RUN: llc -mtriple=s390x-linux-gnu -mcpu=z15 < %s \| FileCheck %s --check-prefixes=CHECK,Z15
				; RUN: llc -mtriple=s390x-linux-gnu -mcpu=z13 < %s \| FileCheck %s --check-prefixes=CHECK,Z13
				;
				; Test inline assembly where the operand is bitcasted.

				define signext i32 @int_and_f(i32 signext %cc_dep1) {
				; CHECK-LABEL: int_and_f:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: vlvgf %v0, %r2, 0
				; CHECK-NEXT: #APP
				; CHECK-NEXT: #NO_APP
				; CHECK-NEXT: vlgvf %r0, %v0, 0
				; CHECK-NEXT: lgfr %r2, %r0
				; CHECK-NEXT: br %r14
				entry:
				%0 = tail call i32 asm sideeffect "", "=f,0"(i32 %cc_dep1)
				ret i32 %0
				}

				define i64 @long_and_f(i64 %cc_dep1) {
				; CHECK-LABEL: long_and_f:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: ldgr %f0, %r2
				; CHECK-NEXT: #APP
				; CHECK-NEXT: #NO_APP
				; CHECK-NEXT: lgdr %r2, %f0
				; CHECK-NEXT: br %r14
				entry:
				%0 = tail call i64 asm sideeffect "", "=f,0"(i64 %cc_dep1)
				ret i64 %0
				}

				define void @__int128_and_f(ptr noalias nocapture writeonly sret(i128) align 8 %agg.result, ptr %0) {
				; Z15-LABEL: __int128_and_f:
				; Z15: # %bb.0: # %entry
				; Z15-NEXT: vl %v0, 0(%r3), 3
				; Z15-NEXT: vrepg %v2, %v0, 1
				; Z15-NEXT: #APP
				uweigandUnsubmitted Not Done Reply Inline Actions This difference between z15 and z13 is a bit weird. Both instruction sequences would be correct and available on both architectures, so I'm not sure why it chooses a different one. (Also, I'm not actually sure which one performs better ...) - That may be something to look at as a follow-on. uweigand: This difference between z15 and z13 is a bit weird. Both instruction sequences would be…
				jonpaAuthorUnsubmitted Done Reply Inline Actions The i128 load is bitcasted into f128, and becomes a f128 load. So I guess this then relates to the fact that for z13 we use FP128BitRegClass for f128, and with z14 and later instead the VR128BitRegClass. I guess VectorEnhancements1 is the difference and that makes it worthwhile to use VR128. Yeah, it seems actually better to have two independent instructions and maybe that could be worth trying on z15 as well. jonpa: The i128 load is bitcasted into f128, and becomes a f128 load. So I guess this then relates to…
				; Z15-NEXT: #NO_APP
				; Z15-NEXT: vmrhg %v0, %v0, %v2
				; Z15-NEXT: vst %v0, 0(%r2), 3
				; Z15-NEXT: br %r14
				;
				iiiUnsubmitted Done Reply Inline Actions Did this work for you in GCC? I tried: __int128 foo(__int128 bar) { asm("" : "+f" (bar)); return bar; } and got: error: inconsistent operand constraints in an ‘asm’ I wanted to give it a try, because I would expect `ld`/`std` here, like for long double. iii: Did this work for you in GCC? I tried: __int128 foo(__int128 bar) { asm("" : "+f"…
				iiiUnsubmitted Done Reply Inline Actions My bad, I should have specified `-march=z13`. iii: My bad, I should have specified `-march=z13`.
				; Z13-LABEL: __int128_and_f:
				; Z13: # %bb.0: # %entry
				; Z13-NEXT: ld %f0, 0(%r3)
				; Z13-NEXT: ld %f2, 8(%r3)
				; Z13-NEXT: #APP
				; Z13-NEXT: #NO_APP
				; Z13-NEXT: std %f0, 0(%r2)
				; Z13-NEXT: std %f2, 8(%r2)
				; Z13-NEXT: br %r14
				entry:
				%cc_dep1 = load i128, ptr %0, align 8
				%1 = tail call i128 asm sideeffect "", "=f,0"(i128 %cc_dep1)
				store i128 %1, ptr %agg.result, align 8
				ret void
				}

				define signext i32 @int_and_v(i32 signext %cc_dep1) {
				; CHECK-LABEL: int_and_v:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: vlvgf %v0, %r2, 0
				; CHECK-NEXT: #APP
				; CHECK-NEXT: #NO_APP
				; CHECK-NEXT: vlgvf %r0, %v0, 0
				; CHECK-NEXT: lgfr %r2, %r0
				; CHECK-NEXT: br %r14
				entry:
				%0 = tail call i32 asm sideeffect "", "=v,0"(i32 %cc_dep1)
				ret i32 %0
				}

				define i64 @long_and_v(i64 %cc_dep1) {
				; CHECK-LABEL: long_and_v:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: ldgr %f0, %r2
				; CHECK-NEXT: #APP
				; CHECK-NEXT: #NO_APP
				; CHECK-NEXT: lgdr %r2, %f0
				; CHECK-NEXT: br %r14
				entry:
				%0 = tail call i64 asm sideeffect "", "=v,0"(i64 %cc_dep1)
				ret i64 %0
				}

				define void @__int128_and_v(ptr noalias nocapture writeonly sret(i128) align 8 %agg.result, ptr %0) {
				; CHECK-LABEL: __int128_and_v:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: vl %v0, 0(%r3), 3
				; CHECK-NEXT: #APP
				; CHECK-NEXT: #NO_APP
				; CHECK-NEXT: vst %v0, 0(%r2), 3
				; CHECK-NEXT: br %r14
				entry:
				%cc_dep1 = load i128, ptr %0, align 8
				%1 = tail call i128 asm sideeffect "", "=v,0"(i128 %cc_dep1)
				store i128 %1, ptr %agg.result, align 8
				ret void
				}

				define float @float_and_r(float %cc_dep1) {
				; CHECK-LABEL: float_and_r:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: vlgvf %r0, %v0, 0
				; CHECK-NEXT: #APP
				; CHECK-NEXT: #NO_APP
				; CHECK-NEXT: vlvgf %v0, %r0, 0
				; CHECK-NEXT: br %r14
				entry:
				%0 = tail call float asm sideeffect "", "=r,0"(float %cc_dep1)
				ret float %0
				}

				define double @double_and_r(double %cc_dep1) {
				; CHECK-LABEL: double_and_r:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: lgdr %r0, %f0
				; CHECK-NEXT: #APP
				; CHECK-NEXT: #NO_APP
				; CHECK-NEXT: ldgr %f0, %r0
				; CHECK-NEXT: br %r14
				entry:
				%0 = tail call double asm sideeffect "", "=r,0"(double %cc_dep1)
				ret double %0
				}

				define void @longdouble_and_r(ptr noalias nocapture writeonly sret(fp128) align 8 %agg.result, ptr %0) {
				; CHECK-LABEL: longdouble_and_r:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: lg %r1, 8(%r3)
				; CHECK-NEXT: lg %r0, 0(%r3)
				; CHECK-NEXT: #APP
				; CHECK-NEXT: #NO_APP
				; CHECK-NEXT: stg %r1, 8(%r2)
				; CHECK-NEXT: stg %r0, 0(%r2)
				; CHECK-NEXT: br %r14
				entry:
				%cc_dep1 = load fp128, ptr %0, align 8
				%1 = tail call fp128 asm sideeffect "", "=r,0"(fp128 %cc_dep1)
				store fp128 %1, ptr %agg.result, align 8
				ret void
				}

				define float @float_and_v(float %cc_dep1) {
				; CHECK-LABEL: float_and_v:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: #APP
				; CHECK-NEXT: #NO_APP
				; CHECK-NEXT: br %r14
				entry:
				%0 = tail call float asm sideeffect "", "=v,0"(float %cc_dep1)
				ret float %0
				}

				define double @double_and_v(double %cc_dep1) {
				; CHECK-LABEL: double_and_v:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: #APP
				; CHECK-NEXT: #NO_APP
				; CHECK-NEXT: br %r14
				entry:
				%0 = tail call double asm sideeffect "", "=v,0"(double %cc_dep1)
				ret double %0
				}

				define void @longdouble_and_v(ptr noalias nocapture writeonly sret(fp128) align 8 %agg.result, ptr %0) {
				; CHECK-LABEL: longdouble_and_v:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: vl %v0, 0(%r3), 3
				; CHECK-NEXT: #APP
				; CHECK-NEXT: #NO_APP
				; CHECK-NEXT: vst %v0, 0(%r2), 3
				; CHECK-NEXT: br %r14
				entry:
				%cc_dep1 = load fp128, ptr %0, align 8
				%1 = tail call fp128 asm sideeffect "", "=v,0"(fp128 %cc_dep1)
				store fp128 %1, ptr %agg.result, align 8
				ret void
				}

				define <2 x i16> @vec32_and_r(<2 x i16> %cc_dep1) {
				; CHECK-LABEL: vec32_and_r:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: vlgvf %r0, %v24, 0
				; CHECK-NEXT: #APP
				; CHECK-NEXT: #NO_APP
				; CHECK-NEXT: vlvgf %v24, %r0, 0
				; CHECK-NEXT: br %r14
				entry:
				%0 = tail call <2 x i16> asm sideeffect "", "=r,0"(<2 x i16> %cc_dep1)
				ret <2 x i16> %0
				}

				define <2 x i32> @vec64_and_r(<2 x i32> %cc_dep1) {
				; CHECK-LABEL: vec64_and_r:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: vlgvg %r0, %v24, 0
				; CHECK-NEXT: #APP
				; CHECK-NEXT: #NO_APP
				; CHECK-NEXT: vlvgg %v24, %r0, 0
				; CHECK-NEXT: br %r14
				entry:
				%0 = tail call <2 x i32> asm sideeffect "", "=r,0"(<2 x i32> %cc_dep1)
				ret <2 x i32> %0
				}

				define <4 x i32> @vec128_and_r(<4 x i32> %cc_dep1) {
				; CHECK-LABEL: vec128_and_r:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: vlgvg %r1, %v24, 1
				; CHECK-NEXT: vlgvg %r0, %v24, 0
				; CHECK-NEXT: #APP
				; CHECK-NEXT: #NO_APP
				; CHECK-NEXT: vlvgp %v24, %r0, %r1
				; CHECK-NEXT: br %r14
				entry:
				%0 = tail call <4 x i32> asm sideeffect "", "=r,0"(<4 x i32> %cc_dep1)
				ret <4 x i32> %0
				}

				define <2 x i16> @vec32_and_f(<2 x i16> %cc_dep1) {
				; CHECK-LABEL: vec32_and_f:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: vlr %v0, %v24
				; CHECK-NEXT: #APP
				; CHECK-NEXT: #NO_APP
				; CHECK-NEXT: vlr %v24, %v0
				; CHECK-NEXT: br %r14
				entry:
				%0 = tail call <2 x i16> asm sideeffect "", "=f,0"(<2 x i16> %cc_dep1)
				ret <2 x i16> %0
				}

				define <2 x i32> @vec64_and_f(<2 x i32> %cc_dep1) {
				; CHECK-LABEL: vec64_and_f:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: vlr %v0, %v24
				; CHECK-NEXT: #APP
				; CHECK-NEXT: #NO_APP
				; CHECK-NEXT: vlr %v24, %v0
				; CHECK-NEXT: br %r14
				entry:
				%0 = tail call <2 x i32> asm sideeffect "", "=f,0"(<2 x i32> %cc_dep1)
				ret <2 x i32> %0
				}

				define <4 x i32> @vec128_and_f(<4 x i32> %cc_dep1) {
				; CHECK-LABEL: vec128_and_f:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: vrepg %v2, %v24, 1
				; CHECK-NEXT: vlr %v0, %v24
				; CHECK-NEXT: #APP
				; CHECK-NEXT: #NO_APP
				; CHECK-NEXT: vmrhg %v24, %v0, %v2
				; CHECK-NEXT: br %r14
				entry:
				%0 = tail call <4 x i32> asm sideeffect "", "=f,0"(<4 x i32> %cc_dep1)
				ret <4 x i32> %0
				}

llvm/test/CodeGen/SystemZ/inline-asm-v-constraint-novecfacility.ll

This file was added.

				; RUN: not llc < %s -mtriple=s390x-linux-gnu -mcpu=zEC12 2>&1 \| FileCheck %s

				; CHECK: error: couldn't allocate output register for constraint 'v'

				define signext i32 @int_and_v(i32 signext %cc_dep1) {
				entry:
				%0 = tail call i32 asm sideeffect "", "=v,0"(i32 %cc_dep1)
				ret i32 %0
				}

This is an archive of the discontinued LLVM Phabricator instance.

[SystemZ] Allow fp/int casting into inline assembly operands
ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 508184

llvm/lib/Target/SystemZ/SystemZISelLowering.cpp

llvm/test/CodeGen/SystemZ/inline-asm-f-constraint-softfloat.ll

llvm/test/CodeGen/SystemZ/inline-asm-fp-int-casting-explicit-regs-zEC12.ll

llvm/test/CodeGen/SystemZ/inline-asm-fp-int-casting-explicit-regs.ll

llvm/test/CodeGen/SystemZ/inline-asm-fp-int-casting-zEC12.ll

llvm/test/CodeGen/SystemZ/inline-asm-fp-int-casting.ll

llvm/test/CodeGen/SystemZ/inline-asm-v-constraint-novecfacility.ll

This is an archive of the discontinued LLVM Phabricator instance.

[SystemZ] Allow fp/int casting into inline assembly operandsClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 508184

llvm/lib/Target/SystemZ/SystemZISelLowering.cpp

llvm/test/CodeGen/SystemZ/inline-asm-f-constraint-softfloat.ll

llvm/test/CodeGen/SystemZ/inline-asm-fp-int-casting-explicit-regs-zEC12.ll

llvm/test/CodeGen/SystemZ/inline-asm-fp-int-casting-explicit-regs.ll

llvm/test/CodeGen/SystemZ/inline-asm-fp-int-casting-zEC12.ll

llvm/test/CodeGen/SystemZ/inline-asm-fp-int-casting.ll

llvm/test/CodeGen/SystemZ/inline-asm-v-constraint-novecfacility.ll

[SystemZ] Allow fp/int casting into inline assembly operands
ClosedPublic