Diff 406432

llvm/lib/Target/AArch64/AArch64ISelLowering.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 7,302 Lines • ▼ Show 20 Lines	return DAG.getNode(AArch64ISD::BRCOND, dl, MVT::Other, BR1, Dest, CC2Val,
Cmp);		Cmp);
}		}

return BR1;		return BR1;
}		}

SDValue AArch64TargetLowering::LowerFCOPYSIGN(SDValue Op,		SDValue AArch64TargetLowering::LowerFCOPYSIGN(SDValue Op,
SelectionDAG &DAG) const {		SelectionDAG &DAG) const {
		if (!Subtarget->hasNEON())
		return SDValue();

EVT VT = Op.getValueType();		EVT VT = Op.getValueType();
		EVT IntVT = VT.changeTypeToInteger();
SDLoc DL(Op);		SDLoc DL(Op);

SDValue In1 = Op.getOperand(0);		SDValue In1 = Op.getOperand(0);
SDValue In2 = Op.getOperand(1);		SDValue In2 = Op.getOperand(1);
EVT SrcVT = In2.getValueType();		EVT SrcVT = In2.getValueType();

if (VT.isScalableVector()) {		if (SrcVT.bitsLT(VT))
if (VT != SrcVT)		In2 = DAG.getNode(ISD::FP_EXTEND, DL, VT, In2);
return SDValue();		else if (SrcVT.bitsGT(VT))
		In2 = DAG.getNode(ISD::FP_ROUND, DL, VT, In2, DAG.getIntPtrConstant(0, DL));

// copysign(x,y) -> (y & SIGN_MASK) \| (x & ~SIGN_MASK)		if (VT.isScalableVector())
//		IntVT =
// A possible alternative sequence involves using FNEG_MERGE_PASSTHRU;
// maybe useful for copysign operations with mismatched VTs.
efriedmaUnsubmitted Not Done Reply Inline Actions Do we want to preserve this comment somewhere? efriedma: Do we want to preserve this comment somewhere?
//
// IntVT here is chosen so it's a legal type with the same element width
// as the input.
EVT IntVT =
getPackedSVEVectorVT(VT.getVectorElementType().changeTypeToInteger());		getPackedSVEVectorVT(VT.getVectorElementType().changeTypeToInteger());
unsigned NumBits = VT.getScalarSizeInBits();
SDValue SignMask = DAG.getConstant(APInt::getSignMask(NumBits), DL, IntVT);
SDValue InvSignMask = DAG.getNOT(DL, SignMask, IntVT);
SDValue Sign = DAG.getNode(ISD::AND, DL, IntVT, SignMask,
getSVESafeBitCast(IntVT, In2, DAG));
SDValue Magnitude = DAG.getNode(ISD::AND, DL, IntVT, InvSignMask,
getSVESafeBitCast(IntVT, In1, DAG));
SDValue IntResult = DAG.getNode(ISD::OR, DL, IntVT, Sign, Magnitude);
return getSVESafeBitCast(VT, IntResult, DAG);
}

if (!Subtarget->hasNEON())		if (VT != In2.getValueType())
return SDValue();		return SDValue();

if (SrcVT.bitsLT(VT))		auto BitCast = [this](EVT VT, SDValue Op, SelectionDAG &DAG) {
In2 = DAG.getNode(ISD::FP_EXTEND, DL, VT, In2);		if (VT.isScalableVector())
else if (SrcVT.bitsGT(VT))		return getSVESafeBitCast(VT, Op, DAG);
In2 = DAG.getNode(ISD::FP_ROUND, DL, VT, In2, DAG.getIntPtrConstant(0, DL));

EVT VecVT;		return DAG.getBitcast(VT, Op);
uint64_t EltMask;		};
SDValue VecVal1, VecVal2;

auto setVecVal = [&] (int Idx) {		SDValue VecVal1, VecVal2;
		EVT VecVT;
		auto SetVecVal = [&](int Idx = -1) {
if (!VT.isVector()) {		if (!VT.isVector()) {
VecVal1 = DAG.getTargetInsertSubreg(Idx, DL, VecVT,		VecVal1 =
DAG.getUNDEF(VecVT), In1);		DAG.getTargetInsertSubreg(Idx, DL, VecVT, DAG.getUNDEF(VecVT), In1);
VecVal2 = DAG.getTargetInsertSubreg(Idx, DL, VecVT,		VecVal2 =
DAG.getUNDEF(VecVT), In2);		DAG.getTargetInsertSubreg(Idx, DL, VecVT, DAG.getUNDEF(VecVT), In2);
} else {		} else {
VecVal1 = DAG.getNode(ISD::BITCAST, DL, VecVT, In1);		VecVal1 = BitCast(VecVT, In1, DAG);
VecVal2 = DAG.getNode(ISD::BITCAST, DL, VecVT, In2);		VecVal2 = BitCast(VecVT, In2, DAG);
}		}
};		};
		if (VT.isVector()) {
if (VT == MVT::f32 \|\| VT == MVT::v2f32 \|\| VT == MVT::v4f32) {		VecVT = IntVT;
VecVT = (VT == MVT::v2f32 ? MVT::v2i32 : MVT::v4i32);		SetVecVal();
EltMask = 0x80000000ULL;		} else if (VT == MVT::f64) {
setVecVal(AArch64::ssub);
} else if (VT == MVT::f64 \|\| VT == MVT::v2f64) {
VecVT = MVT::v2i64;		VecVT = MVT::v2i64;
		SetVecVal(AArch64::dsub);
// We want to materialize a mask with the high bit set, but the AdvSIMD		} else if (VT == MVT::f32) {
// immediate moves cannot materialize that in a single instruction for		VecVT = MVT::v4i32;
// 64-bit elements. Instead, materialize zero and then negate it.		SetVecVal(AArch64::ssub);
EltMask = 0;		} else if (VT == MVT::f16) {
		VecVT = MVT::v8i16;
setVecVal(AArch64::dsub);		SetVecVal(AArch64::hsub);
} else if (VT == MVT::f16 \|\| VT == MVT::v4f16 \|\| VT == MVT::v8f16) {
VecVT = (VT == MVT::v4f16 ? MVT::v4i16 : MVT::v8i16);
EltMask = 0x8000ULL;
setVecVal(AArch64::hsub);
} else {		} else {
llvm_unreachable("Invalid type for copysign!");		llvm_unreachable("Invalid type for copysign!");
}		}

SDValue BuildVec = DAG.getConstant(EltMask, DL, VecVT);		unsigned BitWidth = In1.getScalarValueSizeInBits();
		SDValue SignMaskV = DAG.getConstant(~APInt::getSignMask(BitWidth), DL, VecVT);

// If we couldn't materialize the mask above, then the mask vector will be		// We want to materialize a mask with every bit but the high bit set, but the
// the zero vector, and we need to negate it here.		// AdvSIMD immediate moves cannot materialize that in a single instruction for
		// 64-bit elements. Instead, materialize all bits set and then negate that.
if (VT == MVT::f64 \|\| VT == MVT::v2f64) {		if (VT == MVT::f64 \|\| VT == MVT::v2f64) {
BuildVec = DAG.getNode(ISD::BITCAST, DL, MVT::v2f64, BuildVec);		SignMaskV = DAG.getConstant(APInt::getAllOnes(BitWidth), DL, VecVT);
BuildVec = DAG.getNode(ISD::FNEG, DL, MVT::v2f64, BuildVec);		SignMaskV = DAG.getNode(ISD::BITCAST, DL, MVT::v2f64, SignMaskV);
BuildVec = DAG.getNode(ISD::BITCAST, DL, MVT::v2i64, BuildVec);		SignMaskV = DAG.getNode(ISD::FNEG, DL, MVT::v2f64, SignMaskV);
		SignMaskV = DAG.getNode(ISD::BITCAST, DL, MVT::v2i64, SignMaskV);
}		}

SDValue Sel =		SDValue BSP =
DAG.getNode(AArch64ISD::BIT, DL, VecVT, VecVal1, VecVal2, BuildVec);		DAG.getNode(AArch64ISD::BSP, DL, VecVT, SignMaskV, VecVal1, VecVal2);
		efriedmaUnsubmitted Not Done Reply Inline Actions The special case here feels kind of weird, but I guess it's existing code. efriedma: The special case here feels kind of weird, but I guess it's existing code.
		DavidTrubyAuthorUnsubmitted Done Reply Inline Actions I tried without this special case, oddly that introduces quite a few extra instructions which is why I left the existing code in here. DavidTruby: I tried without this special case, oddly that introduces quite a few extra instructions which…

if (VT == MVT::f16)		if (VT == MVT::f16)
return DAG.getTargetExtractSubreg(AArch64::hsub, DL, VT, Sel);		return DAG.getTargetExtractSubreg(AArch64::hsub, DL, VT, BSP);
if (VT == MVT::f32)		if (VT == MVT::f32)
return DAG.getTargetExtractSubreg(AArch64::ssub, DL, VT, Sel);		return DAG.getTargetExtractSubreg(AArch64::ssub, DL, VT, BSP);
else if (VT == MVT::f64)		if (VT == MVT::f64)
return DAG.getTargetExtractSubreg(AArch64::dsub, DL, VT, Sel);		return DAG.getTargetExtractSubreg(AArch64::dsub, DL, VT, BSP);
else
return DAG.getNode(ISD::BITCAST, DL, VT, Sel);		return BitCast(VT, BSP, DAG);
}		}

SDValue AArch64TargetLowering::LowerCTPOP(SDValue Op, SelectionDAG &DAG) const {		SDValue AArch64TargetLowering::LowerCTPOP(SDValue Op, SelectionDAG &DAG) const {
if (DAG.getMachineFunction().getFunction().hasFnAttribute(		if (DAG.getMachineFunction().getFunction().hasFnAttribute(
Attribute::NoImplicitFloat))		Attribute::NoImplicitFloat))
return SDValue();		return SDValue();

if (!Subtarget->hasNEON())		if (!Subtarget->hasNEON())
▲ Show 20 Lines • Show All 10,522 Lines • ▼ Show 20 Lines	DCI.CombineTo(N0.getNode(),
ExtLoad, DAG.getIntPtrConstant(1, SDLoc(N0))),		ExtLoad, DAG.getIntPtrConstant(1, SDLoc(N0))),
ExtLoad.getValue(1));		ExtLoad.getValue(1));
return SDValue(N, 0); // Return N so it doesn't get rechecked!		return SDValue(N, 0); // Return N so it doesn't get rechecked!
}		}

return SDValue();		return SDValue();
}		}

		SDValue performBSPExpandForSVE(SDNode *N, SelectionDAG &DAG,
		const AArch64Subtarget *Subtarget,
		bool fixedSVEVectorVT) {
		EVT VT = N->getValueType(0);

		// Don't expand for SVE2
		if (!VT.isScalableVector() \|\| Subtarget->hasSVE2() \|\|
		Subtarget->hasStreamingSVE())
		return SDValue();

		// Don't expand for NEON
		if (VT.isFixedLengthVector() && !fixedSVEVectorVT)
		return SDValue();

		SDLoc DL(N);

		SDValue Mask = N->getOperand(0);
		SDValue In1 = N->getOperand(1);
		SDValue In2 = N->getOperand(2);

		SDValue InvMask = DAG.getNOT(DL, Mask, VT);
		SDValue Sel = DAG.getNode(ISD::AND, DL, VT, Mask, In1);
		SDValue SelInv = DAG.getNode(ISD::AND, DL, VT, InvMask, In2);
		return DAG.getNode(ISD::OR, DL, VT, Sel, SelInv);
		}

SDValue AArch64TargetLowering::PerformDAGCombine(SDNode *N,		SDValue AArch64TargetLowering::PerformDAGCombine(SDNode *N,
DAGCombinerInfo &DCI) const {		DAGCombinerInfo &DCI) const {
SelectionDAG &DAG = DCI.DAG;		SelectionDAG &DAG = DCI.DAG;
switch (N->getOpcode()) {		switch (N->getOpcode()) {
default:		default:
LLVM_DEBUG(dbgs() << "Custom combining: skipping\n");		LLVM_DEBUG(dbgs() << "Custom combining: skipping\n");
break;		break;
case ISD::ADD:		case ISD::ADD:
▲ Show 20 Lines • Show All 85 Lines • ▼ Show 20 Lines	SDValue AArch64TargetLowering::PerformDAGCombine(SDNode *N,
case AArch64ISD::GLD1S_SXTW_SCALED_MERGE_ZERO:		case AArch64ISD::GLD1S_SXTW_SCALED_MERGE_ZERO:
case AArch64ISD::GLD1S_IMM_MERGE_ZERO:		case AArch64ISD::GLD1S_IMM_MERGE_ZERO:
return performGLD1Combine(N, DAG);		return performGLD1Combine(N, DAG);
case AArch64ISD::VASHR:		case AArch64ISD::VASHR:
case AArch64ISD::VLSHR:		case AArch64ISD::VLSHR:
return performVectorShiftCombine(N, *this, DCI);		return performVectorShiftCombine(N, *this, DCI);
case AArch64ISD::SUNPKLO:		case AArch64ISD::SUNPKLO:
return performSunpkloCombine(N, DAG);		return performSunpkloCombine(N, DAG);
		case AArch64ISD::BSP:
		return performBSPExpandForSVE(
		N, DAG, Subtarget, useSVEForFixedLengthVectorVT(N->getValueType(0)));
case ISD::INSERT_VECTOR_ELT:		case ISD::INSERT_VECTOR_ELT:
return performInsertVectorEltCombine(N, DCI);		return performInsertVectorEltCombine(N, DCI);
case ISD::EXTRACT_VECTOR_ELT:		case ISD::EXTRACT_VECTOR_ELT:
return performExtractVectorEltCombine(N, DAG);		return performExtractVectorEltCombine(N, DAG);
case ISD::VECREDUCE_ADD:		case ISD::VECREDUCE_ADD:
return performVecReduceAddCombine(N, DCI.DAG, Subtarget);		return performVecReduceAddCombine(N, DCI.DAG, Subtarget);
case AArch64ISD::UADDV:		case AArch64ISD::UADDV:
return performUADDVCombine(N, DAG);		return performUADDVCombine(N, DAG);
▲ Show 20 Lines • Show All 2,245 Lines • Show Last 20 Lines

llvm/lib/Target/AArch64/AArch64SVEInstrInfo.td

Show First 20 Lines • Show All 3,090 Lines • ▼ Show 20 Lines	let Predicates = [HasSVE2orStreamingSVE] in {
defm FMLALB_ZZZ_SHH : sve2_fp_mla_long<0b00, "fmlalb", int_aarch64_sve_fmlalb>;		defm FMLALB_ZZZ_SHH : sve2_fp_mla_long<0b00, "fmlalb", int_aarch64_sve_fmlalb>;
defm FMLALT_ZZZ_SHH : sve2_fp_mla_long<0b01, "fmlalt", int_aarch64_sve_fmlalt>;		defm FMLALT_ZZZ_SHH : sve2_fp_mla_long<0b01, "fmlalt", int_aarch64_sve_fmlalt>;
defm FMLSLB_ZZZ_SHH : sve2_fp_mla_long<0b10, "fmlslb", int_aarch64_sve_fmlslb>;		defm FMLSLB_ZZZ_SHH : sve2_fp_mla_long<0b10, "fmlslb", int_aarch64_sve_fmlslb>;
defm FMLSLT_ZZZ_SHH : sve2_fp_mla_long<0b11, "fmlslt", int_aarch64_sve_fmlslt>;		defm FMLSLT_ZZZ_SHH : sve2_fp_mla_long<0b11, "fmlslt", int_aarch64_sve_fmlslt>;

// SVE2 bitwise ternary operations		// SVE2 bitwise ternary operations
defm EOR3_ZZZZ : sve2_int_bitwise_ternary_op<0b000, "eor3", int_aarch64_sve_eor3>;		defm EOR3_ZZZZ : sve2_int_bitwise_ternary_op<0b000, "eor3", int_aarch64_sve_eor3>;
defm BCAX_ZZZZ : sve2_int_bitwise_ternary_op<0b010, "bcax", int_aarch64_sve_bcax>;		defm BCAX_ZZZZ : sve2_int_bitwise_ternary_op<0b010, "bcax", int_aarch64_sve_bcax>;
defm BSL_ZZZZ : sve2_int_bitwise_ternary_op<0b001, "bsl", int_aarch64_sve_bsl>;		defm BSL_ZZZZ : sve2_int_bitwise_ternary_op<0b001, "bsl", int_aarch64_sve_bsl, AArch64bsp>;
defm BSL1N_ZZZZ : sve2_int_bitwise_ternary_op<0b011, "bsl1n", int_aarch64_sve_bsl1n>;		defm BSL1N_ZZZZ : sve2_int_bitwise_ternary_op<0b011, "bsl1n", int_aarch64_sve_bsl1n>;
defm BSL2N_ZZZZ : sve2_int_bitwise_ternary_op<0b101, "bsl2n", int_aarch64_sve_bsl2n>;		defm BSL2N_ZZZZ : sve2_int_bitwise_ternary_op<0b101, "bsl2n", int_aarch64_sve_bsl2n>;
defm NBSL_ZZZZ : sve2_int_bitwise_ternary_op<0b111, "nbsl", int_aarch64_sve_nbsl>;		defm NBSL_ZZZZ : sve2_int_bitwise_ternary_op<0b111, "nbsl", int_aarch64_sve_nbsl>;

// SVE2 bitwise xor and rotate right by immediate		// SVE2 bitwise xor and rotate right by immediate
defm XAR_ZZZI : sve2_int_rotate_right_imm<"xar", int_aarch64_sve_xar>;		defm XAR_ZZZI : sve2_int_rotate_right_imm<"xar", int_aarch64_sve_xar>;

// SVE2 extract vector (immediate offset, constructive)		// SVE2 extract vector (immediate offset, constructive)
▲ Show 20 Lines • Show All 92 Lines • Show Last 20 Lines

llvm/lib/Target/AArch64/SVEInstrFormats.td

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 515 Lines • ▼ Show 20 Lines
class SVE_2_Op_Fp_Imm_Pat_Zero<ValueType vt, SDPatternOperator op,		class SVE_2_Op_Fp_Imm_Pat_Zero<ValueType vt, SDPatternOperator op,
ValueType pt, ValueType it,		ValueType pt, ValueType it,
FPImmLeaf immL, int imm,		FPImmLeaf immL, int imm,
Instruction inst>		Instruction inst>
: Pat<(vt (op pt:$Pg, (vselect pt:$Pg, vt:$Zs1, (SVEDup0)),		: Pat<(vt (op pt:$Pg, (vselect pt:$Pg, vt:$Zs1, (SVEDup0)),
(vt (AArch64dup (it immL))))),		(vt (AArch64dup (it immL))))),
(inst $Pg, $Zs1, imm)>;		(inst $Pg, $Zs1, imm)>;

		// Used to re-order the operands of BSP when lowering to BSL. BSP has the order:
		// mask, in1, in2 whereas BSL for SVE2 has them ordered in1, in2, mask
		class SVE_3_Op_BSP_Pat<ValueType vtd, SDPatternOperator op, ValueType vt1,
		ValueType vt2, ValueType vt3, Instruction inst>
		: Pat<(vtd (op vt1:$Op1, vt2:$Op2, vt3:$Op3)),
		(inst $Op2, $Op3, $Op1)>;

//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//
// SVE pattern match helpers.		// SVE pattern match helpers.
//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//

// Matches either an intrinsic, or a predicated operation with an all active predicate		// Matches either an intrinsic, or a predicated operation with an all active predicate
class EitherVSelectOrPassthruPatFrags<SDPatternOperator intrinsic, SDPatternOperator sdnode>		class EitherVSelectOrPassthruPatFrags<SDPatternOperator intrinsic, SDPatternOperator sdnode>
: PatFrags<(ops node:$Pg, node:$Op1, node:$Op2), [		: PatFrags<(ops node:$Pg, node:$Op1, node:$Op2), [
(intrinsic node:$Pg, node:$Op1, node:$Op2),		(intrinsic node:$Pg, node:$Op1, node:$Op2),
▲ Show 20 Lines • Show All 3,947 Lines • ▼ Show 20 Lines	: I<(outs ZPR64:$Zdn), (ins ZPR64:$_Zdn, ZPR64:$Zm, ZPR64:$Zk),
let Inst{9-5} = Zk;		let Inst{9-5} = Zk;
let Inst{4-0} = Zdn;		let Inst{4-0} = Zdn;

let Constraints = "$Zdn = $_Zdn";		let Constraints = "$Zdn = $_Zdn";
let DestructiveInstType = DestructiveOther;		let DestructiveInstType = DestructiveOther;
let ElementSize = ElementSizeNone;		let ElementSize = ElementSizeNone;
}		}

multiclass sve2_int_bitwise_ternary_op<bits<3> opc, string asm, SDPatternOperator op> {		multiclass sve2_int_bitwise_ternary_op<bits<3> opc, string asm, SDPatternOperator op,
		SDPatternOperator ir_op = null_frag> {
def NAME : sve2_int_bitwise_ternary_op_d<opc, asm>;		def NAME : sve2_int_bitwise_ternary_op_d<opc, asm>;

def : InstAlias<asm # "\t$Zdn, $Zdn, $Zm, $Zk",		def : InstAlias<asm # "\t$Zdn, $Zdn, $Zm, $Zk",
(!cast<Instruction>(NAME) ZPR8:$Zdn, ZPR8:$Zm, ZPR8:$Zk), 1>;		(!cast<Instruction>(NAME) ZPR8:$Zdn, ZPR8:$Zm, ZPR8:$Zk), 1>;
def : InstAlias<asm # "\t$Zdn, $Zdn, $Zm, $Zk",		def : InstAlias<asm # "\t$Zdn, $Zdn, $Zm, $Zk",
(!cast<Instruction>(NAME) ZPR16:$Zdn, ZPR16:$Zm, ZPR16:$Zk), 1>;		(!cast<Instruction>(NAME) ZPR16:$Zdn, ZPR16:$Zm, ZPR16:$Zk), 1>;
def : InstAlias<asm # "\t$Zdn, $Zdn, $Zm, $Zk",		def : InstAlias<asm # "\t$Zdn, $Zdn, $Zm, $Zk",
(!cast<Instruction>(NAME) ZPR32:$Zdn, ZPR32:$Zm, ZPR32:$Zk), 1>;		(!cast<Instruction>(NAME) ZPR32:$Zdn, ZPR32:$Zm, ZPR32:$Zk), 1>;

def : SVE_3_Op_Pat<nxv16i8, op, nxv16i8, nxv16i8, nxv16i8, !cast<Instruction>(NAME)>;		def : SVE_3_Op_Pat<nxv16i8, op, nxv16i8, nxv16i8, nxv16i8, !cast<Instruction>(NAME)>;
def : SVE_3_Op_Pat<nxv8i16, op, nxv8i16, nxv8i16, nxv8i16, !cast<Instruction>(NAME)>;		def : SVE_3_Op_Pat<nxv8i16, op, nxv8i16, nxv8i16, nxv8i16, !cast<Instruction>(NAME)>;
def : SVE_3_Op_Pat<nxv4i32, op, nxv4i32, nxv4i32, nxv4i32, !cast<Instruction>(NAME)>;		def : SVE_3_Op_Pat<nxv4i32, op, nxv4i32, nxv4i32, nxv4i32, !cast<Instruction>(NAME)>;
def : SVE_3_Op_Pat<nxv2i64, op, nxv2i64, nxv2i64, nxv2i64, !cast<Instruction>(NAME)>;		def : SVE_3_Op_Pat<nxv2i64, op, nxv2i64, nxv2i64, nxv2i64, !cast<Instruction>(NAME)>;


		def : SVE_3_Op_BSP_Pat<nxv16i8, ir_op, nxv16i8, nxv16i8, nxv16i8, !cast<Instruction>(NAME)>;
		def : SVE_3_Op_BSP_Pat<nxv8i16, ir_op, nxv8i16, nxv8i16, nxv8i16, !cast<Instruction>(NAME)>;
		def : SVE_3_Op_BSP_Pat<nxv4i32, ir_op, nxv4i32, nxv4i32, nxv4i32, !cast<Instruction>(NAME)>;
		def : SVE_3_Op_BSP_Pat<nxv2i64, ir_op, nxv2i64, nxv2i64, nxv2i64, !cast<Instruction>(NAME)>;
}		}

class sve2_int_rotate_right_imm<bits<4> tsz8_64, string asm,		class sve2_int_rotate_right_imm<bits<4> tsz8_64, string asm,
ZPRRegOp zprty, Operand immtype>		ZPRRegOp zprty, Operand immtype>
: I<(outs zprty:$Zdn), (ins zprty:$_Zdn, zprty:$Zm, immtype:$imm),		: I<(outs zprty:$Zdn), (ins zprty:$_Zdn, zprty:$Zm, immtype:$imm),
asm, "\t$Zdn, $_Zdn, $Zm, $imm",		asm, "\t$Zdn, $_Zdn, $Zm, $imm",
"",		"",
[]>, Sched<[]> {		[]>, Sched<[]> {
▲ Show 20 Lines • Show All 4,018 Lines • Show Last 20 Lines

llvm/test/CodeGen/AArch64/arm64-fcopysign.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc < %s -mtriple=aarch64-apple-darwin \| FileCheck %s			; RUN: llc < %s -mtriple=aarch64-apple-darwin \| FileCheck %s

	; rdar://9332258			; rdar://9332258

	define float @test1(float %x, float %y) nounwind {			define float @test1(float %x, float %y) nounwind {
	; CHECK-LABEL: test1:			; CHECK-LABEL: test1:
	; CHECK: ; %bb.0: ; %entry			; CHECK: ; %bb.0: ; %entry
	; CHECK-NEXT: movi.4s v2, #128, lsl #24			; CHECK-NEXT: mvni.4s v2, #128, lsl #24
	; CHECK-NEXT: ; kill: def $s0 killed $s0 def $q0			; CHECK-NEXT: ; kill: def $s0 killed $s0 def $q0
	; CHECK-NEXT: ; kill: def $s1 killed $s1 def $q1			; CHECK-NEXT: ; kill: def $s1 killed $s1 def $q1
	; CHECK-NEXT: bit.16b v0, v1, v2			; CHECK-NEXT: bif.16b v0, v1, v2
	; CHECK-NEXT: ; kill: def $s0 killed $s0 killed $q0			; CHECK-NEXT: ; kill: def $s0 killed $s0 killed $q0
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	entry:			entry:
	%0 = tail call float @copysignf(float %x, float %y) nounwind readnone			%0 = tail call float @copysignf(float %x, float %y) nounwind readnone
	ret float %0			ret float %0
	}			}

	define double @test2(double %x, double %y) nounwind {			define double @test2(double %x, double %y) nounwind {
	; CHECK-LABEL: test2:			; CHECK-LABEL: test2:
	; CHECK: ; %bb.0: ; %entry			; CHECK: ; %bb.0: ; %entry
	; CHECK-NEXT: movi.2d v2, #0000000000000000			; CHECK-NEXT: movi.2d v2, #0xffffffffffffffff
	; CHECK-NEXT: ; kill: def $d0 killed $d0 def $q0			; CHECK-NEXT: ; kill: def $d0 killed $d0 def $q0
	; CHECK-NEXT: ; kill: def $d1 killed $d1 def $q1			; CHECK-NEXT: ; kill: def $d1 killed $d1 def $q1
	; CHECK-NEXT: fneg.2d v2, v2			; CHECK-NEXT: fneg.2d v2, v2
	; CHECK-NEXT: bit.16b v0, v1, v2			; CHECK-NEXT: bif.16b v0, v1, v2
				peterwaller-armUnsubmitted Not Done Reply Inline Actions Heads up, this looks like an unintended semantic change. peterwaller-arm: Heads up, this looks like an unintended semantic change.
				DavidTrubyAuthorUnsubmitted Done Reply Inline Actions This is caused by the odd code mentioned above that handles specially for f64, which I forgot to change when changing the mask generation. However since that change I don't think the special handling is actually necessary anymore. I'm just verifying that and will have a fix up soon. DavidTruby: This is caused by the odd code mentioned above that handles specially for f64, which I forgot…
	; CHECK-NEXT: ; kill: def $d0 killed $d0 killed $q0			; CHECK-NEXT: ; kill: def $d0 killed $d0 killed $q0
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	entry:			entry:
	%0 = tail call double @copysign(double %x, double %y) nounwind readnone			%0 = tail call double @copysign(double %x, double %y) nounwind readnone
	ret double %0			ret double %0
	}			}

	; rdar://9545768			; rdar://9545768
	define double @test3(double %a, float %b, float %c) nounwind {			define double @test3(double %a, float %b, float %c) nounwind {
	; CHECK-LABEL: test3:			; CHECK-LABEL: test3:
	; CHECK: ; %bb.0:			; CHECK: ; %bb.0:
	; CHECK-NEXT: movi.2d v3, #0000000000000000			; CHECK-NEXT: movi.2d v3, #0xffffffffffffffff
	; CHECK-NEXT: ; kill: def $d0 killed $d0 def $q0			; CHECK-NEXT: ; kill: def $d0 killed $d0 def $q0
	; CHECK-NEXT: fadd s1, s1, s2			; CHECK-NEXT: fadd s1, s1, s2
	; CHECK-NEXT: fneg.2d v2, v3			; CHECK-NEXT: fneg.2d v2, v3
	; CHECK-NEXT: fcvt d1, s1			; CHECK-NEXT: fcvt d1, s1
	; CHECK-NEXT: bit.16b v0, v1, v2			; CHECK-NEXT: bif.16b v0, v1, v2
	; CHECK-NEXT: ; kill: def $d0 killed $d0 killed $q0			; CHECK-NEXT: ; kill: def $d0 killed $d0 killed $q0
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%tmp1 = fadd float %b, %c			%tmp1 = fadd float %b, %c
	%tmp2 = fpext float %tmp1 to double			%tmp2 = fpext float %tmp1 to double
	%tmp = tail call double @copysign( double %a, double %tmp2 ) nounwind readnone			%tmp = tail call double @copysign( double %a, double %tmp2 ) nounwind readnone
	ret double %tmp			ret double %tmp
	}			}

	define float @test4() nounwind {			define float @test4() nounwind {
	; CHECK-LABEL: test4:			; CHECK-LABEL: test4:
	; CHECK: ; %bb.0: ; %entry			; CHECK: ; %bb.0: ; %entry
	; CHECK-NEXT: stp x29, x30, [sp, #-16]! ; 16-byte Folded Spill			; CHECK-NEXT: stp x29, x30, [sp, #-16]! ; 16-byte Folded Spill
	; CHECK-NEXT: bl _bar			; CHECK-NEXT: bl _bar
	; CHECK-NEXT: movi.4s v1, #128, lsl #24			; CHECK-NEXT: mvni.4s v1, #128, lsl #24
	; CHECK-NEXT: fcvt s0, d0			; CHECK-NEXT: fcvt s0, d0
	; CHECK-NEXT: fmov s2, #0.50000000			; CHECK-NEXT: fmov s2, #0.50000000
	; CHECK-NEXT: bit.16b v2, v0, v1			; CHECK-NEXT: bsl.16b v1, v2, v0
	; CHECK-NEXT: fadd s0, s0, s2			; CHECK-NEXT: fadd s0, s0, s1
	; CHECK-NEXT: ldp x29, x30, [sp], #16 ; 16-byte Folded Reload			; CHECK-NEXT: ldp x29, x30, [sp], #16 ; 16-byte Folded Reload
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	entry:			entry:
	%0 = tail call double (...) @bar() nounwind			%0 = tail call double (...) @bar() nounwind
	%1 = fptrunc double %0 to float			%1 = fptrunc double %0 to float
	%2 = tail call float @copysignf(float 5.000000e-01, float %1) nounwind readnone			%2 = tail call float @copysignf(float 5.000000e-01, float %1) nounwind readnone
	%3 = fadd float %1, %2			%3 = fadd float %1, %2
	ret float %3			ret float %3
	}			}

	declare double @bar(...)			declare double @bar(...)
	declare double @copysign(double, double) nounwind readnone			declare double @copysign(double, double) nounwind readnone
	declare float @copysignf(float, float) nounwind readnone			declare float @copysignf(float, float) nounwind readnone

llvm/test/CodeGen/AArch64/f16-instructions.ll

				; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc < %s -mtriple aarch64-unknown-unknown -aarch64-neon-syntax=apple -asm-verbose=false -disable-post-ra -frame-pointer=non-leaf \| FileCheck %s --check-prefix=CHECK-CVT --check-prefix=CHECK-COMMON			; RUN: llc < %s -mtriple aarch64-unknown-unknown -aarch64-neon-syntax=apple -asm-verbose=false -disable-post-ra -frame-pointer=non-leaf \| FileCheck %s --check-prefix=CHECK-CVT --check-prefix=CHECK-COMMON
	; RUN: llc < %s -mtriple aarch64-unknown-unknown -mattr=+fullfp16 -aarch64-neon-syntax=apple -asm-verbose=false -disable-post-ra -frame-pointer=non-leaf \| FileCheck %s --check-prefix=CHECK-COMMON --check-prefix=CHECK-FP16			; RUN: llc < %s -mtriple aarch64-unknown-unknown -mattr=+fullfp16 -aarch64-neon-syntax=apple -asm-verbose=false -disable-post-ra -frame-pointer=non-leaf \| FileCheck %s --check-prefix=CHECK-COMMON --check-prefix=CHECK-FP16

	; RUN: llc < %s -mtriple aarch64-unknown-unknown -aarch64-neon-syntax=apple \			; RUN: llc < %s -mtriple aarch64-unknown-unknown -aarch64-neon-syntax=apple \
	; RUN: -asm-verbose=false -disable-post-ra -frame-pointer=non-leaf -global-isel \			; RUN: -asm-verbose=false -disable-post-ra -frame-pointer=non-leaf -global-isel \
	; RUN: -global-isel-abort=2 -pass-remarks-missed=gisel-* 2>&1 \| FileCheck %s \			; RUN: -global-isel-abort=2 -pass-remarks-missed=gisel-* 2>&1 \| FileCheck %s \
	; RUN: --check-prefixes=FALLBACK,GISEL-CVT,GISEL			; RUN: --check-prefixes=FALLBACK,GISEL-CVT,GISEL

	▲ Show 20 Lines • Show All 1,086 Lines • ▼ Show 20 Lines
	; CHECK-FP16-NEXT: ret			; CHECK-FP16-NEXT: ret

	define half @test_maxnum(half %a, half %b) #0 {			define half @test_maxnum(half %a, half %b) #0 {
	%r = call half @llvm.maxnum.f16(half %a, half %b)			%r = call half @llvm.maxnum.f16(half %a, half %b)
	ret half %r			ret half %r
	}			}

	; CHECK-CVT-LABEL: test_copysign:			; CHECK-CVT-LABEL: test_copysign:
	; CHECK-CVT-NEXT: movi.4s v2, #128, lsl #24			; CHECK-CVT-NEXT: mvni.4s v2, #128, lsl #24
	; CHECK-CVT-NEXT: fcvt s1, h1			; CHECK-CVT-NEXT: fcvt s1, h1
	; CHECK-CVT-NEXT: fcvt s0, h0			; CHECK-CVT-NEXT: fcvt s0, h0
	; CHECK-CVT-NEXT: bit.16b v0, v1, v2			; CHECK-CVT-NEXT: bif.16b v0, v1, v2
	; CHECK-CVT-NEXT: fcvt h0, s0			; CHECK-CVT-NEXT: fcvt h0, s0
	; CHECK-CVT-NEXT: ret			; CHECK-CVT-NEXT: ret

	; CHECK-FP16-LABEL: test_copysign:			; CHECK-FP16-LABEL: test_copysign:
	; CHECK-FP16-NEXT: movi.8h v2, #128, lsl #8			; CHECK-FP16-NEXT: mvni.8h v2, #128, lsl #8
	; CHECK-FP16-NEXT: bit.16b v0, v1, v2			; CHECK-FP16-NEXT: bif.16b v0, v1, v2
	; CHECK-FP16-NEXT: ret			; CHECK-FP16-NEXT: ret

	define half @test_copysign(half %a, half %b) #0 {			define half @test_copysign(half %a, half %b) #0 {
	%r = call half @llvm.copysign.f16(half %a, half %b)			%r = call half @llvm.copysign.f16(half %a, half %b)
	ret half %r			ret half %r
	}			}

	; CHECK-CVT-LABEL: test_copysign_f32:			; CHECK-CVT-LABEL: test_copysign_f32:
	; CHECK-CVT-NEXT: movi.4s v2, #128, lsl #24			; CHECK-CVT-NEXT: mvni.4s v2, #128, lsl #24
	; CHECK-CVT-NEXT: fcvt s0, h0			; CHECK-CVT-NEXT: fcvt s0, h0
	; CHECK-CVT-NEXT: bit.16b v0, v1, v2			; CHECK-CVT-NEXT: bif.16b v0, v1, v2
	; CHECK-CVT-NEXT: fcvt h0, s0			; CHECK-CVT-NEXT: fcvt h0, s0
	; CHECK-CVT-NEXT: ret			; CHECK-CVT-NEXT: ret

	; CHECK-FP16-LABEL: test_copysign_f32:			; CHECK-FP16-LABEL: test_copysign_f32:
	; CHECK-FP16-NEXT: movi.8h v2, #128, lsl #8			; CHECK-FP16-NEXT: mvni.8h v2, #128, lsl #8
	; CHECK-FP16-NEXT: fcvt h1, s1			; CHECK-FP16-NEXT: fcvt h1, s1
	; CHECK-FP16-NEXT: bit.16b v0, v1, v2			; CHECK-FP16-NEXT: bif.16b v0, v1, v2
	; CHECK-FP16-NEXT: ret			; CHECK-FP16-NEXT: ret

	define half @test_copysign_f32(half %a, float %b) #0 {			define half @test_copysign_f32(half %a, float %b) #0 {
	%tb = fptrunc float %b to half			%tb = fptrunc float %b to half
	%r = call half @llvm.copysign.f16(half %a, half %tb)			%r = call half @llvm.copysign.f16(half %a, half %tb)
	ret half %r			ret half %r
	}			}

	; CHECK-CVT-LABEL: test_copysign_f64:			; CHECK-CVT-LABEL: test_copysign_f64:
	; CHECK-CVT-NEXT: movi.4s v2, #128, lsl #24			; CHECK-CVT-NEXT: mvni.4s v2, #128, lsl #24
	; CHECK-CVT-NEXT: fcvt s1, d1			; CHECK-CVT-NEXT: fcvt s1, d1
	; CHECK-CVT-NEXT: fcvt s0, h0			; CHECK-CVT-NEXT: fcvt s0, h0
	; CHECK-CVT-NEXT: bit.16b v0, v1, v2			; CHECK-CVT-NEXT: bif.16b v0, v1, v2
	; CHECK-CVT-NEXT: fcvt h0, s0			; CHECK-CVT-NEXT: fcvt h0, s0
	; CHECK-CVT-NEXT: ret			; CHECK-CVT-NEXT: ret

	; CHECK-FP16-LABEL: test_copysign_f64:			; CHECK-FP16-LABEL: test_copysign_f64:
	; CHECK-FP16-NEXT: movi.8h v2, #128, lsl #8			; CHECK-FP16-NEXT: mvni.8h v2, #128, lsl #8
	; CHECK-FP16-NEXT: fcvt h1, d1			; CHECK-FP16-NEXT: fcvt h1, d1
	; CHECK-FP16-NEXT: bit.16b v0, v1, v2			; CHECK-FP16-NEXT: bif.16b v0, v1, v2
	; CHECK-FP16-NEXT: ret			; CHECK-FP16-NEXT: ret

	define half @test_copysign_f64(half %a, double %b) #0 {			define half @test_copysign_f64(half %a, double %b) #0 {
	%tb = fptrunc double %b to half			%tb = fptrunc double %b to half
	%r = call half @llvm.copysign.f16(half %a, half %tb)			%r = call half @llvm.copysign.f16(half %a, half %tb)
	ret half %r			ret half %r
	}			}

	; Check that the FP promotion will use a truncating FP_ROUND, so we can fold			; Check that the FP promotion will use a truncating FP_ROUND, so we can fold
	; away the (fpext (fp_round <result>)) here.			; away the (fpext (fp_round <result>)) here.

	; CHECK-CVT-LABEL: test_copysign_extended:			; CHECK-CVT-LABEL: test_copysign_extended:
	; CHECK-CVT-NEXT: movi.4s v2, #128, lsl #24			; CHECK-CVT-NEXT: mvni.4s v2, #128, lsl #24
	; CHECK-CVT-NEXT: fcvt s1, h1			; CHECK-CVT-NEXT: fcvt s1, h1
	; CHECK-CVT-NEXT: fcvt s0, h0			; CHECK-CVT-NEXT: fcvt s0, h0
	; CHECK-CVT-NEXT: bit.16b v0, v1, v2			; CHECK-CVT-NEXT: bif.16b v0, v1, v2
	; CHECK-CVT-NEXT: ret			; CHECK-CVT-NEXT: ret

	; CHECK-FP16-LABEL: test_copysign_extended:			; CHECK-FP16-LABEL: test_copysign_extended:
	; CHECK-FP16-NEXT: movi.8h v2, #128, lsl #8			; CHECK-FP16-NEXT: mvni.8h v2, #128, lsl #8
	; CHECK-FP16-NEXT: bit.16b v0, v1, v2			; CHECK-FP16-NEXT: bif.16b v0, v1, v2
	; CHECK-FP16-NEXT: fcvt s0, h0			; CHECK-FP16-NEXT: fcvt s0, h0
	; CHECK-FP16-NEXT: ret			; CHECK-FP16-NEXT: ret

	define float @test_copysign_extended(half %a, half %b) #0 {			define float @test_copysign_extended(half %a, half %b) #0 {
	%r = call half @llvm.copysign.f16(half %a, half %b)			%r = call half @llvm.copysign.f16(half %a, half %b)
	%xr = fpext half %r to float			%xr = fpext half %r to float
	ret float %xr			ret float %xr
	}			}
	▲ Show 20 Lines • Show All 201 Lines • Show Last 20 Lines

llvm/test/CodeGen/AArch64/fcopysign.ll

Show First 20 Lines • Show All 89 Lines • ▼ Show 20 Lines	entry:
%conv = fpext float %v1 to fp128		%conv = fpext float %v1 to fp128
%call = tail call fp128 @llvm.copysign.f128(fp128 %v0, fp128 %conv)		%call = tail call fp128 @llvm.copysign.f128(fp128 %v0, fp128 %conv)
ret fp128 %call		ret fp128 %call
}		}

define float @copysign32(float %a, float %b) {		define float @copysign32(float %a, float %b) {
; CHECK-LABEL: copysign32:		; CHECK-LABEL: copysign32:
; CHECK: // %bb.0: // %entry		; CHECK: // %bb.0: // %entry
; CHECK-NEXT: movi v2.4s, #128, lsl #24		; CHECK-NEXT: mvni v2.4s, #128, lsl #24
; CHECK-NEXT: // kill: def $s0 killed $s0 def $q0		; CHECK-NEXT: // kill: def $s0 killed $s0 def $q0
; CHECK-NEXT: // kill: def $s1 killed $s1 def $q1		; CHECK-NEXT: // kill: def $s1 killed $s1 def $q1
; CHECK-NEXT: bit v0.16b, v1.16b, v2.16b		; CHECK-NEXT: bif v0.16b, v1.16b, v2.16b
; CHECK-NEXT: // kill: def $s0 killed $s0 killed $q0		; CHECK-NEXT: // kill: def $s0 killed $s0 killed $q0
; CHECK-NEXT: ret		; CHECK-NEXT: ret
;		;
; CHECK-NONEON-LABEL: copysign32:		; CHECK-NONEON-LABEL: copysign32:
; CHECK-NONEON: // %bb.0: // %entry		; CHECK-NONEON: // %bb.0: // %entry
; CHECK-NONEON-NEXT: fabs s0, s0		; CHECK-NONEON-NEXT: fabs s0, s0
; CHECK-NONEON-NEXT: fmov w8, s1		; CHECK-NONEON-NEXT: fmov w8, s1
; CHECK-NONEON-NEXT: tst w8, #0x80000000		; CHECK-NONEON-NEXT: tst w8, #0x80000000
; CHECK-NONEON-NEXT: fneg s2, s0		; CHECK-NONEON-NEXT: fneg s2, s0
; CHECK-NONEON-NEXT: fcsel s0, s2, s0, ne		; CHECK-NONEON-NEXT: fcsel s0, s2, s0, ne
; CHECK-NONEON-NEXT: ret		; CHECK-NONEON-NEXT: ret
entry:		entry:
%c = call float @llvm.copysign.f32(float %a, float %b)		%c = call float @llvm.copysign.f32(float %a, float %b)
ret float %c		ret float %c
}		}

define double @copysign64(double %a, double %b) {		define double @copysign64(double %a, double %b) {
; CHECK-LABEL: copysign64:		; CHECK-LABEL: copysign64:
; CHECK: // %bb.0: // %entry		; CHECK: // %bb.0: // %entry
; CHECK-NEXT: movi v2.2d, #0000000000000000		; CHECK-NEXT: movi v2.2d, #0xffffffffffffffff
; CHECK-NEXT: // kill: def $d0 killed $d0 def $q0		; CHECK-NEXT: // kill: def $d0 killed $d0 def $q0
; CHECK-NEXT: // kill: def $d1 killed $d1 def $q1		; CHECK-NEXT: // kill: def $d1 killed $d1 def $q1
; CHECK-NEXT: fneg v2.2d, v2.2d		; CHECK-NEXT: fneg v2.2d, v2.2d
; CHECK-NEXT: bit v0.16b, v1.16b, v2.16b		; CHECK-NEXT: bif v0.16b, v1.16b, v2.16b
; CHECK-NEXT: // kill: def $d0 killed $d0 killed $q0		; CHECK-NEXT: // kill: def $d0 killed $d0 killed $q0
; CHECK-NEXT: ret		; CHECK-NEXT: ret
;		;
; CHECK-NONEON-LABEL: copysign64:		; CHECK-NONEON-LABEL: copysign64:
; CHECK-NONEON: // %bb.0: // %entry		; CHECK-NONEON: // %bb.0: // %entry
; CHECK-NONEON-NEXT: fabs d0, d0		; CHECK-NONEON-NEXT: fabs d0, d0
; CHECK-NONEON-NEXT: fmov x8, d1		; CHECK-NONEON-NEXT: fmov x8, d1
; CHECK-NONEON-NEXT: tst x8, #0x8000000000000000		; CHECK-NONEON-NEXT: tst x8, #0x8000000000000000
; CHECK-NONEON-NEXT: fneg d2, d0		; CHECK-NONEON-NEXT: fneg d2, d0
; CHECK-NONEON-NEXT: fcsel d0, d2, d0, ne		; CHECK-NONEON-NEXT: fcsel d0, d2, d0, ne
; CHECK-NONEON-NEXT: ret		; CHECK-NONEON-NEXT: ret
entry:		entry:
%c = call double @llvm.copysign.f64(double %a, double %b)		%c = call double @llvm.copysign.f64(double %a, double %b)
ret double %c		ret double %c
}		}

define half @copysign16(half %a, half %b) {		define half @copysign16(half %a, half %b) {
; CHECK-LABEL: copysign16:		; CHECK-LABEL: copysign16:
; CHECK: // %bb.0: // %entry		; CHECK: // %bb.0: // %entry
; CHECK-NEXT: movi v2.4s, #128, lsl #24		; CHECK-NEXT: mvni v2.4s, #128, lsl #24
; CHECK-NEXT: fcvt s1, h1		; CHECK-NEXT: fcvt s1, h1
; CHECK-NEXT: fcvt s0, h0		; CHECK-NEXT: fcvt s0, h0
; CHECK-NEXT: bit v0.16b, v1.16b, v2.16b		; CHECK-NEXT: bif v0.16b, v1.16b, v2.16b
; CHECK-NEXT: fcvt h0, s0		; CHECK-NEXT: fcvt h0, s0
; CHECK-NEXT: ret		; CHECK-NEXT: ret
;		;
; CHECK-NONEON-LABEL: copysign16:		; CHECK-NONEON-LABEL: copysign16:
; CHECK-NONEON: // %bb.0: // %entry		; CHECK-NONEON: // %bb.0: // %entry
; CHECK-NONEON-NEXT: sub sp, sp, #16		; CHECK-NONEON-NEXT: sub sp, sp, #16
; CHECK-NONEON-NEXT: .cfi_def_cfa_offset 16		; CHECK-NONEON-NEXT: .cfi_def_cfa_offset 16
; CHECK-NONEON-NEXT: fcvt s0, h0		; CHECK-NONEON-NEXT: fcvt s0, h0
Show All 13 Lines

llvm/test/CodeGen/AArch64/sve-fcopysign.ll

This file was copied to llvm/test/CodeGen/AArch64/sve2-fcopysign.ll.

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc < %s -mtriple aarch64-eabi -mattr=+sve -o - \| FileCheck --check-prefixes=CHECK %s			; RUN: llc < %s -mtriple aarch64-eabi -mattr=+sve -o - \| FileCheck --check-prefixes=CHECK %s

	target datalayout = "e-m:o-i64:64-i128:128-n32:64-S128"			target datalayout = "e-m:o-i64:64-i128:128-n32:64-S128"

	;============ v2f32			;============ v2f32

	define <vscale x 2 x float> @test_copysign_v2f32_v2f32(<vscale x 2 x float> %a, <vscale x 2 x float> %b) #0 {			define <vscale x 2 x float> @test_copysign_v2f32_v2f32(<vscale x 2 x float> %a, <vscale x 2 x float> %b) #0 {
	; CHECK-LABEL: test_copysign_v2f32_v2f32:			; CHECK-LABEL: test_copysign_v2f32_v2f32:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: and z0.s, z0.s, #0x7fffffff
	; CHECK-NEXT: and z1.s, z1.s, #0x80000000			; CHECK-NEXT: and z1.s, z1.s, #0x80000000
	; CHECK-NEXT: orr z0.d, z1.d, z0.d			; CHECK-NEXT: and z0.s, z0.s, #0x7fffffff
				; CHECK-NEXT: orr z0.d, z0.d, z1.d
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call <vscale x 2 x float> @llvm.copysign.v2f32(<vscale x 2 x float> %a, <vscale x 2 x float> %b)			%r = call <vscale x 2 x float> @llvm.copysign.v2f32(<vscale x 2 x float> %a, <vscale x 2 x float> %b)
	ret <vscale x 2 x float> %r			ret <vscale x 2 x float> %r
	}			}

	define <vscale x 2 x float> @test_copysign_v2f32_v2f64(<vscale x 2 x float> %a, <vscale x 2 x double> %b) #0 {			define <vscale x 2 x float> @test_copysign_v2f32_v2f64(<vscale x 2 x float> %a, <vscale x 2 x double> %b) #0 {
	; CHECK-LABEL: test_copysign_v2f32_v2f64:			; CHECK-LABEL: test_copysign_v2f32_v2f64:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: ptrue p0.d			; CHECK-NEXT: ptrue p0.d
	; CHECK-NEXT: and z0.s, z0.s, #0x7fffffff			; CHECK-NEXT: and z0.s, z0.s, #0x7fffffff
	; CHECK-NEXT: fcvt z1.s, p0/m, z1.d			; CHECK-NEXT: fcvt z1.s, p0/m, z1.d
	; CHECK-NEXT: and z1.s, z1.s, #0x80000000			; CHECK-NEXT: and z1.s, z1.s, #0x80000000
	; CHECK-NEXT: orr z0.d, z1.d, z0.d			; CHECK-NEXT: orr z0.d, z0.d, z1.d
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%tmp0 = fptrunc <vscale x 2 x double> %b to <vscale x 2 x float>			%tmp0 = fptrunc <vscale x 2 x double> %b to <vscale x 2 x float>
	%r = call <vscale x 2 x float> @llvm.copysign.v2f32(<vscale x 2 x float> %a, <vscale x 2 x float> %tmp0)			%r = call <vscale x 2 x float> @llvm.copysign.v2f32(<vscale x 2 x float> %a, <vscale x 2 x float> %tmp0)
	ret <vscale x 2 x float> %r			ret <vscale x 2 x float> %r
	}			}

	declare <vscale x 2 x float> @llvm.copysign.v2f32(<vscale x 2 x float> %a, <vscale x 2 x float> %b) #0			declare <vscale x 2 x float> @llvm.copysign.v2f32(<vscale x 2 x float> %a, <vscale x 2 x float> %b) #0

	;============ v4f32			;============ v4f32

	define <vscale x 4 x float> @test_copysign_v4f32_v4f32(<vscale x 4 x float> %a, <vscale x 4 x float> %b) #0 {			define <vscale x 4 x float> @test_copysign_v4f32_v4f32(<vscale x 4 x float> %a, <vscale x 4 x float> %b) #0 {
	; CHECK-LABEL: test_copysign_v4f32_v4f32:			; CHECK-LABEL: test_copysign_v4f32_v4f32:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: and z0.s, z0.s, #0x7fffffff
	; CHECK-NEXT: and z1.s, z1.s, #0x80000000			; CHECK-NEXT: and z1.s, z1.s, #0x80000000
	; CHECK-NEXT: orr z0.d, z1.d, z0.d			; CHECK-NEXT: and z0.s, z0.s, #0x7fffffff
				; CHECK-NEXT: orr z0.d, z0.d, z1.d
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call <vscale x 4 x float> @llvm.copysign.v4f32(<vscale x 4 x float> %a, <vscale x 4 x float> %b)			%r = call <vscale x 4 x float> @llvm.copysign.v4f32(<vscale x 4 x float> %a, <vscale x 4 x float> %b)
	ret <vscale x 4 x float> %r			ret <vscale x 4 x float> %r
	}			}

	; SplitVecOp #1			; SplitVecOp #1
	define <vscale x 4 x float> @test_copysign_v4f32_v4f64(<vscale x 4 x float> %a, <vscale x 4 x double> %b) #0 {			define <vscale x 4 x float> @test_copysign_v4f32_v4f64(<vscale x 4 x float> %a, <vscale x 4 x double> %b) #0 {
	; CHECK-LABEL: test_copysign_v4f32_v4f64:			; CHECK-LABEL: test_copysign_v4f32_v4f64:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: ptrue p0.d			; CHECK-NEXT: ptrue p0.d
	; CHECK-NEXT: and z0.s, z0.s, #0x7fffffff			; CHECK-NEXT: and z0.s, z0.s, #0x7fffffff
	; CHECK-NEXT: fcvt z2.s, p0/m, z2.d			; CHECK-NEXT: fcvt z2.s, p0/m, z2.d
	; CHECK-NEXT: fcvt z1.s, p0/m, z1.d			; CHECK-NEXT: fcvt z1.s, p0/m, z1.d
	; CHECK-NEXT: uzp1 z1.s, z1.s, z2.s			; CHECK-NEXT: uzp1 z1.s, z1.s, z2.s
	; CHECK-NEXT: and z1.s, z1.s, #0x80000000			; CHECK-NEXT: and z1.s, z1.s, #0x80000000
	; CHECK-NEXT: orr z0.d, z1.d, z0.d			; CHECK-NEXT: orr z0.d, z0.d, z1.d
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%tmp0 = fptrunc <vscale x 4 x double> %b to <vscale x 4 x float>			%tmp0 = fptrunc <vscale x 4 x double> %b to <vscale x 4 x float>
	%r = call <vscale x 4 x float> @llvm.copysign.v4f32(<vscale x 4 x float> %a, <vscale x 4 x float> %tmp0)			%r = call <vscale x 4 x float> @llvm.copysign.v4f32(<vscale x 4 x float> %a, <vscale x 4 x float> %tmp0)
	ret <vscale x 4 x float> %r			ret <vscale x 4 x float> %r
	}			}

	declare <vscale x 4 x float> @llvm.copysign.v4f32(<vscale x 4 x float> %a, <vscale x 4 x float> %b) #0			declare <vscale x 4 x float> @llvm.copysign.v4f32(<vscale x 4 x float> %a, <vscale x 4 x float> %b) #0

	;============ v2f64			;============ v2f64

	define <vscale x 2 x double> @test_copysign_v2f64_v232(<vscale x 2 x double> %a, <vscale x 2 x float> %b) #0 {			define <vscale x 2 x double> @test_copysign_v2f64_v232(<vscale x 2 x double> %a, <vscale x 2 x float> %b) #0 {
	; CHECK-LABEL: test_copysign_v2f64_v232:			; CHECK-LABEL: test_copysign_v2f64_v232:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: ptrue p0.d			; CHECK-NEXT: ptrue p0.d
	; CHECK-NEXT: and z0.d, z0.d, #0x7fffffffffffffff			; CHECK-NEXT: and z0.d, z0.d, #0x7fffffffffffffff
	; CHECK-NEXT: fcvt z1.d, p0/m, z1.s			; CHECK-NEXT: fcvt z1.d, p0/m, z1.s
	; CHECK-NEXT: and z1.d, z1.d, #0x8000000000000000			; CHECK-NEXT: and z1.d, z1.d, #0x8000000000000000
	; CHECK-NEXT: orr z0.d, z1.d, z0.d			; CHECK-NEXT: orr z0.d, z0.d, z1.d
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%tmp0 = fpext <vscale x 2 x float> %b to <vscale x 2 x double>			%tmp0 = fpext <vscale x 2 x float> %b to <vscale x 2 x double>
	%r = call <vscale x 2 x double> @llvm.copysign.v2f64(<vscale x 2 x double> %a, <vscale x 2 x double> %tmp0)			%r = call <vscale x 2 x double> @llvm.copysign.v2f64(<vscale x 2 x double> %a, <vscale x 2 x double> %tmp0)
	ret <vscale x 2 x double> %r			ret <vscale x 2 x double> %r
	}			}

	define <vscale x 2 x double> @test_copysign_v2f64_v2f64(<vscale x 2 x double> %a, <vscale x 2 x double> %b) #0 {			define <vscale x 2 x double> @test_copysign_v2f64_v2f64(<vscale x 2 x double> %a, <vscale x 2 x double> %b) #0 {
	; CHECK-LABEL: test_copysign_v2f64_v2f64:			; CHECK-LABEL: test_copysign_v2f64_v2f64:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: and z0.d, z0.d, #0x7fffffffffffffff
	; CHECK-NEXT: and z1.d, z1.d, #0x8000000000000000			; CHECK-NEXT: and z1.d, z1.d, #0x8000000000000000
	; CHECK-NEXT: orr z0.d, z1.d, z0.d			; CHECK-NEXT: and z0.d, z0.d, #0x7fffffffffffffff
				; CHECK-NEXT: orr z0.d, z0.d, z1.d
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call <vscale x 2 x double> @llvm.copysign.v2f64(<vscale x 2 x double> %a, <vscale x 2 x double> %b)			%r = call <vscale x 2 x double> @llvm.copysign.v2f64(<vscale x 2 x double> %a, <vscale x 2 x double> %b)
	ret <vscale x 2 x double> %r			ret <vscale x 2 x double> %r
	}			}

	declare <vscale x 2 x double> @llvm.copysign.v2f64(<vscale x 2 x double> %a, <vscale x 2 x double> %b) #0			declare <vscale x 2 x double> @llvm.copysign.v2f64(<vscale x 2 x double> %a, <vscale x 2 x double> %b) #0

	;============ v4f64			;============ v4f64

	; SplitVecRes mismatched			; SplitVecRes mismatched
	define <vscale x 4 x double> @test_copysign_v4f64_v4f32(<vscale x 4 x double> %a, <vscale x 4 x float> %b) #0 {			define <vscale x 4 x double> @test_copysign_v4f64_v4f32(<vscale x 4 x double> %a, <vscale x 4 x float> %b) #0 {
	; CHECK-LABEL: test_copysign_v4f64_v4f32:			; CHECK-LABEL: test_copysign_v4f64_v4f32:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: ptrue p0.d			; CHECK-NEXT: ptrue p0.d
	; CHECK-NEXT: uunpkhi z3.d, z2.s			; CHECK-NEXT: uunpkhi z3.d, z2.s
	; CHECK-NEXT: uunpklo z2.d, z2.s			; CHECK-NEXT: uunpklo z2.d, z2.s
	; CHECK-NEXT: fcvt z3.d, p0/m, z3.s			; CHECK-NEXT: fcvt z3.d, p0/m, z3.s
	; CHECK-NEXT: fcvt z2.d, p0/m, z2.s			; CHECK-NEXT: fcvt z2.d, p0/m, z2.s
	; CHECK-NEXT: and z0.d, z0.d, #0x7fffffffffffffff			; CHECK-NEXT: and z0.d, z0.d, #0x7fffffffffffffff
	; CHECK-NEXT: and z2.d, z2.d, #0x8000000000000000			; CHECK-NEXT: and z2.d, z2.d, #0x8000000000000000
	; CHECK-NEXT: and z3.d, z3.d, #0x8000000000000000			; CHECK-NEXT: and z3.d, z3.d, #0x8000000000000000
	; CHECK-NEXT: and z1.d, z1.d, #0x7fffffffffffffff			; CHECK-NEXT: and z1.d, z1.d, #0x7fffffffffffffff
	; CHECK-NEXT: orr z0.d, z2.d, z0.d			; CHECK-NEXT: orr z0.d, z0.d, z2.d
	; CHECK-NEXT: orr z1.d, z3.d, z1.d			; CHECK-NEXT: orr z1.d, z1.d, z3.d
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%tmp0 = fpext <vscale x 4 x float> %b to <vscale x 4 x double>			%tmp0 = fpext <vscale x 4 x float> %b to <vscale x 4 x double>
	%r = call <vscale x 4 x double> @llvm.copysign.v4f64(<vscale x 4 x double> %a, <vscale x 4 x double> %tmp0)			%r = call <vscale x 4 x double> @llvm.copysign.v4f64(<vscale x 4 x double> %a, <vscale x 4 x double> %tmp0)
	ret <vscale x 4 x double> %r			ret <vscale x 4 x double> %r
	}			}

	; SplitVecRes same			; SplitVecRes same
	define <vscale x 4 x double> @test_copysign_v4f64_v4f64(<vscale x 4 x double> %a, <vscale x 4 x double> %b) #0 {			define <vscale x 4 x double> @test_copysign_v4f64_v4f64(<vscale x 4 x double> %a, <vscale x 4 x double> %b) #0 {
	; CHECK-LABEL: test_copysign_v4f64_v4f64:			; CHECK-LABEL: test_copysign_v4f64_v4f64:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: and z2.d, z2.d, #0x8000000000000000			; CHECK-NEXT: and z2.d, z2.d, #0x8000000000000000
	; CHECK-NEXT: and z0.d, z0.d, #0x7fffffffffffffff			; CHECK-NEXT: and z0.d, z0.d, #0x7fffffffffffffff
	; CHECK-NEXT: and z1.d, z1.d, #0x7fffffffffffffff
	; CHECK-NEXT: and z3.d, z3.d, #0x8000000000000000			; CHECK-NEXT: and z3.d, z3.d, #0x8000000000000000
	; CHECK-NEXT: orr z0.d, z2.d, z0.d			; CHECK-NEXT: and z1.d, z1.d, #0x7fffffffffffffff
	; CHECK-NEXT: orr z1.d, z3.d, z1.d			; CHECK-NEXT: orr z0.d, z0.d, z2.d
				; CHECK-NEXT: orr z1.d, z1.d, z3.d
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call <vscale x 4 x double> @llvm.copysign.v4f64(<vscale x 4 x double> %a, <vscale x 4 x double> %b)			%r = call <vscale x 4 x double> @llvm.copysign.v4f64(<vscale x 4 x double> %a, <vscale x 4 x double> %b)
	ret <vscale x 4 x double> %r			ret <vscale x 4 x double> %r
	}			}

	declare <vscale x 4 x double> @llvm.copysign.v4f64(<vscale x 4 x double> %a, <vscale x 4 x double> %b) #0			declare <vscale x 4 x double> @llvm.copysign.v4f64(<vscale x 4 x double> %a, <vscale x 4 x double> %b) #0

	;============ v4f16			;============ v4f16

	define <vscale x 4 x half> @test_copysign_v4f16_v4f16(<vscale x 4 x half> %a, <vscale x 4 x half> %b) #0 {			define <vscale x 4 x half> @test_copysign_v4f16_v4f16(<vscale x 4 x half> %a, <vscale x 4 x half> %b) #0 {
	; CHECK-LABEL: test_copysign_v4f16_v4f16:			; CHECK-LABEL: test_copysign_v4f16_v4f16:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: and z0.h, z0.h, #0x7fff
	; CHECK-NEXT: and z1.h, z1.h, #0x8000			; CHECK-NEXT: and z1.h, z1.h, #0x8000
	; CHECK-NEXT: orr z0.d, z1.d, z0.d			; CHECK-NEXT: and z0.h, z0.h, #0x7fff
				; CHECK-NEXT: orr z0.d, z0.d, z1.d
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call <vscale x 4 x half> @llvm.copysign.v4f16(<vscale x 4 x half> %a, <vscale x 4 x half> %b)			%r = call <vscale x 4 x half> @llvm.copysign.v4f16(<vscale x 4 x half> %a, <vscale x 4 x half> %b)
	ret <vscale x 4 x half> %r			ret <vscale x 4 x half> %r
	}			}

	define <vscale x 4 x half> @test_copysign_v4f16_v4f32(<vscale x 4 x half> %a, <vscale x 4 x float> %b) #0 {			define <vscale x 4 x half> @test_copysign_v4f16_v4f32(<vscale x 4 x half> %a, <vscale x 4 x float> %b) #0 {
	; CHECK-LABEL: test_copysign_v4f16_v4f32:			; CHECK-LABEL: test_copysign_v4f16_v4f32:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: ptrue p0.s			; CHECK-NEXT: ptrue p0.s
	; CHECK-NEXT: and z0.h, z0.h, #0x7fff			; CHECK-NEXT: and z0.h, z0.h, #0x7fff
	; CHECK-NEXT: fcvt z1.h, p0/m, z1.s			; CHECK-NEXT: fcvt z1.h, p0/m, z1.s
	; CHECK-NEXT: and z1.h, z1.h, #0x8000			; CHECK-NEXT: and z1.h, z1.h, #0x8000
	; CHECK-NEXT: orr z0.d, z1.d, z0.d			; CHECK-NEXT: orr z0.d, z0.d, z1.d
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%tmp0 = fptrunc <vscale x 4 x float> %b to <vscale x 4 x half>			%tmp0 = fptrunc <vscale x 4 x float> %b to <vscale x 4 x half>
	%r = call <vscale x 4 x half> @llvm.copysign.v4f16(<vscale x 4 x half> %a, <vscale x 4 x half> %tmp0)			%r = call <vscale x 4 x half> @llvm.copysign.v4f16(<vscale x 4 x half> %a, <vscale x 4 x half> %tmp0)
	ret <vscale x 4 x half> %r			ret <vscale x 4 x half> %r
	}			}

	define <vscale x 4 x half> @test_copysign_v4f16_v4f64(<vscale x 4 x half> %a, <vscale x 4 x double> %b) #0 {			define <vscale x 4 x half> @test_copysign_v4f16_v4f64(<vscale x 4 x half> %a, <vscale x 4 x double> %b) #0 {
	; CHECK-LABEL: test_copysign_v4f16_v4f64:			; CHECK-LABEL: test_copysign_v4f16_v4f64:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: ptrue p0.d			; CHECK-NEXT: ptrue p0.d
	; CHECK-NEXT: and z0.h, z0.h, #0x7fff			; CHECK-NEXT: and z0.h, z0.h, #0x7fff
	; CHECK-NEXT: fcvt z2.h, p0/m, z2.d			; CHECK-NEXT: fcvt z2.h, p0/m, z2.d
	; CHECK-NEXT: fcvt z1.h, p0/m, z1.d			; CHECK-NEXT: fcvt z1.h, p0/m, z1.d
	; CHECK-NEXT: uzp1 z1.s, z1.s, z2.s			; CHECK-NEXT: uzp1 z1.s, z1.s, z2.s
	; CHECK-NEXT: and z1.h, z1.h, #0x8000			; CHECK-NEXT: and z1.h, z1.h, #0x8000
	; CHECK-NEXT: orr z0.d, z1.d, z0.d			; CHECK-NEXT: orr z0.d, z0.d, z1.d
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%tmp0 = fptrunc <vscale x 4 x double> %b to <vscale x 4 x half>			%tmp0 = fptrunc <vscale x 4 x double> %b to <vscale x 4 x half>
	%r = call <vscale x 4 x half> @llvm.copysign.v4f16(<vscale x 4 x half> %a, <vscale x 4 x half> %tmp0)			%r = call <vscale x 4 x half> @llvm.copysign.v4f16(<vscale x 4 x half> %a, <vscale x 4 x half> %tmp0)
	ret <vscale x 4 x half> %r			ret <vscale x 4 x half> %r
	}			}

	declare <vscale x 4 x half> @llvm.copysign.v4f16(<vscale x 4 x half> %a, <vscale x 4 x half> %b) #0			declare <vscale x 4 x half> @llvm.copysign.v4f16(<vscale x 4 x half> %a, <vscale x 4 x half> %b) #0

	;============ v8f16			;============ v8f16

	define <vscale x 8 x half> @test_copysign_v8f16_v8f16(<vscale x 8 x half> %a, <vscale x 8 x half> %b) #0 {			define <vscale x 8 x half> @test_copysign_v8f16_v8f16(<vscale x 8 x half> %a, <vscale x 8 x half> %b) #0 {
	; CHECK-LABEL: test_copysign_v8f16_v8f16:			; CHECK-LABEL: test_copysign_v8f16_v8f16:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: and z0.h, z0.h, #0x7fff
	; CHECK-NEXT: and z1.h, z1.h, #0x8000			; CHECK-NEXT: and z1.h, z1.h, #0x8000
	; CHECK-NEXT: orr z0.d, z1.d, z0.d			; CHECK-NEXT: and z0.h, z0.h, #0x7fff
				; CHECK-NEXT: orr z0.d, z0.d, z1.d
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call <vscale x 8 x half> @llvm.copysign.v8f16(<vscale x 8 x half> %a, <vscale x 8 x half> %b)			%r = call <vscale x 8 x half> @llvm.copysign.v8f16(<vscale x 8 x half> %a, <vscale x 8 x half> %b)
	ret <vscale x 8 x half> %r			ret <vscale x 8 x half> %r
	}			}

	define <vscale x 8 x half> @test_copysign_v8f16_v8f32(<vscale x 8 x half> %a, <vscale x 8 x float> %b) #0 {			define <vscale x 8 x half> @test_copysign_v8f16_v8f32(<vscale x 8 x half> %a, <vscale x 8 x float> %b) #0 {
	; CHECK-LABEL: test_copysign_v8f16_v8f32:			; CHECK-LABEL: test_copysign_v8f16_v8f32:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: ptrue p0.s			; CHECK-NEXT: ptrue p0.s
	; CHECK-NEXT: and z0.h, z0.h, #0x7fff			; CHECK-NEXT: and z0.h, z0.h, #0x7fff
	; CHECK-NEXT: fcvt z2.h, p0/m, z2.s			; CHECK-NEXT: fcvt z2.h, p0/m, z2.s
	; CHECK-NEXT: fcvt z1.h, p0/m, z1.s			; CHECK-NEXT: fcvt z1.h, p0/m, z1.s
	; CHECK-NEXT: uzp1 z1.h, z1.h, z2.h			; CHECK-NEXT: uzp1 z1.h, z1.h, z2.h
	; CHECK-NEXT: and z1.h, z1.h, #0x8000			; CHECK-NEXT: and z1.h, z1.h, #0x8000
	; CHECK-NEXT: orr z0.d, z1.d, z0.d			; CHECK-NEXT: orr z0.d, z0.d, z1.d
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%tmp0 = fptrunc <vscale x 8 x float> %b to <vscale x 8 x half>			%tmp0 = fptrunc <vscale x 8 x float> %b to <vscale x 8 x half>
	%r = call <vscale x 8 x half> @llvm.copysign.v8f16(<vscale x 8 x half> %a, <vscale x 8 x half> %tmp0)			%r = call <vscale x 8 x half> @llvm.copysign.v8f16(<vscale x 8 x half> %a, <vscale x 8 x half> %tmp0)
	ret <vscale x 8 x half> %r			ret <vscale x 8 x half> %r
	}			}

	declare <vscale x 8 x half> @llvm.copysign.v8f16(<vscale x 8 x half> %a, <vscale x 8 x half> %b) #0			declare <vscale x 8 x half> @llvm.copysign.v8f16(<vscale x 8 x half> %a, <vscale x 8 x half> %b) #0

	attributes #0 = { nounwind }			attributes #0 = { nounwind }

llvm/test/CodeGen/AArch64/sve2-fcopysign.ll

This file was copied from llvm/test/CodeGen/AArch64/sve-fcopysign.ll.

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc < %s -mtriple aarch64-eabi -mattr=+sve -o - \| FileCheck --check-prefixes=CHECK %s			; RUN: llc < %s -mtriple aarch64-eabi -mattr=+sve2 -o - \| FileCheck --check-prefixes=CHECK %s

	target datalayout = "e-m:o-i64:64-i128:128-n32:64-S128"			target datalayout = "e-m:o-i64:64-i128:128-n32:64-S128"

	;============ v2f32			;============ v2f32

	define <vscale x 2 x float> @test_copysign_v2f32_v2f32(<vscale x 2 x float> %a, <vscale x 2 x float> %b) #0 {			define <vscale x 2 x float> @test_copysign_v2f32_v2f32(<vscale x 2 x float> %a, <vscale x 2 x float> %b) #0 {
	; CHECK-LABEL: test_copysign_v2f32_v2f32:			; CHECK-LABEL: test_copysign_v2f32_v2f32:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: and z0.s, z0.s, #0x7fffffff			; CHECK-NEXT: mov w8, #2147483647
	; CHECK-NEXT: and z1.s, z1.s, #0x80000000			; CHECK-NEXT: mov z2.s, w8
	; CHECK-NEXT: orr z0.d, z1.d, z0.d			; CHECK-NEXT: bsl z0.d, z0.d, z1.d, z2.d
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call <vscale x 2 x float> @llvm.copysign.v2f32(<vscale x 2 x float> %a, <vscale x 2 x float> %b)			%r = call <vscale x 2 x float> @llvm.copysign.v2f32(<vscale x 2 x float> %a, <vscale x 2 x float> %b)
	ret <vscale x 2 x float> %r			ret <vscale x 2 x float> %r
	}			}

	define <vscale x 2 x float> @test_copysign_v2f32_v2f64(<vscale x 2 x float> %a, <vscale x 2 x double> %b) #0 {			define <vscale x 2 x float> @test_copysign_v2f32_v2f64(<vscale x 2 x float> %a, <vscale x 2 x double> %b) #0 {
	; CHECK-LABEL: test_copysign_v2f32_v2f64:			; CHECK-LABEL: test_copysign_v2f32_v2f64:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
				; CHECK-NEXT: mov w8, #2147483647
	; CHECK-NEXT: ptrue p0.d			; CHECK-NEXT: ptrue p0.d
	; CHECK-NEXT: and z0.s, z0.s, #0x7fffffff
	; CHECK-NEXT: fcvt z1.s, p0/m, z1.d			; CHECK-NEXT: fcvt z1.s, p0/m, z1.d
	; CHECK-NEXT: and z1.s, z1.s, #0x80000000			; CHECK-NEXT: mov z2.s, w8
	; CHECK-NEXT: orr z0.d, z1.d, z0.d			; CHECK-NEXT: bsl z0.d, z0.d, z1.d, z2.d
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%tmp0 = fptrunc <vscale x 2 x double> %b to <vscale x 2 x float>			%tmp0 = fptrunc <vscale x 2 x double> %b to <vscale x 2 x float>
	%r = call <vscale x 2 x float> @llvm.copysign.v2f32(<vscale x 2 x float> %a, <vscale x 2 x float> %tmp0)			%r = call <vscale x 2 x float> @llvm.copysign.v2f32(<vscale x 2 x float> %a, <vscale x 2 x float> %tmp0)
	ret <vscale x 2 x float> %r			ret <vscale x 2 x float> %r
	}			}

	declare <vscale x 2 x float> @llvm.copysign.v2f32(<vscale x 2 x float> %a, <vscale x 2 x float> %b) #0			declare <vscale x 2 x float> @llvm.copysign.v2f32(<vscale x 2 x float> %a, <vscale x 2 x float> %b) #0

	;============ v4f32			;============ v4f32

	define <vscale x 4 x float> @test_copysign_v4f32_v4f32(<vscale x 4 x float> %a, <vscale x 4 x float> %b) #0 {			define <vscale x 4 x float> @test_copysign_v4f32_v4f32(<vscale x 4 x float> %a, <vscale x 4 x float> %b) #0 {
	; CHECK-LABEL: test_copysign_v4f32_v4f32:			; CHECK-LABEL: test_copysign_v4f32_v4f32:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: and z0.s, z0.s, #0x7fffffff			; CHECK-NEXT: mov w8, #2147483647
	; CHECK-NEXT: and z1.s, z1.s, #0x80000000			; CHECK-NEXT: mov z2.s, w8
	; CHECK-NEXT: orr z0.d, z1.d, z0.d			; CHECK-NEXT: bsl z0.d, z0.d, z1.d, z2.d
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call <vscale x 4 x float> @llvm.copysign.v4f32(<vscale x 4 x float> %a, <vscale x 4 x float> %b)			%r = call <vscale x 4 x float> @llvm.copysign.v4f32(<vscale x 4 x float> %a, <vscale x 4 x float> %b)
	ret <vscale x 4 x float> %r			ret <vscale x 4 x float> %r
	}			}

	; SplitVecOp #1			; SplitVecOp #1
	define <vscale x 4 x float> @test_copysign_v4f32_v4f64(<vscale x 4 x float> %a, <vscale x 4 x double> %b) #0 {			define <vscale x 4 x float> @test_copysign_v4f32_v4f64(<vscale x 4 x float> %a, <vscale x 4 x double> %b) #0 {
	; CHECK-LABEL: test_copysign_v4f32_v4f64:			; CHECK-LABEL: test_copysign_v4f32_v4f64:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
				; CHECK-NEXT: mov w8, #2147483647
	; CHECK-NEXT: ptrue p0.d			; CHECK-NEXT: ptrue p0.d
	; CHECK-NEXT: and z0.s, z0.s, #0x7fffffff
	; CHECK-NEXT: fcvt z2.s, p0/m, z2.d			; CHECK-NEXT: fcvt z2.s, p0/m, z2.d
	; CHECK-NEXT: fcvt z1.s, p0/m, z1.d			; CHECK-NEXT: fcvt z1.s, p0/m, z1.d
	; CHECK-NEXT: uzp1 z1.s, z1.s, z2.s			; CHECK-NEXT: uzp1 z1.s, z1.s, z2.s
	; CHECK-NEXT: and z1.s, z1.s, #0x80000000			; CHECK-NEXT: mov z2.s, w8
	; CHECK-NEXT: orr z0.d, z1.d, z0.d			; CHECK-NEXT: bsl z0.d, z0.d, z1.d, z2.d
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%tmp0 = fptrunc <vscale x 4 x double> %b to <vscale x 4 x float>			%tmp0 = fptrunc <vscale x 4 x double> %b to <vscale x 4 x float>
	%r = call <vscale x 4 x float> @llvm.copysign.v4f32(<vscale x 4 x float> %a, <vscale x 4 x float> %tmp0)			%r = call <vscale x 4 x float> @llvm.copysign.v4f32(<vscale x 4 x float> %a, <vscale x 4 x float> %tmp0)
	ret <vscale x 4 x float> %r			ret <vscale x 4 x float> %r
	}			}

	declare <vscale x 4 x float> @llvm.copysign.v4f32(<vscale x 4 x float> %a, <vscale x 4 x float> %b) #0			declare <vscale x 4 x float> @llvm.copysign.v4f32(<vscale x 4 x float> %a, <vscale x 4 x float> %b) #0

	;============ v2f64			;============ v2f64

	define <vscale x 2 x double> @test_copysign_v2f64_v232(<vscale x 2 x double> %a, <vscale x 2 x float> %b) #0 {			define <vscale x 2 x double> @test_copysign_v2f64_v232(<vscale x 2 x double> %a, <vscale x 2 x float> %b) #0 {
	; CHECK-LABEL: test_copysign_v2f64_v232:			; CHECK-LABEL: test_copysign_v2f64_v232:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: ptrue p0.d			; CHECK-NEXT: ptrue p0.d
	; CHECK-NEXT: and z0.d, z0.d, #0x7fffffffffffffff			; CHECK-NEXT: mov z2.d, #0x7fffffffffffffff
	; CHECK-NEXT: fcvt z1.d, p0/m, z1.s			; CHECK-NEXT: fcvt z1.d, p0/m, z1.s
	; CHECK-NEXT: and z1.d, z1.d, #0x8000000000000000			; CHECK-NEXT: bsl z0.d, z0.d, z1.d, z2.d
	; CHECK-NEXT: orr z0.d, z1.d, z0.d
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%tmp0 = fpext <vscale x 2 x float> %b to <vscale x 2 x double>			%tmp0 = fpext <vscale x 2 x float> %b to <vscale x 2 x double>
	%r = call <vscale x 2 x double> @llvm.copysign.v2f64(<vscale x 2 x double> %a, <vscale x 2 x double> %tmp0)			%r = call <vscale x 2 x double> @llvm.copysign.v2f64(<vscale x 2 x double> %a, <vscale x 2 x double> %tmp0)
	ret <vscale x 2 x double> %r			ret <vscale x 2 x double> %r
	}			}

	define <vscale x 2 x double> @test_copysign_v2f64_v2f64(<vscale x 2 x double> %a, <vscale x 2 x double> %b) #0 {			define <vscale x 2 x double> @test_copysign_v2f64_v2f64(<vscale x 2 x double> %a, <vscale x 2 x double> %b) #0 {
	; CHECK-LABEL: test_copysign_v2f64_v2f64:			; CHECK-LABEL: test_copysign_v2f64_v2f64:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: and z0.d, z0.d, #0x7fffffffffffffff			; CHECK-NEXT: mov z2.d, #0x7fffffffffffffff
	; CHECK-NEXT: and z1.d, z1.d, #0x8000000000000000			; CHECK-NEXT: bsl z0.d, z0.d, z1.d, z2.d
	; CHECK-NEXT: orr z0.d, z1.d, z0.d
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call <vscale x 2 x double> @llvm.copysign.v2f64(<vscale x 2 x double> %a, <vscale x 2 x double> %b)			%r = call <vscale x 2 x double> @llvm.copysign.v2f64(<vscale x 2 x double> %a, <vscale x 2 x double> %b)
	ret <vscale x 2 x double> %r			ret <vscale x 2 x double> %r
	}			}

	declare <vscale x 2 x double> @llvm.copysign.v2f64(<vscale x 2 x double> %a, <vscale x 2 x double> %b) #0			declare <vscale x 2 x double> @llvm.copysign.v2f64(<vscale x 2 x double> %a, <vscale x 2 x double> %b) #0

	;============ v4f64			;============ v4f64

	; SplitVecRes mismatched			; SplitVecRes mismatched
	define <vscale x 4 x double> @test_copysign_v4f64_v4f32(<vscale x 4 x double> %a, <vscale x 4 x float> %b) #0 {			define <vscale x 4 x double> @test_copysign_v4f64_v4f32(<vscale x 4 x double> %a, <vscale x 4 x float> %b) #0 {
	; CHECK-LABEL: test_copysign_v4f64_v4f32:			; CHECK-LABEL: test_copysign_v4f64_v4f32:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: ptrue p0.d			; CHECK-NEXT: ptrue p0.d
	; CHECK-NEXT: uunpkhi z3.d, z2.s			; CHECK-NEXT: uunpkhi z3.d, z2.s
	; CHECK-NEXT: uunpklo z2.d, z2.s			; CHECK-NEXT: uunpklo z2.d, z2.s
	; CHECK-NEXT: fcvt z3.d, p0/m, z3.s			; CHECK-NEXT: fcvt z3.d, p0/m, z3.s
	; CHECK-NEXT: fcvt z2.d, p0/m, z2.s			; CHECK-NEXT: fcvt z2.d, p0/m, z2.s
	; CHECK-NEXT: and z0.d, z0.d, #0x7fffffffffffffff			; CHECK-NEXT: mov z4.d, #0x7fffffffffffffff
	; CHECK-NEXT: and z2.d, z2.d, #0x8000000000000000			; CHECK-NEXT: bsl z0.d, z0.d, z2.d, z4.d
	; CHECK-NEXT: and z3.d, z3.d, #0x8000000000000000			; CHECK-NEXT: bsl z1.d, z1.d, z3.d, z4.d
	; CHECK-NEXT: and z1.d, z1.d, #0x7fffffffffffffff
	; CHECK-NEXT: orr z0.d, z2.d, z0.d
	; CHECK-NEXT: orr z1.d, z3.d, z1.d
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%tmp0 = fpext <vscale x 4 x float> %b to <vscale x 4 x double>			%tmp0 = fpext <vscale x 4 x float> %b to <vscale x 4 x double>
	%r = call <vscale x 4 x double> @llvm.copysign.v4f64(<vscale x 4 x double> %a, <vscale x 4 x double> %tmp0)			%r = call <vscale x 4 x double> @llvm.copysign.v4f64(<vscale x 4 x double> %a, <vscale x 4 x double> %tmp0)
	ret <vscale x 4 x double> %r			ret <vscale x 4 x double> %r
	}			}

	; SplitVecRes same			; SplitVecRes same
	define <vscale x 4 x double> @test_copysign_v4f64_v4f64(<vscale x 4 x double> %a, <vscale x 4 x double> %b) #0 {			define <vscale x 4 x double> @test_copysign_v4f64_v4f64(<vscale x 4 x double> %a, <vscale x 4 x double> %b) #0 {
	; CHECK-LABEL: test_copysign_v4f64_v4f64:			; CHECK-LABEL: test_copysign_v4f64_v4f64:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: and z2.d, z2.d, #0x8000000000000000			; CHECK-NEXT: mov z4.d, #0x7fffffffffffffff
	; CHECK-NEXT: and z0.d, z0.d, #0x7fffffffffffffff			; CHECK-NEXT: bsl z0.d, z0.d, z2.d, z4.d
	; CHECK-NEXT: and z1.d, z1.d, #0x7fffffffffffffff			; CHECK-NEXT: bsl z1.d, z1.d, z3.d, z4.d
	; CHECK-NEXT: and z3.d, z3.d, #0x8000000000000000
	; CHECK-NEXT: orr z0.d, z2.d, z0.d
	; CHECK-NEXT: orr z1.d, z3.d, z1.d
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call <vscale x 4 x double> @llvm.copysign.v4f64(<vscale x 4 x double> %a, <vscale x 4 x double> %b)			%r = call <vscale x 4 x double> @llvm.copysign.v4f64(<vscale x 4 x double> %a, <vscale x 4 x double> %b)
	ret <vscale x 4 x double> %r			ret <vscale x 4 x double> %r
	}			}

	declare <vscale x 4 x double> @llvm.copysign.v4f64(<vscale x 4 x double> %a, <vscale x 4 x double> %b) #0			declare <vscale x 4 x double> @llvm.copysign.v4f64(<vscale x 4 x double> %a, <vscale x 4 x double> %b) #0

	;============ v4f16			;============ v4f16

	define <vscale x 4 x half> @test_copysign_v4f16_v4f16(<vscale x 4 x half> %a, <vscale x 4 x half> %b) #0 {			define <vscale x 4 x half> @test_copysign_v4f16_v4f16(<vscale x 4 x half> %a, <vscale x 4 x half> %b) #0 {
	; CHECK-LABEL: test_copysign_v4f16_v4f16:			; CHECK-LABEL: test_copysign_v4f16_v4f16:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: and z0.h, z0.h, #0x7fff			; CHECK-NEXT: mov w8, #32767
	; CHECK-NEXT: and z1.h, z1.h, #0x8000			; CHECK-NEXT: mov z2.h, w8
	; CHECK-NEXT: orr z0.d, z1.d, z0.d			; CHECK-NEXT: bsl z0.d, z0.d, z1.d, z2.d
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call <vscale x 4 x half> @llvm.copysign.v4f16(<vscale x 4 x half> %a, <vscale x 4 x half> %b)			%r = call <vscale x 4 x half> @llvm.copysign.v4f16(<vscale x 4 x half> %a, <vscale x 4 x half> %b)
	ret <vscale x 4 x half> %r			ret <vscale x 4 x half> %r
	}			}

	define <vscale x 4 x half> @test_copysign_v4f16_v4f32(<vscale x 4 x half> %a, <vscale x 4 x float> %b) #0 {			define <vscale x 4 x half> @test_copysign_v4f16_v4f32(<vscale x 4 x half> %a, <vscale x 4 x float> %b) #0 {
	; CHECK-LABEL: test_copysign_v4f16_v4f32:			; CHECK-LABEL: test_copysign_v4f16_v4f32:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
				; CHECK-NEXT: mov w8, #32767
	; CHECK-NEXT: ptrue p0.s			; CHECK-NEXT: ptrue p0.s
	; CHECK-NEXT: and z0.h, z0.h, #0x7fff
	; CHECK-NEXT: fcvt z1.h, p0/m, z1.s			; CHECK-NEXT: fcvt z1.h, p0/m, z1.s
	; CHECK-NEXT: and z1.h, z1.h, #0x8000			; CHECK-NEXT: mov z2.h, w8
	; CHECK-NEXT: orr z0.d, z1.d, z0.d			; CHECK-NEXT: bsl z0.d, z0.d, z1.d, z2.d
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%tmp0 = fptrunc <vscale x 4 x float> %b to <vscale x 4 x half>			%tmp0 = fptrunc <vscale x 4 x float> %b to <vscale x 4 x half>
	%r = call <vscale x 4 x half> @llvm.copysign.v4f16(<vscale x 4 x half> %a, <vscale x 4 x half> %tmp0)			%r = call <vscale x 4 x half> @llvm.copysign.v4f16(<vscale x 4 x half> %a, <vscale x 4 x half> %tmp0)
	ret <vscale x 4 x half> %r			ret <vscale x 4 x half> %r
	}			}

	define <vscale x 4 x half> @test_copysign_v4f16_v4f64(<vscale x 4 x half> %a, <vscale x 4 x double> %b) #0 {			define <vscale x 4 x half> @test_copysign_v4f16_v4f64(<vscale x 4 x half> %a, <vscale x 4 x double> %b) #0 {
	; CHECK-LABEL: test_copysign_v4f16_v4f64:			; CHECK-LABEL: test_copysign_v4f16_v4f64:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
				; CHECK-NEXT: mov w8, #32767
	; CHECK-NEXT: ptrue p0.d			; CHECK-NEXT: ptrue p0.d
	; CHECK-NEXT: and z0.h, z0.h, #0x7fff
	; CHECK-NEXT: fcvt z2.h, p0/m, z2.d			; CHECK-NEXT: fcvt z2.h, p0/m, z2.d
	; CHECK-NEXT: fcvt z1.h, p0/m, z1.d			; CHECK-NEXT: fcvt z1.h, p0/m, z1.d
	; CHECK-NEXT: uzp1 z1.s, z1.s, z2.s			; CHECK-NEXT: uzp1 z1.s, z1.s, z2.s
	; CHECK-NEXT: and z1.h, z1.h, #0x8000			; CHECK-NEXT: mov z2.h, w8
	; CHECK-NEXT: orr z0.d, z1.d, z0.d			; CHECK-NEXT: bsl z0.d, z0.d, z1.d, z2.d
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%tmp0 = fptrunc <vscale x 4 x double> %b to <vscale x 4 x half>			%tmp0 = fptrunc <vscale x 4 x double> %b to <vscale x 4 x half>
	%r = call <vscale x 4 x half> @llvm.copysign.v4f16(<vscale x 4 x half> %a, <vscale x 4 x half> %tmp0)			%r = call <vscale x 4 x half> @llvm.copysign.v4f16(<vscale x 4 x half> %a, <vscale x 4 x half> %tmp0)
	ret <vscale x 4 x half> %r			ret <vscale x 4 x half> %r
	}			}

	declare <vscale x 4 x half> @llvm.copysign.v4f16(<vscale x 4 x half> %a, <vscale x 4 x half> %b) #0			declare <vscale x 4 x half> @llvm.copysign.v4f16(<vscale x 4 x half> %a, <vscale x 4 x half> %b) #0

	;============ v8f16			;============ v8f16

	define <vscale x 8 x half> @test_copysign_v8f16_v8f16(<vscale x 8 x half> %a, <vscale x 8 x half> %b) #0 {			define <vscale x 8 x half> @test_copysign_v8f16_v8f16(<vscale x 8 x half> %a, <vscale x 8 x half> %b) #0 {
	; CHECK-LABEL: test_copysign_v8f16_v8f16:			; CHECK-LABEL: test_copysign_v8f16_v8f16:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: and z0.h, z0.h, #0x7fff			; CHECK-NEXT: mov w8, #32767
	; CHECK-NEXT: and z1.h, z1.h, #0x8000			; CHECK-NEXT: mov z2.h, w8
	; CHECK-NEXT: orr z0.d, z1.d, z0.d			; CHECK-NEXT: bsl z0.d, z0.d, z1.d, z2.d
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call <vscale x 8 x half> @llvm.copysign.v8f16(<vscale x 8 x half> %a, <vscale x 8 x half> %b)			%r = call <vscale x 8 x half> @llvm.copysign.v8f16(<vscale x 8 x half> %a, <vscale x 8 x half> %b)
	ret <vscale x 8 x half> %r			ret <vscale x 8 x half> %r
	}			}

	define <vscale x 8 x half> @test_copysign_v8f16_v8f32(<vscale x 8 x half> %a, <vscale x 8 x float> %b) #0 {			define <vscale x 8 x half> @test_copysign_v8f16_v8f32(<vscale x 8 x half> %a, <vscale x 8 x float> %b) #0 {
	; CHECK-LABEL: test_copysign_v8f16_v8f32:			; CHECK-LABEL: test_copysign_v8f16_v8f32:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
				; CHECK-NEXT: mov w8, #32767
	; CHECK-NEXT: ptrue p0.s			; CHECK-NEXT: ptrue p0.s
	; CHECK-NEXT: and z0.h, z0.h, #0x7fff
	; CHECK-NEXT: fcvt z2.h, p0/m, z2.s			; CHECK-NEXT: fcvt z2.h, p0/m, z2.s
	; CHECK-NEXT: fcvt z1.h, p0/m, z1.s			; CHECK-NEXT: fcvt z1.h, p0/m, z1.s
	; CHECK-NEXT: uzp1 z1.h, z1.h, z2.h			; CHECK-NEXT: uzp1 z1.h, z1.h, z2.h
	; CHECK-NEXT: and z1.h, z1.h, #0x8000			; CHECK-NEXT: mov z2.h, w8
	; CHECK-NEXT: orr z0.d, z1.d, z0.d			; CHECK-NEXT: bsl z0.d, z0.d, z1.d, z2.d
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%tmp0 = fptrunc <vscale x 8 x float> %b to <vscale x 8 x half>			%tmp0 = fptrunc <vscale x 8 x float> %b to <vscale x 8 x half>
	%r = call <vscale x 8 x half> @llvm.copysign.v8f16(<vscale x 8 x half> %a, <vscale x 8 x half> %tmp0)			%r = call <vscale x 8 x half> @llvm.copysign.v8f16(<vscale x 8 x half> %a, <vscale x 8 x half> %tmp0)
	ret <vscale x 8 x half> %r			ret <vscale x 8 x half> %r
	}			}

	declare <vscale x 8 x half> @llvm.copysign.v8f16(<vscale x 8 x half> %a, <vscale x 8 x half> %b) #0			declare <vscale x 8 x half> @llvm.copysign.v8f16(<vscale x 8 x half> %a, <vscale x 8 x half> %b) #0

	attributes #0 = { nounwind }			attributes #0 = { nounwind }

llvm/test/CodeGen/AArch64/vector-fcopysign.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc < %s -mtriple aarch64-apple-darwin \| FileCheck --check-prefixes=CHECK,NOFP16 %s			; RUN: llc < %s -mtriple aarch64-apple-darwin \| FileCheck --check-prefixes=CHECK,NOFP16 %s
	; RUN: llc < %s -mtriple aarch64-apple-darwin -mattr=+v8.2a,+fullfp16 \| FileCheck --check-prefixes=CHECK,FP16 %s			; RUN: llc < %s -mtriple aarch64-apple-darwin -mattr=+v8.2a,+fullfp16 \| FileCheck --check-prefixes=CHECK,FP16 %s

	target datalayout = "e-m:o-i64:64-i128:128-n32:64-S128"			target datalayout = "e-m:o-i64:64-i128:128-n32:64-S128"

	;============ v1f32			;============ v1f32

	; WidenVecRes same			; WidenVecRes same
	define <1 x float> @test_copysign_v1f32_v1f32(<1 x float> %a, <1 x float> %b) #0 {			define <1 x float> @test_copysign_v1f32_v1f32(<1 x float> %a, <1 x float> %b) #0 {
	; CHECK-LABEL: test_copysign_v1f32_v1f32:			; CHECK-LABEL: test_copysign_v1f32_v1f32:
	; CHECK: ; %bb.0:			; CHECK: ; %bb.0:
	; CHECK-NEXT: movi.2s v2, #128, lsl #24			; CHECK-NEXT: mvni.2s v2, #128, lsl #24
	; CHECK-NEXT: bit.8b v0, v1, v2			; CHECK-NEXT: bif.8b v0, v1, v2
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call <1 x float> @llvm.copysign.v1f32(<1 x float> %a, <1 x float> %b)			%r = call <1 x float> @llvm.copysign.v1f32(<1 x float> %a, <1 x float> %b)
	ret <1 x float> %r			ret <1 x float> %r
	}			}

	; WidenVecRes mismatched			; WidenVecRes mismatched
	define <1 x float> @test_copysign_v1f32_v1f64(<1 x float> %a, <1 x double> %b) #0 {			define <1 x float> @test_copysign_v1f32_v1f64(<1 x float> %a, <1 x double> %b) #0 {
	; CHECK-LABEL: test_copysign_v1f32_v1f64:			; CHECK-LABEL: test_copysign_v1f32_v1f64:
	; CHECK: ; %bb.0:			; CHECK: ; %bb.0:
	; CHECK-NEXT: ; kill: def $d1 killed $d1 def $q1			; CHECK-NEXT: ; kill: def $d1 killed $d1 def $q1
	; CHECK-NEXT: movi.2s v2, #128, lsl #24			; CHECK-NEXT: mvni.2s v2, #128, lsl #24
	; CHECK-NEXT: fcvtn v1.2s, v1.2d			; CHECK-NEXT: fcvtn v1.2s, v1.2d
	; CHECK-NEXT: bit.8b v0, v1, v2			; CHECK-NEXT: bif.8b v0, v1, v2
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%tmp0 = fptrunc <1 x double> %b to <1 x float>			%tmp0 = fptrunc <1 x double> %b to <1 x float>
	%r = call <1 x float> @llvm.copysign.v1f32(<1 x float> %a, <1 x float> %tmp0)			%r = call <1 x float> @llvm.copysign.v1f32(<1 x float> %a, <1 x float> %tmp0)
	ret <1 x float> %r			ret <1 x float> %r
	}			}

	declare <1 x float> @llvm.copysign.v1f32(<1 x float> %a, <1 x float> %b) #0			declare <1 x float> @llvm.copysign.v1f32(<1 x float> %a, <1 x float> %b) #0

	;============ v1f64			;============ v1f64

	; WidenVecOp #1			; WidenVecOp #1
	define <1 x double> @test_copysign_v1f64_v1f32(<1 x double> %a, <1 x float> %b) #0 {			define <1 x double> @test_copysign_v1f64_v1f32(<1 x double> %a, <1 x float> %b) #0 {
	; CHECK-LABEL: test_copysign_v1f64_v1f32:			; CHECK-LABEL: test_copysign_v1f64_v1f32:
	; CHECK: ; %bb.0:			; CHECK: ; %bb.0:
	; CHECK-NEXT: movi.2d v2, #0000000000000000			; CHECK-NEXT: movi.2d v2, #0xffffffffffffffff
	; CHECK-NEXT: ; kill: def $d0 killed $d0 def $q0			; CHECK-NEXT: ; kill: def $d0 killed $d0 def $q0
	; CHECK-NEXT: fcvtl v1.2d, v1.2s			; CHECK-NEXT: fcvtl v1.2d, v1.2s
	; CHECK-NEXT: fneg.2d v2, v2			; CHECK-NEXT: fneg.2d v2, v2
	; CHECK-NEXT: bit.16b v0, v1, v2			; CHECK-NEXT: bif.16b v0, v1, v2
	; CHECK-NEXT: ; kill: def $d0 killed $d0 killed $q0			; CHECK-NEXT: ; kill: def $d0 killed $d0 killed $q0
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%tmp0 = fpext <1 x float> %b to <1 x double>			%tmp0 = fpext <1 x float> %b to <1 x double>
	%r = call <1 x double> @llvm.copysign.v1f64(<1 x double> %a, <1 x double> %tmp0)			%r = call <1 x double> @llvm.copysign.v1f64(<1 x double> %a, <1 x double> %tmp0)
	ret <1 x double> %r			ret <1 x double> %r
	}			}

	define <1 x double> @test_copysign_v1f64_v1f64(<1 x double> %a, <1 x double> %b) #0 {			define <1 x double> @test_copysign_v1f64_v1f64(<1 x double> %a, <1 x double> %b) #0 {
	; CHECK-LABEL: test_copysign_v1f64_v1f64:			; CHECK-LABEL: test_copysign_v1f64_v1f64:
	; CHECK: ; %bb.0:			; CHECK: ; %bb.0:
	; CHECK-NEXT: movi.2d v2, #0000000000000000			; CHECK-NEXT: movi.2d v2, #0xffffffffffffffff
	; CHECK-NEXT: ; kill: def $d0 killed $d0 def $q0			; CHECK-NEXT: ; kill: def $d0 killed $d0 def $q0
	; CHECK-NEXT: ; kill: def $d1 killed $d1 def $q1			; CHECK-NEXT: ; kill: def $d1 killed $d1 def $q1
	; CHECK-NEXT: fneg.2d v2, v2			; CHECK-NEXT: fneg.2d v2, v2
	; CHECK-NEXT: bit.16b v0, v1, v2			; CHECK-NEXT: bif.16b v0, v1, v2
	; CHECK-NEXT: ; kill: def $d0 killed $d0 killed $q0			; CHECK-NEXT: ; kill: def $d0 killed $d0 killed $q0
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call <1 x double> @llvm.copysign.v1f64(<1 x double> %a, <1 x double> %b)			%r = call <1 x double> @llvm.copysign.v1f64(<1 x double> %a, <1 x double> %b)
	ret <1 x double> %r			ret <1 x double> %r
	}			}

	declare <1 x double> @llvm.copysign.v1f64(<1 x double> %a, <1 x double> %b) #0			declare <1 x double> @llvm.copysign.v1f64(<1 x double> %a, <1 x double> %b) #0

	;============ v2f32			;============ v2f32

	define <2 x float> @test_copysign_v2f32_v2f32(<2 x float> %a, <2 x float> %b) #0 {			define <2 x float> @test_copysign_v2f32_v2f32(<2 x float> %a, <2 x float> %b) #0 {
	; CHECK-LABEL: test_copysign_v2f32_v2f32:			; CHECK-LABEL: test_copysign_v2f32_v2f32:
	; CHECK: ; %bb.0:			; CHECK: ; %bb.0:
	; CHECK-NEXT: movi.2s v2, #128, lsl #24			; CHECK-NEXT: mvni.2s v2, #128, lsl #24
	; CHECK-NEXT: bit.8b v0, v1, v2			; CHECK-NEXT: bif.8b v0, v1, v2
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call <2 x float> @llvm.copysign.v2f32(<2 x float> %a, <2 x float> %b)			%r = call <2 x float> @llvm.copysign.v2f32(<2 x float> %a, <2 x float> %b)
	ret <2 x float> %r			ret <2 x float> %r
	}			}

	define <2 x float> @test_copysign_v2f32_v2f64(<2 x float> %a, <2 x double> %b) #0 {			define <2 x float> @test_copysign_v2f32_v2f64(<2 x float> %a, <2 x double> %b) #0 {
	; CHECK-LABEL: test_copysign_v2f32_v2f64:			; CHECK-LABEL: test_copysign_v2f32_v2f64:
	; CHECK: ; %bb.0:			; CHECK: ; %bb.0:
	; CHECK-NEXT: movi.2s v2, #128, lsl #24			; CHECK-NEXT: mvni.2s v2, #128, lsl #24
	; CHECK-NEXT: fcvtn v1.2s, v1.2d			; CHECK-NEXT: fcvtn v1.2s, v1.2d
	; CHECK-NEXT: bit.8b v0, v1, v2			; CHECK-NEXT: bif.8b v0, v1, v2
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%tmp0 = fptrunc <2 x double> %b to <2 x float>			%tmp0 = fptrunc <2 x double> %b to <2 x float>
	%r = call <2 x float> @llvm.copysign.v2f32(<2 x float> %a, <2 x float> %tmp0)			%r = call <2 x float> @llvm.copysign.v2f32(<2 x float> %a, <2 x float> %tmp0)
	ret <2 x float> %r			ret <2 x float> %r
	}			}

	declare <2 x float> @llvm.copysign.v2f32(<2 x float> %a, <2 x float> %b) #0			declare <2 x float> @llvm.copysign.v2f32(<2 x float> %a, <2 x float> %b) #0

	;============ v4f32			;============ v4f32

	define <4 x float> @test_copysign_v4f32_v4f32(<4 x float> %a, <4 x float> %b) #0 {			define <4 x float> @test_copysign_v4f32_v4f32(<4 x float> %a, <4 x float> %b) #0 {
	; CHECK-LABEL: test_copysign_v4f32_v4f32:			; CHECK-LABEL: test_copysign_v4f32_v4f32:
	; CHECK: ; %bb.0:			; CHECK: ; %bb.0:
	; CHECK-NEXT: movi.4s v2, #128, lsl #24			; CHECK-NEXT: mvni.4s v2, #128, lsl #24
	; CHECK-NEXT: bit.16b v0, v1, v2			; CHECK-NEXT: bif.16b v0, v1, v2
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call <4 x float> @llvm.copysign.v4f32(<4 x float> %a, <4 x float> %b)			%r = call <4 x float> @llvm.copysign.v4f32(<4 x float> %a, <4 x float> %b)
	ret <4 x float> %r			ret <4 x float> %r
	}			}

	; SplitVecOp #1			; SplitVecOp #1
	define <4 x float> @test_copysign_v4f32_v4f64(<4 x float> %a, <4 x double> %b) #0 {			define <4 x float> @test_copysign_v4f32_v4f64(<4 x float> %a, <4 x double> %b) #0 {
	; CHECK-LABEL: test_copysign_v4f32_v4f64:			; CHECK-LABEL: test_copysign_v4f32_v4f64:
	; CHECK: ; %bb.0:			; CHECK: ; %bb.0:
	; CHECK-NEXT: fcvtn v1.2s, v1.2d			; CHECK-NEXT: fcvtn v1.2s, v1.2d
	; CHECK-NEXT: movi.4s v3, #128, lsl #24			; CHECK-NEXT: mvni.4s v3, #128, lsl #24
	; CHECK-NEXT: fcvtn2 v1.4s, v2.2d			; CHECK-NEXT: fcvtn2 v1.4s, v2.2d
	; CHECK-NEXT: bit.16b v0, v1, v3			; CHECK-NEXT: bif.16b v0, v1, v3
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%tmp0 = fptrunc <4 x double> %b to <4 x float>			%tmp0 = fptrunc <4 x double> %b to <4 x float>
	%r = call <4 x float> @llvm.copysign.v4f32(<4 x float> %a, <4 x float> %tmp0)			%r = call <4 x float> @llvm.copysign.v4f32(<4 x float> %a, <4 x float> %tmp0)
	ret <4 x float> %r			ret <4 x float> %r
	}			}

	declare <4 x float> @llvm.copysign.v4f32(<4 x float> %a, <4 x float> %b) #0			declare <4 x float> @llvm.copysign.v4f32(<4 x float> %a, <4 x float> %b) #0

	;============ v2f64			;============ v2f64

	define <2 x double> @test_copysign_v2f64_v232(<2 x double> %a, <2 x float> %b) #0 {			define <2 x double> @test_copysign_v2f64_v232(<2 x double> %a, <2 x float> %b) #0 {
	; CHECK-LABEL: test_copysign_v2f64_v232:			; CHECK-LABEL: test_copysign_v2f64_v232:
	; CHECK: ; %bb.0:			; CHECK: ; %bb.0:
	; CHECK-NEXT: movi.2d v2, #0000000000000000			; CHECK-NEXT: movi.2d v2, #0xffffffffffffffff
	; CHECK-NEXT: fcvtl v1.2d, v1.2s			; CHECK-NEXT: fcvtl v1.2d, v1.2s
	; CHECK-NEXT: fneg.2d v2, v2			; CHECK-NEXT: fneg.2d v2, v2
	; CHECK-NEXT: bit.16b v0, v1, v2			; CHECK-NEXT: bif.16b v0, v1, v2
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%tmp0 = fpext <2 x float> %b to <2 x double>			%tmp0 = fpext <2 x float> %b to <2 x double>
	%r = call <2 x double> @llvm.copysign.v2f64(<2 x double> %a, <2 x double> %tmp0)			%r = call <2 x double> @llvm.copysign.v2f64(<2 x double> %a, <2 x double> %tmp0)
	ret <2 x double> %r			ret <2 x double> %r
	}			}

	define <2 x double> @test_copysign_v2f64_v2f64(<2 x double> %a, <2 x double> %b) #0 {			define <2 x double> @test_copysign_v2f64_v2f64(<2 x double> %a, <2 x double> %b) #0 {
	; CHECK-LABEL: test_copysign_v2f64_v2f64:			; CHECK-LABEL: test_copysign_v2f64_v2f64:
	; CHECK: ; %bb.0:			; CHECK: ; %bb.0:
	; CHECK-NEXT: movi.2d v2, #0000000000000000			; CHECK-NEXT: movi.2d v2, #0xffffffffffffffff
	; CHECK-NEXT: fneg.2d v2, v2			; CHECK-NEXT: fneg.2d v2, v2
	; CHECK-NEXT: bit.16b v0, v1, v2			; CHECK-NEXT: bif.16b v0, v1, v2
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call <2 x double> @llvm.copysign.v2f64(<2 x double> %a, <2 x double> %b)			%r = call <2 x double> @llvm.copysign.v2f64(<2 x double> %a, <2 x double> %b)
	ret <2 x double> %r			ret <2 x double> %r
	}			}

	declare <2 x double> @llvm.copysign.v2f64(<2 x double> %a, <2 x double> %b) #0			declare <2 x double> @llvm.copysign.v2f64(<2 x double> %a, <2 x double> %b) #0

	;============ v4f64			;============ v4f64

	; SplitVecRes mismatched			; SplitVecRes mismatched
	define <4 x double> @test_copysign_v4f64_v4f32(<4 x double> %a, <4 x float> %b) #0 {			define <4 x double> @test_copysign_v4f64_v4f32(<4 x double> %a, <4 x float> %b) #0 {
	; CHECK-LABEL: test_copysign_v4f64_v4f32:			; CHECK-LABEL: test_copysign_v4f64_v4f32:
	; CHECK: ; %bb.0:			; CHECK: ; %bb.0:
	; CHECK-NEXT: movi.2d v3, #0000000000000000			; CHECK-NEXT: movi.2d v3, #0xffffffffffffffff
	; CHECK-NEXT: fcvtl2 v4.2d, v2.4s			; CHECK-NEXT: fcvtl2 v4.2d, v2.4s
	; CHECK-NEXT: fcvtl v2.2d, v2.2s			; CHECK-NEXT: fcvtl v2.2d, v2.2s
	; CHECK-NEXT: fneg.2d v3, v3			; CHECK-NEXT: fneg.2d v3, v3
	; CHECK-NEXT: bit.16b v1, v4, v3			; CHECK-NEXT: bif.16b v1, v4, v3
	; CHECK-NEXT: bit.16b v0, v2, v3			; CHECK-NEXT: bif.16b v0, v2, v3
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%tmp0 = fpext <4 x float> %b to <4 x double>			%tmp0 = fpext <4 x float> %b to <4 x double>
	%r = call <4 x double> @llvm.copysign.v4f64(<4 x double> %a, <4 x double> %tmp0)			%r = call <4 x double> @llvm.copysign.v4f64(<4 x double> %a, <4 x double> %tmp0)
	ret <4 x double> %r			ret <4 x double> %r
	}			}

	; SplitVecRes same			; SplitVecRes same
	define <4 x double> @test_copysign_v4f64_v4f64(<4 x double> %a, <4 x double> %b) #0 {			define <4 x double> @test_copysign_v4f64_v4f64(<4 x double> %a, <4 x double> %b) #0 {
	; CHECK-LABEL: test_copysign_v4f64_v4f64:			; CHECK-LABEL: test_copysign_v4f64_v4f64:
	; CHECK: ; %bb.0:			; CHECK: ; %bb.0:
	; CHECK-NEXT: movi.2d v4, #0000000000000000			; CHECK-NEXT: movi.2d v4, #0xffffffffffffffff
	; CHECK-NEXT: fneg.2d v4, v4			; CHECK-NEXT: fneg.2d v4, v4
	; CHECK-NEXT: bit.16b v0, v2, v4			; CHECK-NEXT: bif.16b v0, v2, v4
	; CHECK-NEXT: bit.16b v1, v3, v4			; CHECK-NEXT: bif.16b v1, v3, v4
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%r = call <4 x double> @llvm.copysign.v4f64(<4 x double> %a, <4 x double> %b)			%r = call <4 x double> @llvm.copysign.v4f64(<4 x double> %a, <4 x double> %b)
	ret <4 x double> %r			ret <4 x double> %r
	}			}

	declare <4 x double> @llvm.copysign.v4f64(<4 x double> %a, <4 x double> %b) #0			declare <4 x double> @llvm.copysign.v4f64(<4 x double> %a, <4 x double> %b) #0

	;============ v4f16			;============ v4f16

	define <4 x half> @test_copysign_v4f16_v4f16(<4 x half> %a, <4 x half> %b) #0 {			define <4 x half> @test_copysign_v4f16_v4f16(<4 x half> %a, <4 x half> %b) #0 {
	; NOFP16-LABEL: test_copysign_v4f16_v4f16:			; NOFP16-LABEL: test_copysign_v4f16_v4f16:
	; NOFP16: ; %bb.0:			; NOFP16: ; %bb.0:
	; NOFP16-NEXT: ; kill: def $d1 killed $d1 def $q1			; NOFP16-NEXT: ; kill: def $d1 killed $d1 def $q1
	; NOFP16-NEXT: ; kill: def $d0 killed $d0 def $q0			; NOFP16-NEXT: ; kill: def $d0 killed $d0 def $q0
	; NOFP16-NEXT: mov h3, v1[1]			; NOFP16-NEXT: mov h3, v1[1]
	; NOFP16-NEXT: mov h4, v0[1]			; NOFP16-NEXT: mov h4, v0[1]
	; NOFP16-NEXT: movi.4s v2, #128, lsl #24			; NOFP16-NEXT: mvni.4s v2, #128, lsl #24
	; NOFP16-NEXT: fcvt s5, h1			; NOFP16-NEXT: fcvt s5, h1
	; NOFP16-NEXT: fcvt s6, h0			; NOFP16-NEXT: fcvt s6, h0
	; NOFP16-NEXT: mov h7, v1[2]			; NOFP16-NEXT: mov h7, v1[2]
	; NOFP16-NEXT: mov h16, v0[2]			; NOFP16-NEXT: mov h16, v0[2]
	; NOFP16-NEXT: fcvt s3, h3			; NOFP16-NEXT: fcvt s3, h3
	; NOFP16-NEXT: fcvt s4, h4			; NOFP16-NEXT: fcvt s4, h4
	; NOFP16-NEXT: mov h1, v1[3]			; NOFP16-NEXT: mov h1, v1[3]
	; NOFP16-NEXT: bit.16b v6, v5, v2			; NOFP16-NEXT: bit.16b v5, v6, v2
	; NOFP16-NEXT: fcvt s5, h7			; NOFP16-NEXT: fcvt s6, h7
	; NOFP16-NEXT: fcvt s7, h16			; NOFP16-NEXT: fcvt s7, h16
	; NOFP16-NEXT: bit.16b v4, v3, v2			; NOFP16-NEXT: bit.16b v3, v4, v2
	; NOFP16-NEXT: mov h3, v0[3]			; NOFP16-NEXT: mov h4, v0[3]
	; NOFP16-NEXT: fcvt h0, s6			; NOFP16-NEXT: fcvt h0, s5
	; NOFP16-NEXT: fcvt s1, h1			; NOFP16-NEXT: fcvt s1, h1
	; NOFP16-NEXT: bit.16b v7, v5, v2			; NOFP16-NEXT: bit.16b v6, v7, v2
	; NOFP16-NEXT: fcvt h4, s4			; NOFP16-NEXT: fcvt h3, s3
	; NOFP16-NEXT: fcvt s3, h3			; NOFP16-NEXT: fcvt s4, h4
	; NOFP16-NEXT: fcvt h5, s7			; NOFP16-NEXT: fcvt h5, s6
	; NOFP16-NEXT: mov.h v0[1], v4[0]			; NOFP16-NEXT: mov.h v0[1], v3[0]
	; NOFP16-NEXT: bit.16b v3, v1, v2			; NOFP16-NEXT: bit.16b v1, v4, v2
	; NOFP16-NEXT: mov.h v0[2], v5[0]			; NOFP16-NEXT: mov.h v0[2], v5[0]
	; NOFP16-NEXT: fcvt h1, s3			; NOFP16-NEXT: fcvt h1, s1
	; NOFP16-NEXT: mov.h v0[3], v1[0]			; NOFP16-NEXT: mov.h v0[3], v1[0]
	; NOFP16-NEXT: ; kill: def $d0 killed $d0 killed $q0			; NOFP16-NEXT: ; kill: def $d0 killed $d0 killed $q0
	; NOFP16-NEXT: ret			; NOFP16-NEXT: ret
	;			;
	; FP16-LABEL: test_copysign_v4f16_v4f16:			; FP16-LABEL: test_copysign_v4f16_v4f16:
	; FP16: ; %bb.0:			; FP16: ; %bb.0:
	; FP16-NEXT: movi.4h v2, #128, lsl #8			; FP16-NEXT: mvni.4h v2, #128, lsl #8
	; FP16-NEXT: bit.8b v0, v1, v2			; FP16-NEXT: bif.8b v0, v1, v2
	; FP16-NEXT: ret			; FP16-NEXT: ret
	%r = call <4 x half> @llvm.copysign.v4f16(<4 x half> %a, <4 x half> %b)			%r = call <4 x half> @llvm.copysign.v4f16(<4 x half> %a, <4 x half> %b)
	ret <4 x half> %r			ret <4 x half> %r
	}			}

	define <4 x half> @test_copysign_v4f16_v4f32(<4 x half> %a, <4 x float> %b) #0 {			define <4 x half> @test_copysign_v4f16_v4f32(<4 x half> %a, <4 x float> %b) #0 {
	; NOFP16-LABEL: test_copysign_v4f16_v4f32:			; NOFP16-LABEL: test_copysign_v4f16_v4f32:
	; NOFP16: ; %bb.0:			; NOFP16: ; %bb.0:
	; NOFP16-NEXT: fcvtn v1.4h, v1.4s			; NOFP16-NEXT: fcvtn v1.4h, v1.4s
	; NOFP16-NEXT: ; kill: def $d0 killed $d0 def $q0			; NOFP16-NEXT: ; kill: def $d0 killed $d0 def $q0
	; NOFP16-NEXT: mov h3, v0[1]			; NOFP16-NEXT: mov h3, v0[1]
	; NOFP16-NEXT: movi.4s v2, #128, lsl #24			; NOFP16-NEXT: mvni.4s v2, #128, lsl #24
	; NOFP16-NEXT: fcvt s5, h0			; NOFP16-NEXT: fcvt s5, h0
	; NOFP16-NEXT: mov h7, v0[2]			; NOFP16-NEXT: mov h7, v0[2]
	; NOFP16-NEXT: mov h4, v1[1]			; NOFP16-NEXT: mov h4, v1[1]
	; NOFP16-NEXT: fcvt s6, h1			; NOFP16-NEXT: fcvt s6, h1
	; NOFP16-NEXT: mov h16, v1[2]			; NOFP16-NEXT: mov h16, v1[2]
	; NOFP16-NEXT: fcvt s3, h3			; NOFP16-NEXT: fcvt s3, h3
	; NOFP16-NEXT: mov h1, v1[3]			; NOFP16-NEXT: mov h1, v1[3]
	; NOFP16-NEXT: fcvt s4, h4			; NOFP16-NEXT: fcvt s4, h4
	; NOFP16-NEXT: bit.16b v5, v6, v2			; NOFP16-NEXT: bif.16b v5, v6, v2
	; NOFP16-NEXT: fcvt s6, h7			; NOFP16-NEXT: fcvt s6, h7
	; NOFP16-NEXT: fcvt s7, h16			; NOFP16-NEXT: fcvt s7, h16
	; NOFP16-NEXT: fcvt s1, h1			; NOFP16-NEXT: fcvt s1, h1
	; NOFP16-NEXT: bit.16b v3, v4, v2			; NOFP16-NEXT: bif.16b v3, v4, v2
	; NOFP16-NEXT: mov h4, v0[3]			; NOFP16-NEXT: mov h4, v0[3]
	; NOFP16-NEXT: fcvt h0, s5			; NOFP16-NEXT: fcvt h0, s5
	; NOFP16-NEXT: bit.16b v6, v7, v2			; NOFP16-NEXT: bif.16b v6, v7, v2
	; NOFP16-NEXT: fcvt h3, s3			; NOFP16-NEXT: fcvt h3, s3
	; NOFP16-NEXT: fcvt s4, h4			; NOFP16-NEXT: fcvt s4, h4
	; NOFP16-NEXT: fcvt h5, s6			; NOFP16-NEXT: fcvt h5, s6
	; NOFP16-NEXT: mov.h v0[1], v3[0]			; NOFP16-NEXT: mov.h v0[1], v3[0]
	; NOFP16-NEXT: bit.16b v4, v1, v2			; NOFP16-NEXT: bit.16b v1, v4, v2
	; NOFP16-NEXT: mov.h v0[2], v5[0]			; NOFP16-NEXT: mov.h v0[2], v5[0]
	; NOFP16-NEXT: fcvt h1, s4			; NOFP16-NEXT: fcvt h1, s1
	; NOFP16-NEXT: mov.h v0[3], v1[0]			; NOFP16-NEXT: mov.h v0[3], v1[0]
	; NOFP16-NEXT: ; kill: def $d0 killed $d0 killed $q0			; NOFP16-NEXT: ; kill: def $d0 killed $d0 killed $q0
	; NOFP16-NEXT: ret			; NOFP16-NEXT: ret
	;			;
	; FP16-LABEL: test_copysign_v4f16_v4f32:			; FP16-LABEL: test_copysign_v4f16_v4f32:
	; FP16: ; %bb.0:			; FP16: ; %bb.0:
	; FP16-NEXT: movi.4h v2, #128, lsl #8			; FP16-NEXT: mvni.4h v2, #128, lsl #8
	; FP16-NEXT: fcvtn v1.4h, v1.4s			; FP16-NEXT: fcvtn v1.4h, v1.4s
	; FP16-NEXT: bit.8b v0, v1, v2			; FP16-NEXT: bif.8b v0, v1, v2
	; FP16-NEXT: ret			; FP16-NEXT: ret
	%tmp0 = fptrunc <4 x float> %b to <4 x half>			%tmp0 = fptrunc <4 x float> %b to <4 x half>
	%r = call <4 x half> @llvm.copysign.v4f16(<4 x half> %a, <4 x half> %tmp0)			%r = call <4 x half> @llvm.copysign.v4f16(<4 x half> %a, <4 x half> %tmp0)
	ret <4 x half> %r			ret <4 x half> %r
	}			}

	define <4 x half> @test_copysign_v4f16_v4f64(<4 x half> %a, <4 x double> %b) #0 {			define <4 x half> @test_copysign_v4f16_v4f64(<4 x half> %a, <4 x double> %b) #0 {
	; NOFP16-LABEL: test_copysign_v4f16_v4f64:			; NOFP16-LABEL: test_copysign_v4f16_v4f64:
	; NOFP16: ; %bb.0:			; NOFP16: ; %bb.0:
	; NOFP16-NEXT: ; kill: def $d0 killed $d0 def $q0			; NOFP16-NEXT: ; kill: def $d0 killed $d0 def $q0
	; NOFP16-NEXT: mov d4, v1[1]			; NOFP16-NEXT: mov d4, v1[1]
	; NOFP16-NEXT: mov h5, v0[1]			; NOFP16-NEXT: mov h5, v0[1]
	; NOFP16-NEXT: movi.4s v3, #128, lsl #24			; NOFP16-NEXT: mvni.4s v3, #128, lsl #24
	; NOFP16-NEXT: fcvt s1, d1			; NOFP16-NEXT: fcvt s1, d1
	; NOFP16-NEXT: fcvt s6, h0			; NOFP16-NEXT: fcvt s6, h0
	; NOFP16-NEXT: mov h7, v0[2]			; NOFP16-NEXT: mov h7, v0[2]
	; NOFP16-NEXT: fcvt s4, d4			; NOFP16-NEXT: fcvt s4, d4
	; NOFP16-NEXT: fcvt s5, h5			; NOFP16-NEXT: fcvt s5, h5
	; NOFP16-NEXT: bit.16b v6, v1, v3			; NOFP16-NEXT: bit.16b v1, v6, v3
	; NOFP16-NEXT: fcvt s1, d2			; NOFP16-NEXT: fcvt s6, d2
	; NOFP16-NEXT: fcvt s7, h7			; NOFP16-NEXT: fcvt s7, h7
	; NOFP16-NEXT: bit.16b v5, v4, v3			; NOFP16-NEXT: bit.16b v4, v5, v3
	; NOFP16-NEXT: mov d2, v2[1]			; NOFP16-NEXT: mov d2, v2[1]
	; NOFP16-NEXT: mov h4, v0[3]			; NOFP16-NEXT: mov h5, v0[3]
	; NOFP16-NEXT: fcvt h0, s6			; NOFP16-NEXT: fcvt h0, s1
	; NOFP16-NEXT: bit.16b v7, v1, v3			; NOFP16-NEXT: bit.16b v6, v7, v3
	; NOFP16-NEXT: fcvt h1, s5			; NOFP16-NEXT: fcvt h1, s4
	; NOFP16-NEXT: fcvt s2, d2			; NOFP16-NEXT: fcvt s2, d2
	; NOFP16-NEXT: fcvt s4, h4			; NOFP16-NEXT: fcvt s4, h5
	; NOFP16-NEXT: fcvt h5, s7			; NOFP16-NEXT: fcvt h5, s6
	; NOFP16-NEXT: mov.h v0[1], v1[0]			; NOFP16-NEXT: mov.h v0[1], v1[0]
	; NOFP16-NEXT: bit.16b v4, v2, v3			; NOFP16-NEXT: mov.16b v1, v3
	; NOFP16-NEXT: mov.h v0[2], v5[0]			; NOFP16-NEXT: mov.h v0[2], v5[0]
	; NOFP16-NEXT: fcvt h1, s4			; NOFP16-NEXT: bsl.16b v1, v4, v2
				; NOFP16-NEXT: fcvt h1, s1
				efriedmaUnsubmitted Not Done Reply Inline Actions It looks like the generated code here got worse; is there something wrong with the way we lower AArch64ISD::BSP? efriedma: It looks like the generated code here got worse; is there something wrong with the way we lower…
				DavidTrubyAuthorUnsubmitted Done Reply Inline Actions This looks like an oddity of register allocation to me. I'm not sure why the bsl instruction doesn't just use v3, in which case the extra mov wouldn't be necessary. By the time we get to AArch64ISD::BSP lowering register allocation has already happened though. I'm not sure what the solution to that is. DavidTruby: This looks like an oddity of register allocation to me. I'm not sure why the bsl instruction…
	; NOFP16-NEXT: mov.h v0[3], v1[0]			; NOFP16-NEXT: mov.h v0[3], v1[0]
	; NOFP16-NEXT: ; kill: def $d0 killed $d0 killed $q0			; NOFP16-NEXT: ; kill: def $d0 killed $d0 killed $q0
	; NOFP16-NEXT: ret			; NOFP16-NEXT: ret
	;			;
	; FP16-LABEL: test_copysign_v4f16_v4f64:			; FP16-LABEL: test_copysign_v4f16_v4f64:
	; FP16: ; %bb.0:			; FP16: ; %bb.0:
	; FP16-NEXT: mov d4, v1[1]			; FP16-NEXT: mov d4, v1[1]
	; FP16-NEXT: fcvt h1, d1			; FP16-NEXT: fcvt h1, d1
	; FP16-NEXT: movi.4h v3, #128, lsl #8			; FP16-NEXT: mvni.4h v3, #128, lsl #8
	; FP16-NEXT: fcvt h4, d4			; FP16-NEXT: fcvt h4, d4
	; FP16-NEXT: mov.h v1[1], v4[0]			; FP16-NEXT: mov.h v1[1], v4[0]
	; FP16-NEXT: fcvt h4, d2			; FP16-NEXT: fcvt h4, d2
	; FP16-NEXT: mov d2, v2[1]			; FP16-NEXT: mov d2, v2[1]
	; FP16-NEXT: mov.h v1[2], v4[0]			; FP16-NEXT: mov.h v1[2], v4[0]
	; FP16-NEXT: fcvt h2, d2			; FP16-NEXT: fcvt h2, d2
	; FP16-NEXT: mov.h v1[3], v2[0]			; FP16-NEXT: mov.h v1[3], v2[0]
	; FP16-NEXT: bit.8b v0, v1, v3			; FP16-NEXT: bif.8b v0, v1, v3
	; FP16-NEXT: ret			; FP16-NEXT: ret
	%tmp0 = fptrunc <4 x double> %b to <4 x half>			%tmp0 = fptrunc <4 x double> %b to <4 x half>
	%r = call <4 x half> @llvm.copysign.v4f16(<4 x half> %a, <4 x half> %tmp0)			%r = call <4 x half> @llvm.copysign.v4f16(<4 x half> %a, <4 x half> %tmp0)
	ret <4 x half> %r			ret <4 x half> %r
	}			}

	declare <4 x half> @llvm.copysign.v4f16(<4 x half> %a, <4 x half> %b) #0			declare <4 x half> @llvm.copysign.v4f16(<4 x half> %a, <4 x half> %b) #0

	;============ v8f16			;============ v8f16

	define <8 x half> @test_copysign_v8f16_v8f16(<8 x half> %a, <8 x half> %b) #0 {			define <8 x half> @test_copysign_v8f16_v8f16(<8 x half> %a, <8 x half> %b) #0 {
	; NOFP16-LABEL: test_copysign_v8f16_v8f16:			; NOFP16-LABEL: test_copysign_v8f16_v8f16:
	; NOFP16: ; %bb.0:			; NOFP16: ; %bb.0:
	; NOFP16-NEXT: mov h5, v1[1]			; NOFP16-NEXT: mov h5, v1[1]
	; NOFP16-NEXT: mov h6, v0[1]			; NOFP16-NEXT: mov h6, v0[1]
	; NOFP16-NEXT: movi.4s v3, #128, lsl #24			; NOFP16-NEXT: mvni.4s v3, #128, lsl #24
	; NOFP16-NEXT: fcvt s2, h1			; NOFP16-NEXT: fcvt s2, h1
	; NOFP16-NEXT: fcvt s4, h0			; NOFP16-NEXT: fcvt s4, h0
	; NOFP16-NEXT: mov h7, v1[2]			; NOFP16-NEXT: mov h7, v1[2]
	; NOFP16-NEXT: mov h16, v0[2]			; NOFP16-NEXT: mov h16, v0[2]
	; NOFP16-NEXT: fcvt s5, h5			; NOFP16-NEXT: fcvt s5, h5
	; NOFP16-NEXT: fcvt s6, h6			; NOFP16-NEXT: fcvt s6, h6
	; NOFP16-NEXT: mov h17, v0[3]			; NOFP16-NEXT: mov h17, v0[3]
	; NOFP16-NEXT: bit.16b v4, v2, v3			; NOFP16-NEXT: mov h18, v0[5]
	; NOFP16-NEXT: mov h2, v1[3]			; NOFP16-NEXT: bit.16b v2, v4, v3
				; NOFP16-NEXT: mov h4, v1[3]
	; NOFP16-NEXT: fcvt s7, h7			; NOFP16-NEXT: fcvt s7, h7
	; NOFP16-NEXT: fcvt s16, h16			; NOFP16-NEXT: fcvt s16, h16
	; NOFP16-NEXT: bit.16b v6, v5, v3			; NOFP16-NEXT: bit.16b v5, v6, v3
	; NOFP16-NEXT: fcvt s17, h17			; NOFP16-NEXT: fcvt s17, h17
	; NOFP16-NEXT: fcvt s18, h2			; NOFP16-NEXT: mov.16b v6, v3
	; NOFP16-NEXT: mov h5, v1[4]			; NOFP16-NEXT: fcvt s4, h4
	; NOFP16-NEXT: fcvt h2, s4			; NOFP16-NEXT: fcvt h2, s2
	; NOFP16-NEXT: bit.16b v16, v7, v3			; NOFP16-NEXT: fcvt h5, s5
	; NOFP16-NEXT: mov h7, v0[4]			; NOFP16-NEXT: bsl.16b v6, v16, v7
	; NOFP16-NEXT: fcvt h4, s6			; NOFP16-NEXT: mov h7, v1[4]
	; NOFP16-NEXT: bit.16b v17, v18, v3			; NOFP16-NEXT: mov h16, v0[4]
	; NOFP16-NEXT: mov h6, v1[5]			; NOFP16-NEXT: bit.16b v4, v17, v3
	; NOFP16-NEXT: mov h18, v0[5]			; NOFP16-NEXT: mov h17, v1[5]
	; NOFP16-NEXT: fcvt s5, h5			; NOFP16-NEXT: mov.h v2[1], v5[0]
	; NOFP16-NEXT: fcvt s7, h7			; NOFP16-NEXT: fcvt s7, h7
	; NOFP16-NEXT: mov.h v2[1], v4[0]			; NOFP16-NEXT: fcvt s16, h16
	; NOFP16-NEXT: fcvt h4, s16			; NOFP16-NEXT: fcvt h5, s6
	; NOFP16-NEXT: fcvt s6, h6			; NOFP16-NEXT: fcvt s6, h17
	; NOFP16-NEXT: fcvt s16, h18			; NOFP16-NEXT: fcvt s17, h18
	; NOFP16-NEXT: fcvt h17, s17			; NOFP16-NEXT: fcvt h4, s4
	; NOFP16-NEXT: bit.16b v7, v5, v3			; NOFP16-NEXT: bit.16b v7, v16, v3
	; NOFP16-NEXT: mov h5, v0[6]			; NOFP16-NEXT: mov h16, v0[6]
	; NOFP16-NEXT: mov.h v2[2], v4[0]			; NOFP16-NEXT: mov.h v2[2], v5[0]
	; NOFP16-NEXT: mov h4, v1[6]			; NOFP16-NEXT: mov h5, v1[6]
	; NOFP16-NEXT: bit.16b v16, v6, v3			; NOFP16-NEXT: bit.16b v6, v17, v3
	; NOFP16-NEXT: mov h1, v1[7]			; NOFP16-NEXT: mov h1, v1[7]
				; NOFP16-NEXT: fcvt s16, h16
				; NOFP16-NEXT: mov.h v2[3], v4[0]
				; NOFP16-NEXT: fcvt h4, s7
	; NOFP16-NEXT: fcvt s5, h5			; NOFP16-NEXT: fcvt s5, h5
	; NOFP16-NEXT: mov.h v2[3], v17[0]
	; NOFP16-NEXT: fcvt h6, s7
	; NOFP16-NEXT: fcvt s4, h4
	; NOFP16-NEXT: mov h0, v0[7]			; NOFP16-NEXT: mov h0, v0[7]
	; NOFP16-NEXT: fcvt s1, h1			; NOFP16-NEXT: fcvt s1, h1
	; NOFP16-NEXT: mov.h v2[4], v6[0]			; NOFP16-NEXT: mov.h v2[4], v4[0]
	; NOFP16-NEXT: bit.16b v5, v4, v3			; NOFP16-NEXT: fcvt h4, s6
	; NOFP16-NEXT: fcvt h4, s16			; NOFP16-NEXT: bit.16b v5, v16, v3
	; NOFP16-NEXT: fcvt s0, h0			; NOFP16-NEXT: fcvt s0, h0
	; NOFP16-NEXT: fcvt h5, s5
	; NOFP16-NEXT: mov.h v2[5], v4[0]			; NOFP16-NEXT: mov.h v2[5], v4[0]
	; NOFP16-NEXT: bit.16b v0, v1, v3			; NOFP16-NEXT: fcvt h5, s5
				; NOFP16-NEXT: bif.16b v0, v1, v3
	; NOFP16-NEXT: mov.h v2[6], v5[0]			; NOFP16-NEXT: mov.h v2[6], v5[0]
	; NOFP16-NEXT: fcvt h0, s0			; NOFP16-NEXT: fcvt h0, s0
	; NOFP16-NEXT: mov.h v2[7], v0[0]			; NOFP16-NEXT: mov.h v2[7], v0[0]
	; NOFP16-NEXT: mov.16b v0, v2			; NOFP16-NEXT: mov.16b v0, v2
	; NOFP16-NEXT: ret			; NOFP16-NEXT: ret
	;			;
	; FP16-LABEL: test_copysign_v8f16_v8f16:			; FP16-LABEL: test_copysign_v8f16_v8f16:
	; FP16: ; %bb.0:			; FP16: ; %bb.0:
	; FP16-NEXT: movi.8h v2, #128, lsl #8			; FP16-NEXT: mvni.8h v2, #128, lsl #8
	; FP16-NEXT: bit.16b v0, v1, v2			; FP16-NEXT: bif.16b v0, v1, v2
	; FP16-NEXT: ret			; FP16-NEXT: ret
	%r = call <8 x half> @llvm.copysign.v8f16(<8 x half> %a, <8 x half> %b)			%r = call <8 x half> @llvm.copysign.v8f16(<8 x half> %a, <8 x half> %b)
	ret <8 x half> %r			ret <8 x half> %r
	}			}

	define <8 x half> @test_copysign_v8f16_v8f32(<8 x half> %a, <8 x float> %b) #0 {			define <8 x half> @test_copysign_v8f16_v8f32(<8 x half> %a, <8 x float> %b) #0 {
	; NOFP16-LABEL: test_copysign_v8f16_v8f32:			; NOFP16-LABEL: test_copysign_v8f16_v8f32:
	; NOFP16: ; %bb.0:			; NOFP16: ; %bb.0:
	; NOFP16-NEXT: fcvtn v1.4h, v1.4s			; NOFP16-NEXT: fcvtn v1.4h, v1.4s
	; NOFP16-NEXT: fcvtn v2.4h, v2.4s			; NOFP16-NEXT: fcvtn v2.4h, v2.4s
	; NOFP16-NEXT: movi.4s v3, #128, lsl #24			; NOFP16-NEXT: mvni.4s v3, #128, lsl #24
	; NOFP16-NEXT: mov h4, v0[1]			; NOFP16-NEXT: mov h4, v0[1]
	; NOFP16-NEXT: mov h5, v0[4]			; NOFP16-NEXT: mov h5, v0[4]
	; NOFP16-NEXT: fcvt s7, h0			; NOFP16-NEXT: fcvt s7, h0
	; NOFP16-NEXT: mov h17, v0[2]			; NOFP16-NEXT: mov h17, v0[2]
	; NOFP16-NEXT: mov h6, v1[1]			; NOFP16-NEXT: mov h6, v1[1]
	; NOFP16-NEXT: fcvt s16, h1			; NOFP16-NEXT: fcvt s16, h1
	; NOFP16-NEXT: fcvt s4, h4			; NOFP16-NEXT: fcvt s4, h4
	; NOFP16-NEXT: mov h18, v1[2]			; NOFP16-NEXT: mov h18, v1[2]
	; NOFP16-NEXT: fcvt s5, h5			; NOFP16-NEXT: fcvt s5, h5
	; NOFP16-NEXT: fcvt s17, h17			; NOFP16-NEXT: fcvt s17, h17
	; NOFP16-NEXT: fcvt s6, h6			; NOFP16-NEXT: fcvt s6, h6
	; NOFP16-NEXT: bit.16b v7, v16, v3			; NOFP16-NEXT: bif.16b v7, v16, v3
	; NOFP16-NEXT: fcvt s16, h2			; NOFP16-NEXT: fcvt s16, h2
	; NOFP16-NEXT: fcvt s18, h18			; NOFP16-NEXT: fcvt s18, h18
	; NOFP16-NEXT: bit.16b v4, v6, v3			; NOFP16-NEXT: bif.16b v4, v6, v3
	; NOFP16-NEXT: mov h6, v0[3]			; NOFP16-NEXT: mov h6, v0[3]
	; NOFP16-NEXT: bit.16b v5, v16, v3			; NOFP16-NEXT: bif.16b v5, v16, v3
	; NOFP16-NEXT: mov h16, v1[3]			; NOFP16-NEXT: mov h16, v1[3]
	; NOFP16-NEXT: fcvt h1, s7			; NOFP16-NEXT: fcvt h1, s7
	; NOFP16-NEXT: mov h7, v0[5]			; NOFP16-NEXT: mov.16b v7, v3
	; NOFP16-NEXT: bit.16b v17, v18, v3
	; NOFP16-NEXT: fcvt h4, s4			; NOFP16-NEXT: fcvt h4, s4
	; NOFP16-NEXT: fcvt s6, h6			; NOFP16-NEXT: fcvt s6, h6
	; NOFP16-NEXT: fcvt s16, h16			; NOFP16-NEXT: fcvt s16, h16
	; NOFP16-NEXT: mov h18, v2[1]
	; NOFP16-NEXT: fcvt s7, h7
	; NOFP16-NEXT: fcvt h5, s5			; NOFP16-NEXT: fcvt h5, s5
				; NOFP16-NEXT: bsl.16b v7, v17, v18
				; NOFP16-NEXT: mov h17, v0[5]
				; NOFP16-NEXT: mov h18, v2[1]
	; NOFP16-NEXT: mov.h v1[1], v4[0]			; NOFP16-NEXT: mov.h v1[1], v4[0]
	; NOFP16-NEXT: fcvt h4, s17			; NOFP16-NEXT: bif.16b v6, v16, v3
	; NOFP16-NEXT: bit.16b v6, v16, v3			; NOFP16-NEXT: fcvt h4, s7
				; NOFP16-NEXT: fcvt s7, h17
	; NOFP16-NEXT: fcvt s17, h18			; NOFP16-NEXT: fcvt s17, h18
	; NOFP16-NEXT: mov h16, v2[2]			; NOFP16-NEXT: mov h16, v2[2]
				; NOFP16-NEXT: mov h2, v2[3]
				; NOFP16-NEXT: fcvt h6, s6
	; NOFP16-NEXT: mov.h v1[2], v4[0]			; NOFP16-NEXT: mov.h v1[2], v4[0]
	; NOFP16-NEXT: mov h4, v0[6]			; NOFP16-NEXT: mov h4, v0[6]
	; NOFP16-NEXT: mov h0, v0[7]			; NOFP16-NEXT: bif.16b v7, v17, v3
	; NOFP16-NEXT: fcvt h6, s6
	; NOFP16-NEXT: mov h2, v2[3]
	; NOFP16-NEXT: bit.16b v7, v17, v3
	; NOFP16-NEXT: fcvt s16, h16			; NOFP16-NEXT: fcvt s16, h16
				; NOFP16-NEXT: mov h0, v0[7]
				; NOFP16-NEXT: fcvt s2, h2
	; NOFP16-NEXT: fcvt s4, h4			; NOFP16-NEXT: fcvt s4, h4
	; NOFP16-NEXT: fcvt s0, h0
	; NOFP16-NEXT: mov.h v1[3], v6[0]			; NOFP16-NEXT: mov.h v1[3], v6[0]
	; NOFP16-NEXT: fcvt s2, h2			; NOFP16-NEXT: fcvt s0, h0
	; NOFP16-NEXT: bit.16b v4, v16, v3			; NOFP16-NEXT: bif.16b v4, v16, v3
	; NOFP16-NEXT: mov.h v1[4], v5[0]			; NOFP16-NEXT: mov.h v1[4], v5[0]
	; NOFP16-NEXT: fcvt h5, s7			; NOFP16-NEXT: fcvt h5, s7
	; NOFP16-NEXT: bit.16b v0, v2, v3			; NOFP16-NEXT: bif.16b v0, v2, v3
	; NOFP16-NEXT: fcvt h4, s4			; NOFP16-NEXT: fcvt h4, s4
	; NOFP16-NEXT: mov.h v1[5], v5[0]			; NOFP16-NEXT: mov.h v1[5], v5[0]
	; NOFP16-NEXT: fcvt h0, s0			; NOFP16-NEXT: fcvt h0, s0
	; NOFP16-NEXT: mov.h v1[6], v4[0]			; NOFP16-NEXT: mov.h v1[6], v4[0]
	; NOFP16-NEXT: mov.h v1[7], v0[0]			; NOFP16-NEXT: mov.h v1[7], v0[0]
	; NOFP16-NEXT: mov.16b v0, v1			; NOFP16-NEXT: mov.16b v0, v1
	; NOFP16-NEXT: ret			; NOFP16-NEXT: ret
	;			;
	; FP16-LABEL: test_copysign_v8f16_v8f32:			; FP16-LABEL: test_copysign_v8f16_v8f32:
	; FP16: ; %bb.0:			; FP16: ; %bb.0:
	; FP16-NEXT: fcvtn v2.4h, v2.4s			; FP16-NEXT: fcvtn v2.4h, v2.4s
	; FP16-NEXT: fcvtn v1.4h, v1.4s			; FP16-NEXT: fcvtn v1.4h, v1.4s
	; FP16-NEXT: movi.8h v3, #128, lsl #8			; FP16-NEXT: mvni.8h v3, #128, lsl #8
	; FP16-NEXT: mov.d v1[1], v2[0]			; FP16-NEXT: mov.d v1[1], v2[0]
	; FP16-NEXT: bit.16b v0, v1, v3			; FP16-NEXT: bif.16b v0, v1, v3
	; FP16-NEXT: ret			; FP16-NEXT: ret
	%tmp0 = fptrunc <8 x float> %b to <8 x half>			%tmp0 = fptrunc <8 x float> %b to <8 x half>
	%r = call <8 x half> @llvm.copysign.v8f16(<8 x half> %a, <8 x half> %tmp0)			%r = call <8 x half> @llvm.copysign.v8f16(<8 x half> %a, <8 x half> %tmp0)
	ret <8 x half> %r			ret <8 x half> %r
	}			}

	declare <8 x half> @llvm.copysign.v8f16(<8 x half> %a, <8 x half> %b) #0			declare <8 x half> @llvm.copysign.v8f16(<8 x half> %a, <8 x half> %b) #0

	attributes #0 = { nounwind }			attributes #0 = { nounwind }

This is an archive of the discontinued LLVM Phabricator instance.

[AArch64][NEON][SVE] Lower FCOPYSIGN using AArch64ISD::BSP
ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 406432

llvm/lib/Target/AArch64/AArch64ISelLowering.cpp

llvm/lib/Target/AArch64/AArch64SVEInstrInfo.td

llvm/lib/Target/AArch64/SVEInstrFormats.td

llvm/test/CodeGen/AArch64/arm64-fcopysign.ll

llvm/test/CodeGen/AArch64/f16-instructions.ll

llvm/test/CodeGen/AArch64/fcopysign.ll

llvm/test/CodeGen/AArch64/sve-fcopysign.ll

llvm/test/CodeGen/AArch64/sve2-fcopysign.ll

llvm/test/CodeGen/AArch64/vector-fcopysign.ll

This is an archive of the discontinued LLVM Phabricator instance.

[AArch64][NEON][SVE] Lower FCOPYSIGN using AArch64ISD::BSPClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 406432

llvm/lib/Target/AArch64/AArch64ISelLowering.cpp

llvm/lib/Target/AArch64/AArch64SVEInstrInfo.td

llvm/lib/Target/AArch64/SVEInstrFormats.td

llvm/test/CodeGen/AArch64/arm64-fcopysign.ll

llvm/test/CodeGen/AArch64/f16-instructions.ll

llvm/test/CodeGen/AArch64/fcopysign.ll

llvm/test/CodeGen/AArch64/sve-fcopysign.ll

llvm/test/CodeGen/AArch64/sve2-fcopysign.ll

llvm/test/CodeGen/AArch64/vector-fcopysign.ll

[AArch64][NEON][SVE] Lower FCOPYSIGN using AArch64ISD::BSP
ClosedPublic