Diff 245400

llvm/include/llvm/IR/IntrinsicsAArch64.td

	Show First 20 Lines • Show All 1,628 Lines • ▼ Show 20 Lines
	// Testing predicates			// Testing predicates
	//			//

	def int_aarch64_sve_ptest_any : AdvSIMD_SVE_PTEST_Intrinsic;			def int_aarch64_sve_ptest_any : AdvSIMD_SVE_PTEST_Intrinsic;
	def int_aarch64_sve_ptest_first : AdvSIMD_SVE_PTEST_Intrinsic;			def int_aarch64_sve_ptest_first : AdvSIMD_SVE_PTEST_Intrinsic;
	def int_aarch64_sve_ptest_last : AdvSIMD_SVE_PTEST_Intrinsic;			def int_aarch64_sve_ptest_last : AdvSIMD_SVE_PTEST_Intrinsic;

	//			//
				// Reinterpreting data
				//

				def int_aarch64_sve_convert_from_svbool : Intrinsic<[llvm_anyvector_ty],
				[llvm_nxv16i1_ty],
				[IntrNoMem]>;

				def int_aarch64_sve_convert_to_svbool : Intrinsic<[llvm_nxv16i1_ty],
				[llvm_anyvector_ty],
				[IntrNoMem]>;

				//
	// Gather loads: scalar base + vector offsets			// Gather loads: scalar base + vector offsets
	//			//

	// 64 bit unscaled offsets			// 64 bit unscaled offsets
	def int_aarch64_sve_ld1_gather : AdvSIMD_GatherLoad_64bitOffset_Intrinsic;			def int_aarch64_sve_ld1_gather : AdvSIMD_GatherLoad_64bitOffset_Intrinsic;

	// 64 bit scaled offsets			// 64 bit scaled offsets
	def int_aarch64_sve_ld1_gather_index : AdvSIMD_GatherLoad_64bitOffset_Intrinsic;			def int_aarch64_sve_ld1_gather_index : AdvSIMD_GatherLoad_64bitOffset_Intrinsic;
	▲ Show 20 Lines • Show All 291 Lines • Show Last 20 Lines

llvm/lib/Target/AArch64/AArch64ISelLowering.h

Show First 20 Lines • Show All 209 Lines • ▼ Show 20 Lines	enum NodeType : unsigned {
LASTB,		LASTB,
REV,		REV,
TBL,		TBL,

INSR,		INSR,
PTEST,		PTEST,
PTRUE,		PTRUE,

		REINTERPRET_CAST,

LDNF1,		LDNF1,
LDNF1S,		LDNF1S,
LDFF1,		LDFF1,
LDFF1S,		LDFF1S,

// Unsigned gather loads.		// Unsigned gather loads.
GLD1,		GLD1,
GLD1_SCALED,		GLD1_SCALED,
▲ Show 20 Lines • Show All 605 Lines • Show Last 20 Lines

llvm/lib/Target/AArch64/AArch64ISelLowering.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 1,333 Lines • ▼ Show 20 Lines	const char *AArch64TargetLowering::getTargetNodeName(unsigned Opcode) const {
case AArch64ISD::ORV_PRED: return "AArch64ISD::ORV_PRED";		case AArch64ISD::ORV_PRED: return "AArch64ISD::ORV_PRED";
case AArch64ISD::EORV_PRED: return "AArch64ISD::EORV_PRED";		case AArch64ISD::EORV_PRED: return "AArch64ISD::EORV_PRED";
case AArch64ISD::ANDV_PRED: return "AArch64ISD::ANDV_PRED";		case AArch64ISD::ANDV_PRED: return "AArch64ISD::ANDV_PRED";
case AArch64ISD::CLASTA_N: return "AArch64ISD::CLASTA_N";		case AArch64ISD::CLASTA_N: return "AArch64ISD::CLASTA_N";
case AArch64ISD::CLASTB_N: return "AArch64ISD::CLASTB_N";		case AArch64ISD::CLASTB_N: return "AArch64ISD::CLASTB_N";
case AArch64ISD::LASTA: return "AArch64ISD::LASTA";		case AArch64ISD::LASTA: return "AArch64ISD::LASTA";
case AArch64ISD::LASTB: return "AArch64ISD::LASTB";		case AArch64ISD::LASTB: return "AArch64ISD::LASTB";
case AArch64ISD::REV: return "AArch64ISD::REV";		case AArch64ISD::REV: return "AArch64ISD::REV";
		case AArch64ISD::REINTERPRET_CAST: return "AArch64ISD::REINTERPRET_CAST";
case AArch64ISD::TBL: return "AArch64ISD::TBL";		case AArch64ISD::TBL: return "AArch64ISD::TBL";
case AArch64ISD::NOT: return "AArch64ISD::NOT";		case AArch64ISD::NOT: return "AArch64ISD::NOT";
case AArch64ISD::BIT: return "AArch64ISD::BIT";		case AArch64ISD::BIT: return "AArch64ISD::BIT";
case AArch64ISD::CBZ: return "AArch64ISD::CBZ";		case AArch64ISD::CBZ: return "AArch64ISD::CBZ";
case AArch64ISD::CBNZ: return "AArch64ISD::CBNZ";		case AArch64ISD::CBNZ: return "AArch64ISD::CBNZ";
case AArch64ISD::TBZ: return "AArch64ISD::TBZ";		case AArch64ISD::TBZ: return "AArch64ISD::TBZ";
case AArch64ISD::TBNZ: return "AArch64ISD::TBNZ";		case AArch64ISD::TBNZ: return "AArch64ISD::TBNZ";
case AArch64ISD::TC_RETURN: return "AArch64ISD::TC_RETURN";		case AArch64ISD::TC_RETURN: return "AArch64ISD::TC_RETURN";
▲ Show 20 Lines • Show All 1,595 Lines • ▼ Show 20 Lines	static SDValue LowerMUL(SDValue Op, SelectionDAG &DAG) {
EVT Op1VT = Op1.getValueType();		EVT Op1VT = Op1.getValueType();
return DAG.getNode(N0->getOpcode(), DL, VT,		return DAG.getNode(N0->getOpcode(), DL, VT,
DAG.getNode(NewOpc, DL, VT,		DAG.getNode(NewOpc, DL, VT,
DAG.getNode(ISD::BITCAST, DL, Op1VT, N00), Op1),		DAG.getNode(ISD::BITCAST, DL, Op1VT, N00), Op1),
DAG.getNode(NewOpc, DL, VT,		DAG.getNode(NewOpc, DL, VT,
DAG.getNode(ISD::BITCAST, DL, Op1VT, N01), Op1));		DAG.getNode(ISD::BITCAST, DL, Op1VT, N01), Op1));
}		}

		static inline SDValue getPTrue(SelectionDAG &DAG, SDLoc DL, EVT VT,
		int Pattern) {
		return DAG.getNode(AArch64ISD::PTRUE, DL, VT,
		DAG.getTargetConstant(Pattern, DL, MVT::i32));
		}

SDValue AArch64TargetLowering::LowerINTRINSIC_WO_CHAIN(SDValue Op,		SDValue AArch64TargetLowering::LowerINTRINSIC_WO_CHAIN(SDValue Op,
SelectionDAG &DAG) const {		SelectionDAG &DAG) const {
unsigned IntNo = cast<ConstantSDNode>(Op.getOperand(0))->getZExtValue();		unsigned IntNo = cast<ConstantSDNode>(Op.getOperand(0))->getZExtValue();
SDLoc dl(Op);		SDLoc dl(Op);
switch (IntNo) {		switch (IntNo) {
default: return SDValue(); // Don't custom lower most intrinsics.		default: return SDValue(); // Don't custom lower most intrinsics.
case Intrinsic::thread_pointer: {		case Intrinsic::thread_pointer: {
EVT PtrVT = getPointerTy(DAG.getDataLayout());		EVT PtrVT = getPointerTy(DAG.getDataLayout());
▲ Show 20 Lines • Show All 71 Lines • ▼ Show 20 Lines	case Intrinsic::aarch64_sve_zip1:
return DAG.getNode(AArch64ISD::ZIP1, dl, Op.getValueType(),		return DAG.getNode(AArch64ISD::ZIP1, dl, Op.getValueType(),
Op.getOperand(1), Op.getOperand(2));		Op.getOperand(1), Op.getOperand(2));
case Intrinsic::aarch64_sve_zip2:		case Intrinsic::aarch64_sve_zip2:
return DAG.getNode(AArch64ISD::ZIP2, dl, Op.getValueType(),		return DAG.getNode(AArch64ISD::ZIP2, dl, Op.getValueType(),
Op.getOperand(1), Op.getOperand(2));		Op.getOperand(1), Op.getOperand(2));
case Intrinsic::aarch64_sve_ptrue:		case Intrinsic::aarch64_sve_ptrue:
return DAG.getNode(AArch64ISD::PTRUE, dl, Op.getValueType(),		return DAG.getNode(AArch64ISD::PTRUE, dl, Op.getValueType(),
Op.getOperand(1));		Op.getOperand(1));
		case Intrinsic::aarch64_sve_convert_from_svbool:
		return DAG.getNode(AArch64ISD::REINTERPRET_CAST, dl, Op.getValueType(),
		Op.getOperand(1));
		case Intrinsic::aarch64_sve_convert_to_svbool: {
		EVT VT = Op.getValueType();
		SDValue Reinterpret = DAG.getNode(AArch64ISD::REINTERPRET_CAST, dl, VT,
		Op.getOperand(1));
		// Return the reintepret if the cast isn't changing type,
		// i.e. <n x 16 x i1> -> <n x 16 x i1>
		efriedmaUnsubmitted Done Reply Inline Actions If the conversion isn't changing the type, do you need a REINTERPRET_CAST at all? efriedma: If the conversion isn't changing the type, do you need a REINTERPRET_CAST at all?
		c-rhodesAuthorUnsubmitted Not Done Reply Inline Actions No the reinterpret isn't necessary, I was expecting it to be DAG combined with `performNVCASTCombine` but realised there's a case missing for the reinterpret ISD node where that's invoked. I've updated it so the operand is returned if it's a cast to the same type. c-rhodes: No the reinterpret isn't necessary, I was expecting it to be DAG combined with…
		if (VT == Op.getOperand(1).getValueType())
		return Reinterpret;
		// Otherwise, zero the newly introduced lanes.
		SDValue Mask = getPTrue(DAG, dl, VT, AArch64SVEPredPattern::all);
		return DAG.getNode(ISD::AND, dl, VT, Reinterpret, Mask);
		sdesmalenUnsubmitted Not Done Reply Inline Actions Can you just use OutVT instead of using a REINTERPET_CAST? sdesmalen: Can you just use OutVT instead of using a REINTERPET_CAST?
		sdesmalenUnsubmitted Not Done Reply Inline Actions Sorry, ignore that comment, it of course needs the reinterpret cast because the AND operation is done on nxv16i1. sdesmalen: Sorry, ignore that comment, it of course needs the reinterpret cast because the AND operation…
		}

case Intrinsic::aarch64_sve_insr: {		case Intrinsic::aarch64_sve_insr: {
SDValue Scalar = Op.getOperand(2);		SDValue Scalar = Op.getOperand(2);
EVT ScalarTy = Scalar.getValueType();		EVT ScalarTy = Scalar.getValueType();
if ((ScalarTy == MVT::i8) \|\| (ScalarTy == MVT::i16))		if ((ScalarTy == MVT::i8) \|\| (ScalarTy == MVT::i16))
Scalar = DAG.getNode(ISD::ANY_EXTEND, dl, MVT::i32, Scalar);		Scalar = DAG.getNode(ISD::ANY_EXTEND, dl, MVT::i32, Scalar);

return DAG.getNode(AArch64ISD::INSR, dl, Op.getValueType(),		return DAG.getNode(AArch64ISD::INSR, dl, Op.getValueType(),
▲ Show 20 Lines • Show All 4,398 Lines • ▼ Show 20 Lines	SDValue AArch64TargetLowering::LowerSPLAT_VECTOR(SDValue Op,
case MVT::i16:		case MVT::i16:
case MVT::i32:		case MVT::i32:
SplatVal = DAG.getAnyExtOrTrunc(SplatVal, dl, MVT::i32);		SplatVal = DAG.getAnyExtOrTrunc(SplatVal, dl, MVT::i32);
return DAG.getNode(AArch64ISD::DUP, dl, VT, SplatVal);		return DAG.getNode(AArch64ISD::DUP, dl, VT, SplatVal);
case MVT::i64:		case MVT::i64:
SplatVal = DAG.getAnyExtOrTrunc(SplatVal, dl, MVT::i64);		SplatVal = DAG.getAnyExtOrTrunc(SplatVal, dl, MVT::i64);
return DAG.getNode(AArch64ISD::DUP, dl, VT, SplatVal);		return DAG.getNode(AArch64ISD::DUP, dl, VT, SplatVal);
case MVT::i1: {		case MVT::i1: {
		if (auto CSplatVal = dyn_cast<ConstantSDNode>(SplatVal))
		if (CSplatVal->isNullValue())
		return SDValue(DAG.getMachineNode(AArch64::PFALSE, dl, VT), 0);
		efriedmaUnsubmitted Not Done Reply Inline Actions We should not be calling getMachineNode before Select(). If we need a new AArch64ISD opcode, please add one. I'm not sure how this is relevant to the rest of the patch, in any case. efriedma: We should not be calling getMachineNode before Select(). If we need a new AArch64ISD opcode…
		c-rhodesAuthorUnsubmitted Done Reply Inline Actions It was necessary for how the test was written downstream with `zeroinitializer` but you're right it's not really relevant. I've removed this. c-rhodes: It was necessary for how the test was written downstream with `zeroinitializer` but you're…
// The general case of i1. There isn't any natural way to do this,		// The general case of i1. There isn't any natural way to do this,
// so we use some trickery with whilelo.		// so we use some trickery with whilelo.
// TODO: Add special cases for splat of constant true/false.		// TODO: Add special case for splat of constant true.
SplatVal = DAG.getAnyExtOrTrunc(SplatVal, dl, MVT::i64);		SplatVal = DAG.getAnyExtOrTrunc(SplatVal, dl, MVT::i64);
SplatVal = DAG.getNode(ISD::SIGN_EXTEND_INREG, dl, MVT::i64, SplatVal,		SplatVal = DAG.getNode(ISD::SIGN_EXTEND_INREG, dl, MVT::i64, SplatVal,
DAG.getValueType(MVT::i1));		DAG.getValueType(MVT::i1));
SDValue ID = DAG.getTargetConstant(Intrinsic::aarch64_sve_whilelo, dl,		SDValue ID = DAG.getTargetConstant(Intrinsic::aarch64_sve_whilelo, dl,
MVT::i64);		MVT::i64);
return DAG.getNode(ISD::INTRINSIC_WO_CHAIN, dl, VT, ID,		return DAG.getNode(ISD::INTRINSIC_WO_CHAIN, dl, VT, ID,
DAG.getConstant(0, dl, MVT::i64), SplatVal);		DAG.getConstant(0, dl, MVT::i64), SplatVal);
}		}
▲ Show 20 Lines • Show All 6,068 Lines • Show Last 20 Lines

llvm/lib/Target/AArch64/AArch64SVEInstrInfo.td

	Show First 20 Lines • Show All 90 Lines • ▼ Show 20 Lines
	def AArch64clastb_n : SDNode<"AArch64ISD::CLASTB_N", SDT_AArch64ReduceWithInit>;			def AArch64clastb_n : SDNode<"AArch64ISD::CLASTB_N", SDT_AArch64ReduceWithInit>;

	def SDT_AArch64Rev : SDTypeProfile<1, 1, [SDTCisVec<0>, SDTCisSameAs<0,1>]>;			def SDT_AArch64Rev : SDTypeProfile<1, 1, [SDTCisVec<0>, SDTCisSameAs<0,1>]>;
	def AArch64rev : SDNode<"AArch64ISD::REV", SDT_AArch64Rev>;			def AArch64rev : SDNode<"AArch64ISD::REV", SDT_AArch64Rev>;

	def SDT_AArch64PTest : SDTypeProfile<0, 2, [SDTCisVec<0>, SDTCisSameAs<0,1>]>;			def SDT_AArch64PTest : SDTypeProfile<0, 2, [SDTCisVec<0>, SDTCisSameAs<0,1>]>;
	def AArch64ptest : SDNode<"AArch64ISD::PTEST", SDT_AArch64PTest>;			def AArch64ptest : SDNode<"AArch64ISD::PTEST", SDT_AArch64PTest>;

				def reinterpret_cast : SDNode<"AArch64ISD::REINTERPRET_CAST", SDTUnaryOp>;

	let Predicates = [HasSVE] in {			let Predicates = [HasSVE] in {

	defm RDFFR_PPz : sve_int_rdffr_pred<0b0, "rdffr", int_aarch64_sve_rdffr_z>;			defm RDFFR_PPz : sve_int_rdffr_pred<0b0, "rdffr", int_aarch64_sve_rdffr_z>;
	def RDFFRS_PPz : sve_int_rdffr_pred<0b1, "rdffrs">;			def RDFFRS_PPz : sve_int_rdffr_pred<0b1, "rdffrs">;
	defm RDFFR_P : sve_int_rdffr_unpred<"rdffr", int_aarch64_sve_rdffr>;			defm RDFFR_P : sve_int_rdffr_unpred<"rdffr", int_aarch64_sve_rdffr>;
	def SETFFR : sve_int_setffr<"setffr", int_aarch64_sve_setffr>;			def SETFFR : sve_int_setffr<"setffr", int_aarch64_sve_setffr>;
	def WRFFR : sve_int_wrffr<"wrffr", int_aarch64_sve_wrffr>;			def WRFFR : sve_int_wrffr<"wrffr", int_aarch64_sve_wrffr>;

	▲ Show 20 Lines • Show All 1,089 Lines • ▼ Show 20 Lines

	def : Pat<(nxv2f64 (bitconvert (nxv16i8 ZPR:$src))), (nxv2f64 ZPR:$src)>;			def : Pat<(nxv2f64 (bitconvert (nxv16i8 ZPR:$src))), (nxv2f64 ZPR:$src)>;
	def : Pat<(nxv2f64 (bitconvert (nxv8i16 ZPR:$src))), (nxv2f64 ZPR:$src)>;			def : Pat<(nxv2f64 (bitconvert (nxv8i16 ZPR:$src))), (nxv2f64 ZPR:$src)>;
	def : Pat<(nxv2f64 (bitconvert (nxv4i32 ZPR:$src))), (nxv2f64 ZPR:$src)>;			def : Pat<(nxv2f64 (bitconvert (nxv4i32 ZPR:$src))), (nxv2f64 ZPR:$src)>;
	def : Pat<(nxv2f64 (bitconvert (nxv2i64 ZPR:$src))), (nxv2f64 ZPR:$src)>;			def : Pat<(nxv2f64 (bitconvert (nxv2i64 ZPR:$src))), (nxv2f64 ZPR:$src)>;
	def : Pat<(nxv2f64 (bitconvert (nxv8f16 ZPR:$src))), (nxv2f64 ZPR:$src)>;			def : Pat<(nxv2f64 (bitconvert (nxv8f16 ZPR:$src))), (nxv2f64 ZPR:$src)>;
	def : Pat<(nxv2f64 (bitconvert (nxv4f32 ZPR:$src))), (nxv2f64 ZPR:$src)>;			def : Pat<(nxv2f64 (bitconvert (nxv4f32 ZPR:$src))), (nxv2f64 ZPR:$src)>;

				def : Pat<(nxv16i1 (reinterpret_cast (nxv16i1 PPR:$src))), (COPY_TO_REGCLASS PPR:$src, PPR)>;
				def : Pat<(nxv16i1 (reinterpret_cast (nxv8i1 PPR:$src))), (COPY_TO_REGCLASS PPR:$src, PPR)>;
				def : Pat<(nxv16i1 (reinterpret_cast (nxv4i1 PPR:$src))), (COPY_TO_REGCLASS PPR:$src, PPR)>;
				def : Pat<(nxv16i1 (reinterpret_cast (nxv2i1 PPR:$src))), (COPY_TO_REGCLASS PPR:$src, PPR)>;
				def : Pat<(nxv8i1 (reinterpret_cast (nxv16i1 PPR:$src))), (COPY_TO_REGCLASS PPR:$src, PPR)>;
				def : Pat<(nxv8i1 (reinterpret_cast (nxv4i1 PPR:$src))), (COPY_TO_REGCLASS PPR:$src, PPR)>;
				def : Pat<(nxv8i1 (reinterpret_cast (nxv2i1 PPR:$src))), (COPY_TO_REGCLASS PPR:$src, PPR)>;
				def : Pat<(nxv4i1 (reinterpret_cast (nxv16i1 PPR:$src))), (COPY_TO_REGCLASS PPR:$src, PPR)>;
				def : Pat<(nxv4i1 (reinterpret_cast (nxv8i1 PPR:$src))), (COPY_TO_REGCLASS PPR:$src, PPR)>;
				def : Pat<(nxv4i1 (reinterpret_cast (nxv2i1 PPR:$src))), (COPY_TO_REGCLASS PPR:$src, PPR)>;
				def : Pat<(nxv2i1 (reinterpret_cast (nxv16i1 PPR:$src))), (COPY_TO_REGCLASS PPR:$src, PPR)>;
				def : Pat<(nxv2i1 (reinterpret_cast (nxv8i1 PPR:$src))), (COPY_TO_REGCLASS PPR:$src, PPR)>;
				def : Pat<(nxv2i1 (reinterpret_cast (nxv4i1 PPR:$src))), (COPY_TO_REGCLASS PPR:$src, PPR)>;

				def : Pat<(nxv16i1 (and PPR:$Ps1, PPR:$Ps2)),
				(AND_PPzPP (PTRUE_B 31), PPR:$Ps1, PPR:$Ps2)>;
				def : Pat<(nxv8i1 (and PPR:$Ps1, PPR:$Ps2)),
				(AND_PPzPP (PTRUE_H 31), PPR:$Ps1, PPR:$Ps2)>;
				def : Pat<(nxv4i1 (and PPR:$Ps1, PPR:$Ps2)),
				(AND_PPzPP (PTRUE_S 31), PPR:$Ps1, PPR:$Ps2)>;
				def : Pat<(nxv2i1 (and PPR:$Ps1, PPR:$Ps2)),
				(AND_PPzPP (PTRUE_D 31), PPR:$Ps1, PPR:$Ps2)>;

	// Add more complex addressing modes here as required			// Add more complex addressing modes here as required
	multiclass pred_load<ValueType Ty, ValueType PredTy, SDPatternOperator Load,			multiclass pred_load<ValueType Ty, ValueType PredTy, SDPatternOperator Load,
	Instruction RegImmInst> {			Instruction RegImmInst> {

	def _default_z : Pat<(Ty (Load GPR64:$base, (PredTy PPR:$gp), (SVEDup0Undef))),			def _default_z : Pat<(Ty (Load GPR64:$base, (PredTy PPR:$gp), (SVEDup0Undef))),
	(RegImmInst PPR:$gp, GPR64:$base, (i64 0))>;			(RegImmInst PPR:$gp, GPR64:$base, (i64 0))>;
	}			}

	▲ Show 20 Lines • Show All 608 Lines • Show Last 20 Lines

llvm/test/CodeGen/AArch64/sve-intrinsics-reinterpret.ll

This file was added.

				; RUN: llc -mtriple=aarch64-linux-gnu -mattr=+sve < %s \| FileCheck %s

				;
				; Converting to svbool_t (<vscale x 16 x i1>)
				;

				define <vscale x 16 x i1> @reinterpret_bool_b2b() {
				; CHECK-LABEL: reinterpret_bool_b2b:
				; CHECK: pfalse p0.b
				; CHECK-NEXT: ret
				%out = call <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv16i1(<vscale x 16 x i1> zeroinitializer)
				ret <vscale x 16 x i1> %out
				}

				define <vscale x 16 x i1> @reinterpret_bool_h2b() {
				; CHECK-LABEL: reinterpret_bool_h2b:
				; CHECK: pfalse p0.b
				; CHECK-NEXT: ptrue p1.b
				; CHECK-NEXT: and p0.b, p1/z, p0.b, p1.b
				; CHECK-NEXT: ret
				%out = call <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv8i1(<vscale x 8 x i1> zeroinitializer)
				ret <vscale x 16 x i1> %out
				}

				define <vscale x 16 x i1> @reinterpret_bool_s2b() {
				; CHECK-LABEL: reinterpret_bool_s2b:
				; CHECK: pfalse p0.b
				; CHECK-NEXT: ptrue p1.b
				; CHECK-NEXT: and p0.b, p1/z, p0.b, p1.b
				; CHECK-NEXT: ret
				%out = call <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv4i1(<vscale x 4 x i1> zeroinitializer)
				ret <vscale x 16 x i1> %out
				}
				efriedmaUnsubmitted Done Reply Inline Actions Are you sure the explicit zeroing is working correctly? It looks like reinterpret_bool_h2b and reinterpret_bool_s2b are generating the same code. efriedma: Are you sure the explicit zeroing is working correctly? It looks like reinterpret_bool_h2b and…

				define <vscale x 16 x i1> @reinterpret_bool_d2b() {
				; CHECK-LABEL: reinterpret_bool_d2b:
				; CHECK: pfalse p0.b
				; CHECK-NEXT: ptrue p1.b
				; CHECK-NEXT: and p0.b, p1/z, p0.b, p1.b
				; CHECK-NEXT: ret
				%out = call <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv2i1(<vscale x 2 x i1> zeroinitializer)
				ret <vscale x 16 x i1> %out
				}

				sdesmalenUnsubmitted Done Reply Inline Actions nit: the naming is a bit inconsistent here, maybe rename the tests to have either: `_from_b`, `_from_h`, `_from_s`, `_from_d` and `_to_b`, `_to_h`, `_to_s`, `_to_d` instead of the `b2b`, `b2h`, `h2b`, etc. sdesmalen: nit: the naming is a bit inconsistent here, maybe rename the tests to have either: `_from_b`…
				;
				; Converting from svbool_t
				;

				define <vscale x 16 x i1> @reinterpret_bool_b2b_from() {
				; CHECK-LABEL: reinterpret_bool_b2b_from:
				; CHECK: pfalse p0.b
				; CHECK-NEXT: ret
				%out = call <vscale x 16 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv16i1(<vscale x 16 x i1> zeroinitializer)
				ret <vscale x 16 x i1> %out
				}

				define <vscale x 8 x i1> @reinterpret_bool_b2h() {
				; CHECK-LABEL: reinterpret_bool_b2h:
				; CHECK: pfalse p0.b
				; CHECK-NEXT: ret
				%out = call <vscale x 8 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv8i1(<vscale x 16 x i1> zeroinitializer)
				ret <vscale x 8 x i1> %out
				}

				define <vscale x 4 x i1> @reinterpret_bool_b2s() {
				; CHECK-LABEL: reinterpret_bool_b2s:
				; CHECK: pfalse p0.b
				; CHECK-NEXT: ret
				%out = call <vscale x 4 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv4i1(<vscale x 16 x i1> zeroinitializer)
				ret <vscale x 4 x i1> %out
				}

				define <vscale x 2 x i1> @reinterpret_bool_b2d() {
				; CHECK-LABEL: reinterpret_bool_b2d:
				; CHECK: pfalse p0.b
				; CHECK-NEXT: ret
				%out = call <vscale x 2 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv2i1(<vscale x 16 x i1> zeroinitializer)
				ret <vscale x 2 x i1> %out
				}

				declare <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv16i1(<vscale x 16 x i1>)
				declare <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv8i1(<vscale x 8 x i1>)
				declare <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv4i1(<vscale x 4 x i1>)
				declare <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv2i1(<vscale x 2 x i1>)

				declare <vscale x 16 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv16i1(<vscale x 16 x i1>)
				declare <vscale x 8 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv8i1(<vscale x 16 x i1>)
				declare <vscale x 4 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv4i1(<vscale x 16 x i1>)
				declare <vscale x 2 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv2i1(<vscale x 16 x i1>)

This is an archive of the discontinued LLVM Phabricator instance.

[AArch64][SVE] Add predicate reinterpret intrinsics
ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 245400

llvm/include/llvm/IR/IntrinsicsAArch64.td

llvm/lib/Target/AArch64/AArch64ISelLowering.h

llvm/lib/Target/AArch64/AArch64ISelLowering.cpp

llvm/lib/Target/AArch64/AArch64SVEInstrInfo.td

llvm/test/CodeGen/AArch64/sve-intrinsics-reinterpret.ll

This is an archive of the discontinued LLVM Phabricator instance.

[AArch64][SVE] Add predicate reinterpret intrinsicsClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 245400

llvm/include/llvm/IR/IntrinsicsAArch64.td

llvm/lib/Target/AArch64/AArch64ISelLowering.h

llvm/lib/Target/AArch64/AArch64ISelLowering.cpp

llvm/lib/Target/AArch64/AArch64SVEInstrInfo.td

llvm/test/CodeGen/AArch64/sve-intrinsics-reinterpret.ll

[AArch64][SVE] Add predicate reinterpret intrinsics
ClosedPublic