Diff 246391

llvm/include/llvm/IR/IntrinsicsAArch64.td

	Show First 20 Lines • Show All 1,686 Lines • ▼ Show 20 Lines
	// Testing predicates			// Testing predicates
	//			//

	def int_aarch64_sve_ptest_any : AdvSIMD_SVE_PTEST_Intrinsic;			def int_aarch64_sve_ptest_any : AdvSIMD_SVE_PTEST_Intrinsic;
	def int_aarch64_sve_ptest_first : AdvSIMD_SVE_PTEST_Intrinsic;			def int_aarch64_sve_ptest_first : AdvSIMD_SVE_PTEST_Intrinsic;
	def int_aarch64_sve_ptest_last : AdvSIMD_SVE_PTEST_Intrinsic;			def int_aarch64_sve_ptest_last : AdvSIMD_SVE_PTEST_Intrinsic;

	//			//
				// Reinterpreting data
				//

				def int_aarch64_sve_convert_from_svbool : Intrinsic<[llvm_anyvector_ty],
				[llvm_nxv16i1_ty],
				[IntrNoMem]>;

				def int_aarch64_sve_convert_to_svbool : Intrinsic<[llvm_nxv16i1_ty],
				[llvm_anyvector_ty],
				[IntrNoMem]>;

				//
	// Gather loads: scalar base + vector offsets			// Gather loads: scalar base + vector offsets
	//			//

	// 64 bit unscaled offsets			// 64 bit unscaled offsets
	def int_aarch64_sve_ld1_gather : AdvSIMD_GatherLoad_64bitOffset_Intrinsic;			def int_aarch64_sve_ld1_gather : AdvSIMD_GatherLoad_64bitOffset_Intrinsic;

	// 64 bit scaled offsets			// 64 bit scaled offsets
	def int_aarch64_sve_ld1_gather_index : AdvSIMD_GatherLoad_64bitOffset_Intrinsic;			def int_aarch64_sve_ld1_gather_index : AdvSIMD_GatherLoad_64bitOffset_Intrinsic;
	▲ Show 20 Lines • Show All 363 Lines • Show Last 20 Lines

llvm/lib/Target/AArch64/AArch64ISelLowering.h

Show First 20 Lines • Show All 212 Lines • ▼ Show 20 Lines	enum NodeType : unsigned {

INSR,		INSR,
PTEST,		PTEST,
PTRUE,		PTRUE,

DUP_PRED,		DUP_PRED,
INDEX_VECTOR,		INDEX_VECTOR,

		REINTERPRET_CAST,

LDNF1,		LDNF1,
LDNF1S,		LDNF1S,
LDFF1,		LDFF1,
LDFF1S,		LDFF1S,

// Unsigned gather loads.		// Unsigned gather loads.
GLD1,		GLD1,
GLD1_SCALED,		GLD1_SCALED,
▲ Show 20 Lines • Show All 613 Lines • Show Last 20 Lines

llvm/lib/Target/AArch64/AArch64ISelLowering.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 1,339 Lines • ▼ Show 20 Lines	const char *AArch64TargetLowering::getTargetNodeName(unsigned Opcode) const {
case AArch64ISD::ORV_PRED: return "AArch64ISD::ORV_PRED";		case AArch64ISD::ORV_PRED: return "AArch64ISD::ORV_PRED";
case AArch64ISD::EORV_PRED: return "AArch64ISD::EORV_PRED";		case AArch64ISD::EORV_PRED: return "AArch64ISD::EORV_PRED";
case AArch64ISD::ANDV_PRED: return "AArch64ISD::ANDV_PRED";		case AArch64ISD::ANDV_PRED: return "AArch64ISD::ANDV_PRED";
case AArch64ISD::CLASTA_N: return "AArch64ISD::CLASTA_N";		case AArch64ISD::CLASTA_N: return "AArch64ISD::CLASTA_N";
case AArch64ISD::CLASTB_N: return "AArch64ISD::CLASTB_N";		case AArch64ISD::CLASTB_N: return "AArch64ISD::CLASTB_N";
case AArch64ISD::LASTA: return "AArch64ISD::LASTA";		case AArch64ISD::LASTA: return "AArch64ISD::LASTA";
case AArch64ISD::LASTB: return "AArch64ISD::LASTB";		case AArch64ISD::LASTB: return "AArch64ISD::LASTB";
case AArch64ISD::REV: return "AArch64ISD::REV";		case AArch64ISD::REV: return "AArch64ISD::REV";
		case AArch64ISD::REINTERPRET_CAST: return "AArch64ISD::REINTERPRET_CAST";
case AArch64ISD::TBL: return "AArch64ISD::TBL";		case AArch64ISD::TBL: return "AArch64ISD::TBL";
case AArch64ISD::NOT: return "AArch64ISD::NOT";		case AArch64ISD::NOT: return "AArch64ISD::NOT";
case AArch64ISD::BIT: return "AArch64ISD::BIT";		case AArch64ISD::BIT: return "AArch64ISD::BIT";
case AArch64ISD::CBZ: return "AArch64ISD::CBZ";		case AArch64ISD::CBZ: return "AArch64ISD::CBZ";
case AArch64ISD::CBNZ: return "AArch64ISD::CBNZ";		case AArch64ISD::CBNZ: return "AArch64ISD::CBNZ";
case AArch64ISD::TBZ: return "AArch64ISD::TBZ";		case AArch64ISD::TBZ: return "AArch64ISD::TBZ";
case AArch64ISD::TBNZ: return "AArch64ISD::TBNZ";		case AArch64ISD::TBNZ: return "AArch64ISD::TBNZ";
case AArch64ISD::TC_RETURN: return "AArch64ISD::TC_RETURN";		case AArch64ISD::TC_RETURN: return "AArch64ISD::TC_RETURN";
▲ Show 20 Lines • Show All 1,588 Lines • ▼ Show 20 Lines	static SDValue LowerMUL(SDValue Op, SelectionDAG &DAG) {
EVT Op1VT = Op1.getValueType();		EVT Op1VT = Op1.getValueType();
return DAG.getNode(N0->getOpcode(), DL, VT,		return DAG.getNode(N0->getOpcode(), DL, VT,
DAG.getNode(NewOpc, DL, VT,		DAG.getNode(NewOpc, DL, VT,
DAG.getNode(ISD::BITCAST, DL, Op1VT, N00), Op1),		DAG.getNode(ISD::BITCAST, DL, Op1VT, N00), Op1),
DAG.getNode(NewOpc, DL, VT,		DAG.getNode(NewOpc, DL, VT,
DAG.getNode(ISD::BITCAST, DL, Op1VT, N01), Op1));		DAG.getNode(ISD::BITCAST, DL, Op1VT, N01), Op1));
}		}

		static inline SDValue getPTrue(SelectionDAG &DAG, SDLoc DL, EVT VT,
		int Pattern) {
		return DAG.getNode(AArch64ISD::PTRUE, DL, VT,
		DAG.getTargetConstant(Pattern, DL, MVT::i32));
		}

SDValue AArch64TargetLowering::LowerINTRINSIC_WO_CHAIN(SDValue Op,		SDValue AArch64TargetLowering::LowerINTRINSIC_WO_CHAIN(SDValue Op,
SelectionDAG &DAG) const {		SelectionDAG &DAG) const {
unsigned IntNo = cast<ConstantSDNode>(Op.getOperand(0))->getZExtValue();		unsigned IntNo = cast<ConstantSDNode>(Op.getOperand(0))->getZExtValue();
SDLoc dl(Op);		SDLoc dl(Op);
switch (IntNo) {		switch (IntNo) {
default: return SDValue(); // Don't custom lower most intrinsics.		default: return SDValue(); // Don't custom lower most intrinsics.
case Intrinsic::thread_pointer: {		case Intrinsic::thread_pointer: {
EVT PtrVT = getPointerTy(DAG.getDataLayout());		EVT PtrVT = getPointerTy(DAG.getDataLayout());
▲ Show 20 Lines • Show All 73 Lines • ▼ Show 20 Lines	SDValue AArch64TargetLowering::LowerINTRINSIC_WO_CHAIN(SDValue Op,
case Intrinsic::aarch64_sve_zip2:		case Intrinsic::aarch64_sve_zip2:
return DAG.getNode(AArch64ISD::ZIP2, dl, Op.getValueType(),		return DAG.getNode(AArch64ISD::ZIP2, dl, Op.getValueType(),
Op.getOperand(1), Op.getOperand(2));		Op.getOperand(1), Op.getOperand(2));
case Intrinsic::aarch64_sve_ptrue:		case Intrinsic::aarch64_sve_ptrue:
return DAG.getNode(AArch64ISD::PTRUE, dl, Op.getValueType(),		return DAG.getNode(AArch64ISD::PTRUE, dl, Op.getValueType(),
Op.getOperand(1));		Op.getOperand(1));
case Intrinsic::aarch64_sve_dupq_lane:		case Intrinsic::aarch64_sve_dupq_lane:
return LowerDUPQLane(Op, DAG);		return LowerDUPQLane(Op, DAG);
		case Intrinsic::aarch64_sve_convert_from_svbool:
		return DAG.getNode(AArch64ISD::REINTERPRET_CAST, dl, Op.getValueType(),
		Op.getOperand(1));
		case Intrinsic::aarch64_sve_convert_to_svbool: {
		EVT OutVT = Op.getValueType();
		EVT InVT = Op.getOperand(1).getValueType();
		// Return the operand if the cast isn't changing type,
		efriedmaUnsubmitted Done Reply Inline Actions If the conversion isn't changing the type, do you need a REINTERPRET_CAST at all? efriedma: If the conversion isn't changing the type, do you need a REINTERPRET_CAST at all?
		c-rhodesAuthorUnsubmitted Not Done Reply Inline Actions No the reinterpret isn't necessary, I was expecting it to be DAG combined with `performNVCASTCombine` but realised there's a case missing for the reinterpret ISD node where that's invoked. I've updated it so the operand is returned if it's a cast to the same type. c-rhodes: No the reinterpret isn't necessary, I was expecting it to be DAG combined with…
		// i.e. <n x 16 x i1> -> <n x 16 x i1>
		if (InVT == OutVT)
		return Op.getOperand(1);
		// Otherwise, zero the newly introduced lanes.
		SDValue Reinterpret =
		sdesmalenUnsubmitted Not Done Reply Inline Actions Can you just use OutVT instead of using a REINTERPET_CAST? sdesmalen: Can you just use OutVT instead of using a REINTERPET_CAST?
		sdesmalenUnsubmitted Not Done Reply Inline Actions Sorry, ignore that comment, it of course needs the reinterpret cast because the AND operation is done on nxv16i1. sdesmalen: Sorry, ignore that comment, it of course needs the reinterpret cast because the AND operation…
		DAG.getNode(AArch64ISD::REINTERPRET_CAST, dl, OutVT, Op.getOperand(1));
		SDValue Mask = getPTrue(DAG, dl, InVT, AArch64SVEPredPattern::all);
		SDValue MaskReinterpret =
		DAG.getNode(AArch64ISD::REINTERPRET_CAST, dl, OutVT, Mask);
		return DAG.getNode(ISD::AND, dl, OutVT, Reinterpret, MaskReinterpret);
		}

case Intrinsic::aarch64_sve_insr: {		case Intrinsic::aarch64_sve_insr: {
SDValue Scalar = Op.getOperand(2);		SDValue Scalar = Op.getOperand(2);
EVT ScalarTy = Scalar.getValueType();		EVT ScalarTy = Scalar.getValueType();
if ((ScalarTy == MVT::i8) \|\| (ScalarTy == MVT::i16))		if ((ScalarTy == MVT::i8) \|\| (ScalarTy == MVT::i16))
Scalar = DAG.getNode(ISD::ANY_EXTEND, dl, MVT::i32, Scalar);		Scalar = DAG.getNode(ISD::ANY_EXTEND, dl, MVT::i32, Scalar);

return DAG.getNode(AArch64ISD::INSR, dl, Op.getValueType(),		return DAG.getNode(AArch64ISD::INSR, dl, Op.getValueType(),
▲ Show 20 Lines • Show All 4,431 Lines • ▼ Show 20 Lines	SDValue AArch64TargetLowering::LowerSPLAT_VECTOR(SDValue Op,
SDValue SplatVal = Op.getOperand(0);		SDValue SplatVal = Op.getOperand(0);

// Extend input splat value where needed to fit into a GPR (32b or 64b only)		// Extend input splat value where needed to fit into a GPR (32b or 64b only)
// FPRs don't have this restriction.		// FPRs don't have this restriction.
switch (ElemVT.getSimpleVT().SimpleTy) {		switch (ElemVT.getSimpleVT().SimpleTy) {
case MVT::i1: {		case MVT::i1: {
// The general case of i1. There isn't any natural way to do this,		// The general case of i1. There isn't any natural way to do this,
// so we use some trickery with whilelo.		// so we use some trickery with whilelo.
// TODO: Add special cases for splat of constant true/false.		// TODO: Add special cases for splat of constant true/false.
		efriedmaUnsubmitted Not Done Reply Inline Actions We should not be calling getMachineNode before Select(). If we need a new AArch64ISD opcode, please add one. I'm not sure how this is relevant to the rest of the patch, in any case. efriedma: We should not be calling getMachineNode before Select(). If we need a new AArch64ISD opcode…
		c-rhodesAuthorUnsubmitted Done Reply Inline Actions It was necessary for how the test was written downstream with `zeroinitializer` but you're right it's not really relevant. I've removed this. c-rhodes: It was necessary for how the test was written downstream with `zeroinitializer` but you're…
SplatVal = DAG.getAnyExtOrTrunc(SplatVal, dl, MVT::i64);		SplatVal = DAG.getAnyExtOrTrunc(SplatVal, dl, MVT::i64);
SplatVal = DAG.getNode(ISD::SIGN_EXTEND_INREG, dl, MVT::i64, SplatVal,		SplatVal = DAG.getNode(ISD::SIGN_EXTEND_INREG, dl, MVT::i64, SplatVal,
DAG.getValueType(MVT::i1));		DAG.getValueType(MVT::i1));
SDValue ID = DAG.getTargetConstant(Intrinsic::aarch64_sve_whilelo, dl,		SDValue ID = DAG.getTargetConstant(Intrinsic::aarch64_sve_whilelo, dl,
MVT::i64);		MVT::i64);
return DAG.getNode(ISD::INTRINSIC_WO_CHAIN, dl, VT, ID,		return DAG.getNode(ISD::INTRINSIC_WO_CHAIN, dl, VT, ID,
DAG.getConstant(0, dl, MVT::i64), SplatVal);		DAG.getConstant(0, dl, MVT::i64), SplatVal);
}		}
▲ Show 20 Lines • Show All 6,158 Lines • Show Last 20 Lines

llvm/lib/Target/AArch64/AArch64SVEInstrInfo.td

Show First 20 Lines • Show All 109 Lines • ▼ Show 20 Lines
def AArch64ptest : SDNode<"AArch64ISD::PTEST", SDT_AArch64PTest>;		def AArch64ptest : SDNode<"AArch64ISD::PTEST", SDT_AArch64PTest>;

def SDT_AArch64DUP_PRED : SDTypeProfile<1, 3, [SDTCisVec<0>, SDTCisSameAs<0,1>, SDTCisVec<2>, SDTCVecEltisVT<2,i1>]>;		def SDT_AArch64DUP_PRED : SDTypeProfile<1, 3, [SDTCisVec<0>, SDTCisSameAs<0,1>, SDTCisVec<2>, SDTCVecEltisVT<2,i1>]>;
def AArch64dup_pred : SDNode<"AArch64ISD::DUP_PRED", SDT_AArch64DUP_PRED>;		def AArch64dup_pred : SDNode<"AArch64ISD::DUP_PRED", SDT_AArch64DUP_PRED>;

def SDT_IndexVector : SDTypeProfile<1, 2, [SDTCisVec<0>, SDTCisSameAs<1, 2>, SDTCisInt<2>]>;		def SDT_IndexVector : SDTypeProfile<1, 2, [SDTCisVec<0>, SDTCisSameAs<1, 2>, SDTCisInt<2>]>;
def index_vector : SDNode<"AArch64ISD::INDEX_VECTOR", SDT_IndexVector, []>;		def index_vector : SDNode<"AArch64ISD::INDEX_VECTOR", SDT_IndexVector, []>;

		def reinterpret_cast : SDNode<"AArch64ISD::REINTERPRET_CAST", SDTUnaryOp>;

let Predicates = [HasSVE] in {		let Predicates = [HasSVE] in {

defm RDFFR_PPz : sve_int_rdffr_pred<0b0, "rdffr", int_aarch64_sve_rdffr_z>;		defm RDFFR_PPz : sve_int_rdffr_pred<0b0, "rdffr", int_aarch64_sve_rdffr_z>;
def RDFFRS_PPz : sve_int_rdffr_pred<0b1, "rdffrs">;		def RDFFRS_PPz : sve_int_rdffr_pred<0b1, "rdffrs">;
defm RDFFR_P : sve_int_rdffr_unpred<"rdffr", int_aarch64_sve_rdffr>;		defm RDFFR_P : sve_int_rdffr_unpred<"rdffr", int_aarch64_sve_rdffr>;
def SETFFR : sve_int_setffr<"setffr", int_aarch64_sve_setffr>;		def SETFFR : sve_int_setffr<"setffr", int_aarch64_sve_setffr>;
def WRFFR : sve_int_wrffr<"wrffr", int_aarch64_sve_wrffr>;		def WRFFR : sve_int_wrffr<"wrffr", int_aarch64_sve_wrffr>;

▲ Show 20 Lines • Show All 1,173 Lines • ▼ Show 20 Lines	multiclass sve_prefetch<SDPatternOperator prefetch, ValueType PredTy, Instruction RegImmInst, Instruction RegRegInst, int scale, ComplexPattern AddrCP> {

def : Pat<(nxv2f64 (bitconvert (nxv16i8 ZPR:$src))), (nxv2f64 ZPR:$src)>;		def : Pat<(nxv2f64 (bitconvert (nxv16i8 ZPR:$src))), (nxv2f64 ZPR:$src)>;
def : Pat<(nxv2f64 (bitconvert (nxv8i16 ZPR:$src))), (nxv2f64 ZPR:$src)>;		def : Pat<(nxv2f64 (bitconvert (nxv8i16 ZPR:$src))), (nxv2f64 ZPR:$src)>;
def : Pat<(nxv2f64 (bitconvert (nxv4i32 ZPR:$src))), (nxv2f64 ZPR:$src)>;		def : Pat<(nxv2f64 (bitconvert (nxv4i32 ZPR:$src))), (nxv2f64 ZPR:$src)>;
def : Pat<(nxv2f64 (bitconvert (nxv2i64 ZPR:$src))), (nxv2f64 ZPR:$src)>;		def : Pat<(nxv2f64 (bitconvert (nxv2i64 ZPR:$src))), (nxv2f64 ZPR:$src)>;
def : Pat<(nxv2f64 (bitconvert (nxv8f16 ZPR:$src))), (nxv2f64 ZPR:$src)>;		def : Pat<(nxv2f64 (bitconvert (nxv8f16 ZPR:$src))), (nxv2f64 ZPR:$src)>;
def : Pat<(nxv2f64 (bitconvert (nxv4f32 ZPR:$src))), (nxv2f64 ZPR:$src)>;		def : Pat<(nxv2f64 (bitconvert (nxv4f32 ZPR:$src))), (nxv2f64 ZPR:$src)>;

		def : Pat<(nxv16i1 (reinterpret_cast (nxv16i1 PPR:$src))), (COPY_TO_REGCLASS PPR:$src, PPR)>;
		def : Pat<(nxv16i1 (reinterpret_cast (nxv8i1 PPR:$src))), (COPY_TO_REGCLASS PPR:$src, PPR)>;
		def : Pat<(nxv16i1 (reinterpret_cast (nxv4i1 PPR:$src))), (COPY_TO_REGCLASS PPR:$src, PPR)>;
		def : Pat<(nxv16i1 (reinterpret_cast (nxv2i1 PPR:$src))), (COPY_TO_REGCLASS PPR:$src, PPR)>;
		def : Pat<(nxv8i1 (reinterpret_cast (nxv16i1 PPR:$src))), (COPY_TO_REGCLASS PPR:$src, PPR)>;
		def : Pat<(nxv8i1 (reinterpret_cast (nxv4i1 PPR:$src))), (COPY_TO_REGCLASS PPR:$src, PPR)>;
		def : Pat<(nxv8i1 (reinterpret_cast (nxv2i1 PPR:$src))), (COPY_TO_REGCLASS PPR:$src, PPR)>;
		def : Pat<(nxv4i1 (reinterpret_cast (nxv16i1 PPR:$src))), (COPY_TO_REGCLASS PPR:$src, PPR)>;
		def : Pat<(nxv4i1 (reinterpret_cast (nxv8i1 PPR:$src))), (COPY_TO_REGCLASS PPR:$src, PPR)>;
		def : Pat<(nxv4i1 (reinterpret_cast (nxv2i1 PPR:$src))), (COPY_TO_REGCLASS PPR:$src, PPR)>;
		def : Pat<(nxv2i1 (reinterpret_cast (nxv16i1 PPR:$src))), (COPY_TO_REGCLASS PPR:$src, PPR)>;
		def : Pat<(nxv2i1 (reinterpret_cast (nxv8i1 PPR:$src))), (COPY_TO_REGCLASS PPR:$src, PPR)>;
		def : Pat<(nxv2i1 (reinterpret_cast (nxv4i1 PPR:$src))), (COPY_TO_REGCLASS PPR:$src, PPR)>;

		def : Pat<(nxv16i1 (and PPR:$Ps1, PPR:$Ps2)),
		(AND_PPzPP (PTRUE_B 31), PPR:$Ps1, PPR:$Ps2)>;
		def : Pat<(nxv8i1 (and PPR:$Ps1, PPR:$Ps2)),
		(AND_PPzPP (PTRUE_H 31), PPR:$Ps1, PPR:$Ps2)>;
		def : Pat<(nxv4i1 (and PPR:$Ps1, PPR:$Ps2)),
		(AND_PPzPP (PTRUE_S 31), PPR:$Ps1, PPR:$Ps2)>;
		def : Pat<(nxv2i1 (and PPR:$Ps1, PPR:$Ps2)),
		(AND_PPzPP (PTRUE_D 31), PPR:$Ps1, PPR:$Ps2)>;

// Add more complex addressing modes here as required		// Add more complex addressing modes here as required
multiclass pred_load<ValueType Ty, ValueType PredTy, SDPatternOperator Load,		multiclass pred_load<ValueType Ty, ValueType PredTy, SDPatternOperator Load,
Instruction RegRegInst, Instruction RegImmInst, ComplexPattern AddrCP> {		Instruction RegRegInst, Instruction RegImmInst, ComplexPattern AddrCP> {
// reg + reg		// reg + reg
let AddedComplexity = 1 in {		let AddedComplexity = 1 in {
def _reg_reg_z : Pat<(Ty (Load (AddrCP GPR64:$base, GPR64:$offset), (PredTy PPR:$gp), (SVEDup0Undef))),		def _reg_reg_z : Pat<(Ty (Load (AddrCP GPR64:$base, GPR64:$offset), (PredTy PPR:$gp), (SVEDup0Undef))),
(RegRegInst PPR:$gp, GPR64:$base, GPR64:$offset)>;		(RegRegInst PPR:$gp, GPR64:$base, GPR64:$offset)>;
}		}
▲ Show 20 Lines • Show All 637 Lines • Show Last 20 Lines

llvm/test/CodeGen/AArch64/sve-intrinsics-reinterpret.ll

This file was added.

				; RUN: llc -mtriple=aarch64-linux-gnu -mattr=+sve < %s \| FileCheck %s

				;
				; Converting to svbool_t (<vscale x 16 x i1>)
				;

				define <vscale x 16 x i1> @reinterpret_bool_from_b(<vscale x 16 x i1> %pg) {
				; CHECK-LABEL: reinterpret_bool_from_b:
				; CHECK: ret
				%out = call <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv16i1(<vscale x 16 x i1> %pg)
				ret <vscale x 16 x i1> %out
				}

				define <vscale x 16 x i1> @reinterpret_bool_from_h(<vscale x 8 x i1> %pg) {
				; CHECK-LABEL: reinterpret_bool_from_h:
				; CHECK: ptrue p1.h
				; CHECK-NEXT: ptrue p2.b
				; CHECK-NEXT: and p0.b, p2/z, p0.b, p1.b
				; CHECK-NEXT: ret
				%out = call <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv8i1(<vscale x 8 x i1> %pg)
				ret <vscale x 16 x i1> %out
				}

				define <vscale x 16 x i1> @reinterpret_bool_from_s(<vscale x 4 x i1> %pg) {
				; CHECK-LABEL: reinterpret_bool_from_s:
				; CHECK: ptrue p1.s
				; CHECK-NEXT: ptrue p2.b
				; CHECK-NEXT: and p0.b, p2/z, p0.b, p1.b
				; CHECK-NEXT: ret
				%out = call <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv4i1(<vscale x 4 x i1> %pg)
				ret <vscale x 16 x i1> %out
				}

				define <vscale x 16 x i1> @reinterpret_bool_from_d(<vscale x 2 x i1> %pg) {
				efriedmaUnsubmitted Done Reply Inline Actions Are you sure the explicit zeroing is working correctly? It looks like reinterpret_bool_h2b and reinterpret_bool_s2b are generating the same code. efriedma: Are you sure the explicit zeroing is working correctly? It looks like reinterpret_bool_h2b and…
				; CHECK-LABEL: reinterpret_bool_from_d:
				; CHECK: ptrue p1.d
				; CHECK-NEXT: ptrue p2.b
				; CHECK-NEXT: and p0.b, p2/z, p0.b, p1.b
				; CHECK-NEXT: ret
				%out = call <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv2i1(<vscale x 2 x i1> %pg)
				ret <vscale x 16 x i1> %out
				}

				;
				sdesmalenUnsubmitted Done Reply Inline Actions nit: the naming is a bit inconsistent here, maybe rename the tests to have either: `_from_b`, `_from_h`, `_from_s`, `_from_d` and `_to_b`, `_to_h`, `_to_s`, `_to_d` instead of the `b2b`, `b2h`, `h2b`, etc. sdesmalen: nit: the naming is a bit inconsistent here, maybe rename the tests to have either: `_from_b`…
				; Converting from svbool_t
				;

				define <vscale x 16 x i1> @reinterpret_bool_to_b(<vscale x 16 x i1> %pg) {
				; CHECK-LABEL: reinterpret_bool_to_b:
				; CHECK: ret
				%out = call <vscale x 16 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv16i1(<vscale x 16 x i1> %pg)
				ret <vscale x 16 x i1> %out
				}

				define <vscale x 8 x i1> @reinterpret_bool_to_h(<vscale x 16 x i1> %pg) {
				; CHECK-LABEL: reinterpret_bool_to_h:
				; CHECK: ret
				%out = call <vscale x 8 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv8i1(<vscale x 16 x i1> %pg)
				ret <vscale x 8 x i1> %out
				}

				define <vscale x 4 x i1> @reinterpret_bool_to_s(<vscale x 16 x i1> %pg) {
				; CHECK-LABEL: reinterpret_bool_to_s:
				; CHECK: ret
				%out = call <vscale x 4 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv4i1(<vscale x 16 x i1> %pg)
				ret <vscale x 4 x i1> %out
				}

				define <vscale x 2 x i1> @reinterpret_bool_to_d(<vscale x 16 x i1> %pg) {
				; CHECK-LABEL: reinterpret_bool_to_d:
				; CHECK: ret
				%out = call <vscale x 2 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv2i1(<vscale x 16 x i1> %pg)
				ret <vscale x 2 x i1> %out
				}

				declare <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv16i1(<vscale x 16 x i1>)
				declare <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv8i1(<vscale x 8 x i1>)
				declare <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv4i1(<vscale x 4 x i1>)
				declare <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv2i1(<vscale x 2 x i1>)

				declare <vscale x 16 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv16i1(<vscale x 16 x i1>)
				declare <vscale x 8 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv8i1(<vscale x 16 x i1>)
				declare <vscale x 4 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv4i1(<vscale x 16 x i1>)
				declare <vscale x 2 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv2i1(<vscale x 16 x i1>)

This is an archive of the discontinued LLVM Phabricator instance.

[AArch64][SVE] Add predicate reinterpret intrinsics
ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 246391

llvm/include/llvm/IR/IntrinsicsAArch64.td

llvm/lib/Target/AArch64/AArch64ISelLowering.h

llvm/lib/Target/AArch64/AArch64ISelLowering.cpp

llvm/lib/Target/AArch64/AArch64SVEInstrInfo.td

llvm/test/CodeGen/AArch64/sve-intrinsics-reinterpret.ll

This is an archive of the discontinued LLVM Phabricator instance.

[AArch64][SVE] Add predicate reinterpret intrinsicsClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 246391

llvm/include/llvm/IR/IntrinsicsAArch64.td

llvm/lib/Target/AArch64/AArch64ISelLowering.h

llvm/lib/Target/AArch64/AArch64ISelLowering.cpp

llvm/lib/Target/AArch64/AArch64SVEInstrInfo.td

llvm/test/CodeGen/AArch64/sve-intrinsics-reinterpret.ll

[AArch64][SVE] Add predicate reinterpret intrinsics
ClosedPublic