Diff 414917

llvm/lib/Target/RISCV/MCTargetDesc/RISCVBaseInfo.h

	Show First 20 Lines • Show All 371 Lines • ▼ Show 20 Lines
	// Decode VLMUL into 1,2,4,8 and fractional indicator.			// Decode VLMUL into 1,2,4,8 and fractional indicator.
	std::pair<unsigned, bool> decodeVLMUL(RISCVII::VLMUL VLMUL);			std::pair<unsigned, bool> decodeVLMUL(RISCVII::VLMUL VLMUL);

	inline static unsigned decodeVSEW(unsigned VSEW) {			inline static unsigned decodeVSEW(unsigned VSEW) {
	assert(VSEW < 8 && "Unexpected VSEW value");			assert(VSEW < 8 && "Unexpected VSEW value");
	return 1 << (VSEW + 3);			return 1 << (VSEW + 3);
	}			}

				inline static unsigned encodeSEW(unsigned SEW) {
				assert(isValidSEW(SEW) && "Unexpected SEW value");
				craig.topperUnsubmitted Done Reply Inline Actions Unspected -> Unexpected craig.topper: Unspected -> Unexpected
				return Log2_32(SEW) - 3;
				}

	inline static unsigned getSEW(unsigned VType) {			inline static unsigned getSEW(unsigned VType) {
	unsigned VSEW = (VType >> 3) & 0x7;			unsigned VSEW = (VType >> 3) & 0x7;
	return decodeVSEW(VSEW);			return decodeVSEW(VSEW);
	}			}

	inline static bool isTailAgnostic(unsigned VType) { return VType & 0x40; }			inline static bool isTailAgnostic(unsigned VType) { return VType & 0x40; }

	inline static bool isMaskAgnostic(unsigned VType) { return VType & 0x80; }			inline static bool isMaskAgnostic(unsigned VType) { return VType & 0x80; }

	void printVType(unsigned VType, raw_ostream &OS);			void printVType(unsigned VType, raw_ostream &OS);

	} // namespace RISCVVType			} // namespace RISCVVType

	} // namespace llvm			} // namespace llvm

	#endif			#endif

llvm/lib/Target/RISCV/MCTargetDesc/RISCVBaseInfo.cpp

	Show First 20 Lines • Show All 125 Lines • ▼ Show 20 Lines
	// 7 \| vma \| Vector mask agnostic			// 7 \| vma \| Vector mask agnostic
	// 6 \| vta \| Vector tail agnostic			// 6 \| vta \| Vector tail agnostic
	// 5:3 \| vsew[2:0] \| Standard element width (SEW) setting			// 5:3 \| vsew[2:0] \| Standard element width (SEW) setting
	// 2:0 \| vlmul[2:0] \| Vector register group multiplier (LMUL) setting			// 2:0 \| vlmul[2:0] \| Vector register group multiplier (LMUL) setting
	unsigned RISCVVType::encodeVTYPE(RISCVII::VLMUL VLMUL, unsigned SEW,			unsigned RISCVVType::encodeVTYPE(RISCVII::VLMUL VLMUL, unsigned SEW,
	bool TailAgnostic, bool MaskAgnostic) {			bool TailAgnostic, bool MaskAgnostic) {
	assert(isValidSEW(SEW) && "Invalid SEW");			assert(isValidSEW(SEW) && "Invalid SEW");
	unsigned VLMULBits = static_cast<unsigned>(VLMUL);			unsigned VLMULBits = static_cast<unsigned>(VLMUL);
	unsigned VSEWBits = Log2_32(SEW) - 3;			unsigned VSEWBits = encodeSEW(SEW);
	unsigned VTypeI = (VSEWBits << 3) \| (VLMULBits & 0x7);			unsigned VTypeI = (VSEWBits << 3) \| (VLMULBits & 0x7);
	if (TailAgnostic)			if (TailAgnostic)
	VTypeI \|= 0x40;			VTypeI \|= 0x40;
	if (MaskAgnostic)			if (MaskAgnostic)
	VTypeI \|= 0x80;			VTypeI \|= 0x80;

	return VTypeI;			return VTypeI;
	}			}
	▲ Show 20 Lines • Show All 43 Lines • Show Last 20 Lines

llvm/lib/Target/RISCV/RISCVISelLowering.h

Show First 20 Lines • Show All 311 Lines • ▼ Show 20 Lines	enum NodeType : unsigned {
STRICT_FCVT_WU_RV64,		STRICT_FCVT_WU_RV64,

// WARNING: Do not add anything in the end unless you want the node to		// WARNING: Do not add anything in the end unless you want the node to
// have memop! In fact, starting from FIRST_TARGET_MEMORY_OPCODE all		// have memop! In fact, starting from FIRST_TARGET_MEMORY_OPCODE all
// opcodes will be thought as target memory ops!		// opcodes will be thought as target memory ops!
};		};
} // namespace RISCVISD		} // namespace RISCVISD

		namespace RISCV {
		// We use 64 bits as the known part in the scalable vector types.
		static constexpr unsigned RVVBitsPerBlock = 64;
		} // namespace RISCV

class RISCVTargetLowering : public TargetLowering {		class RISCVTargetLowering : public TargetLowering {
const RISCVSubtarget &Subtarget;		const RISCVSubtarget &Subtarget;

public:		public:
explicit RISCVTargetLowering(const TargetMachine &TM,		explicit RISCVTargetLowering(const TargetMachine &TM,
const RISCVSubtarget &STI);		const RISCVSubtarget &STI);

const RISCVSubtarget &getSubtarget() const { return Subtarget; }		const RISCVSubtarget &getSubtarget() const { return Subtarget; }
▲ Show 20 Lines • Show All 198 Lines • ▼ Show 20 Lines	public:

SDValue		SDValue
joinRegisterPartsIntoValue(SelectionDAG &DAG, const SDLoc &DL,		joinRegisterPartsIntoValue(SelectionDAG &DAG, const SDLoc &DL,
const SDValue *Parts, unsigned NumParts,		const SDValue *Parts, unsigned NumParts,
MVT PartVT, EVT ValueVT,		MVT PartVT, EVT ValueVT,
Optional<CallingConv::ID> CC) const override;		Optional<CallingConv::ID> CC) const override;

static RISCVII::VLMUL getLMUL(MVT VT);		static RISCVII::VLMUL getLMUL(MVT VT);
		inline static unsigned computeVLMAX(unsigned VectorBits, unsigned EltSize,
		unsigned MinSize) {
		// Original equation:
		// VLMAX = (VectorBits / EltSize) * LMUL
		// where LMUL = MinSize / RISCV::RVVBitsPerBlock
		// The following equations have been reordered to prevent loss of precision
		// when calculating fractional LMUL.
		return ((VectorBits / EltSize) * MinSize) / RISCV::RVVBitsPerBlock;
		};
static unsigned getRegClassIDForLMUL(RISCVII::VLMUL LMul);		static unsigned getRegClassIDForLMUL(RISCVII::VLMUL LMul);
static unsigned getSubregIndexByMVT(MVT VT, unsigned Index);		static unsigned getSubregIndexByMVT(MVT VT, unsigned Index);
static unsigned getRegClassIDForVecVT(MVT VT);		static unsigned getRegClassIDForVecVT(MVT VT);
static std::pair<unsigned, unsigned>		static std::pair<unsigned, unsigned>
decomposeSubvectorInsertExtractToSubRegs(MVT VecVT, MVT SubVecVT,		decomposeSubvectorInsertExtractToSubRegs(MVT VecVT, MVT SubVecVT,
unsigned InsertExtractIdx,		unsigned InsertExtractIdx,
const RISCVRegisterInfo *TRI);		const RISCVRegisterInfo *TRI);
MVT getContainerForFixedLengthVector(MVT VT) const;		MVT getContainerForFixedLengthVector(MVT VT) const;
▲ Show 20 Lines • Show All 124 Lines • ▼ Show 20 Lines	private:
/// Disable normalizing		/// Disable normalizing
/// select(N0&N1, X, Y) => select(N0, select(N1, X, Y), Y) and		/// select(N0&N1, X, Y) => select(N0, select(N1, X, Y), Y) and
/// select(N0\|N1, X, Y) => select(N0, select(N1, X, Y, Y))		/// select(N0\|N1, X, Y) => select(N0, select(N1, X, Y, Y))
/// RISCV doesn't have flags so it's better to perform the and/or in a GPR.		/// RISCV doesn't have flags so it's better to perform the and/or in a GPR.
bool shouldNormalizeToSelectSequence(LLVMContext &, EVT) const override {		bool shouldNormalizeToSelectSequence(LLVMContext &, EVT) const override {
return false;		return false;
};		};
};		};

namespace RISCV {
// We use 64 bits as the known part in the scalable vector types.
static constexpr unsigned RVVBitsPerBlock = 64;
} // namespace RISCV

namespace RISCVVIntrinsicsTable {		namespace RISCVVIntrinsicsTable {

struct RISCVVIntrinsicInfo {		struct RISCVVIntrinsicInfo {
unsigned IntrinsicID;		unsigned IntrinsicID;
uint8_t ScalarOperand;		uint8_t ScalarOperand;
uint8_t VLOperand;		uint8_t VLOperand;
bool hasScalarOperand() const {		bool hasScalarOperand() const {
// 0xF is not valid. See NoScalarOperand in IntrinsicsRISCV.td.		// 0xF is not valid. See NoScalarOperand in IntrinsicsRISCV.td.
Show All 18 Lines

llvm/lib/Target/RISCV/RISCVISelLowering.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 4,653 Lines • ▼ Show 20 Lines	case Intrinsic::riscv_vslide1down_mask: {
SDValue Vec = DAG.getBitcast(I32VT, Operands[2]);		SDValue Vec = DAG.getBitcast(I32VT, Operands[2]);

SDValue ScalarLo = DAG.getNode(ISD::EXTRACT_ELEMENT, DL, MVT::i32, ScalarOp,		SDValue ScalarLo = DAG.getNode(ISD::EXTRACT_ELEMENT, DL, MVT::i32, ScalarOp,
DAG.getConstant(0, DL, XLenVT));		DAG.getConstant(0, DL, XLenVT));
SDValue ScalarHi = DAG.getNode(ISD::EXTRACT_ELEMENT, DL, MVT::i32, ScalarOp,		SDValue ScalarHi = DAG.getNode(ISD::EXTRACT_ELEMENT, DL, MVT::i32, ScalarOp,
DAG.getConstant(1, DL, XLenVT));		DAG.getConstant(1, DL, XLenVT));

// Double the VL since we halved SEW.		// Double the VL since we halved SEW.
SDValue VL = getVLOperand(Op);		SDValue AVL = getVLOperand(Op);
SDValue I32VL =		SDValue I32VL;

		// Optimize for constant AVL
		if (isa<ConstantSDNode>(AVL)) {
		unsigned EltSize = VT.getScalarSizeInBits();
		unsigned MinSize = VT.getSizeInBits().getKnownMinValue();

		unsigned VectorBitsMax = Subtarget.getRealMaxVLen();
		unsigned MaxVLMAX =
		RISCVTargetLowering::computeVLMAX(VectorBitsMax, EltSize, MinSize);

		unsigned VectorBitsMin = Subtarget.getRealMinVLen();
		unsigned MinVLMAX =
		kito-chengUnsubmitted Done Reply Inline Actions `MinSize / RISCV::RVVBitsPerBlock;` is equal to LMUL and you using this equation to prevent screw up for fractional LMUL, but it's kind of hard to understand at first impression, so I would suggest you can add an util function here and use LMUL explicitly like that: RISCVII::VLMUL Lmul = RISCVTargetLowering::getLMUL(VT); unsigned MaxVLMAX = computeVLMAX(VectorBitsMax, EltSize, Lmul); And unsigned MinVLMAX = computeVLMAX(VectorBitsMin, EltSize, Lmul); it would improve readability kito-cheng: `MinSize / RISCV::RVVBitsPerBlock;` is equal to LMUL and you using this equation to prevent…
		RISCVTargetLowering::computeVLMAX(VectorBitsMin, EltSize, MinSize);
		craig.topperUnsubmitted Done Reply Inline Actions Where does 128 come from? The vector extension allows 32-bit for Zve32* and 64-bit for Zve64* craig.topper: Where does 128 come from? The vector extension allows 32-bit for Zve32* and 64-bit for Zve64*

		craig.topperUnsubmitted Done Reply Inline Actions I'm not sure I understand this math. What is 64? KnownSize can be as small as 8 so this returns 0 in that case. craig.topper: I'm not sure I understand this math. What is 64? KnownSize can be as small as 8 so this…
		uint64_t AVLInt = cast<ConstantSDNode>(AVL)->getZExtValue();
		if (AVLInt <= MinVLMAX) {
		I32VL = DAG.getConstant(2 * AVLInt, DL, XLenVT);
		} else if (AVLInt >= 2 * MaxVLMAX) {
		craig.topperUnsubmitted Done Reply Inline Actions Use cast instead of dyn_cast. dyn_cast returns null if the cast fails and that would need to be checked, but you already called `isa` earlier, so it can't fail. craig.topper: Use cast instead of dyn_cast. dyn_cast returns null if the cast fails and that would need to be…
		// Just set vl to VLMAX in this situation
		craig.topperUnsubmitted Done Reply Inline Actions AVL is a 64-bit value on RV64 so you can't use unsigned here. craig.topper: AVL is a 64-bit value on RV64 so you can't use unsigned here.
		RISCVII::VLMUL Lmul = RISCVTargetLowering::getLMUL(I32VT);
		SDValue LMUL = DAG.getConstant(Lmul, DL, XLenVT);
		unsigned Sew = RISCVVType::encodeSEW(I32VT.getScalarSizeInBits());
		craig.topperUnsubmitted Done Reply Inline Actions Use `* 2` instead of `<< 1`. craig.topper: Use `* 2` instead of `<< 1`.
		SDValue SEW = DAG.getConstant(Sew, DL, XLenVT);
		SDValue SETVLMAX = DAG.getTargetConstant(
		Intrinsic::riscv_vsetvlimax_opt, DL, MVT::i32);
		I32VL = DAG.getNode(ISD::INTRINSIC_WO_CHAIN, DL, XLenVT, SETVLMAX, SEW,
		kito-chengUnsubmitted Done Reply Inline Actions Maybe you just using vlmax (`vsetvli any_tmp_reg, x0, e32, `) here instead of `2 MaxVLMAX`? then you just need a vsetvli here. kito-cheng: Maybe you just using vlmax (`vsetvli any_tmp_reg, x0, e32, `) here instead of `2 MaxVLMAX`?
		LMUL);
		} else {
		// For AVL between (MinVLMAX, 2 * MaxVLMAX), the actual working vl
		// is related to the hardware implementation.
		// So let the following code handle
		}
		}
		if (!I32VL) {
		RISCVII::VLMUL Lmul = RISCVTargetLowering::getLMUL(VT);
		SDValue LMUL = DAG.getConstant(Lmul, DL, XLenVT);
		unsigned Sew = RISCVVType::encodeSEW(VT.getScalarSizeInBits());
		SDValue SEW = DAG.getConstant(Sew, DL, XLenVT);
		SDValue SETVL =
		DAG.getTargetConstant(Intrinsic::riscv_vsetvli_opt, DL, MVT::i32);
		// Using vsetvli instruction to get actually used length which related to
		// the hardware implementation
		SDValue VL = DAG.getNode(ISD::INTRINSIC_WO_CHAIN, DL, XLenVT, SETVL, AVL,
		SEW, LMUL);
		I32VL =
DAG.getNode(ISD::SHL, DL, XLenVT, VL, DAG.getConstant(1, DL, XLenVT));		DAG.getNode(ISD::SHL, DL, XLenVT, VL, DAG.getConstant(1, DL, XLenVT));
		}

MVT I32MaskVT = MVT::getVectorVT(MVT::i1, I32VT.getVectorElementCount());		MVT I32MaskVT = MVT::getVectorVT(MVT::i1, I32VT.getVectorElementCount());
SDValue I32Mask = DAG.getNode(RISCVISD::VMSET_VL, DL, I32MaskVT, VL);		SDValue I32Mask = DAG.getNode(RISCVISD::VMSET_VL, DL, I32MaskVT, I32VL);
		craig.topperUnsubmitted Done Reply Inline Actions This AVL should be I32VL to match the I32 type. It was wrong in the old code. It should have been scaled by 2. Since its gets pattern matched away during isel it probably doesn't really matter, but could to be logically correct. craig.topper: This AVL should be I32VL to match the I32 type. It was wrong in the old code. It should have…

// Shift the two scalar parts in using SEW=32 slide1up/slide1down		// Shift the two scalar parts in using SEW=32 slide1up/slide1down
// instructions.		// instructions.
SDValue Passthru;		SDValue Passthru;
if (IsMasked)		if (IsMasked)
Passthru = DAG.getUNDEF(I32VT);		Passthru = DAG.getUNDEF(I32VT);
else		else
Passthru = DAG.getBitcast(I32VT, Operands[1]);		Passthru = DAG.getBitcast(I32VT, Operands[1]);
Show All 23 Lines	case Intrinsic::riscv_vslide1down_mask: {
uint64_t Policy =		uint64_t Policy =
cast<ConstantSDNode>(Operands[NumOps - 1])->getZExtValue();		cast<ConstantSDNode>(Operands[NumOps - 1])->getZExtValue();
// We don't need to select maskedoff if it's undef.		// We don't need to select maskedoff if it's undef.
if (MaskedOff.isUndef())		if (MaskedOff.isUndef())
return Vec;		return Vec;
// TAMU		// TAMU
if (Policy == RISCVII::TAIL_AGNOSTIC)		if (Policy == RISCVII::TAIL_AGNOSTIC)
return DAG.getNode(RISCVISD::VSELECT_VL, DL, VT, Mask, Vec, MaskedOff,		return DAG.getNode(RISCVISD::VSELECT_VL, DL, VT, Mask, Vec, MaskedOff,
VL);		AVL);
// TUMA or TUMU: Currently we always emit tumu policy regardless of tuma.		// TUMA or TUMU: Currently we always emit tumu policy regardless of tuma.
// It's fine because vmerge does not care mask policy.		// It's fine because vmerge does not care mask policy.
return DAG.getNode(RISCVISD::VP_MERGE_VL, DL, VT, Mask, Vec, MaskedOff, VL);		return DAG.getNode(RISCVISD::VP_MERGE_VL, DL, VT, Mask, Vec, MaskedOff,
		AVL);
}		}
}		}

// We need to convert the scalar to a splat vector.		// We need to convert the scalar to a splat vector.
// FIXME: Can we implicitly truncate the scalar if it is known to		// FIXME: Can we implicitly truncate the scalar if it is known to
// be sign extended?		// be sign extended?
SDValue VL = getVLOperand(Op);		SDValue VL = getVLOperand(Op);
assert(VL.getValueType() == XLenVT);		assert(VL.getValueType() == XLenVT);
▲ Show 20 Lines • Show All 882 Lines • ▼ Show 20 Lines	SDValue RISCVTargetLowering::lowerVECTOR_REVERSE(SDValue Op,
SDLoc DL(Op);		SDLoc DL(Op);
MVT VecVT = Op.getSimpleValueType();		MVT VecVT = Op.getSimpleValueType();
unsigned EltSize = VecVT.getScalarSizeInBits();		unsigned EltSize = VecVT.getScalarSizeInBits();
unsigned MinSize = VecVT.getSizeInBits().getKnownMinValue();		unsigned MinSize = VecVT.getSizeInBits().getKnownMinValue();

unsigned MaxVLMAX = 0;		unsigned MaxVLMAX = 0;
unsigned VectorBitsMax = Subtarget.getMaxRVVVectorSizeInBits();		unsigned VectorBitsMax = Subtarget.getMaxRVVVectorSizeInBits();
if (VectorBitsMax != 0)		if (VectorBitsMax != 0)
MaxVLMAX = ((VectorBitsMax / EltSize) * MinSize) / RISCV::RVVBitsPerBlock;		MaxVLMAX =
		RISCVTargetLowering::computeVLMAX(VectorBitsMax, EltSize, MinSize);

unsigned GatherOpc = RISCVISD::VRGATHER_VV_VL;		unsigned GatherOpc = RISCVISD::VRGATHER_VV_VL;
MVT IntVT = VecVT.changeVectorElementTypeToInteger();		MVT IntVT = VecVT.changeVectorElementTypeToInteger();

// If this is SEW=8 and VLMAX is unknown or more than 256, we need		// If this is SEW=8 and VLMAX is unknown or more than 256, we need
// to use vrgatherei16.vv.		// to use vrgatherei16.vv.
// TODO: It's also possible to use vrgatherei16.vv for other types to		// TODO: It's also possible to use vrgatherei16.vv for other types to
// decrease register width for the index calculation.		// decrease register width for the index calculation.
▲ Show 20 Lines • Show All 6,020 Lines • Show Last 20 Lines

llvm/lib/Target/RISCV/RISCVSubtarget.h

Show First 20 Lines • Show All 200 Lines • ▼ Show 20 Lines	if (HasStdExtD)
return 64;		return 64;

if (HasStdExtF)		if (HasStdExtF)
return 32;		return 32;

return 0;		return 0;
}		}
unsigned getMinVLen() const { return ZvlLen; }		unsigned getMinVLen() const { return ZvlLen; }
		unsigned getMaxVLen() const { return Zvl65536b; }
		unsigned getRealMinVLen() const {
		unsigned VLen = getMinRVVVectorSizeInBits();
		return VLen == 0 ? getMinVLen() : VLen;
		}
		unsigned getRealMaxVLen() const {
		unsigned VLen = getMaxRVVVectorSizeInBits();
		return VLen == 0 ? getMaxVLen() : VLen;
		}
RISCVABI::ABI getTargetABI() const { return TargetABI; }		RISCVABI::ABI getTargetABI() const { return TargetABI; }
bool isRegisterReservedByUser(Register i) const {		bool isRegisterReservedByUser(Register i) const {
assert(i < RISCV::NUM_TARGET_REGS && "Register out of range");		assert(i < RISCV::NUM_TARGET_REGS && "Register out of range");
return UserReservedRegister[i];		return UserReservedRegister[i];
}		}

// Vector codegen related methods.		// Vector codegen related methods.
bool hasVInstructions() const { return HasStdExtZve32x; }		bool hasVInstructions() const { return HasStdExtZve32x; }
▲ Show 20 Lines • Show All 43 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/masked-vslide1down-rv32.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc -mtriple=riscv32 -mattr=+v,+f -verify-machineinstrs \			; RUN: llc -mtriple=riscv32 -mattr=+v,+f -verify-machineinstrs \
	; RUN: < %s \| FileCheck %s			; RUN: < %s \| FileCheck %s

	declare <vscale x 1 x i64> @llvm.riscv.vslide1down.mask.nxv1i64.i64(			declare <vscale x 1 x i64> @llvm.riscv.vslide1down.mask.nxv1i64.i64(
	<vscale x 1 x i64>,			<vscale x 1 x i64>,
	<vscale x 1 x i64>,			<vscale x 1 x i64>,
	i64,			i64,
	<vscale x 1 x i1>,			<vscale x 1 x i1>,
	i32,			i32,
	i32);			i32);

	define <vscale x 1 x i64> @intrinsic_vslide1down_mask_tumu_vx_nxv1i64_nxv1i64_i64(<vscale x 1 x i64> %0, <vscale x 1 x i64> %1, i64 %2, <vscale x 1 x i1> %3, i32 %4) nounwind {			define <vscale x 1 x i64> @intrinsic_vslide1down_mask_tumu_vx_nxv1i64_nxv1i64_i64(<vscale x 1 x i64> %0, <vscale x 1 x i64> %1, i64 %2, <vscale x 1 x i1> %3, i32 %4) nounwind {
	; CHECK-LABEL: intrinsic_vslide1down_mask_tumu_vx_nxv1i64_nxv1i64_i64:			; CHECK-LABEL: intrinsic_vslide1down_mask_tumu_vx_nxv1i64_nxv1i64_i64:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: slli a3, a2, 1			; CHECK-NEXT: vsetvli a3, a2, e64, m1, ta, mu
				; CHECK-NEXT: slli a3, a3, 1
	; CHECK-NEXT: vsetvli zero, a3, e32, m1, ta, mu			; CHECK-NEXT: vsetvli zero, a3, e32, m1, ta, mu
	; CHECK-NEXT: vslide1down.vx v9, v9, a0			; CHECK-NEXT: vslide1down.vx v9, v9, a0
	; CHECK-NEXT: vslide1down.vx v9, v9, a1			; CHECK-NEXT: vslide1down.vx v9, v9, a1
	; CHECK-NEXT: vsetvli zero, a2, e64, m1, tu, mu			; CHECK-NEXT: vsetvli zero, a2, e64, m1, tu, mu
	; CHECK-NEXT: vmerge.vvm v8, v8, v9, v0			; CHECK-NEXT: vmerge.vvm v8, v8, v9, v0
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	entry:			entry:
	%a = call <vscale x 1 x i64> @llvm.riscv.vslide1down.mask.nxv1i64.i64(			%a = call <vscale x 1 x i64> @llvm.riscv.vslide1down.mask.nxv1i64.i64(
	<vscale x 1 x i64> %0,			<vscale x 1 x i64> %0,
	<vscale x 1 x i64> %1,			<vscale x 1 x i64> %1,
	i64 %2,			i64 %2,
	<vscale x 1 x i1> %3,			<vscale x 1 x i1> %3,
	i32 %4, i32 0)			i32 %4, i32 0)

	ret <vscale x 1 x i64> %a			ret <vscale x 1 x i64> %a
	}			}

	define <vscale x 1 x i64> @intrinsic_vslide1down_mask_tamu_vx_nxv1i64_nxv1i64_i64(<vscale x 1 x i64> %0, <vscale x 1 x i64> %1, i64 %2, <vscale x 1 x i1> %3, i32 %4) nounwind {			define <vscale x 1 x i64> @intrinsic_vslide1down_mask_tamu_vx_nxv1i64_nxv1i64_i64(<vscale x 1 x i64> %0, <vscale x 1 x i64> %1, i64 %2, <vscale x 1 x i1> %3, i32 %4) nounwind {
	; CHECK-LABEL: intrinsic_vslide1down_mask_tamu_vx_nxv1i64_nxv1i64_i64:			; CHECK-LABEL: intrinsic_vslide1down_mask_tamu_vx_nxv1i64_nxv1i64_i64:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: slli a3, a2, 1			; CHECK-NEXT: vsetvli a3, a2, e64, m1, ta, mu
				; CHECK-NEXT: slli a3, a3, 1
	; CHECK-NEXT: vsetvli zero, a3, e32, m1, ta, mu			; CHECK-NEXT: vsetvli zero, a3, e32, m1, ta, mu
	; CHECK-NEXT: vslide1down.vx v9, v9, a0			; CHECK-NEXT: vslide1down.vx v9, v9, a0
	; CHECK-NEXT: vslide1down.vx v9, v9, a1			; CHECK-NEXT: vslide1down.vx v9, v9, a1
	; CHECK-NEXT: vsetvli zero, a2, e64, m1, ta, mu			; CHECK-NEXT: vsetvli zero, a2, e64, m1, ta, mu
	; CHECK-NEXT: vmerge.vvm v8, v8, v9, v0			; CHECK-NEXT: vmerge.vvm v8, v8, v9, v0
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	entry:			entry:
	%a = call <vscale x 1 x i64> @llvm.riscv.vslide1down.mask.nxv1i64.i64(			%a = call <vscale x 1 x i64> @llvm.riscv.vslide1down.mask.nxv1i64.i64(
	<vscale x 1 x i64> %0,			<vscale x 1 x i64> %0,
	<vscale x 1 x i64> %1,			<vscale x 1 x i64> %1,
	i64 %2,			i64 %2,
	<vscale x 1 x i1> %3,			<vscale x 1 x i1> %3,
	i32 %4, i32 1)			i32 %4, i32 1)

	ret <vscale x 1 x i64> %a			ret <vscale x 1 x i64> %a
	}			}


	; Fallback vslide1 to mask undisturbed until InsertVSETVLI supports mask agnostic.			; Fallback vslide1 to mask undisturbed until InsertVSETVLI supports mask agnostic.
	define <vscale x 1 x i64> @intrinsic_vslide1down_mask_tuma_vx_nxv1i64_nxv1i64_i64(<vscale x 1 x i64> %0, <vscale x 1 x i64> %1, i64 %2, <vscale x 1 x i1> %3, i32 %4) nounwind {			define <vscale x 1 x i64> @intrinsic_vslide1down_mask_tuma_vx_nxv1i64_nxv1i64_i64(<vscale x 1 x i64> %0, <vscale x 1 x i64> %1, i64 %2, <vscale x 1 x i1> %3, i32 %4) nounwind {
	; CHECK-LABEL: intrinsic_vslide1down_mask_tuma_vx_nxv1i64_nxv1i64_i64:			; CHECK-LABEL: intrinsic_vslide1down_mask_tuma_vx_nxv1i64_nxv1i64_i64:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: slli a3, a2, 1			; CHECK-NEXT: vsetvli a3, a2, e64, m1, ta, mu
				; CHECK-NEXT: slli a3, a3, 1
	; CHECK-NEXT: vsetvli zero, a3, e32, m1, ta, mu			; CHECK-NEXT: vsetvli zero, a3, e32, m1, ta, mu
	; CHECK-NEXT: vslide1down.vx v9, v9, a0			; CHECK-NEXT: vslide1down.vx v9, v9, a0
	; CHECK-NEXT: vslide1down.vx v9, v9, a1			; CHECK-NEXT: vslide1down.vx v9, v9, a1
	; CHECK-NEXT: vsetvli zero, a2, e64, m1, tu, mu			; CHECK-NEXT: vsetvli zero, a2, e64, m1, tu, mu
	; CHECK-NEXT: vmerge.vvm v8, v8, v9, v0			; CHECK-NEXT: vmerge.vvm v8, v8, v9, v0
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	entry:			entry:
	%a = call <vscale x 1 x i64> @llvm.riscv.vslide1down.mask.nxv1i64.i64(			%a = call <vscale x 1 x i64> @llvm.riscv.vslide1down.mask.nxv1i64.i64(
	<vscale x 1 x i64> %0,			<vscale x 1 x i64> %0,
	<vscale x 1 x i64> %1,			<vscale x 1 x i64> %1,
	i64 %2,			i64 %2,
	<vscale x 1 x i1> %3,			<vscale x 1 x i1> %3,
	i32 %4, i32 2)			i32 %4, i32 2)

	ret <vscale x 1 x i64> %a			ret <vscale x 1 x i64> %a
	}			}

	; Fallback vslide1 to mask undisturbed until InsertVSETVLI supports mask agnostic.			; Fallback vslide1 to mask undisturbed until InsertVSETVLI supports mask agnostic.
	define <vscale x 1 x i64> @intrinsic_vslide1down_mask_tama_vx_nxv1i64_nxv1i64_i64(<vscale x 1 x i64> %0, i64 %1, <vscale x 1 x i1> %2, i32 %3) nounwind {			define <vscale x 1 x i64> @intrinsic_vslide1down_mask_tama_vx_nxv1i64_nxv1i64_i64(<vscale x 1 x i64> %0, i64 %1, <vscale x 1 x i1> %2, i32 %3) nounwind {
	; CHECK-LABEL: intrinsic_vslide1down_mask_tama_vx_nxv1i64_nxv1i64_i64:			; CHECK-LABEL: intrinsic_vslide1down_mask_tama_vx_nxv1i64_nxv1i64_i64:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: vsetvli a2, a2, e64, m1, ta, mu
	; CHECK-NEXT: slli a2, a2, 1			; CHECK-NEXT: slli a2, a2, 1
	; CHECK-NEXT: vsetvli zero, a2, e32, m1, ta, mu			; CHECK-NEXT: vsetvli zero, a2, e32, m1, ta, mu
	; CHECK-NEXT: vslide1down.vx v8, v8, a0			; CHECK-NEXT: vslide1down.vx v8, v8, a0
	; CHECK-NEXT: vslide1down.vx v8, v8, a1			; CHECK-NEXT: vslide1down.vx v8, v8, a1
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	entry:			entry:
	%a = call <vscale x 1 x i64> @llvm.riscv.vslide1down.mask.nxv1i64.i64(			%a = call <vscale x 1 x i64> @llvm.riscv.vslide1down.mask.nxv1i64.i64(
	<vscale x 1 x i64> undef,			<vscale x 1 x i64> undef,
	<vscale x 1 x i64> %0,			<vscale x 1 x i64> %0,
	i64 %1,			i64 %1,
	<vscale x 1 x i1> %2,			<vscale x 1 x i1> %2,
	i32 %3, i32 3)			i32 %3, i32 3)

	ret <vscale x 1 x i64> %a			ret <vscale x 1 x i64> %a
	}			}

	define <vscale x 1 x i64> @intrinsic_vslide1down_mask_tama_undef_mask_vx_nxv1i64_nxv1i64_i64(<vscale x 1 x i64> %0, i64 %1, i32 %2) nounwind {			define <vscale x 1 x i64> @intrinsic_vslide1down_mask_tama_undef_mask_vx_nxv1i64_nxv1i64_i64(<vscale x 1 x i64> %0, i64 %1, i32 %2) nounwind {
	; CHECK-LABEL: intrinsic_vslide1down_mask_tama_undef_mask_vx_nxv1i64_nxv1i64_i64:			; CHECK-LABEL: intrinsic_vslide1down_mask_tama_undef_mask_vx_nxv1i64_nxv1i64_i64:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: vsetvli a2, a2, e64, m1, ta, mu
	; CHECK-NEXT: slli a2, a2, 1			; CHECK-NEXT: slli a2, a2, 1
	; CHECK-NEXT: vsetvli zero, a2, e32, m1, ta, mu			; CHECK-NEXT: vsetvli zero, a2, e32, m1, ta, mu
	; CHECK-NEXT: vslide1down.vx v8, v8, a0			; CHECK-NEXT: vslide1down.vx v8, v8, a0
	; CHECK-NEXT: vslide1down.vx v8, v8, a1			; CHECK-NEXT: vslide1down.vx v8, v8, a1
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	entry:			entry:
	%a = call <vscale x 1 x i64> @llvm.riscv.vslide1down.mask.nxv1i64.i64(			%a = call <vscale x 1 x i64> @llvm.riscv.vslide1down.mask.nxv1i64.i64(
	<vscale x 1 x i64> undef,			<vscale x 1 x i64> undef,
	<vscale x 1 x i64> %0,			<vscale x 1 x i64> %0,
	i64 %1,			i64 %1,
	<vscale x 1 x i1> undef,			<vscale x 1 x i1> undef,
	i32 %2, i32 3)			i32 %2, i32 3)

	ret <vscale x 1 x i64> %a			ret <vscale x 1 x i64> %a
	}			}

llvm/test/CodeGen/RISCV/rvv/unmasked-tu.ll

Show First 20 Lines • Show All 880 Lines • ▼ Show 20 Lines	declare <vscale x 1 x i64> @llvm.riscv.vslide1down.nxv1i64(
<vscale x 1 x i64>,		<vscale x 1 x i64>,
<vscale x 1 x i64>,		<vscale x 1 x i64>,
i64,		i64,
iXLen);		iXLen);

define <vscale x 1 x i64> @intrinsic_vslide1down_vx_nxv1i64_nxv1i64_i64(<vscale x 1 x i64> %0, <vscale x 1 x i64> %1, i64 %2, iXLen %3) nounwind {		define <vscale x 1 x i64> @intrinsic_vslide1down_vx_nxv1i64_nxv1i64_i64(<vscale x 1 x i64> %0, <vscale x 1 x i64> %1, i64 %2, iXLen %3) nounwind {
; RV32-LABEL: intrinsic_vslide1down_vx_nxv1i64_nxv1i64_i64:		; RV32-LABEL: intrinsic_vslide1down_vx_nxv1i64_nxv1i64_i64:
; RV32: # %bb.0: # %entry		; RV32: # %bb.0: # %entry
		; RV32-NEXT: vsetvli a2, a2, e64, m1, ta, mu
; RV32-NEXT: slli a2, a2, 1		; RV32-NEXT: slli a2, a2, 1
; RV32-NEXT: vsetvli zero, a2, e32, m1, tu, mu		; RV32-NEXT: vsetvli zero, a2, e32, m1, tu, mu
; RV32-NEXT: vmv1r.v v10, v8		; RV32-NEXT: vmv1r.v v10, v8
; RV32-NEXT: vslide1down.vx v10, v9, a0		; RV32-NEXT: vslide1down.vx v10, v9, a0
; RV32-NEXT: vslide1down.vx v8, v10, a1		; RV32-NEXT: vslide1down.vx v8, v10, a1
; RV32-NEXT: ret		; RV32-NEXT: ret
;		;
; RV64-LABEL: intrinsic_vslide1down_vx_nxv1i64_nxv1i64_i64:		; RV64-LABEL: intrinsic_vslide1down_vx_nxv1i64_nxv1i64_i64:
Show All 15 Lines	declare <vscale x 1 x i64> @llvm.riscv.vslide1up.nxv1i64.i64(
<vscale x 1 x i64>,		<vscale x 1 x i64>,
<vscale x 1 x i64>,		<vscale x 1 x i64>,
i64,		i64,
iXLen);		iXLen);

define <vscale x 1 x i64> @intrinsic_vslide1up_vx_nxv1i64_nxv1i64_i64(<vscale x 1 x i64> %0, <vscale x 1 x i64> %1, i64 %2, iXLen %3) nounwind {		define <vscale x 1 x i64> @intrinsic_vslide1up_vx_nxv1i64_nxv1i64_i64(<vscale x 1 x i64> %0, <vscale x 1 x i64> %1, i64 %2, iXLen %3) nounwind {
; RV32-LABEL: intrinsic_vslide1up_vx_nxv1i64_nxv1i64_i64:		; RV32-LABEL: intrinsic_vslide1up_vx_nxv1i64_nxv1i64_i64:
; RV32: # %bb.0: # %entry		; RV32: # %bb.0: # %entry
		; RV32-NEXT: vsetvli a2, a2, e64, m1, ta, mu
; RV32-NEXT: slli a2, a2, 1		; RV32-NEXT: slli a2, a2, 1
; RV32-NEXT: vsetvli zero, a2, e32, m1, tu, mu		; RV32-NEXT: vsetvli zero, a2, e32, m1, tu, mu
; RV32-NEXT: vmv1r.v v10, v8		; RV32-NEXT: vmv1r.v v10, v8
; RV32-NEXT: vslide1up.vx v10, v9, a1		; RV32-NEXT: vslide1up.vx v10, v9, a1
; RV32-NEXT: vslide1up.vx v8, v10, a0		; RV32-NEXT: vslide1up.vx v8, v10, a0
; RV32-NEXT: ret		; RV32-NEXT: ret
;		;
; RV64-LABEL: intrinsic_vslide1up_vx_nxv1i64_nxv1i64_i64:		; RV64-LABEL: intrinsic_vslide1up_vx_nxv1i64_nxv1i64_i64:
▲ Show 20 Lines • Show All 2,419 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/vslide1down-constant-vl-rv32.ll

This file was added.

				; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py

				; RUN: llc -mtriple=riscv32 -mattr=+v -verify-machineinstrs \
				; RUN: < %s \| FileCheck %s --check-prefixes=CHECK,CHECK-128-65536

				; RUN: llc -mtriple=riscv32 -riscv-v-vector-bits-min=512 -riscv-v-vector-bits-max=512 \
				; RUN: -mattr=+v -verify-machineinstrs \
				; RUN: < %s \| FileCheck %s --check-prefixes=CHECK,CHECK-512

				; RUN: llc -mtriple=riscv32 -riscv-v-vector-bits-min=64 -riscv-v-vector-bits-max=64 \
				; RUN: -mattr=+zve64x -verify-machineinstrs \
				; RUN: < %s \| FileCheck %s --check-prefixes=CHECK,CHECK-64

				declare <vscale x 1 x i64> @llvm.riscv.vslide1down.nxv1i64.i64(
				<vscale x 1 x i64>,
				<vscale x 1 x i64>,
				i64,
				i32)

				define <vscale x 1 x i64> @intrinsic_vslide1down_vx_nxv1i64_nxv1i64_i64_vl1(<vscale x 1 x i64> %0, i64 %1) nounwind {
				; CHECK-LABEL: intrinsic_vslide1down_vx_nxv1i64_nxv1i64_i64_vl1:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: vsetivli zero, 2, e32, m1, ta, mu
				; CHECK-NEXT: vslide1down.vx v8, v8, a0
				; CHECK-NEXT: vslide1down.vx v8, v8, a1
				; CHECK-NEXT: ret
				entry:
				%a = call <vscale x 1 x i64> @llvm.riscv.vslide1down.nxv1i64.i64(
				<vscale x 1 x i64> undef,
				<vscale x 1 x i64> %0,
				i64 %1,
				i32 1)

				ret <vscale x 1 x i64> %a
				}

				define <vscale x 1 x i64> @intrinsic_vslide1down_vx_nxv1i64_nxv1i64_i64_vl2(<vscale x 1 x i64> %0, i64 %1) nounwind {
				; CHECK-128-65536-LABEL: intrinsic_vslide1down_vx_nxv1i64_nxv1i64_i64_vl2:
				; CHECK-128-65536: # %bb.0: # %entry
				; CHECK-128-65536-NEXT: vsetivli zero, 4, e32, m1, ta, mu
				; CHECK-128-65536-NEXT: vslide1down.vx v8, v8, a0
				; CHECK-128-65536-NEXT: vslide1down.vx v8, v8, a1
				; CHECK-128-65536-NEXT: ret
				;
				; CHECK-512-LABEL: intrinsic_vslide1down_vx_nxv1i64_nxv1i64_i64_vl2:
				; CHECK-512: # %bb.0: # %entry
				; CHECK-512-NEXT: vsetivli zero, 4, e32, m1, ta, mu
				; CHECK-512-NEXT: vslide1down.vx v8, v8, a0
				; CHECK-512-NEXT: vslide1down.vx v8, v8, a1
				; CHECK-512-NEXT: ret
				;
				; CHECK-64-LABEL: intrinsic_vslide1down_vx_nxv1i64_nxv1i64_i64_vl2:
				; CHECK-64: # %bb.0: # %entry
				; CHECK-64-NEXT: vsetvli a2, zero, e32, m1, ta, mu
				; CHECK-64-NEXT: vslide1down.vx v8, v8, a0
				; CHECK-64-NEXT: vslide1down.vx v8, v8, a1
				; CHECK-64-NEXT: ret
				entry:
				%a = call <vscale x 1 x i64> @llvm.riscv.vslide1down.nxv1i64.i64(
				<vscale x 1 x i64> undef,
				<vscale x 1 x i64> %0,
				i64 %1,
				i32 2)

				ret <vscale x 1 x i64> %a
				}

				define <vscale x 1 x i64> @intrinsic_vslide1down_vx_nxv1i64_nxv1i64_i64_vl3(<vscale x 1 x i64> %0, i64 %1) nounwind {
				; CHECK-128-65536-LABEL: intrinsic_vslide1down_vx_nxv1i64_nxv1i64_i64_vl3:
				; CHECK-128-65536: # %bb.0: # %entry
				; CHECK-128-65536-NEXT: vsetivli a2, 3, e64, m1, ta, mu
				; CHECK-128-65536-NEXT: slli a2, a2, 1
				; CHECK-128-65536-NEXT: vsetvli zero, a2, e32, m1, ta, mu
				; CHECK-128-65536-NEXT: vslide1down.vx v8, v8, a0
				; CHECK-128-65536-NEXT: vslide1down.vx v8, v8, a1
				; CHECK-128-65536-NEXT: ret
				;
				; CHECK-512-LABEL: intrinsic_vslide1down_vx_nxv1i64_nxv1i64_i64_vl3:
				; CHECK-512: # %bb.0: # %entry
				; CHECK-512-NEXT: vsetivli zero, 6, e32, m1, ta, mu
				; CHECK-512-NEXT: vslide1down.vx v8, v8, a0
				; CHECK-512-NEXT: vslide1down.vx v8, v8, a1
				; CHECK-512-NEXT: ret
				;
				; CHECK-64-LABEL: intrinsic_vslide1down_vx_nxv1i64_nxv1i64_i64_vl3:
				; CHECK-64: # %bb.0: # %entry
				; CHECK-64-NEXT: vsetvli a2, zero, e32, m1, ta, mu
				; CHECK-64-NEXT: vslide1down.vx v8, v8, a0
				; CHECK-64-NEXT: vslide1down.vx v8, v8, a1
				; CHECK-64-NEXT: ret
				entry:
				%a = call <vscale x 1 x i64> @llvm.riscv.vslide1down.nxv1i64.i64(
				<vscale x 1 x i64> undef,
				<vscale x 1 x i64> %0,
				i64 %1,
				i32 3)

				ret <vscale x 1 x i64> %a
				}

				define <vscale x 1 x i64> @intrinsic_vslide1down_vx_nxv1i64_nxv1i64_i64_vl8(<vscale x 1 x i64> %0, i64 %1) nounwind {
				; CHECK-128-65536-LABEL: intrinsic_vslide1down_vx_nxv1i64_nxv1i64_i64_vl8:
				; CHECK-128-65536: # %bb.0: # %entry
				; CHECK-128-65536-NEXT: vsetivli a2, 8, e64, m1, ta, mu
				; CHECK-128-65536-NEXT: slli a2, a2, 1
				; CHECK-128-65536-NEXT: vsetvli zero, a2, e32, m1, ta, mu
				; CHECK-128-65536-NEXT: vslide1down.vx v8, v8, a0
				; CHECK-128-65536-NEXT: vslide1down.vx v8, v8, a1
				; CHECK-128-65536-NEXT: ret
				;
				; CHECK-512-LABEL: intrinsic_vslide1down_vx_nxv1i64_nxv1i64_i64_vl8:
				; CHECK-512: # %bb.0: # %entry
				; CHECK-512-NEXT: vsetivli zero, 16, e32, m1, ta, mu
				; CHECK-512-NEXT: vslide1down.vx v8, v8, a0
				; CHECK-512-NEXT: vslide1down.vx v8, v8, a1
				; CHECK-512-NEXT: ret
				;
				; CHECK-64-LABEL: intrinsic_vslide1down_vx_nxv1i64_nxv1i64_i64_vl8:
				; CHECK-64: # %bb.0: # %entry
				; CHECK-64-NEXT: vsetvli a2, zero, e32, m1, ta, mu
				; CHECK-64-NEXT: vslide1down.vx v8, v8, a0
				; CHECK-64-NEXT: vslide1down.vx v8, v8, a1
				; CHECK-64-NEXT: ret
				entry:
				%a = call <vscale x 1 x i64> @llvm.riscv.vslide1down.nxv1i64.i64(
				<vscale x 1 x i64> undef,
				<vscale x 1 x i64> %0,
				i64 %1,
				i32 8)

				ret <vscale x 1 x i64> %a
				}

				define <vscale x 1 x i64> @intrinsic_vslide1down_vx_nxv1i64_nxv1i64_i64_vl9(<vscale x 1 x i64> %0, i64 %1) nounwind {
				; CHECK-128-65536-LABEL: intrinsic_vslide1down_vx_nxv1i64_nxv1i64_i64_vl9:
				; CHECK-128-65536: # %bb.0: # %entry
				; CHECK-128-65536-NEXT: vsetivli a2, 9, e64, m1, ta, mu
				; CHECK-128-65536-NEXT: slli a2, a2, 1
				; CHECK-128-65536-NEXT: vsetvli zero, a2, e32, m1, ta, mu
				; CHECK-128-65536-NEXT: vslide1down.vx v8, v8, a0
				; CHECK-128-65536-NEXT: vslide1down.vx v8, v8, a1
				; CHECK-128-65536-NEXT: ret
				;
				; CHECK-512-LABEL: intrinsic_vslide1down_vx_nxv1i64_nxv1i64_i64_vl9:
				; CHECK-512: # %bb.0: # %entry
				; CHECK-512-NEXT: vsetivli a2, 9, e64, m1, ta, mu
				; CHECK-512-NEXT: slli a2, a2, 1
				; CHECK-512-NEXT: vsetvli zero, a2, e32, m1, ta, mu
				; CHECK-512-NEXT: vslide1down.vx v8, v8, a0
				; CHECK-512-NEXT: vslide1down.vx v8, v8, a1
				; CHECK-512-NEXT: ret
				;
				; CHECK-64-LABEL: intrinsic_vslide1down_vx_nxv1i64_nxv1i64_i64_vl9:
				; CHECK-64: # %bb.0: # %entry
				; CHECK-64-NEXT: vsetvli a2, zero, e32, m1, ta, mu
				; CHECK-64-NEXT: vslide1down.vx v8, v8, a0
				; CHECK-64-NEXT: vslide1down.vx v8, v8, a1
				; CHECK-64-NEXT: ret
				entry:
				%a = call <vscale x 1 x i64> @llvm.riscv.vslide1down.nxv1i64.i64(
				<vscale x 1 x i64> undef,
				<vscale x 1 x i64> %0,
				i64 %1,
				i32 9)

				ret <vscale x 1 x i64> %a
				}

				define <vscale x 1 x i64> @intrinsic_vslide1down_vx_nxv1i64_nxv1i64_i64_vl15(<vscale x 1 x i64> %0, i64 %1) nounwind {
				; CHECK-128-65536-LABEL: intrinsic_vslide1down_vx_nxv1i64_nxv1i64_i64_vl15:
				; CHECK-128-65536: # %bb.0: # %entry
				; CHECK-128-65536-NEXT: vsetivli a2, 15, e64, m1, ta, mu
				; CHECK-128-65536-NEXT: slli a2, a2, 1
				; CHECK-128-65536-NEXT: vsetvli zero, a2, e32, m1, ta, mu
				; CHECK-128-65536-NEXT: vslide1down.vx v8, v8, a0
				; CHECK-128-65536-NEXT: vslide1down.vx v8, v8, a1
				; CHECK-128-65536-NEXT: ret
				;
				; CHECK-512-LABEL: intrinsic_vslide1down_vx_nxv1i64_nxv1i64_i64_vl15:
				; CHECK-512: # %bb.0: # %entry
				; CHECK-512-NEXT: vsetivli a2, 15, e64, m1, ta, mu
				; CHECK-512-NEXT: slli a2, a2, 1
				; CHECK-512-NEXT: vsetvli zero, a2, e32, m1, ta, mu
				; CHECK-512-NEXT: vslide1down.vx v8, v8, a0
				; CHECK-512-NEXT: vslide1down.vx v8, v8, a1
				; CHECK-512-NEXT: ret
				;
				; CHECK-64-LABEL: intrinsic_vslide1down_vx_nxv1i64_nxv1i64_i64_vl15:
				; CHECK-64: # %bb.0: # %entry
				; CHECK-64-NEXT: vsetvli a2, zero, e32, m1, ta, mu
				; CHECK-64-NEXT: vslide1down.vx v8, v8, a0
				; CHECK-64-NEXT: vslide1down.vx v8, v8, a1
				; CHECK-64-NEXT: ret
				entry:
				%a = call <vscale x 1 x i64> @llvm.riscv.vslide1down.nxv1i64.i64(
				<vscale x 1 x i64> undef,
				<vscale x 1 x i64> %0,
				i64 %1,
				i32 15)

				ret <vscale x 1 x i64> %a
				}

				define <vscale x 1 x i64> @intrinsic_vslide1down_vx_nxv1i64_nxv1i64_i64_vl16(<vscale x 1 x i64> %0, i64 %1) nounwind {
				; CHECK-128-65536-LABEL: intrinsic_vslide1down_vx_nxv1i64_nxv1i64_i64_vl16:
				; CHECK-128-65536: # %bb.0: # %entry
				; CHECK-128-65536-NEXT: vsetivli a2, 16, e64, m1, ta, mu
				; CHECK-128-65536-NEXT: slli a2, a2, 1
				; CHECK-128-65536-NEXT: vsetvli zero, a2, e32, m1, ta, mu
				; CHECK-128-65536-NEXT: vslide1down.vx v8, v8, a0
				; CHECK-128-65536-NEXT: vslide1down.vx v8, v8, a1
				; CHECK-128-65536-NEXT: ret
				;
				; CHECK-512-LABEL: intrinsic_vslide1down_vx_nxv1i64_nxv1i64_i64_vl16:
				; CHECK-512: # %bb.0: # %entry
				; CHECK-512-NEXT: vsetvli a2, zero, e32, m1, ta, mu
				; CHECK-512-NEXT: vslide1down.vx v8, v8, a0
				; CHECK-512-NEXT: vslide1down.vx v8, v8, a1
				; CHECK-512-NEXT: ret
				;
				; CHECK-64-LABEL: intrinsic_vslide1down_vx_nxv1i64_nxv1i64_i64_vl16:
				; CHECK-64: # %bb.0: # %entry
				; CHECK-64-NEXT: vsetvli a2, zero, e32, m1, ta, mu
				; CHECK-64-NEXT: vslide1down.vx v8, v8, a0
				; CHECK-64-NEXT: vslide1down.vx v8, v8, a1
				; CHECK-64-NEXT: ret
				entry:
				%a = call <vscale x 1 x i64> @llvm.riscv.vslide1down.nxv1i64.i64(
				<vscale x 1 x i64> undef,
				<vscale x 1 x i64> %0,
				i64 %1,
				i32 16)

				ret <vscale x 1 x i64> %a
				}

				define <vscale x 1 x i64> @intrinsic_vslide1down_vx_nxv1i64_nxv1i64_i64_vl2047(<vscale x 1 x i64> %0, i64 %1) nounwind {
				; CHECK-128-65536-LABEL: intrinsic_vslide1down_vx_nxv1i64_nxv1i64_i64_vl2047:
				; CHECK-128-65536: # %bb.0: # %entry
				; CHECK-128-65536-NEXT: li a2, 2047
				; CHECK-128-65536-NEXT: vsetvli a2, a2, e64, m1, ta, mu
				; CHECK-128-65536-NEXT: slli a2, a2, 1
				; CHECK-128-65536-NEXT: vsetvli zero, a2, e32, m1, ta, mu
				; CHECK-128-65536-NEXT: vslide1down.vx v8, v8, a0
				; CHECK-128-65536-NEXT: vslide1down.vx v8, v8, a1
				; CHECK-128-65536-NEXT: ret
				;
				; CHECK-512-LABEL: intrinsic_vslide1down_vx_nxv1i64_nxv1i64_i64_vl2047:
				; CHECK-512: # %bb.0: # %entry
				; CHECK-512-NEXT: vsetvli a2, zero, e32, m1, ta, mu
				; CHECK-512-NEXT: vslide1down.vx v8, v8, a0
				; CHECK-512-NEXT: vslide1down.vx v8, v8, a1
				; CHECK-512-NEXT: ret
				;
				; CHECK-64-LABEL: intrinsic_vslide1down_vx_nxv1i64_nxv1i64_i64_vl2047:
				; CHECK-64: # %bb.0: # %entry
				; CHECK-64-NEXT: vsetvli a2, zero, e32, m1, ta, mu
				; CHECK-64-NEXT: vslide1down.vx v8, v8, a0
				; CHECK-64-NEXT: vslide1down.vx v8, v8, a1
				; CHECK-64-NEXT: ret
				entry:
				%a = call <vscale x 1 x i64> @llvm.riscv.vslide1down.nxv1i64.i64(
				<vscale x 1 x i64> undef,
				<vscale x 1 x i64> %0,
				i64 %1,
				i32 2047)

				ret <vscale x 1 x i64> %a
				}

				define <vscale x 1 x i64> @intrinsic_vslide1down_vx_nxv1i64_nxv1i64_i64_vl2048(<vscale x 1 x i64> %0, i64 %1) nounwind {
				; CHECK-LABEL: intrinsic_vslide1down_vx_nxv1i64_nxv1i64_i64_vl2048:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: vsetvli a2, zero, e32, m1, ta, mu
				; CHECK-NEXT: vslide1down.vx v8, v8, a0
				; CHECK-NEXT: vslide1down.vx v8, v8, a1
				; CHECK-NEXT: ret
				entry:
				%a = call <vscale x 1 x i64> @llvm.riscv.vslide1down.nxv1i64.i64(
				<vscale x 1 x i64> undef,
				<vscale x 1 x i64> %0,
				i64 %1,
				i32 2048)

				ret <vscale x 1 x i64> %a
				}

llvm/test/CodeGen/RISCV/rvv/vslide1down-rv32.ll

Show First 20 Lines • Show All 850 Lines • ▼ Show 20 Lines	declare <vscale x 1 x i64> @llvm.riscv.vslide1down.nxv1i64.i64(
<vscale x 1 x i64>,		<vscale x 1 x i64>,
<vscale x 1 x i64>,		<vscale x 1 x i64>,
i64,		i64,
i32);		i32);

define <vscale x 1 x i64> @intrinsic_vslide1down_vx_nxv1i64_nxv1i64_i64(<vscale x 1 x i64> %0, i64 %1, i32 %2) nounwind {		define <vscale x 1 x i64> @intrinsic_vslide1down_vx_nxv1i64_nxv1i64_i64(<vscale x 1 x i64> %0, i64 %1, i32 %2) nounwind {
; CHECK-LABEL: intrinsic_vslide1down_vx_nxv1i64_nxv1i64_i64:		; CHECK-LABEL: intrinsic_vslide1down_vx_nxv1i64_nxv1i64_i64:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
		; CHECK-NEXT: vsetvli a2, a2, e64, m1, ta, mu
; CHECK-NEXT: slli a2, a2, 1		; CHECK-NEXT: slli a2, a2, 1
; CHECK-NEXT: vsetvli zero, a2, e32, m1, ta, mu		; CHECK-NEXT: vsetvli zero, a2, e32, m1, ta, mu
; CHECK-NEXT: vslide1down.vx v8, v8, a0		; CHECK-NEXT: vslide1down.vx v8, v8, a0
; CHECK-NEXT: vslide1down.vx v8, v8, a1		; CHECK-NEXT: vslide1down.vx v8, v8, a1
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%a = call <vscale x 1 x i64> @llvm.riscv.vslide1down.nxv1i64.i64(		%a = call <vscale x 1 x i64> @llvm.riscv.vslide1down.nxv1i64.i64(
<vscale x 1 x i64> undef,		<vscale x 1 x i64> undef,
Show All 10 Lines	declare <vscale x 1 x i64> @llvm.riscv.vslide1down.mask.nxv1i64.i64(
i64,		i64,
<vscale x 1 x i1>,		<vscale x 1 x i1>,
i32,		i32,
i32);		i32);

define <vscale x 1 x i64> @intrinsic_vslide1down_mask_vx_nxv1i64_nxv1i64_i64(<vscale x 1 x i64> %0, <vscale x 1 x i64> %1, i64 %2, <vscale x 1 x i1> %3, i32 %4) nounwind {		define <vscale x 1 x i64> @intrinsic_vslide1down_mask_vx_nxv1i64_nxv1i64_i64(<vscale x 1 x i64> %0, <vscale x 1 x i64> %1, i64 %2, <vscale x 1 x i1> %3, i32 %4) nounwind {
; CHECK-LABEL: intrinsic_vslide1down_mask_vx_nxv1i64_nxv1i64_i64:		; CHECK-LABEL: intrinsic_vslide1down_mask_vx_nxv1i64_nxv1i64_i64:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: slli a3, a2, 1		; CHECK-NEXT: vsetvli a3, a2, e64, m1, ta, mu
		; CHECK-NEXT: slli a3, a3, 1
; CHECK-NEXT: vsetvli zero, a3, e32, m1, ta, mu		; CHECK-NEXT: vsetvli zero, a3, e32, m1, ta, mu
; CHECK-NEXT: vslide1down.vx v9, v9, a0		; CHECK-NEXT: vslide1down.vx v9, v9, a0
; CHECK-NEXT: vslide1down.vx v9, v9, a1		; CHECK-NEXT: vslide1down.vx v9, v9, a1
; CHECK-NEXT: vsetvli zero, a2, e64, m1, ta, mu		; CHECK-NEXT: vsetvli zero, a2, e64, m1, ta, mu
; CHECK-NEXT: vmerge.vvm v8, v8, v9, v0		; CHECK-NEXT: vmerge.vvm v8, v8, v9, v0
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%a = call <vscale x 1 x i64> @llvm.riscv.vslide1down.mask.nxv1i64.i64(		%a = call <vscale x 1 x i64> @llvm.riscv.vslide1down.mask.nxv1i64.i64(
Show All 10 Lines	declare <vscale x 2 x i64> @llvm.riscv.vslide1down.nxv2i64.i64(
<vscale x 2 x i64>,		<vscale x 2 x i64>,
<vscale x 2 x i64>,		<vscale x 2 x i64>,
i64,		i64,
i32);		i32);

define <vscale x 2 x i64> @intrinsic_vslide1down_vx_nxv2i64_nxv2i64_i64(<vscale x 2 x i64> %0, i64 %1, i32 %2) nounwind {		define <vscale x 2 x i64> @intrinsic_vslide1down_vx_nxv2i64_nxv2i64_i64(<vscale x 2 x i64> %0, i64 %1, i32 %2) nounwind {
; CHECK-LABEL: intrinsic_vslide1down_vx_nxv2i64_nxv2i64_i64:		; CHECK-LABEL: intrinsic_vslide1down_vx_nxv2i64_nxv2i64_i64:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
		; CHECK-NEXT: vsetvli a2, a2, e64, m2, ta, mu
; CHECK-NEXT: slli a2, a2, 1		; CHECK-NEXT: slli a2, a2, 1
; CHECK-NEXT: vsetvli zero, a2, e32, m2, ta, mu		; CHECK-NEXT: vsetvli zero, a2, e32, m2, ta, mu
; CHECK-NEXT: vslide1down.vx v8, v8, a0		; CHECK-NEXT: vslide1down.vx v8, v8, a0
; CHECK-NEXT: vslide1down.vx v8, v8, a1		; CHECK-NEXT: vslide1down.vx v8, v8, a1
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%a = call <vscale x 2 x i64> @llvm.riscv.vslide1down.nxv2i64.i64(		%a = call <vscale x 2 x i64> @llvm.riscv.vslide1down.nxv2i64.i64(
<vscale x 2 x i64> undef,		<vscale x 2 x i64> undef,
Show All 10 Lines	declare <vscale x 2 x i64> @llvm.riscv.vslide1down.mask.nxv2i64.i64(
i64,		i64,
<vscale x 2 x i1>,		<vscale x 2 x i1>,
i32,		i32,
i32);		i32);

define <vscale x 2 x i64> @intrinsic_vslide1down_mask_vx_nxv2i64_nxv2i64_i64(<vscale x 2 x i64> %0, <vscale x 2 x i64> %1, i64 %2, <vscale x 2 x i1> %3, i32 %4) nounwind {		define <vscale x 2 x i64> @intrinsic_vslide1down_mask_vx_nxv2i64_nxv2i64_i64(<vscale x 2 x i64> %0, <vscale x 2 x i64> %1, i64 %2, <vscale x 2 x i1> %3, i32 %4) nounwind {
; CHECK-LABEL: intrinsic_vslide1down_mask_vx_nxv2i64_nxv2i64_i64:		; CHECK-LABEL: intrinsic_vslide1down_mask_vx_nxv2i64_nxv2i64_i64:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: slli a3, a2, 1		; CHECK-NEXT: vsetvli a3, a2, e64, m2, ta, mu
		; CHECK-NEXT: slli a3, a3, 1
; CHECK-NEXT: vsetvli zero, a3, e32, m2, ta, mu		; CHECK-NEXT: vsetvli zero, a3, e32, m2, ta, mu
; CHECK-NEXT: vslide1down.vx v10, v10, a0		; CHECK-NEXT: vslide1down.vx v10, v10, a0
; CHECK-NEXT: vslide1down.vx v10, v10, a1		; CHECK-NEXT: vslide1down.vx v10, v10, a1
; CHECK-NEXT: vsetvli zero, a2, e64, m2, ta, mu		; CHECK-NEXT: vsetvli zero, a2, e64, m2, ta, mu
; CHECK-NEXT: vmerge.vvm v8, v8, v10, v0		; CHECK-NEXT: vmerge.vvm v8, v8, v10, v0
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%a = call <vscale x 2 x i64> @llvm.riscv.vslide1down.mask.nxv2i64.i64(		%a = call <vscale x 2 x i64> @llvm.riscv.vslide1down.mask.nxv2i64.i64(
Show All 10 Lines	declare <vscale x 4 x i64> @llvm.riscv.vslide1down.nxv4i64.i64(
<vscale x 4 x i64>,		<vscale x 4 x i64>,
<vscale x 4 x i64>,		<vscale x 4 x i64>,
i64,		i64,
i32);		i32);

define <vscale x 4 x i64> @intrinsic_vslide1down_vx_nxv4i64_nxv4i64_i64(<vscale x 4 x i64> %0, i64 %1, i32 %2) nounwind {		define <vscale x 4 x i64> @intrinsic_vslide1down_vx_nxv4i64_nxv4i64_i64(<vscale x 4 x i64> %0, i64 %1, i32 %2) nounwind {
; CHECK-LABEL: intrinsic_vslide1down_vx_nxv4i64_nxv4i64_i64:		; CHECK-LABEL: intrinsic_vslide1down_vx_nxv4i64_nxv4i64_i64:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
		; CHECK-NEXT: vsetvli a2, a2, e64, m4, ta, mu
; CHECK-NEXT: slli a2, a2, 1		; CHECK-NEXT: slli a2, a2, 1
; CHECK-NEXT: vsetvli zero, a2, e32, m4, ta, mu		; CHECK-NEXT: vsetvli zero, a2, e32, m4, ta, mu
; CHECK-NEXT: vslide1down.vx v8, v8, a0		; CHECK-NEXT: vslide1down.vx v8, v8, a0
; CHECK-NEXT: vslide1down.vx v8, v8, a1		; CHECK-NEXT: vslide1down.vx v8, v8, a1
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%a = call <vscale x 4 x i64> @llvm.riscv.vslide1down.nxv4i64.i64(		%a = call <vscale x 4 x i64> @llvm.riscv.vslide1down.nxv4i64.i64(
<vscale x 4 x i64> undef,		<vscale x 4 x i64> undef,
Show All 10 Lines	declare <vscale x 4 x i64> @llvm.riscv.vslide1down.mask.nxv4i64.i64(
i64,		i64,
<vscale x 4 x i1>,		<vscale x 4 x i1>,
i32,		i32,
i32);		i32);

define <vscale x 4 x i64> @intrinsic_vslide1down_mask_vx_nxv4i64_nxv4i64_i64(<vscale x 4 x i64> %0, <vscale x 4 x i64> %1, i64 %2, <vscale x 4 x i1> %3, i32 %4) nounwind {		define <vscale x 4 x i64> @intrinsic_vslide1down_mask_vx_nxv4i64_nxv4i64_i64(<vscale x 4 x i64> %0, <vscale x 4 x i64> %1, i64 %2, <vscale x 4 x i1> %3, i32 %4) nounwind {
; CHECK-LABEL: intrinsic_vslide1down_mask_vx_nxv4i64_nxv4i64_i64:		; CHECK-LABEL: intrinsic_vslide1down_mask_vx_nxv4i64_nxv4i64_i64:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: slli a3, a2, 1		; CHECK-NEXT: vsetvli a3, a2, e64, m4, ta, mu
		; CHECK-NEXT: slli a3, a3, 1
; CHECK-NEXT: vsetvli zero, a3, e32, m4, ta, mu		; CHECK-NEXT: vsetvli zero, a3, e32, m4, ta, mu
; CHECK-NEXT: vslide1down.vx v12, v12, a0		; CHECK-NEXT: vslide1down.vx v12, v12, a0
; CHECK-NEXT: vslide1down.vx v12, v12, a1		; CHECK-NEXT: vslide1down.vx v12, v12, a1
; CHECK-NEXT: vsetvli zero, a2, e64, m4, ta, mu		; CHECK-NEXT: vsetvli zero, a2, e64, m4, ta, mu
; CHECK-NEXT: vmerge.vvm v8, v8, v12, v0		; CHECK-NEXT: vmerge.vvm v8, v8, v12, v0
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%a = call <vscale x 4 x i64> @llvm.riscv.vslide1down.mask.nxv4i64.i64(		%a = call <vscale x 4 x i64> @llvm.riscv.vslide1down.mask.nxv4i64.i64(
Show All 10 Lines	declare <vscale x 8 x i64> @llvm.riscv.vslide1down.nxv8i64.i64(
<vscale x 8 x i64>,		<vscale x 8 x i64>,
<vscale x 8 x i64>,		<vscale x 8 x i64>,
i64,		i64,
i32);		i32);

define <vscale x 8 x i64> @intrinsic_vslide1down_vx_nxv8i64_nxv8i64_i64(<vscale x 8 x i64> %0, i64 %1, i32 %2) nounwind {		define <vscale x 8 x i64> @intrinsic_vslide1down_vx_nxv8i64_nxv8i64_i64(<vscale x 8 x i64> %0, i64 %1, i32 %2) nounwind {
; CHECK-LABEL: intrinsic_vslide1down_vx_nxv8i64_nxv8i64_i64:		; CHECK-LABEL: intrinsic_vslide1down_vx_nxv8i64_nxv8i64_i64:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
		; CHECK-NEXT: vsetvli a2, a2, e64, m8, ta, mu
; CHECK-NEXT: slli a2, a2, 1		; CHECK-NEXT: slli a2, a2, 1
; CHECK-NEXT: vsetvli zero, a2, e32, m8, ta, mu		; CHECK-NEXT: vsetvli zero, a2, e32, m8, ta, mu
; CHECK-NEXT: vslide1down.vx v8, v8, a0		; CHECK-NEXT: vslide1down.vx v8, v8, a0
; CHECK-NEXT: vslide1down.vx v8, v8, a1		; CHECK-NEXT: vslide1down.vx v8, v8, a1
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%a = call <vscale x 8 x i64> @llvm.riscv.vslide1down.nxv8i64.i64(		%a = call <vscale x 8 x i64> @llvm.riscv.vslide1down.nxv8i64.i64(
<vscale x 8 x i64> undef,		<vscale x 8 x i64> undef,
Show All 10 Lines	declare <vscale x 8 x i64> @llvm.riscv.vslide1down.mask.nxv8i64.i64(
i64,		i64,
<vscale x 8 x i1>,		<vscale x 8 x i1>,
i32,		i32,
i32);		i32);

define <vscale x 8 x i64> @intrinsic_vslide1down_mask_vx_nxv8i64_nxv8i64_i64(<vscale x 8 x i64> %0, <vscale x 8 x i64> %1, i64 %2, <vscale x 8 x i1> %3, i32 %4) nounwind {		define <vscale x 8 x i64> @intrinsic_vslide1down_mask_vx_nxv8i64_nxv8i64_i64(<vscale x 8 x i64> %0, <vscale x 8 x i64> %1, i64 %2, <vscale x 8 x i1> %3, i32 %4) nounwind {
; CHECK-LABEL: intrinsic_vslide1down_mask_vx_nxv8i64_nxv8i64_i64:		; CHECK-LABEL: intrinsic_vslide1down_mask_vx_nxv8i64_nxv8i64_i64:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: slli a3, a2, 1		; CHECK-NEXT: vsetvli a3, a2, e64, m8, ta, mu
		; CHECK-NEXT: slli a3, a3, 1
; CHECK-NEXT: vsetvli zero, a3, e32, m8, ta, mu		; CHECK-NEXT: vsetvli zero, a3, e32, m8, ta, mu
; CHECK-NEXT: vslide1down.vx v16, v16, a0		; CHECK-NEXT: vslide1down.vx v16, v16, a0
; CHECK-NEXT: vslide1down.vx v16, v16, a1		; CHECK-NEXT: vslide1down.vx v16, v16, a1
; CHECK-NEXT: vsetvli zero, a2, e64, m8, ta, mu		; CHECK-NEXT: vsetvli zero, a2, e64, m8, ta, mu
; CHECK-NEXT: vmerge.vvm v8, v8, v16, v0		; CHECK-NEXT: vmerge.vvm v8, v8, v16, v0
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%a = call <vscale x 8 x i64> @llvm.riscv.vslide1down.mask.nxv8i64.i64(		%a = call <vscale x 8 x i64> @llvm.riscv.vslide1down.mask.nxv8i64.i64(
<vscale x 8 x i64> %0,		<vscale x 8 x i64> %0,
<vscale x 8 x i64> %1,		<vscale x 8 x i64> %1,
i64 %2,		i64 %2,
<vscale x 8 x i1> %3,		<vscale x 8 x i1> %3,
i32 %4, i32 1)		i32 %4, i32 1)

ret <vscale x 8 x i64> %a		ret <vscale x 8 x i64> %a
}		}

llvm/test/CodeGen/RISCV/rvv/vslide1up-constant-vl-rv32.ll

This file was added.

				; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py

				; RUN: llc -mtriple=riscv32 -mattr=+v -verify-machineinstrs \
				; RUN: < %s \| FileCheck %s --check-prefixes=CHECK,CHECK-128-65536

				; RUN: llc -mtriple=riscv32 -riscv-v-vector-bits-min=512 -riscv-v-vector-bits-max=512 \
				; RUN: -mattr=+v -verify-machineinstrs \
				; RUN: < %s \| FileCheck %s --check-prefixes=CHECK,CHECK-512

				; RUN: llc -mtriple=riscv32 -riscv-v-vector-bits-min=64 -riscv-v-vector-bits-max=64 \
				; RUN: -mattr=+zve64x -verify-machineinstrs \
				; RUN: < %s \| FileCheck %s --check-prefixes=CHECK,CHECK-64

				declare <vscale x 1 x i64> @llvm.riscv.vslide1up.nxv1i64.i64(
				<vscale x 1 x i64>,
				<vscale x 1 x i64>,
				i64,
				i32)

				define <vscale x 1 x i64> @intrinsic_vslide1up_vx_nxv1i64_nxv1i64_i64_vl1(<vscale x 1 x i64> %0, i64 %1) nounwind {
				; CHECK-LABEL: intrinsic_vslide1up_vx_nxv1i64_nxv1i64_i64_vl1:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: vsetivli zero, 2, e32, m1, ta, mu
				; CHECK-NEXT: vslide1up.vx v9, v8, a1
				; CHECK-NEXT: vslide1up.vx v8, v9, a0
				; CHECK-NEXT: ret
				entry:
				%a = call <vscale x 1 x i64> @llvm.riscv.vslide1up.nxv1i64.i64(
				<vscale x 1 x i64> undef,
				<vscale x 1 x i64> %0,
				i64 %1,
				i32 1)

				ret <vscale x 1 x i64> %a
				}

				define <vscale x 1 x i64> @intrinsic_vslide1up_vx_nxv1i64_nxv1i64_i64_vl2(<vscale x 1 x i64> %0, i64 %1) nounwind {
				; CHECK-128-65536-LABEL: intrinsic_vslide1up_vx_nxv1i64_nxv1i64_i64_vl2:
				; CHECK-128-65536: # %bb.0: # %entry
				; CHECK-128-65536-NEXT: vsetivli zero, 4, e32, m1, ta, mu
				; CHECK-128-65536-NEXT: vslide1up.vx v9, v8, a1
				; CHECK-128-65536-NEXT: vslide1up.vx v8, v9, a0
				; CHECK-128-65536-NEXT: ret
				;
				; CHECK-512-LABEL: intrinsic_vslide1up_vx_nxv1i64_nxv1i64_i64_vl2:
				; CHECK-512: # %bb.0: # %entry
				; CHECK-512-NEXT: vsetivli zero, 4, e32, m1, ta, mu
				; CHECK-512-NEXT: vslide1up.vx v9, v8, a1
				; CHECK-512-NEXT: vslide1up.vx v8, v9, a0
				; CHECK-512-NEXT: ret
				;
				; CHECK-64-LABEL: intrinsic_vslide1up_vx_nxv1i64_nxv1i64_i64_vl2:
				; CHECK-64: # %bb.0: # %entry
				; CHECK-64-NEXT: vsetvli a2, zero, e32, m1, ta, mu
				; CHECK-64-NEXT: vslide1up.vx v9, v8, a1
				; CHECK-64-NEXT: vslide1up.vx v8, v9, a0
				; CHECK-64-NEXT: ret
				entry:
				%a = call <vscale x 1 x i64> @llvm.riscv.vslide1up.nxv1i64.i64(
				<vscale x 1 x i64> undef,
				<vscale x 1 x i64> %0,
				i64 %1,
				i32 2)

				ret <vscale x 1 x i64> %a
				}

				define <vscale x 1 x i64> @intrinsic_vslide1up_vx_nxv1i64_nxv1i64_i64_vl3(<vscale x 1 x i64> %0, i64 %1) nounwind {
				; CHECK-128-65536-LABEL: intrinsic_vslide1up_vx_nxv1i64_nxv1i64_i64_vl3:
				; CHECK-128-65536: # %bb.0: # %entry
				; CHECK-128-65536-NEXT: vsetivli a2, 3, e64, m1, ta, mu
				; CHECK-128-65536-NEXT: slli a2, a2, 1
				; CHECK-128-65536-NEXT: vsetvli zero, a2, e32, m1, ta, mu
				; CHECK-128-65536-NEXT: vslide1up.vx v9, v8, a1
				; CHECK-128-65536-NEXT: vslide1up.vx v8, v9, a0
				; CHECK-128-65536-NEXT: ret
				;
				; CHECK-512-LABEL: intrinsic_vslide1up_vx_nxv1i64_nxv1i64_i64_vl3:
				; CHECK-512: # %bb.0: # %entry
				; CHECK-512-NEXT: vsetivli zero, 6, e32, m1, ta, mu
				; CHECK-512-NEXT: vslide1up.vx v9, v8, a1
				; CHECK-512-NEXT: vslide1up.vx v8, v9, a0
				; CHECK-512-NEXT: ret
				;
				; CHECK-64-LABEL: intrinsic_vslide1up_vx_nxv1i64_nxv1i64_i64_vl3:
				; CHECK-64: # %bb.0: # %entry
				; CHECK-64-NEXT: vsetvli a2, zero, e32, m1, ta, mu
				; CHECK-64-NEXT: vslide1up.vx v9, v8, a1
				; CHECK-64-NEXT: vslide1up.vx v8, v9, a0
				; CHECK-64-NEXT: ret
				entry:
				%a = call <vscale x 1 x i64> @llvm.riscv.vslide1up.nxv1i64.i64(
				<vscale x 1 x i64> undef,
				<vscale x 1 x i64> %0,
				i64 %1,
				i32 3)

				ret <vscale x 1 x i64> %a
				}

				define <vscale x 1 x i64> @intrinsic_vslide1up_vx_nxv1i64_nxv1i64_i64_vl8(<vscale x 1 x i64> %0, i64 %1) nounwind {
				; CHECK-128-65536-LABEL: intrinsic_vslide1up_vx_nxv1i64_nxv1i64_i64_vl8:
				; CHECK-128-65536: # %bb.0: # %entry
				; CHECK-128-65536-NEXT: vsetivli a2, 8, e64, m1, ta, mu
				; CHECK-128-65536-NEXT: slli a2, a2, 1
				; CHECK-128-65536-NEXT: vsetvli zero, a2, e32, m1, ta, mu
				; CHECK-128-65536-NEXT: vslide1up.vx v9, v8, a1
				; CHECK-128-65536-NEXT: vslide1up.vx v8, v9, a0
				; CHECK-128-65536-NEXT: ret
				;
				; CHECK-512-LABEL: intrinsic_vslide1up_vx_nxv1i64_nxv1i64_i64_vl8:
				; CHECK-512: # %bb.0: # %entry
				; CHECK-512-NEXT: vsetivli zero, 16, e32, m1, ta, mu
				; CHECK-512-NEXT: vslide1up.vx v9, v8, a1
				; CHECK-512-NEXT: vslide1up.vx v8, v9, a0
				; CHECK-512-NEXT: ret
				;
				; CHECK-64-LABEL: intrinsic_vslide1up_vx_nxv1i64_nxv1i64_i64_vl8:
				; CHECK-64: # %bb.0: # %entry
				; CHECK-64-NEXT: vsetvli a2, zero, e32, m1, ta, mu
				; CHECK-64-NEXT: vslide1up.vx v9, v8, a1
				; CHECK-64-NEXT: vslide1up.vx v8, v9, a0
				; CHECK-64-NEXT: ret
				entry:
				%a = call <vscale x 1 x i64> @llvm.riscv.vslide1up.nxv1i64.i64(
				<vscale x 1 x i64> undef,
				<vscale x 1 x i64> %0,
				i64 %1,
				i32 8)

				ret <vscale x 1 x i64> %a
				}

				define <vscale x 1 x i64> @intrinsic_vslide1up_vx_nxv1i64_nxv1i64_i64_vl9(<vscale x 1 x i64> %0, i64 %1) nounwind {
				; CHECK-128-65536-LABEL: intrinsic_vslide1up_vx_nxv1i64_nxv1i64_i64_vl9:
				; CHECK-128-65536: # %bb.0: # %entry
				; CHECK-128-65536-NEXT: vsetivli a2, 9, e64, m1, ta, mu
				; CHECK-128-65536-NEXT: slli a2, a2, 1
				; CHECK-128-65536-NEXT: vsetvli zero, a2, e32, m1, ta, mu
				; CHECK-128-65536-NEXT: vslide1up.vx v9, v8, a1
				; CHECK-128-65536-NEXT: vslide1up.vx v8, v9, a0
				; CHECK-128-65536-NEXT: ret
				;
				; CHECK-512-LABEL: intrinsic_vslide1up_vx_nxv1i64_nxv1i64_i64_vl9:
				; CHECK-512: # %bb.0: # %entry
				; CHECK-512-NEXT: vsetivli a2, 9, e64, m1, ta, mu
				; CHECK-512-NEXT: slli a2, a2, 1
				; CHECK-512-NEXT: vsetvli zero, a2, e32, m1, ta, mu
				; CHECK-512-NEXT: vslide1up.vx v9, v8, a1
				; CHECK-512-NEXT: vslide1up.vx v8, v9, a0
				; CHECK-512-NEXT: ret
				;
				; CHECK-64-LABEL: intrinsic_vslide1up_vx_nxv1i64_nxv1i64_i64_vl9:
				; CHECK-64: # %bb.0: # %entry
				; CHECK-64-NEXT: vsetvli a2, zero, e32, m1, ta, mu
				; CHECK-64-NEXT: vslide1up.vx v9, v8, a1
				; CHECK-64-NEXT: vslide1up.vx v8, v9, a0
				; CHECK-64-NEXT: ret
				entry:
				%a = call <vscale x 1 x i64> @llvm.riscv.vslide1up.nxv1i64.i64(
				<vscale x 1 x i64> undef,
				<vscale x 1 x i64> %0,
				i64 %1,
				i32 9)

				ret <vscale x 1 x i64> %a
				}

				define <vscale x 1 x i64> @intrinsic_vslide1up_vx_nxv1i64_nxv1i64_i64_vl15(<vscale x 1 x i64> %0, i64 %1) nounwind {
				; CHECK-128-65536-LABEL: intrinsic_vslide1up_vx_nxv1i64_nxv1i64_i64_vl15:
				; CHECK-128-65536: # %bb.0: # %entry
				; CHECK-128-65536-NEXT: vsetivli a2, 15, e64, m1, ta, mu
				; CHECK-128-65536-NEXT: slli a2, a2, 1
				; CHECK-128-65536-NEXT: vsetvli zero, a2, e32, m1, ta, mu
				; CHECK-128-65536-NEXT: vslide1up.vx v9, v8, a1
				; CHECK-128-65536-NEXT: vslide1up.vx v8, v9, a0
				; CHECK-128-65536-NEXT: ret
				;
				; CHECK-512-LABEL: intrinsic_vslide1up_vx_nxv1i64_nxv1i64_i64_vl15:
				; CHECK-512: # %bb.0: # %entry
				; CHECK-512-NEXT: vsetivli a2, 15, e64, m1, ta, mu
				; CHECK-512-NEXT: slli a2, a2, 1
				; CHECK-512-NEXT: vsetvli zero, a2, e32, m1, ta, mu
				; CHECK-512-NEXT: vslide1up.vx v9, v8, a1
				; CHECK-512-NEXT: vslide1up.vx v8, v9, a0
				; CHECK-512-NEXT: ret
				;
				; CHECK-64-LABEL: intrinsic_vslide1up_vx_nxv1i64_nxv1i64_i64_vl15:
				; CHECK-64: # %bb.0: # %entry
				; CHECK-64-NEXT: vsetvli a2, zero, e32, m1, ta, mu
				; CHECK-64-NEXT: vslide1up.vx v9, v8, a1
				; CHECK-64-NEXT: vslide1up.vx v8, v9, a0
				; CHECK-64-NEXT: ret
				entry:
				%a = call <vscale x 1 x i64> @llvm.riscv.vslide1up.nxv1i64.i64(
				<vscale x 1 x i64> undef,
				<vscale x 1 x i64> %0,
				i64 %1,
				i32 15)

				ret <vscale x 1 x i64> %a
				}

				define <vscale x 1 x i64> @intrinsic_vslide1up_vx_nxv1i64_nxv1i64_i64_vl16(<vscale x 1 x i64> %0, i64 %1) nounwind {
				; CHECK-128-65536-LABEL: intrinsic_vslide1up_vx_nxv1i64_nxv1i64_i64_vl16:
				; CHECK-128-65536: # %bb.0: # %entry
				; CHECK-128-65536-NEXT: vsetivli a2, 16, e64, m1, ta, mu
				; CHECK-128-65536-NEXT: slli a2, a2, 1
				; CHECK-128-65536-NEXT: vsetvli zero, a2, e32, m1, ta, mu
				; CHECK-128-65536-NEXT: vslide1up.vx v9, v8, a1
				; CHECK-128-65536-NEXT: vslide1up.vx v8, v9, a0
				; CHECK-128-65536-NEXT: ret
				;
				; CHECK-512-LABEL: intrinsic_vslide1up_vx_nxv1i64_nxv1i64_i64_vl16:
				; CHECK-512: # %bb.0: # %entry
				; CHECK-512-NEXT: vsetvli a2, zero, e32, m1, ta, mu
				; CHECK-512-NEXT: vslide1up.vx v9, v8, a1
				; CHECK-512-NEXT: vslide1up.vx v8, v9, a0
				; CHECK-512-NEXT: ret
				;
				; CHECK-64-LABEL: intrinsic_vslide1up_vx_nxv1i64_nxv1i64_i64_vl16:
				; CHECK-64: # %bb.0: # %entry
				; CHECK-64-NEXT: vsetvli a2, zero, e32, m1, ta, mu
				; CHECK-64-NEXT: vslide1up.vx v9, v8, a1
				; CHECK-64-NEXT: vslide1up.vx v8, v9, a0
				; CHECK-64-NEXT: ret
				entry:
				%a = call <vscale x 1 x i64> @llvm.riscv.vslide1up.nxv1i64.i64(
				<vscale x 1 x i64> undef,
				<vscale x 1 x i64> %0,
				i64 %1,
				i32 16)

				ret <vscale x 1 x i64> %a
				}

				define <vscale x 1 x i64> @intrinsic_vslide1up_vx_nxv1i64_nxv1i64_i64_vl2047(<vscale x 1 x i64> %0, i64 %1) nounwind {
				; CHECK-128-65536-LABEL: intrinsic_vslide1up_vx_nxv1i64_nxv1i64_i64_vl2047:
				; CHECK-128-65536: # %bb.0: # %entry
				; CHECK-128-65536-NEXT: li a2, 2047
				; CHECK-128-65536-NEXT: vsetvli a2, a2, e64, m1, ta, mu
				; CHECK-128-65536-NEXT: slli a2, a2, 1
				; CHECK-128-65536-NEXT: vsetvli zero, a2, e32, m1, ta, mu
				; CHECK-128-65536-NEXT: vslide1up.vx v9, v8, a1
				; CHECK-128-65536-NEXT: vslide1up.vx v8, v9, a0
				; CHECK-128-65536-NEXT: ret
				;
				; CHECK-512-LABEL: intrinsic_vslide1up_vx_nxv1i64_nxv1i64_i64_vl2047:
				; CHECK-512: # %bb.0: # %entry
				; CHECK-512-NEXT: vsetvli a2, zero, e32, m1, ta, mu
				; CHECK-512-NEXT: vslide1up.vx v9, v8, a1
				; CHECK-512-NEXT: vslide1up.vx v8, v9, a0
				; CHECK-512-NEXT: ret
				;
				; CHECK-64-LABEL: intrinsic_vslide1up_vx_nxv1i64_nxv1i64_i64_vl2047:
				; CHECK-64: # %bb.0: # %entry
				; CHECK-64-NEXT: vsetvli a2, zero, e32, m1, ta, mu
				; CHECK-64-NEXT: vslide1up.vx v9, v8, a1
				; CHECK-64-NEXT: vslide1up.vx v8, v9, a0
				; CHECK-64-NEXT: ret
				entry:
				%a = call <vscale x 1 x i64> @llvm.riscv.vslide1up.nxv1i64.i64(
				<vscale x 1 x i64> undef,
				<vscale x 1 x i64> %0,
				i64 %1,
				i32 2047)

				ret <vscale x 1 x i64> %a
				}

				define <vscale x 1 x i64> @intrinsic_vslide1up_vx_nxv1i64_nxv1i64_i64_vl2048(<vscale x 1 x i64> %0, i64 %1) nounwind {
				; CHECK-LABEL: intrinsic_vslide1up_vx_nxv1i64_nxv1i64_i64_vl2048:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: vsetvli a2, zero, e32, m1, ta, mu
				; CHECK-NEXT: vslide1up.vx v9, v8, a1
				; CHECK-NEXT: vslide1up.vx v8, v9, a0
				; CHECK-NEXT: ret
				entry:
				%a = call <vscale x 1 x i64> @llvm.riscv.vslide1up.nxv1i64.i64(
				<vscale x 1 x i64> undef,
				<vscale x 1 x i64> %0,
				i64 %1,
				i32 2048)

				ret <vscale x 1 x i64> %a
				}

llvm/test/CodeGen/RISCV/rvv/vslide1up-rv32.ll

Show First 20 Lines • Show All 868 Lines • ▼ Show 20 Lines	declare <vscale x 1 x i64> @llvm.riscv.vslide1up.nxv1i64.i64(
<vscale x 1 x i64>,		<vscale x 1 x i64>,
<vscale x 1 x i64>,		<vscale x 1 x i64>,
i64,		i64,
i32);		i32);

define <vscale x 1 x i64> @intrinsic_vslide1up_vx_nxv1i64_nxv1i64_i64(<vscale x 1 x i64> %0, i64 %1, i32 %2) nounwind {		define <vscale x 1 x i64> @intrinsic_vslide1up_vx_nxv1i64_nxv1i64_i64(<vscale x 1 x i64> %0, i64 %1, i32 %2) nounwind {
; CHECK-LABEL: intrinsic_vslide1up_vx_nxv1i64_nxv1i64_i64:		; CHECK-LABEL: intrinsic_vslide1up_vx_nxv1i64_nxv1i64_i64:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
		; CHECK-NEXT: vsetvli a2, a2, e64, m1, ta, mu
; CHECK-NEXT: slli a2, a2, 1		; CHECK-NEXT: slli a2, a2, 1
; CHECK-NEXT: vsetvli zero, a2, e32, m1, ta, mu		; CHECK-NEXT: vsetvli zero, a2, e32, m1, ta, mu
; CHECK-NEXT: vslide1up.vx v9, v8, a1		; CHECK-NEXT: vslide1up.vx v9, v8, a1
; CHECK-NEXT: vslide1up.vx v8, v9, a0		; CHECK-NEXT: vslide1up.vx v8, v9, a0
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%a = call <vscale x 1 x i64> @llvm.riscv.vslide1up.nxv1i64.i64(		%a = call <vscale x 1 x i64> @llvm.riscv.vslide1up.nxv1i64.i64(
<vscale x 1 x i64> undef,		<vscale x 1 x i64> undef,
Show All 10 Lines	declare <vscale x 1 x i64> @llvm.riscv.vslide1up.mask.nxv1i64.i64(
i64,		i64,
<vscale x 1 x i1>,		<vscale x 1 x i1>,
i32,		i32,
i32);		i32);

define <vscale x 1 x i64> @intrinsic_vslide1up_mask_vx_nxv1i64_nxv1i64_i64(<vscale x 1 x i64> %0, <vscale x 1 x i64> %1, i64 %2, <vscale x 1 x i1> %3, i32 %4) nounwind {		define <vscale x 1 x i64> @intrinsic_vslide1up_mask_vx_nxv1i64_nxv1i64_i64(<vscale x 1 x i64> %0, <vscale x 1 x i64> %1, i64 %2, <vscale x 1 x i1> %3, i32 %4) nounwind {
; CHECK-LABEL: intrinsic_vslide1up_mask_vx_nxv1i64_nxv1i64_i64:		; CHECK-LABEL: intrinsic_vslide1up_mask_vx_nxv1i64_nxv1i64_i64:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: slli a3, a2, 1		; CHECK-NEXT: vsetvli a3, a2, e64, m1, ta, mu
		; CHECK-NEXT: slli a3, a3, 1
; CHECK-NEXT: vsetvli zero, a3, e32, m1, ta, mu		; CHECK-NEXT: vsetvli zero, a3, e32, m1, ta, mu
; CHECK-NEXT: vslide1up.vx v10, v9, a1		; CHECK-NEXT: vslide1up.vx v10, v9, a1
; CHECK-NEXT: vslide1up.vx v9, v10, a0		; CHECK-NEXT: vslide1up.vx v9, v10, a0
; CHECK-NEXT: vsetvli zero, a2, e64, m1, ta, mu		; CHECK-NEXT: vsetvli zero, a2, e64, m1, ta, mu
; CHECK-NEXT: vmerge.vvm v8, v8, v9, v0		; CHECK-NEXT: vmerge.vvm v8, v8, v9, v0
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%a = call <vscale x 1 x i64> @llvm.riscv.vslide1up.mask.nxv1i64.i64(		%a = call <vscale x 1 x i64> @llvm.riscv.vslide1up.mask.nxv1i64.i64(
Show All 10 Lines	declare <vscale x 2 x i64> @llvm.riscv.vslide1up.nxv2i64.i64(
<vscale x 2 x i64>,		<vscale x 2 x i64>,
<vscale x 2 x i64>,		<vscale x 2 x i64>,
i64,		i64,
i32);		i32);

define <vscale x 2 x i64> @intrinsic_vslide1up_vx_nxv2i64_nxv2i64_i64(<vscale x 2 x i64> %0, i64 %1, i32 %2) nounwind {		define <vscale x 2 x i64> @intrinsic_vslide1up_vx_nxv2i64_nxv2i64_i64(<vscale x 2 x i64> %0, i64 %1, i32 %2) nounwind {
; CHECK-LABEL: intrinsic_vslide1up_vx_nxv2i64_nxv2i64_i64:		; CHECK-LABEL: intrinsic_vslide1up_vx_nxv2i64_nxv2i64_i64:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
		; CHECK-NEXT: vsetvli a2, a2, e64, m2, ta, mu
; CHECK-NEXT: slli a2, a2, 1		; CHECK-NEXT: slli a2, a2, 1
; CHECK-NEXT: vsetvli zero, a2, e32, m2, ta, mu		; CHECK-NEXT: vsetvli zero, a2, e32, m2, ta, mu
; CHECK-NEXT: vslide1up.vx v10, v8, a1		; CHECK-NEXT: vslide1up.vx v10, v8, a1
; CHECK-NEXT: vslide1up.vx v8, v10, a0		; CHECK-NEXT: vslide1up.vx v8, v10, a0
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%a = call <vscale x 2 x i64> @llvm.riscv.vslide1up.nxv2i64.i64(		%a = call <vscale x 2 x i64> @llvm.riscv.vslide1up.nxv2i64.i64(
<vscale x 2 x i64> undef,		<vscale x 2 x i64> undef,
Show All 10 Lines	declare <vscale x 2 x i64> @llvm.riscv.vslide1up.mask.nxv2i64.i64(
i64,		i64,
<vscale x 2 x i1>,		<vscale x 2 x i1>,
i32,		i32,
i32);		i32);

define <vscale x 2 x i64> @intrinsic_vslide1up_mask_vx_nxv2i64_nxv2i64_i64(<vscale x 2 x i64> %0, <vscale x 2 x i64> %1, i64 %2, <vscale x 2 x i1> %3, i32 %4) nounwind {		define <vscale x 2 x i64> @intrinsic_vslide1up_mask_vx_nxv2i64_nxv2i64_i64(<vscale x 2 x i64> %0, <vscale x 2 x i64> %1, i64 %2, <vscale x 2 x i1> %3, i32 %4) nounwind {
; CHECK-LABEL: intrinsic_vslide1up_mask_vx_nxv2i64_nxv2i64_i64:		; CHECK-LABEL: intrinsic_vslide1up_mask_vx_nxv2i64_nxv2i64_i64:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: slli a3, a2, 1		; CHECK-NEXT: vsetvli a3, a2, e64, m2, ta, mu
		; CHECK-NEXT: slli a3, a3, 1
; CHECK-NEXT: vsetvli zero, a3, e32, m2, ta, mu		; CHECK-NEXT: vsetvli zero, a3, e32, m2, ta, mu
; CHECK-NEXT: vslide1up.vx v12, v10, a1		; CHECK-NEXT: vslide1up.vx v12, v10, a1
; CHECK-NEXT: vslide1up.vx v10, v12, a0		; CHECK-NEXT: vslide1up.vx v10, v12, a0
; CHECK-NEXT: vsetvli zero, a2, e64, m2, ta, mu		; CHECK-NEXT: vsetvli zero, a2, e64, m2, ta, mu
; CHECK-NEXT: vmerge.vvm v8, v8, v10, v0		; CHECK-NEXT: vmerge.vvm v8, v8, v10, v0
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%a = call <vscale x 2 x i64> @llvm.riscv.vslide1up.mask.nxv2i64.i64(		%a = call <vscale x 2 x i64> @llvm.riscv.vslide1up.mask.nxv2i64.i64(
Show All 10 Lines	declare <vscale x 4 x i64> @llvm.riscv.vslide1up.nxv4i64.i64(
<vscale x 4 x i64>,		<vscale x 4 x i64>,
<vscale x 4 x i64>,		<vscale x 4 x i64>,
i64,		i64,
i32);		i32);

define <vscale x 4 x i64> @intrinsic_vslide1up_vx_nxv4i64_nxv4i64_i64(<vscale x 4 x i64> %0, i64 %1, i32 %2) nounwind {		define <vscale x 4 x i64> @intrinsic_vslide1up_vx_nxv4i64_nxv4i64_i64(<vscale x 4 x i64> %0, i64 %1, i32 %2) nounwind {
; CHECK-LABEL: intrinsic_vslide1up_vx_nxv4i64_nxv4i64_i64:		; CHECK-LABEL: intrinsic_vslide1up_vx_nxv4i64_nxv4i64_i64:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
		; CHECK-NEXT: vsetvli a2, a2, e64, m4, ta, mu
; CHECK-NEXT: slli a2, a2, 1		; CHECK-NEXT: slli a2, a2, 1
; CHECK-NEXT: vsetvli zero, a2, e32, m4, ta, mu		; CHECK-NEXT: vsetvli zero, a2, e32, m4, ta, mu
; CHECK-NEXT: vslide1up.vx v12, v8, a1		; CHECK-NEXT: vslide1up.vx v12, v8, a1
; CHECK-NEXT: vslide1up.vx v8, v12, a0		; CHECK-NEXT: vslide1up.vx v8, v12, a0
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%a = call <vscale x 4 x i64> @llvm.riscv.vslide1up.nxv4i64.i64(		%a = call <vscale x 4 x i64> @llvm.riscv.vslide1up.nxv4i64.i64(
<vscale x 4 x i64> undef,		<vscale x 4 x i64> undef,
Show All 10 Lines	declare <vscale x 4 x i64> @llvm.riscv.vslide1up.mask.nxv4i64.i64(
i64,		i64,
<vscale x 4 x i1>,		<vscale x 4 x i1>,
i32,		i32,
i32);		i32);

define <vscale x 4 x i64> @intrinsic_vslide1up_mask_vx_nxv4i64_nxv4i64_i64(<vscale x 4 x i64> %0, <vscale x 4 x i64> %1, i64 %2, <vscale x 4 x i1> %3, i32 %4) nounwind {		define <vscale x 4 x i64> @intrinsic_vslide1up_mask_vx_nxv4i64_nxv4i64_i64(<vscale x 4 x i64> %0, <vscale x 4 x i64> %1, i64 %2, <vscale x 4 x i1> %3, i32 %4) nounwind {
; CHECK-LABEL: intrinsic_vslide1up_mask_vx_nxv4i64_nxv4i64_i64:		; CHECK-LABEL: intrinsic_vslide1up_mask_vx_nxv4i64_nxv4i64_i64:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: slli a3, a2, 1		; CHECK-NEXT: vsetvli a3, a2, e64, m4, ta, mu
		; CHECK-NEXT: slli a3, a3, 1
; CHECK-NEXT: vsetvli zero, a3, e32, m4, ta, mu		; CHECK-NEXT: vsetvli zero, a3, e32, m4, ta, mu
; CHECK-NEXT: vslide1up.vx v16, v12, a1		; CHECK-NEXT: vslide1up.vx v16, v12, a1
; CHECK-NEXT: vslide1up.vx v12, v16, a0		; CHECK-NEXT: vslide1up.vx v12, v16, a0
; CHECK-NEXT: vsetvli zero, a2, e64, m4, ta, mu		; CHECK-NEXT: vsetvli zero, a2, e64, m4, ta, mu
; CHECK-NEXT: vmerge.vvm v8, v8, v12, v0		; CHECK-NEXT: vmerge.vvm v8, v8, v12, v0
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%a = call <vscale x 4 x i64> @llvm.riscv.vslide1up.mask.nxv4i64.i64(		%a = call <vscale x 4 x i64> @llvm.riscv.vslide1up.mask.nxv4i64.i64(
Show All 10 Lines	declare <vscale x 8 x i64> @llvm.riscv.vslide1up.nxv8i64.i64(
<vscale x 8 x i64>,		<vscale x 8 x i64>,
<vscale x 8 x i64>,		<vscale x 8 x i64>,
i64,		i64,
i32);		i32);

define <vscale x 8 x i64> @intrinsic_vslide1up_vx_nxv8i64_nxv8i64_i64(<vscale x 8 x i64> %0, i64 %1, i32 %2) nounwind {		define <vscale x 8 x i64> @intrinsic_vslide1up_vx_nxv8i64_nxv8i64_i64(<vscale x 8 x i64> %0, i64 %1, i32 %2) nounwind {
; CHECK-LABEL: intrinsic_vslide1up_vx_nxv8i64_nxv8i64_i64:		; CHECK-LABEL: intrinsic_vslide1up_vx_nxv8i64_nxv8i64_i64:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
		; CHECK-NEXT: vsetvli a2, a2, e64, m8, ta, mu
; CHECK-NEXT: slli a2, a2, 1		; CHECK-NEXT: slli a2, a2, 1
; CHECK-NEXT: vsetvli zero, a2, e32, m8, ta, mu		; CHECK-NEXT: vsetvli zero, a2, e32, m8, ta, mu
; CHECK-NEXT: vslide1up.vx v16, v8, a1		; CHECK-NEXT: vslide1up.vx v16, v8, a1
; CHECK-NEXT: vslide1up.vx v8, v16, a0		; CHECK-NEXT: vslide1up.vx v8, v16, a0
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%a = call <vscale x 8 x i64> @llvm.riscv.vslide1up.nxv8i64.i64(		%a = call <vscale x 8 x i64> @llvm.riscv.vslide1up.nxv8i64.i64(
<vscale x 8 x i64> undef,		<vscale x 8 x i64> undef,
Show All 10 Lines	declare <vscale x 8 x i64> @llvm.riscv.vslide1up.mask.nxv8i64.i64(
i64,		i64,
<vscale x 8 x i1>,		<vscale x 8 x i1>,
i32,		i32,
i32);		i32);

define <vscale x 8 x i64> @intrinsic_vslide1up_mask_vx_nxv8i64_nxv8i64_i64(<vscale x 8 x i64> %0, <vscale x 8 x i64> %1, i64 %2, <vscale x 8 x i1> %3, i32 %4) nounwind {		define <vscale x 8 x i64> @intrinsic_vslide1up_mask_vx_nxv8i64_nxv8i64_i64(<vscale x 8 x i64> %0, <vscale x 8 x i64> %1, i64 %2, <vscale x 8 x i1> %3, i32 %4) nounwind {
; CHECK-LABEL: intrinsic_vslide1up_mask_vx_nxv8i64_nxv8i64_i64:		; CHECK-LABEL: intrinsic_vslide1up_mask_vx_nxv8i64_nxv8i64_i64:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: slli a3, a2, 1		; CHECK-NEXT: vsetvli a3, a2, e64, m8, ta, mu
		; CHECK-NEXT: slli a3, a3, 1
; CHECK-NEXT: vsetvli zero, a3, e32, m8, ta, mu		; CHECK-NEXT: vsetvli zero, a3, e32, m8, ta, mu
; CHECK-NEXT: vslide1up.vx v24, v16, a1		; CHECK-NEXT: vslide1up.vx v24, v16, a1
; CHECK-NEXT: vslide1up.vx v16, v24, a0		; CHECK-NEXT: vslide1up.vx v16, v24, a0
; CHECK-NEXT: vsetvli zero, a2, e64, m8, ta, mu		; CHECK-NEXT: vsetvli zero, a2, e64, m8, ta, mu
; CHECK-NEXT: vmerge.vvm v8, v8, v16, v0		; CHECK-NEXT: vmerge.vvm v8, v8, v16, v0
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%a = call <vscale x 8 x i64> @llvm.riscv.vslide1up.mask.nxv8i64.i64(		%a = call <vscale x 8 x i64> @llvm.riscv.vslide1up.mask.nxv8i64.i64(
<vscale x 8 x i64> %0,		<vscale x 8 x i64> %0,
<vscale x 8 x i64> %1,		<vscale x 8 x i64> %1,
i64 %2,		i64 %2,
<vscale x 8 x i1> %3,		<vscale x 8 x i1> %3,
i32 %4, i32 1)		i32 %4, i32 1)

ret <vscale x 8 x i64> %a		ret <vscale x 8 x i64> %a
}		}

This is an archive of the discontinued LLVM Phabricator instance.

[RISCV][RVV] Fix vslide1up/down intrinsics overflow bug for SEW=64 on RV32
ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 414917

llvm/lib/Target/RISCV/MCTargetDesc/RISCVBaseInfo.h

llvm/lib/Target/RISCV/MCTargetDesc/RISCVBaseInfo.cpp

llvm/lib/Target/RISCV/RISCVISelLowering.h

llvm/lib/Target/RISCV/RISCVISelLowering.cpp

llvm/lib/Target/RISCV/RISCVSubtarget.h

llvm/test/CodeGen/RISCV/rvv/masked-vslide1down-rv32.ll

llvm/test/CodeGen/RISCV/rvv/unmasked-tu.ll

llvm/test/CodeGen/RISCV/rvv/vslide1down-constant-vl-rv32.ll

llvm/test/CodeGen/RISCV/rvv/vslide1down-rv32.ll

llvm/test/CodeGen/RISCV/rvv/vslide1up-constant-vl-rv32.ll

llvm/test/CodeGen/RISCV/rvv/vslide1up-rv32.ll

This is an archive of the discontinued LLVM Phabricator instance.

[RISCV][RVV] Fix vslide1up/down intrinsics overflow bug for SEW=64 on RV32ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 414917

llvm/lib/Target/RISCV/MCTargetDesc/RISCVBaseInfo.h

llvm/lib/Target/RISCV/MCTargetDesc/RISCVBaseInfo.cpp

llvm/lib/Target/RISCV/RISCVISelLowering.h

llvm/lib/Target/RISCV/RISCVISelLowering.cpp

llvm/lib/Target/RISCV/RISCVSubtarget.h

llvm/test/CodeGen/RISCV/rvv/masked-vslide1down-rv32.ll

llvm/test/CodeGen/RISCV/rvv/unmasked-tu.ll

llvm/test/CodeGen/RISCV/rvv/vslide1down-constant-vl-rv32.ll

llvm/test/CodeGen/RISCV/rvv/vslide1down-rv32.ll

llvm/test/CodeGen/RISCV/rvv/vslide1up-constant-vl-rv32.ll

llvm/test/CodeGen/RISCV/rvv/vslide1up-rv32.ll

[RISCV][RVV] Fix vslide1up/down intrinsics overflow bug for SEW=64 on RV32
ClosedPublic