Diff 331226

llvm/lib/Target/RISCV/RISCVISelLowering.h

Show First 20 Lines • Show All 426 Lines • ▼ Show 20 Lines	decomposeSubvectorInsertExtractToSubRegs(MVT VecVT, MVT SubVecVT,
unsigned InsertExtractIdx,		unsigned InsertExtractIdx,
const RISCVRegisterInfo *TRI);		const RISCVRegisterInfo *TRI);
MVT getContainerForFixedLengthVector(MVT VT) const;		MVT getContainerForFixedLengthVector(MVT VT) const;
static MVT getContainerForFixedLengthVector(const TargetLowering &TLI, MVT VT,		static MVT getContainerForFixedLengthVector(const TargetLowering &TLI, MVT VT,
const RISCVSubtarget &Subtarget);		const RISCVSubtarget &Subtarget);
static MVT getContainerForFixedLengthVector(SelectionDAG &DAG, MVT VT,		static MVT getContainerForFixedLengthVector(SelectionDAG &DAG, MVT VT,
const RISCVSubtarget &Subtarget);		const RISCVSubtarget &Subtarget);

		bool shouldRemoveExtendFromGSIndex(EVT VT) const override;

private:		private:
void analyzeInputArgs(MachineFunction &MF, CCState &CCInfo,		void analyzeInputArgs(MachineFunction &MF, CCState &CCInfo,
const SmallVectorImpl<ISD::InputArg> &Ins,		const SmallVectorImpl<ISD::InputArg> &Ins,
bool IsRet) const;		bool IsRet) const;
void analyzeOutputArgs(MachineFunction &MF, CCState &CCInfo,		void analyzeOutputArgs(MachineFunction &MF, CCState &CCInfo,
const SmallVectorImpl<ISD::OutputArg> &Outs,		const SmallVectorImpl<ISD::OutputArg> &Outs,
bool IsRet, CallLoweringInfo *CLI) const;		bool IsRet, CallLoweringInfo *CLI) const;

Show All 27 Lines	private:
SDValue lowerVECREDUCE(SDValue Op, SelectionDAG &DAG) const;		SDValue lowerVECREDUCE(SDValue Op, SelectionDAG &DAG) const;
SDValue lowerFPVECREDUCE(SDValue Op, SelectionDAG &DAG) const;		SDValue lowerFPVECREDUCE(SDValue Op, SelectionDAG &DAG) const;
SDValue lowerINSERT_SUBVECTOR(SDValue Op, SelectionDAG &DAG) const;		SDValue lowerINSERT_SUBVECTOR(SDValue Op, SelectionDAG &DAG) const;
SDValue lowerEXTRACT_SUBVECTOR(SDValue Op, SelectionDAG &DAG) const;		SDValue lowerEXTRACT_SUBVECTOR(SDValue Op, SelectionDAG &DAG) const;
SDValue lowerVECTOR_REVERSE(SDValue Op, SelectionDAG &DAG) const;		SDValue lowerVECTOR_REVERSE(SDValue Op, SelectionDAG &DAG) const;
SDValue lowerABS(SDValue Op, SelectionDAG &DAG) const;		SDValue lowerABS(SDValue Op, SelectionDAG &DAG) const;
SDValue lowerFixedLengthVectorFCOPYSIGNToRVV(SDValue Op,		SDValue lowerFixedLengthVectorFCOPYSIGNToRVV(SDValue Op,
SelectionDAG &DAG) const;		SelectionDAG &DAG) const;
		SDValue lowerMGATHER(SDValue Op, SelectionDAG &DAG) const;
SDValue lowerFixedLengthVectorLoadToRVV(SDValue Op, SelectionDAG &DAG) const;		SDValue lowerFixedLengthVectorLoadToRVV(SDValue Op, SelectionDAG &DAG) const;
SDValue lowerFixedLengthVectorStoreToRVV(SDValue Op, SelectionDAG &DAG) const;		SDValue lowerFixedLengthVectorStoreToRVV(SDValue Op, SelectionDAG &DAG) const;
SDValue lowerFixedLengthVectorSetccToRVV(SDValue Op, SelectionDAG &DAG) const;		SDValue lowerFixedLengthVectorSetccToRVV(SDValue Op, SelectionDAG &DAG) const;
SDValue lowerFixedLengthVectorLogicOpToRVV(SDValue Op, SelectionDAG &DAG,		SDValue lowerFixedLengthVectorLogicOpToRVV(SDValue Op, SelectionDAG &DAG,
unsigned MaskOpc,		unsigned MaskOpc,
unsigned VecOpc) const;		unsigned VecOpc) const;
SDValue lowerFixedLengthVectorSelectToRVV(SDValue Op,		SDValue lowerFixedLengthVectorSelectToRVV(SDValue Op,
SelectionDAG &DAG) const;		SelectionDAG &DAG) const;
Show All 40 Lines

llvm/lib/Target/RISCV/RISCVISelLowering.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 468 Lines • ▼ Show 20 Lines	for (MVT VT : IntVecVTs) {
setOperationAction(ISD::VECREDUCE_AND, VT, Custom);		setOperationAction(ISD::VECREDUCE_AND, VT, Custom);
setOperationAction(ISD::VECREDUCE_OR, VT, Custom);		setOperationAction(ISD::VECREDUCE_OR, VT, Custom);
setOperationAction(ISD::VECREDUCE_XOR, VT, Custom);		setOperationAction(ISD::VECREDUCE_XOR, VT, Custom);
setOperationAction(ISD::VECREDUCE_SMAX, VT, Custom);		setOperationAction(ISD::VECREDUCE_SMAX, VT, Custom);
setOperationAction(ISD::VECREDUCE_SMIN, VT, Custom);		setOperationAction(ISD::VECREDUCE_SMIN, VT, Custom);
setOperationAction(ISD::VECREDUCE_UMAX, VT, Custom);		setOperationAction(ISD::VECREDUCE_UMAX, VT, Custom);
setOperationAction(ISD::VECREDUCE_UMIN, VT, Custom);		setOperationAction(ISD::VECREDUCE_UMIN, VT, Custom);

		setOperationAction(ISD::MGATHER, VT, Custom);

		setOperationAction(ISD::CONCAT_VECTORS, VT, Custom);
setOperationAction(ISD::INSERT_SUBVECTOR, VT, Custom);		setOperationAction(ISD::INSERT_SUBVECTOR, VT, Custom);
setOperationAction(ISD::EXTRACT_SUBVECTOR, VT, Custom);		setOperationAction(ISD::EXTRACT_SUBVECTOR, VT, Custom);

setOperationAction(ISD::VECTOR_REVERSE, VT, Custom);		setOperationAction(ISD::VECTOR_REVERSE, VT, Custom);
}		}

// Expand various CCs to best match the RVV ISA, which natively supports UNE		// Expand various CCs to best match the RVV ISA, which natively supports UNE
// but no other unordered comparisons, and supports all ordered comparisons		// but no other unordered comparisons, and supports all ordered comparisons
Show All 23 Lines	const auto SetCommonVFPActions = [&](MVT VT) {
// Expand various condition codes (explained above).		// Expand various condition codes (explained above).
for (auto CC : VFPCCToExpand)		for (auto CC : VFPCCToExpand)
setCondCodeAction(CC, VT, Expand);		setCondCodeAction(CC, VT, Expand);

setOperationAction(ISD::VECREDUCE_FADD, VT, Custom);		setOperationAction(ISD::VECREDUCE_FADD, VT, Custom);
setOperationAction(ISD::VECREDUCE_SEQ_FADD, VT, Custom);		setOperationAction(ISD::VECREDUCE_SEQ_FADD, VT, Custom);
setOperationAction(ISD::FCOPYSIGN, VT, Legal);		setOperationAction(ISD::FCOPYSIGN, VT, Legal);

		setOperationAction(ISD::MGATHER, VT, Custom);

		setOperationAction(ISD::CONCAT_VECTORS, VT, Custom);
setOperationAction(ISD::INSERT_SUBVECTOR, VT, Custom);		setOperationAction(ISD::INSERT_SUBVECTOR, VT, Custom);
setOperationAction(ISD::EXTRACT_SUBVECTOR, VT, Custom);		setOperationAction(ISD::EXTRACT_SUBVECTOR, VT, Custom);

setOperationAction(ISD::VECTOR_REVERSE, VT, Custom);		setOperationAction(ISD::VECTOR_REVERSE, VT, Custom);
};		};

if (Subtarget.hasStdExtZfh())		if (Subtarget.hasStdExtZfh())
for (MVT VT : F16VecVTs)		for (MVT VT : F16VecVTs)
▲ Show 20 Lines • Show All 153 Lines • ▼ Show 20 Lines	RISCVTargetLowering::RISCVTargetLowering(const TargetMachine &TM,
setJumpIsExpensive();		setJumpIsExpensive();

// We can use any register for comparisons		// We can use any register for comparisons
setHasMultipleConditionRegisters();		setHasMultipleConditionRegisters();

if (Subtarget.hasStdExtZbp()) {		if (Subtarget.hasStdExtZbp()) {
setTargetDAGCombine(ISD::OR);		setTargetDAGCombine(ISD::OR);
}		}
if (Subtarget.hasStdExtV())		if (Subtarget.hasStdExtV()) {
setTargetDAGCombine(ISD::FCOPYSIGN);		setTargetDAGCombine(ISD::FCOPYSIGN);
		setTargetDAGCombine(ISD::MGATHER);
		}
}		}

EVT RISCVTargetLowering::getSetCCResultType(const DataLayout &DL,		EVT RISCVTargetLowering::getSetCCResultType(const DataLayout &DL,
LLVMContext &Context,		LLVMContext &Context,
EVT VT) const {		EVT VT) const {
if (!VT.isVector())		if (!VT.isVector())
return getPointerTy(DL);		return getPointerTy(DL);
if (Subtarget.hasStdExtV() &&		if (Subtarget.hasStdExtV() &&
▲ Show 20 Lines • Show All 925 Lines • ▼ Show 20 Lines	case ISD::BUILD_VECTOR:
return lowerBUILD_VECTOR(Op, DAG, Subtarget);		return lowerBUILD_VECTOR(Op, DAG, Subtarget);
case ISD::VECTOR_SHUFFLE:		case ISD::VECTOR_SHUFFLE:
return lowerVECTOR_SHUFFLE(Op, DAG, Subtarget);		return lowerVECTOR_SHUFFLE(Op, DAG, Subtarget);
case ISD::CONCAT_VECTORS: {		case ISD::CONCAT_VECTORS: {
// Split CONCAT_VECTORS into a series of INSERT_SUBVECTOR nodes. This is		// Split CONCAT_VECTORS into a series of INSERT_SUBVECTOR nodes. This is
// better than going through the stack, as the default expansion does.		// better than going through the stack, as the default expansion does.
SDLoc DL(Op);		SDLoc DL(Op);
MVT VT = Op.getSimpleValueType();		MVT VT = Op.getSimpleValueType();
assert(VT.isFixedLengthVector() && "Unexpected CONCAT_VECTORS lowering");
unsigned NumOpElts =		unsigned NumOpElts =
Op.getOperand(0).getSimpleValueType().getVectorNumElements();		Op.getOperand(0).getSimpleValueType().getVectorMinNumElements();
SDValue Vec = DAG.getUNDEF(VT);		SDValue Vec = DAG.getUNDEF(VT);
for (const auto &OpIdx : enumerate(Op->ops()))		for (const auto &OpIdx : enumerate(Op->ops()))
Vec = DAG.getNode(ISD::INSERT_SUBVECTOR, DL, VT, Vec, OpIdx.value(),		Vec = DAG.getNode(ISD::INSERT_SUBVECTOR, DL, VT, Vec, OpIdx.value(),
DAG.getIntPtrConstant(OpIdx.index() * NumOpElts, DL));		DAG.getIntPtrConstant(OpIdx.index() * NumOpElts, DL));
return Vec;		return Vec;
}		}
case ISD::LOAD:		case ISD::LOAD:
return lowerFixedLengthVectorLoadToRVV(Op, DAG);		return lowerFixedLengthVectorLoadToRVV(Op, DAG);
▲ Show 20 Lines • Show All 59 Lines • ▼ Show 20 Lines	SDValue RISCVTargetLowering::LowerOperation(SDValue Op,
case ISD::UMAX:		case ISD::UMAX:
return lowerToScalableOp(Op, DAG, RISCVISD::UMAX_VL);		return lowerToScalableOp(Op, DAG, RISCVISD::UMAX_VL);
case ISD::ABS:		case ISD::ABS:
return lowerABS(Op, DAG);		return lowerABS(Op, DAG);
case ISD::VSELECT:		case ISD::VSELECT:
return lowerFixedLengthVectorSelectToRVV(Op, DAG);		return lowerFixedLengthVectorSelectToRVV(Op, DAG);
case ISD::FCOPYSIGN:		case ISD::FCOPYSIGN:
return lowerFixedLengthVectorFCOPYSIGNToRVV(Op, DAG);		return lowerFixedLengthVectorFCOPYSIGNToRVV(Op, DAG);
		case ISD::MGATHER:
		return lowerMGATHER(Op, DAG);
}		}
}		}

static SDValue getTargetNode(GlobalAddressSDNode *N, SDLoc DL, EVT Ty,		static SDValue getTargetNode(GlobalAddressSDNode *N, SDLoc DL, EVT Ty,
SelectionDAG &DAG, unsigned Flags) {		SelectionDAG &DAG, unsigned Flags) {
return DAG.getTargetGlobalAddress(N->getGlobal(), DL, Ty, 0, Flags);		return DAG.getTargetGlobalAddress(N->getGlobal(), DL, Ty, 0, Flags);
}		}

▲ Show 20 Lines • Show All 1,061 Lines • ▼ Show 20 Lines	return DAG.getNode(ISD::EXTRACT_VECTOR_ELT, DL, VecEltVT, Reduction,
DAG.getConstant(0, DL, Subtarget.getXLenVT()));		DAG.getConstant(0, DL, Subtarget.getXLenVT()));
}		}

SDValue RISCVTargetLowering::lowerINSERT_SUBVECTOR(SDValue Op,		SDValue RISCVTargetLowering::lowerINSERT_SUBVECTOR(SDValue Op,
SelectionDAG &DAG) const {		SelectionDAG &DAG) const {
SDValue Vec = Op.getOperand(0);		SDValue Vec = Op.getOperand(0);
SDValue SubVec = Op.getOperand(1);		SDValue SubVec = Op.getOperand(1);
MVT VecVT = Vec.getSimpleValueType();		MVT VecVT = Vec.getSimpleValueType();
MVT SubVecVT = SubVec.getSimpleValueType();		MVT SubVecVT = SubVec.getSimpleValueType();
		frasercrmckAuthorUnsubmitted Done Reply Inline Actions I'll add tests in case LLVM tries to create "ext loads" out of these. We'd have to undo that if that were the case. frasercrmck: I'll add tests in case LLVM tries to create "ext loads" out of these. We'd have to undo that if…

SDLoc DL(Op);		SDLoc DL(Op);
MVT XLenVT = Subtarget.getXLenVT();		MVT XLenVT = Subtarget.getXLenVT();
unsigned OrigIdx = Op.getConstantOperandVal(2);		unsigned OrigIdx = Op.getConstantOperandVal(2);
const RISCVRegisterInfo *TRI = Subtarget.getRegisterInfo();		const RISCVRegisterInfo *TRI = Subtarget.getRegisterInfo();

// We don't have the ability to slide mask vectors up indexed by their i1		// We don't have the ability to slide mask vectors up indexed by their i1
// elements; the smallest we can do is i8. Often we are able to bitcast to		// elements; the smallest we can do is i8. Often we are able to bitcast to
// equivalent i8 vectors. Note that when inserting a fixed-length vector		// equivalent i8 vectors. Note that when inserting a fixed-length vector
// into a scalable one, we might not necessarily have enough scalable		// into a scalable one, we might not necessarily have enough scalable
// elements to safely divide by 8: nxv1i1 = insert nxv1i1, v4i1 is valid.		// elements to safely divide by 8: nxv1i1 = insert nxv1i1, v4i1 is valid.
if (SubVecVT.getVectorElementType() == MVT::i1 &&		if (SubVecVT.getVectorElementType() == MVT::i1 &&
(OrigIdx != 0 \|\| !Vec.isUndef())) {		(OrigIdx != 0 \|\| !Vec.isUndef())) {
if (VecVT.getVectorMinNumElements() >= 8 &&		if (VecVT.getVectorMinNumElements() >= 8 &&
SubVecVT.getVectorMinNumElements() >= 8) {		SubVecVT.getVectorMinNumElements() >= 8) {
assert(OrigIdx % 8 == 0 && "Invalid index");		assert(OrigIdx % 8 == 0 && "Invalid index");
assert(VecVT.getVectorMinNumElements() % 8 == 0 &&		assert(VecVT.getVectorMinNumElements() % 8 == 0 &&
SubVecVT.getVectorMinNumElements() % 8 == 0 &&		SubVecVT.getVectorMinNumElements() % 8 == 0 &&
"Unexpected mask vector lowering");		"Unexpected mask vector lowering");
OrigIdx /= 8;		OrigIdx /= 8;
SubVecVT =		SubVecVT =
MVT::getVectorVT(MVT::i8, SubVecVT.getVectorMinNumElements() / 8,		MVT::getVectorVT(MVT::i8, SubVecVT.getVectorMinNumElements() / 8,
SubVecVT.isScalableVector());		SubVecVT.isScalableVector());
		craig.topperUnsubmitted Not Done Reply Inline Actions Is it possible that IndexVT has 32-bit elements on a 64-bit target and that the IndexVT is already LMUL==8 such that this SIGN_EXTEND/ZERO_EXTEND would produce an illegal LMUL==16 type? craig.topper: Is it possible that IndexVT has 32-bit elements on a 64-bit target and that the IndexVT is…
		frasercrmckAuthorUnsubmitted Not Done Reply Inline Actions Yes, it's possible, and similarly on a 32-bit target with an illegal 8- or 16-bit index type, but I think that implies the original intrinsic would have an illegal pointer type, like `<vscale x 16 x i32>`. So in that sense it's ideally something LLVM would help legalize (split) for us, but sadly it folds the illegal intrinsic to one with legal types, e.g.: `i32 base, <vscale x 16 x i32> idxs` so it doesn't see that until it asks us to custom-lower. Am I right in thinking we have to custom-legalize this ourselves, duplicating logic from `LegalizeVectorTypes`? frasercrmck: Yes, it's possible, and similarly on a 32-bit target with an illegal 8- or 16-bit index type…
		frasercrmckAuthorUnsubmitted Not Done Reply Inline Actions It should be possible to do a DAGCombine pre-legalization which creates the illegal XLEN index types and passes it back to go through the vanilla legalization, if you think that's a valid route. Either way it's going to require support for scalable-vector insert/extract subvector. In the worst case we'll have to expand nxv64i64 (from nxv64i8) into 8 x nxv8i64. frasercrmck: It should be possible to do a DAGCombine pre-legalization which creates the illegal XLEN index…
		craig.topperUnsubmitted Not Done Reply Inline Actions Would the DAG combine end up fighting with the combine that uses shouldRemoveExtendFromGSIndex? craig.topper: Would the DAG combine end up fighting with the combine that uses shouldRemoveExtendFromGSIndex?
		frasercrmckAuthorUnsubmitted Not Done Reply Inline Actions It does, so you have to turn off that hook. I don't think that's the worst thing for our gathers since only UNSIGNED UNSCALED can be represented as index types smaller than XLEN, and I couldn't find anything that would generate that. frasercrmck: It does, so you have to turn off that hook. I don't think that's the worst thing for our…
VecVT = MVT::getVectorVT(MVT::i8, VecVT.getVectorMinNumElements() / 8,		VecVT = MVT::getVectorVT(MVT::i8, VecVT.getVectorMinNumElements() / 8,
VecVT.isScalableVector());		VecVT.isScalableVector());
Vec = DAG.getBitcast(VecVT, Vec);		Vec = DAG.getBitcast(VecVT, Vec);
SubVec = DAG.getBitcast(SubVecVT, SubVec);		SubVec = DAG.getBitcast(SubVecVT, SubVec);
} else {		} else {
// We can't slide this mask vector up indexed by its i1 elements.		// We can't slide this mask vector up indexed by its i1 elements.
// This poses a problem when we wish to insert a scalable vector which		// This poses a problem when we wish to insert a scalable vector which
// can't be re-expressed as a larger type. Just choose the slow path and		// can't be re-expressed as a larger type. Just choose the slow path and
// extend to a larger type, then truncate back down.		// extend to a larger type, then truncate back down.
MVT ExtVecVT = VecVT.changeVectorElementType(MVT::i8);		MVT ExtVecVT = VecVT.changeVectorElementType(MVT::i8);
		craig.topperUnsubmitted Done Reply Inline Actions Assert that this is a power of 2. I'm not completely sure that's guaranteed, but maybe it is for the types we expect to see. craig.topper: Assert that this is a power of 2. I'm not completely sure that's guaranteed, but maybe it is…
		frasercrmckAuthorUnsubmitted Done Reply Inline Actions Good idea. frasercrmck: Good idea.
MVT ExtSubVecVT = SubVecVT.changeVectorElementType(MVT::i8);		MVT ExtSubVecVT = SubVecVT.changeVectorElementType(MVT::i8);
Vec = DAG.getNode(ISD::ZERO_EXTEND, DL, ExtVecVT, Vec);		Vec = DAG.getNode(ISD::ZERO_EXTEND, DL, ExtVecVT, Vec);
SubVec = DAG.getNode(ISD::ZERO_EXTEND, DL, ExtSubVecVT, SubVec);		SubVec = DAG.getNode(ISD::ZERO_EXTEND, DL, ExtSubVecVT, SubVec);
Vec = DAG.getNode(ISD::INSERT_SUBVECTOR, DL, ExtVecVT, Vec, SubVec,		Vec = DAG.getNode(ISD::INSERT_SUBVECTOR, DL, ExtVecVT, Vec, SubVec,
Op.getOperand(2));		Op.getOperand(2));
SDValue SplatZero = DAG.getConstant(0, DL, ExtVecVT);		SDValue SplatZero = DAG.getConstant(0, DL, ExtVecVT);
return DAG.getSetCC(DL, VecVT, Vec, SplatZero, ISD::SETNE);		return DAG.getSetCC(DL, VecVT, Vec, SplatZero, ISD::SETNE);
}		}
▲ Show 20 Lines • Show All 563 Lines • ▼ Show 20 Lines	SDValue RISCVTargetLowering::lowerToScalableOp(SDValue Op, SelectionDAG &DAG,
if (HasMask)		if (HasMask)
Ops.push_back(Mask);		Ops.push_back(Mask);
Ops.push_back(VL);		Ops.push_back(VL);

SDValue ScalableRes = DAG.getNode(NewOpc, DL, ContainerVT, Ops);		SDValue ScalableRes = DAG.getNode(NewOpc, DL, ContainerVT, Ops);
return convertFromScalableVector(VT, ScalableRes, DAG, Subtarget);		return convertFromScalableVector(VT, ScalableRes, DAG, Subtarget);
}		}

		// Custom lower MGATHER to a legalized form for RVV. It will then be matched to
		// a RVV indexed load. The RVV indexed load/store instructions only support the
		// "unsigned unscaled" addressing mode; indices are implicitly zero-extended or
		// truncated to XLEN and are treated as byte offsets. Any signed or scaled
		// indexing is extended to the XLEN value type and scaled accordingly.
		SDValue RISCVTargetLowering::lowerMGATHER(SDValue Op, SelectionDAG &DAG) const {
		MaskedGatherSDNode *N = cast<MaskedGatherSDNode>(Op.getNode());
		SDLoc DL(Op);
		MVT VT = Op.getSimpleValueType();
		SDValue Index = N->getIndex();
		SDValue Mask = N->getMask();
		SDValue PassThru = N->getPassThru();

		MVT XLenVT = Subtarget.getXLenVT();
		assert(N->getBasePtr().getSimpleValueType() == XLenVT &&
		"Unexpected pointer type");
		// Targets have to explicitly opt-in for extending vector loads.
		assert(N->getExtensionType() == ISD::NON_EXTLOAD &&
		"Unexpected extending MGATHER");

		SDValue VL = getDefaultVLOps(VT, VT, DL, DAG, Subtarget).second;
		// If the mask is known to be all ones, optimize to an unmasked intrinsic;
		// the selection of the masked intrinsics doesn't do this for us.
		if (ISD::isConstantSplatVectorAllOnes(Mask.getNode())) {
		SDValue IntID = DAG.getTargetConstant(Intrinsic::riscv_vloxei, DL, XLenVT);
		SDValue Ops[] = {N->getChain(), IntID, N->getBasePtr(), Index, VL};
		return DAG.getMemIntrinsicNode(ISD::INTRINSIC_W_CHAIN, DL,
		DAG.getVTList(VT, MVT::Other), Ops,
		N->getMemoryVT(), N->getMemOperand());
		}

		SDValue IntID =
		DAG.getTargetConstant(Intrinsic::riscv_vloxei_mask, DL, XLenVT);
		SDValue Ops[] = {N->getChain(), IntID, PassThru, N->getBasePtr(),
		Index, Mask, VL};
		return DAG.getMemIntrinsicNode(ISD::INTRINSIC_W_CHAIN, DL,
		DAG.getVTList(VT, MVT::Other), Ops,
		N->getMemoryVT(), N->getMemOperand());
		}

// Returns the opcode of the target-specific SDNode that implements the 32-bit		// Returns the opcode of the target-specific SDNode that implements the 32-bit
// form of the given Opcode.		// form of the given Opcode.
static RISCVISD::NodeType getRISCVWOpcode(unsigned Opcode) {		static RISCVISD::NodeType getRISCVWOpcode(unsigned Opcode) {
switch (Opcode) {		switch (Opcode) {
default:		default:
llvm_unreachable("Unexpected opcode");		llvm_unreachable("Unexpected opcode");
case ISD::SHL:		case ISD::SHL:
return RISCVISD::SLLW;		return RISCVISD::SLLW;
▲ Show 20 Lines • Show All 1,001 Lines • ▼ Show 20 Lines	case ISD::FCOPYSIGN: {
In2 = In2.getOperand(0);		In2 = In2.getOperand(0);
if (In2.getOpcode() != ISD::FNEG)		if (In2.getOpcode() != ISD::FNEG)
break;		break;
SDLoc DL(N);		SDLoc DL(N);
SDValue NewFPExtRound = DAG.getFPExtendOrRound(In2.getOperand(0), DL, VT);		SDValue NewFPExtRound = DAG.getFPExtendOrRound(In2.getOperand(0), DL, VT);
return DAG.getNode(ISD::FCOPYSIGN, DL, VT, N->getOperand(0),		return DAG.getNode(ISD::FCOPYSIGN, DL, VT, N->getOperand(0),
DAG.getNode(ISD::FNEG, DL, VT, NewFPExtRound));		DAG.getNode(ISD::FNEG, DL, VT, NewFPExtRound));
}		}
		case ISD::MGATHER: {
		if (!DCI.isBeforeLegalize())
		break;
		MaskedGatherSDNode *MGN = cast<MaskedGatherSDNode>(N);
		SDValue Index = MGN->getIndex();
		EVT IndexVT = Index.getValueType();
		MVT XLenVT = Subtarget.getXLenVT();
		// RISCV indexed loads only support the "unsigned unscaled" addressing
		// mode, so anything else must be manually legalized.
		bool NeedsIdxLegalization =
		MGN->isIndexScaled() \|\|
		(MGN->isIndexSigned() && IndexVT.getVectorElementType().bitsLT(XLenVT));
		if (!NeedsIdxLegalization)
		break;

		SDLoc DL(N);

		// Any index legalization should first promote to XLenVT, so we don't lose
		// bits when scaling. This may create an illegal index type so we let
		// LLVM's legalization take care of the splitting.
		if (IndexVT.getVectorElementType().bitsLT(XLenVT)) {
		IndexVT = IndexVT.changeVectorElementType(XLenVT);
		Index = DAG.getNode(MGN->isIndexSigned() ? ISD::SIGN_EXTEND
		: ISD::ZERO_EXTEND,
		DL, IndexVT, Index);
		}

		unsigned Scale = N->getConstantOperandVal(5);
		if (MGN->isIndexScaled() && Scale != 1) {
		// Manually scale the indices by the element size.
		// TODO: Sanitize the scale operand here?
		assert(isPowerOf2_32(Scale) && "Expecting power-of-two types");
		SDValue SplatScale = DAG.getConstant(Log2_32(Scale), DL, IndexVT);
		Index = DAG.getNode(ISD::SHL, DL, IndexVT, Index, SplatScale);
		}

		ISD::MemIndexType NewIndexTy = ISD::UNSIGNED_UNSCALED;
		return DAG.getMaskedGather(
		N->getVTList(), MGN->getMemoryVT(), DL,
		{MGN->getChain(), MGN->getPassThru(), MGN->getMask(), MGN->getBasePtr(),
		Index, MGN->getScale()},
		MGN->getMemOperand(), NewIndexTy, MGN->getExtensionType());
		}
}		}

return SDValue();		return SDValue();
}		}

bool RISCVTargetLowering::isDesirableToCommuteWithShift(		bool RISCVTargetLowering::isDesirableToCommuteWithShift(
const SDNode *N, CombineLevel Level) const {		const SDNode *N, CombineLevel Level) const {
// The following folds are only desirable if `(OP _, c1 << c2)` can be		// The following folds are only desirable if `(OP _, c1 << c2)` can be
▲ Show 20 Lines • Show All 2,404 Lines • ▼ Show 20 Lines	Function *MaskedCmpXchg =
Intrinsic::getDeclaration(CI->getModule(), CmpXchgIntrID, Tys);		Intrinsic::getDeclaration(CI->getModule(), CmpXchgIntrID, Tys);
Value *Result = Builder.CreateCall(		Value *Result = Builder.CreateCall(
MaskedCmpXchg, {AlignedAddr, CmpVal, NewVal, Mask, Ordering});		MaskedCmpXchg, {AlignedAddr, CmpVal, NewVal, Mask, Ordering});
if (XLen == 64)		if (XLen == 64)
Result = Builder.CreateTrunc(Result, Builder.getInt32Ty());		Result = Builder.CreateTrunc(Result, Builder.getInt32Ty());
return Result;		return Result;
}		}

		bool RISCVTargetLowering::shouldRemoveExtendFromGSIndex(EVT VT) const {
		return false;
		}

bool RISCVTargetLowering::isFMAFasterThanFMulAndFAdd(const MachineFunction &MF,		bool RISCVTargetLowering::isFMAFasterThanFMulAndFAdd(const MachineFunction &MF,
EVT VT) const {		EVT VT) const {
VT = VT.getScalarType();		VT = VT.getScalarType();

if (!VT.isSimple())		if (!VT.isSimple())
return false;		return false;

switch (VT.getSimpleVT().SimpleTy) {		switch (VT.getSimpleVT().SimpleTy) {
▲ Show 20 Lines • Show All 224 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/mgather-sdnode.ll

This file was added.

				; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
				; RUN: llc -mtriple=riscv32 -mattr=+m,+d,+experimental-zfh,+experimental-v -target-abi=ilp32d \
				; RUN: -verify-machineinstrs < %s \| FileCheck %s --check-prefix=RV32
				; RUN: llc -mtriple=riscv64 -mattr=+m,+d,+experimental-zfh,+experimental-v -target-abi=lp64d \
				; RUN: -verify-machineinstrs < %s \| FileCheck %s --check-prefix=RV64

				declare <vscale x 1 x i8> @llvm.masked.gather.nxv1i8.nxv1p0i8(<vscale x 1 x i8*>, i32, <vscale x 1 x i1>, <vscale x 1 x i8>)

				define <vscale x 1 x i8> @mgather_nxv1i8(<vscale x 1 x i8*> %ptrs, <vscale x 1 x i1> %m, <vscale x 1 x i8> %passthru) {
				; RV32-LABEL: mgather_nxv1i8:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e8,mf8,tu,mu
				; RV32-NEXT: vloxei32.v v9, (zero), v8, v0.t
				; RV32-NEXT: vmv1r.v v8, v9
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_nxv1i8:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e8,mf8,tu,mu
				; RV64-NEXT: vloxei64.v v9, (zero), v8, v0.t
				; RV64-NEXT: vmv1r.v v8, v9
				; RV64-NEXT: ret
				%v = call <vscale x 1 x i8> @llvm.masked.gather.nxv1i8.nxv1p0i8(<vscale x 1 x i8*> %ptrs, i32 1, <vscale x 1 x i1> %m, <vscale x 1 x i8> %passthru)
				ret <vscale x 1 x i8> %v
				}

				declare <vscale x 2 x i8> @llvm.masked.gather.nxv2i8.nxv2p0i8(<vscale x 2 x i8*>, i32, <vscale x 2 x i1>, <vscale x 2 x i8>)

				define <vscale x 2 x i8> @mgather_nxv2i8(<vscale x 2 x i8*> %ptrs, <vscale x 2 x i1> %m, <vscale x 2 x i8> %passthru) {
				; RV32-LABEL: mgather_nxv2i8:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e8,mf4,tu,mu
				; RV32-NEXT: vloxei32.v v9, (zero), v8, v0.t
				; RV32-NEXT: vmv1r.v v8, v9
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_nxv2i8:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e8,mf4,tu,mu
				; RV64-NEXT: vloxei64.v v10, (zero), v8, v0.t
				; RV64-NEXT: vmv1r.v v8, v10
				; RV64-NEXT: ret
				%v = call <vscale x 2 x i8> @llvm.masked.gather.nxv2i8.nxv2p0i8(<vscale x 2 x i8*> %ptrs, i32 1, <vscale x 2 x i1> %m, <vscale x 2 x i8> %passthru)
				ret <vscale x 2 x i8> %v
				}

				define <vscale x 2 x i16> @mgather_nxv2i8_sextload_nxv2i16(<vscale x 2 x i8*> %ptrs, <vscale x 2 x i1> %m, <vscale x 2 x i8> %passthru) {
				; RV32-LABEL: mgather_nxv2i8_sextload_nxv2i16:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e8,mf4,tu,mu
				; RV32-NEXT: vloxei32.v v9, (zero), v8, v0.t
				; RV32-NEXT: vsetvli a0, zero, e16,mf2,ta,mu
				; RV32-NEXT: vsext.vf2 v8, v9
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_nxv2i8_sextload_nxv2i16:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e8,mf4,tu,mu
				; RV64-NEXT: vloxei64.v v10, (zero), v8, v0.t
				; RV64-NEXT: vsetvli a0, zero, e16,mf2,ta,mu
				; RV64-NEXT: vsext.vf2 v8, v10
				; RV64-NEXT: ret
				%v = call <vscale x 2 x i8> @llvm.masked.gather.nxv2i8.nxv2p0i8(<vscale x 2 x i8*> %ptrs, i32 1, <vscale x 2 x i1> %m, <vscale x 2 x i8> %passthru)
				%ev = sext <vscale x 2 x i8> %v to <vscale x 2 x i16>
				ret <vscale x 2 x i16> %ev
				}

				define <vscale x 2 x i16> @mgather_nxv2i8_zextload_nxv2i16(<vscale x 2 x i8*> %ptrs, <vscale x 2 x i1> %m, <vscale x 2 x i8> %passthru) {
				; RV32-LABEL: mgather_nxv2i8_zextload_nxv2i16:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e8,mf4,tu,mu
				; RV32-NEXT: vloxei32.v v9, (zero), v8, v0.t
				; RV32-NEXT: vsetvli a0, zero, e16,mf2,ta,mu
				; RV32-NEXT: vzext.vf2 v8, v9
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_nxv2i8_zextload_nxv2i16:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e8,mf4,tu,mu
				; RV64-NEXT: vloxei64.v v10, (zero), v8, v0.t
				; RV64-NEXT: vsetvli a0, zero, e16,mf2,ta,mu
				; RV64-NEXT: vzext.vf2 v8, v10
				; RV64-NEXT: ret
				%v = call <vscale x 2 x i8> @llvm.masked.gather.nxv2i8.nxv2p0i8(<vscale x 2 x i8*> %ptrs, i32 1, <vscale x 2 x i1> %m, <vscale x 2 x i8> %passthru)
				%ev = zext <vscale x 2 x i8> %v to <vscale x 2 x i16>
				ret <vscale x 2 x i16> %ev
				}

				define <vscale x 2 x i32> @mgather_nxv2i8_sextload_nxv2i32(<vscale x 2 x i8*> %ptrs, <vscale x 2 x i1> %m, <vscale x 2 x i8> %passthru) {
				; RV32-LABEL: mgather_nxv2i8_sextload_nxv2i32:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e8,mf4,tu,mu
				; RV32-NEXT: vloxei32.v v9, (zero), v8, v0.t
				; RV32-NEXT: vsetvli a0, zero, e32,m1,ta,mu
				; RV32-NEXT: vsext.vf4 v8, v9
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_nxv2i8_sextload_nxv2i32:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e8,mf4,tu,mu
				; RV64-NEXT: vloxei64.v v10, (zero), v8, v0.t
				; RV64-NEXT: vsetvli a0, zero, e32,m1,ta,mu
				; RV64-NEXT: vsext.vf4 v8, v10
				; RV64-NEXT: ret
				%v = call <vscale x 2 x i8> @llvm.masked.gather.nxv2i8.nxv2p0i8(<vscale x 2 x i8*> %ptrs, i32 1, <vscale x 2 x i1> %m, <vscale x 2 x i8> %passthru)
				%ev = sext <vscale x 2 x i8> %v to <vscale x 2 x i32>
				ret <vscale x 2 x i32> %ev
				}

				define <vscale x 2 x i32> @mgather_nxv2i8_zextload_nxv2i32(<vscale x 2 x i8*> %ptrs, <vscale x 2 x i1> %m, <vscale x 2 x i8> %passthru) {
				; RV32-LABEL: mgather_nxv2i8_zextload_nxv2i32:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e8,mf4,tu,mu
				; RV32-NEXT: vloxei32.v v9, (zero), v8, v0.t
				; RV32-NEXT: vsetvli a0, zero, e32,m1,ta,mu
				; RV32-NEXT: vzext.vf4 v8, v9
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_nxv2i8_zextload_nxv2i32:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e8,mf4,tu,mu
				; RV64-NEXT: vloxei64.v v10, (zero), v8, v0.t
				; RV64-NEXT: vsetvli a0, zero, e32,m1,ta,mu
				; RV64-NEXT: vzext.vf4 v8, v10
				; RV64-NEXT: ret
				%v = call <vscale x 2 x i8> @llvm.masked.gather.nxv2i8.nxv2p0i8(<vscale x 2 x i8*> %ptrs, i32 1, <vscale x 2 x i1> %m, <vscale x 2 x i8> %passthru)
				%ev = zext <vscale x 2 x i8> %v to <vscale x 2 x i32>
				ret <vscale x 2 x i32> %ev
				}

				define <vscale x 2 x i64> @mgather_nxv2i8_sextload_nxv2i64(<vscale x 2 x i8*> %ptrs, <vscale x 2 x i1> %m, <vscale x 2 x i8> %passthru) {
				; RV32-LABEL: mgather_nxv2i8_sextload_nxv2i64:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e8,mf4,tu,mu
				; RV32-NEXT: vloxei32.v v9, (zero), v8, v0.t
				; RV32-NEXT: vsetvli a0, zero, e64,m2,ta,mu
				; RV32-NEXT: vsext.vf8 v26, v9
				; RV32-NEXT: vmv2r.v v8, v26
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_nxv2i8_sextload_nxv2i64:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e8,mf4,tu,mu
				; RV64-NEXT: vloxei64.v v10, (zero), v8, v0.t
				; RV64-NEXT: vsetvli a0, zero, e64,m2,ta,mu
				; RV64-NEXT: vsext.vf8 v8, v10
				; RV64-NEXT: ret
				%v = call <vscale x 2 x i8> @llvm.masked.gather.nxv2i8.nxv2p0i8(<vscale x 2 x i8*> %ptrs, i32 1, <vscale x 2 x i1> %m, <vscale x 2 x i8> %passthru)
				%ev = sext <vscale x 2 x i8> %v to <vscale x 2 x i64>
				ret <vscale x 2 x i64> %ev
				}

				define <vscale x 2 x i64> @mgather_nxv2i8_zextload_nxv2i64(<vscale x 2 x i8*> %ptrs, <vscale x 2 x i1> %m, <vscale x 2 x i8> %passthru) {
				; RV32-LABEL: mgather_nxv2i8_zextload_nxv2i64:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e8,mf4,tu,mu
				; RV32-NEXT: vloxei32.v v9, (zero), v8, v0.t
				; RV32-NEXT: vsetvli a0, zero, e64,m2,ta,mu
				; RV32-NEXT: vzext.vf8 v26, v9
				; RV32-NEXT: vmv2r.v v8, v26
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_nxv2i8_zextload_nxv2i64:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e8,mf4,tu,mu
				; RV64-NEXT: vloxei64.v v10, (zero), v8, v0.t
				; RV64-NEXT: vsetvli a0, zero, e64,m2,ta,mu
				; RV64-NEXT: vzext.vf8 v8, v10
				; RV64-NEXT: ret
				%v = call <vscale x 2 x i8> @llvm.masked.gather.nxv2i8.nxv2p0i8(<vscale x 2 x i8*> %ptrs, i32 1, <vscale x 2 x i1> %m, <vscale x 2 x i8> %passthru)
				%ev = zext <vscale x 2 x i8> %v to <vscale x 2 x i64>
				ret <vscale x 2 x i64> %ev
				}

				declare <vscale x 4 x i8> @llvm.masked.gather.nxv4i8.nxv4p0i8(<vscale x 4 x i8*>, i32, <vscale x 4 x i1>, <vscale x 4 x i8>)

				define <vscale x 4 x i8> @mgather_nxv4i8(<vscale x 4 x i8*> %ptrs, <vscale x 4 x i1> %m, <vscale x 4 x i8> %passthru) {
				; RV32-LABEL: mgather_nxv4i8:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e8,mf2,tu,mu
				; RV32-NEXT: vloxei32.v v10, (zero), v8, v0.t
				; RV32-NEXT: vmv1r.v v8, v10
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_nxv4i8:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e8,mf2,tu,mu
				; RV64-NEXT: vloxei64.v v12, (zero), v8, v0.t
				; RV64-NEXT: vmv1r.v v8, v12
				; RV64-NEXT: ret
				%v = call <vscale x 4 x i8> @llvm.masked.gather.nxv4i8.nxv4p0i8(<vscale x 4 x i8*> %ptrs, i32 1, <vscale x 4 x i1> %m, <vscale x 4 x i8> %passthru)
				ret <vscale x 4 x i8> %v
				}

				define <vscale x 4 x i8> @mgather_truemask_nxv4i8(<vscale x 4 x i8*> %ptrs, <vscale x 4 x i8> %passthru) {
				; RV32-LABEL: mgather_truemask_nxv4i8:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e8,mf2,ta,mu
				; RV32-NEXT: vloxei32.v v8, (zero), v8
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_truemask_nxv4i8:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e8,mf2,ta,mu
				; RV64-NEXT: vloxei64.v v8, (zero), v8
				; RV64-NEXT: ret
				%mhead = insertelement <vscale x 4 x i1> undef, i1 1, i32 0
				%mtrue = shufflevector <vscale x 4 x i1> %mhead, <vscale x 4 x i1> undef, <vscale x 4 x i32> zeroinitializer
				%v = call <vscale x 4 x i8> @llvm.masked.gather.nxv4i8.nxv4p0i8(<vscale x 4 x i8*> %ptrs, i32 1, <vscale x 4 x i1> %mtrue, <vscale x 4 x i8> %passthru)
				ret <vscale x 4 x i8> %v
				}

				declare <vscale x 8 x i8> @llvm.masked.gather.nxv8i8.nxv8p0i8(<vscale x 8 x i8*>, i32, <vscale x 8 x i1>, <vscale x 8 x i8>)

				define <vscale x 8 x i8> @mgather_nxv8i8(<vscale x 8 x i8*> %ptrs, <vscale x 8 x i1> %m, <vscale x 8 x i8> %passthru) {
				; RV32-LABEL: mgather_nxv8i8:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e8,m1,tu,mu
				; RV32-NEXT: vloxei32.v v12, (zero), v8, v0.t
				; RV32-NEXT: vmv1r.v v8, v12
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_nxv8i8:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e8,m1,tu,mu
				; RV64-NEXT: vloxei64.v v16, (zero), v8, v0.t
				; RV64-NEXT: vmv1r.v v8, v16
				; RV64-NEXT: ret
				%v = call <vscale x 8 x i8> @llvm.masked.gather.nxv8i8.nxv8p0i8(<vscale x 8 x i8*> %ptrs, i32 1, <vscale x 8 x i1> %m, <vscale x 8 x i8> %passthru)
				ret <vscale x 8 x i8> %v
				}

				define <vscale x 8 x i8> @mgather_baseidx_nxv8i8(i8* %base, <vscale x 8 x i8> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x i8> %passthru) {
				; RV32-LABEL: mgather_baseidx_nxv8i8:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e32,m4,ta,mu
				; RV32-NEXT: vsext.vf4 v28, v8
				; RV32-NEXT: vsetvli a1, zero, e8,m1,tu,mu
				; RV32-NEXT: vloxei32.v v9, (a0), v28, v0.t
				; RV32-NEXT: vmv1r.v v8, v9
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_nxv8i8:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vsext.vf8 v16, v8
				; RV64-NEXT: vsetvli a1, zero, e8,m1,tu,mu
				; RV64-NEXT: vloxei64.v v9, (a0), v16, v0.t
				; RV64-NEXT: vmv1r.v v8, v9
				; RV64-NEXT: ret
				%ptrs = getelementptr inbounds i8, i8* %base, <vscale x 8 x i8> %idxs
				%v = call <vscale x 8 x i8> @llvm.masked.gather.nxv8i8.nxv8p0i8(<vscale x 8 x i8*> %ptrs, i32 1, <vscale x 8 x i1> %m, <vscale x 8 x i8> %passthru)
				ret <vscale x 8 x i8> %v
				}

				declare <vscale x 1 x i16> @llvm.masked.gather.nxv1i16.nxv1p0i16(<vscale x 1 x i16*>, i32, <vscale x 1 x i1>, <vscale x 1 x i16>)

				define <vscale x 1 x i16> @mgather_nxv1i16(<vscale x 1 x i16*> %ptrs, <vscale x 1 x i1> %m, <vscale x 1 x i16> %passthru) {
				; RV32-LABEL: mgather_nxv1i16:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e16,mf4,tu,mu
				; RV32-NEXT: vloxei32.v v9, (zero), v8, v0.t
				; RV32-NEXT: vmv1r.v v8, v9
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_nxv1i16:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e16,mf4,tu,mu
				; RV64-NEXT: vloxei64.v v9, (zero), v8, v0.t
				; RV64-NEXT: vmv1r.v v8, v9
				; RV64-NEXT: ret
				%v = call <vscale x 1 x i16> @llvm.masked.gather.nxv1i16.nxv1p0i16(<vscale x 1 x i16*> %ptrs, i32 2, <vscale x 1 x i1> %m, <vscale x 1 x i16> %passthru)
				ret <vscale x 1 x i16> %v
				}

				declare <vscale x 2 x i16> @llvm.masked.gather.nxv2i16.nxv2p0i16(<vscale x 2 x i16*>, i32, <vscale x 2 x i1>, <vscale x 2 x i16>)

				define <vscale x 2 x i16> @mgather_nxv2i16(<vscale x 2 x i16*> %ptrs, <vscale x 2 x i1> %m, <vscale x 2 x i16> %passthru) {
				; RV32-LABEL: mgather_nxv2i16:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e16,mf2,tu,mu
				; RV32-NEXT: vloxei32.v v9, (zero), v8, v0.t
				; RV32-NEXT: vmv1r.v v8, v9
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_nxv2i16:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e16,mf2,tu,mu
				; RV64-NEXT: vloxei64.v v10, (zero), v8, v0.t
				; RV64-NEXT: vmv1r.v v8, v10
				; RV64-NEXT: ret
				%v = call <vscale x 2 x i16> @llvm.masked.gather.nxv2i16.nxv2p0i16(<vscale x 2 x i16*> %ptrs, i32 2, <vscale x 2 x i1> %m, <vscale x 2 x i16> %passthru)
				ret <vscale x 2 x i16> %v
				}

				define <vscale x 2 x i32> @mgather_nxv2i16_sextload_nxv2i32(<vscale x 2 x i16*> %ptrs, <vscale x 2 x i1> %m, <vscale x 2 x i16> %passthru) {
				; RV32-LABEL: mgather_nxv2i16_sextload_nxv2i32:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e16,mf2,tu,mu
				; RV32-NEXT: vloxei32.v v9, (zero), v8, v0.t
				; RV32-NEXT: vsetvli a0, zero, e32,m1,ta,mu
				; RV32-NEXT: vsext.vf2 v8, v9
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_nxv2i16_sextload_nxv2i32:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e16,mf2,tu,mu
				; RV64-NEXT: vloxei64.v v10, (zero), v8, v0.t
				; RV64-NEXT: vsetvli a0, zero, e32,m1,ta,mu
				; RV64-NEXT: vsext.vf2 v8, v10
				; RV64-NEXT: ret
				%v = call <vscale x 2 x i16> @llvm.masked.gather.nxv2i16.nxv2p0i16(<vscale x 2 x i16*> %ptrs, i32 2, <vscale x 2 x i1> %m, <vscale x 2 x i16> %passthru)
				%ev = sext <vscale x 2 x i16> %v to <vscale x 2 x i32>
				ret <vscale x 2 x i32> %ev
				}

				define <vscale x 2 x i32> @mgather_nxv2i16_zextload_nxv2i32(<vscale x 2 x i16*> %ptrs, <vscale x 2 x i1> %m, <vscale x 2 x i16> %passthru) {
				; RV32-LABEL: mgather_nxv2i16_zextload_nxv2i32:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e16,mf2,tu,mu
				; RV32-NEXT: vloxei32.v v9, (zero), v8, v0.t
				; RV32-NEXT: vsetvli a0, zero, e32,m1,ta,mu
				; RV32-NEXT: vzext.vf2 v8, v9
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_nxv2i16_zextload_nxv2i32:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e16,mf2,tu,mu
				; RV64-NEXT: vloxei64.v v10, (zero), v8, v0.t
				; RV64-NEXT: vsetvli a0, zero, e32,m1,ta,mu
				; RV64-NEXT: vzext.vf2 v8, v10
				; RV64-NEXT: ret
				%v = call <vscale x 2 x i16> @llvm.masked.gather.nxv2i16.nxv2p0i16(<vscale x 2 x i16*> %ptrs, i32 2, <vscale x 2 x i1> %m, <vscale x 2 x i16> %passthru)
				%ev = zext <vscale x 2 x i16> %v to <vscale x 2 x i32>
				ret <vscale x 2 x i32> %ev
				}

				define <vscale x 2 x i64> @mgather_nxv2i16_sextload_nxv2i64(<vscale x 2 x i16*> %ptrs, <vscale x 2 x i1> %m, <vscale x 2 x i16> %passthru) {
				; RV32-LABEL: mgather_nxv2i16_sextload_nxv2i64:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e16,mf2,tu,mu
				; RV32-NEXT: vloxei32.v v9, (zero), v8, v0.t
				; RV32-NEXT: vsetvli a0, zero, e64,m2,ta,mu
				; RV32-NEXT: vsext.vf4 v26, v9
				; RV32-NEXT: vmv2r.v v8, v26
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_nxv2i16_sextload_nxv2i64:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e16,mf2,tu,mu
				; RV64-NEXT: vloxei64.v v10, (zero), v8, v0.t
				; RV64-NEXT: vsetvli a0, zero, e64,m2,ta,mu
				; RV64-NEXT: vsext.vf4 v8, v10
				; RV64-NEXT: ret
				%v = call <vscale x 2 x i16> @llvm.masked.gather.nxv2i16.nxv2p0i16(<vscale x 2 x i16*> %ptrs, i32 2, <vscale x 2 x i1> %m, <vscale x 2 x i16> %passthru)
				%ev = sext <vscale x 2 x i16> %v to <vscale x 2 x i64>
				ret <vscale x 2 x i64> %ev
				}

				define <vscale x 2 x i64> @mgather_nxv2i16_zextload_nxv2i64(<vscale x 2 x i16*> %ptrs, <vscale x 2 x i1> %m, <vscale x 2 x i16> %passthru) {
				; RV32-LABEL: mgather_nxv2i16_zextload_nxv2i64:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e16,mf2,tu,mu
				; RV32-NEXT: vloxei32.v v9, (zero), v8, v0.t
				; RV32-NEXT: vsetvli a0, zero, e64,m2,ta,mu
				; RV32-NEXT: vzext.vf4 v26, v9
				; RV32-NEXT: vmv2r.v v8, v26
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_nxv2i16_zextload_nxv2i64:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e16,mf2,tu,mu
				; RV64-NEXT: vloxei64.v v10, (zero), v8, v0.t
				; RV64-NEXT: vsetvli a0, zero, e64,m2,ta,mu
				; RV64-NEXT: vzext.vf4 v8, v10
				; RV64-NEXT: ret
				%v = call <vscale x 2 x i16> @llvm.masked.gather.nxv2i16.nxv2p0i16(<vscale x 2 x i16*> %ptrs, i32 2, <vscale x 2 x i1> %m, <vscale x 2 x i16> %passthru)
				%ev = zext <vscale x 2 x i16> %v to <vscale x 2 x i64>
				ret <vscale x 2 x i64> %ev
				}

				declare <vscale x 4 x i16> @llvm.masked.gather.nxv4i16.nxv4p0i16(<vscale x 4 x i16*>, i32, <vscale x 4 x i1>, <vscale x 4 x i16>)

				define <vscale x 4 x i16> @mgather_nxv4i16(<vscale x 4 x i16*> %ptrs, <vscale x 4 x i1> %m, <vscale x 4 x i16> %passthru) {
				; RV32-LABEL: mgather_nxv4i16:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e16,m1,tu,mu
				; RV32-NEXT: vloxei32.v v10, (zero), v8, v0.t
				; RV32-NEXT: vmv1r.v v8, v10
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_nxv4i16:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e16,m1,tu,mu
				; RV64-NEXT: vloxei64.v v12, (zero), v8, v0.t
				; RV64-NEXT: vmv1r.v v8, v12
				; RV64-NEXT: ret
				%v = call <vscale x 4 x i16> @llvm.masked.gather.nxv4i16.nxv4p0i16(<vscale x 4 x i16*> %ptrs, i32 2, <vscale x 4 x i1> %m, <vscale x 4 x i16> %passthru)
				ret <vscale x 4 x i16> %v
				}

				define <vscale x 4 x i16> @mgather_truemask_nxv4i16(<vscale x 4 x i16*> %ptrs, <vscale x 4 x i16> %passthru) {
				; RV32-LABEL: mgather_truemask_nxv4i16:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e16,m1,ta,mu
				; RV32-NEXT: vloxei32.v v8, (zero), v8
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_truemask_nxv4i16:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e16,m1,ta,mu
				; RV64-NEXT: vloxei64.v v8, (zero), v8
				; RV64-NEXT: ret
				%mhead = insertelement <vscale x 4 x i1> undef, i1 1, i32 0
				%mtrue = shufflevector <vscale x 4 x i1> %mhead, <vscale x 4 x i1> undef, <vscale x 4 x i32> zeroinitializer
				%v = call <vscale x 4 x i16> @llvm.masked.gather.nxv4i16.nxv4p0i16(<vscale x 4 x i16*> %ptrs, i32 2, <vscale x 4 x i1> %mtrue, <vscale x 4 x i16> %passthru)
				ret <vscale x 4 x i16> %v
				}

				declare <vscale x 8 x i16> @llvm.masked.gather.nxv8i16.nxv8p0i16(<vscale x 8 x i16*>, i32, <vscale x 8 x i1>, <vscale x 8 x i16>)

				define <vscale x 8 x i16> @mgather_nxv8i16(<vscale x 8 x i16*> %ptrs, <vscale x 8 x i1> %m, <vscale x 8 x i16> %passthru) {
				; RV32-LABEL: mgather_nxv8i16:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e16,m2,tu,mu
				; RV32-NEXT: vloxei32.v v12, (zero), v8, v0.t
				; RV32-NEXT: vmv2r.v v8, v12
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_nxv8i16:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e16,m2,tu,mu
				; RV64-NEXT: vloxei64.v v16, (zero), v8, v0.t
				; RV64-NEXT: vmv2r.v v8, v16
				; RV64-NEXT: ret
				%v = call <vscale x 8 x i16> @llvm.masked.gather.nxv8i16.nxv8p0i16(<vscale x 8 x i16*> %ptrs, i32 2, <vscale x 8 x i1> %m, <vscale x 8 x i16> %passthru)
				ret <vscale x 8 x i16> %v
				}

				define <vscale x 8 x i16> @mgather_baseidx_nxv8i8_nxv8i16(i16* %base, <vscale x 8 x i8> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x i16> %passthru) {
				; RV32-LABEL: mgather_baseidx_nxv8i8_nxv8i16:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e32,m4,ta,mu
				; RV32-NEXT: vsext.vf4 v28, v8
				; RV32-NEXT: vsll.vi v28, v28, 1
				; RV32-NEXT: vsetvli a1, zero, e16,m2,tu,mu
				; RV32-NEXT: vloxei32.v v10, (a0), v28, v0.t
				; RV32-NEXT: vmv2r.v v8, v10
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_nxv8i8_nxv8i16:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vsext.vf8 v16, v8
				; RV64-NEXT: vsll.vi v16, v16, 1
				; RV64-NEXT: vsetvli a1, zero, e16,m2,tu,mu
				; RV64-NEXT: vloxei64.v v10, (a0), v16, v0.t
				; RV64-NEXT: vmv2r.v v8, v10
				; RV64-NEXT: ret
				%ptrs = getelementptr inbounds i16, i16* %base, <vscale x 8 x i8> %idxs
				%v = call <vscale x 8 x i16> @llvm.masked.gather.nxv8i16.nxv8p0i16(<vscale x 8 x i16*> %ptrs, i32 2, <vscale x 8 x i1> %m, <vscale x 8 x i16> %passthru)
				ret <vscale x 8 x i16> %v
				}

				define <vscale x 8 x i16> @mgather_baseidx_sext_nxv8i8_nxv8i16(i16* %base, <vscale x 8 x i8> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x i16> %passthru) {
				; RV32-LABEL: mgather_baseidx_sext_nxv8i8_nxv8i16:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e32,m4,ta,mu
				; RV32-NEXT: vsext.vf4 v28, v8
				; RV32-NEXT: vsll.vi v28, v28, 1
				; RV32-NEXT: vsetvli a1, zero, e16,m2,tu,mu
				; RV32-NEXT: vloxei32.v v10, (a0), v28, v0.t
				; RV32-NEXT: vmv2r.v v8, v10
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_sext_nxv8i8_nxv8i16:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vsext.vf8 v16, v8
				; RV64-NEXT: vsll.vi v16, v16, 1
				; RV64-NEXT: vsetvli a1, zero, e16,m2,tu,mu
				; RV64-NEXT: vloxei64.v v10, (a0), v16, v0.t
				; RV64-NEXT: vmv2r.v v8, v10
				; RV64-NEXT: ret
				%eidxs = sext <vscale x 8 x i8> %idxs to <vscale x 8 x i16>
				%ptrs = getelementptr inbounds i16, i16* %base, <vscale x 8 x i16> %eidxs
				%v = call <vscale x 8 x i16> @llvm.masked.gather.nxv8i16.nxv8p0i16(<vscale x 8 x i16*> %ptrs, i32 2, <vscale x 8 x i1> %m, <vscale x 8 x i16> %passthru)
				ret <vscale x 8 x i16> %v
				}

				define <vscale x 8 x i16> @mgather_baseidx_zext_nxv8i8_nxv8i16(i16* %base, <vscale x 8 x i8> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x i16> %passthru) {
				; RV32-LABEL: mgather_baseidx_zext_nxv8i8_nxv8i16:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e32,m4,ta,mu
				; RV32-NEXT: vzext.vf4 v28, v8
				; RV32-NEXT: vsll.vi v28, v28, 1
				; RV32-NEXT: vsetvli a1, zero, e16,m2,tu,mu
				; RV32-NEXT: vloxei32.v v10, (a0), v28, v0.t
				; RV32-NEXT: vmv2r.v v8, v10
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_zext_nxv8i8_nxv8i16:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vzext.vf8 v16, v8
				; RV64-NEXT: vsll.vi v16, v16, 1
				; RV64-NEXT: vsetvli a1, zero, e16,m2,tu,mu
				; RV64-NEXT: vloxei64.v v10, (a0), v16, v0.t
				; RV64-NEXT: vmv2r.v v8, v10
				; RV64-NEXT: ret
				%eidxs = zext <vscale x 8 x i8> %idxs to <vscale x 8 x i16>
				%ptrs = getelementptr inbounds i16, i16* %base, <vscale x 8 x i16> %eidxs
				%v = call <vscale x 8 x i16> @llvm.masked.gather.nxv8i16.nxv8p0i16(<vscale x 8 x i16*> %ptrs, i32 2, <vscale x 8 x i1> %m, <vscale x 8 x i16> %passthru)
				ret <vscale x 8 x i16> %v
				}

				define <vscale x 8 x i16> @mgather_baseidx_nxv8i16(i16* %base, <vscale x 8 x i16> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x i16> %passthru) {
				; RV32-LABEL: mgather_baseidx_nxv8i16:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e32,m4,ta,mu
				; RV32-NEXT: vsext.vf2 v28, v8
				; RV32-NEXT: vsll.vi v28, v28, 1
				; RV32-NEXT: vsetvli a1, zero, e16,m2,tu,mu
				; RV32-NEXT: vloxei32.v v10, (a0), v28, v0.t
				; RV32-NEXT: vmv2r.v v8, v10
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_nxv8i16:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vsext.vf4 v16, v8
				; RV64-NEXT: vsll.vi v16, v16, 1
				; RV64-NEXT: vsetvli a1, zero, e16,m2,tu,mu
				; RV64-NEXT: vloxei64.v v10, (a0), v16, v0.t
				; RV64-NEXT: vmv2r.v v8, v10
				; RV64-NEXT: ret
				%ptrs = getelementptr inbounds i16, i16* %base, <vscale x 8 x i16> %idxs
				%v = call <vscale x 8 x i16> @llvm.masked.gather.nxv8i16.nxv8p0i16(<vscale x 8 x i16*> %ptrs, i32 2, <vscale x 8 x i1> %m, <vscale x 8 x i16> %passthru)
				ret <vscale x 8 x i16> %v
				}

				declare <vscale x 1 x i32> @llvm.masked.gather.nxv1i32.nxv1p0i32(<vscale x 1 x i32*>, i32, <vscale x 1 x i1>, <vscale x 1 x i32>)

				define <vscale x 1 x i32> @mgather_nxv1i32(<vscale x 1 x i32*> %ptrs, <vscale x 1 x i1> %m, <vscale x 1 x i32> %passthru) {
				; RV32-LABEL: mgather_nxv1i32:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e32,mf2,tu,mu
				; RV32-NEXT: vloxei32.v v9, (zero), v8, v0.t
				; RV32-NEXT: vmv1r.v v8, v9
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_nxv1i32:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e32,mf2,tu,mu
				; RV64-NEXT: vloxei64.v v9, (zero), v8, v0.t
				; RV64-NEXT: vmv1r.v v8, v9
				; RV64-NEXT: ret
				%v = call <vscale x 1 x i32> @llvm.masked.gather.nxv1i32.nxv1p0i32(<vscale x 1 x i32*> %ptrs, i32 4, <vscale x 1 x i1> %m, <vscale x 1 x i32> %passthru)
				ret <vscale x 1 x i32> %v
				}

				declare <vscale x 2 x i32> @llvm.masked.gather.nxv2i32.nxv2p0i32(<vscale x 2 x i32*>, i32, <vscale x 2 x i1>, <vscale x 2 x i32>)

				define <vscale x 2 x i32> @mgather_nxv2i32(<vscale x 2 x i32*> %ptrs, <vscale x 2 x i1> %m, <vscale x 2 x i32> %passthru) {
				; RV32-LABEL: mgather_nxv2i32:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e32,m1,tu,mu
				; RV32-NEXT: vloxei32.v v9, (zero), v8, v0.t
				; RV32-NEXT: vmv1r.v v8, v9
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_nxv2i32:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e32,m1,tu,mu
				; RV64-NEXT: vloxei64.v v10, (zero), v8, v0.t
				; RV64-NEXT: vmv1r.v v8, v10
				; RV64-NEXT: ret
				%v = call <vscale x 2 x i32> @llvm.masked.gather.nxv2i32.nxv2p0i32(<vscale x 2 x i32*> %ptrs, i32 4, <vscale x 2 x i1> %m, <vscale x 2 x i32> %passthru)
				ret <vscale x 2 x i32> %v
				}

				define <vscale x 2 x i64> @mgather_nxv2i32_sextload_nxv2i64(<vscale x 2 x i32*> %ptrs, <vscale x 2 x i1> %m, <vscale x 2 x i32> %passthru) {
				; RV32-LABEL: mgather_nxv2i32_sextload_nxv2i64:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e32,m1,tu,mu
				; RV32-NEXT: vloxei32.v v9, (zero), v8, v0.t
				; RV32-NEXT: vsetvli a0, zero, e64,m2,ta,mu
				; RV32-NEXT: vsext.vf2 v26, v9
				; RV32-NEXT: vmv2r.v v8, v26
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_nxv2i32_sextload_nxv2i64:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e32,m1,tu,mu
				; RV64-NEXT: vloxei64.v v10, (zero), v8, v0.t
				; RV64-NEXT: vsetvli a0, zero, e64,m2,ta,mu
				; RV64-NEXT: vsext.vf2 v8, v10
				; RV64-NEXT: ret
				%v = call <vscale x 2 x i32> @llvm.masked.gather.nxv2i32.nxv2p0i32(<vscale x 2 x i32*> %ptrs, i32 4, <vscale x 2 x i1> %m, <vscale x 2 x i32> %passthru)
				%ev = sext <vscale x 2 x i32> %v to <vscale x 2 x i64>
				ret <vscale x 2 x i64> %ev
				}

				define <vscale x 2 x i64> @mgather_nxv2i32_zextload_nxv2i64(<vscale x 2 x i32*> %ptrs, <vscale x 2 x i1> %m, <vscale x 2 x i32> %passthru) {
				; RV32-LABEL: mgather_nxv2i32_zextload_nxv2i64:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e32,m1,tu,mu
				; RV32-NEXT: vloxei32.v v9, (zero), v8, v0.t
				; RV32-NEXT: vsetvli a0, zero, e64,m2,ta,mu
				; RV32-NEXT: vzext.vf2 v26, v9
				; RV32-NEXT: vmv2r.v v8, v26
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_nxv2i32_zextload_nxv2i64:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e32,m1,tu,mu
				; RV64-NEXT: vloxei64.v v10, (zero), v8, v0.t
				; RV64-NEXT: vsetvli a0, zero, e64,m2,ta,mu
				; RV64-NEXT: vzext.vf2 v8, v10
				; RV64-NEXT: ret
				%v = call <vscale x 2 x i32> @llvm.masked.gather.nxv2i32.nxv2p0i32(<vscale x 2 x i32*> %ptrs, i32 4, <vscale x 2 x i1> %m, <vscale x 2 x i32> %passthru)
				%ev = zext <vscale x 2 x i32> %v to <vscale x 2 x i64>
				ret <vscale x 2 x i64> %ev
				}

				declare <vscale x 4 x i32> @llvm.masked.gather.nxv4i32.nxv4p0i32(<vscale x 4 x i32*>, i32, <vscale x 4 x i1>, <vscale x 4 x i32>)

				define <vscale x 4 x i32> @mgather_nxv4i32(<vscale x 4 x i32*> %ptrs, <vscale x 4 x i1> %m, <vscale x 4 x i32> %passthru) {
				; RV32-LABEL: mgather_nxv4i32:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e32,m2,tu,mu
				; RV32-NEXT: vloxei32.v v10, (zero), v8, v0.t
				; RV32-NEXT: vmv2r.v v8, v10
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_nxv4i32:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e32,m2,tu,mu
				; RV64-NEXT: vloxei64.v v12, (zero), v8, v0.t
				; RV64-NEXT: vmv2r.v v8, v12
				; RV64-NEXT: ret
				%v = call <vscale x 4 x i32> @llvm.masked.gather.nxv4i32.nxv4p0i32(<vscale x 4 x i32*> %ptrs, i32 4, <vscale x 4 x i1> %m, <vscale x 4 x i32> %passthru)
				ret <vscale x 4 x i32> %v
				}

				define <vscale x 4 x i32> @mgather_truemask_nxv4i32(<vscale x 4 x i32*> %ptrs, <vscale x 4 x i32> %passthru) {
				; RV32-LABEL: mgather_truemask_nxv4i32:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e32,m2,ta,mu
				; RV32-NEXT: vloxei32.v v8, (zero), v8
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_truemask_nxv4i32:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e32,m2,ta,mu
				; RV64-NEXT: vloxei64.v v8, (zero), v8
				; RV64-NEXT: ret
				%mhead = insertelement <vscale x 4 x i1> undef, i1 1, i32 0
				%mtrue = shufflevector <vscale x 4 x i1> %mhead, <vscale x 4 x i1> undef, <vscale x 4 x i32> zeroinitializer
				%v = call <vscale x 4 x i32> @llvm.masked.gather.nxv4i32.nxv4p0i32(<vscale x 4 x i32*> %ptrs, i32 4, <vscale x 4 x i1> %mtrue, <vscale x 4 x i32> %passthru)
				ret <vscale x 4 x i32> %v
				}

				declare <vscale x 8 x i32> @llvm.masked.gather.nxv8i32.nxv8p0i32(<vscale x 8 x i32*>, i32, <vscale x 8 x i1>, <vscale x 8 x i32>)

				define <vscale x 8 x i32> @mgather_nxv8i32(<vscale x 8 x i32*> %ptrs, <vscale x 8 x i1> %m, <vscale x 8 x i32> %passthru) {
				; RV32-LABEL: mgather_nxv8i32:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e32,m4,tu,mu
				; RV32-NEXT: vloxei32.v v12, (zero), v8, v0.t
				; RV32-NEXT: vmv4r.v v8, v12
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_nxv8i32:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e32,m4,tu,mu
				; RV64-NEXT: vloxei64.v v16, (zero), v8, v0.t
				; RV64-NEXT: vmv4r.v v8, v16
				; RV64-NEXT: ret
				%v = call <vscale x 8 x i32> @llvm.masked.gather.nxv8i32.nxv8p0i32(<vscale x 8 x i32*> %ptrs, i32 4, <vscale x 8 x i1> %m, <vscale x 8 x i32> %passthru)
				ret <vscale x 8 x i32> %v
				}

				define <vscale x 8 x i32> @mgather_baseidx_nxv8i8_nxv8i32(i32* %base, <vscale x 8 x i8> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x i32> %passthru) {
				; RV32-LABEL: mgather_baseidx_nxv8i8_nxv8i32:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e32,m4,ta,mu
				; RV32-NEXT: vsext.vf4 v28, v8
				; RV32-NEXT: vsll.vi v28, v28, 2
				; RV32-NEXT: vsetvli a1, zero, e32,m4,tu,mu
				; RV32-NEXT: vloxei32.v v12, (a0), v28, v0.t
				; RV32-NEXT: vmv4r.v v8, v12
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_nxv8i8_nxv8i32:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vsext.vf8 v16, v8
				; RV64-NEXT: vsll.vi v16, v16, 2
				; RV64-NEXT: vsetvli a1, zero, e32,m4,tu,mu
				; RV64-NEXT: vloxei64.v v12, (a0), v16, v0.t
				; RV64-NEXT: vmv4r.v v8, v12
				; RV64-NEXT: ret
				%ptrs = getelementptr inbounds i32, i32* %base, <vscale x 8 x i8> %idxs
				%v = call <vscale x 8 x i32> @llvm.masked.gather.nxv8i32.nxv8p0i32(<vscale x 8 x i32*> %ptrs, i32 4, <vscale x 8 x i1> %m, <vscale x 8 x i32> %passthru)
				ret <vscale x 8 x i32> %v
				}

				define <vscale x 8 x i32> @mgather_baseidx_sext_nxv8i8_nxv8i32(i32* %base, <vscale x 8 x i8> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x i32> %passthru) {
				; RV32-LABEL: mgather_baseidx_sext_nxv8i8_nxv8i32:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e32,m4,ta,mu
				; RV32-NEXT: vsext.vf4 v28, v8
				; RV32-NEXT: vsll.vi v28, v28, 2
				; RV32-NEXT: vsetvli a1, zero, e32,m4,tu,mu
				; RV32-NEXT: vloxei32.v v12, (a0), v28, v0.t
				; RV32-NEXT: vmv4r.v v8, v12
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_sext_nxv8i8_nxv8i32:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vsext.vf8 v16, v8
				; RV64-NEXT: vsll.vi v16, v16, 2
				; RV64-NEXT: vsetvli a1, zero, e32,m4,tu,mu
				; RV64-NEXT: vloxei64.v v12, (a0), v16, v0.t
				; RV64-NEXT: vmv4r.v v8, v12
				; RV64-NEXT: ret
				%eidxs = sext <vscale x 8 x i8> %idxs to <vscale x 8 x i32>
				%ptrs = getelementptr inbounds i32, i32* %base, <vscale x 8 x i32> %eidxs
				%v = call <vscale x 8 x i32> @llvm.masked.gather.nxv8i32.nxv8p0i32(<vscale x 8 x i32*> %ptrs, i32 4, <vscale x 8 x i1> %m, <vscale x 8 x i32> %passthru)
				ret <vscale x 8 x i32> %v
				}

				define <vscale x 8 x i32> @mgather_baseidx_zext_nxv8i8_nxv8i32(i32* %base, <vscale x 8 x i8> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x i32> %passthru) {
				; RV32-LABEL: mgather_baseidx_zext_nxv8i8_nxv8i32:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e32,m4,ta,mu
				; RV32-NEXT: vzext.vf4 v28, v8
				; RV32-NEXT: vsll.vi v28, v28, 2
				; RV32-NEXT: vsetvli a1, zero, e32,m4,tu,mu
				; RV32-NEXT: vloxei32.v v12, (a0), v28, v0.t
				; RV32-NEXT: vmv4r.v v8, v12
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_zext_nxv8i8_nxv8i32:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vzext.vf8 v16, v8
				; RV64-NEXT: vsll.vi v16, v16, 2
				; RV64-NEXT: vsetvli a1, zero, e32,m4,tu,mu
				; RV64-NEXT: vloxei64.v v12, (a0), v16, v0.t
				; RV64-NEXT: vmv4r.v v8, v12
				; RV64-NEXT: ret
				%eidxs = zext <vscale x 8 x i8> %idxs to <vscale x 8 x i32>
				%ptrs = getelementptr inbounds i32, i32* %base, <vscale x 8 x i32> %eidxs
				%v = call <vscale x 8 x i32> @llvm.masked.gather.nxv8i32.nxv8p0i32(<vscale x 8 x i32*> %ptrs, i32 4, <vscale x 8 x i1> %m, <vscale x 8 x i32> %passthru)
				ret <vscale x 8 x i32> %v
				}

				define <vscale x 8 x i32> @mgather_baseidx_nxv8i16_nxv8i32(i32* %base, <vscale x 8 x i16> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x i32> %passthru) {
				; RV32-LABEL: mgather_baseidx_nxv8i16_nxv8i32:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e32,m4,ta,mu
				; RV32-NEXT: vsext.vf2 v28, v8
				; RV32-NEXT: vsll.vi v28, v28, 2
				; RV32-NEXT: vsetvli a1, zero, e32,m4,tu,mu
				; RV32-NEXT: vloxei32.v v12, (a0), v28, v0.t
				; RV32-NEXT: vmv4r.v v8, v12
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_nxv8i16_nxv8i32:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vsext.vf4 v16, v8
				; RV64-NEXT: vsll.vi v16, v16, 2
				; RV64-NEXT: vsetvli a1, zero, e32,m4,tu,mu
				; RV64-NEXT: vloxei64.v v12, (a0), v16, v0.t
				; RV64-NEXT: vmv4r.v v8, v12
				; RV64-NEXT: ret
				%ptrs = getelementptr inbounds i32, i32* %base, <vscale x 8 x i16> %idxs
				%v = call <vscale x 8 x i32> @llvm.masked.gather.nxv8i32.nxv8p0i32(<vscale x 8 x i32*> %ptrs, i32 4, <vscale x 8 x i1> %m, <vscale x 8 x i32> %passthru)
				ret <vscale x 8 x i32> %v
				}

				define <vscale x 8 x i32> @mgather_baseidx_sext_nxv8i16_nxv8i32(i32* %base, <vscale x 8 x i16> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x i32> %passthru) {
				; RV32-LABEL: mgather_baseidx_sext_nxv8i16_nxv8i32:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e32,m4,ta,mu
				; RV32-NEXT: vsext.vf2 v28, v8
				; RV32-NEXT: vsll.vi v28, v28, 2
				; RV32-NEXT: vsetvli a1, zero, e32,m4,tu,mu
				; RV32-NEXT: vloxei32.v v12, (a0), v28, v0.t
				; RV32-NEXT: vmv4r.v v8, v12
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_sext_nxv8i16_nxv8i32:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vsext.vf4 v16, v8
				; RV64-NEXT: vsll.vi v16, v16, 2
				; RV64-NEXT: vsetvli a1, zero, e32,m4,tu,mu
				; RV64-NEXT: vloxei64.v v12, (a0), v16, v0.t
				; RV64-NEXT: vmv4r.v v8, v12
				; RV64-NEXT: ret
				%eidxs = sext <vscale x 8 x i16> %idxs to <vscale x 8 x i32>
				%ptrs = getelementptr inbounds i32, i32* %base, <vscale x 8 x i32> %eidxs
				%v = call <vscale x 8 x i32> @llvm.masked.gather.nxv8i32.nxv8p0i32(<vscale x 8 x i32*> %ptrs, i32 4, <vscale x 8 x i1> %m, <vscale x 8 x i32> %passthru)
				ret <vscale x 8 x i32> %v
				}

				define <vscale x 8 x i32> @mgather_baseidx_zext_nxv8i16_nxv8i32(i32* %base, <vscale x 8 x i16> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x i32> %passthru) {
				; RV32-LABEL: mgather_baseidx_zext_nxv8i16_nxv8i32:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e32,m4,ta,mu
				; RV32-NEXT: vzext.vf2 v28, v8
				; RV32-NEXT: vsll.vi v28, v28, 2
				; RV32-NEXT: vsetvli a1, zero, e32,m4,tu,mu
				; RV32-NEXT: vloxei32.v v12, (a0), v28, v0.t
				; RV32-NEXT: vmv4r.v v8, v12
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_zext_nxv8i16_nxv8i32:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vzext.vf4 v16, v8
				; RV64-NEXT: vsll.vi v16, v16, 2
				; RV64-NEXT: vsetvli a1, zero, e32,m4,tu,mu
				; RV64-NEXT: vloxei64.v v12, (a0), v16, v0.t
				; RV64-NEXT: vmv4r.v v8, v12
				; RV64-NEXT: ret
				%eidxs = zext <vscale x 8 x i16> %idxs to <vscale x 8 x i32>
				%ptrs = getelementptr inbounds i32, i32* %base, <vscale x 8 x i32> %eidxs
				%v = call <vscale x 8 x i32> @llvm.masked.gather.nxv8i32.nxv8p0i32(<vscale x 8 x i32*> %ptrs, i32 4, <vscale x 8 x i1> %m, <vscale x 8 x i32> %passthru)
				ret <vscale x 8 x i32> %v
				}

				define <vscale x 8 x i32> @mgather_baseidx_nxv8i32(i32* %base, <vscale x 8 x i32> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x i32> %passthru) {
				; RV32-LABEL: mgather_baseidx_nxv8i32:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e32,m4,ta,mu
				; RV32-NEXT: vsll.vi v28, v8, 2
				; RV32-NEXT: vsetvli a1, zero, e32,m4,tu,mu
				; RV32-NEXT: vloxei32.v v12, (a0), v28, v0.t
				; RV32-NEXT: vmv4r.v v8, v12
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_nxv8i32:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vsext.vf2 v16, v8
				; RV64-NEXT: vsll.vi v16, v16, 2
				; RV64-NEXT: vsetvli a1, zero, e32,m4,tu,mu
				; RV64-NEXT: vloxei64.v v12, (a0), v16, v0.t
				; RV64-NEXT: vmv4r.v v8, v12
				; RV64-NEXT: ret
				%ptrs = getelementptr inbounds i32, i32* %base, <vscale x 8 x i32> %idxs
				%v = call <vscale x 8 x i32> @llvm.masked.gather.nxv8i32.nxv8p0i32(<vscale x 8 x i32*> %ptrs, i32 4, <vscale x 8 x i1> %m, <vscale x 8 x i32> %passthru)
				ret <vscale x 8 x i32> %v
				}

				declare <vscale x 1 x i64> @llvm.masked.gather.nxv1i64.nxv1p0i64(<vscale x 1 x i64*>, i32, <vscale x 1 x i1>, <vscale x 1 x i64>)

				define <vscale x 1 x i64> @mgather_nxv1i64(<vscale x 1 x i64*> %ptrs, <vscale x 1 x i1> %m, <vscale x 1 x i64> %passthru) {
				; RV32-LABEL: mgather_nxv1i64:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e64,m1,tu,mu
				; RV32-NEXT: vloxei32.v v9, (zero), v8, v0.t
				; RV32-NEXT: vmv1r.v v8, v9
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_nxv1i64:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e64,m1,tu,mu
				; RV64-NEXT: vloxei64.v v9, (zero), v8, v0.t
				; RV64-NEXT: vmv1r.v v8, v9
				; RV64-NEXT: ret
				%v = call <vscale x 1 x i64> @llvm.masked.gather.nxv1i64.nxv1p0i64(<vscale x 1 x i64*> %ptrs, i32 8, <vscale x 1 x i1> %m, <vscale x 1 x i64> %passthru)
				ret <vscale x 1 x i64> %v
				}

				declare <vscale x 2 x i64> @llvm.masked.gather.nxv2i64.nxv2p0i64(<vscale x 2 x i64*>, i32, <vscale x 2 x i1>, <vscale x 2 x i64>)

				define <vscale x 2 x i64> @mgather_nxv2i64(<vscale x 2 x i64*> %ptrs, <vscale x 2 x i1> %m, <vscale x 2 x i64> %passthru) {
				; RV32-LABEL: mgather_nxv2i64:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e64,m2,tu,mu
				; RV32-NEXT: vloxei32.v v10, (zero), v8, v0.t
				; RV32-NEXT: vmv2r.v v8, v10
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_nxv2i64:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e64,m2,tu,mu
				; RV64-NEXT: vloxei64.v v10, (zero), v8, v0.t
				; RV64-NEXT: vmv2r.v v8, v10
				; RV64-NEXT: ret
				%v = call <vscale x 2 x i64> @llvm.masked.gather.nxv2i64.nxv2p0i64(<vscale x 2 x i64*> %ptrs, i32 8, <vscale x 2 x i1> %m, <vscale x 2 x i64> %passthru)
				ret <vscale x 2 x i64> %v
				}

				declare <vscale x 4 x i64> @llvm.masked.gather.nxv4i64.nxv4p0i64(<vscale x 4 x i64*>, i32, <vscale x 4 x i1>, <vscale x 4 x i64>)

				define <vscale x 4 x i64> @mgather_nxv4i64(<vscale x 4 x i64*> %ptrs, <vscale x 4 x i1> %m, <vscale x 4 x i64> %passthru) {
				; RV32-LABEL: mgather_nxv4i64:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e64,m4,tu,mu
				; RV32-NEXT: vloxei32.v v12, (zero), v8, v0.t
				; RV32-NEXT: vmv4r.v v8, v12
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_nxv4i64:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e64,m4,tu,mu
				; RV64-NEXT: vloxei64.v v12, (zero), v8, v0.t
				; RV64-NEXT: vmv4r.v v8, v12
				; RV64-NEXT: ret
				%v = call <vscale x 4 x i64> @llvm.masked.gather.nxv4i64.nxv4p0i64(<vscale x 4 x i64*> %ptrs, i32 8, <vscale x 4 x i1> %m, <vscale x 4 x i64> %passthru)
				ret <vscale x 4 x i64> %v
				}

				define <vscale x 4 x i64> @mgather_truemask_nxv4i64(<vscale x 4 x i64*> %ptrs, <vscale x 4 x i64> %passthru) {
				; RV32-LABEL: mgather_truemask_nxv4i64:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e64,m4,ta,mu
				; RV32-NEXT: vloxei32.v v8, (zero), v8
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_truemask_nxv4i64:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e64,m4,ta,mu
				; RV64-NEXT: vloxei64.v v8, (zero), v8
				; RV64-NEXT: ret
				%mhead = insertelement <vscale x 4 x i1> undef, i1 1, i32 0
				%mtrue = shufflevector <vscale x 4 x i1> %mhead, <vscale x 4 x i1> undef, <vscale x 4 x i32> zeroinitializer
				%v = call <vscale x 4 x i64> @llvm.masked.gather.nxv4i64.nxv4p0i64(<vscale x 4 x i64*> %ptrs, i32 8, <vscale x 4 x i1> %mtrue, <vscale x 4 x i64> %passthru)
				ret <vscale x 4 x i64> %v
				}

				declare <vscale x 8 x i64> @llvm.masked.gather.nxv8i64.nxv8p0i64(<vscale x 8 x i64*>, i32, <vscale x 8 x i1>, <vscale x 8 x i64>)

				define <vscale x 8 x i64> @mgather_nxv8i64(<vscale x 8 x i64*> %ptrs, <vscale x 8 x i1> %m, <vscale x 8 x i64> %passthru) {
				; RV32-LABEL: mgather_nxv8i64:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e64,m8,tu,mu
				; RV32-NEXT: vloxei32.v v16, (zero), v8, v0.t
				; RV32-NEXT: vmv8r.v v8, v16
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_nxv8i64:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e64,m8,tu,mu
				; RV64-NEXT: vloxei64.v v16, (zero), v8, v0.t
				; RV64-NEXT: vmv8r.v v8, v16
				; RV64-NEXT: ret
				%v = call <vscale x 8 x i64> @llvm.masked.gather.nxv8i64.nxv8p0i64(<vscale x 8 x i64*> %ptrs, i32 8, <vscale x 8 x i1> %m, <vscale x 8 x i64> %passthru)
				ret <vscale x 8 x i64> %v
				}

				define <vscale x 8 x i64> @mgather_baseidx_nxv8i8_nxv8i64(i64* %base, <vscale x 8 x i8> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x i64> %passthru) {
				; RV32-LABEL: mgather_baseidx_nxv8i8_nxv8i64:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e32,m4,ta,mu
				; RV32-NEXT: vsext.vf4 v28, v8
				; RV32-NEXT: vsll.vi v28, v28, 3
				; RV32-NEXT: vsetvli a1, zero, e64,m8,tu,mu
				; RV32-NEXT: vloxei32.v v16, (a0), v28, v0.t
				; RV32-NEXT: vmv8r.v v8, v16
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_nxv8i8_nxv8i64:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vsext.vf8 v24, v8
				; RV64-NEXT: vsll.vi v8, v24, 3
				; RV64-NEXT: vsetvli a1, zero, e64,m8,tu,mu
				; RV64-NEXT: vloxei64.v v16, (a0), v8, v0.t
				; RV64-NEXT: vmv8r.v v8, v16
				; RV64-NEXT: ret
				%ptrs = getelementptr inbounds i64, i64* %base, <vscale x 8 x i8> %idxs
				%v = call <vscale x 8 x i64> @llvm.masked.gather.nxv8i64.nxv8p0i64(<vscale x 8 x i64*> %ptrs, i32 8, <vscale x 8 x i1> %m, <vscale x 8 x i64> %passthru)
				ret <vscale x 8 x i64> %v
				}

				define <vscale x 8 x i64> @mgather_baseidx_sext_nxv8i8_nxv8i64(i64* %base, <vscale x 8 x i8> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x i64> %passthru) {
				; RV32-LABEL: mgather_baseidx_sext_nxv8i8_nxv8i64:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV32-NEXT: vsext.vf8 v24, v8
				; RV32-NEXT: vsll.vi v8, v24, 3
				; RV32-NEXT: vsetvli a1, zero, e64,m8,tu,mu
				; RV32-NEXT: vloxei64.v v16, (a0), v8, v0.t
				; RV32-NEXT: vmv8r.v v8, v16
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_sext_nxv8i8_nxv8i64:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vsext.vf8 v24, v8
				; RV64-NEXT: vsll.vi v8, v24, 3
				; RV64-NEXT: vsetvli a1, zero, e64,m8,tu,mu
				; RV64-NEXT: vloxei64.v v16, (a0), v8, v0.t
				; RV64-NEXT: vmv8r.v v8, v16
				; RV64-NEXT: ret
				%eidxs = sext <vscale x 8 x i8> %idxs to <vscale x 8 x i64>
				%ptrs = getelementptr inbounds i64, i64* %base, <vscale x 8 x i64> %eidxs
				%v = call <vscale x 8 x i64> @llvm.masked.gather.nxv8i64.nxv8p0i64(<vscale x 8 x i64*> %ptrs, i32 8, <vscale x 8 x i1> %m, <vscale x 8 x i64> %passthru)
				ret <vscale x 8 x i64> %v
				}

				define <vscale x 8 x i64> @mgather_baseidx_zext_nxv8i8_nxv8i64(i64* %base, <vscale x 8 x i8> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x i64> %passthru) {
				; RV32-LABEL: mgather_baseidx_zext_nxv8i8_nxv8i64:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV32-NEXT: vzext.vf8 v24, v8
				; RV32-NEXT: vsll.vi v8, v24, 3
				; RV32-NEXT: vsetvli a1, zero, e64,m8,tu,mu
				; RV32-NEXT: vloxei64.v v16, (a0), v8, v0.t
				; RV32-NEXT: vmv8r.v v8, v16
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_zext_nxv8i8_nxv8i64:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vzext.vf8 v24, v8
				; RV64-NEXT: vsll.vi v8, v24, 3
				; RV64-NEXT: vsetvli a1, zero, e64,m8,tu,mu
				; RV64-NEXT: vloxei64.v v16, (a0), v8, v0.t
				; RV64-NEXT: vmv8r.v v8, v16
				; RV64-NEXT: ret
				%eidxs = zext <vscale x 8 x i8> %idxs to <vscale x 8 x i64>
				%ptrs = getelementptr inbounds i64, i64* %base, <vscale x 8 x i64> %eidxs
				%v = call <vscale x 8 x i64> @llvm.masked.gather.nxv8i64.nxv8p0i64(<vscale x 8 x i64*> %ptrs, i32 8, <vscale x 8 x i1> %m, <vscale x 8 x i64> %passthru)
				ret <vscale x 8 x i64> %v
				}

				define <vscale x 8 x i64> @mgather_baseidx_nxv8i16_nxv8i64(i64* %base, <vscale x 8 x i16> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x i64> %passthru) {
				; RV32-LABEL: mgather_baseidx_nxv8i16_nxv8i64:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e32,m4,ta,mu
				; RV32-NEXT: vsext.vf2 v28, v8
				; RV32-NEXT: vsll.vi v28, v28, 3
				; RV32-NEXT: vsetvli a1, zero, e64,m8,tu,mu
				; RV32-NEXT: vloxei32.v v16, (a0), v28, v0.t
				; RV32-NEXT: vmv8r.v v8, v16
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_nxv8i16_nxv8i64:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vsext.vf4 v24, v8
				; RV64-NEXT: vsll.vi v8, v24, 3
				; RV64-NEXT: vsetvli a1, zero, e64,m8,tu,mu
				; RV64-NEXT: vloxei64.v v16, (a0), v8, v0.t
				; RV64-NEXT: vmv8r.v v8, v16
				; RV64-NEXT: ret
				%ptrs = getelementptr inbounds i64, i64* %base, <vscale x 8 x i16> %idxs
				%v = call <vscale x 8 x i64> @llvm.masked.gather.nxv8i64.nxv8p0i64(<vscale x 8 x i64*> %ptrs, i32 8, <vscale x 8 x i1> %m, <vscale x 8 x i64> %passthru)
				ret <vscale x 8 x i64> %v
				}

				define <vscale x 8 x i64> @mgather_baseidx_sext_nxv8i16_nxv8i64(i64* %base, <vscale x 8 x i16> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x i64> %passthru) {
				; RV32-LABEL: mgather_baseidx_sext_nxv8i16_nxv8i64:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV32-NEXT: vsext.vf4 v24, v8
				; RV32-NEXT: vsll.vi v8, v24, 3
				; RV32-NEXT: vsetvli a1, zero, e64,m8,tu,mu
				; RV32-NEXT: vloxei64.v v16, (a0), v8, v0.t
				; RV32-NEXT: vmv8r.v v8, v16
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_sext_nxv8i16_nxv8i64:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vsext.vf4 v24, v8
				; RV64-NEXT: vsll.vi v8, v24, 3
				; RV64-NEXT: vsetvli a1, zero, e64,m8,tu,mu
				; RV64-NEXT: vloxei64.v v16, (a0), v8, v0.t
				; RV64-NEXT: vmv8r.v v8, v16
				; RV64-NEXT: ret
				%eidxs = sext <vscale x 8 x i16> %idxs to <vscale x 8 x i64>
				%ptrs = getelementptr inbounds i64, i64* %base, <vscale x 8 x i64> %eidxs
				%v = call <vscale x 8 x i64> @llvm.masked.gather.nxv8i64.nxv8p0i64(<vscale x 8 x i64*> %ptrs, i32 8, <vscale x 8 x i1> %m, <vscale x 8 x i64> %passthru)
				ret <vscale x 8 x i64> %v
				}

				define <vscale x 8 x i64> @mgather_baseidx_zext_nxv8i16_nxv8i64(i64* %base, <vscale x 8 x i16> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x i64> %passthru) {
				; RV32-LABEL: mgather_baseidx_zext_nxv8i16_nxv8i64:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV32-NEXT: vzext.vf4 v24, v8
				; RV32-NEXT: vsll.vi v8, v24, 3
				; RV32-NEXT: vsetvli a1, zero, e64,m8,tu,mu
				; RV32-NEXT: vloxei64.v v16, (a0), v8, v0.t
				; RV32-NEXT: vmv8r.v v8, v16
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_zext_nxv8i16_nxv8i64:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vzext.vf4 v24, v8
				; RV64-NEXT: vsll.vi v8, v24, 3
				; RV64-NEXT: vsetvli a1, zero, e64,m8,tu,mu
				; RV64-NEXT: vloxei64.v v16, (a0), v8, v0.t
				; RV64-NEXT: vmv8r.v v8, v16
				; RV64-NEXT: ret
				%eidxs = zext <vscale x 8 x i16> %idxs to <vscale x 8 x i64>
				%ptrs = getelementptr inbounds i64, i64* %base, <vscale x 8 x i64> %eidxs
				%v = call <vscale x 8 x i64> @llvm.masked.gather.nxv8i64.nxv8p0i64(<vscale x 8 x i64*> %ptrs, i32 8, <vscale x 8 x i1> %m, <vscale x 8 x i64> %passthru)
				ret <vscale x 8 x i64> %v
				}

				define <vscale x 8 x i64> @mgather_baseidx_nxv8i32_nxv8i64(i64* %base, <vscale x 8 x i32> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x i64> %passthru) {
				; RV32-LABEL: mgather_baseidx_nxv8i32_nxv8i64:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e32,m4,ta,mu
				; RV32-NEXT: vsll.vi v28, v8, 3
				; RV32-NEXT: vsetvli a1, zero, e64,m8,tu,mu
				; RV32-NEXT: vloxei32.v v16, (a0), v28, v0.t
				; RV32-NEXT: vmv8r.v v8, v16
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_nxv8i32_nxv8i64:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vsext.vf2 v24, v8
				; RV64-NEXT: vsll.vi v8, v24, 3
				; RV64-NEXT: vsetvli a1, zero, e64,m8,tu,mu
				; RV64-NEXT: vloxei64.v v16, (a0), v8, v0.t
				; RV64-NEXT: vmv8r.v v8, v16
				; RV64-NEXT: ret
				%ptrs = getelementptr inbounds i64, i64* %base, <vscale x 8 x i32> %idxs
				%v = call <vscale x 8 x i64> @llvm.masked.gather.nxv8i64.nxv8p0i64(<vscale x 8 x i64*> %ptrs, i32 8, <vscale x 8 x i1> %m, <vscale x 8 x i64> %passthru)
				ret <vscale x 8 x i64> %v
				}

				define <vscale x 8 x i64> @mgather_baseidx_sext_nxv8i32_nxv8i64(i64* %base, <vscale x 8 x i32> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x i64> %passthru) {
				; RV32-LABEL: mgather_baseidx_sext_nxv8i32_nxv8i64:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV32-NEXT: vsext.vf2 v24, v8
				; RV32-NEXT: vsll.vi v8, v24, 3
				; RV32-NEXT: vsetvli a1, zero, e64,m8,tu,mu
				; RV32-NEXT: vloxei64.v v16, (a0), v8, v0.t
				; RV32-NEXT: vmv8r.v v8, v16
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_sext_nxv8i32_nxv8i64:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vsext.vf2 v24, v8
				; RV64-NEXT: vsll.vi v8, v24, 3
				; RV64-NEXT: vsetvli a1, zero, e64,m8,tu,mu
				; RV64-NEXT: vloxei64.v v16, (a0), v8, v0.t
				; RV64-NEXT: vmv8r.v v8, v16
				; RV64-NEXT: ret
				%eidxs = sext <vscale x 8 x i32> %idxs to <vscale x 8 x i64>
				%ptrs = getelementptr inbounds i64, i64* %base, <vscale x 8 x i64> %eidxs
				%v = call <vscale x 8 x i64> @llvm.masked.gather.nxv8i64.nxv8p0i64(<vscale x 8 x i64*> %ptrs, i32 8, <vscale x 8 x i1> %m, <vscale x 8 x i64> %passthru)
				ret <vscale x 8 x i64> %v
				}

				define <vscale x 8 x i64> @mgather_baseidx_zext_nxv8i32_nxv8i64(i64* %base, <vscale x 8 x i32> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x i64> %passthru) {
				; RV32-LABEL: mgather_baseidx_zext_nxv8i32_nxv8i64:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV32-NEXT: vzext.vf2 v24, v8
				; RV32-NEXT: vsll.vi v8, v24, 3
				; RV32-NEXT: vsetvli a1, zero, e64,m8,tu,mu
				; RV32-NEXT: vloxei64.v v16, (a0), v8, v0.t
				; RV32-NEXT: vmv8r.v v8, v16
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_zext_nxv8i32_nxv8i64:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vzext.vf2 v24, v8
				; RV64-NEXT: vsll.vi v8, v24, 3
				; RV64-NEXT: vsetvli a1, zero, e64,m8,tu,mu
				; RV64-NEXT: vloxei64.v v16, (a0), v8, v0.t
				; RV64-NEXT: vmv8r.v v8, v16
				; RV64-NEXT: ret
				%eidxs = zext <vscale x 8 x i32> %idxs to <vscale x 8 x i64>
				%ptrs = getelementptr inbounds i64, i64* %base, <vscale x 8 x i64> %eidxs
				%v = call <vscale x 8 x i64> @llvm.masked.gather.nxv8i64.nxv8p0i64(<vscale x 8 x i64*> %ptrs, i32 8, <vscale x 8 x i1> %m, <vscale x 8 x i64> %passthru)
				ret <vscale x 8 x i64> %v
				}

				define <vscale x 8 x i64> @mgather_baseidx_nxv8i64(i64* %base, <vscale x 8 x i64> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x i64> %passthru) {
				; RV32-LABEL: mgather_baseidx_nxv8i64:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV32-NEXT: vsll.vi v8, v8, 3
				; RV32-NEXT: vsetvli a1, zero, e64,m8,tu,mu
				; RV32-NEXT: vloxei64.v v16, (a0), v8, v0.t
				; RV32-NEXT: vmv8r.v v8, v16
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_nxv8i64:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vsll.vi v8, v8, 3
				; RV64-NEXT: vsetvli a1, zero, e64,m8,tu,mu
				; RV64-NEXT: vloxei64.v v16, (a0), v8, v0.t
				; RV64-NEXT: vmv8r.v v8, v16
				; RV64-NEXT: ret
				%ptrs = getelementptr inbounds i64, i64* %base, <vscale x 8 x i64> %idxs
				%v = call <vscale x 8 x i64> @llvm.masked.gather.nxv8i64.nxv8p0i64(<vscale x 8 x i64*> %ptrs, i32 8, <vscale x 8 x i1> %m, <vscale x 8 x i64> %passthru)
				ret <vscale x 8 x i64> %v
				}

				declare <vscale x 16 x i64> @llvm.masked.gather.nxv16i64.nxv16p0f64(<vscale x 16 x i64*>, i32, <vscale x 16 x i1>, <vscale x 16 x i64>)

				declare <vscale x 16 x i64> @llvm.experimental.vector.insert.nxv8i64.nxv16i64(<vscale x 16 x i64>, <vscale x 8 x i64>, i64 %idx)
				declare <vscale x 16 x i64> @llvm.experimental.vector.insert.nxv8p0i64.nxv16p0i64(<vscale x 16 x i64>, <vscale x 8 x i64*>, i64 %idx)

				define void @mgather_nxv16i64(<vscale x 8 x i64> %ptrs0, <vscale x 8 x i64> %ptrs1, <vscale x 16 x i1> %m, <vscale x 8 x i64> %passthru0, <vscale x 8 x i64> %passthru1, <vscale x 16 x i64>* %out) {
				; RV32-LABEL: mgather_nxv16i64:
				; RV32: # %bb.0:
				; RV32-NEXT: vl8re64.v v24, (a0)
				; RV32-NEXT: vsetvli a0, zero, e64,m8,tu,mu
				; RV32-NEXT: vloxei32.v v16, (zero), v8, v0.t
				; RV32-NEXT: csrr a0, vlenb
				; RV32-NEXT: srli a0, a0, 3
				; RV32-NEXT: vsetvli a2, zero, e8,mf4,ta,mu
				; RV32-NEXT: vslidedown.vx v0, v0, a0
				; RV32-NEXT: vsetvli a2, zero, e64,m8,tu,mu
				; RV32-NEXT: vloxei32.v v24, (zero), v12, v0.t
				; RV32-NEXT: slli a0, a0, 6
				; RV32-NEXT: add a0, a1, a0
				; RV32-NEXT: vs8r.v v24, (a0)
				; RV32-NEXT: vs8r.v v16, (a1)
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_nxv16i64:
				; RV64: # %bb.0:
				; RV64-NEXT: addi sp, sp, -16
				; RV64-NEXT: .cfi_def_cfa_offset 16
				; RV64-NEXT: csrr a3, vlenb
				; RV64-NEXT: slli a3, a3, 3
				; RV64-NEXT: sub sp, sp, a3
				; RV64-NEXT: vl8re64.v v24, (a0)
				; RV64-NEXT: addi a0, sp, 16
				; RV64-NEXT: vs8r.v v16, (a0) # Unknown-size Folded Spill
				; RV64-NEXT: vmv8r.v v16, v8
				; RV64-NEXT: vl8re64.v v8, (a1)
				; RV64-NEXT: vsetvli a0, zero, e64,m8,tu,mu
				; RV64-NEXT: vloxei64.v v24, (zero), v16, v0.t
				; RV64-NEXT: csrr a0, vlenb
				; RV64-NEXT: srli a0, a0, 3
				; RV64-NEXT: vsetvli a1, zero, e8,mf4,ta,mu
				; RV64-NEXT: vslidedown.vx v0, v0, a0
				; RV64-NEXT: vsetvli a1, zero, e64,m8,tu,mu
				; RV64-NEXT: addi a1, sp, 16
				; RV64-NEXT: vl8re8.v v16, (a1) # Unknown-size Folded Reload
				; RV64-NEXT: vloxei64.v v8, (zero), v16, v0.t
				; RV64-NEXT: slli a0, a0, 6
				; RV64-NEXT: add a0, a2, a0
				; RV64-NEXT: vs8r.v v8, (a0)
				; RV64-NEXT: vs8r.v v24, (a2)
				; RV64-NEXT: csrr a0, vlenb
				; RV64-NEXT: slli a0, a0, 3
				; RV64-NEXT: add sp, sp, a0
				; RV64-NEXT: addi sp, sp, 16
				; RV64-NEXT: ret
				%p0 = call <vscale x 16 x i64> @llvm.experimental.vector.insert.nxv8p0i64.nxv16p0i64(<vscale x 16 x i64> undef, <vscale x 8 x i64*> %ptrs0, i64 0)
				%p1 = call <vscale x 16 x i64> @llvm.experimental.vector.insert.nxv8p0i64.nxv16p0i64(<vscale x 16 x i64> %p0, <vscale x 8 x i64*> %ptrs1, i64 8)

				%pt0 = call <vscale x 16 x i64> @llvm.experimental.vector.insert.nxv8i64.nxv16i64(<vscale x 16 x i64> undef, <vscale x 8 x i64> %passthru0, i64 0)
				%pt1 = call <vscale x 16 x i64> @llvm.experimental.vector.insert.nxv8i64.nxv16i64(<vscale x 16 x i64> %pt0, <vscale x 8 x i64> %passthru1, i64 8)

				%v = call <vscale x 16 x i64> @llvm.masked.gather.nxv16i64.nxv16p0f64(<vscale x 16 x i64*> %p1, i32 8, <vscale x 16 x i1> %m, <vscale x 16 x i64> %pt1)
				store <vscale x 16 x i64> %v, <vscale x 16 x i64>* %out
				ret void
				}


				declare <vscale x 1 x half> @llvm.masked.gather.nxv1f16.nxv1p0f16(<vscale x 1 x half*>, i32, <vscale x 1 x i1>, <vscale x 1 x half>)

				define <vscale x 1 x half> @mgather_nxv1f16(<vscale x 1 x half*> %ptrs, <vscale x 1 x i1> %m, <vscale x 1 x half> %passthru) {
				; RV32-LABEL: mgather_nxv1f16:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e16,mf4,tu,mu
				; RV32-NEXT: vloxei32.v v9, (zero), v8, v0.t
				; RV32-NEXT: vmv1r.v v8, v9
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_nxv1f16:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e16,mf4,tu,mu
				; RV64-NEXT: vloxei64.v v9, (zero), v8, v0.t
				; RV64-NEXT: vmv1r.v v8, v9
				; RV64-NEXT: ret
				%v = call <vscale x 1 x half> @llvm.masked.gather.nxv1f16.nxv1p0f16(<vscale x 1 x half*> %ptrs, i32 2, <vscale x 1 x i1> %m, <vscale x 1 x half> %passthru)
				ret <vscale x 1 x half> %v
				}

				declare <vscale x 2 x half> @llvm.masked.gather.nxv2f16.nxv2p0f16(<vscale x 2 x half*>, i32, <vscale x 2 x i1>, <vscale x 2 x half>)

				define <vscale x 2 x half> @mgather_nxv2f16(<vscale x 2 x half*> %ptrs, <vscale x 2 x i1> %m, <vscale x 2 x half> %passthru) {
				; RV32-LABEL: mgather_nxv2f16:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e16,mf2,tu,mu
				; RV32-NEXT: vloxei32.v v9, (zero), v8, v0.t
				; RV32-NEXT: vmv1r.v v8, v9
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_nxv2f16:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e16,mf2,tu,mu
				; RV64-NEXT: vloxei64.v v10, (zero), v8, v0.t
				; RV64-NEXT: vmv1r.v v8, v10
				; RV64-NEXT: ret
				%v = call <vscale x 2 x half> @llvm.masked.gather.nxv2f16.nxv2p0f16(<vscale x 2 x half*> %ptrs, i32 2, <vscale x 2 x i1> %m, <vscale x 2 x half> %passthru)
				ret <vscale x 2 x half> %v
				}

				declare <vscale x 4 x half> @llvm.masked.gather.nxv4f16.nxv4p0f16(<vscale x 4 x half*>, i32, <vscale x 4 x i1>, <vscale x 4 x half>)

				define <vscale x 4 x half> @mgather_nxv4f16(<vscale x 4 x half*> %ptrs, <vscale x 4 x i1> %m, <vscale x 4 x half> %passthru) {
				; RV32-LABEL: mgather_nxv4f16:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e16,m1,tu,mu
				; RV32-NEXT: vloxei32.v v10, (zero), v8, v0.t
				; RV32-NEXT: vmv1r.v v8, v10
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_nxv4f16:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e16,m1,tu,mu
				; RV64-NEXT: vloxei64.v v12, (zero), v8, v0.t
				; RV64-NEXT: vmv1r.v v8, v12
				; RV64-NEXT: ret
				%v = call <vscale x 4 x half> @llvm.masked.gather.nxv4f16.nxv4p0f16(<vscale x 4 x half*> %ptrs, i32 2, <vscale x 4 x i1> %m, <vscale x 4 x half> %passthru)
				ret <vscale x 4 x half> %v
				}

				define <vscale x 4 x half> @mgather_truemask_nxv4f16(<vscale x 4 x half*> %ptrs, <vscale x 4 x half> %passthru) {
				; RV32-LABEL: mgather_truemask_nxv4f16:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e16,m1,ta,mu
				; RV32-NEXT: vloxei32.v v8, (zero), v8
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_truemask_nxv4f16:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e16,m1,ta,mu
				; RV64-NEXT: vloxei64.v v8, (zero), v8
				; RV64-NEXT: ret
				%mhead = insertelement <vscale x 4 x i1> undef, i1 1, i32 0
				%mtrue = shufflevector <vscale x 4 x i1> %mhead, <vscale x 4 x i1> undef, <vscale x 4 x i32> zeroinitializer
				%v = call <vscale x 4 x half> @llvm.masked.gather.nxv4f16.nxv4p0f16(<vscale x 4 x half*> %ptrs, i32 2, <vscale x 4 x i1> %mtrue, <vscale x 4 x half> %passthru)
				ret <vscale x 4 x half> %v
				}

				declare <vscale x 8 x half> @llvm.masked.gather.nxv8f16.nxv8p0f16(<vscale x 8 x half*>, i32, <vscale x 8 x i1>, <vscale x 8 x half>)

				define <vscale x 8 x half> @mgather_nxv8f16(<vscale x 8 x half*> %ptrs, <vscale x 8 x i1> %m, <vscale x 8 x half> %passthru) {
				; RV32-LABEL: mgather_nxv8f16:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e16,m2,tu,mu
				; RV32-NEXT: vloxei32.v v12, (zero), v8, v0.t
				; RV32-NEXT: vmv2r.v v8, v12
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_nxv8f16:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e16,m2,tu,mu
				; RV64-NEXT: vloxei64.v v16, (zero), v8, v0.t
				; RV64-NEXT: vmv2r.v v8, v16
				; RV64-NEXT: ret
				%v = call <vscale x 8 x half> @llvm.masked.gather.nxv8f16.nxv8p0f16(<vscale x 8 x half*> %ptrs, i32 2, <vscale x 8 x i1> %m, <vscale x 8 x half> %passthru)
				ret <vscale x 8 x half> %v
				}

				define <vscale x 8 x half> @mgather_baseidx_nxv8i8_nxv8f16(half* %base, <vscale x 8 x i8> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x half> %passthru) {
				; RV32-LABEL: mgather_baseidx_nxv8i8_nxv8f16:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e32,m4,ta,mu
				; RV32-NEXT: vsext.vf4 v28, v8
				; RV32-NEXT: vsll.vi v28, v28, 1
				; RV32-NEXT: vsetvli a1, zero, e16,m2,tu,mu
				; RV32-NEXT: vloxei32.v v10, (a0), v28, v0.t
				; RV32-NEXT: vmv2r.v v8, v10
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_nxv8i8_nxv8f16:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vsext.vf8 v16, v8
				; RV64-NEXT: vsll.vi v16, v16, 1
				; RV64-NEXT: vsetvli a1, zero, e16,m2,tu,mu
				; RV64-NEXT: vloxei64.v v10, (a0), v16, v0.t
				; RV64-NEXT: vmv2r.v v8, v10
				; RV64-NEXT: ret
				%ptrs = getelementptr inbounds half, half* %base, <vscale x 8 x i8> %idxs
				%v = call <vscale x 8 x half> @llvm.masked.gather.nxv8f16.nxv8p0f16(<vscale x 8 x half*> %ptrs, i32 2, <vscale x 8 x i1> %m, <vscale x 8 x half> %passthru)
				ret <vscale x 8 x half> %v
				}

				define <vscale x 8 x half> @mgather_baseidx_sext_nxv8i8_nxv8f16(half* %base, <vscale x 8 x i8> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x half> %passthru) {
				; RV32-LABEL: mgather_baseidx_sext_nxv8i8_nxv8f16:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e32,m4,ta,mu
				; RV32-NEXT: vsext.vf4 v28, v8
				; RV32-NEXT: vsll.vi v28, v28, 1
				; RV32-NEXT: vsetvli a1, zero, e16,m2,tu,mu
				; RV32-NEXT: vloxei32.v v10, (a0), v28, v0.t
				; RV32-NEXT: vmv2r.v v8, v10
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_sext_nxv8i8_nxv8f16:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vsext.vf8 v16, v8
				; RV64-NEXT: vsll.vi v16, v16, 1
				; RV64-NEXT: vsetvli a1, zero, e16,m2,tu,mu
				; RV64-NEXT: vloxei64.v v10, (a0), v16, v0.t
				; RV64-NEXT: vmv2r.v v8, v10
				; RV64-NEXT: ret
				%eidxs = sext <vscale x 8 x i8> %idxs to <vscale x 8 x i16>
				%ptrs = getelementptr inbounds half, half* %base, <vscale x 8 x i16> %eidxs
				%v = call <vscale x 8 x half> @llvm.masked.gather.nxv8f16.nxv8p0f16(<vscale x 8 x half*> %ptrs, i32 2, <vscale x 8 x i1> %m, <vscale x 8 x half> %passthru)
				ret <vscale x 8 x half> %v
				}

				define <vscale x 8 x half> @mgather_baseidx_zext_nxv8i8_nxv8f16(half* %base, <vscale x 8 x i8> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x half> %passthru) {
				; RV32-LABEL: mgather_baseidx_zext_nxv8i8_nxv8f16:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e32,m4,ta,mu
				; RV32-NEXT: vzext.vf4 v28, v8
				; RV32-NEXT: vsll.vi v28, v28, 1
				; RV32-NEXT: vsetvli a1, zero, e16,m2,tu,mu
				; RV32-NEXT: vloxei32.v v10, (a0), v28, v0.t
				; RV32-NEXT: vmv2r.v v8, v10
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_zext_nxv8i8_nxv8f16:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vzext.vf8 v16, v8
				; RV64-NEXT: vsll.vi v16, v16, 1
				; RV64-NEXT: vsetvli a1, zero, e16,m2,tu,mu
				; RV64-NEXT: vloxei64.v v10, (a0), v16, v0.t
				; RV64-NEXT: vmv2r.v v8, v10
				; RV64-NEXT: ret
				%eidxs = zext <vscale x 8 x i8> %idxs to <vscale x 8 x i16>
				%ptrs = getelementptr inbounds half, half* %base, <vscale x 8 x i16> %eidxs
				%v = call <vscale x 8 x half> @llvm.masked.gather.nxv8f16.nxv8p0f16(<vscale x 8 x half*> %ptrs, i32 2, <vscale x 8 x i1> %m, <vscale x 8 x half> %passthru)
				ret <vscale x 8 x half> %v
				}

				define <vscale x 8 x half> @mgather_baseidx_nxv8f16(half* %base, <vscale x 8 x i16> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x half> %passthru) {
				; RV32-LABEL: mgather_baseidx_nxv8f16:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e32,m4,ta,mu
				; RV32-NEXT: vsext.vf2 v28, v8
				; RV32-NEXT: vsll.vi v28, v28, 1
				; RV32-NEXT: vsetvli a1, zero, e16,m2,tu,mu
				; RV32-NEXT: vloxei32.v v10, (a0), v28, v0.t
				; RV32-NEXT: vmv2r.v v8, v10
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_nxv8f16:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vsext.vf4 v16, v8
				; RV64-NEXT: vsll.vi v16, v16, 1
				; RV64-NEXT: vsetvli a1, zero, e16,m2,tu,mu
				; RV64-NEXT: vloxei64.v v10, (a0), v16, v0.t
				; RV64-NEXT: vmv2r.v v8, v10
				; RV64-NEXT: ret
				%ptrs = getelementptr inbounds half, half* %base, <vscale x 8 x i16> %idxs
				%v = call <vscale x 8 x half> @llvm.masked.gather.nxv8f16.nxv8p0f16(<vscale x 8 x half*> %ptrs, i32 2, <vscale x 8 x i1> %m, <vscale x 8 x half> %passthru)
				ret <vscale x 8 x half> %v
				}

				declare <vscale x 1 x float> @llvm.masked.gather.nxv1f32.nxv1p0f32(<vscale x 1 x float*>, i32, <vscale x 1 x i1>, <vscale x 1 x float>)

				define <vscale x 1 x float> @mgather_nxv1f32(<vscale x 1 x float*> %ptrs, <vscale x 1 x i1> %m, <vscale x 1 x float> %passthru) {
				; RV32-LABEL: mgather_nxv1f32:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e32,mf2,tu,mu
				; RV32-NEXT: vloxei32.v v9, (zero), v8, v0.t
				; RV32-NEXT: vmv1r.v v8, v9
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_nxv1f32:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e32,mf2,tu,mu
				; RV64-NEXT: vloxei64.v v9, (zero), v8, v0.t
				; RV64-NEXT: vmv1r.v v8, v9
				; RV64-NEXT: ret
				%v = call <vscale x 1 x float> @llvm.masked.gather.nxv1f32.nxv1p0f32(<vscale x 1 x float*> %ptrs, i32 4, <vscale x 1 x i1> %m, <vscale x 1 x float> %passthru)
				ret <vscale x 1 x float> %v
				}

				declare <vscale x 2 x float> @llvm.masked.gather.nxv2f32.nxv2p0f32(<vscale x 2 x float*>, i32, <vscale x 2 x i1>, <vscale x 2 x float>)

				define <vscale x 2 x float> @mgather_nxv2f32(<vscale x 2 x float*> %ptrs, <vscale x 2 x i1> %m, <vscale x 2 x float> %passthru) {
				; RV32-LABEL: mgather_nxv2f32:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e32,m1,tu,mu
				; RV32-NEXT: vloxei32.v v9, (zero), v8, v0.t
				; RV32-NEXT: vmv1r.v v8, v9
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_nxv2f32:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e32,m1,tu,mu
				; RV64-NEXT: vloxei64.v v10, (zero), v8, v0.t
				; RV64-NEXT: vmv1r.v v8, v10
				; RV64-NEXT: ret
				%v = call <vscale x 2 x float> @llvm.masked.gather.nxv2f32.nxv2p0f32(<vscale x 2 x float*> %ptrs, i32 4, <vscale x 2 x i1> %m, <vscale x 2 x float> %passthru)
				ret <vscale x 2 x float> %v
				}

				declare <vscale x 4 x float> @llvm.masked.gather.nxv4f32.nxv4p0f32(<vscale x 4 x float*>, i32, <vscale x 4 x i1>, <vscale x 4 x float>)

				define <vscale x 4 x float> @mgather_nxv4f32(<vscale x 4 x float*> %ptrs, <vscale x 4 x i1> %m, <vscale x 4 x float> %passthru) {
				; RV32-LABEL: mgather_nxv4f32:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e32,m2,tu,mu
				; RV32-NEXT: vloxei32.v v10, (zero), v8, v0.t
				; RV32-NEXT: vmv2r.v v8, v10
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_nxv4f32:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e32,m2,tu,mu
				; RV64-NEXT: vloxei64.v v12, (zero), v8, v0.t
				; RV64-NEXT: vmv2r.v v8, v12
				; RV64-NEXT: ret
				%v = call <vscale x 4 x float> @llvm.masked.gather.nxv4f32.nxv4p0f32(<vscale x 4 x float*> %ptrs, i32 4, <vscale x 4 x i1> %m, <vscale x 4 x float> %passthru)
				ret <vscale x 4 x float> %v
				}

				define <vscale x 4 x float> @mgather_truemask_nxv4f32(<vscale x 4 x float*> %ptrs, <vscale x 4 x float> %passthru) {
				; RV32-LABEL: mgather_truemask_nxv4f32:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e32,m2,ta,mu
				; RV32-NEXT: vloxei32.v v8, (zero), v8
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_truemask_nxv4f32:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e32,m2,ta,mu
				; RV64-NEXT: vloxei64.v v8, (zero), v8
				; RV64-NEXT: ret
				%mhead = insertelement <vscale x 4 x i1> undef, i1 1, i32 0
				%mtrue = shufflevector <vscale x 4 x i1> %mhead, <vscale x 4 x i1> undef, <vscale x 4 x i32> zeroinitializer
				%v = call <vscale x 4 x float> @llvm.masked.gather.nxv4f32.nxv4p0f32(<vscale x 4 x float*> %ptrs, i32 4, <vscale x 4 x i1> %mtrue, <vscale x 4 x float> %passthru)
				ret <vscale x 4 x float> %v
				}

				declare <vscale x 8 x float> @llvm.masked.gather.nxv8f32.nxv8p0f32(<vscale x 8 x float*>, i32, <vscale x 8 x i1>, <vscale x 8 x float>)

				define <vscale x 8 x float> @mgather_nxv8f32(<vscale x 8 x float*> %ptrs, <vscale x 8 x i1> %m, <vscale x 8 x float> %passthru) {
				; RV32-LABEL: mgather_nxv8f32:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e32,m4,tu,mu
				; RV32-NEXT: vloxei32.v v12, (zero), v8, v0.t
				; RV32-NEXT: vmv4r.v v8, v12
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_nxv8f32:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e32,m4,tu,mu
				; RV64-NEXT: vloxei64.v v16, (zero), v8, v0.t
				; RV64-NEXT: vmv4r.v v8, v16
				; RV64-NEXT: ret
				%v = call <vscale x 8 x float> @llvm.masked.gather.nxv8f32.nxv8p0f32(<vscale x 8 x float*> %ptrs, i32 4, <vscale x 8 x i1> %m, <vscale x 8 x float> %passthru)
				ret <vscale x 8 x float> %v
				}

				define <vscale x 8 x float> @mgather_baseidx_nxv8i8_nxv8f32(float* %base, <vscale x 8 x i8> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x float> %passthru) {
				; RV32-LABEL: mgather_baseidx_nxv8i8_nxv8f32:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e32,m4,ta,mu
				; RV32-NEXT: vsext.vf4 v28, v8
				; RV32-NEXT: vsll.vi v28, v28, 2
				; RV32-NEXT: vsetvli a1, zero, e32,m4,tu,mu
				; RV32-NEXT: vloxei32.v v12, (a0), v28, v0.t
				; RV32-NEXT: vmv4r.v v8, v12
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_nxv8i8_nxv8f32:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vsext.vf8 v16, v8
				; RV64-NEXT: vsll.vi v16, v16, 2
				; RV64-NEXT: vsetvli a1, zero, e32,m4,tu,mu
				; RV64-NEXT: vloxei64.v v12, (a0), v16, v0.t
				; RV64-NEXT: vmv4r.v v8, v12
				; RV64-NEXT: ret
				%ptrs = getelementptr inbounds float, float* %base, <vscale x 8 x i8> %idxs
				%v = call <vscale x 8 x float> @llvm.masked.gather.nxv8f32.nxv8p0f32(<vscale x 8 x float*> %ptrs, i32 4, <vscale x 8 x i1> %m, <vscale x 8 x float> %passthru)
				ret <vscale x 8 x float> %v
				}

				define <vscale x 8 x float> @mgather_baseidx_sext_nxv8i8_nxv8f32(float* %base, <vscale x 8 x i8> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x float> %passthru) {
				; RV32-LABEL: mgather_baseidx_sext_nxv8i8_nxv8f32:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e32,m4,ta,mu
				; RV32-NEXT: vsext.vf4 v28, v8
				; RV32-NEXT: vsll.vi v28, v28, 2
				; RV32-NEXT: vsetvli a1, zero, e32,m4,tu,mu
				; RV32-NEXT: vloxei32.v v12, (a0), v28, v0.t
				; RV32-NEXT: vmv4r.v v8, v12
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_sext_nxv8i8_nxv8f32:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vsext.vf8 v16, v8
				; RV64-NEXT: vsll.vi v16, v16, 2
				; RV64-NEXT: vsetvli a1, zero, e32,m4,tu,mu
				; RV64-NEXT: vloxei64.v v12, (a0), v16, v0.t
				; RV64-NEXT: vmv4r.v v8, v12
				; RV64-NEXT: ret
				%eidxs = sext <vscale x 8 x i8> %idxs to <vscale x 8 x i32>
				%ptrs = getelementptr inbounds float, float* %base, <vscale x 8 x i32> %eidxs
				%v = call <vscale x 8 x float> @llvm.masked.gather.nxv8f32.nxv8p0f32(<vscale x 8 x float*> %ptrs, i32 4, <vscale x 8 x i1> %m, <vscale x 8 x float> %passthru)
				ret <vscale x 8 x float> %v
				}

				define <vscale x 8 x float> @mgather_baseidx_zext_nxv8i8_nxv8f32(float* %base, <vscale x 8 x i8> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x float> %passthru) {
				; RV32-LABEL: mgather_baseidx_zext_nxv8i8_nxv8f32:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e32,m4,ta,mu
				; RV32-NEXT: vzext.vf4 v28, v8
				; RV32-NEXT: vsll.vi v28, v28, 2
				; RV32-NEXT: vsetvli a1, zero, e32,m4,tu,mu
				; RV32-NEXT: vloxei32.v v12, (a0), v28, v0.t
				; RV32-NEXT: vmv4r.v v8, v12
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_zext_nxv8i8_nxv8f32:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vzext.vf8 v16, v8
				; RV64-NEXT: vsll.vi v16, v16, 2
				; RV64-NEXT: vsetvli a1, zero, e32,m4,tu,mu
				; RV64-NEXT: vloxei64.v v12, (a0), v16, v0.t
				; RV64-NEXT: vmv4r.v v8, v12
				; RV64-NEXT: ret
				%eidxs = zext <vscale x 8 x i8> %idxs to <vscale x 8 x i32>
				%ptrs = getelementptr inbounds float, float* %base, <vscale x 8 x i32> %eidxs
				%v = call <vscale x 8 x float> @llvm.masked.gather.nxv8f32.nxv8p0f32(<vscale x 8 x float*> %ptrs, i32 4, <vscale x 8 x i1> %m, <vscale x 8 x float> %passthru)
				ret <vscale x 8 x float> %v
				}

				define <vscale x 8 x float> @mgather_baseidx_nxv8i16_nxv8f32(float* %base, <vscale x 8 x i16> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x float> %passthru) {
				; RV32-LABEL: mgather_baseidx_nxv8i16_nxv8f32:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e32,m4,ta,mu
				; RV32-NEXT: vsext.vf2 v28, v8
				; RV32-NEXT: vsll.vi v28, v28, 2
				; RV32-NEXT: vsetvli a1, zero, e32,m4,tu,mu
				; RV32-NEXT: vloxei32.v v12, (a0), v28, v0.t
				; RV32-NEXT: vmv4r.v v8, v12
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_nxv8i16_nxv8f32:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vsext.vf4 v16, v8
				; RV64-NEXT: vsll.vi v16, v16, 2
				; RV64-NEXT: vsetvli a1, zero, e32,m4,tu,mu
				; RV64-NEXT: vloxei64.v v12, (a0), v16, v0.t
				; RV64-NEXT: vmv4r.v v8, v12
				; RV64-NEXT: ret
				%ptrs = getelementptr inbounds float, float* %base, <vscale x 8 x i16> %idxs
				%v = call <vscale x 8 x float> @llvm.masked.gather.nxv8f32.nxv8p0f32(<vscale x 8 x float*> %ptrs, i32 4, <vscale x 8 x i1> %m, <vscale x 8 x float> %passthru)
				ret <vscale x 8 x float> %v
				}

				define <vscale x 8 x float> @mgather_baseidx_sext_nxv8i16_nxv8f32(float* %base, <vscale x 8 x i16> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x float> %passthru) {
				; RV32-LABEL: mgather_baseidx_sext_nxv8i16_nxv8f32:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e32,m4,ta,mu
				; RV32-NEXT: vsext.vf2 v28, v8
				; RV32-NEXT: vsll.vi v28, v28, 2
				; RV32-NEXT: vsetvli a1, zero, e32,m4,tu,mu
				; RV32-NEXT: vloxei32.v v12, (a0), v28, v0.t
				; RV32-NEXT: vmv4r.v v8, v12
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_sext_nxv8i16_nxv8f32:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vsext.vf4 v16, v8
				; RV64-NEXT: vsll.vi v16, v16, 2
				; RV64-NEXT: vsetvli a1, zero, e32,m4,tu,mu
				; RV64-NEXT: vloxei64.v v12, (a0), v16, v0.t
				; RV64-NEXT: vmv4r.v v8, v12
				; RV64-NEXT: ret
				%eidxs = sext <vscale x 8 x i16> %idxs to <vscale x 8 x i32>
				%ptrs = getelementptr inbounds float, float* %base, <vscale x 8 x i32> %eidxs
				%v = call <vscale x 8 x float> @llvm.masked.gather.nxv8f32.nxv8p0f32(<vscale x 8 x float*> %ptrs, i32 4, <vscale x 8 x i1> %m, <vscale x 8 x float> %passthru)
				ret <vscale x 8 x float> %v
				}

				define <vscale x 8 x float> @mgather_baseidx_zext_nxv8i16_nxv8f32(float* %base, <vscale x 8 x i16> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x float> %passthru) {
				; RV32-LABEL: mgather_baseidx_zext_nxv8i16_nxv8f32:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e32,m4,ta,mu
				; RV32-NEXT: vzext.vf2 v28, v8
				; RV32-NEXT: vsll.vi v28, v28, 2
				; RV32-NEXT: vsetvli a1, zero, e32,m4,tu,mu
				; RV32-NEXT: vloxei32.v v12, (a0), v28, v0.t
				; RV32-NEXT: vmv4r.v v8, v12
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_zext_nxv8i16_nxv8f32:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vzext.vf4 v16, v8
				; RV64-NEXT: vsll.vi v16, v16, 2
				; RV64-NEXT: vsetvli a1, zero, e32,m4,tu,mu
				; RV64-NEXT: vloxei64.v v12, (a0), v16, v0.t
				; RV64-NEXT: vmv4r.v v8, v12
				; RV64-NEXT: ret
				%eidxs = zext <vscale x 8 x i16> %idxs to <vscale x 8 x i32>
				%ptrs = getelementptr inbounds float, float* %base, <vscale x 8 x i32> %eidxs
				%v = call <vscale x 8 x float> @llvm.masked.gather.nxv8f32.nxv8p0f32(<vscale x 8 x float*> %ptrs, i32 4, <vscale x 8 x i1> %m, <vscale x 8 x float> %passthru)
				ret <vscale x 8 x float> %v
				}

				define <vscale x 8 x float> @mgather_baseidx_nxv8f32(float* %base, <vscale x 8 x i32> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x float> %passthru) {
				; RV32-LABEL: mgather_baseidx_nxv8f32:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e32,m4,ta,mu
				; RV32-NEXT: vsll.vi v28, v8, 2
				; RV32-NEXT: vsetvli a1, zero, e32,m4,tu,mu
				; RV32-NEXT: vloxei32.v v12, (a0), v28, v0.t
				; RV32-NEXT: vmv4r.v v8, v12
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_nxv8f32:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vsext.vf2 v16, v8
				; RV64-NEXT: vsll.vi v16, v16, 2
				; RV64-NEXT: vsetvli a1, zero, e32,m4,tu,mu
				; RV64-NEXT: vloxei64.v v12, (a0), v16, v0.t
				; RV64-NEXT: vmv4r.v v8, v12
				; RV64-NEXT: ret
				%ptrs = getelementptr inbounds float, float* %base, <vscale x 8 x i32> %idxs
				%v = call <vscale x 8 x float> @llvm.masked.gather.nxv8f32.nxv8p0f32(<vscale x 8 x float*> %ptrs, i32 4, <vscale x 8 x i1> %m, <vscale x 8 x float> %passthru)
				ret <vscale x 8 x float> %v
				}

				declare <vscale x 1 x double> @llvm.masked.gather.nxv1f64.nxv1p0f64(<vscale x 1 x double*>, i32, <vscale x 1 x i1>, <vscale x 1 x double>)

				define <vscale x 1 x double> @mgather_nxv1f64(<vscale x 1 x double*> %ptrs, <vscale x 1 x i1> %m, <vscale x 1 x double> %passthru) {
				; RV32-LABEL: mgather_nxv1f64:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e64,m1,tu,mu
				; RV32-NEXT: vloxei32.v v9, (zero), v8, v0.t
				; RV32-NEXT: vmv1r.v v8, v9
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_nxv1f64:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e64,m1,tu,mu
				; RV64-NEXT: vloxei64.v v9, (zero), v8, v0.t
				; RV64-NEXT: vmv1r.v v8, v9
				; RV64-NEXT: ret
				%v = call <vscale x 1 x double> @llvm.masked.gather.nxv1f64.nxv1p0f64(<vscale x 1 x double*> %ptrs, i32 8, <vscale x 1 x i1> %m, <vscale x 1 x double> %passthru)
				ret <vscale x 1 x double> %v
				}

				declare <vscale x 2 x double> @llvm.masked.gather.nxv2f64.nxv2p0f64(<vscale x 2 x double*>, i32, <vscale x 2 x i1>, <vscale x 2 x double>)

				define <vscale x 2 x double> @mgather_nxv2f64(<vscale x 2 x double*> %ptrs, <vscale x 2 x i1> %m, <vscale x 2 x double> %passthru) {
				; RV32-LABEL: mgather_nxv2f64:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e64,m2,tu,mu
				; RV32-NEXT: vloxei32.v v10, (zero), v8, v0.t
				; RV32-NEXT: vmv2r.v v8, v10
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_nxv2f64:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e64,m2,tu,mu
				; RV64-NEXT: vloxei64.v v10, (zero), v8, v0.t
				; RV64-NEXT: vmv2r.v v8, v10
				; RV64-NEXT: ret
				%v = call <vscale x 2 x double> @llvm.masked.gather.nxv2f64.nxv2p0f64(<vscale x 2 x double*> %ptrs, i32 8, <vscale x 2 x i1> %m, <vscale x 2 x double> %passthru)
				ret <vscale x 2 x double> %v
				}

				declare <vscale x 4 x double> @llvm.masked.gather.nxv4f64.nxv4p0f64(<vscale x 4 x double*>, i32, <vscale x 4 x i1>, <vscale x 4 x double>)

				define <vscale x 4 x double> @mgather_nxv4f64(<vscale x 4 x double*> %ptrs, <vscale x 4 x i1> %m, <vscale x 4 x double> %passthru) {
				; RV32-LABEL: mgather_nxv4f64:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e64,m4,tu,mu
				; RV32-NEXT: vloxei32.v v12, (zero), v8, v0.t
				; RV32-NEXT: vmv4r.v v8, v12
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_nxv4f64:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e64,m4,tu,mu
				; RV64-NEXT: vloxei64.v v12, (zero), v8, v0.t
				; RV64-NEXT: vmv4r.v v8, v12
				; RV64-NEXT: ret
				%v = call <vscale x 4 x double> @llvm.masked.gather.nxv4f64.nxv4p0f64(<vscale x 4 x double*> %ptrs, i32 8, <vscale x 4 x i1> %m, <vscale x 4 x double> %passthru)
				ret <vscale x 4 x double> %v
				}

				define <vscale x 4 x double> @mgather_truemask_nxv4f64(<vscale x 4 x double*> %ptrs, <vscale x 4 x double> %passthru) {
				; RV32-LABEL: mgather_truemask_nxv4f64:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e64,m4,ta,mu
				; RV32-NEXT: vloxei32.v v8, (zero), v8
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_truemask_nxv4f64:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e64,m4,ta,mu
				; RV64-NEXT: vloxei64.v v8, (zero), v8
				; RV64-NEXT: ret
				%mhead = insertelement <vscale x 4 x i1> undef, i1 1, i32 0
				%mtrue = shufflevector <vscale x 4 x i1> %mhead, <vscale x 4 x i1> undef, <vscale x 4 x i32> zeroinitializer
				%v = call <vscale x 4 x double> @llvm.masked.gather.nxv4f64.nxv4p0f64(<vscale x 4 x double*> %ptrs, i32 8, <vscale x 4 x i1> %mtrue, <vscale x 4 x double> %passthru)
				ret <vscale x 4 x double> %v
				}

				declare <vscale x 8 x double> @llvm.masked.gather.nxv8f64.nxv8p0f64(<vscale x 8 x double*>, i32, <vscale x 8 x i1>, <vscale x 8 x double>)

				define <vscale x 8 x double> @mgather_nxv8f64(<vscale x 8 x double*> %ptrs, <vscale x 8 x i1> %m, <vscale x 8 x double> %passthru) {
				; RV32-LABEL: mgather_nxv8f64:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e64,m8,tu,mu
				; RV32-NEXT: vloxei32.v v16, (zero), v8, v0.t
				; RV32-NEXT: vmv8r.v v8, v16
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_nxv8f64:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e64,m8,tu,mu
				; RV64-NEXT: vloxei64.v v16, (zero), v8, v0.t
				; RV64-NEXT: vmv8r.v v8, v16
				; RV64-NEXT: ret
				%v = call <vscale x 8 x double> @llvm.masked.gather.nxv8f64.nxv8p0f64(<vscale x 8 x double*> %ptrs, i32 8, <vscale x 8 x i1> %m, <vscale x 8 x double> %passthru)
				ret <vscale x 8 x double> %v
				}

				define <vscale x 8 x double> @mgather_baseidx_nxv8i8_nxv8f64(double* %base, <vscale x 8 x i8> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x double> %passthru) {
				; RV32-LABEL: mgather_baseidx_nxv8i8_nxv8f64:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e32,m4,ta,mu
				; RV32-NEXT: vsext.vf4 v28, v8
				; RV32-NEXT: vsll.vi v28, v28, 3
				; RV32-NEXT: vsetvli a1, zero, e64,m8,tu,mu
				; RV32-NEXT: vloxei32.v v16, (a0), v28, v0.t
				; RV32-NEXT: vmv8r.v v8, v16
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_nxv8i8_nxv8f64:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vsext.vf8 v24, v8
				; RV64-NEXT: vsll.vi v8, v24, 3
				; RV64-NEXT: vsetvli a1, zero, e64,m8,tu,mu
				; RV64-NEXT: vloxei64.v v16, (a0), v8, v0.t
				; RV64-NEXT: vmv8r.v v8, v16
				; RV64-NEXT: ret
				%ptrs = getelementptr inbounds double, double* %base, <vscale x 8 x i8> %idxs
				%v = call <vscale x 8 x double> @llvm.masked.gather.nxv8f64.nxv8p0f64(<vscale x 8 x double*> %ptrs, i32 8, <vscale x 8 x i1> %m, <vscale x 8 x double> %passthru)
				ret <vscale x 8 x double> %v
				}

				define <vscale x 8 x double> @mgather_baseidx_sext_nxv8i8_nxv8f64(double* %base, <vscale x 8 x i8> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x double> %passthru) {
				; RV32-LABEL: mgather_baseidx_sext_nxv8i8_nxv8f64:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV32-NEXT: vsext.vf8 v24, v8
				; RV32-NEXT: vsll.vi v8, v24, 3
				; RV32-NEXT: vsetvli a1, zero, e64,m8,tu,mu
				; RV32-NEXT: vloxei64.v v16, (a0), v8, v0.t
				; RV32-NEXT: vmv8r.v v8, v16
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_sext_nxv8i8_nxv8f64:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vsext.vf8 v24, v8
				; RV64-NEXT: vsll.vi v8, v24, 3
				; RV64-NEXT: vsetvli a1, zero, e64,m8,tu,mu
				; RV64-NEXT: vloxei64.v v16, (a0), v8, v0.t
				; RV64-NEXT: vmv8r.v v8, v16
				; RV64-NEXT: ret
				%eidxs = sext <vscale x 8 x i8> %idxs to <vscale x 8 x i64>
				%ptrs = getelementptr inbounds double, double* %base, <vscale x 8 x i64> %eidxs
				%v = call <vscale x 8 x double> @llvm.masked.gather.nxv8f64.nxv8p0f64(<vscale x 8 x double*> %ptrs, i32 8, <vscale x 8 x i1> %m, <vscale x 8 x double> %passthru)
				ret <vscale x 8 x double> %v
				}

				define <vscale x 8 x double> @mgather_baseidx_zext_nxv8i8_nxv8f64(double* %base, <vscale x 8 x i8> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x double> %passthru) {
				; RV32-LABEL: mgather_baseidx_zext_nxv8i8_nxv8f64:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV32-NEXT: vzext.vf8 v24, v8
				; RV32-NEXT: vsll.vi v8, v24, 3
				; RV32-NEXT: vsetvli a1, zero, e64,m8,tu,mu
				; RV32-NEXT: vloxei64.v v16, (a0), v8, v0.t
				; RV32-NEXT: vmv8r.v v8, v16
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_zext_nxv8i8_nxv8f64:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vzext.vf8 v24, v8
				; RV64-NEXT: vsll.vi v8, v24, 3
				; RV64-NEXT: vsetvli a1, zero, e64,m8,tu,mu
				; RV64-NEXT: vloxei64.v v16, (a0), v8, v0.t
				; RV64-NEXT: vmv8r.v v8, v16
				; RV64-NEXT: ret
				%eidxs = zext <vscale x 8 x i8> %idxs to <vscale x 8 x i64>
				%ptrs = getelementptr inbounds double, double* %base, <vscale x 8 x i64> %eidxs
				%v = call <vscale x 8 x double> @llvm.masked.gather.nxv8f64.nxv8p0f64(<vscale x 8 x double*> %ptrs, i32 8, <vscale x 8 x i1> %m, <vscale x 8 x double> %passthru)
				ret <vscale x 8 x double> %v
				}

				define <vscale x 8 x double> @mgather_baseidx_nxv8i16_nxv8f64(double* %base, <vscale x 8 x i16> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x double> %passthru) {
				; RV32-LABEL: mgather_baseidx_nxv8i16_nxv8f64:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e32,m4,ta,mu
				; RV32-NEXT: vsext.vf2 v28, v8
				; RV32-NEXT: vsll.vi v28, v28, 3
				; RV32-NEXT: vsetvli a1, zero, e64,m8,tu,mu
				; RV32-NEXT: vloxei32.v v16, (a0), v28, v0.t
				; RV32-NEXT: vmv8r.v v8, v16
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_nxv8i16_nxv8f64:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vsext.vf4 v24, v8
				; RV64-NEXT: vsll.vi v8, v24, 3
				; RV64-NEXT: vsetvli a1, zero, e64,m8,tu,mu
				; RV64-NEXT: vloxei64.v v16, (a0), v8, v0.t
				; RV64-NEXT: vmv8r.v v8, v16
				; RV64-NEXT: ret
				%ptrs = getelementptr inbounds double, double* %base, <vscale x 8 x i16> %idxs
				%v = call <vscale x 8 x double> @llvm.masked.gather.nxv8f64.nxv8p0f64(<vscale x 8 x double*> %ptrs, i32 8, <vscale x 8 x i1> %m, <vscale x 8 x double> %passthru)
				ret <vscale x 8 x double> %v
				}

				define <vscale x 8 x double> @mgather_baseidx_sext_nxv8i16_nxv8f64(double* %base, <vscale x 8 x i16> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x double> %passthru) {
				; RV32-LABEL: mgather_baseidx_sext_nxv8i16_nxv8f64:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV32-NEXT: vsext.vf4 v24, v8
				; RV32-NEXT: vsll.vi v8, v24, 3
				; RV32-NEXT: vsetvli a1, zero, e64,m8,tu,mu
				; RV32-NEXT: vloxei64.v v16, (a0), v8, v0.t
				; RV32-NEXT: vmv8r.v v8, v16
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_sext_nxv8i16_nxv8f64:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vsext.vf4 v24, v8
				; RV64-NEXT: vsll.vi v8, v24, 3
				; RV64-NEXT: vsetvli a1, zero, e64,m8,tu,mu
				; RV64-NEXT: vloxei64.v v16, (a0), v8, v0.t
				; RV64-NEXT: vmv8r.v v8, v16
				; RV64-NEXT: ret
				%eidxs = sext <vscale x 8 x i16> %idxs to <vscale x 8 x i64>
				%ptrs = getelementptr inbounds double, double* %base, <vscale x 8 x i64> %eidxs
				%v = call <vscale x 8 x double> @llvm.masked.gather.nxv8f64.nxv8p0f64(<vscale x 8 x double*> %ptrs, i32 8, <vscale x 8 x i1> %m, <vscale x 8 x double> %passthru)
				ret <vscale x 8 x double> %v
				}

				define <vscale x 8 x double> @mgather_baseidx_zext_nxv8i16_nxv8f64(double* %base, <vscale x 8 x i16> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x double> %passthru) {
				; RV32-LABEL: mgather_baseidx_zext_nxv8i16_nxv8f64:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV32-NEXT: vzext.vf4 v24, v8
				; RV32-NEXT: vsll.vi v8, v24, 3
				; RV32-NEXT: vsetvli a1, zero, e64,m8,tu,mu
				; RV32-NEXT: vloxei64.v v16, (a0), v8, v0.t
				; RV32-NEXT: vmv8r.v v8, v16
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_zext_nxv8i16_nxv8f64:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vzext.vf4 v24, v8
				; RV64-NEXT: vsll.vi v8, v24, 3
				; RV64-NEXT: vsetvli a1, zero, e64,m8,tu,mu
				; RV64-NEXT: vloxei64.v v16, (a0), v8, v0.t
				; RV64-NEXT: vmv8r.v v8, v16
				; RV64-NEXT: ret
				%eidxs = zext <vscale x 8 x i16> %idxs to <vscale x 8 x i64>
				%ptrs = getelementptr inbounds double, double* %base, <vscale x 8 x i64> %eidxs
				%v = call <vscale x 8 x double> @llvm.masked.gather.nxv8f64.nxv8p0f64(<vscale x 8 x double*> %ptrs, i32 8, <vscale x 8 x i1> %m, <vscale x 8 x double> %passthru)
				ret <vscale x 8 x double> %v
				}

				define <vscale x 8 x double> @mgather_baseidx_nxv8i32_nxv8f64(double* %base, <vscale x 8 x i32> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x double> %passthru) {
				; RV32-LABEL: mgather_baseidx_nxv8i32_nxv8f64:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e32,m4,ta,mu
				; RV32-NEXT: vsll.vi v28, v8, 3
				; RV32-NEXT: vsetvli a1, zero, e64,m8,tu,mu
				; RV32-NEXT: vloxei32.v v16, (a0), v28, v0.t
				; RV32-NEXT: vmv8r.v v8, v16
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_nxv8i32_nxv8f64:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vsext.vf2 v24, v8
				; RV64-NEXT: vsll.vi v8, v24, 3
				; RV64-NEXT: vsetvli a1, zero, e64,m8,tu,mu
				; RV64-NEXT: vloxei64.v v16, (a0), v8, v0.t
				; RV64-NEXT: vmv8r.v v8, v16
				; RV64-NEXT: ret
				%ptrs = getelementptr inbounds double, double* %base, <vscale x 8 x i32> %idxs
				%v = call <vscale x 8 x double> @llvm.masked.gather.nxv8f64.nxv8p0f64(<vscale x 8 x double*> %ptrs, i32 8, <vscale x 8 x i1> %m, <vscale x 8 x double> %passthru)
				ret <vscale x 8 x double> %v
				}

				define <vscale x 8 x double> @mgather_baseidx_sext_nxv8i32_nxv8f64(double* %base, <vscale x 8 x i32> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x double> %passthru) {
				; RV32-LABEL: mgather_baseidx_sext_nxv8i32_nxv8f64:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV32-NEXT: vsext.vf2 v24, v8
				; RV32-NEXT: vsll.vi v8, v24, 3
				; RV32-NEXT: vsetvli a1, zero, e64,m8,tu,mu
				; RV32-NEXT: vloxei64.v v16, (a0), v8, v0.t
				; RV32-NEXT: vmv8r.v v8, v16
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_sext_nxv8i32_nxv8f64:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vsext.vf2 v24, v8
				; RV64-NEXT: vsll.vi v8, v24, 3
				; RV64-NEXT: vsetvli a1, zero, e64,m8,tu,mu
				; RV64-NEXT: vloxei64.v v16, (a0), v8, v0.t
				; RV64-NEXT: vmv8r.v v8, v16
				; RV64-NEXT: ret
				%eidxs = sext <vscale x 8 x i32> %idxs to <vscale x 8 x i64>
				%ptrs = getelementptr inbounds double, double* %base, <vscale x 8 x i64> %eidxs
				%v = call <vscale x 8 x double> @llvm.masked.gather.nxv8f64.nxv8p0f64(<vscale x 8 x double*> %ptrs, i32 8, <vscale x 8 x i1> %m, <vscale x 8 x double> %passthru)
				ret <vscale x 8 x double> %v
				}

				define <vscale x 8 x double> @mgather_baseidx_zext_nxv8i32_nxv8f64(double* %base, <vscale x 8 x i32> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x double> %passthru) {
				; RV32-LABEL: mgather_baseidx_zext_nxv8i32_nxv8f64:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV32-NEXT: vzext.vf2 v24, v8
				; RV32-NEXT: vsll.vi v8, v24, 3
				; RV32-NEXT: vsetvli a1, zero, e64,m8,tu,mu
				; RV32-NEXT: vloxei64.v v16, (a0), v8, v0.t
				; RV32-NEXT: vmv8r.v v8, v16
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_zext_nxv8i32_nxv8f64:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vzext.vf2 v24, v8
				; RV64-NEXT: vsll.vi v8, v24, 3
				; RV64-NEXT: vsetvli a1, zero, e64,m8,tu,mu
				; RV64-NEXT: vloxei64.v v16, (a0), v8, v0.t
				; RV64-NEXT: vmv8r.v v8, v16
				; RV64-NEXT: ret
				%eidxs = zext <vscale x 8 x i32> %idxs to <vscale x 8 x i64>
				%ptrs = getelementptr inbounds double, double* %base, <vscale x 8 x i64> %eidxs
				%v = call <vscale x 8 x double> @llvm.masked.gather.nxv8f64.nxv8p0f64(<vscale x 8 x double*> %ptrs, i32 8, <vscale x 8 x i1> %m, <vscale x 8 x double> %passthru)
				ret <vscale x 8 x double> %v
				}

				define <vscale x 8 x double> @mgather_baseidx_nxv8f64(double* %base, <vscale x 8 x i64> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x double> %passthru) {
				; RV32-LABEL: mgather_baseidx_nxv8f64:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV32-NEXT: vsll.vi v8, v8, 3
				; RV32-NEXT: vsetvli a1, zero, e64,m8,tu,mu
				; RV32-NEXT: vloxei64.v v16, (a0), v8, v0.t
				; RV32-NEXT: vmv8r.v v8, v16
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_nxv8f64:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vsll.vi v8, v8, 3
				; RV64-NEXT: vsetvli a1, zero, e64,m8,tu,mu
				; RV64-NEXT: vloxei64.v v16, (a0), v8, v0.t
				; RV64-NEXT: vmv8r.v v8, v16
				; RV64-NEXT: ret
				%ptrs = getelementptr inbounds double, double* %base, <vscale x 8 x i64> %idxs
				%v = call <vscale x 8 x double> @llvm.masked.gather.nxv8f64.nxv8p0f64(<vscale x 8 x double*> %ptrs, i32 8, <vscale x 8 x i1> %m, <vscale x 8 x double> %passthru)
				ret <vscale x 8 x double> %v
				}

				declare <vscale x 16 x i8> @llvm.masked.gather.nxv16i8.nxv16p0i8(<vscale x 16 x i8*>, i32, <vscale x 16 x i1>, <vscale x 16 x i8>)

				define <vscale x 16 x i8> @mgather_baseidx_nxv16i8(i8* %base, <vscale x 16 x i8> %idxs, <vscale x 16 x i1> %m, <vscale x 16 x i8> %passthru) {
				; RV32-LABEL: mgather_baseidx_nxv16i8:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e32,m8,ta,mu
				; RV32-NEXT: vsext.vf4 v16, v8
				; RV32-NEXT: vsetvli a1, zero, e8,m2,tu,mu
				; RV32-NEXT: vloxei32.v v10, (a0), v16, v0.t
				; RV32-NEXT: vmv2r.v v8, v10
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_nxv16i8:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vsext.vf8 v16, v8
				; RV64-NEXT: vsetvli a1, zero, e8,m1,tu,mu
				; RV64-NEXT: vloxei64.v v10, (a0), v16, v0.t
				; RV64-NEXT: csrr a1, vlenb
				; RV64-NEXT: srli a1, a1, 3
				; RV64-NEXT: vsetvli a2, zero, e8,mf4,ta,mu
				; RV64-NEXT: vslidedown.vx v0, v0, a1
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vsext.vf8 v16, v9
				; RV64-NEXT: vsetvli a1, zero, e8,m1,tu,mu
				; RV64-NEXT: vloxei64.v v11, (a0), v16, v0.t
				; RV64-NEXT: vmv2r.v v8, v10
				; RV64-NEXT: ret
				%ptrs = getelementptr inbounds i8, i8* %base, <vscale x 16 x i8> %idxs
				%v = call <vscale x 16 x i8> @llvm.masked.gather.nxv16i8.nxv16p0i8(<vscale x 16 x i8*> %ptrs, i32 2, <vscale x 16 x i1> %m, <vscale x 16 x i8> %passthru)
				ret <vscale x 16 x i8> %v
				}

				declare <vscale x 32 x i8> @llvm.masked.gather.nxv32i8.nxv32p0i8(<vscale x 32 x i8*>, i32, <vscale x 32 x i1>, <vscale x 32 x i8>)

				define <vscale x 32 x i8> @mgather_baseidx_nxv32i8(i8* %base, <vscale x 32 x i8> %idxs, <vscale x 32 x i1> %m, <vscale x 32 x i8> %passthru) {
				; RV32-LABEL: mgather_baseidx_nxv32i8:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e32,m8,ta,mu
				; RV32-NEXT: vsext.vf4 v16, v8
				; RV32-NEXT: vsetvli a1, zero, e8,m2,tu,mu
				; RV32-NEXT: vloxei32.v v12, (a0), v16, v0.t
				; RV32-NEXT: csrr a1, vlenb
				; RV32-NEXT: srli a1, a1, 2
				; RV32-NEXT: vsetvli a2, zero, e8,mf2,ta,mu
				; RV32-NEXT: vslidedown.vx v0, v0, a1
				; RV32-NEXT: vsetvli a1, zero, e32,m8,ta,mu
				; RV32-NEXT: vsext.vf4 v16, v10
				; RV32-NEXT: vsetvli a1, zero, e8,m2,tu,mu
				; RV32-NEXT: vloxei32.v v14, (a0), v16, v0.t
				; RV32-NEXT: vmv4r.v v8, v12
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_nxv32i8:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vsext.vf8 v16, v8
				; RV64-NEXT: vsetvli a1, zero, e8,m1,tu,mu
				; RV64-NEXT: vloxei64.v v12, (a0), v16, v0.t
				; RV64-NEXT: csrr a1, vlenb
				; RV64-NEXT: srli a1, a1, 3
				; RV64-NEXT: vsetvli a2, zero, e8,mf4,ta,mu
				; RV64-NEXT: vslidedown.vx v25, v0, a1
				; RV64-NEXT: vmv1r.v v26, v0
				; RV64-NEXT: vsetvli a2, zero, e64,m8,ta,mu
				; RV64-NEXT: vsext.vf8 v16, v9
				; RV64-NEXT: vsetvli a2, zero, e8,m1,tu,mu
				; RV64-NEXT: vmv1r.v v0, v25
				; RV64-NEXT: vloxei64.v v13, (a0), v16, v0.t
				; RV64-NEXT: slli a2, a1, 1
				; RV64-NEXT: vsetvli a3, zero, e8,mf2,ta,mu
				; RV64-NEXT: vslidedown.vx v26, v26, a2
				; RV64-NEXT: vsetvli a2, zero, e8,mf4,ta,mu
				; RV64-NEXT: vslidedown.vx v0, v26, a1
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vsext.vf8 v16, v11
				; RV64-NEXT: vsetvli a1, zero, e8,m1,tu,mu
				; RV64-NEXT: vloxei64.v v15, (a0), v16, v0.t
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vsext.vf8 v16, v10
				; RV64-NEXT: vsetvli a1, zero, e8,m1,tu,mu
				; RV64-NEXT: vmv1r.v v0, v26
				; RV64-NEXT: vloxei64.v v14, (a0), v16, v0.t
				; RV64-NEXT: vmv4r.v v8, v12
				; RV64-NEXT: ret
				%ptrs = getelementptr inbounds i8, i8* %base, <vscale x 32 x i8> %idxs
				%v = call <vscale x 32 x i8> @llvm.masked.gather.nxv32i8.nxv32p0i8(<vscale x 32 x i8*> %ptrs, i32 2, <vscale x 32 x i1> %m, <vscale x 32 x i8> %passthru)
				ret <vscale x 32 x i8> %v
				}

This is an archive of the discontinued LLVM Phabricator instance.

[RISCV] Support scalable-vector masked gather operations
ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 331226

llvm/lib/Target/RISCV/RISCVISelLowering.h

llvm/lib/Target/RISCV/RISCVISelLowering.cpp

llvm/test/CodeGen/RISCV/rvv/mgather-sdnode.ll

This is an archive of the discontinued LLVM Phabricator instance.

[RISCV] Support scalable-vector masked gather operationsClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 331226

llvm/lib/Target/RISCV/RISCVISelLowering.h

llvm/lib/Target/RISCV/RISCVISelLowering.cpp

llvm/test/CodeGen/RISCV/rvv/mgather-sdnode.ll

[RISCV] Support scalable-vector masked gather operations
ClosedPublic