Diff 323283

llvm/lib/Target/RISCV/RISCVISelLowering.h

Show First 20 Lines • Show All 171 Lines • ▼ Show 20 Lines	enum NodeType : unsigned {
VMSET_VL,		VMSET_VL,

// Matches the semantics of vrgather.vx with an extra operand for VL.		// Matches the semantics of vrgather.vx with an extra operand for VL.
VRGATHER_VX_VL,		VRGATHER_VX_VL,

// Memory opcodes start here.		// Memory opcodes start here.
VLE_VL = ISD::FIRST_TARGET_MEMORY_OPCODE,		VLE_VL = ISD::FIRST_TARGET_MEMORY_OPCODE,
VSE_VL,		VSE_VL,
		MGATHER,

// WARNING: Do not add anything in the end unless you want the node to		// WARNING: Do not add anything in the end unless you want the node to
// have memop! In fact, starting from FIRST_TARGET_MEMORY_OPCODE all		// have memop! In fact, starting from FIRST_TARGET_MEMORY_OPCODE all
// opcodes will be thought as target memory ops!		// opcodes will be thought as target memory ops!
};		};
} // namespace RISCVISD		} // namespace RISCVISD

class RISCVTargetLowering : public TargetLowering {		class RISCVTargetLowering : public TargetLowering {
▲ Show 20 Lines • Show All 162 Lines • ▼ Show 20 Lines	public:

/// Returns true if the target allows unaligned memory accesses of the		/// Returns true if the target allows unaligned memory accesses of the
/// specified type.		/// specified type.
bool allowsMisalignedMemoryAccesses(		bool allowsMisalignedMemoryAccesses(
EVT VT, unsigned AddrSpace = 0, Align Alignment = Align(1),		EVT VT, unsigned AddrSpace = 0, Align Alignment = Align(1),
MachineMemOperand::Flags Flags = MachineMemOperand::MONone,		MachineMemOperand::Flags Flags = MachineMemOperand::MONone,
bool *Fast = nullptr) const override;		bool *Fast = nullptr) const override;

		bool shouldRemoveExtendFromGSIndex(EVT VT) const override;

private:		private:
void analyzeInputArgs(MachineFunction &MF, CCState &CCInfo,		void analyzeInputArgs(MachineFunction &MF, CCState &CCInfo,
const SmallVectorImpl<ISD::InputArg> &Ins,		const SmallVectorImpl<ISD::InputArg> &Ins,
bool IsRet) const;		bool IsRet) const;
void analyzeOutputArgs(MachineFunction &MF, CCState &CCInfo,		void analyzeOutputArgs(MachineFunction &MF, CCState &CCInfo,
const SmallVectorImpl<ISD::OutputArg> &Outs,		const SmallVectorImpl<ISD::OutputArg> &Outs,
bool IsRet, CallLoweringInfo *CLI) const;		bool IsRet, CallLoweringInfo *CLI) const;

Show All 24 Lines	private:
SDValue LowerINTRINSIC_WO_CHAIN(SDValue Op, SelectionDAG &DAG) const;		SDValue LowerINTRINSIC_WO_CHAIN(SDValue Op, SelectionDAG &DAG) const;
SDValue LowerINTRINSIC_W_CHAIN(SDValue Op, SelectionDAG &DAG) const;		SDValue LowerINTRINSIC_W_CHAIN(SDValue Op, SelectionDAG &DAG) const;
SDValue lowerVECREDUCE(SDValue Op, SelectionDAG &DAG) const;		SDValue lowerVECREDUCE(SDValue Op, SelectionDAG &DAG) const;
SDValue lowerFPVECREDUCE(SDValue Op, SelectionDAG &DAG) const;		SDValue lowerFPVECREDUCE(SDValue Op, SelectionDAG &DAG) const;
SDValue lowerFixedLengthVectorLoadToRVV(SDValue Op, SelectionDAG &DAG) const;		SDValue lowerFixedLengthVectorLoadToRVV(SDValue Op, SelectionDAG &DAG) const;
SDValue lowerFixedLengthVectorStoreToRVV(SDValue Op, SelectionDAG &DAG) const;		SDValue lowerFixedLengthVectorStoreToRVV(SDValue Op, SelectionDAG &DAG) const;
SDValue lowerToScalableOp(SDValue Op, SelectionDAG &DAG,		SDValue lowerToScalableOp(SDValue Op, SelectionDAG &DAG,
unsigned NewOpc) const;		unsigned NewOpc) const;
		SDValue lowerMGATHER(SDValue Op, SelectionDAG &DAG) const;

bool isEligibleForTailCallOptimization(		bool isEligibleForTailCallOptimization(
CCState &CCInfo, CallLoweringInfo &CLI, MachineFunction &MF,		CCState &CCInfo, CallLoweringInfo &CLI, MachineFunction &MF,
const SmallVector<CCValAssign, 16> &ArgLocs) const;		const SmallVector<CCValAssign, 16> &ArgLocs) const;

/// Generate error diagnostics if any register used by CC has been marked		/// Generate error diagnostics if any register used by CC has been marked
/// reserved.		/// reserved.
void validateCCReservedRegs(		void validateCCReservedRegs(
▲ Show 20 Lines • Show All 44 Lines • Show Last 20 Lines

llvm/lib/Target/RISCV/RISCVISelLowering.cpp

Show First 20 Lines • Show All 458 Lines • ▼ Show 20 Lines	for (MVT VT : IntVecVTs) {
setOperationAction(ISD::VECREDUCE_ADD, VT, Custom);		setOperationAction(ISD::VECREDUCE_ADD, VT, Custom);
setOperationAction(ISD::VECREDUCE_AND, VT, Custom);		setOperationAction(ISD::VECREDUCE_AND, VT, Custom);
setOperationAction(ISD::VECREDUCE_OR, VT, Custom);		setOperationAction(ISD::VECREDUCE_OR, VT, Custom);
setOperationAction(ISD::VECREDUCE_XOR, VT, Custom);		setOperationAction(ISD::VECREDUCE_XOR, VT, Custom);
setOperationAction(ISD::VECREDUCE_SMAX, VT, Custom);		setOperationAction(ISD::VECREDUCE_SMAX, VT, Custom);
setOperationAction(ISD::VECREDUCE_SMIN, VT, Custom);		setOperationAction(ISD::VECREDUCE_SMIN, VT, Custom);
setOperationAction(ISD::VECREDUCE_UMAX, VT, Custom);		setOperationAction(ISD::VECREDUCE_UMAX, VT, Custom);
setOperationAction(ISD::VECREDUCE_UMIN, VT, Custom);		setOperationAction(ISD::VECREDUCE_UMIN, VT, Custom);

		setOperationAction(ISD::MGATHER, VT, Custom);
}		}

// Expand various CCs to best match the RVV ISA, which natively supports UNE		// Expand various CCs to best match the RVV ISA, which natively supports UNE
// but no other unordered comparisons, and supports all ordered comparisons		// but no other unordered comparisons, and supports all ordered comparisons
// except ONE. Additionally, we expand GT,OGT,GE,OGE for optimization		// except ONE. Additionally, we expand GT,OGT,GE,OGE for optimization
// purposes; they are expanded to their swapped-operand CCs (LT,OLT,LE,OLE),		// purposes; they are expanded to their swapped-operand CCs (LT,OLT,LE,OLE),
// and we pattern-match those back to the "original", swapping operands once		// and we pattern-match those back to the "original", swapping operands once
// more. This way we catch both operations and both "vf" and "fv" forms with		// more. This way we catch both operations and both "vf" and "fv" forms with
Show All 17 Lines	const auto SetCommonVFPActions = [&](MVT VT) {
setOperationAction(ISD::INSERT_VECTOR_ELT, VT, Custom);		setOperationAction(ISD::INSERT_VECTOR_ELT, VT, Custom);
setOperationAction(ISD::EXTRACT_VECTOR_ELT, VT, Custom);		setOperationAction(ISD::EXTRACT_VECTOR_ELT, VT, Custom);
// Expand various condition codes (explained above).		// Expand various condition codes (explained above).
for (auto CC : VFPCCToExpand)		for (auto CC : VFPCCToExpand)
setCondCodeAction(CC, VT, Expand);		setCondCodeAction(CC, VT, Expand);

setOperationAction(ISD::VECREDUCE_FADD, VT, Custom);		setOperationAction(ISD::VECREDUCE_FADD, VT, Custom);
setOperationAction(ISD::VECREDUCE_SEQ_FADD, VT, Custom);		setOperationAction(ISD::VECREDUCE_SEQ_FADD, VT, Custom);

		setOperationAction(ISD::MGATHER, VT, Custom);
};		};

if (Subtarget.hasStdExtZfh())		if (Subtarget.hasStdExtZfh())
for (MVT VT : F16VecVTs)		for (MVT VT : F16VecVTs)
SetCommonVFPActions(VT);		SetCommonVFPActions(VT);

if (Subtarget.hasStdExtF())		if (Subtarget.hasStdExtF())
for (MVT VT : F32VecVTs)		for (MVT VT : F32VecVTs)
▲ Show 20 Lines • Show All 701 Lines • ▼ Show 20 Lines	SDValue RISCVTargetLowering::LowerOperation(SDValue Op,
case ISD::SMIN:		case ISD::SMIN:
return lowerToScalableOp(Op, DAG, RISCVISD::SMIN_VL);		return lowerToScalableOp(Op, DAG, RISCVISD::SMIN_VL);
case ISD::SMAX:		case ISD::SMAX:
return lowerToScalableOp(Op, DAG, RISCVISD::SMAX_VL);		return lowerToScalableOp(Op, DAG, RISCVISD::SMAX_VL);
case ISD::UMIN:		case ISD::UMIN:
return lowerToScalableOp(Op, DAG, RISCVISD::UMIN_VL);		return lowerToScalableOp(Op, DAG, RISCVISD::UMIN_VL);
case ISD::UMAX:		case ISD::UMAX:
return lowerToScalableOp(Op, DAG, RISCVISD::UMAX_VL);		return lowerToScalableOp(Op, DAG, RISCVISD::UMAX_VL);
		case ISD::MGATHER:
		return lowerMGATHER(Op, DAG);
}		}
}		}

static SDValue getTargetNode(GlobalAddressSDNode *N, SDLoc DL, EVT Ty,		static SDValue getTargetNode(GlobalAddressSDNode *N, SDLoc DL, EVT Ty,
SelectionDAG &DAG, unsigned Flags) {		SelectionDAG &DAG, unsigned Flags) {
return DAG.getTargetGlobalAddress(N->getGlobal(), DL, Ty, 0, Flags);		return DAG.getTargetGlobalAddress(N->getGlobal(), DL, Ty, 0, Flags);
}		}

▲ Show 20 Lines • Show All 815 Lines • ▼ Show 20 Lines	return DAG.getNode(ISD::EXTRACT_VECTOR_ELT, DL, VecEltVT, Reduction,
DAG.getConstant(0, DL, Subtarget.getXLenVT()));		DAG.getConstant(0, DL, Subtarget.getXLenVT()));
}		}

SDValue		SDValue
RISCVTargetLowering::lowerFixedLengthVectorLoadToRVV(SDValue Op,		RISCVTargetLowering::lowerFixedLengthVectorLoadToRVV(SDValue Op,
SelectionDAG &DAG) const {		SelectionDAG &DAG) const {
auto *Load = cast<LoadSDNode>(Op);		auto *Load = cast<LoadSDNode>(Op);

SDLoc DL(Op);		SDLoc DL(Op);
		frasercrmckAuthorUnsubmitted Done Reply Inline Actions I'll add tests in case LLVM tries to create "ext loads" out of these. We'd have to undo that if that were the case. frasercrmck: I'll add tests in case LLVM tries to create "ext loads" out of these. We'd have to undo that if…
MVT VT = Op.getSimpleValueType();		MVT VT = Op.getSimpleValueType();
MVT ContainerVT = getContainerForFixedLengthVector(DAG, VT, Subtarget);		MVT ContainerVT = getContainerForFixedLengthVector(DAG, VT, Subtarget);

SDValue VL =		SDValue VL =
DAG.getConstant(VT.getVectorNumElements(), DL, Subtarget.getXLenVT());		DAG.getConstant(VT.getVectorNumElements(), DL, Subtarget.getXLenVT());

SDVTList VTs = DAG.getVTList({ContainerVT, MVT::Other});		SDVTList VTs = DAG.getVTList({ContainerVT, MVT::Other});
SDValue NewLoad = DAG.getMemIntrinsicNode(		SDValue NewLoad = DAG.getMemIntrinsicNode(
RISCVISD::VLE_VL, DL, VTs, {Load->getChain(), Load->getBasePtr(), VL},		RISCVISD::VLE_VL, DL, VTs, {Load->getChain(), Load->getBasePtr(), VL},
Load->getMemoryVT(), Load->getMemOperand());		Load->getMemoryVT(), Load->getMemOperand());

SDValue Result = convertFromScalableVector(VT, NewLoad, DAG, Subtarget);		SDValue Result = convertFromScalableVector(VT, NewLoad, DAG, Subtarget);
return DAG.getMergeValues({Result, Load->getChain()}, DL);		return DAG.getMergeValues({Result, Load->getChain()}, DL);
}		}

SDValue		SDValue
RISCVTargetLowering::lowerFixedLengthVectorStoreToRVV(SDValue Op,		RISCVTargetLowering::lowerFixedLengthVectorStoreToRVV(SDValue Op,
SelectionDAG &DAG) const {		SelectionDAG &DAG) const {
auto *Store = cast<StoreSDNode>(Op);		auto *Store = cast<StoreSDNode>(Op);

SDLoc DL(Op);		SDLoc DL(Op);
MVT VT = Store->getValue().getSimpleValueType();		MVT VT = Store->getValue().getSimpleValueType();

		craig.topperUnsubmitted Not Done Reply Inline Actions Is it possible that IndexVT has 32-bit elements on a 64-bit target and that the IndexVT is already LMUL==8 such that this SIGN_EXTEND/ZERO_EXTEND would produce an illegal LMUL==16 type? craig.topper: Is it possible that IndexVT has 32-bit elements on a 64-bit target and that the IndexVT is…
		frasercrmckAuthorUnsubmitted Not Done Reply Inline Actions Yes, it's possible, and similarly on a 32-bit target with an illegal 8- or 16-bit index type, but I think that implies the original intrinsic would have an illegal pointer type, like `<vscale x 16 x i32>`. So in that sense it's ideally something LLVM would help legalize (split) for us, but sadly it folds the illegal intrinsic to one with legal types, e.g.: `i32 base, <vscale x 16 x i32> idxs` so it doesn't see that until it asks us to custom-lower. Am I right in thinking we have to custom-legalize this ourselves, duplicating logic from `LegalizeVectorTypes`? frasercrmck: Yes, it's possible, and similarly on a 32-bit target with an illegal 8- or 16-bit index type…
		frasercrmckAuthorUnsubmitted Not Done Reply Inline Actions It should be possible to do a DAGCombine pre-legalization which creates the illegal XLEN index types and passes it back to go through the vanilla legalization, if you think that's a valid route. Either way it's going to require support for scalable-vector insert/extract subvector. In the worst case we'll have to expand nxv64i64 (from nxv64i8) into 8 x nxv8i64. frasercrmck: It should be possible to do a DAGCombine pre-legalization which creates the illegal XLEN index…
		craig.topperUnsubmitted Not Done Reply Inline Actions Would the DAG combine end up fighting with the combine that uses shouldRemoveExtendFromGSIndex? craig.topper: Would the DAG combine end up fighting with the combine that uses shouldRemoveExtendFromGSIndex?
		frasercrmckAuthorUnsubmitted Not Done Reply Inline Actions It does, so you have to turn off that hook. I don't think that's the worst thing for our gathers since only UNSIGNED UNSCALED can be represented as index types smaller than XLEN, and I couldn't find anything that would generate that. frasercrmck: It does, so you have to turn off that hook. I don't think that's the worst thing for our…
// FIXME: We probably need to zero any extra bits in a byte for mask stores.		// FIXME: We probably need to zero any extra bits in a byte for mask stores.
// This is tricky to do.		// This is tricky to do.

MVT ContainerVT = getContainerForFixedLengthVector(DAG, VT, Subtarget);		MVT ContainerVT = getContainerForFixedLengthVector(DAG, VT, Subtarget);

SDValue VL =		SDValue VL =
DAG.getConstant(VT.getVectorNumElements(), DL, Subtarget.getXLenVT());		DAG.getConstant(VT.getVectorNumElements(), DL, Subtarget.getXLenVT());

SDValue NewValue =		SDValue NewValue =
convertToScalableVector(ContainerVT, Store->getValue(), DAG, Subtarget);		convertToScalableVector(ContainerVT, Store->getValue(), DAG, Subtarget);
		craig.topperUnsubmitted Done Reply Inline Actions Assert that this is a power of 2. I'm not completely sure that's guaranteed, but maybe it is for the types we expect to see. craig.topper: Assert that this is a power of 2. I'm not completely sure that's guaranteed, but maybe it is…
		frasercrmckAuthorUnsubmitted Done Reply Inline Actions Good idea. frasercrmck: Good idea.
return DAG.getMemIntrinsicNode(		return DAG.getMemIntrinsicNode(
RISCVISD::VSE_VL, DL, DAG.getVTList(MVT::Other),		RISCVISD::VSE_VL, DL, DAG.getVTList(MVT::Other),
{Store->getChain(), NewValue, Store->getBasePtr(), VL},		{Store->getChain(), NewValue, Store->getBasePtr(), VL},
Store->getMemoryVT(), Store->getMemOperand());		Store->getMemoryVT(), Store->getMemOperand());
}		}

SDValue RISCVTargetLowering::lowerToScalableOp(SDValue Op, SelectionDAG &DAG,		SDValue RISCVTargetLowering::lowerToScalableOp(SDValue Op, SelectionDAG &DAG,
unsigned NewOpc) const {		unsigned NewOpc) const {
Show All 26 Lines	SDValue RISCVTargetLowering::lowerToScalableOp(SDValue Op, SelectionDAG &DAG,
SDValue Mask = DAG.getNode(RISCVISD::VMSET_VL, DL, MaskVT, VL);		SDValue Mask = DAG.getNode(RISCVISD::VMSET_VL, DL, MaskVT, VL);
Ops.push_back(Mask);		Ops.push_back(Mask);
Ops.push_back(VL);		Ops.push_back(VL);

SDValue ScalableRes = DAG.getNode(NewOpc, DL, ContainerVT, Ops);		SDValue ScalableRes = DAG.getNode(NewOpc, DL, ContainerVT, Ops);
return convertFromScalableVector(VT, ScalableRes, DAG, Subtarget);		return convertFromScalableVector(VT, ScalableRes, DAG, Subtarget);
}		}

		// Custom lower MGATHER to a legalized form for RVV. It will then be matched to
		// a RVV indexed load. The RVV indexed load/store instructions only support the
		// "unsigned unscaled" addressing mode; indices are implicitly zero-extended or
		// truncated to XLEN and are treated as byte offsets. Any signed or scaled
		// indexing is extended to the XLEN value type and scaled accordingly.
		SDValue RISCVTargetLowering::lowerMGATHER(SDValue Op, SelectionDAG &DAG) const {
		MaskedGatherSDNode *N = cast<MaskedGatherSDNode>(Op.getNode());
		SDLoc DL(Op);
		MVT VT = Op.getSimpleValueType();
		SDValue Index = N->getIndex();
		SDValue Mask = N->getMask();
		SDValue PassThru = N->getPassThru();
		MVT IndexVT = Index.getSimpleValueType();

		MVT XLenVT = Subtarget.getXLenVT();
		assert(N->getBasePtr().getSimpleValueType() == XLenVT &&
		"Unexpected pointer type");
		// Targets have to explicitly opt-in for extending vector loads>
		assert(N->getExtensionType() == ISD::NON_EXTLOAD &&
		"Unexpected extending MGATHER");

		// RISCV indexed loads only support the "unsigned unscaled" addressing mode,
		// so anything else must be manually legalized.
		if (N->isIndexScaled() \|\|
		(N->isIndexSigned() && IndexVT.getVectorElementType().bitsLT(XLenVT))) {
		// Scale the indices up to pointer size (XLEN). This is required for all
		// signed indices (we need the sign bit at position XLEN-1) and for
		// unsigned scaled indices it helps prevent overflow when scaling.
		if (IndexVT.getVectorElementType().bitsLT(XLenVT)) {
		IndexVT = IndexVT.changeVectorElementType(XLenVT);
		Index =
		DAG.getNode(N->isIndexSigned() ? ISD::SIGN_EXTEND : ISD::ZERO_EXTEND,
		DL, IndexVT, Index);
		}
		// Manually scale the indices by the element size
		unsigned Scale = N->getConstantOperandVal(5);
		if (N->isIndexScaled() && Scale != 1) {
		assert(isPowerOf2_32(Scale) && "Expecting power-of-two types");
		bool IsRV32E64 =
		!Subtarget.is64Bit() && IndexVT.getVectorElementType() == MVT::i64;
		SDValue SplatScale =
		DAG.getConstant(Log2_32(Scale), DL, Subtarget.getXLenVT());
		if (!IsRV32E64)
		SplatScale = DAG.getSplatVector(IndexVT, DL, SplatScale);
		else
		SplatScale =
		DAG.getNode(RISCVISD::SPLAT_VECTOR_I64, DL, IndexVT, SplatScale);
		Index = DAG.getNode(ISD::SHL, DL, IndexVT, Index, SplatScale);
		}
		}

		SDValue Ops[] = {N->getChain(), PassThru, N->getBasePtr(), Index, Mask};
		return DAG.getMemIntrinsicNode(RISCVISD::MGATHER, DL,
		DAG.getVTList(VT, MVT::Other), Ops,
		N->getMemoryVT(), N->getMemOperand());
		}

// Returns the opcode of the target-specific SDNode that implements the 32-bit		// Returns the opcode of the target-specific SDNode that implements the 32-bit
// form of the given Opcode.		// form of the given Opcode.
static RISCVISD::NodeType getRISCVWOpcode(unsigned Opcode) {		static RISCVISD::NodeType getRISCVWOpcode(unsigned Opcode) {
switch (Opcode) {		switch (Opcode) {
default:		default:
llvm_unreachable("Unexpected opcode");		llvm_unreachable("Unexpected opcode");
case ISD::SHL:		case ISD::SHL:
return RISCVISD::SLLW;		return RISCVISD::SLLW;
▲ Show 20 Lines • Show All 2,582 Lines • ▼ Show 20 Lines	#define NODE_NAME_CASE(NODE) \
NODE_NAME_CASE(SMAX_VL)		NODE_NAME_CASE(SMAX_VL)
NODE_NAME_CASE(UMIN_VL)		NODE_NAME_CASE(UMIN_VL)
NODE_NAME_CASE(UMAX_VL)		NODE_NAME_CASE(UMAX_VL)
NODE_NAME_CASE(VMCLR_VL)		NODE_NAME_CASE(VMCLR_VL)
NODE_NAME_CASE(VMSET_VL)		NODE_NAME_CASE(VMSET_VL)
NODE_NAME_CASE(VRGATHER_VX_VL)		NODE_NAME_CASE(VRGATHER_VX_VL)
NODE_NAME_CASE(VLE_VL)		NODE_NAME_CASE(VLE_VL)
NODE_NAME_CASE(VSE_VL)		NODE_NAME_CASE(VSE_VL)
		NODE_NAME_CASE(MGATHER)
}		}
// clang-format on		// clang-format on
return nullptr;		return nullptr;
#undef NODE_NAME_CASE		#undef NODE_NAME_CASE
}		}

/// getConstraintType - Given a constraint letter, return the type of		/// getConstraintType - Given a constraint letter, return the type of
/// constraint it is for this target.		/// constraint it is for this target.
▲ Show 20 Lines • Show All 341 Lines • ▼ Show 20 Lines	Function *MaskedCmpXchg =
Intrinsic::getDeclaration(CI->getModule(), CmpXchgIntrID, Tys);		Intrinsic::getDeclaration(CI->getModule(), CmpXchgIntrID, Tys);
Value *Result = Builder.CreateCall(		Value *Result = Builder.CreateCall(
MaskedCmpXchg, {AlignedAddr, CmpVal, NewVal, Mask, Ordering});		MaskedCmpXchg, {AlignedAddr, CmpVal, NewVal, Mask, Ordering});
if (XLen == 64)		if (XLen == 64)
Result = Builder.CreateTrunc(Result, Builder.getInt32Ty());		Result = Builder.CreateTrunc(Result, Builder.getInt32Ty());
return Result;		return Result;
}		}

		bool RISCVTargetLowering::shouldRemoveExtendFromGSIndex(EVT VT) const {
		EVT EltVT = VT.getVectorElementType();
		return EltVT == MVT::i8 \|\| EltVT == MVT::i16 \|\| EltVT == MVT::i32;
		}

bool RISCVTargetLowering::isFMAFasterThanFMulAndFAdd(const MachineFunction &MF,		bool RISCVTargetLowering::isFMAFasterThanFMulAndFAdd(const MachineFunction &MF,
EVT VT) const {		EVT VT) const {
VT = VT.getScalarType();		VT = VT.getScalarType();

if (!VT.isSimple())		if (!VT.isSimple())
return false;		return false;

switch (VT.getSimpleVT().SimpleTy) {		switch (VT.getSimpleVT().SimpleTy) {
▲ Show 20 Lines • Show All 166 Lines • Show Last 20 Lines

llvm/lib/Target/RISCV/RISCVInstrInfoVSDPatterns.td

Show First 20 Lines • Show All 97 Lines • ▼ Show 20 Lines	multiclass VPatUSLoadStoreMaskSDNode<MTypeInfo m>
// Load		// Load
def : Pat<(m.Mask (load RVVBaseAddr:$rs1)),		def : Pat<(m.Mask (load RVVBaseAddr:$rs1)),
(load_instr RVVBaseAddr:$rs1, m.AVL, m.SEW)>;		(load_instr RVVBaseAddr:$rs1, m.AVL, m.SEW)>;
// Store		// Store
def : Pat<(store m.Mask:$rs2, RVVBaseAddr:$rs1),		def : Pat<(store m.Mask:$rs2, RVVBaseAddr:$rs1),
(store_instr VR:$rs2, RVVBaseAddr:$rs1, m.AVL, m.SEW)>;		(store_instr VR:$rs2, RVVBaseAddr:$rs1, m.AVL, m.SEW)>;
}		}

		def riscv_mgather : SDNode<"RISCVISD::MGATHER",
		SDTypeProfile<1, 4, [SDTCisVT<2, XLenVT>]>,
		[SDNPHasChain, SDNPMayLoad, SDNPMemOperand]>;

		multiclass VPatILoadStoreSDNode<VTypeInfo vti,
		VTypeInfo idx_vti, int eew> {
		defvar iload_name = "PseudoVLOXEI"#eew#"_V_"#idx_vti.LMul.MX#"_"#vti.LMul.MX;
		defvar iload_instr = !cast<Instruction>(iload_name);
		defvar iload_instr_mask = !cast<Instruction>(iload_name # "_MASK");
		frasercrmckAuthorUnsubmitted Done Reply Inline Actions We can improve codegen for when the mask is known "true". frasercrmck: We can improve codegen for when the mask is known "true".
		// Load
		def : Pat<(vti.Vector (riscv_mgather (vti.Vector srcvalue),
		RVVBaseAddr:$rs1,
		(idx_vti.Vector idx_vti.Vector:$rs2),
		(vti.Mask immAllOnesV))),
		(iload_instr $rs1, $rs2, vti.AVL, vti.SEW)>;
		def : Pat<(vti.Vector (riscv_mgather (vti.Vector GetVRegNoV0<vti.RegClass>.R:$merge),
		RVVBaseAddr:$rs1,
		(idx_vti.Vector idx_vti.Vector:$rs2),
		(vti.Mask VMaskOp:$vm))),
		(iload_instr_mask $merge, $rs1, $rs2, $vm, vti.AVL, vti.SEW)>;
		}

class VPatBinarySDNode_VV<SDNode vop,		class VPatBinarySDNode_VV<SDNode vop,
string instruction_name,		string instruction_name,
ValueType result_type,		ValueType result_type,
ValueType op_type,		ValueType op_type,
ValueType mask_type,		ValueType mask_type,
int sew,		int sew,
LMULInfo vlmul,		LMULInfo vlmul,
OutPatFrag avl,		OutPatFrag avl,
▲ Show 20 Lines • Show All 298 Lines • ▼ Show 20 Lines	foreach vti = [VI8M1, VI16M1, VI32M1, VI64M1, VF16M1, VF32M1, VF64M1] in
defm "" : VPatUSLoadStoreWholeVRSDNode<vti.Vector, vti.SEW, vti.LMul,		defm "" : VPatUSLoadStoreWholeVRSDNode<vti.Vector, vti.SEW, vti.LMul,
vti.RegClass>;		vti.RegClass>;
foreach vti = !listconcat(GroupIntegerVectors, GroupFloatVectors) in		foreach vti = !listconcat(GroupIntegerVectors, GroupFloatVectors) in
defm "" : VPatUSLoadStoreWholeVRSDNode<vti.Vector, vti.SEW, vti.LMul,		defm "" : VPatUSLoadStoreWholeVRSDNode<vti.Vector, vti.SEW, vti.LMul,
vti.RegClass>;		vti.RegClass>;
foreach mti = AllMasks in		foreach mti = AllMasks in
defm "" : VPatUSLoadStoreMaskSDNode<mti>;		defm "" : VPatUSLoadStoreMaskSDNode<mti>;

		// 7.6. Vector Indexed Instructions
		foreach vti = AllVectors in {
		foreach eew = EEWList in {

		defvar vlmul = vti.LMul;
		defvar octuple_lmul = octuple_from_str<vti.LMul.MX>.ret;
		defvar log_sew = shift_amount<vti.SEW>.val;

		// The data vector register group has EEW=SEW, EMUL=LMUL, while the offset
		// vector register group has EEW encoding in the instruction and EMUL=(EEW/SEW)*LMUL.
		// calculate octuple elmul which is (eew * octuple_lmul) >> log_sew
		defvar octuple_elmul = !srl(!mul(eew, octuple_lmul), log_sew);
		// legal octuple elmul should be more than 0 and less than equal 64
		if !gt(octuple_elmul, 0) then {
		if !le(octuple_elmul, 64) then {
		frasercrmckAuthorUnsubmitted Not Done Reply Inline Actions This is (helpfully) copy/pasted from VPseudos.td. Is there a way to create a "list" (e.g. of val/idx tuples) there which we reuse here? frasercrmck: This is (helpfully) copy/pasted from VPseudos.td. Is there a way to create a "list" (e.g. of…
		defvar elmul_str = octuple_to_str<octuple_elmul>.ret;
		//defvar elmul =!cast<LMULInfo>("V_" # elmul_str);
		defvar idx_vti = !cast<VTypeInfo>("VI" # eew # elmul_str);
		defm "" : VPatILoadStoreSDNode<vti, idx_vti, eew>;
		}
		}

		}
		}

// 12.1. Vector Single-Width Integer Add and Subtract		// 12.1. Vector Single-Width Integer Add and Subtract
defm "" : VPatBinarySDNode_VV_VX_VI<add, "PseudoVADD">;		defm "" : VPatBinarySDNode_VV_VX_VI<add, "PseudoVADD">;
defm "" : VPatBinarySDNode_VV_VX<sub, "PseudoVSUB">;		defm "" : VPatBinarySDNode_VV_VX<sub, "PseudoVSUB">;
// Handle VRSUB specially since it's the only integer binary op with reversed		// Handle VRSUB specially since it's the only integer binary op with reversed
// pattern operands		// pattern operands
foreach vti = AllIntegerVectors in {		foreach vti = AllIntegerVectors in {
def : Pat<(sub (vti.Vector (SplatPat XLenVT:$rs2)),		def : Pat<(sub (vti.Vector (SplatPat XLenVT:$rs2)),
(vti.Vector vti.RegClass:$rs1)),		(vti.Vector vti.RegClass:$rs1)),
▲ Show 20 Lines • Show All 438 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/mgather-sdnode.ll

This file was added.

				; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
				; RUN: llc -mtriple=riscv32 -mattr=+d,+experimental-zfh,+experimental-v -target-abi=ilp32d \
				; RUN: -verify-machineinstrs < %s \| FileCheck %s --check-prefix=RV32
				; RUN: llc -mtriple=riscv64 -mattr=+d,+experimental-zfh,+experimental-v -target-abi=lp64d \
				; RUN: -verify-machineinstrs < %s \| FileCheck %s --check-prefix=RV64

				declare <vscale x 1 x i8> @llvm.masked.gather.nxv1i8.nxv1p0i8(<vscale x 1 x i8*>, i32, <vscale x 1 x i1>, <vscale x 1 x i8>)

				define <vscale x 1 x i8> @mgather_nxv1i8(<vscale x 1 x i8*> %ptrs, <vscale x 1 x i1> %m, <vscale x 1 x i8> %passthru) {
				; RV32-LABEL: mgather_nxv1i8:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e8,mf8,tu,mu
				; RV32-NEXT: vloxei32.v v9, (zero), v8, v0.t
				; RV32-NEXT: vmv1r.v v8, v9
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_nxv1i8:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e8,mf8,tu,mu
				; RV64-NEXT: vloxei64.v v9, (zero), v8, v0.t
				; RV64-NEXT: vmv1r.v v8, v9
				; RV64-NEXT: ret
				%v = call <vscale x 1 x i8> @llvm.masked.gather.nxv1i8.nxv1p0i8(<vscale x 1 x i8*> %ptrs, i32 1, <vscale x 1 x i1> %m, <vscale x 1 x i8> %passthru)
				ret <vscale x 1 x i8> %v
				}

				declare <vscale x 2 x i8> @llvm.masked.gather.nxv2i8.nxv2p0i8(<vscale x 2 x i8*>, i32, <vscale x 2 x i1>, <vscale x 2 x i8>)

				define <vscale x 2 x i8> @mgather_nxv2i8(<vscale x 2 x i8*> %ptrs, <vscale x 2 x i1> %m, <vscale x 2 x i8> %passthru) {
				; RV32-LABEL: mgather_nxv2i8:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e8,mf4,tu,mu
				; RV32-NEXT: vloxei32.v v9, (zero), v8, v0.t
				; RV32-NEXT: vmv1r.v v8, v9
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_nxv2i8:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e8,mf4,tu,mu
				; RV64-NEXT: vloxei64.v v10, (zero), v8, v0.t
				; RV64-NEXT: vmv1r.v v8, v10
				; RV64-NEXT: ret
				%v = call <vscale x 2 x i8> @llvm.masked.gather.nxv2i8.nxv2p0i8(<vscale x 2 x i8*> %ptrs, i32 1, <vscale x 2 x i1> %m, <vscale x 2 x i8> %passthru)
				ret <vscale x 2 x i8> %v
				}

				define <vscale x 2 x i16> @mgather_nxv2i8_sextload_nxv2i16(<vscale x 2 x i8*> %ptrs, <vscale x 2 x i1> %m, <vscale x 2 x i8> %passthru) {
				; RV32-LABEL: mgather_nxv2i8_sextload_nxv2i16:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e8,mf4,tu,mu
				; RV32-NEXT: vloxei32.v v9, (zero), v8, v0.t
				; RV32-NEXT: vsetvli a0, zero, e16,mf2,ta,mu
				; RV32-NEXT: vsext.vf2 v8, v9
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_nxv2i8_sextload_nxv2i16:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e8,mf4,tu,mu
				; RV64-NEXT: vloxei64.v v10, (zero), v8, v0.t
				; RV64-NEXT: vsetvli a0, zero, e16,mf2,ta,mu
				; RV64-NEXT: vsext.vf2 v8, v10
				; RV64-NEXT: ret
				%v = call <vscale x 2 x i8> @llvm.masked.gather.nxv2i8.nxv2p0i8(<vscale x 2 x i8*> %ptrs, i32 1, <vscale x 2 x i1> %m, <vscale x 2 x i8> %passthru)
				%ev = sext <vscale x 2 x i8> %v to <vscale x 2 x i16>
				ret <vscale x 2 x i16> %ev
				}

				define <vscale x 2 x i16> @mgather_nxv2i8_zextload_nxv2i16(<vscale x 2 x i8*> %ptrs, <vscale x 2 x i1> %m, <vscale x 2 x i8> %passthru) {
				; RV32-LABEL: mgather_nxv2i8_zextload_nxv2i16:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e8,mf4,tu,mu
				; RV32-NEXT: vloxei32.v v9, (zero), v8, v0.t
				; RV32-NEXT: vsetvli a0, zero, e16,mf2,ta,mu
				; RV32-NEXT: vzext.vf2 v8, v9
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_nxv2i8_zextload_nxv2i16:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e8,mf4,tu,mu
				; RV64-NEXT: vloxei64.v v10, (zero), v8, v0.t
				; RV64-NEXT: vsetvli a0, zero, e16,mf2,ta,mu
				; RV64-NEXT: vzext.vf2 v8, v10
				; RV64-NEXT: ret
				%v = call <vscale x 2 x i8> @llvm.masked.gather.nxv2i8.nxv2p0i8(<vscale x 2 x i8*> %ptrs, i32 1, <vscale x 2 x i1> %m, <vscale x 2 x i8> %passthru)
				%ev = zext <vscale x 2 x i8> %v to <vscale x 2 x i16>
				ret <vscale x 2 x i16> %ev
				}

				define <vscale x 2 x i32> @mgather_nxv2i8_sextload_nxv2i32(<vscale x 2 x i8*> %ptrs, <vscale x 2 x i1> %m, <vscale x 2 x i8> %passthru) {
				; RV32-LABEL: mgather_nxv2i8_sextload_nxv2i32:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e8,mf4,tu,mu
				; RV32-NEXT: vloxei32.v v9, (zero), v8, v0.t
				; RV32-NEXT: vsetvli a0, zero, e32,m1,ta,mu
				; RV32-NEXT: vsext.vf4 v8, v9
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_nxv2i8_sextload_nxv2i32:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e8,mf4,tu,mu
				; RV64-NEXT: vloxei64.v v10, (zero), v8, v0.t
				; RV64-NEXT: vsetvli a0, zero, e32,m1,ta,mu
				; RV64-NEXT: vsext.vf4 v8, v10
				; RV64-NEXT: ret
				%v = call <vscale x 2 x i8> @llvm.masked.gather.nxv2i8.nxv2p0i8(<vscale x 2 x i8*> %ptrs, i32 1, <vscale x 2 x i1> %m, <vscale x 2 x i8> %passthru)
				%ev = sext <vscale x 2 x i8> %v to <vscale x 2 x i32>
				ret <vscale x 2 x i32> %ev
				}

				define <vscale x 2 x i32> @mgather_nxv2i8_zextload_nxv2i32(<vscale x 2 x i8*> %ptrs, <vscale x 2 x i1> %m, <vscale x 2 x i8> %passthru) {
				; RV32-LABEL: mgather_nxv2i8_zextload_nxv2i32:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e8,mf4,tu,mu
				; RV32-NEXT: vloxei32.v v9, (zero), v8, v0.t
				; RV32-NEXT: vsetvli a0, zero, e32,m1,ta,mu
				; RV32-NEXT: vzext.vf4 v8, v9
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_nxv2i8_zextload_nxv2i32:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e8,mf4,tu,mu
				; RV64-NEXT: vloxei64.v v10, (zero), v8, v0.t
				; RV64-NEXT: vsetvli a0, zero, e32,m1,ta,mu
				; RV64-NEXT: vzext.vf4 v8, v10
				; RV64-NEXT: ret
				%v = call <vscale x 2 x i8> @llvm.masked.gather.nxv2i8.nxv2p0i8(<vscale x 2 x i8*> %ptrs, i32 1, <vscale x 2 x i1> %m, <vscale x 2 x i8> %passthru)
				%ev = zext <vscale x 2 x i8> %v to <vscale x 2 x i32>
				ret <vscale x 2 x i32> %ev
				}

				define <vscale x 2 x i64> @mgather_nxv2i8_sextload_nxv2i64(<vscale x 2 x i8*> %ptrs, <vscale x 2 x i1> %m, <vscale x 2 x i8> %passthru) {
				; RV32-LABEL: mgather_nxv2i8_sextload_nxv2i64:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e8,mf4,tu,mu
				; RV32-NEXT: vloxei32.v v9, (zero), v8, v0.t
				; RV32-NEXT: vsetvli a0, zero, e64,m2,ta,mu
				; RV32-NEXT: vsext.vf8 v26, v9
				; RV32-NEXT: vmv2r.v v8, v26
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_nxv2i8_sextload_nxv2i64:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e8,mf4,tu,mu
				; RV64-NEXT: vloxei64.v v10, (zero), v8, v0.t
				; RV64-NEXT: vsetvli a0, zero, e64,m2,ta,mu
				; RV64-NEXT: vsext.vf8 v8, v10
				; RV64-NEXT: ret
				%v = call <vscale x 2 x i8> @llvm.masked.gather.nxv2i8.nxv2p0i8(<vscale x 2 x i8*> %ptrs, i32 1, <vscale x 2 x i1> %m, <vscale x 2 x i8> %passthru)
				%ev = sext <vscale x 2 x i8> %v to <vscale x 2 x i64>
				ret <vscale x 2 x i64> %ev
				}

				define <vscale x 2 x i64> @mgather_nxv2i8_zextload_nxv2i64(<vscale x 2 x i8*> %ptrs, <vscale x 2 x i1> %m, <vscale x 2 x i8> %passthru) {
				; RV32-LABEL: mgather_nxv2i8_zextload_nxv2i64:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e8,mf4,tu,mu
				; RV32-NEXT: vloxei32.v v9, (zero), v8, v0.t
				; RV32-NEXT: vsetvli a0, zero, e64,m2,ta,mu
				; RV32-NEXT: vzext.vf8 v26, v9
				; RV32-NEXT: vmv2r.v v8, v26
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_nxv2i8_zextload_nxv2i64:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e8,mf4,tu,mu
				; RV64-NEXT: vloxei64.v v10, (zero), v8, v0.t
				; RV64-NEXT: vsetvli a0, zero, e64,m2,ta,mu
				; RV64-NEXT: vzext.vf8 v8, v10
				; RV64-NEXT: ret
				%v = call <vscale x 2 x i8> @llvm.masked.gather.nxv2i8.nxv2p0i8(<vscale x 2 x i8*> %ptrs, i32 1, <vscale x 2 x i1> %m, <vscale x 2 x i8> %passthru)
				%ev = zext <vscale x 2 x i8> %v to <vscale x 2 x i64>
				ret <vscale x 2 x i64> %ev
				}

				declare <vscale x 4 x i8> @llvm.masked.gather.nxv4i8.nxv4p0i8(<vscale x 4 x i8*>, i32, <vscale x 4 x i1>, <vscale x 4 x i8>)

				define <vscale x 4 x i8> @mgather_nxv4i8(<vscale x 4 x i8*> %ptrs, <vscale x 4 x i1> %m, <vscale x 4 x i8> %passthru) {
				; RV32-LABEL: mgather_nxv4i8:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e8,mf2,tu,mu
				; RV32-NEXT: vloxei32.v v10, (zero), v8, v0.t
				; RV32-NEXT: vmv1r.v v8, v10
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_nxv4i8:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e8,mf2,tu,mu
				; RV64-NEXT: vloxei64.v v12, (zero), v8, v0.t
				; RV64-NEXT: vmv1r.v v8, v12
				; RV64-NEXT: ret
				%v = call <vscale x 4 x i8> @llvm.masked.gather.nxv4i8.nxv4p0i8(<vscale x 4 x i8*> %ptrs, i32 1, <vscale x 4 x i1> %m, <vscale x 4 x i8> %passthru)
				ret <vscale x 4 x i8> %v
				}

				define <vscale x 4 x i8> @mgather_truemask_nxv4i8(<vscale x 4 x i8*> %ptrs, <vscale x 4 x i8> %passthru) {
				; RV32-LABEL: mgather_truemask_nxv4i8:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e8,mf2,ta,mu
				; RV32-NEXT: vloxei32.v v8, (zero), v8
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_truemask_nxv4i8:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e8,mf2,ta,mu
				; RV64-NEXT: vloxei64.v v8, (zero), v8
				; RV64-NEXT: ret
				%mhead = insertelement <vscale x 4 x i1> undef, i1 1, i32 0
				%mtrue = shufflevector <vscale x 4 x i1> %mhead, <vscale x 4 x i1> undef, <vscale x 4 x i32> zeroinitializer
				%v = call <vscale x 4 x i8> @llvm.masked.gather.nxv4i8.nxv4p0i8(<vscale x 4 x i8*> %ptrs, i32 1, <vscale x 4 x i1> %mtrue, <vscale x 4 x i8> %passthru)
				ret <vscale x 4 x i8> %v
				}

				declare <vscale x 8 x i8> @llvm.masked.gather.nxv8i8.nxv8p0i8(<vscale x 8 x i8*>, i32, <vscale x 8 x i1>, <vscale x 8 x i8>)

				define <vscale x 8 x i8> @mgather_nxv8i8(<vscale x 8 x i8*> %ptrs, <vscale x 8 x i1> %m, <vscale x 8 x i8> %passthru) {
				; RV32-LABEL: mgather_nxv8i8:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e8,m1,tu,mu
				; RV32-NEXT: vloxei32.v v12, (zero), v8, v0.t
				; RV32-NEXT: vmv1r.v v8, v12
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_nxv8i8:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e8,m1,tu,mu
				; RV64-NEXT: vloxei64.v v16, (zero), v8, v0.t
				; RV64-NEXT: vmv1r.v v8, v16
				; RV64-NEXT: ret
				%v = call <vscale x 8 x i8> @llvm.masked.gather.nxv8i8.nxv8p0i8(<vscale x 8 x i8*> %ptrs, i32 1, <vscale x 8 x i1> %m, <vscale x 8 x i8> %passthru)
				ret <vscale x 8 x i8> %v
				}

				define <vscale x 8 x i8> @mgather_baseidx_nxv8i8(i8* %base, <vscale x 8 x i8> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x i8> %passthru) {
				; RV32-LABEL: mgather_baseidx_nxv8i8:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e32,m4,ta,mu
				; RV32-NEXT: vsext.vf4 v28, v8
				; RV32-NEXT: vsetvli a1, zero, e8,m1,tu,mu
				; RV32-NEXT: vloxei32.v v9, (a0), v28, v0.t
				; RV32-NEXT: vmv1r.v v8, v9
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_nxv8i8:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vsext.vf8 v16, v8
				; RV64-NEXT: vsetvli a1, zero, e8,m1,tu,mu
				; RV64-NEXT: vloxei64.v v9, (a0), v16, v0.t
				; RV64-NEXT: vmv1r.v v8, v9
				; RV64-NEXT: ret
				%ptrs = getelementptr inbounds i8, i8* %base, <vscale x 8 x i8> %idxs
				%v = call <vscale x 8 x i8> @llvm.masked.gather.nxv8i8.nxv8p0i8(<vscale x 8 x i8*> %ptrs, i32 1, <vscale x 8 x i1> %m, <vscale x 8 x i8> %passthru)
				ret <vscale x 8 x i8> %v
				}

				declare <vscale x 1 x i16> @llvm.masked.gather.nxv1i16.nxv1p0i16(<vscale x 1 x i16*>, i32, <vscale x 1 x i1>, <vscale x 1 x i16>)

				define <vscale x 1 x i16> @mgather_nxv1i16(<vscale x 1 x i16*> %ptrs, <vscale x 1 x i1> %m, <vscale x 1 x i16> %passthru) {
				; RV32-LABEL: mgather_nxv1i16:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e16,mf4,tu,mu
				; RV32-NEXT: vloxei32.v v9, (zero), v8, v0.t
				; RV32-NEXT: vmv1r.v v8, v9
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_nxv1i16:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e16,mf4,tu,mu
				; RV64-NEXT: vloxei64.v v9, (zero), v8, v0.t
				; RV64-NEXT: vmv1r.v v8, v9
				; RV64-NEXT: ret
				%v = call <vscale x 1 x i16> @llvm.masked.gather.nxv1i16.nxv1p0i16(<vscale x 1 x i16*> %ptrs, i32 2, <vscale x 1 x i1> %m, <vscale x 1 x i16> %passthru)
				ret <vscale x 1 x i16> %v
				}

				declare <vscale x 2 x i16> @llvm.masked.gather.nxv2i16.nxv2p0i16(<vscale x 2 x i16*>, i32, <vscale x 2 x i1>, <vscale x 2 x i16>)

				define <vscale x 2 x i16> @mgather_nxv2i16(<vscale x 2 x i16*> %ptrs, <vscale x 2 x i1> %m, <vscale x 2 x i16> %passthru) {
				; RV32-LABEL: mgather_nxv2i16:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e16,mf2,tu,mu
				; RV32-NEXT: vloxei32.v v9, (zero), v8, v0.t
				; RV32-NEXT: vmv1r.v v8, v9
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_nxv2i16:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e16,mf2,tu,mu
				; RV64-NEXT: vloxei64.v v10, (zero), v8, v0.t
				; RV64-NEXT: vmv1r.v v8, v10
				; RV64-NEXT: ret
				%v = call <vscale x 2 x i16> @llvm.masked.gather.nxv2i16.nxv2p0i16(<vscale x 2 x i16*> %ptrs, i32 2, <vscale x 2 x i1> %m, <vscale x 2 x i16> %passthru)
				ret <vscale x 2 x i16> %v
				}

				define <vscale x 2 x i32> @mgather_nxv2i16_sextload_nxv2i32(<vscale x 2 x i16*> %ptrs, <vscale x 2 x i1> %m, <vscale x 2 x i16> %passthru) {
				; RV32-LABEL: mgather_nxv2i16_sextload_nxv2i32:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e16,mf2,tu,mu
				; RV32-NEXT: vloxei32.v v9, (zero), v8, v0.t
				; RV32-NEXT: vsetvli a0, zero, e32,m1,ta,mu
				; RV32-NEXT: vsext.vf2 v8, v9
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_nxv2i16_sextload_nxv2i32:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e16,mf2,tu,mu
				; RV64-NEXT: vloxei64.v v10, (zero), v8, v0.t
				; RV64-NEXT: vsetvli a0, zero, e32,m1,ta,mu
				; RV64-NEXT: vsext.vf2 v8, v10
				; RV64-NEXT: ret
				%v = call <vscale x 2 x i16> @llvm.masked.gather.nxv2i16.nxv2p0i16(<vscale x 2 x i16*> %ptrs, i32 2, <vscale x 2 x i1> %m, <vscale x 2 x i16> %passthru)
				%ev = sext <vscale x 2 x i16> %v to <vscale x 2 x i32>
				ret <vscale x 2 x i32> %ev
				}

				define <vscale x 2 x i32> @mgather_nxv2i16_zextload_nxv2i32(<vscale x 2 x i16*> %ptrs, <vscale x 2 x i1> %m, <vscale x 2 x i16> %passthru) {
				; RV32-LABEL: mgather_nxv2i16_zextload_nxv2i32:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e16,mf2,tu,mu
				; RV32-NEXT: vloxei32.v v9, (zero), v8, v0.t
				; RV32-NEXT: vsetvli a0, zero, e32,m1,ta,mu
				; RV32-NEXT: vzext.vf2 v8, v9
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_nxv2i16_zextload_nxv2i32:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e16,mf2,tu,mu
				; RV64-NEXT: vloxei64.v v10, (zero), v8, v0.t
				; RV64-NEXT: vsetvli a0, zero, e32,m1,ta,mu
				; RV64-NEXT: vzext.vf2 v8, v10
				; RV64-NEXT: ret
				%v = call <vscale x 2 x i16> @llvm.masked.gather.nxv2i16.nxv2p0i16(<vscale x 2 x i16*> %ptrs, i32 2, <vscale x 2 x i1> %m, <vscale x 2 x i16> %passthru)
				%ev = zext <vscale x 2 x i16> %v to <vscale x 2 x i32>
				ret <vscale x 2 x i32> %ev
				}

				define <vscale x 2 x i64> @mgather_nxv2i16_sextload_nxv2i64(<vscale x 2 x i16*> %ptrs, <vscale x 2 x i1> %m, <vscale x 2 x i16> %passthru) {
				; RV32-LABEL: mgather_nxv2i16_sextload_nxv2i64:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e16,mf2,tu,mu
				; RV32-NEXT: vloxei32.v v9, (zero), v8, v0.t
				; RV32-NEXT: vsetvli a0, zero, e64,m2,ta,mu
				; RV32-NEXT: vsext.vf4 v26, v9
				; RV32-NEXT: vmv2r.v v8, v26
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_nxv2i16_sextload_nxv2i64:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e16,mf2,tu,mu
				; RV64-NEXT: vloxei64.v v10, (zero), v8, v0.t
				; RV64-NEXT: vsetvli a0, zero, e64,m2,ta,mu
				; RV64-NEXT: vsext.vf4 v8, v10
				; RV64-NEXT: ret
				%v = call <vscale x 2 x i16> @llvm.masked.gather.nxv2i16.nxv2p0i16(<vscale x 2 x i16*> %ptrs, i32 2, <vscale x 2 x i1> %m, <vscale x 2 x i16> %passthru)
				%ev = sext <vscale x 2 x i16> %v to <vscale x 2 x i64>
				ret <vscale x 2 x i64> %ev
				}

				define <vscale x 2 x i64> @mgather_nxv2i16_zextload_nxv2i64(<vscale x 2 x i16*> %ptrs, <vscale x 2 x i1> %m, <vscale x 2 x i16> %passthru) {
				; RV32-LABEL: mgather_nxv2i16_zextload_nxv2i64:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e16,mf2,tu,mu
				; RV32-NEXT: vloxei32.v v9, (zero), v8, v0.t
				; RV32-NEXT: vsetvli a0, zero, e64,m2,ta,mu
				; RV32-NEXT: vzext.vf4 v26, v9
				; RV32-NEXT: vmv2r.v v8, v26
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_nxv2i16_zextload_nxv2i64:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e16,mf2,tu,mu
				; RV64-NEXT: vloxei64.v v10, (zero), v8, v0.t
				; RV64-NEXT: vsetvli a0, zero, e64,m2,ta,mu
				; RV64-NEXT: vzext.vf4 v8, v10
				; RV64-NEXT: ret
				%v = call <vscale x 2 x i16> @llvm.masked.gather.nxv2i16.nxv2p0i16(<vscale x 2 x i16*> %ptrs, i32 2, <vscale x 2 x i1> %m, <vscale x 2 x i16> %passthru)
				%ev = zext <vscale x 2 x i16> %v to <vscale x 2 x i64>
				ret <vscale x 2 x i64> %ev
				}

				declare <vscale x 4 x i16> @llvm.masked.gather.nxv4i16.nxv4p0i16(<vscale x 4 x i16*>, i32, <vscale x 4 x i1>, <vscale x 4 x i16>)

				define <vscale x 4 x i16> @mgather_nxv4i16(<vscale x 4 x i16*> %ptrs, <vscale x 4 x i1> %m, <vscale x 4 x i16> %passthru) {
				; RV32-LABEL: mgather_nxv4i16:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e16,m1,tu,mu
				; RV32-NEXT: vloxei32.v v10, (zero), v8, v0.t
				; RV32-NEXT: vmv1r.v v8, v10
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_nxv4i16:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e16,m1,tu,mu
				; RV64-NEXT: vloxei64.v v12, (zero), v8, v0.t
				; RV64-NEXT: vmv1r.v v8, v12
				; RV64-NEXT: ret
				%v = call <vscale x 4 x i16> @llvm.masked.gather.nxv4i16.nxv4p0i16(<vscale x 4 x i16*> %ptrs, i32 2, <vscale x 4 x i1> %m, <vscale x 4 x i16> %passthru)
				ret <vscale x 4 x i16> %v
				}

				define <vscale x 4 x i16> @mgather_truemask_nxv4i16(<vscale x 4 x i16*> %ptrs, <vscale x 4 x i16> %passthru) {
				; RV32-LABEL: mgather_truemask_nxv4i16:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e16,m1,ta,mu
				; RV32-NEXT: vloxei32.v v8, (zero), v8
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_truemask_nxv4i16:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e16,m1,ta,mu
				; RV64-NEXT: vloxei64.v v8, (zero), v8
				; RV64-NEXT: ret
				%mhead = insertelement <vscale x 4 x i1> undef, i1 1, i32 0
				%mtrue = shufflevector <vscale x 4 x i1> %mhead, <vscale x 4 x i1> undef, <vscale x 4 x i32> zeroinitializer
				%v = call <vscale x 4 x i16> @llvm.masked.gather.nxv4i16.nxv4p0i16(<vscale x 4 x i16*> %ptrs, i32 2, <vscale x 4 x i1> %mtrue, <vscale x 4 x i16> %passthru)
				ret <vscale x 4 x i16> %v
				}

				declare <vscale x 8 x i16> @llvm.masked.gather.nxv8i16.nxv8p0i16(<vscale x 8 x i16*>, i32, <vscale x 8 x i1>, <vscale x 8 x i16>)

				define <vscale x 8 x i16> @mgather_nxv8i16(<vscale x 8 x i16*> %ptrs, <vscale x 8 x i1> %m, <vscale x 8 x i16> %passthru) {
				; RV32-LABEL: mgather_nxv8i16:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e16,m2,tu,mu
				; RV32-NEXT: vloxei32.v v12, (zero), v8, v0.t
				; RV32-NEXT: vmv2r.v v8, v12
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_nxv8i16:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e16,m2,tu,mu
				; RV64-NEXT: vloxei64.v v16, (zero), v8, v0.t
				; RV64-NEXT: vmv2r.v v8, v16
				; RV64-NEXT: ret
				%v = call <vscale x 8 x i16> @llvm.masked.gather.nxv8i16.nxv8p0i16(<vscale x 8 x i16*> %ptrs, i32 2, <vscale x 8 x i1> %m, <vscale x 8 x i16> %passthru)
				ret <vscale x 8 x i16> %v
				}

				define <vscale x 8 x i16> @mgather_baseidx_nxv8i8_nxv8i16(i16* %base, <vscale x 8 x i8> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x i16> %passthru) {
				; RV32-LABEL: mgather_baseidx_nxv8i8_nxv8i16:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e32,m4,ta,mu
				; RV32-NEXT: vsext.vf4 v28, v8
				; RV32-NEXT: vsll.vi v28, v28, 1
				; RV32-NEXT: vsetvli a1, zero, e16,m2,tu,mu
				; RV32-NEXT: vloxei32.v v10, (a0), v28, v0.t
				; RV32-NEXT: vmv2r.v v8, v10
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_nxv8i8_nxv8i16:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vsext.vf8 v16, v8
				; RV64-NEXT: vsll.vi v16, v16, 1
				; RV64-NEXT: vsetvli a1, zero, e16,m2,tu,mu
				; RV64-NEXT: vloxei64.v v10, (a0), v16, v0.t
				; RV64-NEXT: vmv2r.v v8, v10
				; RV64-NEXT: ret
				%ptrs = getelementptr inbounds i16, i16* %base, <vscale x 8 x i8> %idxs
				%v = call <vscale x 8 x i16> @llvm.masked.gather.nxv8i16.nxv8p0i16(<vscale x 8 x i16*> %ptrs, i32 2, <vscale x 8 x i1> %m, <vscale x 8 x i16> %passthru)
				ret <vscale x 8 x i16> %v
				}

				define <vscale x 8 x i16> @mgather_baseidx_sext_nxv8i8_nxv8i16(i16* %base, <vscale x 8 x i8> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x i16> %passthru) {
				; RV32-LABEL: mgather_baseidx_sext_nxv8i8_nxv8i16:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e32,m4,ta,mu
				; RV32-NEXT: vsext.vf4 v28, v8
				; RV32-NEXT: vsll.vi v28, v28, 1
				; RV32-NEXT: vsetvli a1, zero, e16,m2,tu,mu
				; RV32-NEXT: vloxei32.v v10, (a0), v28, v0.t
				; RV32-NEXT: vmv2r.v v8, v10
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_sext_nxv8i8_nxv8i16:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vsext.vf8 v16, v8
				; RV64-NEXT: vsll.vi v16, v16, 1
				; RV64-NEXT: vsetvli a1, zero, e16,m2,tu,mu
				; RV64-NEXT: vloxei64.v v10, (a0), v16, v0.t
				; RV64-NEXT: vmv2r.v v8, v10
				; RV64-NEXT: ret
				%eidxs = sext <vscale x 8 x i8> %idxs to <vscale x 8 x i16>
				%ptrs = getelementptr inbounds i16, i16* %base, <vscale x 8 x i16> %eidxs
				%v = call <vscale x 8 x i16> @llvm.masked.gather.nxv8i16.nxv8p0i16(<vscale x 8 x i16*> %ptrs, i32 2, <vscale x 8 x i1> %m, <vscale x 8 x i16> %passthru)
				ret <vscale x 8 x i16> %v
				}

				define <vscale x 8 x i16> @mgather_baseidx_zext_nxv8i8_nxv8i16(i16* %base, <vscale x 8 x i8> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x i16> %passthru) {
				; RV32-LABEL: mgather_baseidx_zext_nxv8i8_nxv8i16:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e32,m4,ta,mu
				; RV32-NEXT: vzext.vf4 v28, v8
				; RV32-NEXT: vsll.vi v28, v28, 1
				; RV32-NEXT: vsetvli a1, zero, e16,m2,tu,mu
				; RV32-NEXT: vloxei32.v v10, (a0), v28, v0.t
				; RV32-NEXT: vmv2r.v v8, v10
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_zext_nxv8i8_nxv8i16:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vzext.vf8 v16, v8
				; RV64-NEXT: vsll.vi v16, v16, 1
				; RV64-NEXT: vsetvli a1, zero, e16,m2,tu,mu
				; RV64-NEXT: vloxei64.v v10, (a0), v16, v0.t
				; RV64-NEXT: vmv2r.v v8, v10
				; RV64-NEXT: ret
				%eidxs = zext <vscale x 8 x i8> %idxs to <vscale x 8 x i16>
				%ptrs = getelementptr inbounds i16, i16* %base, <vscale x 8 x i16> %eidxs
				%v = call <vscale x 8 x i16> @llvm.masked.gather.nxv8i16.nxv8p0i16(<vscale x 8 x i16*> %ptrs, i32 2, <vscale x 8 x i1> %m, <vscale x 8 x i16> %passthru)
				ret <vscale x 8 x i16> %v
				}

				define <vscale x 8 x i16> @mgather_baseidx_nxv8i16(i16* %base, <vscale x 8 x i16> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x i16> %passthru) {
				; RV32-LABEL: mgather_baseidx_nxv8i16:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e32,m4,ta,mu
				; RV32-NEXT: vsext.vf2 v28, v8
				; RV32-NEXT: vsll.vi v28, v28, 1
				; RV32-NEXT: vsetvli a1, zero, e16,m2,tu,mu
				; RV32-NEXT: vloxei32.v v10, (a0), v28, v0.t
				; RV32-NEXT: vmv2r.v v8, v10
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_nxv8i16:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vsext.vf4 v16, v8
				; RV64-NEXT: vsll.vi v16, v16, 1
				; RV64-NEXT: vsetvli a1, zero, e16,m2,tu,mu
				; RV64-NEXT: vloxei64.v v10, (a0), v16, v0.t
				; RV64-NEXT: vmv2r.v v8, v10
				; RV64-NEXT: ret
				%ptrs = getelementptr inbounds i16, i16* %base, <vscale x 8 x i16> %idxs
				%v = call <vscale x 8 x i16> @llvm.masked.gather.nxv8i16.nxv8p0i16(<vscale x 8 x i16*> %ptrs, i32 2, <vscale x 8 x i1> %m, <vscale x 8 x i16> %passthru)
				ret <vscale x 8 x i16> %v
				}

				declare <vscale x 1 x i32> @llvm.masked.gather.nxv1i32.nxv1p0i32(<vscale x 1 x i32*>, i32, <vscale x 1 x i1>, <vscale x 1 x i32>)

				define <vscale x 1 x i32> @mgather_nxv1i32(<vscale x 1 x i32*> %ptrs, <vscale x 1 x i1> %m, <vscale x 1 x i32> %passthru) {
				; RV32-LABEL: mgather_nxv1i32:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e32,mf2,tu,mu
				; RV32-NEXT: vloxei32.v v9, (zero), v8, v0.t
				; RV32-NEXT: vmv1r.v v8, v9
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_nxv1i32:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e32,mf2,tu,mu
				; RV64-NEXT: vloxei64.v v9, (zero), v8, v0.t
				; RV64-NEXT: vmv1r.v v8, v9
				; RV64-NEXT: ret
				%v = call <vscale x 1 x i32> @llvm.masked.gather.nxv1i32.nxv1p0i32(<vscale x 1 x i32*> %ptrs, i32 4, <vscale x 1 x i1> %m, <vscale x 1 x i32> %passthru)
				ret <vscale x 1 x i32> %v
				}

				declare <vscale x 2 x i32> @llvm.masked.gather.nxv2i32.nxv2p0i32(<vscale x 2 x i32*>, i32, <vscale x 2 x i1>, <vscale x 2 x i32>)

				define <vscale x 2 x i32> @mgather_nxv2i32(<vscale x 2 x i32*> %ptrs, <vscale x 2 x i1> %m, <vscale x 2 x i32> %passthru) {
				; RV32-LABEL: mgather_nxv2i32:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e32,m1,tu,mu
				; RV32-NEXT: vloxei32.v v9, (zero), v8, v0.t
				; RV32-NEXT: vmv1r.v v8, v9
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_nxv2i32:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e32,m1,tu,mu
				; RV64-NEXT: vloxei64.v v10, (zero), v8, v0.t
				; RV64-NEXT: vmv1r.v v8, v10
				; RV64-NEXT: ret
				%v = call <vscale x 2 x i32> @llvm.masked.gather.nxv2i32.nxv2p0i32(<vscale x 2 x i32*> %ptrs, i32 4, <vscale x 2 x i1> %m, <vscale x 2 x i32> %passthru)
				ret <vscale x 2 x i32> %v
				}

				define <vscale x 2 x i64> @mgather_nxv2i32_sextload_nxv2i64(<vscale x 2 x i32*> %ptrs, <vscale x 2 x i1> %m, <vscale x 2 x i32> %passthru) {
				; RV32-LABEL: mgather_nxv2i32_sextload_nxv2i64:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e32,m1,tu,mu
				; RV32-NEXT: vloxei32.v v9, (zero), v8, v0.t
				; RV32-NEXT: vsetvli a0, zero, e64,m2,ta,mu
				; RV32-NEXT: vsext.vf2 v26, v9
				; RV32-NEXT: vmv2r.v v8, v26
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_nxv2i32_sextload_nxv2i64:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e32,m1,tu,mu
				; RV64-NEXT: vloxei64.v v10, (zero), v8, v0.t
				; RV64-NEXT: vsetvli a0, zero, e64,m2,ta,mu
				; RV64-NEXT: vsext.vf2 v8, v10
				; RV64-NEXT: ret
				%v = call <vscale x 2 x i32> @llvm.masked.gather.nxv2i32.nxv2p0i32(<vscale x 2 x i32*> %ptrs, i32 4, <vscale x 2 x i1> %m, <vscale x 2 x i32> %passthru)
				%ev = sext <vscale x 2 x i32> %v to <vscale x 2 x i64>
				ret <vscale x 2 x i64> %ev
				}

				define <vscale x 2 x i64> @mgather_nxv2i32_zextload_nxv2i64(<vscale x 2 x i32*> %ptrs, <vscale x 2 x i1> %m, <vscale x 2 x i32> %passthru) {
				; RV32-LABEL: mgather_nxv2i32_zextload_nxv2i64:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e32,m1,tu,mu
				; RV32-NEXT: vloxei32.v v9, (zero), v8, v0.t
				; RV32-NEXT: vsetvli a0, zero, e64,m2,ta,mu
				; RV32-NEXT: vzext.vf2 v26, v9
				; RV32-NEXT: vmv2r.v v8, v26
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_nxv2i32_zextload_nxv2i64:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e32,m1,tu,mu
				; RV64-NEXT: vloxei64.v v10, (zero), v8, v0.t
				; RV64-NEXT: vsetvli a0, zero, e64,m2,ta,mu
				; RV64-NEXT: vzext.vf2 v8, v10
				; RV64-NEXT: ret
				%v = call <vscale x 2 x i32> @llvm.masked.gather.nxv2i32.nxv2p0i32(<vscale x 2 x i32*> %ptrs, i32 4, <vscale x 2 x i1> %m, <vscale x 2 x i32> %passthru)
				%ev = zext <vscale x 2 x i32> %v to <vscale x 2 x i64>
				ret <vscale x 2 x i64> %ev
				}

				declare <vscale x 4 x i32> @llvm.masked.gather.nxv4i32.nxv4p0i32(<vscale x 4 x i32*>, i32, <vscale x 4 x i1>, <vscale x 4 x i32>)

				define <vscale x 4 x i32> @mgather_nxv4i32(<vscale x 4 x i32*> %ptrs, <vscale x 4 x i1> %m, <vscale x 4 x i32> %passthru) {
				; RV32-LABEL: mgather_nxv4i32:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e32,m2,tu,mu
				; RV32-NEXT: vloxei32.v v10, (zero), v8, v0.t
				; RV32-NEXT: vmv2r.v v8, v10
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_nxv4i32:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e32,m2,tu,mu
				; RV64-NEXT: vloxei64.v v12, (zero), v8, v0.t
				; RV64-NEXT: vmv2r.v v8, v12
				; RV64-NEXT: ret
				%v = call <vscale x 4 x i32> @llvm.masked.gather.nxv4i32.nxv4p0i32(<vscale x 4 x i32*> %ptrs, i32 4, <vscale x 4 x i1> %m, <vscale x 4 x i32> %passthru)
				ret <vscale x 4 x i32> %v
				}

				define <vscale x 4 x i32> @mgather_truemask_nxv4i32(<vscale x 4 x i32*> %ptrs, <vscale x 4 x i32> %passthru) {
				; RV32-LABEL: mgather_truemask_nxv4i32:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e32,m2,ta,mu
				; RV32-NEXT: vloxei32.v v8, (zero), v8
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_truemask_nxv4i32:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e32,m2,ta,mu
				; RV64-NEXT: vloxei64.v v8, (zero), v8
				; RV64-NEXT: ret
				%mhead = insertelement <vscale x 4 x i1> undef, i1 1, i32 0
				%mtrue = shufflevector <vscale x 4 x i1> %mhead, <vscale x 4 x i1> undef, <vscale x 4 x i32> zeroinitializer
				%v = call <vscale x 4 x i32> @llvm.masked.gather.nxv4i32.nxv4p0i32(<vscale x 4 x i32*> %ptrs, i32 4, <vscale x 4 x i1> %mtrue, <vscale x 4 x i32> %passthru)
				ret <vscale x 4 x i32> %v
				}

				declare <vscale x 8 x i32> @llvm.masked.gather.nxv8i32.nxv8p0i32(<vscale x 8 x i32*>, i32, <vscale x 8 x i1>, <vscale x 8 x i32>)

				define <vscale x 8 x i32> @mgather_nxv8i32(<vscale x 8 x i32*> %ptrs, <vscale x 8 x i1> %m, <vscale x 8 x i32> %passthru) {
				; RV32-LABEL: mgather_nxv8i32:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e32,m4,tu,mu
				; RV32-NEXT: vloxei32.v v12, (zero), v8, v0.t
				; RV32-NEXT: vmv4r.v v8, v12
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_nxv8i32:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e32,m4,tu,mu
				; RV64-NEXT: vloxei64.v v16, (zero), v8, v0.t
				; RV64-NEXT: vmv4r.v v8, v16
				; RV64-NEXT: ret
				%v = call <vscale x 8 x i32> @llvm.masked.gather.nxv8i32.nxv8p0i32(<vscale x 8 x i32*> %ptrs, i32 4, <vscale x 8 x i1> %m, <vscale x 8 x i32> %passthru)
				ret <vscale x 8 x i32> %v
				}

				define <vscale x 8 x i32> @mgather_baseidx_nxv8i8_nxv8i32(i32* %base, <vscale x 8 x i8> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x i32> %passthru) {
				; RV32-LABEL: mgather_baseidx_nxv8i8_nxv8i32:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e32,m4,ta,mu
				; RV32-NEXT: vsext.vf4 v28, v8
				; RV32-NEXT: vsll.vi v28, v28, 2
				; RV32-NEXT: vsetvli a1, zero, e32,m4,tu,mu
				; RV32-NEXT: vloxei32.v v12, (a0), v28, v0.t
				; RV32-NEXT: vmv4r.v v8, v12
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_nxv8i8_nxv8i32:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vsext.vf8 v16, v8
				; RV64-NEXT: vsll.vi v16, v16, 2
				; RV64-NEXT: vsetvli a1, zero, e32,m4,tu,mu
				; RV64-NEXT: vloxei64.v v12, (a0), v16, v0.t
				; RV64-NEXT: vmv4r.v v8, v12
				; RV64-NEXT: ret
				%ptrs = getelementptr inbounds i32, i32* %base, <vscale x 8 x i8> %idxs
				%v = call <vscale x 8 x i32> @llvm.masked.gather.nxv8i32.nxv8p0i32(<vscale x 8 x i32*> %ptrs, i32 4, <vscale x 8 x i1> %m, <vscale x 8 x i32> %passthru)
				ret <vscale x 8 x i32> %v
				}

				define <vscale x 8 x i32> @mgather_baseidx_sext_nxv8i8_nxv8i32(i32* %base, <vscale x 8 x i8> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x i32> %passthru) {
				; RV32-LABEL: mgather_baseidx_sext_nxv8i8_nxv8i32:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e32,m4,ta,mu
				; RV32-NEXT: vsext.vf4 v28, v8
				; RV32-NEXT: vsll.vi v28, v28, 2
				; RV32-NEXT: vsetvli a1, zero, e32,m4,tu,mu
				; RV32-NEXT: vloxei32.v v12, (a0), v28, v0.t
				; RV32-NEXT: vmv4r.v v8, v12
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_sext_nxv8i8_nxv8i32:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vsext.vf8 v16, v8
				; RV64-NEXT: vsll.vi v16, v16, 2
				; RV64-NEXT: vsetvli a1, zero, e32,m4,tu,mu
				; RV64-NEXT: vloxei64.v v12, (a0), v16, v0.t
				; RV64-NEXT: vmv4r.v v8, v12
				; RV64-NEXT: ret
				%eidxs = sext <vscale x 8 x i8> %idxs to <vscale x 8 x i32>
				%ptrs = getelementptr inbounds i32, i32* %base, <vscale x 8 x i32> %eidxs
				%v = call <vscale x 8 x i32> @llvm.masked.gather.nxv8i32.nxv8p0i32(<vscale x 8 x i32*> %ptrs, i32 4, <vscale x 8 x i1> %m, <vscale x 8 x i32> %passthru)
				ret <vscale x 8 x i32> %v
				}

				define <vscale x 8 x i32> @mgather_baseidx_zext_nxv8i8_nxv8i32(i32* %base, <vscale x 8 x i8> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x i32> %passthru) {
				; RV32-LABEL: mgather_baseidx_zext_nxv8i8_nxv8i32:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e32,m4,ta,mu
				; RV32-NEXT: vzext.vf4 v28, v8
				; RV32-NEXT: vsll.vi v28, v28, 2
				; RV32-NEXT: vsetvli a1, zero, e32,m4,tu,mu
				; RV32-NEXT: vloxei32.v v12, (a0), v28, v0.t
				; RV32-NEXT: vmv4r.v v8, v12
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_zext_nxv8i8_nxv8i32:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vzext.vf8 v16, v8
				; RV64-NEXT: vsll.vi v16, v16, 2
				; RV64-NEXT: vsetvli a1, zero, e32,m4,tu,mu
				; RV64-NEXT: vloxei64.v v12, (a0), v16, v0.t
				; RV64-NEXT: vmv4r.v v8, v12
				; RV64-NEXT: ret
				%eidxs = zext <vscale x 8 x i8> %idxs to <vscale x 8 x i32>
				%ptrs = getelementptr inbounds i32, i32* %base, <vscale x 8 x i32> %eidxs
				%v = call <vscale x 8 x i32> @llvm.masked.gather.nxv8i32.nxv8p0i32(<vscale x 8 x i32*> %ptrs, i32 4, <vscale x 8 x i1> %m, <vscale x 8 x i32> %passthru)
				ret <vscale x 8 x i32> %v
				}

				define <vscale x 8 x i32> @mgather_baseidx_nxv8i16_nxv8i32(i32* %base, <vscale x 8 x i16> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x i32> %passthru) {
				; RV32-LABEL: mgather_baseidx_nxv8i16_nxv8i32:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e32,m4,ta,mu
				; RV32-NEXT: vsext.vf2 v28, v8
				; RV32-NEXT: vsll.vi v28, v28, 2
				; RV32-NEXT: vsetvli a1, zero, e32,m4,tu,mu
				; RV32-NEXT: vloxei32.v v12, (a0), v28, v0.t
				; RV32-NEXT: vmv4r.v v8, v12
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_nxv8i16_nxv8i32:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vsext.vf4 v16, v8
				; RV64-NEXT: vsll.vi v16, v16, 2
				; RV64-NEXT: vsetvli a1, zero, e32,m4,tu,mu
				; RV64-NEXT: vloxei64.v v12, (a0), v16, v0.t
				; RV64-NEXT: vmv4r.v v8, v12
				; RV64-NEXT: ret
				%ptrs = getelementptr inbounds i32, i32* %base, <vscale x 8 x i16> %idxs
				%v = call <vscale x 8 x i32> @llvm.masked.gather.nxv8i32.nxv8p0i32(<vscale x 8 x i32*> %ptrs, i32 4, <vscale x 8 x i1> %m, <vscale x 8 x i32> %passthru)
				ret <vscale x 8 x i32> %v
				}

				define <vscale x 8 x i32> @mgather_baseidx_sext_nxv8i16_nxv8i32(i32* %base, <vscale x 8 x i16> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x i32> %passthru) {
				; RV32-LABEL: mgather_baseidx_sext_nxv8i16_nxv8i32:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e32,m4,ta,mu
				; RV32-NEXT: vsext.vf2 v28, v8
				; RV32-NEXT: vsll.vi v28, v28, 2
				; RV32-NEXT: vsetvli a1, zero, e32,m4,tu,mu
				; RV32-NEXT: vloxei32.v v12, (a0), v28, v0.t
				; RV32-NEXT: vmv4r.v v8, v12
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_sext_nxv8i16_nxv8i32:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vsext.vf4 v16, v8
				; RV64-NEXT: vsll.vi v16, v16, 2
				; RV64-NEXT: vsetvli a1, zero, e32,m4,tu,mu
				; RV64-NEXT: vloxei64.v v12, (a0), v16, v0.t
				; RV64-NEXT: vmv4r.v v8, v12
				; RV64-NEXT: ret
				%eidxs = sext <vscale x 8 x i16> %idxs to <vscale x 8 x i32>
				%ptrs = getelementptr inbounds i32, i32* %base, <vscale x 8 x i32> %eidxs
				%v = call <vscale x 8 x i32> @llvm.masked.gather.nxv8i32.nxv8p0i32(<vscale x 8 x i32*> %ptrs, i32 4, <vscale x 8 x i1> %m, <vscale x 8 x i32> %passthru)
				ret <vscale x 8 x i32> %v
				}

				define <vscale x 8 x i32> @mgather_baseidx_zext_nxv8i16_nxv8i32(i32* %base, <vscale x 8 x i16> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x i32> %passthru) {
				; RV32-LABEL: mgather_baseidx_zext_nxv8i16_nxv8i32:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e32,m4,ta,mu
				; RV32-NEXT: vzext.vf2 v28, v8
				; RV32-NEXT: vsll.vi v28, v28, 2
				; RV32-NEXT: vsetvli a1, zero, e32,m4,tu,mu
				; RV32-NEXT: vloxei32.v v12, (a0), v28, v0.t
				; RV32-NEXT: vmv4r.v v8, v12
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_zext_nxv8i16_nxv8i32:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vzext.vf4 v16, v8
				; RV64-NEXT: vsll.vi v16, v16, 2
				; RV64-NEXT: vsetvli a1, zero, e32,m4,tu,mu
				; RV64-NEXT: vloxei64.v v12, (a0), v16, v0.t
				; RV64-NEXT: vmv4r.v v8, v12
				; RV64-NEXT: ret
				%eidxs = zext <vscale x 8 x i16> %idxs to <vscale x 8 x i32>
				%ptrs = getelementptr inbounds i32, i32* %base, <vscale x 8 x i32> %eidxs
				%v = call <vscale x 8 x i32> @llvm.masked.gather.nxv8i32.nxv8p0i32(<vscale x 8 x i32*> %ptrs, i32 4, <vscale x 8 x i1> %m, <vscale x 8 x i32> %passthru)
				ret <vscale x 8 x i32> %v
				}

				define <vscale x 8 x i32> @mgather_baseidx_nxv8i32(i32* %base, <vscale x 8 x i32> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x i32> %passthru) {
				; RV32-LABEL: mgather_baseidx_nxv8i32:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e32,m4,ta,mu
				; RV32-NEXT: vsll.vi v28, v8, 2
				; RV32-NEXT: vsetvli a1, zero, e32,m4,tu,mu
				; RV32-NEXT: vloxei32.v v12, (a0), v28, v0.t
				; RV32-NEXT: vmv4r.v v8, v12
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_nxv8i32:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vsext.vf2 v16, v8
				; RV64-NEXT: vsll.vi v16, v16, 2
				; RV64-NEXT: vsetvli a1, zero, e32,m4,tu,mu
				; RV64-NEXT: vloxei64.v v12, (a0), v16, v0.t
				; RV64-NEXT: vmv4r.v v8, v12
				; RV64-NEXT: ret
				%ptrs = getelementptr inbounds i32, i32* %base, <vscale x 8 x i32> %idxs
				%v = call <vscale x 8 x i32> @llvm.masked.gather.nxv8i32.nxv8p0i32(<vscale x 8 x i32*> %ptrs, i32 4, <vscale x 8 x i1> %m, <vscale x 8 x i32> %passthru)
				ret <vscale x 8 x i32> %v
				}

				declare <vscale x 1 x i64> @llvm.masked.gather.nxv1i64.nxv1p0i64(<vscale x 1 x i64*>, i32, <vscale x 1 x i1>, <vscale x 1 x i64>)

				define <vscale x 1 x i64> @mgather_nxv1i64(<vscale x 1 x i64*> %ptrs, <vscale x 1 x i1> %m, <vscale x 1 x i64> %passthru) {
				; RV32-LABEL: mgather_nxv1i64:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e64,m1,tu,mu
				; RV32-NEXT: vloxei32.v v9, (zero), v8, v0.t
				; RV32-NEXT: vmv1r.v v8, v9
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_nxv1i64:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e64,m1,tu,mu
				; RV64-NEXT: vloxei64.v v9, (zero), v8, v0.t
				; RV64-NEXT: vmv1r.v v8, v9
				; RV64-NEXT: ret
				%v = call <vscale x 1 x i64> @llvm.masked.gather.nxv1i64.nxv1p0i64(<vscale x 1 x i64*> %ptrs, i32 8, <vscale x 1 x i1> %m, <vscale x 1 x i64> %passthru)
				ret <vscale x 1 x i64> %v
				}

				declare <vscale x 2 x i64> @llvm.masked.gather.nxv2i64.nxv2p0i64(<vscale x 2 x i64*>, i32, <vscale x 2 x i1>, <vscale x 2 x i64>)

				define <vscale x 2 x i64> @mgather_nxv2i64(<vscale x 2 x i64*> %ptrs, <vscale x 2 x i1> %m, <vscale x 2 x i64> %passthru) {
				; RV32-LABEL: mgather_nxv2i64:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e64,m2,tu,mu
				; RV32-NEXT: vloxei32.v v10, (zero), v8, v0.t
				; RV32-NEXT: vmv2r.v v8, v10
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_nxv2i64:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e64,m2,tu,mu
				; RV64-NEXT: vloxei64.v v10, (zero), v8, v0.t
				; RV64-NEXT: vmv2r.v v8, v10
				; RV64-NEXT: ret
				%v = call <vscale x 2 x i64> @llvm.masked.gather.nxv2i64.nxv2p0i64(<vscale x 2 x i64*> %ptrs, i32 8, <vscale x 2 x i1> %m, <vscale x 2 x i64> %passthru)
				ret <vscale x 2 x i64> %v
				}

				declare <vscale x 4 x i64> @llvm.masked.gather.nxv4i64.nxv4p0i64(<vscale x 4 x i64*>, i32, <vscale x 4 x i1>, <vscale x 4 x i64>)

				define <vscale x 4 x i64> @mgather_nxv4i64(<vscale x 4 x i64*> %ptrs, <vscale x 4 x i1> %m, <vscale x 4 x i64> %passthru) {
				; RV32-LABEL: mgather_nxv4i64:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e64,m4,tu,mu
				; RV32-NEXT: vloxei32.v v12, (zero), v8, v0.t
				; RV32-NEXT: vmv4r.v v8, v12
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_nxv4i64:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e64,m4,tu,mu
				; RV64-NEXT: vloxei64.v v12, (zero), v8, v0.t
				; RV64-NEXT: vmv4r.v v8, v12
				; RV64-NEXT: ret
				%v = call <vscale x 4 x i64> @llvm.masked.gather.nxv4i64.nxv4p0i64(<vscale x 4 x i64*> %ptrs, i32 8, <vscale x 4 x i1> %m, <vscale x 4 x i64> %passthru)
				ret <vscale x 4 x i64> %v
				}

				define <vscale x 4 x i64> @mgather_truemask_nxv4i64(<vscale x 4 x i64*> %ptrs, <vscale x 4 x i64> %passthru) {
				; RV32-LABEL: mgather_truemask_nxv4i64:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e64,m4,ta,mu
				; RV32-NEXT: vloxei32.v v8, (zero), v8
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_truemask_nxv4i64:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e64,m4,ta,mu
				; RV64-NEXT: vloxei64.v v8, (zero), v8
				; RV64-NEXT: ret
				%mhead = insertelement <vscale x 4 x i1> undef, i1 1, i32 0
				%mtrue = shufflevector <vscale x 4 x i1> %mhead, <vscale x 4 x i1> undef, <vscale x 4 x i32> zeroinitializer
				%v = call <vscale x 4 x i64> @llvm.masked.gather.nxv4i64.nxv4p0i64(<vscale x 4 x i64*> %ptrs, i32 8, <vscale x 4 x i1> %mtrue, <vscale x 4 x i64> %passthru)
				ret <vscale x 4 x i64> %v
				}

				declare <vscale x 8 x i64> @llvm.masked.gather.nxv8i64.nxv8p0i64(<vscale x 8 x i64*>, i32, <vscale x 8 x i1>, <vscale x 8 x i64>)

				define <vscale x 8 x i64> @mgather_nxv8i64(<vscale x 8 x i64*> %ptrs, <vscale x 8 x i1> %m, <vscale x 8 x i64> %passthru) {
				; RV32-LABEL: mgather_nxv8i64:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e64,m8,tu,mu
				; RV32-NEXT: vloxei32.v v16, (zero), v8, v0.t
				; RV32-NEXT: vmv8r.v v8, v16
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_nxv8i64:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e64,m8,tu,mu
				; RV64-NEXT: vloxei64.v v16, (zero), v8, v0.t
				; RV64-NEXT: vmv8r.v v8, v16
				; RV64-NEXT: ret
				%v = call <vscale x 8 x i64> @llvm.masked.gather.nxv8i64.nxv8p0i64(<vscale x 8 x i64*> %ptrs, i32 8, <vscale x 8 x i1> %m, <vscale x 8 x i64> %passthru)
				ret <vscale x 8 x i64> %v
				}

				define <vscale x 8 x i64> @mgather_baseidx_nxv8i8_nxv8i64(i64* %base, <vscale x 8 x i8> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x i64> %passthru) {
				; RV32-LABEL: mgather_baseidx_nxv8i8_nxv8i64:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e32,m4,ta,mu
				; RV32-NEXT: vsext.vf4 v28, v8
				; RV32-NEXT: vsll.vi v28, v28, 3
				; RV32-NEXT: vsetvli a1, zero, e64,m8,tu,mu
				; RV32-NEXT: vloxei32.v v16, (a0), v28, v0.t
				; RV32-NEXT: vmv8r.v v8, v16
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_nxv8i8_nxv8i64:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vsext.vf8 v24, v8
				; RV64-NEXT: vsll.vi v8, v24, 3
				; RV64-NEXT: vsetvli a1, zero, e64,m8,tu,mu
				; RV64-NEXT: vloxei64.v v16, (a0), v8, v0.t
				; RV64-NEXT: vmv8r.v v8, v16
				; RV64-NEXT: ret
				%ptrs = getelementptr inbounds i64, i64* %base, <vscale x 8 x i8> %idxs
				%v = call <vscale x 8 x i64> @llvm.masked.gather.nxv8i64.nxv8p0i64(<vscale x 8 x i64*> %ptrs, i32 8, <vscale x 8 x i1> %m, <vscale x 8 x i64> %passthru)
				ret <vscale x 8 x i64> %v
				}

				define <vscale x 8 x i64> @mgather_baseidx_sext_nxv8i8_nxv8i64(i64* %base, <vscale x 8 x i8> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x i64> %passthru) {
				; RV32-LABEL: mgather_baseidx_sext_nxv8i8_nxv8i64:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e32,m4,ta,mu
				; RV32-NEXT: vsext.vf4 v28, v8
				; RV32-NEXT: vsll.vi v28, v28, 3
				; RV32-NEXT: vsetvli a1, zero, e64,m8,tu,mu
				; RV32-NEXT: vloxei32.v v16, (a0), v28, v0.t
				; RV32-NEXT: vmv8r.v v8, v16
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_sext_nxv8i8_nxv8i64:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vsext.vf8 v24, v8
				; RV64-NEXT: vsll.vi v8, v24, 3
				; RV64-NEXT: vsetvli a1, zero, e64,m8,tu,mu
				; RV64-NEXT: vloxei64.v v16, (a0), v8, v0.t
				; RV64-NEXT: vmv8r.v v8, v16
				; RV64-NEXT: ret
				%eidxs = sext <vscale x 8 x i8> %idxs to <vscale x 8 x i64>
				%ptrs = getelementptr inbounds i64, i64* %base, <vscale x 8 x i64> %eidxs
				%v = call <vscale x 8 x i64> @llvm.masked.gather.nxv8i64.nxv8p0i64(<vscale x 8 x i64*> %ptrs, i32 8, <vscale x 8 x i1> %m, <vscale x 8 x i64> %passthru)
				ret <vscale x 8 x i64> %v
				}

				define <vscale x 8 x i64> @mgather_baseidx_zext_nxv8i8_nxv8i64(i64* %base, <vscale x 8 x i8> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x i64> %passthru) {
				; RV32-LABEL: mgather_baseidx_zext_nxv8i8_nxv8i64:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e32,m4,ta,mu
				; RV32-NEXT: vzext.vf4 v28, v8
				; RV32-NEXT: vsll.vi v28, v28, 3
				; RV32-NEXT: vsetvli a1, zero, e64,m8,tu,mu
				; RV32-NEXT: vloxei32.v v16, (a0), v28, v0.t
				; RV32-NEXT: vmv8r.v v8, v16
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_zext_nxv8i8_nxv8i64:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vzext.vf8 v24, v8
				; RV64-NEXT: vsll.vi v8, v24, 3
				; RV64-NEXT: vsetvli a1, zero, e64,m8,tu,mu
				; RV64-NEXT: vloxei64.v v16, (a0), v8, v0.t
				; RV64-NEXT: vmv8r.v v8, v16
				; RV64-NEXT: ret
				%eidxs = zext <vscale x 8 x i8> %idxs to <vscale x 8 x i64>
				%ptrs = getelementptr inbounds i64, i64* %base, <vscale x 8 x i64> %eidxs
				%v = call <vscale x 8 x i64> @llvm.masked.gather.nxv8i64.nxv8p0i64(<vscale x 8 x i64*> %ptrs, i32 8, <vscale x 8 x i1> %m, <vscale x 8 x i64> %passthru)
				ret <vscale x 8 x i64> %v
				}

				define <vscale x 8 x i64> @mgather_baseidx_nxv8i16_nxv8i64(i64* %base, <vscale x 8 x i16> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x i64> %passthru) {
				; RV32-LABEL: mgather_baseidx_nxv8i16_nxv8i64:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e32,m4,ta,mu
				; RV32-NEXT: vsext.vf2 v28, v8
				; RV32-NEXT: vsll.vi v28, v28, 3
				; RV32-NEXT: vsetvli a1, zero, e64,m8,tu,mu
				; RV32-NEXT: vloxei32.v v16, (a0), v28, v0.t
				; RV32-NEXT: vmv8r.v v8, v16
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_nxv8i16_nxv8i64:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vsext.vf4 v24, v8
				; RV64-NEXT: vsll.vi v8, v24, 3
				; RV64-NEXT: vsetvli a1, zero, e64,m8,tu,mu
				; RV64-NEXT: vloxei64.v v16, (a0), v8, v0.t
				; RV64-NEXT: vmv8r.v v8, v16
				; RV64-NEXT: ret
				%ptrs = getelementptr inbounds i64, i64* %base, <vscale x 8 x i16> %idxs
				%v = call <vscale x 8 x i64> @llvm.masked.gather.nxv8i64.nxv8p0i64(<vscale x 8 x i64*> %ptrs, i32 8, <vscale x 8 x i1> %m, <vscale x 8 x i64> %passthru)
				ret <vscale x 8 x i64> %v
				}

				define <vscale x 8 x i64> @mgather_baseidx_sext_nxv8i16_nxv8i64(i64* %base, <vscale x 8 x i16> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x i64> %passthru) {
				; RV32-LABEL: mgather_baseidx_sext_nxv8i16_nxv8i64:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e32,m4,ta,mu
				; RV32-NEXT: vsext.vf2 v28, v8
				; RV32-NEXT: vsll.vi v28, v28, 3
				; RV32-NEXT: vsetvli a1, zero, e64,m8,tu,mu
				; RV32-NEXT: vloxei32.v v16, (a0), v28, v0.t
				; RV32-NEXT: vmv8r.v v8, v16
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_sext_nxv8i16_nxv8i64:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vsext.vf4 v24, v8
				; RV64-NEXT: vsll.vi v8, v24, 3
				; RV64-NEXT: vsetvli a1, zero, e64,m8,tu,mu
				; RV64-NEXT: vloxei64.v v16, (a0), v8, v0.t
				; RV64-NEXT: vmv8r.v v8, v16
				; RV64-NEXT: ret
				%eidxs = sext <vscale x 8 x i16> %idxs to <vscale x 8 x i64>
				%ptrs = getelementptr inbounds i64, i64* %base, <vscale x 8 x i64> %eidxs
				%v = call <vscale x 8 x i64> @llvm.masked.gather.nxv8i64.nxv8p0i64(<vscale x 8 x i64*> %ptrs, i32 8, <vscale x 8 x i1> %m, <vscale x 8 x i64> %passthru)
				ret <vscale x 8 x i64> %v
				}

				define <vscale x 8 x i64> @mgather_baseidx_zext_nxv8i16_nxv8i64(i64* %base, <vscale x 8 x i16> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x i64> %passthru) {
				; RV32-LABEL: mgather_baseidx_zext_nxv8i16_nxv8i64:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e32,m4,ta,mu
				; RV32-NEXT: vzext.vf2 v28, v8
				; RV32-NEXT: vsll.vi v28, v28, 3
				; RV32-NEXT: vsetvli a1, zero, e64,m8,tu,mu
				; RV32-NEXT: vloxei32.v v16, (a0), v28, v0.t
				; RV32-NEXT: vmv8r.v v8, v16
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_zext_nxv8i16_nxv8i64:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vzext.vf4 v24, v8
				; RV64-NEXT: vsll.vi v8, v24, 3
				; RV64-NEXT: vsetvli a1, zero, e64,m8,tu,mu
				; RV64-NEXT: vloxei64.v v16, (a0), v8, v0.t
				; RV64-NEXT: vmv8r.v v8, v16
				; RV64-NEXT: ret
				%eidxs = zext <vscale x 8 x i16> %idxs to <vscale x 8 x i64>
				%ptrs = getelementptr inbounds i64, i64* %base, <vscale x 8 x i64> %eidxs
				%v = call <vscale x 8 x i64> @llvm.masked.gather.nxv8i64.nxv8p0i64(<vscale x 8 x i64*> %ptrs, i32 8, <vscale x 8 x i1> %m, <vscale x 8 x i64> %passthru)
				ret <vscale x 8 x i64> %v
				}

				define <vscale x 8 x i64> @mgather_baseidx_nxv8i32_nxv8i64(i64* %base, <vscale x 8 x i32> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x i64> %passthru) {
				; RV32-LABEL: mgather_baseidx_nxv8i32_nxv8i64:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e32,m4,ta,mu
				; RV32-NEXT: vsll.vi v28, v8, 3
				; RV32-NEXT: vsetvli a1, zero, e64,m8,tu,mu
				; RV32-NEXT: vloxei32.v v16, (a0), v28, v0.t
				; RV32-NEXT: vmv8r.v v8, v16
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_nxv8i32_nxv8i64:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vsext.vf2 v24, v8
				; RV64-NEXT: vsll.vi v8, v24, 3
				; RV64-NEXT: vsetvli a1, zero, e64,m8,tu,mu
				; RV64-NEXT: vloxei64.v v16, (a0), v8, v0.t
				; RV64-NEXT: vmv8r.v v8, v16
				; RV64-NEXT: ret
				%ptrs = getelementptr inbounds i64, i64* %base, <vscale x 8 x i32> %idxs
				%v = call <vscale x 8 x i64> @llvm.masked.gather.nxv8i64.nxv8p0i64(<vscale x 8 x i64*> %ptrs, i32 8, <vscale x 8 x i1> %m, <vscale x 8 x i64> %passthru)
				ret <vscale x 8 x i64> %v
				}

				define <vscale x 8 x i64> @mgather_baseidx_sext_nxv8i32_nxv8i64(i64* %base, <vscale x 8 x i32> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x i64> %passthru) {
				; RV32-LABEL: mgather_baseidx_sext_nxv8i32_nxv8i64:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e32,m4,ta,mu
				; RV32-NEXT: vsll.vi v28, v8, 3
				; RV32-NEXT: vsetvli a1, zero, e64,m8,tu,mu
				; RV32-NEXT: vloxei32.v v16, (a0), v28, v0.t
				; RV32-NEXT: vmv8r.v v8, v16
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_sext_nxv8i32_nxv8i64:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vsext.vf2 v24, v8
				; RV64-NEXT: vsll.vi v8, v24, 3
				; RV64-NEXT: vsetvli a1, zero, e64,m8,tu,mu
				; RV64-NEXT: vloxei64.v v16, (a0), v8, v0.t
				; RV64-NEXT: vmv8r.v v8, v16
				; RV64-NEXT: ret
				%eidxs = sext <vscale x 8 x i32> %idxs to <vscale x 8 x i64>
				%ptrs = getelementptr inbounds i64, i64* %base, <vscale x 8 x i64> %eidxs
				%v = call <vscale x 8 x i64> @llvm.masked.gather.nxv8i64.nxv8p0i64(<vscale x 8 x i64*> %ptrs, i32 8, <vscale x 8 x i1> %m, <vscale x 8 x i64> %passthru)
				ret <vscale x 8 x i64> %v
				}

				define <vscale x 8 x i64> @mgather_baseidx_zext_nxv8i32_nxv8i64(i64* %base, <vscale x 8 x i32> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x i64> %passthru) {
				; RV32-LABEL: mgather_baseidx_zext_nxv8i32_nxv8i64:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e32,m4,ta,mu
				; RV32-NEXT: vsll.vi v28, v8, 3
				; RV32-NEXT: vsetvli a1, zero, e64,m8,tu,mu
				; RV32-NEXT: vloxei32.v v16, (a0), v28, v0.t
				; RV32-NEXT: vmv8r.v v8, v16
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_zext_nxv8i32_nxv8i64:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vzext.vf2 v24, v8
				; RV64-NEXT: vsll.vi v8, v24, 3
				; RV64-NEXT: vsetvli a1, zero, e64,m8,tu,mu
				; RV64-NEXT: vloxei64.v v16, (a0), v8, v0.t
				; RV64-NEXT: vmv8r.v v8, v16
				; RV64-NEXT: ret
				%eidxs = zext <vscale x 8 x i32> %idxs to <vscale x 8 x i64>
				%ptrs = getelementptr inbounds i64, i64* %base, <vscale x 8 x i64> %eidxs
				%v = call <vscale x 8 x i64> @llvm.masked.gather.nxv8i64.nxv8p0i64(<vscale x 8 x i64*> %ptrs, i32 8, <vscale x 8 x i1> %m, <vscale x 8 x i64> %passthru)
				ret <vscale x 8 x i64> %v
				}

				define <vscale x 8 x i64> @mgather_baseidx_nxv8i64(i64* %base, <vscale x 8 x i64> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x i64> %passthru) {
				; RV32-LABEL: mgather_baseidx_nxv8i64:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV32-NEXT: vsll.vi v8, v8, 3
				; RV32-NEXT: vsetvli a1, zero, e64,m8,tu,mu
				; RV32-NEXT: vloxei64.v v16, (a0), v8, v0.t
				; RV32-NEXT: vmv8r.v v8, v16
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_nxv8i64:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vsll.vi v8, v8, 3
				; RV64-NEXT: vsetvli a1, zero, e64,m8,tu,mu
				; RV64-NEXT: vloxei64.v v16, (a0), v8, v0.t
				; RV64-NEXT: vmv8r.v v8, v16
				; RV64-NEXT: ret
				%ptrs = getelementptr inbounds i64, i64* %base, <vscale x 8 x i64> %idxs
				%v = call <vscale x 8 x i64> @llvm.masked.gather.nxv8i64.nxv8p0i64(<vscale x 8 x i64*> %ptrs, i32 8, <vscale x 8 x i1> %m, <vscale x 8 x i64> %passthru)
				ret <vscale x 8 x i64> %v
				}

				declare <vscale x 1 x half> @llvm.masked.gather.nxv1f16.nxv1p0f16(<vscale x 1 x half*>, i32, <vscale x 1 x i1>, <vscale x 1 x half>)

				define <vscale x 1 x half> @mgather_nxv1f16(<vscale x 1 x half*> %ptrs, <vscale x 1 x i1> %m, <vscale x 1 x half> %passthru) {
				; RV32-LABEL: mgather_nxv1f16:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e16,mf4,tu,mu
				; RV32-NEXT: vloxei32.v v9, (zero), v8, v0.t
				; RV32-NEXT: vmv1r.v v8, v9
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_nxv1f16:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e16,mf4,tu,mu
				; RV64-NEXT: vloxei64.v v9, (zero), v8, v0.t
				; RV64-NEXT: vmv1r.v v8, v9
				; RV64-NEXT: ret
				%v = call <vscale x 1 x half> @llvm.masked.gather.nxv1f16.nxv1p0f16(<vscale x 1 x half*> %ptrs, i32 2, <vscale x 1 x i1> %m, <vscale x 1 x half> %passthru)
				ret <vscale x 1 x half> %v
				}

				declare <vscale x 2 x half> @llvm.masked.gather.nxv2f16.nxv2p0f16(<vscale x 2 x half*>, i32, <vscale x 2 x i1>, <vscale x 2 x half>)

				define <vscale x 2 x half> @mgather_nxv2f16(<vscale x 2 x half*> %ptrs, <vscale x 2 x i1> %m, <vscale x 2 x half> %passthru) {
				; RV32-LABEL: mgather_nxv2f16:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e16,mf2,tu,mu
				; RV32-NEXT: vloxei32.v v9, (zero), v8, v0.t
				; RV32-NEXT: vmv1r.v v8, v9
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_nxv2f16:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e16,mf2,tu,mu
				; RV64-NEXT: vloxei64.v v10, (zero), v8, v0.t
				; RV64-NEXT: vmv1r.v v8, v10
				; RV64-NEXT: ret
				%v = call <vscale x 2 x half> @llvm.masked.gather.nxv2f16.nxv2p0f16(<vscale x 2 x half*> %ptrs, i32 2, <vscale x 2 x i1> %m, <vscale x 2 x half> %passthru)
				ret <vscale x 2 x half> %v
				}

				declare <vscale x 4 x half> @llvm.masked.gather.nxv4f16.nxv4p0f16(<vscale x 4 x half*>, i32, <vscale x 4 x i1>, <vscale x 4 x half>)

				define <vscale x 4 x half> @mgather_nxv4f16(<vscale x 4 x half*> %ptrs, <vscale x 4 x i1> %m, <vscale x 4 x half> %passthru) {
				; RV32-LABEL: mgather_nxv4f16:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e16,m1,tu,mu
				; RV32-NEXT: vloxei32.v v10, (zero), v8, v0.t
				; RV32-NEXT: vmv1r.v v8, v10
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_nxv4f16:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e16,m1,tu,mu
				; RV64-NEXT: vloxei64.v v12, (zero), v8, v0.t
				; RV64-NEXT: vmv1r.v v8, v12
				; RV64-NEXT: ret
				%v = call <vscale x 4 x half> @llvm.masked.gather.nxv4f16.nxv4p0f16(<vscale x 4 x half*> %ptrs, i32 2, <vscale x 4 x i1> %m, <vscale x 4 x half> %passthru)
				ret <vscale x 4 x half> %v
				}

				define <vscale x 4 x half> @mgather_truemask_nxv4f16(<vscale x 4 x half*> %ptrs, <vscale x 4 x half> %passthru) {
				; RV32-LABEL: mgather_truemask_nxv4f16:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e16,m1,ta,mu
				; RV32-NEXT: vloxei32.v v8, (zero), v8
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_truemask_nxv4f16:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e16,m1,ta,mu
				; RV64-NEXT: vloxei64.v v8, (zero), v8
				; RV64-NEXT: ret
				%mhead = insertelement <vscale x 4 x i1> undef, i1 1, i32 0
				%mtrue = shufflevector <vscale x 4 x i1> %mhead, <vscale x 4 x i1> undef, <vscale x 4 x i32> zeroinitializer
				%v = call <vscale x 4 x half> @llvm.masked.gather.nxv4f16.nxv4p0f16(<vscale x 4 x half*> %ptrs, i32 2, <vscale x 4 x i1> %mtrue, <vscale x 4 x half> %passthru)
				ret <vscale x 4 x half> %v
				}

				declare <vscale x 8 x half> @llvm.masked.gather.nxv8f16.nxv8p0f16(<vscale x 8 x half*>, i32, <vscale x 8 x i1>, <vscale x 8 x half>)

				define <vscale x 8 x half> @mgather_nxv8f16(<vscale x 8 x half*> %ptrs, <vscale x 8 x i1> %m, <vscale x 8 x half> %passthru) {
				; RV32-LABEL: mgather_nxv8f16:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e16,m2,tu,mu
				; RV32-NEXT: vloxei32.v v12, (zero), v8, v0.t
				; RV32-NEXT: vmv2r.v v8, v12
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_nxv8f16:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e16,m2,tu,mu
				; RV64-NEXT: vloxei64.v v16, (zero), v8, v0.t
				; RV64-NEXT: vmv2r.v v8, v16
				; RV64-NEXT: ret
				%v = call <vscale x 8 x half> @llvm.masked.gather.nxv8f16.nxv8p0f16(<vscale x 8 x half*> %ptrs, i32 2, <vscale x 8 x i1> %m, <vscale x 8 x half> %passthru)
				ret <vscale x 8 x half> %v
				}

				define <vscale x 8 x half> @mgather_baseidx_nxv8i8_nxv8f16(half* %base, <vscale x 8 x i8> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x half> %passthru) {
				; RV32-LABEL: mgather_baseidx_nxv8i8_nxv8f16:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e32,m4,ta,mu
				; RV32-NEXT: vsext.vf4 v28, v8
				; RV32-NEXT: vsll.vi v28, v28, 1
				; RV32-NEXT: vsetvli a1, zero, e16,m2,tu,mu
				; RV32-NEXT: vloxei32.v v10, (a0), v28, v0.t
				; RV32-NEXT: vmv2r.v v8, v10
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_nxv8i8_nxv8f16:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vsext.vf8 v16, v8
				; RV64-NEXT: vsll.vi v16, v16, 1
				; RV64-NEXT: vsetvli a1, zero, e16,m2,tu,mu
				; RV64-NEXT: vloxei64.v v10, (a0), v16, v0.t
				; RV64-NEXT: vmv2r.v v8, v10
				; RV64-NEXT: ret
				%ptrs = getelementptr inbounds half, half* %base, <vscale x 8 x i8> %idxs
				%v = call <vscale x 8 x half> @llvm.masked.gather.nxv8f16.nxv8p0f16(<vscale x 8 x half*> %ptrs, i32 2, <vscale x 8 x i1> %m, <vscale x 8 x half> %passthru)
				ret <vscale x 8 x half> %v
				}

				define <vscale x 8 x half> @mgather_baseidx_sext_nxv8i8_nxv8f16(half* %base, <vscale x 8 x i8> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x half> %passthru) {
				; RV32-LABEL: mgather_baseidx_sext_nxv8i8_nxv8f16:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e32,m4,ta,mu
				; RV32-NEXT: vsext.vf4 v28, v8
				; RV32-NEXT: vsll.vi v28, v28, 1
				; RV32-NEXT: vsetvli a1, zero, e16,m2,tu,mu
				; RV32-NEXT: vloxei32.v v10, (a0), v28, v0.t
				; RV32-NEXT: vmv2r.v v8, v10
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_sext_nxv8i8_nxv8f16:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vsext.vf8 v16, v8
				; RV64-NEXT: vsll.vi v16, v16, 1
				; RV64-NEXT: vsetvli a1, zero, e16,m2,tu,mu
				; RV64-NEXT: vloxei64.v v10, (a0), v16, v0.t
				; RV64-NEXT: vmv2r.v v8, v10
				; RV64-NEXT: ret
				%eidxs = sext <vscale x 8 x i8> %idxs to <vscale x 8 x i16>
				%ptrs = getelementptr inbounds half, half* %base, <vscale x 8 x i16> %eidxs
				%v = call <vscale x 8 x half> @llvm.masked.gather.nxv8f16.nxv8p0f16(<vscale x 8 x half*> %ptrs, i32 2, <vscale x 8 x i1> %m, <vscale x 8 x half> %passthru)
				ret <vscale x 8 x half> %v
				}

				define <vscale x 8 x half> @mgather_baseidx_zext_nxv8i8_nxv8f16(half* %base, <vscale x 8 x i8> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x half> %passthru) {
				; RV32-LABEL: mgather_baseidx_zext_nxv8i8_nxv8f16:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e32,m4,ta,mu
				; RV32-NEXT: vzext.vf4 v28, v8
				; RV32-NEXT: vsll.vi v28, v28, 1
				; RV32-NEXT: vsetvli a1, zero, e16,m2,tu,mu
				; RV32-NEXT: vloxei32.v v10, (a0), v28, v0.t
				; RV32-NEXT: vmv2r.v v8, v10
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_zext_nxv8i8_nxv8f16:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vzext.vf8 v16, v8
				; RV64-NEXT: vsll.vi v16, v16, 1
				; RV64-NEXT: vsetvli a1, zero, e16,m2,tu,mu
				; RV64-NEXT: vloxei64.v v10, (a0), v16, v0.t
				; RV64-NEXT: vmv2r.v v8, v10
				; RV64-NEXT: ret
				%eidxs = zext <vscale x 8 x i8> %idxs to <vscale x 8 x i16>
				%ptrs = getelementptr inbounds half, half* %base, <vscale x 8 x i16> %eidxs
				%v = call <vscale x 8 x half> @llvm.masked.gather.nxv8f16.nxv8p0f16(<vscale x 8 x half*> %ptrs, i32 2, <vscale x 8 x i1> %m, <vscale x 8 x half> %passthru)
				ret <vscale x 8 x half> %v
				}

				define <vscale x 8 x half> @mgather_baseidx_nxv8f16(half* %base, <vscale x 8 x i16> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x half> %passthru) {
				; RV32-LABEL: mgather_baseidx_nxv8f16:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e32,m4,ta,mu
				; RV32-NEXT: vsext.vf2 v28, v8
				; RV32-NEXT: vsll.vi v28, v28, 1
				; RV32-NEXT: vsetvli a1, zero, e16,m2,tu,mu
				; RV32-NEXT: vloxei32.v v10, (a0), v28, v0.t
				; RV32-NEXT: vmv2r.v v8, v10
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_nxv8f16:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vsext.vf4 v16, v8
				; RV64-NEXT: vsll.vi v16, v16, 1
				; RV64-NEXT: vsetvli a1, zero, e16,m2,tu,mu
				; RV64-NEXT: vloxei64.v v10, (a0), v16, v0.t
				; RV64-NEXT: vmv2r.v v8, v10
				; RV64-NEXT: ret
				%ptrs = getelementptr inbounds half, half* %base, <vscale x 8 x i16> %idxs
				%v = call <vscale x 8 x half> @llvm.masked.gather.nxv8f16.nxv8p0f16(<vscale x 8 x half*> %ptrs, i32 2, <vscale x 8 x i1> %m, <vscale x 8 x half> %passthru)
				ret <vscale x 8 x half> %v
				}

				declare <vscale x 1 x float> @llvm.masked.gather.nxv1f32.nxv1p0f32(<vscale x 1 x float*>, i32, <vscale x 1 x i1>, <vscale x 1 x float>)

				define <vscale x 1 x float> @mgather_nxv1f32(<vscale x 1 x float*> %ptrs, <vscale x 1 x i1> %m, <vscale x 1 x float> %passthru) {
				; RV32-LABEL: mgather_nxv1f32:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e32,mf2,tu,mu
				; RV32-NEXT: vloxei32.v v9, (zero), v8, v0.t
				; RV32-NEXT: vmv1r.v v8, v9
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_nxv1f32:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e32,mf2,tu,mu
				; RV64-NEXT: vloxei64.v v9, (zero), v8, v0.t
				; RV64-NEXT: vmv1r.v v8, v9
				; RV64-NEXT: ret
				%v = call <vscale x 1 x float> @llvm.masked.gather.nxv1f32.nxv1p0f32(<vscale x 1 x float*> %ptrs, i32 4, <vscale x 1 x i1> %m, <vscale x 1 x float> %passthru)
				ret <vscale x 1 x float> %v
				}

				declare <vscale x 2 x float> @llvm.masked.gather.nxv2f32.nxv2p0f32(<vscale x 2 x float*>, i32, <vscale x 2 x i1>, <vscale x 2 x float>)

				define <vscale x 2 x float> @mgather_nxv2f32(<vscale x 2 x float*> %ptrs, <vscale x 2 x i1> %m, <vscale x 2 x float> %passthru) {
				; RV32-LABEL: mgather_nxv2f32:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e32,m1,tu,mu
				; RV32-NEXT: vloxei32.v v9, (zero), v8, v0.t
				; RV32-NEXT: vmv1r.v v8, v9
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_nxv2f32:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e32,m1,tu,mu
				; RV64-NEXT: vloxei64.v v10, (zero), v8, v0.t
				; RV64-NEXT: vmv1r.v v8, v10
				; RV64-NEXT: ret
				%v = call <vscale x 2 x float> @llvm.masked.gather.nxv2f32.nxv2p0f32(<vscale x 2 x float*> %ptrs, i32 4, <vscale x 2 x i1> %m, <vscale x 2 x float> %passthru)
				ret <vscale x 2 x float> %v
				}

				declare <vscale x 4 x float> @llvm.masked.gather.nxv4f32.nxv4p0f32(<vscale x 4 x float*>, i32, <vscale x 4 x i1>, <vscale x 4 x float>)

				define <vscale x 4 x float> @mgather_nxv4f32(<vscale x 4 x float*> %ptrs, <vscale x 4 x i1> %m, <vscale x 4 x float> %passthru) {
				; RV32-LABEL: mgather_nxv4f32:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e32,m2,tu,mu
				; RV32-NEXT: vloxei32.v v10, (zero), v8, v0.t
				; RV32-NEXT: vmv2r.v v8, v10
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_nxv4f32:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e32,m2,tu,mu
				; RV64-NEXT: vloxei64.v v12, (zero), v8, v0.t
				; RV64-NEXT: vmv2r.v v8, v12
				; RV64-NEXT: ret
				%v = call <vscale x 4 x float> @llvm.masked.gather.nxv4f32.nxv4p0f32(<vscale x 4 x float*> %ptrs, i32 4, <vscale x 4 x i1> %m, <vscale x 4 x float> %passthru)
				ret <vscale x 4 x float> %v
				}

				define <vscale x 4 x float> @mgather_truemask_nxv4f32(<vscale x 4 x float*> %ptrs, <vscale x 4 x float> %passthru) {
				; RV32-LABEL: mgather_truemask_nxv4f32:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e32,m2,ta,mu
				; RV32-NEXT: vloxei32.v v8, (zero), v8
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_truemask_nxv4f32:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e32,m2,ta,mu
				; RV64-NEXT: vloxei64.v v8, (zero), v8
				; RV64-NEXT: ret
				%mhead = insertelement <vscale x 4 x i1> undef, i1 1, i32 0
				%mtrue = shufflevector <vscale x 4 x i1> %mhead, <vscale x 4 x i1> undef, <vscale x 4 x i32> zeroinitializer
				%v = call <vscale x 4 x float> @llvm.masked.gather.nxv4f32.nxv4p0f32(<vscale x 4 x float*> %ptrs, i32 4, <vscale x 4 x i1> %mtrue, <vscale x 4 x float> %passthru)
				ret <vscale x 4 x float> %v
				}

				declare <vscale x 8 x float> @llvm.masked.gather.nxv8f32.nxv8p0f32(<vscale x 8 x float*>, i32, <vscale x 8 x i1>, <vscale x 8 x float>)

				define <vscale x 8 x float> @mgather_nxv8f32(<vscale x 8 x float*> %ptrs, <vscale x 8 x i1> %m, <vscale x 8 x float> %passthru) {
				; RV32-LABEL: mgather_nxv8f32:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e32,m4,tu,mu
				; RV32-NEXT: vloxei32.v v12, (zero), v8, v0.t
				; RV32-NEXT: vmv4r.v v8, v12
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_nxv8f32:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e32,m4,tu,mu
				; RV64-NEXT: vloxei64.v v16, (zero), v8, v0.t
				; RV64-NEXT: vmv4r.v v8, v16
				; RV64-NEXT: ret
				%v = call <vscale x 8 x float> @llvm.masked.gather.nxv8f32.nxv8p0f32(<vscale x 8 x float*> %ptrs, i32 4, <vscale x 8 x i1> %m, <vscale x 8 x float> %passthru)
				ret <vscale x 8 x float> %v
				}

				define <vscale x 8 x float> @mgather_baseidx_nxv8i8_nxv8f32(float* %base, <vscale x 8 x i8> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x float> %passthru) {
				; RV32-LABEL: mgather_baseidx_nxv8i8_nxv8f32:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e32,m4,ta,mu
				; RV32-NEXT: vsext.vf4 v28, v8
				; RV32-NEXT: vsll.vi v28, v28, 2
				; RV32-NEXT: vsetvli a1, zero, e32,m4,tu,mu
				; RV32-NEXT: vloxei32.v v12, (a0), v28, v0.t
				; RV32-NEXT: vmv4r.v v8, v12
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_nxv8i8_nxv8f32:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vsext.vf8 v16, v8
				; RV64-NEXT: vsll.vi v16, v16, 2
				; RV64-NEXT: vsetvli a1, zero, e32,m4,tu,mu
				; RV64-NEXT: vloxei64.v v12, (a0), v16, v0.t
				; RV64-NEXT: vmv4r.v v8, v12
				; RV64-NEXT: ret
				%ptrs = getelementptr inbounds float, float* %base, <vscale x 8 x i8> %idxs
				%v = call <vscale x 8 x float> @llvm.masked.gather.nxv8f32.nxv8p0f32(<vscale x 8 x float*> %ptrs, i32 4, <vscale x 8 x i1> %m, <vscale x 8 x float> %passthru)
				ret <vscale x 8 x float> %v
				}

				define <vscale x 8 x float> @mgather_baseidx_sext_nxv8i8_nxv8f32(float* %base, <vscale x 8 x i8> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x float> %passthru) {
				; RV32-LABEL: mgather_baseidx_sext_nxv8i8_nxv8f32:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e32,m4,ta,mu
				; RV32-NEXT: vsext.vf4 v28, v8
				; RV32-NEXT: vsll.vi v28, v28, 2
				; RV32-NEXT: vsetvli a1, zero, e32,m4,tu,mu
				; RV32-NEXT: vloxei32.v v12, (a0), v28, v0.t
				; RV32-NEXT: vmv4r.v v8, v12
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_sext_nxv8i8_nxv8f32:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vsext.vf8 v16, v8
				; RV64-NEXT: vsll.vi v16, v16, 2
				; RV64-NEXT: vsetvli a1, zero, e32,m4,tu,mu
				; RV64-NEXT: vloxei64.v v12, (a0), v16, v0.t
				; RV64-NEXT: vmv4r.v v8, v12
				; RV64-NEXT: ret
				%eidxs = sext <vscale x 8 x i8> %idxs to <vscale x 8 x i32>
				%ptrs = getelementptr inbounds float, float* %base, <vscale x 8 x i32> %eidxs
				%v = call <vscale x 8 x float> @llvm.masked.gather.nxv8f32.nxv8p0f32(<vscale x 8 x float*> %ptrs, i32 4, <vscale x 8 x i1> %m, <vscale x 8 x float> %passthru)
				ret <vscale x 8 x float> %v
				}

				define <vscale x 8 x float> @mgather_baseidx_zext_nxv8i8_nxv8f32(float* %base, <vscale x 8 x i8> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x float> %passthru) {
				; RV32-LABEL: mgather_baseidx_zext_nxv8i8_nxv8f32:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e32,m4,ta,mu
				; RV32-NEXT: vzext.vf4 v28, v8
				; RV32-NEXT: vsll.vi v28, v28, 2
				; RV32-NEXT: vsetvli a1, zero, e32,m4,tu,mu
				; RV32-NEXT: vloxei32.v v12, (a0), v28, v0.t
				; RV32-NEXT: vmv4r.v v8, v12
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_zext_nxv8i8_nxv8f32:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vzext.vf8 v16, v8
				; RV64-NEXT: vsll.vi v16, v16, 2
				; RV64-NEXT: vsetvli a1, zero, e32,m4,tu,mu
				; RV64-NEXT: vloxei64.v v12, (a0), v16, v0.t
				; RV64-NEXT: vmv4r.v v8, v12
				; RV64-NEXT: ret
				%eidxs = zext <vscale x 8 x i8> %idxs to <vscale x 8 x i32>
				%ptrs = getelementptr inbounds float, float* %base, <vscale x 8 x i32> %eidxs
				%v = call <vscale x 8 x float> @llvm.masked.gather.nxv8f32.nxv8p0f32(<vscale x 8 x float*> %ptrs, i32 4, <vscale x 8 x i1> %m, <vscale x 8 x float> %passthru)
				ret <vscale x 8 x float> %v
				}

				define <vscale x 8 x float> @mgather_baseidx_nxv8i16_nxv8f32(float* %base, <vscale x 8 x i16> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x float> %passthru) {
				; RV32-LABEL: mgather_baseidx_nxv8i16_nxv8f32:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e32,m4,ta,mu
				; RV32-NEXT: vsext.vf2 v28, v8
				; RV32-NEXT: vsll.vi v28, v28, 2
				; RV32-NEXT: vsetvli a1, zero, e32,m4,tu,mu
				; RV32-NEXT: vloxei32.v v12, (a0), v28, v0.t
				; RV32-NEXT: vmv4r.v v8, v12
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_nxv8i16_nxv8f32:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vsext.vf4 v16, v8
				; RV64-NEXT: vsll.vi v16, v16, 2
				; RV64-NEXT: vsetvli a1, zero, e32,m4,tu,mu
				; RV64-NEXT: vloxei64.v v12, (a0), v16, v0.t
				; RV64-NEXT: vmv4r.v v8, v12
				; RV64-NEXT: ret
				%ptrs = getelementptr inbounds float, float* %base, <vscale x 8 x i16> %idxs
				%v = call <vscale x 8 x float> @llvm.masked.gather.nxv8f32.nxv8p0f32(<vscale x 8 x float*> %ptrs, i32 4, <vscale x 8 x i1> %m, <vscale x 8 x float> %passthru)
				ret <vscale x 8 x float> %v
				}

				define <vscale x 8 x float> @mgather_baseidx_sext_nxv8i16_nxv8f32(float* %base, <vscale x 8 x i16> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x float> %passthru) {
				; RV32-LABEL: mgather_baseidx_sext_nxv8i16_nxv8f32:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e32,m4,ta,mu
				; RV32-NEXT: vsext.vf2 v28, v8
				; RV32-NEXT: vsll.vi v28, v28, 2
				; RV32-NEXT: vsetvli a1, zero, e32,m4,tu,mu
				; RV32-NEXT: vloxei32.v v12, (a0), v28, v0.t
				; RV32-NEXT: vmv4r.v v8, v12
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_sext_nxv8i16_nxv8f32:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vsext.vf4 v16, v8
				; RV64-NEXT: vsll.vi v16, v16, 2
				; RV64-NEXT: vsetvli a1, zero, e32,m4,tu,mu
				; RV64-NEXT: vloxei64.v v12, (a0), v16, v0.t
				; RV64-NEXT: vmv4r.v v8, v12
				; RV64-NEXT: ret
				%eidxs = sext <vscale x 8 x i16> %idxs to <vscale x 8 x i32>
				%ptrs = getelementptr inbounds float, float* %base, <vscale x 8 x i32> %eidxs
				%v = call <vscale x 8 x float> @llvm.masked.gather.nxv8f32.nxv8p0f32(<vscale x 8 x float*> %ptrs, i32 4, <vscale x 8 x i1> %m, <vscale x 8 x float> %passthru)
				ret <vscale x 8 x float> %v
				}

				define <vscale x 8 x float> @mgather_baseidx_zext_nxv8i16_nxv8f32(float* %base, <vscale x 8 x i16> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x float> %passthru) {
				; RV32-LABEL: mgather_baseidx_zext_nxv8i16_nxv8f32:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e32,m4,ta,mu
				; RV32-NEXT: vzext.vf2 v28, v8
				; RV32-NEXT: vsll.vi v28, v28, 2
				; RV32-NEXT: vsetvli a1, zero, e32,m4,tu,mu
				; RV32-NEXT: vloxei32.v v12, (a0), v28, v0.t
				; RV32-NEXT: vmv4r.v v8, v12
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_zext_nxv8i16_nxv8f32:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vzext.vf4 v16, v8
				; RV64-NEXT: vsll.vi v16, v16, 2
				; RV64-NEXT: vsetvli a1, zero, e32,m4,tu,mu
				; RV64-NEXT: vloxei64.v v12, (a0), v16, v0.t
				; RV64-NEXT: vmv4r.v v8, v12
				; RV64-NEXT: ret
				%eidxs = zext <vscale x 8 x i16> %idxs to <vscale x 8 x i32>
				%ptrs = getelementptr inbounds float, float* %base, <vscale x 8 x i32> %eidxs
				%v = call <vscale x 8 x float> @llvm.masked.gather.nxv8f32.nxv8p0f32(<vscale x 8 x float*> %ptrs, i32 4, <vscale x 8 x i1> %m, <vscale x 8 x float> %passthru)
				ret <vscale x 8 x float> %v
				}

				define <vscale x 8 x float> @mgather_baseidx_nxv8f32(float* %base, <vscale x 8 x i32> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x float> %passthru) {
				; RV32-LABEL: mgather_baseidx_nxv8f32:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e32,m4,ta,mu
				; RV32-NEXT: vsll.vi v28, v8, 2
				; RV32-NEXT: vsetvli a1, zero, e32,m4,tu,mu
				; RV32-NEXT: vloxei32.v v12, (a0), v28, v0.t
				; RV32-NEXT: vmv4r.v v8, v12
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_nxv8f32:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vsext.vf2 v16, v8
				; RV64-NEXT: vsll.vi v16, v16, 2
				; RV64-NEXT: vsetvli a1, zero, e32,m4,tu,mu
				; RV64-NEXT: vloxei64.v v12, (a0), v16, v0.t
				; RV64-NEXT: vmv4r.v v8, v12
				; RV64-NEXT: ret
				%ptrs = getelementptr inbounds float, float* %base, <vscale x 8 x i32> %idxs
				%v = call <vscale x 8 x float> @llvm.masked.gather.nxv8f32.nxv8p0f32(<vscale x 8 x float*> %ptrs, i32 4, <vscale x 8 x i1> %m, <vscale x 8 x float> %passthru)
				ret <vscale x 8 x float> %v
				}

				declare <vscale x 1 x double> @llvm.masked.gather.nxv1f64.nxv1p0f64(<vscale x 1 x double*>, i32, <vscale x 1 x i1>, <vscale x 1 x double>)

				define <vscale x 1 x double> @mgather_nxv1f64(<vscale x 1 x double*> %ptrs, <vscale x 1 x i1> %m, <vscale x 1 x double> %passthru) {
				; RV32-LABEL: mgather_nxv1f64:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e64,m1,tu,mu
				; RV32-NEXT: vloxei32.v v9, (zero), v8, v0.t
				; RV32-NEXT: vmv1r.v v8, v9
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_nxv1f64:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e64,m1,tu,mu
				; RV64-NEXT: vloxei64.v v9, (zero), v8, v0.t
				; RV64-NEXT: vmv1r.v v8, v9
				; RV64-NEXT: ret
				%v = call <vscale x 1 x double> @llvm.masked.gather.nxv1f64.nxv1p0f64(<vscale x 1 x double*> %ptrs, i32 8, <vscale x 1 x i1> %m, <vscale x 1 x double> %passthru)
				ret <vscale x 1 x double> %v
				}

				declare <vscale x 2 x double> @llvm.masked.gather.nxv2f64.nxv2p0f64(<vscale x 2 x double*>, i32, <vscale x 2 x i1>, <vscale x 2 x double>)

				define <vscale x 2 x double> @mgather_nxv2f64(<vscale x 2 x double*> %ptrs, <vscale x 2 x i1> %m, <vscale x 2 x double> %passthru) {
				; RV32-LABEL: mgather_nxv2f64:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e64,m2,tu,mu
				; RV32-NEXT: vloxei32.v v10, (zero), v8, v0.t
				; RV32-NEXT: vmv2r.v v8, v10
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_nxv2f64:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e64,m2,tu,mu
				; RV64-NEXT: vloxei64.v v10, (zero), v8, v0.t
				; RV64-NEXT: vmv2r.v v8, v10
				; RV64-NEXT: ret
				%v = call <vscale x 2 x double> @llvm.masked.gather.nxv2f64.nxv2p0f64(<vscale x 2 x double*> %ptrs, i32 8, <vscale x 2 x i1> %m, <vscale x 2 x double> %passthru)
				ret <vscale x 2 x double> %v
				}

				declare <vscale x 4 x double> @llvm.masked.gather.nxv4f64.nxv4p0f64(<vscale x 4 x double*>, i32, <vscale x 4 x i1>, <vscale x 4 x double>)

				define <vscale x 4 x double> @mgather_nxv4f64(<vscale x 4 x double*> %ptrs, <vscale x 4 x i1> %m, <vscale x 4 x double> %passthru) {
				; RV32-LABEL: mgather_nxv4f64:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e64,m4,tu,mu
				; RV32-NEXT: vloxei32.v v12, (zero), v8, v0.t
				; RV32-NEXT: vmv4r.v v8, v12
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_nxv4f64:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e64,m4,tu,mu
				; RV64-NEXT: vloxei64.v v12, (zero), v8, v0.t
				; RV64-NEXT: vmv4r.v v8, v12
				; RV64-NEXT: ret
				%v = call <vscale x 4 x double> @llvm.masked.gather.nxv4f64.nxv4p0f64(<vscale x 4 x double*> %ptrs, i32 8, <vscale x 4 x i1> %m, <vscale x 4 x double> %passthru)
				ret <vscale x 4 x double> %v
				}

				define <vscale x 4 x double> @mgather_truemask_nxv4f64(<vscale x 4 x double*> %ptrs, <vscale x 4 x double> %passthru) {
				; RV32-LABEL: mgather_truemask_nxv4f64:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e64,m4,ta,mu
				; RV32-NEXT: vloxei32.v v8, (zero), v8
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_truemask_nxv4f64:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e64,m4,ta,mu
				; RV64-NEXT: vloxei64.v v8, (zero), v8
				; RV64-NEXT: ret
				%mhead = insertelement <vscale x 4 x i1> undef, i1 1, i32 0
				%mtrue = shufflevector <vscale x 4 x i1> %mhead, <vscale x 4 x i1> undef, <vscale x 4 x i32> zeroinitializer
				%v = call <vscale x 4 x double> @llvm.masked.gather.nxv4f64.nxv4p0f64(<vscale x 4 x double*> %ptrs, i32 8, <vscale x 4 x i1> %mtrue, <vscale x 4 x double> %passthru)
				ret <vscale x 4 x double> %v
				}

				declare <vscale x 8 x double> @llvm.masked.gather.nxv8f64.nxv8p0f64(<vscale x 8 x double*>, i32, <vscale x 8 x i1>, <vscale x 8 x double>)

				define <vscale x 8 x double> @mgather_nxv8f64(<vscale x 8 x double*> %ptrs, <vscale x 8 x i1> %m, <vscale x 8 x double> %passthru) {
				; RV32-LABEL: mgather_nxv8f64:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a0, zero, e64,m8,tu,mu
				; RV32-NEXT: vloxei32.v v16, (zero), v8, v0.t
				; RV32-NEXT: vmv8r.v v8, v16
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_nxv8f64:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a0, zero, e64,m8,tu,mu
				; RV64-NEXT: vloxei64.v v16, (zero), v8, v0.t
				; RV64-NEXT: vmv8r.v v8, v16
				; RV64-NEXT: ret
				%v = call <vscale x 8 x double> @llvm.masked.gather.nxv8f64.nxv8p0f64(<vscale x 8 x double*> %ptrs, i32 8, <vscale x 8 x i1> %m, <vscale x 8 x double> %passthru)
				ret <vscale x 8 x double> %v
				}

				define <vscale x 8 x double> @mgather_baseidx_nxv8i8_nxv8f64(double* %base, <vscale x 8 x i8> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x double> %passthru) {
				; RV32-LABEL: mgather_baseidx_nxv8i8_nxv8f64:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e32,m4,ta,mu
				; RV32-NEXT: vsext.vf4 v28, v8
				; RV32-NEXT: vsll.vi v28, v28, 3
				; RV32-NEXT: vsetvli a1, zero, e64,m8,tu,mu
				; RV32-NEXT: vloxei32.v v16, (a0), v28, v0.t
				; RV32-NEXT: vmv8r.v v8, v16
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_nxv8i8_nxv8f64:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vsext.vf8 v24, v8
				; RV64-NEXT: vsll.vi v8, v24, 3
				; RV64-NEXT: vsetvli a1, zero, e64,m8,tu,mu
				; RV64-NEXT: vloxei64.v v16, (a0), v8, v0.t
				; RV64-NEXT: vmv8r.v v8, v16
				; RV64-NEXT: ret
				%ptrs = getelementptr inbounds double, double* %base, <vscale x 8 x i8> %idxs
				%v = call <vscale x 8 x double> @llvm.masked.gather.nxv8f64.nxv8p0f64(<vscale x 8 x double*> %ptrs, i32 8, <vscale x 8 x i1> %m, <vscale x 8 x double> %passthru)
				ret <vscale x 8 x double> %v
				}

				define <vscale x 8 x double> @mgather_baseidx_sext_nxv8i8_nxv8f64(double* %base, <vscale x 8 x i8> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x double> %passthru) {
				; RV32-LABEL: mgather_baseidx_sext_nxv8i8_nxv8f64:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e32,m4,ta,mu
				; RV32-NEXT: vsext.vf4 v28, v8
				; RV32-NEXT: vsll.vi v28, v28, 3
				; RV32-NEXT: vsetvli a1, zero, e64,m8,tu,mu
				; RV32-NEXT: vloxei32.v v16, (a0), v28, v0.t
				; RV32-NEXT: vmv8r.v v8, v16
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_sext_nxv8i8_nxv8f64:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vsext.vf8 v24, v8
				; RV64-NEXT: vsll.vi v8, v24, 3
				; RV64-NEXT: vsetvli a1, zero, e64,m8,tu,mu
				; RV64-NEXT: vloxei64.v v16, (a0), v8, v0.t
				; RV64-NEXT: vmv8r.v v8, v16
				; RV64-NEXT: ret
				%eidxs = sext <vscale x 8 x i8> %idxs to <vscale x 8 x i64>
				%ptrs = getelementptr inbounds double, double* %base, <vscale x 8 x i64> %eidxs
				%v = call <vscale x 8 x double> @llvm.masked.gather.nxv8f64.nxv8p0f64(<vscale x 8 x double*> %ptrs, i32 8, <vscale x 8 x i1> %m, <vscale x 8 x double> %passthru)
				ret <vscale x 8 x double> %v
				}

				define <vscale x 8 x double> @mgather_baseidx_zext_nxv8i8_nxv8f64(double* %base, <vscale x 8 x i8> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x double> %passthru) {
				; RV32-LABEL: mgather_baseidx_zext_nxv8i8_nxv8f64:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e32,m4,ta,mu
				; RV32-NEXT: vzext.vf4 v28, v8
				; RV32-NEXT: vsll.vi v28, v28, 3
				; RV32-NEXT: vsetvli a1, zero, e64,m8,tu,mu
				; RV32-NEXT: vloxei32.v v16, (a0), v28, v0.t
				; RV32-NEXT: vmv8r.v v8, v16
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_zext_nxv8i8_nxv8f64:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vzext.vf8 v24, v8
				; RV64-NEXT: vsll.vi v8, v24, 3
				; RV64-NEXT: vsetvli a1, zero, e64,m8,tu,mu
				; RV64-NEXT: vloxei64.v v16, (a0), v8, v0.t
				; RV64-NEXT: vmv8r.v v8, v16
				; RV64-NEXT: ret
				%eidxs = zext <vscale x 8 x i8> %idxs to <vscale x 8 x i64>
				%ptrs = getelementptr inbounds double, double* %base, <vscale x 8 x i64> %eidxs
				%v = call <vscale x 8 x double> @llvm.masked.gather.nxv8f64.nxv8p0f64(<vscale x 8 x double*> %ptrs, i32 8, <vscale x 8 x i1> %m, <vscale x 8 x double> %passthru)
				ret <vscale x 8 x double> %v
				}

				define <vscale x 8 x double> @mgather_baseidx_nxv8i16_nxv8f64(double* %base, <vscale x 8 x i16> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x double> %passthru) {
				; RV32-LABEL: mgather_baseidx_nxv8i16_nxv8f64:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e32,m4,ta,mu
				; RV32-NEXT: vsext.vf2 v28, v8
				; RV32-NEXT: vsll.vi v28, v28, 3
				; RV32-NEXT: vsetvli a1, zero, e64,m8,tu,mu
				; RV32-NEXT: vloxei32.v v16, (a0), v28, v0.t
				; RV32-NEXT: vmv8r.v v8, v16
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_nxv8i16_nxv8f64:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vsext.vf4 v24, v8
				; RV64-NEXT: vsll.vi v8, v24, 3
				; RV64-NEXT: vsetvli a1, zero, e64,m8,tu,mu
				; RV64-NEXT: vloxei64.v v16, (a0), v8, v0.t
				; RV64-NEXT: vmv8r.v v8, v16
				; RV64-NEXT: ret
				%ptrs = getelementptr inbounds double, double* %base, <vscale x 8 x i16> %idxs
				%v = call <vscale x 8 x double> @llvm.masked.gather.nxv8f64.nxv8p0f64(<vscale x 8 x double*> %ptrs, i32 8, <vscale x 8 x i1> %m, <vscale x 8 x double> %passthru)
				ret <vscale x 8 x double> %v
				}

				define <vscale x 8 x double> @mgather_baseidx_sext_nxv8i16_nxv8f64(double* %base, <vscale x 8 x i16> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x double> %passthru) {
				; RV32-LABEL: mgather_baseidx_sext_nxv8i16_nxv8f64:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e32,m4,ta,mu
				; RV32-NEXT: vsext.vf2 v28, v8
				; RV32-NEXT: vsll.vi v28, v28, 3
				; RV32-NEXT: vsetvli a1, zero, e64,m8,tu,mu
				; RV32-NEXT: vloxei32.v v16, (a0), v28, v0.t
				; RV32-NEXT: vmv8r.v v8, v16
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_sext_nxv8i16_nxv8f64:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vsext.vf4 v24, v8
				; RV64-NEXT: vsll.vi v8, v24, 3
				; RV64-NEXT: vsetvli a1, zero, e64,m8,tu,mu
				; RV64-NEXT: vloxei64.v v16, (a0), v8, v0.t
				; RV64-NEXT: vmv8r.v v8, v16
				; RV64-NEXT: ret
				%eidxs = sext <vscale x 8 x i16> %idxs to <vscale x 8 x i64>
				%ptrs = getelementptr inbounds double, double* %base, <vscale x 8 x i64> %eidxs
				%v = call <vscale x 8 x double> @llvm.masked.gather.nxv8f64.nxv8p0f64(<vscale x 8 x double*> %ptrs, i32 8, <vscale x 8 x i1> %m, <vscale x 8 x double> %passthru)
				ret <vscale x 8 x double> %v
				}

				define <vscale x 8 x double> @mgather_baseidx_zext_nxv8i16_nxv8f64(double* %base, <vscale x 8 x i16> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x double> %passthru) {
				; RV32-LABEL: mgather_baseidx_zext_nxv8i16_nxv8f64:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e32,m4,ta,mu
				; RV32-NEXT: vzext.vf2 v28, v8
				; RV32-NEXT: vsll.vi v28, v28, 3
				; RV32-NEXT: vsetvli a1, zero, e64,m8,tu,mu
				; RV32-NEXT: vloxei32.v v16, (a0), v28, v0.t
				; RV32-NEXT: vmv8r.v v8, v16
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_zext_nxv8i16_nxv8f64:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vzext.vf4 v24, v8
				; RV64-NEXT: vsll.vi v8, v24, 3
				; RV64-NEXT: vsetvli a1, zero, e64,m8,tu,mu
				; RV64-NEXT: vloxei64.v v16, (a0), v8, v0.t
				; RV64-NEXT: vmv8r.v v8, v16
				; RV64-NEXT: ret
				%eidxs = zext <vscale x 8 x i16> %idxs to <vscale x 8 x i64>
				%ptrs = getelementptr inbounds double, double* %base, <vscale x 8 x i64> %eidxs
				%v = call <vscale x 8 x double> @llvm.masked.gather.nxv8f64.nxv8p0f64(<vscale x 8 x double*> %ptrs, i32 8, <vscale x 8 x i1> %m, <vscale x 8 x double> %passthru)
				ret <vscale x 8 x double> %v
				}

				define <vscale x 8 x double> @mgather_baseidx_nxv8i32_nxv8f64(double* %base, <vscale x 8 x i32> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x double> %passthru) {
				; RV32-LABEL: mgather_baseidx_nxv8i32_nxv8f64:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e32,m4,ta,mu
				; RV32-NEXT: vsll.vi v28, v8, 3
				; RV32-NEXT: vsetvli a1, zero, e64,m8,tu,mu
				; RV32-NEXT: vloxei32.v v16, (a0), v28, v0.t
				; RV32-NEXT: vmv8r.v v8, v16
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_nxv8i32_nxv8f64:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vsext.vf2 v24, v8
				; RV64-NEXT: vsll.vi v8, v24, 3
				; RV64-NEXT: vsetvli a1, zero, e64,m8,tu,mu
				; RV64-NEXT: vloxei64.v v16, (a0), v8, v0.t
				; RV64-NEXT: vmv8r.v v8, v16
				; RV64-NEXT: ret
				%ptrs = getelementptr inbounds double, double* %base, <vscale x 8 x i32> %idxs
				%v = call <vscale x 8 x double> @llvm.masked.gather.nxv8f64.nxv8p0f64(<vscale x 8 x double*> %ptrs, i32 8, <vscale x 8 x i1> %m, <vscale x 8 x double> %passthru)
				ret <vscale x 8 x double> %v
				}

				define <vscale x 8 x double> @mgather_baseidx_sext_nxv8i32_nxv8f64(double* %base, <vscale x 8 x i32> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x double> %passthru) {
				; RV32-LABEL: mgather_baseidx_sext_nxv8i32_nxv8f64:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e32,m4,ta,mu
				; RV32-NEXT: vsll.vi v28, v8, 3
				; RV32-NEXT: vsetvli a1, zero, e64,m8,tu,mu
				; RV32-NEXT: vloxei32.v v16, (a0), v28, v0.t
				; RV32-NEXT: vmv8r.v v8, v16
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_sext_nxv8i32_nxv8f64:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vsext.vf2 v24, v8
				; RV64-NEXT: vsll.vi v8, v24, 3
				; RV64-NEXT: vsetvli a1, zero, e64,m8,tu,mu
				; RV64-NEXT: vloxei64.v v16, (a0), v8, v0.t
				; RV64-NEXT: vmv8r.v v8, v16
				; RV64-NEXT: ret
				%eidxs = sext <vscale x 8 x i32> %idxs to <vscale x 8 x i64>
				%ptrs = getelementptr inbounds double, double* %base, <vscale x 8 x i64> %eidxs
				%v = call <vscale x 8 x double> @llvm.masked.gather.nxv8f64.nxv8p0f64(<vscale x 8 x double*> %ptrs, i32 8, <vscale x 8 x i1> %m, <vscale x 8 x double> %passthru)
				ret <vscale x 8 x double> %v
				}

				define <vscale x 8 x double> @mgather_baseidx_zext_nxv8i32_nxv8f64(double* %base, <vscale x 8 x i32> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x double> %passthru) {
				; RV32-LABEL: mgather_baseidx_zext_nxv8i32_nxv8f64:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e32,m4,ta,mu
				; RV32-NEXT: vsll.vi v28, v8, 3
				; RV32-NEXT: vsetvli a1, zero, e64,m8,tu,mu
				; RV32-NEXT: vloxei32.v v16, (a0), v28, v0.t
				; RV32-NEXT: vmv8r.v v8, v16
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_zext_nxv8i32_nxv8f64:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vzext.vf2 v24, v8
				; RV64-NEXT: vsll.vi v8, v24, 3
				; RV64-NEXT: vsetvli a1, zero, e64,m8,tu,mu
				; RV64-NEXT: vloxei64.v v16, (a0), v8, v0.t
				; RV64-NEXT: vmv8r.v v8, v16
				; RV64-NEXT: ret
				%eidxs = zext <vscale x 8 x i32> %idxs to <vscale x 8 x i64>
				%ptrs = getelementptr inbounds double, double* %base, <vscale x 8 x i64> %eidxs
				%v = call <vscale x 8 x double> @llvm.masked.gather.nxv8f64.nxv8p0f64(<vscale x 8 x double*> %ptrs, i32 8, <vscale x 8 x i1> %m, <vscale x 8 x double> %passthru)
				ret <vscale x 8 x double> %v
				}

				define <vscale x 8 x double> @mgather_baseidx_nxv8f64(double* %base, <vscale x 8 x i64> %idxs, <vscale x 8 x i1> %m, <vscale x 8 x double> %passthru) {
				; RV32-LABEL: mgather_baseidx_nxv8f64:
				; RV32: # %bb.0:
				; RV32-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV32-NEXT: vsll.vi v8, v8, 3
				; RV32-NEXT: vsetvli a1, zero, e64,m8,tu,mu
				; RV32-NEXT: vloxei64.v v16, (a0), v8, v0.t
				; RV32-NEXT: vmv8r.v v8, v16
				; RV32-NEXT: ret
				;
				; RV64-LABEL: mgather_baseidx_nxv8f64:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli a1, zero, e64,m8,ta,mu
				; RV64-NEXT: vsll.vi v8, v8, 3
				; RV64-NEXT: vsetvli a1, zero, e64,m8,tu,mu
				; RV64-NEXT: vloxei64.v v16, (a0), v8, v0.t
				; RV64-NEXT: vmv8r.v v8, v16
				; RV64-NEXT: ret
				%ptrs = getelementptr inbounds double, double* %base, <vscale x 8 x i64> %idxs
				%v = call <vscale x 8 x double> @llvm.masked.gather.nxv8f64.nxv8p0f64(<vscale x 8 x double*> %ptrs, i32 8, <vscale x 8 x i1> %m, <vscale x 8 x double> %passthru)
				ret <vscale x 8 x double> %v
				}

This is an archive of the discontinued LLVM Phabricator instance.

[RISCV] Support scalable-vector masked gather operations
ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 323283

llvm/lib/Target/RISCV/RISCVISelLowering.h

llvm/lib/Target/RISCV/RISCVISelLowering.cpp

llvm/lib/Target/RISCV/RISCVInstrInfoVSDPatterns.td

llvm/test/CodeGen/RISCV/rvv/mgather-sdnode.ll

This is an archive of the discontinued LLVM Phabricator instance.

[RISCV] Support scalable-vector masked gather operationsClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 323283

llvm/lib/Target/RISCV/RISCVISelLowering.h

llvm/lib/Target/RISCV/RISCVISelLowering.cpp

llvm/lib/Target/RISCV/RISCVInstrInfoVSDPatterns.td

llvm/test/CodeGen/RISCV/rvv/mgather-sdnode.ll

[RISCV] Support scalable-vector masked gather operations
ClosedPublic