This is an archive of the discontinued LLVM Phabricator instance.

Paths

Table of Contentst

-
llvm/
-
lib/Target/RISCV/
-
Target/
-
RISCV/
6/6
RISCVISelLowering.h
-
RISCVISelLowering.cpp
5/5
RISCVInstrInfoVPseudos.td
-
RISCVInstrInfoVVLPatterns.td
-
test/CodeGen/RISCV/rvv/
-
CodeGen/
-
RISCV/
-
rvv/
-
fixed-vectors-vpmerge.ll
-
vpmerge-sdnode.ll

Differential D117561

[RISCV][VP] Lower VP_MERGE to RVV instructions
ClosedPublic

Authored by frasercrmck on Jan 18 2022, 6:35 AM.

Download Raw Diff

Details

Reviewers

craig.topper
rogfer01

Commits

rGaf773a18181d: [RISCV][VP] Lower VP_MERGE to RVV instructions

Summary

This patch adds lowering of the llvm.vp.merge.* intrinsic
(ISD::VP_MERGE) to RVV vmerge/vfmerge instructions. It introduces a
special pseudo form of vmerge which allows a tied merge operand,
allowing us to specify the tail elements as being equal to the "on
false" operand, using a tied-def constraint and a "tail undisturbed"
policy.

While this strategy allows us to often lower the intrinsic to just one
instruction, it may be less efficient in fixed-vector types as the
number of tail elements may extend far beyond the length of the fixed
vector. Another strategy could be to use a vmerge/vfmerge instruction
with an AVL equal to the length of the vector type, and manipulate the
condition operand such that mask elements greater than the operation's
EVL are false.

I've also observed inefficient codegen in which our 'VF' patterns don't
match raw floating-point SPLAT_VECTORs, which occur in scalable-vector
code.

Diff Detail

Repository: rG LLVM Github Monorepo

Event Timeline

frasercrmck created this revision.Jan 18 2022, 6:35 AM

Herald added subscribers: VincentWu, luke957, achieveartificialintelligence and 25 others. · View Herald TranscriptJan 18 2022, 6:35 AM

frasercrmck requested review of this revision.Jan 18 2022, 6:35 AM

Herald added a project: Restricted Project. · View Herald TranscriptJan 18 2022, 6:35 AM

Herald added subscribers: llvm-commits, eopXD, MaskRay. · View Herald Transcript

Harbormaster completed remote builds in B144006: Diff 400828.Jan 18 2022, 7:20 AM

craig.topper added inline comments.Jan 19 2022, 3:50 PM

llvm/lib/Target/RISCV/RISCVISelLowering.h
254	Say which operand is tied
256	This is an unfortunate name collision with the RVV instruction. While also having weird constraints. Maybe VPMERGE_VL or VP_MERGE_VL would be slightly better?
llvm/lib/Target/RISCV/RISCVInstrInfoVPseudos.td
1086	Does it really need to tied or can we have a _TU instruction and pass the false value to two operands in the pattern match?

craig.topper added inline comments.Jan 19 2022, 3:55 PM

llvm/lib/Target/RISCV/RISCVInstrInfoVPseudos.td
1086	Let me rephrase that. We obviously need an operand that is tied. But it doesn't need to be the same as $rs2. We can assign $rs2 and the merge operand to the same src in the pattern. But I guess we don't have the concept of _TU instructions until https://reviews.llvm.org/D117647

frasercrmck added inline comments.Jan 20 2022, 6:39 AM

llvm/lib/Target/RISCV/RISCVISelLowering.h
256	Yeah totally. I also considered making `VSELECT_VL` take a merge operand which means we can share a node for vp.merge, vp.select and vselect. I don't know if that's too intrusive into areas where a merge operand doesn't make sense, though. We'd probably need a policy operand, too... What do you think?
llvm/lib/Target/RISCV/RISCVInstrInfoVPseudos.td
1086	Yeah that would work too. Are we really dependent on that patch or can we have a `HasMergeOp = 1` in conjunction `HasVecPolicyOp = 1` where we pass along `TAIL_UNDISTURBED`? Or is it then that we don't really have a suffix to convey that: `_TIED` isn't quite right and `_MASK` isn't either since `vmerge` isn't "masked", in that sense?

craig.topper added inline comments.Jan 20 2022, 10:03 AM

llvm/lib/Target/RISCV/RISCVISelLowering.h
256	I think its ok to keep them separate for now.
llvm/lib/Target/RISCV/RISCVInstrInfoVPseudos.td
1086	I think you can use `_TU` and take the change PseudoToVInst from D117647 Add the extra tied source operand and use `HasMergeOp = 1` and `HasVecPolicyOp = 0`. We don't need a policy op since the tied source being undef can distinquish tail undisturbed vs agnostic.

use a _TU suffix (taken from D117647)
drop the policy op: use an explicit tied merge/passthru operand
rename to VP_MERGE_VL: document node accordingly

frasercrmck marked 6 inline comments as done.Jan 21 2022, 7:09 AM

frasercrmck added inline comments.

llvm/lib/Target/RISCV/RISCVISelLowering.h
254	Done.
256	`VP_MERGE_VL` it is.
llvm/lib/Target/RISCV/RISCVInstrInfoVPseudos.td
1086	Perfect yeah, thanks! Only thing is I'm not really sure what to call `VPseudoTiedBinaryCarryIn`. Maybe it's fine as it is.

frasercrmck mentioned this in D117647: [RISCV] Add passthru operand for RVV nomask load intrinsics..Jan 21 2022, 7:17 AM

Harbormaster completed remote builds in B144824: Diff 401976.Jan 21 2022, 7:50 AM

LGTM

This revision is now accepted and ready to land.Jan 21 2022, 11:01 AM

Closed by commit rGaf773a18181d: [RISCV][VP] Lower VP_MERGE to RVV instructions (authored by frasercrmck). · Explain WhyJan 24 2022, 3:15 AM

This revision was automatically updated to reflect the committed changes.

frasercrmck marked 3 inline comments as done.

frasercrmck added a commit: rGaf773a18181d: [RISCV][VP] Lower VP_MERGE to RVV instructions.

Herald added a subscriber: • pcwang-thead. · View Herald TranscriptJan 24 2022, 3:15 AM

Revision Contents

Path

Size

llvm/

lib/

Target/

RISCV/

RISCVISelLowering.h

4 lines

RISCVISelLowering.cpp

8 lines

RISCVInstrInfoVPseudos.td

75 lines

RISCVInstrInfoVVLPatterns.td

64 lines

test/

CodeGen/

RISCV/

rvv/

fixed-vectors-vpmerge.ll

953 lines

vpmerge-sdnode.ll

1280 lines

Diff 402444

llvm/lib/Target/RISCV/RISCVISelLowering.h

Show First 20 Lines • Show All 245 Lines • ▼ Show 20 Lines	enum NodeType : unsigned {
VWMUL_VL,		VWMUL_VL,
VWMULU_VL,		VWMULU_VL,
VWADDU_VL,		VWADDU_VL,

// Vector compare producing a mask. Fourth operand is input mask. Fifth		// Vector compare producing a mask. Fourth operand is input mask. Fifth
// operand is VL.		// operand is VL.
SETCC_VL,		SETCC_VL,

// Vector select with an additional VL operand. This operation is unmasked.		// Vector select with an additional VL operand. This operation is unmasked.
		craig.topperUnsubmitted Done Reply Inline Actions Say which operand is tied craig.topper: Say which operand is tied
		frasercrmckAuthorUnsubmitted Done Reply Inline Actions Done. frasercrmck: Done.
VSELECT_VL,		VSELECT_VL,
		// Vector select with operand #2 (the value when the condition is false) tied
		craig.topperUnsubmitted Done Reply Inline Actions This is an unfortunate name collision with the RVV instruction. While also having weird constraints. Maybe VPMERGE_VL or VP_MERGE_VL would be slightly better? craig.topper: This is an unfortunate name collision with the RVV instruction. While also having weird…
		frasercrmckAuthorUnsubmitted Done Reply Inline Actions Yeah totally. I also considered making `VSELECT_VL` take a merge operand which means we can share a node for vp.merge, vp.select and vselect. I don't know if that's too intrusive into areas where a merge operand doesn't make sense, though. We'd probably need a policy operand, too... What do you think? frasercrmck: Yeah totally. I also considered making `VSELECT_VL` take a merge operand which means we can…
		craig.topperUnsubmitted Done Reply Inline Actions I think its ok to keep them separate for now. craig.topper: I think its ok to keep them separate for now.
		frasercrmckAuthorUnsubmitted Done Reply Inline Actions `VP_MERGE_VL` it is. frasercrmck: `VP_MERGE_VL` it is.
		// to the destination and an additional VL operand. This operation is
		// unmasked.
		VP_MERGE_VL,

// Mask binary operators.		// Mask binary operators.
VMAND_VL,		VMAND_VL,
VMOR_VL,		VMOR_VL,
VMXOR_VL,		VMXOR_VL,

// Set mask vector to all zeros or ones.		// Set mask vector to all zeros or ones.
VMCLR_VL,		VMCLR_VL,
▲ Show 20 Lines • Show All 431 Lines • Show Last 20 Lines

llvm/lib/Target/RISCV/RISCVISelLowering.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 515 Lines • ▼ Show 20 Lines	if (Subtarget.hasVInstructions()) {
static const unsigned IntegerVPOps[] = {		static const unsigned IntegerVPOps[] = {
ISD::VP_ADD, ISD::VP_SUB, ISD::VP_MUL,		ISD::VP_ADD, ISD::VP_SUB, ISD::VP_MUL,
ISD::VP_SDIV, ISD::VP_UDIV, ISD::VP_SREM,		ISD::VP_SDIV, ISD::VP_UDIV, ISD::VP_SREM,
ISD::VP_UREM, ISD::VP_AND, ISD::VP_OR,		ISD::VP_UREM, ISD::VP_AND, ISD::VP_OR,
ISD::VP_XOR, ISD::VP_ASHR, ISD::VP_LSHR,		ISD::VP_XOR, ISD::VP_ASHR, ISD::VP_LSHR,
ISD::VP_SHL, ISD::VP_REDUCE_ADD, ISD::VP_REDUCE_AND,		ISD::VP_SHL, ISD::VP_REDUCE_ADD, ISD::VP_REDUCE_AND,
ISD::VP_REDUCE_OR, ISD::VP_REDUCE_XOR, ISD::VP_REDUCE_SMAX,		ISD::VP_REDUCE_OR, ISD::VP_REDUCE_XOR, ISD::VP_REDUCE_SMAX,
ISD::VP_REDUCE_SMIN, ISD::VP_REDUCE_UMAX, ISD::VP_REDUCE_UMIN,		ISD::VP_REDUCE_SMIN, ISD::VP_REDUCE_UMAX, ISD::VP_REDUCE_UMIN,
ISD::VP_SELECT};		ISD::VP_MERGE, ISD::VP_SELECT};

static const unsigned FloatingPointVPOps[] = {		static const unsigned FloatingPointVPOps[] = {
ISD::VP_FADD, ISD::VP_FSUB, ISD::VP_FMUL,		ISD::VP_FADD, ISD::VP_FSUB, ISD::VP_FMUL,
ISD::VP_FDIV, ISD::VP_REDUCE_FADD, ISD::VP_REDUCE_SEQ_FADD,		ISD::VP_FDIV, ISD::VP_REDUCE_FADD, ISD::VP_REDUCE_SEQ_FADD,
ISD::VP_REDUCE_FMIN, ISD::VP_REDUCE_FMAX, ISD::VP_SELECT};		ISD::VP_REDUCE_FMIN, ISD::VP_REDUCE_FMAX, ISD::VP_MERGE,
		ISD::VP_SELECT};

if (!Subtarget.is64Bit()) {		if (!Subtarget.is64Bit()) {
// We must custom-lower certain vXi64 operations on RV32 due to the vector		// We must custom-lower certain vXi64 operations on RV32 due to the vector
// element type being illegal.		// element type being illegal.
setOperationAction(ISD::INSERT_VECTOR_ELT, MVT::i64, Custom);		setOperationAction(ISD::INSERT_VECTOR_ELT, MVT::i64, Custom);
setOperationAction(ISD::EXTRACT_VECTOR_ELT, MVT::i64, Custom);		setOperationAction(ISD::EXTRACT_VECTOR_ELT, MVT::i64, Custom);

setOperationAction(ISD::VECREDUCE_ADD, MVT::i64, Custom);		setOperationAction(ISD::VECREDUCE_ADD, MVT::i64, Custom);
▲ Show 20 Lines • Show All 2,898 Lines • ▼ Show 20 Lines	SDValue RISCVTargetLowering::LowerOperation(SDValue Op,
case ISD::VP_SCATTER:		case ISD::VP_SCATTER:
return lowerMaskedScatter(Op, DAG);		return lowerMaskedScatter(Op, DAG);
case ISD::FLT_ROUNDS_:		case ISD::FLT_ROUNDS_:
return lowerGET_ROUNDING(Op, DAG);		return lowerGET_ROUNDING(Op, DAG);
case ISD::SET_ROUNDING:		case ISD::SET_ROUNDING:
return lowerSET_ROUNDING(Op, DAG);		return lowerSET_ROUNDING(Op, DAG);
case ISD::VP_SELECT:		case ISD::VP_SELECT:
return lowerVPOp(Op, DAG, RISCVISD::VSELECT_VL);		return lowerVPOp(Op, DAG, RISCVISD::VSELECT_VL);
		case ISD::VP_MERGE:
		return lowerVPOp(Op, DAG, RISCVISD::VP_MERGE_VL);
case ISD::VP_ADD:		case ISD::VP_ADD:
return lowerVPOp(Op, DAG, RISCVISD::ADD_VL);		return lowerVPOp(Op, DAG, RISCVISD::ADD_VL);
case ISD::VP_SUB:		case ISD::VP_SUB:
return lowerVPOp(Op, DAG, RISCVISD::SUB_VL);		return lowerVPOp(Op, DAG, RISCVISD::SUB_VL);
case ISD::VP_MUL:		case ISD::VP_MUL:
return lowerVPOp(Op, DAG, RISCVISD::MUL_VL);		return lowerVPOp(Op, DAG, RISCVISD::MUL_VL);
case ISD::VP_SDIV:		case ISD::VP_SDIV:
return lowerVPOp(Op, DAG, RISCVISD::SDIV_VL);		return lowerVPOp(Op, DAG, RISCVISD::SDIV_VL);
▲ Show 20 Lines • Show All 6,630 Lines • ▼ Show 20 Lines	#define NODE_NAME_CASE(NODE) \
NODE_NAME_CASE(UINT_TO_FP_VL)		NODE_NAME_CASE(UINT_TO_FP_VL)
NODE_NAME_CASE(FP_EXTEND_VL)		NODE_NAME_CASE(FP_EXTEND_VL)
NODE_NAME_CASE(FP_ROUND_VL)		NODE_NAME_CASE(FP_ROUND_VL)
NODE_NAME_CASE(VWMUL_VL)		NODE_NAME_CASE(VWMUL_VL)
NODE_NAME_CASE(VWMULU_VL)		NODE_NAME_CASE(VWMULU_VL)
NODE_NAME_CASE(VWADDU_VL)		NODE_NAME_CASE(VWADDU_VL)
NODE_NAME_CASE(SETCC_VL)		NODE_NAME_CASE(SETCC_VL)
NODE_NAME_CASE(VSELECT_VL)		NODE_NAME_CASE(VSELECT_VL)
		NODE_NAME_CASE(VP_MERGE_VL)
NODE_NAME_CASE(VMAND_VL)		NODE_NAME_CASE(VMAND_VL)
NODE_NAME_CASE(VMOR_VL)		NODE_NAME_CASE(VMOR_VL)
NODE_NAME_CASE(VMXOR_VL)		NODE_NAME_CASE(VMXOR_VL)
NODE_NAME_CASE(VMCLR_VL)		NODE_NAME_CASE(VMCLR_VL)
NODE_NAME_CASE(VMSET_VL)		NODE_NAME_CASE(VMSET_VL)
NODE_NAME_CASE(VRGATHER_VX_VL)		NODE_NAME_CASE(VRGATHER_VX_VL)
NODE_NAME_CASE(VRGATHER_VV_VL)		NODE_NAME_CASE(VRGATHER_VV_VL)
NODE_NAME_CASE(VRGATHEREI16_VV_VL)		NODE_NAME_CASE(VRGATHEREI16_VV_VL)
▲ Show 20 Lines • Show All 791 Lines • Show Last 20 Lines

llvm/lib/Target/RISCV/RISCVInstrInfoVPseudos.td

Show First 20 Lines • Show All 573 Lines • ▼ Show 20 Lines	string VInst = !subst("_M8", "",
!subst("_B2", "",		!subst("_B2", "",
!subst("_B4", "",		!subst("_B4", "",
!subst("_B8", "",		!subst("_B8", "",
!subst("_B16", "",		!subst("_B16", "",
!subst("_B32", "",		!subst("_B32", "",
!subst("_B64", "",		!subst("_B64", "",
!subst("_MASK", "",		!subst("_MASK", "",
!subst("_TIED", "",		!subst("_TIED", "",
		!subst("_TU", "",
!subst("F16", "F",		!subst("F16", "F",
!subst("F32", "F",		!subst("F32", "F",
!subst("F64", "F",		!subst("F64", "F",
!subst("Pseudo", "", PseudoInst))))))))))))))))))));		!subst("Pseudo", "", PseudoInst)))))))))))))))))))));
}		}

// The destination vector register group for a masked vector instruction cannot		// The destination vector register group for a masked vector instruction cannot
// overlap the source mask register (v0), unless the destination vector register		// overlap the source mask register (v0), unless the destination vector register
// is being written with a mask value (e.g., comparisons) or the scalar result		// is being written with a mask value (e.g., comparisons) or the scalar result
// of a reduction.		// of a reduction.
class GetVRegNoV0<VReg VRegClass> {		class GetVRegNoV0<VReg VRegClass> {
VReg R = !cond(!eq(VRegClass, VR) : VRNoV0,		VReg R = !cond(!eq(VRegClass, VR) : VRNoV0,
▲ Show 20 Lines • Show All 329 Lines • ▼ Show 20 Lines	class VPseudoBinaryNoMask<VReg RetClass,
let hasSideEffects = 0;		let hasSideEffects = 0;
let Constraints = Constraint;		let Constraints = Constraint;
let HasVLOp = 1;		let HasVLOp = 1;
let HasSEWOp = 1;		let HasSEWOp = 1;
let HasDummyMask = 1;		let HasDummyMask = 1;
let BaseInstr = !cast<Instruction>(PseudoToVInst<NAME>.VInst);		let BaseInstr = !cast<Instruction>(PseudoToVInst<NAME>.VInst);
}		}

		// Special version of VPseudoBinaryNoMask where we pretend the first source is
		// tied to the destination.
		// This allows maskedoff and rs2 to be the same register.
class VPseudoTiedBinaryNoMask<VReg RetClass,		class VPseudoTiedBinaryNoMask<VReg RetClass,
DAGOperand Op2Class,		DAGOperand Op2Class,
string Constraint> :		string Constraint> :
Pseudo<(outs RetClass:$rd),		Pseudo<(outs RetClass:$rd),
(ins RetClass:$rs2, Op2Class:$rs1, AVL:$vl, ixlenimm:$sew), []>,		(ins RetClass:$rs2, Op2Class:$rs1, AVL:$vl, ixlenimm:$sew), []>,
RISCVVPseudo {		RISCVVPseudo {
let mayLoad = 0;		let mayLoad = 0;
let mayStore = 0;		let mayStore = 0;
▲ Show 20 Lines • Show All 135 Lines • ▼ Show 20 Lines	class VPseudoBinaryCarryIn<VReg RetClass,
let Constraints = Constraint;		let Constraints = Constraint;
let HasVLOp = 1;		let HasVLOp = 1;
let HasSEWOp = 1;		let HasSEWOp = 1;
let HasMergeOp = 0;		let HasMergeOp = 0;
let BaseInstr = !cast<Instruction>(PseudoToVInst<NAME>.VInst);		let BaseInstr = !cast<Instruction>(PseudoToVInst<NAME>.VInst);
let VLMul = MInfo.value;		let VLMul = MInfo.value;
}		}

		class VPseudoTiedBinaryCarryIn<VReg RetClass,
		craig.topperUnsubmitted Done Reply Inline Actions Does it really need to tied or can we have a _TU instruction and pass the false value to two operands in the pattern match? craig.topper: Does it really need to tied or can we have a _TU instruction and pass the false value to two…
		craig.topperUnsubmitted Done Reply Inline Actions Let me rephrase that. We obviously need an operand that is tied. But it doesn't need to be the same as $rs2. We can assign $rs2 and the merge operand to the same src in the pattern. But I guess we don't have the concept of _TU instructions until https://reviews.llvm.org/D117647 craig.topper: Let me rephrase that. We obviously need an operand that is tied. But it doesn't need to be the…
		frasercrmckAuthorUnsubmitted Done Reply Inline Actions Yeah that would work too. Are we really dependent on that patch or can we have a `HasMergeOp = 1` in conjunction `HasVecPolicyOp = 1` where we pass along `TAIL_UNDISTURBED`? Or is it then that we don't really have a suffix to convey that: `_TIED` isn't quite right and `_MASK` isn't either since `vmerge` isn't "masked", in that sense? frasercrmck: Yeah that would work too. Are we really dependent on that patch or can we have a `HasMergeOp =…
		craig.topperUnsubmitted Done Reply Inline Actions I think you can use `_TU` and take the change PseudoToVInst from D117647 Add the extra tied source operand and use `HasMergeOp = 1` and `HasVecPolicyOp = 0`. We don't need a policy op since the tied source being undef can distinquish tail undisturbed vs agnostic. craig.topper: I think you can use `_TU` and take the change PseudoToVInst from D117647 Add the extra tied…
		frasercrmckAuthorUnsubmitted Done Reply Inline Actions Perfect yeah, thanks! Only thing is I'm not really sure what to call `VPseudoTiedBinaryCarryIn`. Maybe it's fine as it is. frasercrmck: Perfect yeah, thanks! Only thing is I'm not really sure what to call `VPseudoTiedBinaryCarryIn`.
		VReg Op1Class,
		DAGOperand Op2Class,
		LMULInfo MInfo,
		bit CarryIn,
		string Constraint> :
		Pseudo<(outs RetClass:$rd),
		!if(CarryIn,
		(ins RetClass:$merge, Op1Class:$rs2, Op2Class:$rs1, VMV0:$carry, AVL:$vl,
		ixlenimm:$sew),
		(ins RetClass:$merge, Op1Class:$rs2, Op2Class:$rs1, AVL:$vl, ixlenimm:$sew)), []>,
		RISCVVPseudo {
		let mayLoad = 0;
		let mayStore = 0;
		let hasSideEffects = 0;
		let Constraints = Join<[Constraint, "$rd = $merge"], ",">.ret;
		let HasVLOp = 1;
		let HasSEWOp = 1;
		let HasMergeOp = 1;
		let HasVecPolicyOp = 0;
		let BaseInstr = !cast<Instruction>(PseudoToVInst<NAME>.VInst);
		let VLMul = MInfo.value;
		}

class VPseudoTernaryNoMask<VReg RetClass,		class VPseudoTernaryNoMask<VReg RetClass,
RegisterClass Op1Class,		RegisterClass Op1Class,
DAGOperand Op2Class,		DAGOperand Op2Class,
string Constraint> :		string Constraint> :
Pseudo<(outs RetClass:$rd),		Pseudo<(outs RetClass:$rd),
(ins RetClass:$rs3, Op1Class:$rs1, Op2Class:$rs2,		(ins RetClass:$rs3, Op1Class:$rs1, Op2Class:$rs2,
AVL:$vl, ixlenimm:$sew),		AVL:$vl, ixlenimm:$sew),
[]>,		[]>,
▲ Show 20 Lines • Show All 646 Lines • ▼ Show 20 Lines	multiclass VPseudoBinaryV_VM<bit CarryOut = 0, bit CarryIn = 1,
foreach m = MxList in		foreach m = MxList in
def "_VV" # !if(CarryIn, "M", "") # "_" # m.MX :		def "_VV" # !if(CarryIn, "M", "") # "_" # m.MX :
VPseudoBinaryCarryIn<!if(CarryOut, VR,		VPseudoBinaryCarryIn<!if(CarryOut, VR,
!if(!and(CarryIn, !not(CarryOut)),		!if(!and(CarryIn, !not(CarryOut)),
GetVRegNoV0<m.vrclass>.R, m.vrclass)),		GetVRegNoV0<m.vrclass>.R, m.vrclass)),
m.vrclass, m.vrclass, m, CarryIn, Constraint>;		m.vrclass, m.vrclass, m, CarryIn, Constraint>;
}		}

		multiclass VPseudoTiedBinaryV_VM<bit CarryOut = 0, bit CarryIn = 1,
		string Constraint = ""> {
		foreach m = MxList in
		def "_VV" # !if(CarryIn, "M", "") # "_" # m.MX # "_TU" :
		VPseudoTiedBinaryCarryIn<!if(CarryOut, VR,
		!if(!and(CarryIn, !not(CarryOut)),
		GetVRegNoV0<m.vrclass>.R, m.vrclass)),
		m.vrclass, m.vrclass, m, CarryIn, Constraint>;
		}

multiclass VPseudoBinaryV_XM<bit CarryOut = 0, bit CarryIn = 1,		multiclass VPseudoBinaryV_XM<bit CarryOut = 0, bit CarryIn = 1,
string Constraint = ""> {		string Constraint = ""> {
foreach m = MxList in		foreach m = MxList in
def "_VX" # !if(CarryIn, "M", "") # "_" # m.MX :		def "_VX" # !if(CarryIn, "M", "") # "_" # m.MX :
VPseudoBinaryCarryIn<!if(CarryOut, VR,		VPseudoBinaryCarryIn<!if(CarryOut, VR,
!if(!and(CarryIn, !not(CarryOut)),		!if(!and(CarryIn, !not(CarryOut)),
GetVRegNoV0<m.vrclass>.R, m.vrclass)),		GetVRegNoV0<m.vrclass>.R, m.vrclass)),
m.vrclass, GPR, m, CarryIn, Constraint>;		m.vrclass, GPR, m, CarryIn, Constraint>;
}		}

		multiclass VPseudoTiedBinaryV_XM<bit CarryOut = 0, bit CarryIn = 1,
		string Constraint = ""> {
		foreach m = MxList in
		def "_VX" # !if(CarryIn, "M", "") # "_" # m.MX # "_TU":
		VPseudoTiedBinaryCarryIn<!if(CarryOut, VR,
		!if(!and(CarryIn, !not(CarryOut)),
		GetVRegNoV0<m.vrclass>.R, m.vrclass)),
		m.vrclass, GPR, m, CarryIn, Constraint>;
		}

multiclass VPseudoVMRG_FM {		multiclass VPseudoVMRG_FM {
foreach f = FPList in		foreach f = FPList in
foreach m = f.MxList in		foreach m = f.MxList in {
def "_V" # f.FX # "M_" # m.MX :		def "_V" # f.FX # "M_" # m.MX :
VPseudoBinaryCarryIn<GetVRegNoV0<m.vrclass>.R,		VPseudoBinaryCarryIn<GetVRegNoV0<m.vrclass>.R,
m.vrclass, f.fprclass, m, /CarryIn=/1, "">,		m.vrclass, f.fprclass, m, /CarryIn=/1, "">,
Sched<[WriteVFMergeV, ReadVFMergeV, ReadVFMergeF, ReadVMask]>;		Sched<[WriteVFMergeV, ReadVFMergeV, ReadVFMergeF, ReadVMask]>;
		// Tied version to allow codegen control over the tail elements
		def "_V" # f.FX # "M_" # m.MX # "_TU":
		VPseudoTiedBinaryCarryIn<GetVRegNoV0<m.vrclass>.R,
		m.vrclass, f.fprclass, m, /CarryIn=/1, "">,
		Sched<[WriteVFMergeV, ReadVFMergeV, ReadVFMergeF, ReadVMask]>;
		}
}		}

multiclass VPseudoBinaryV_IM<bit CarryOut = 0, bit CarryIn = 1,		multiclass VPseudoBinaryV_IM<bit CarryOut = 0, bit CarryIn = 1,
string Constraint = ""> {		string Constraint = ""> {
foreach m = MxList in		foreach m = MxList in
def "_VI" # !if(CarryIn, "M", "") # "_" # m.MX :		def "_VI" # !if(CarryIn, "M", "") # "_" # m.MX :
VPseudoBinaryCarryIn<!if(CarryOut, VR,		VPseudoBinaryCarryIn<!if(CarryOut, VR,
!if(!and(CarryIn, !not(CarryOut)),		!if(!and(CarryIn, !not(CarryOut)),
GetVRegNoV0<m.vrclass>.R, m.vrclass)),		GetVRegNoV0<m.vrclass>.R, m.vrclass)),
m.vrclass, simm5, m, CarryIn, Constraint>;		m.vrclass, simm5, m, CarryIn, Constraint>;
}		}

		multiclass VPseudoTiedBinaryV_IM<bit CarryOut = 0, bit CarryIn = 1,
		string Constraint = ""> {
		foreach m = MxList in
		def "_VI" # !if(CarryIn, "M", "") # "_" # m.MX # "_TU":
		VPseudoTiedBinaryCarryIn<!if(CarryOut, VR,
		!if(!and(CarryIn, !not(CarryOut)),
		GetVRegNoV0<m.vrclass>.R, m.vrclass)),
		m.vrclass, simm5, m, CarryIn, Constraint>;
		}

multiclass VPseudoUnaryVMV_V_X_I {		multiclass VPseudoUnaryVMV_V_X_I {
foreach m = MxList in {		foreach m = MxList in {
let VLMul = m.value in {		let VLMul = m.value in {
def "_V_" # m.MX : VPseudoUnaryNoDummyMask<m.vrclass, m.vrclass>,		def "_V_" # m.MX : VPseudoUnaryNoDummyMask<m.vrclass, m.vrclass>,
Sched<[WriteVIMovV, ReadVIMovV]>;		Sched<[WriteVIMovV, ReadVIMovV]>;
def "_X_" # m.MX : VPseudoUnaryNoDummyMask<m.vrclass, GPR>,		def "_X_" # m.MX : VPseudoUnaryNoDummyMask<m.vrclass, GPR>,
Sched<[WriteVIMovX, ReadVIMovX]>;		Sched<[WriteVIMovX, ReadVIMovX]>;
def "_I_" # m.MX : VPseudoUnaryNoDummyMask<m.vrclass, simm5>,		def "_I_" # m.MX : VPseudoUnaryNoDummyMask<m.vrclass, simm5>,
▲ Show 20 Lines • Show All 318 Lines • ▼ Show 20 Lines

multiclass VPseudoVMRG_VM_XM_IM {		multiclass VPseudoVMRG_VM_XM_IM {
defm "" : VPseudoBinaryV_VM,		defm "" : VPseudoBinaryV_VM,
Sched<[WriteVIMergeV, ReadVIMergeV, ReadVIMergeV, ReadVMask]>;		Sched<[WriteVIMergeV, ReadVIMergeV, ReadVIMergeV, ReadVMask]>;
defm "" : VPseudoBinaryV_XM,		defm "" : VPseudoBinaryV_XM,
Sched<[WriteVIMergeX, ReadVIMergeV, ReadVIMergeX, ReadVMask]>;		Sched<[WriteVIMergeX, ReadVIMergeV, ReadVIMergeX, ReadVMask]>;
defm "" : VPseudoBinaryV_IM,		defm "" : VPseudoBinaryV_IM,
Sched<[WriteVIMergeI, ReadVIMergeV, ReadVMask]>;		Sched<[WriteVIMergeI, ReadVIMergeV, ReadVMask]>;
		// Tied versions to allow codegen control over the tail elements
		defm "" : VPseudoTiedBinaryV_VM,
		Sched<[WriteVIMergeV, ReadVIMergeV, ReadVIMergeV, ReadVMask]>;
		defm "" : VPseudoTiedBinaryV_XM,
		Sched<[WriteVIMergeX, ReadVIMergeV, ReadVIMergeX, ReadVMask]>;
		defm "" : VPseudoTiedBinaryV_IM,
		Sched<[WriteVIMergeI, ReadVIMergeV, ReadVMask]>;
}		}

multiclass VPseudoVCALU_VM_XM_IM {		multiclass VPseudoVCALU_VM_XM_IM {
defm "" : VPseudoBinaryV_VM,		defm "" : VPseudoBinaryV_VM,
Sched<[WriteVICALUV, ReadVIALUCV, ReadVIALUCV, ReadVMask]>;		Sched<[WriteVICALUV, ReadVIALUCV, ReadVIALUCV, ReadVMask]>;
defm "" : VPseudoBinaryV_XM,		defm "" : VPseudoBinaryV_XM,
Sched<[WriteVICALUX, ReadVIALUCV, ReadVIALUCX, ReadVMask]>;		Sched<[WriteVICALUX, ReadVIALUCV, ReadVIALUCX, ReadVMask]>;
defm "" : VPseudoBinaryV_IM,		defm "" : VPseudoBinaryV_IM,
▲ Show 20 Lines • Show All 2,824 Lines • Show Last 20 Lines

llvm/lib/Target/RISCV/RISCVInstrInfoVVLPatterns.td

Show First 20 Lines • Show All 171 Lines • ▼ Show 20 Lines	def riscv_vrgatherei16_vv_vl : SDNode<"RISCVISD::VRGATHEREI16_VV_VL",
SDTCisSameAs<0, 1>,		SDTCisSameAs<0, 1>,
SDTCisInt<2>,		SDTCisInt<2>,
SDTCVecEltisVT<2, i16>,		SDTCVecEltisVT<2, i16>,
SDTCisSameNumEltsAs<0, 2>,		SDTCisSameNumEltsAs<0, 2>,
SDTCVecEltisVT<3, i1>,		SDTCVecEltisVT<3, i1>,
SDTCisSameNumEltsAs<0, 3>,		SDTCisSameNumEltsAs<0, 3>,
SDTCisVT<4, XLenVT>]>>;		SDTCisVT<4, XLenVT>]>>;

def riscv_vselect_vl : SDNode<"RISCVISD::VSELECT_VL",		def SDT_RISCVSelect_VL : SDTypeProfile<1, 4, [
SDTypeProfile<1, 4, [SDTCisVec<0>,		SDTCisVec<0>, SDTCisVec<1>, SDTCisSameNumEltsAs<0, 1>, SDTCVecEltisVT<1, i1>,
SDTCisVec<1>,		SDTCisSameAs<0, 2>, SDTCisSameAs<2, 3>, SDTCisVT<4, XLenVT>
SDTCisSameNumEltsAs<0, 1>,		]>;
SDTCVecEltisVT<1, i1>,
SDTCisSameAs<0, 2>,		def riscv_vselect_vl : SDNode<"RISCVISD::VSELECT_VL", SDT_RISCVSelect_VL>;
SDTCisSameAs<2, 3>,		def riscv_vp_merge_vl : SDNode<"RISCVISD::VP_MERGE_VL", SDT_RISCVSelect_VL>;
SDTCisVT<4, XLenVT>]>>;

def SDT_RISCVMaskBinOp_VL : SDTypeProfile<1, 3, [SDTCisSameAs<0, 1>,		def SDT_RISCVMaskBinOp_VL : SDTypeProfile<1, 3, [SDTCisSameAs<0, 1>,
SDTCisSameAs<0, 2>,		SDTCisSameAs<0, 2>,
SDTCVecEltisVT<0, i1>,		SDTCVecEltisVT<0, i1>,
SDTCisVT<3, XLenVT>]>;		SDTCisVT<3, XLenVT>]>;
def riscv_vmand_vl : SDNode<"RISCVISD::VMAND_VL", SDT_RISCVMaskBinOp_VL, [SDNPCommutative]>;		def riscv_vmand_vl : SDNode<"RISCVISD::VMAND_VL", SDT_RISCVMaskBinOp_VL, [SDNPCommutative]>;
def riscv_vmor_vl : SDNode<"RISCVISD::VMOR_VL", SDT_RISCVMaskBinOp_VL, [SDNPCommutative]>;		def riscv_vmor_vl : SDNode<"RISCVISD::VMOR_VL", SDT_RISCVMaskBinOp_VL, [SDNPCommutative]>;
def riscv_vmxor_vl : SDNode<"RISCVISD::VMXOR_VL", SDT_RISCVMaskBinOp_VL, [SDNPCommutative]>;		def riscv_vmxor_vl : SDNode<"RISCVISD::VMXOR_VL", SDT_RISCVMaskBinOp_VL, [SDNPCommutative]>;
▲ Show 20 Lines • Show All 775 Lines • ▼ Show 20 Lines	def : Pat<(vti.Vector (riscv_vselect_vl (vti.Mask V0),
vti.RegClass:$rs2, GPR:$rs1, (vti.Mask V0), GPR:$vl, vti.Log2SEW)>;		vti.RegClass:$rs2, GPR:$rs1, (vti.Mask V0), GPR:$vl, vti.Log2SEW)>;

def : Pat<(vti.Vector (riscv_vselect_vl (vti.Mask V0),		def : Pat<(vti.Vector (riscv_vselect_vl (vti.Mask V0),
(SplatPat_simm5 simm5:$rs1),		(SplatPat_simm5 simm5:$rs1),
vti.RegClass:$rs2,		vti.RegClass:$rs2,
VLOpFrag)),		VLOpFrag)),
(!cast<Instruction>("PseudoVMERGE_VIM_"#vti.LMul.MX)		(!cast<Instruction>("PseudoVMERGE_VIM_"#vti.LMul.MX)
vti.RegClass:$rs2, simm5:$rs1, (vti.Mask V0), GPR:$vl, vti.Log2SEW)>;		vti.RegClass:$rs2, simm5:$rs1, (vti.Mask V0), GPR:$vl, vti.Log2SEW)>;

		def : Pat<(vti.Vector (riscv_vp_merge_vl (vti.Mask V0),
		vti.RegClass:$rs1,
		vti.RegClass:$rs2,
		VLOpFrag)),
		(!cast<Instruction>("PseudoVMERGE_VVM_"#vti.LMul.MX#"_TU")
		vti.RegClass:$rs2, vti.RegClass:$rs2, vti.RegClass:$rs1,
		(vti.Mask V0), GPR:$vl, vti.Log2SEW)>;

		def : Pat<(vti.Vector (riscv_vp_merge_vl (vti.Mask V0),
		(SplatPat XLenVT:$rs1),
		vti.RegClass:$rs2,
		VLOpFrag)),
		(!cast<Instruction>("PseudoVMERGE_VXM_"#vti.LMul.MX#"_TU")
		vti.RegClass:$rs2, vti.RegClass:$rs2, GPR:$rs1,
		(vti.Mask V0), GPR:$vl, vti.Log2SEW)>;

		def : Pat<(vti.Vector (riscv_vp_merge_vl (vti.Mask V0),
		(SplatPat_simm5 simm5:$rs1),
		vti.RegClass:$rs2,
		VLOpFrag)),
		(!cast<Instruction>("PseudoVMERGE_VIM_"#vti.LMul.MX#"_TU")
		vti.RegClass:$rs2, vti.RegClass:$rs2, simm5:$rs1,
		(vti.Mask V0), GPR:$vl, vti.Log2SEW)>;
}		}

// 12.16. Vector Integer Move Instructions		// 12.16. Vector Integer Move Instructions
foreach vti = AllIntegerVectors in {		foreach vti = AllIntegerVectors in {
def : Pat<(vti.Vector (riscv_vmv_v_x_vl GPR:$rs2, VLOpFrag)),		def : Pat<(vti.Vector (riscv_vmv_v_x_vl GPR:$rs2, VLOpFrag)),
(!cast<Instruction>("PseudoVMV_V_X_"#vti.LMul.MX)		(!cast<Instruction>("PseudoVMV_V_X_"#vti.LMul.MX)
$rs2, GPR:$vl, vti.Log2SEW)>;		$rs2, GPR:$vl, vti.Log2SEW)>;
defvar ImmPat = !cast<ComplexPattern>("sew"#vti.SEW#"simm5");		defvar ImmPat = !cast<ComplexPattern>("sew"#vti.SEW#"simm5");
▲ Show 20 Lines • Show All 231 Lines • ▼ Show 20 Lines	foreach fvti = AllFloatVectors in {

def : Pat<(fvti.Vector (riscv_vselect_vl (fvti.Mask V0),		def : Pat<(fvti.Vector (riscv_vselect_vl (fvti.Mask V0),
(SplatFPOp (fvti.Scalar fpimm0)),		(SplatFPOp (fvti.Scalar fpimm0)),
fvti.RegClass:$rs2,		fvti.RegClass:$rs2,
VLOpFrag)),		VLOpFrag)),
(!cast<Instruction>("PseudoVMERGE_VIM_"#fvti.LMul.MX)		(!cast<Instruction>("PseudoVMERGE_VIM_"#fvti.LMul.MX)
fvti.RegClass:$rs2, 0, (fvti.Mask V0), GPR:$vl, fvti.Log2SEW)>;		fvti.RegClass:$rs2, 0, (fvti.Mask V0), GPR:$vl, fvti.Log2SEW)>;

		def : Pat<(fvti.Vector (riscv_vp_merge_vl (fvti.Mask V0),
		fvti.RegClass:$rs1,
		fvti.RegClass:$rs2,
		VLOpFrag)),
		(!cast<Instruction>("PseudoVMERGE_VVM_"#fvti.LMul.MX#"_TU")
		fvti.RegClass:$rs2, fvti.RegClass:$rs2, fvti.RegClass:$rs1, (fvti.Mask V0),
		GPR:$vl, fvti.Log2SEW)>;

		def : Pat<(fvti.Vector (riscv_vp_merge_vl (fvti.Mask V0),
		(SplatFPOp fvti.ScalarRegClass:$rs1),
		fvti.RegClass:$rs2,
		VLOpFrag)),
		(!cast<Instruction>("PseudoVFMERGE_V"#fvti.ScalarSuffix#"M_"#fvti.LMul.MX#"_TU")
		fvti.RegClass:$rs2, fvti.RegClass:$rs2,
		(fvti.Scalar fvti.ScalarRegClass:$rs1),
		(fvti.Mask V0), GPR:$vl, fvti.Log2SEW)>;

		def : Pat<(fvti.Vector (riscv_vp_merge_vl (fvti.Mask V0),
		(SplatFPOp (fvti.Scalar fpimm0)),
		fvti.RegClass:$rs2,
		VLOpFrag)),
		(!cast<Instruction>("PseudoVMERGE_VIM_"#fvti.LMul.MX#"_TU")
		fvti.RegClass:$rs2, fvti.RegClass:$rs2, 0, (fvti.Mask V0),
		GPR:$vl, fvti.Log2SEW)>;

// 14.16. Vector Floating-Point Move Instruction		// 14.16. Vector Floating-Point Move Instruction
// If we're splatting fpimm0, use vmv.v.x vd, x0.		// If we're splatting fpimm0, use vmv.v.x vd, x0.
def : Pat<(fvti.Vector (riscv_vfmv_v_f_vl		def : Pat<(fvti.Vector (riscv_vfmv_v_f_vl
(fvti.Scalar (fpimm0)), VLOpFrag)),		(fvti.Scalar (fpimm0)), VLOpFrag)),
(!cast<Instruction>("PseudoVMV_V_I_"#fvti.LMul.MX)		(!cast<Instruction>("PseudoVMV_V_I_"#fvti.LMul.MX)
0, GPR:$vl, fvti.Log2SEW)>;		0, GPR:$vl, fvti.Log2SEW)>;

def : Pat<(fvti.Vector (riscv_vfmv_v_f_vl		def : Pat<(fvti.Vector (riscv_vfmv_v_f_vl
▲ Show 20 Lines • Show All 366 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-vpmerge.ll

This file was added.

				; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
				; RUN: llc -mtriple=riscv32 -mattr=+d,+zfh,+v -target-abi=ilp32d -riscv-v-vector-bits-min=128 \
				; RUN: -verify-machineinstrs < %s \| FileCheck %s --check-prefixes=CHECK,RV32
				; RUN: llc -mtriple=riscv64 -mattr=+d,+zfh,+v -target-abi=lp64d -riscv-v-vector-bits-min=128 \
				; RUN: -verify-machineinstrs < %s \| FileCheck %s --check-prefixes=CHECK,RV64

				declare <2 x i8> @llvm.vp.merge.v2i8(<2 x i1>, <2 x i8>, <2 x i8>, i32)

				define <2 x i8> @vpmerge_vv_v2i8(<2 x i8> %va, <2 x i8> %vb, <2 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vv_v2i8:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e8, mf8, tu, mu
				; CHECK-NEXT: vmerge.vvm v9, v9, v8, v0
				; CHECK-NEXT: vmv1r.v v8, v9
				; CHECK-NEXT: ret
				%v = call <2 x i8> @llvm.vp.merge.v2i8(<2 x i1> %m, <2 x i8> %va, <2 x i8> %vb, i32 %evl)
				ret <2 x i8> %v
				}

				define <2 x i8> @vpmerge_vx_v2i8(i8 %a, <2 x i8> %vb, <2 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vx_v2i8:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a1, e8, mf8, tu, mu
				; CHECK-NEXT: vmerge.vxm v8, v8, a0, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <2 x i8> poison, i8 %a, i32 0
				%va = shufflevector <2 x i8> %elt.head, <2 x i8> poison, <2 x i32> zeroinitializer
				%v = call <2 x i8> @llvm.vp.merge.v2i8(<2 x i1> %m, <2 x i8> %va, <2 x i8> %vb, i32 %evl)
				ret <2 x i8> %v
				}

				define <2 x i8> @vpmerge_vi_v2i8(<2 x i8> %vb, <2 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vi_v2i8:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e8, mf8, tu, mu
				; CHECK-NEXT: vmerge.vim v8, v8, 2, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <2 x i8> poison, i8 2, i32 0
				%va = shufflevector <2 x i8> %elt.head, <2 x i8> poison, <2 x i32> zeroinitializer
				%v = call <2 x i8> @llvm.vp.merge.v2i8(<2 x i1> %m, <2 x i8> %va, <2 x i8> %vb, i32 %evl)
				ret <2 x i8> %v
				}

				declare <4 x i8> @llvm.vp.merge.v4i8(<4 x i1>, <4 x i8>, <4 x i8>, i32)

				define <4 x i8> @vpmerge_vv_v4i8(<4 x i8> %va, <4 x i8> %vb, <4 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vv_v4i8:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e8, mf4, tu, mu
				; CHECK-NEXT: vmerge.vvm v9, v9, v8, v0
				; CHECK-NEXT: vmv1r.v v8, v9
				; CHECK-NEXT: ret
				%v = call <4 x i8> @llvm.vp.merge.v4i8(<4 x i1> %m, <4 x i8> %va, <4 x i8> %vb, i32 %evl)
				ret <4 x i8> %v
				}

				define <4 x i8> @vpmerge_vx_v4i8(i8 %a, <4 x i8> %vb, <4 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vx_v4i8:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a1, e8, mf4, tu, mu
				; CHECK-NEXT: vmerge.vxm v8, v8, a0, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <4 x i8> poison, i8 %a, i32 0
				%va = shufflevector <4 x i8> %elt.head, <4 x i8> poison, <4 x i32> zeroinitializer
				%v = call <4 x i8> @llvm.vp.merge.v4i8(<4 x i1> %m, <4 x i8> %va, <4 x i8> %vb, i32 %evl)
				ret <4 x i8> %v
				}

				define <4 x i8> @vpmerge_vi_v4i8(<4 x i8> %vb, <4 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vi_v4i8:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e8, mf4, tu, mu
				; CHECK-NEXT: vmerge.vim v8, v8, 2, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <4 x i8> poison, i8 2, i32 0
				%va = shufflevector <4 x i8> %elt.head, <4 x i8> poison, <4 x i32> zeroinitializer
				%v = call <4 x i8> @llvm.vp.merge.v4i8(<4 x i1> %m, <4 x i8> %va, <4 x i8> %vb, i32 %evl)
				ret <4 x i8> %v
				}

				declare <8 x i8> @llvm.vp.merge.v8i8(<8 x i1>, <8 x i8>, <8 x i8>, i32)

				define <8 x i8> @vpmerge_vv_v8i8(<8 x i8> %va, <8 x i8> %vb, <8 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vv_v8i8:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e8, mf2, tu, mu
				; CHECK-NEXT: vmerge.vvm v9, v9, v8, v0
				; CHECK-NEXT: vmv1r.v v8, v9
				; CHECK-NEXT: ret
				%v = call <8 x i8> @llvm.vp.merge.v8i8(<8 x i1> %m, <8 x i8> %va, <8 x i8> %vb, i32 %evl)
				ret <8 x i8> %v
				}

				define <8 x i8> @vpmerge_vx_v8i8(i8 %a, <8 x i8> %vb, <8 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vx_v8i8:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a1, e8, mf2, tu, mu
				; CHECK-NEXT: vmerge.vxm v8, v8, a0, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <8 x i8> poison, i8 %a, i32 0
				%va = shufflevector <8 x i8> %elt.head, <8 x i8> poison, <8 x i32> zeroinitializer
				%v = call <8 x i8> @llvm.vp.merge.v8i8(<8 x i1> %m, <8 x i8> %va, <8 x i8> %vb, i32 %evl)
				ret <8 x i8> %v
				}

				define <8 x i8> @vpmerge_vi_v8i8(<8 x i8> %vb, <8 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vi_v8i8:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e8, mf2, tu, mu
				; CHECK-NEXT: vmerge.vim v8, v8, 2, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <8 x i8> poison, i8 2, i32 0
				%va = shufflevector <8 x i8> %elt.head, <8 x i8> poison, <8 x i32> zeroinitializer
				%v = call <8 x i8> @llvm.vp.merge.v8i8(<8 x i1> %m, <8 x i8> %va, <8 x i8> %vb, i32 %evl)
				ret <8 x i8> %v
				}

				declare <16 x i8> @llvm.vp.merge.v16i8(<16 x i1>, <16 x i8>, <16 x i8>, i32)

				define <16 x i8> @vpmerge_vv_v16i8(<16 x i8> %va, <16 x i8> %vb, <16 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vv_v16i8:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e8, m1, tu, mu
				; CHECK-NEXT: vmerge.vvm v9, v9, v8, v0
				; CHECK-NEXT: vmv1r.v v8, v9
				; CHECK-NEXT: ret
				%v = call <16 x i8> @llvm.vp.merge.v16i8(<16 x i1> %m, <16 x i8> %va, <16 x i8> %vb, i32 %evl)
				ret <16 x i8> %v
				}

				define <16 x i8> @vpmerge_vx_v16i8(i8 %a, <16 x i8> %vb, <16 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vx_v16i8:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a1, e8, m1, tu, mu
				; CHECK-NEXT: vmerge.vxm v8, v8, a0, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <16 x i8> poison, i8 %a, i32 0
				%va = shufflevector <16 x i8> %elt.head, <16 x i8> poison, <16 x i32> zeroinitializer
				%v = call <16 x i8> @llvm.vp.merge.v16i8(<16 x i1> %m, <16 x i8> %va, <16 x i8> %vb, i32 %evl)
				ret <16 x i8> %v
				}

				define <16 x i8> @vpmerge_vi_v16i8(<16 x i8> %vb, <16 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vi_v16i8:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e8, m1, tu, mu
				; CHECK-NEXT: vmerge.vim v8, v8, 2, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <16 x i8> poison, i8 2, i32 0
				%va = shufflevector <16 x i8> %elt.head, <16 x i8> poison, <16 x i32> zeroinitializer
				%v = call <16 x i8> @llvm.vp.merge.v16i8(<16 x i1> %m, <16 x i8> %va, <16 x i8> %vb, i32 %evl)
				ret <16 x i8> %v
				}

				declare <2 x i16> @llvm.vp.merge.v2i16(<2 x i1>, <2 x i16>, <2 x i16>, i32)

				define <2 x i16> @vpmerge_vv_v2i16(<2 x i16> %va, <2 x i16> %vb, <2 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vv_v2i16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e16, mf4, tu, mu
				; CHECK-NEXT: vmerge.vvm v9, v9, v8, v0
				; CHECK-NEXT: vmv1r.v v8, v9
				; CHECK-NEXT: ret
				%v = call <2 x i16> @llvm.vp.merge.v2i16(<2 x i1> %m, <2 x i16> %va, <2 x i16> %vb, i32 %evl)
				ret <2 x i16> %v
				}

				define <2 x i16> @vpmerge_vx_v2i16(i16 %a, <2 x i16> %vb, <2 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vx_v2i16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a1, e16, mf4, tu, mu
				; CHECK-NEXT: vmerge.vxm v8, v8, a0, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <2 x i16> poison, i16 %a, i32 0
				%va = shufflevector <2 x i16> %elt.head, <2 x i16> poison, <2 x i32> zeroinitializer
				%v = call <2 x i16> @llvm.vp.merge.v2i16(<2 x i1> %m, <2 x i16> %va, <2 x i16> %vb, i32 %evl)
				ret <2 x i16> %v
				}

				define <2 x i16> @vpmerge_vi_v2i16(<2 x i16> %vb, <2 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vi_v2i16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e16, mf4, tu, mu
				; CHECK-NEXT: vmerge.vim v8, v8, 2, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <2 x i16> poison, i16 2, i32 0
				%va = shufflevector <2 x i16> %elt.head, <2 x i16> poison, <2 x i32> zeroinitializer
				%v = call <2 x i16> @llvm.vp.merge.v2i16(<2 x i1> %m, <2 x i16> %va, <2 x i16> %vb, i32 %evl)
				ret <2 x i16> %v
				}

				declare <4 x i16> @llvm.vp.merge.v4i16(<4 x i1>, <4 x i16>, <4 x i16>, i32)

				define <4 x i16> @vpmerge_vv_v4i16(<4 x i16> %va, <4 x i16> %vb, <4 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vv_v4i16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e16, mf2, tu, mu
				; CHECK-NEXT: vmerge.vvm v9, v9, v8, v0
				; CHECK-NEXT: vmv1r.v v8, v9
				; CHECK-NEXT: ret
				%v = call <4 x i16> @llvm.vp.merge.v4i16(<4 x i1> %m, <4 x i16> %va, <4 x i16> %vb, i32 %evl)
				ret <4 x i16> %v
				}

				define <4 x i16> @vpmerge_vx_v4i16(i16 %a, <4 x i16> %vb, <4 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vx_v4i16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a1, e16, mf2, tu, mu
				; CHECK-NEXT: vmerge.vxm v8, v8, a0, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <4 x i16> poison, i16 %a, i32 0
				%va = shufflevector <4 x i16> %elt.head, <4 x i16> poison, <4 x i32> zeroinitializer
				%v = call <4 x i16> @llvm.vp.merge.v4i16(<4 x i1> %m, <4 x i16> %va, <4 x i16> %vb, i32 %evl)
				ret <4 x i16> %v
				}

				define <4 x i16> @vpmerge_vi_v4i16(<4 x i16> %vb, <4 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vi_v4i16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e16, mf2, tu, mu
				; CHECK-NEXT: vmerge.vim v8, v8, 2, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <4 x i16> poison, i16 2, i32 0
				%va = shufflevector <4 x i16> %elt.head, <4 x i16> poison, <4 x i32> zeroinitializer
				%v = call <4 x i16> @llvm.vp.merge.v4i16(<4 x i1> %m, <4 x i16> %va, <4 x i16> %vb, i32 %evl)
				ret <4 x i16> %v
				}

				declare <8 x i16> @llvm.vp.merge.v8i16(<8 x i1>, <8 x i16>, <8 x i16>, i32)

				define <8 x i16> @vpmerge_vv_v8i16(<8 x i16> %va, <8 x i16> %vb, <8 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vv_v8i16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e16, m1, tu, mu
				; CHECK-NEXT: vmerge.vvm v9, v9, v8, v0
				; CHECK-NEXT: vmv1r.v v8, v9
				; CHECK-NEXT: ret
				%v = call <8 x i16> @llvm.vp.merge.v8i16(<8 x i1> %m, <8 x i16> %va, <8 x i16> %vb, i32 %evl)
				ret <8 x i16> %v
				}

				define <8 x i16> @vpmerge_vx_v8i16(i16 %a, <8 x i16> %vb, <8 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vx_v8i16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a1, e16, m1, tu, mu
				; CHECK-NEXT: vmerge.vxm v8, v8, a0, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <8 x i16> poison, i16 %a, i32 0
				%va = shufflevector <8 x i16> %elt.head, <8 x i16> poison, <8 x i32> zeroinitializer
				%v = call <8 x i16> @llvm.vp.merge.v8i16(<8 x i1> %m, <8 x i16> %va, <8 x i16> %vb, i32 %evl)
				ret <8 x i16> %v
				}

				define <8 x i16> @vpmerge_vi_v8i16(<8 x i16> %vb, <8 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vi_v8i16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e16, m1, tu, mu
				; CHECK-NEXT: vmerge.vim v8, v8, 2, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <8 x i16> poison, i16 2, i32 0
				%va = shufflevector <8 x i16> %elt.head, <8 x i16> poison, <8 x i32> zeroinitializer
				%v = call <8 x i16> @llvm.vp.merge.v8i16(<8 x i1> %m, <8 x i16> %va, <8 x i16> %vb, i32 %evl)
				ret <8 x i16> %v
				}

				declare <16 x i16> @llvm.vp.merge.v16i16(<16 x i1>, <16 x i16>, <16 x i16>, i32)

				define <16 x i16> @vpmerge_vv_v16i16(<16 x i16> %va, <16 x i16> %vb, <16 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vv_v16i16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e16, m2, tu, mu
				; CHECK-NEXT: vmerge.vvm v10, v10, v8, v0
				; CHECK-NEXT: vmv2r.v v8, v10
				; CHECK-NEXT: ret
				%v = call <16 x i16> @llvm.vp.merge.v16i16(<16 x i1> %m, <16 x i16> %va, <16 x i16> %vb, i32 %evl)
				ret <16 x i16> %v
				}

				define <16 x i16> @vpmerge_vx_v16i16(i16 %a, <16 x i16> %vb, <16 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vx_v16i16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a1, e16, m2, tu, mu
				; CHECK-NEXT: vmerge.vxm v8, v8, a0, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <16 x i16> poison, i16 %a, i32 0
				%va = shufflevector <16 x i16> %elt.head, <16 x i16> poison, <16 x i32> zeroinitializer
				%v = call <16 x i16> @llvm.vp.merge.v16i16(<16 x i1> %m, <16 x i16> %va, <16 x i16> %vb, i32 %evl)
				ret <16 x i16> %v
				}

				define <16 x i16> @vpmerge_vi_v16i16(<16 x i16> %vb, <16 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vi_v16i16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e16, m2, tu, mu
				; CHECK-NEXT: vmerge.vim v8, v8, 2, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <16 x i16> poison, i16 2, i32 0
				%va = shufflevector <16 x i16> %elt.head, <16 x i16> poison, <16 x i32> zeroinitializer
				%v = call <16 x i16> @llvm.vp.merge.v16i16(<16 x i1> %m, <16 x i16> %va, <16 x i16> %vb, i32 %evl)
				ret <16 x i16> %v
				}

				declare <2 x i32> @llvm.vp.merge.v2i32(<2 x i1>, <2 x i32>, <2 x i32>, i32)

				define <2 x i32> @vpmerge_vv_v2i32(<2 x i32> %va, <2 x i32> %vb, <2 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vv_v2i32:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e32, mf2, tu, mu
				; CHECK-NEXT: vmerge.vvm v9, v9, v8, v0
				; CHECK-NEXT: vmv1r.v v8, v9
				; CHECK-NEXT: ret
				%v = call <2 x i32> @llvm.vp.merge.v2i32(<2 x i1> %m, <2 x i32> %va, <2 x i32> %vb, i32 %evl)
				ret <2 x i32> %v
				}

				define <2 x i32> @vpmerge_vx_v2i32(i32 %a, <2 x i32> %vb, <2 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vx_v2i32:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a1, e32, mf2, tu, mu
				; CHECK-NEXT: vmerge.vxm v8, v8, a0, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <2 x i32> poison, i32 %a, i32 0
				%va = shufflevector <2 x i32> %elt.head, <2 x i32> poison, <2 x i32> zeroinitializer
				%v = call <2 x i32> @llvm.vp.merge.v2i32(<2 x i1> %m, <2 x i32> %va, <2 x i32> %vb, i32 %evl)
				ret <2 x i32> %v
				}

				define <2 x i32> @vpmerge_vi_v2i32(<2 x i32> %vb, <2 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vi_v2i32:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e32, mf2, tu, mu
				; CHECK-NEXT: vmerge.vim v8, v8, 2, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <2 x i32> poison, i32 2, i32 0
				%va = shufflevector <2 x i32> %elt.head, <2 x i32> poison, <2 x i32> zeroinitializer
				%v = call <2 x i32> @llvm.vp.merge.v2i32(<2 x i1> %m, <2 x i32> %va, <2 x i32> %vb, i32 %evl)
				ret <2 x i32> %v
				}

				declare <4 x i32> @llvm.vp.merge.v4i32(<4 x i1>, <4 x i32>, <4 x i32>, i32)

				define <4 x i32> @vpmerge_vv_v4i32(<4 x i32> %va, <4 x i32> %vb, <4 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vv_v4i32:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e32, m1, tu, mu
				; CHECK-NEXT: vmerge.vvm v9, v9, v8, v0
				; CHECK-NEXT: vmv1r.v v8, v9
				; CHECK-NEXT: ret
				%v = call <4 x i32> @llvm.vp.merge.v4i32(<4 x i1> %m, <4 x i32> %va, <4 x i32> %vb, i32 %evl)
				ret <4 x i32> %v
				}

				define <4 x i32> @vpmerge_vx_v4i32(i32 %a, <4 x i32> %vb, <4 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vx_v4i32:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a1, e32, m1, tu, mu
				; CHECK-NEXT: vmerge.vxm v8, v8, a0, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <4 x i32> poison, i32 %a, i32 0
				%va = shufflevector <4 x i32> %elt.head, <4 x i32> poison, <4 x i32> zeroinitializer
				%v = call <4 x i32> @llvm.vp.merge.v4i32(<4 x i1> %m, <4 x i32> %va, <4 x i32> %vb, i32 %evl)
				ret <4 x i32> %v
				}

				define <4 x i32> @vpmerge_vi_v4i32(<4 x i32> %vb, <4 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vi_v4i32:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e32, m1, tu, mu
				; CHECK-NEXT: vmerge.vim v8, v8, 2, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <4 x i32> poison, i32 2, i32 0
				%va = shufflevector <4 x i32> %elt.head, <4 x i32> poison, <4 x i32> zeroinitializer
				%v = call <4 x i32> @llvm.vp.merge.v4i32(<4 x i1> %m, <4 x i32> %va, <4 x i32> %vb, i32 %evl)
				ret <4 x i32> %v
				}

				declare <8 x i32> @llvm.vp.merge.v8i32(<8 x i1>, <8 x i32>, <8 x i32>, i32)

				define <8 x i32> @vpmerge_vv_v8i32(<8 x i32> %va, <8 x i32> %vb, <8 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vv_v8i32:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e32, m2, tu, mu
				; CHECK-NEXT: vmerge.vvm v10, v10, v8, v0
				; CHECK-NEXT: vmv2r.v v8, v10
				; CHECK-NEXT: ret
				%v = call <8 x i32> @llvm.vp.merge.v8i32(<8 x i1> %m, <8 x i32> %va, <8 x i32> %vb, i32 %evl)
				ret <8 x i32> %v
				}

				define <8 x i32> @vpmerge_vx_v8i32(i32 %a, <8 x i32> %vb, <8 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vx_v8i32:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a1, e32, m2, tu, mu
				; CHECK-NEXT: vmerge.vxm v8, v8, a0, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <8 x i32> poison, i32 %a, i32 0
				%va = shufflevector <8 x i32> %elt.head, <8 x i32> poison, <8 x i32> zeroinitializer
				%v = call <8 x i32> @llvm.vp.merge.v8i32(<8 x i1> %m, <8 x i32> %va, <8 x i32> %vb, i32 %evl)
				ret <8 x i32> %v
				}

				define <8 x i32> @vpmerge_vi_v8i32(<8 x i32> %vb, <8 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vi_v8i32:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e32, m2, tu, mu
				; CHECK-NEXT: vmerge.vim v8, v8, 2, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <8 x i32> poison, i32 2, i32 0
				%va = shufflevector <8 x i32> %elt.head, <8 x i32> poison, <8 x i32> zeroinitializer
				%v = call <8 x i32> @llvm.vp.merge.v8i32(<8 x i1> %m, <8 x i32> %va, <8 x i32> %vb, i32 %evl)
				ret <8 x i32> %v
				}

				declare <16 x i32> @llvm.vp.merge.v16i32(<16 x i1>, <16 x i32>, <16 x i32>, i32)

				define <16 x i32> @vpmerge_vv_v16i32(<16 x i32> %va, <16 x i32> %vb, <16 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vv_v16i32:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e32, m4, tu, mu
				; CHECK-NEXT: vmerge.vvm v12, v12, v8, v0
				; CHECK-NEXT: vmv4r.v v8, v12
				; CHECK-NEXT: ret
				%v = call <16 x i32> @llvm.vp.merge.v16i32(<16 x i1> %m, <16 x i32> %va, <16 x i32> %vb, i32 %evl)
				ret <16 x i32> %v
				}

				define <16 x i32> @vpmerge_vx_v16i32(i32 %a, <16 x i32> %vb, <16 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vx_v16i32:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a1, e32, m4, tu, mu
				; CHECK-NEXT: vmerge.vxm v8, v8, a0, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <16 x i32> poison, i32 %a, i32 0
				%va = shufflevector <16 x i32> %elt.head, <16 x i32> poison, <16 x i32> zeroinitializer
				%v = call <16 x i32> @llvm.vp.merge.v16i32(<16 x i1> %m, <16 x i32> %va, <16 x i32> %vb, i32 %evl)
				ret <16 x i32> %v
				}

				define <16 x i32> @vpmerge_vi_v16i32(<16 x i32> %vb, <16 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vi_v16i32:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e32, m4, tu, mu
				; CHECK-NEXT: vmerge.vim v8, v8, 2, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <16 x i32> poison, i32 2, i32 0
				%va = shufflevector <16 x i32> %elt.head, <16 x i32> poison, <16 x i32> zeroinitializer
				%v = call <16 x i32> @llvm.vp.merge.v16i32(<16 x i1> %m, <16 x i32> %va, <16 x i32> %vb, i32 %evl)
				ret <16 x i32> %v
				}

				declare <2 x i64> @llvm.vp.merge.v2i64(<2 x i1>, <2 x i64>, <2 x i64>, i32)

				define <2 x i64> @vpmerge_vv_v2i64(<2 x i64> %va, <2 x i64> %vb, <2 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vv_v2i64:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e64, m1, tu, mu
				; CHECK-NEXT: vmerge.vvm v9, v9, v8, v0
				; CHECK-NEXT: vmv1r.v v8, v9
				; CHECK-NEXT: ret
				%v = call <2 x i64> @llvm.vp.merge.v2i64(<2 x i1> %m, <2 x i64> %va, <2 x i64> %vb, i32 %evl)
				ret <2 x i64> %v
				}

				define <2 x i64> @vpmerge_vx_v2i64(i64 %a, <2 x i64> %vb, <2 x i1> %m, i32 zeroext %evl) {
				; RV32-LABEL: vpmerge_vx_v2i64:
				; RV32: # %bb.0:
				; RV32-NEXT: addi sp, sp, -16
				; RV32-NEXT: .cfi_def_cfa_offset 16
				; RV32-NEXT: sw a1, 12(sp)
				; RV32-NEXT: sw a0, 8(sp)
				; RV32-NEXT: vsetivli zero, 2, e64, m1, ta, mu
				; RV32-NEXT: addi a0, sp, 8
				; RV32-NEXT: vlse64.v v9, (a0), zero
				; RV32-NEXT: vsetvli zero, a2, e64, m1, tu, mu
				; RV32-NEXT: vmerge.vvm v8, v8, v9, v0
				; RV32-NEXT: addi sp, sp, 16
				; RV32-NEXT: ret
				;
				; RV64-LABEL: vpmerge_vx_v2i64:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli zero, a1, e64, m1, tu, mu
				; RV64-NEXT: vmerge.vxm v8, v8, a0, v0
				; RV64-NEXT: ret
				%elt.head = insertelement <2 x i64> poison, i64 %a, i32 0
				%va = shufflevector <2 x i64> %elt.head, <2 x i64> poison, <2 x i32> zeroinitializer
				%v = call <2 x i64> @llvm.vp.merge.v2i64(<2 x i1> %m, <2 x i64> %va, <2 x i64> %vb, i32 %evl)
				ret <2 x i64> %v
				}

				define <2 x i64> @vpmerge_vi_v2i64(<2 x i64> %vb, <2 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vi_v2i64:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e64, m1, tu, mu
				; CHECK-NEXT: vmerge.vim v8, v8, 2, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <2 x i64> poison, i64 2, i32 0
				%va = shufflevector <2 x i64> %elt.head, <2 x i64> poison, <2 x i32> zeroinitializer
				%v = call <2 x i64> @llvm.vp.merge.v2i64(<2 x i1> %m, <2 x i64> %va, <2 x i64> %vb, i32 %evl)
				ret <2 x i64> %v
				}

				declare <4 x i64> @llvm.vp.merge.v4i64(<4 x i1>, <4 x i64>, <4 x i64>, i32)

				define <4 x i64> @vpmerge_vv_v4i64(<4 x i64> %va, <4 x i64> %vb, <4 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vv_v4i64:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e64, m2, tu, mu
				; CHECK-NEXT: vmerge.vvm v10, v10, v8, v0
				; CHECK-NEXT: vmv2r.v v8, v10
				; CHECK-NEXT: ret
				%v = call <4 x i64> @llvm.vp.merge.v4i64(<4 x i1> %m, <4 x i64> %va, <4 x i64> %vb, i32 %evl)
				ret <4 x i64> %v
				}

				define <4 x i64> @vpmerge_vx_v4i64(i64 %a, <4 x i64> %vb, <4 x i1> %m, i32 zeroext %evl) {
				; RV32-LABEL: vpmerge_vx_v4i64:
				; RV32: # %bb.0:
				; RV32-NEXT: addi sp, sp, -16
				; RV32-NEXT: .cfi_def_cfa_offset 16
				; RV32-NEXT: sw a1, 12(sp)
				; RV32-NEXT: sw a0, 8(sp)
				; RV32-NEXT: vsetivli zero, 4, e64, m2, ta, mu
				; RV32-NEXT: addi a0, sp, 8
				; RV32-NEXT: vlse64.v v10, (a0), zero
				; RV32-NEXT: vsetvli zero, a2, e64, m2, tu, mu
				; RV32-NEXT: vmerge.vvm v8, v8, v10, v0
				; RV32-NEXT: addi sp, sp, 16
				; RV32-NEXT: ret
				;
				; RV64-LABEL: vpmerge_vx_v4i64:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli zero, a1, e64, m2, tu, mu
				; RV64-NEXT: vmerge.vxm v8, v8, a0, v0
				; RV64-NEXT: ret
				%elt.head = insertelement <4 x i64> poison, i64 %a, i32 0
				%va = shufflevector <4 x i64> %elt.head, <4 x i64> poison, <4 x i32> zeroinitializer
				%v = call <4 x i64> @llvm.vp.merge.v4i64(<4 x i1> %m, <4 x i64> %va, <4 x i64> %vb, i32 %evl)
				ret <4 x i64> %v
				}

				define <4 x i64> @vpmerge_vi_v4i64(<4 x i64> %vb, <4 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vi_v4i64:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e64, m2, tu, mu
				; CHECK-NEXT: vmerge.vim v8, v8, 2, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <4 x i64> poison, i64 2, i32 0
				%va = shufflevector <4 x i64> %elt.head, <4 x i64> poison, <4 x i32> zeroinitializer
				%v = call <4 x i64> @llvm.vp.merge.v4i64(<4 x i1> %m, <4 x i64> %va, <4 x i64> %vb, i32 %evl)
				ret <4 x i64> %v
				}

				declare <8 x i64> @llvm.vp.merge.v8i64(<8 x i1>, <8 x i64>, <8 x i64>, i32)

				define <8 x i64> @vpmerge_vv_v8i64(<8 x i64> %va, <8 x i64> %vb, <8 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vv_v8i64:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e64, m4, tu, mu
				; CHECK-NEXT: vmerge.vvm v12, v12, v8, v0
				; CHECK-NEXT: vmv4r.v v8, v12
				; CHECK-NEXT: ret
				%v = call <8 x i64> @llvm.vp.merge.v8i64(<8 x i1> %m, <8 x i64> %va, <8 x i64> %vb, i32 %evl)
				ret <8 x i64> %v
				}

				define <8 x i64> @vpmerge_vx_v8i64(i64 %a, <8 x i64> %vb, <8 x i1> %m, i32 zeroext %evl) {
				; RV32-LABEL: vpmerge_vx_v8i64:
				; RV32: # %bb.0:
				; RV32-NEXT: addi sp, sp, -16
				; RV32-NEXT: .cfi_def_cfa_offset 16
				; RV32-NEXT: sw a1, 12(sp)
				; RV32-NEXT: sw a0, 8(sp)
				; RV32-NEXT: vsetivli zero, 8, e64, m4, ta, mu
				; RV32-NEXT: addi a0, sp, 8
				; RV32-NEXT: vlse64.v v12, (a0), zero
				; RV32-NEXT: vsetvli zero, a2, e64, m4, tu, mu
				; RV32-NEXT: vmerge.vvm v8, v8, v12, v0
				; RV32-NEXT: addi sp, sp, 16
				; RV32-NEXT: ret
				;
				; RV64-LABEL: vpmerge_vx_v8i64:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli zero, a1, e64, m4, tu, mu
				; RV64-NEXT: vmerge.vxm v8, v8, a0, v0
				; RV64-NEXT: ret
				%elt.head = insertelement <8 x i64> poison, i64 %a, i32 0
				%va = shufflevector <8 x i64> %elt.head, <8 x i64> poison, <8 x i32> zeroinitializer
				%v = call <8 x i64> @llvm.vp.merge.v8i64(<8 x i1> %m, <8 x i64> %va, <8 x i64> %vb, i32 %evl)
				ret <8 x i64> %v
				}

				define <8 x i64> @vpmerge_vi_v8i64(<8 x i64> %vb, <8 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vi_v8i64:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e64, m4, tu, mu
				; CHECK-NEXT: vmerge.vim v8, v8, 2, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <8 x i64> poison, i64 2, i32 0
				%va = shufflevector <8 x i64> %elt.head, <8 x i64> poison, <8 x i32> zeroinitializer
				%v = call <8 x i64> @llvm.vp.merge.v8i64(<8 x i1> %m, <8 x i64> %va, <8 x i64> %vb, i32 %evl)
				ret <8 x i64> %v
				}

				declare <16 x i64> @llvm.vp.merge.v16i64(<16 x i1>, <16 x i64>, <16 x i64>, i32)

				define <16 x i64> @vpmerge_vv_v16i64(<16 x i64> %va, <16 x i64> %vb, <16 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vv_v16i64:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e64, m8, tu, mu
				; CHECK-NEXT: vmerge.vvm v16, v16, v8, v0
				; CHECK-NEXT: vmv8r.v v8, v16
				; CHECK-NEXT: ret
				%v = call <16 x i64> @llvm.vp.merge.v16i64(<16 x i1> %m, <16 x i64> %va, <16 x i64> %vb, i32 %evl)
				ret <16 x i64> %v
				}

				define <16 x i64> @vpmerge_vx_v16i64(i64 %a, <16 x i64> %vb, <16 x i1> %m, i32 zeroext %evl) {
				; RV32-LABEL: vpmerge_vx_v16i64:
				; RV32: # %bb.0:
				; RV32-NEXT: addi sp, sp, -16
				; RV32-NEXT: .cfi_def_cfa_offset 16
				; RV32-NEXT: sw a1, 12(sp)
				; RV32-NEXT: sw a0, 8(sp)
				; RV32-NEXT: vsetivli zero, 16, e64, m8, ta, mu
				; RV32-NEXT: addi a0, sp, 8
				; RV32-NEXT: vlse64.v v16, (a0), zero
				; RV32-NEXT: vsetvli zero, a2, e64, m8, tu, mu
				; RV32-NEXT: vmerge.vvm v8, v8, v16, v0
				; RV32-NEXT: addi sp, sp, 16
				; RV32-NEXT: ret
				;
				; RV64-LABEL: vpmerge_vx_v16i64:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli zero, a1, e64, m8, tu, mu
				; RV64-NEXT: vmerge.vxm v8, v8, a0, v0
				; RV64-NEXT: ret
				%elt.head = insertelement <16 x i64> poison, i64 %a, i32 0
				%va = shufflevector <16 x i64> %elt.head, <16 x i64> poison, <16 x i32> zeroinitializer
				%v = call <16 x i64> @llvm.vp.merge.v16i64(<16 x i1> %m, <16 x i64> %va, <16 x i64> %vb, i32 %evl)
				ret <16 x i64> %v
				}

				define <16 x i64> @vpmerge_vi_v16i64(<16 x i64> %vb, <16 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vi_v16i64:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e64, m8, tu, mu
				; CHECK-NEXT: vmerge.vim v8, v8, 2, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <16 x i64> poison, i64 2, i32 0
				%va = shufflevector <16 x i64> %elt.head, <16 x i64> poison, <16 x i32> zeroinitializer
				%v = call <16 x i64> @llvm.vp.merge.v16i64(<16 x i1> %m, <16 x i64> %va, <16 x i64> %vb, i32 %evl)
				ret <16 x i64> %v
				}

				declare <2 x half> @llvm.vp.merge.v2f16(<2 x i1>, <2 x half>, <2 x half>, i32)

				define <2 x half> @vpmerge_vv_v2f16(<2 x half> %va, <2 x half> %vb, <2 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vv_v2f16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e16, mf4, tu, mu
				; CHECK-NEXT: vmerge.vvm v9, v9, v8, v0
				; CHECK-NEXT: vmv1r.v v8, v9
				; CHECK-NEXT: ret
				%v = call <2 x half> @llvm.vp.merge.v2f16(<2 x i1> %m, <2 x half> %va, <2 x half> %vb, i32 %evl)
				ret <2 x half> %v
				}

				define <2 x half> @vpmerge_vf_v2f16(half %a, <2 x half> %vb, <2 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vf_v2f16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e16, mf4, tu, mu
				; CHECK-NEXT: vfmerge.vfm v8, v8, fa0, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <2 x half> poison, half %a, i32 0
				%va = shufflevector <2 x half> %elt.head, <2 x half> poison, <2 x i32> zeroinitializer
				%v = call <2 x half> @llvm.vp.merge.v2f16(<2 x i1> %m, <2 x half> %va, <2 x half> %vb, i32 %evl)
				ret <2 x half> %v
				}

				declare <4 x half> @llvm.vp.merge.v4f16(<4 x i1>, <4 x half>, <4 x half>, i32)

				define <4 x half> @vpmerge_vv_v4f16(<4 x half> %va, <4 x half> %vb, <4 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vv_v4f16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e16, mf2, tu, mu
				; CHECK-NEXT: vmerge.vvm v9, v9, v8, v0
				; CHECK-NEXT: vmv1r.v v8, v9
				; CHECK-NEXT: ret
				%v = call <4 x half> @llvm.vp.merge.v4f16(<4 x i1> %m, <4 x half> %va, <4 x half> %vb, i32 %evl)
				ret <4 x half> %v
				}

				define <4 x half> @vpmerge_vf_v4f16(half %a, <4 x half> %vb, <4 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vf_v4f16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e16, mf2, tu, mu
				; CHECK-NEXT: vfmerge.vfm v8, v8, fa0, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <4 x half> poison, half %a, i32 0
				%va = shufflevector <4 x half> %elt.head, <4 x half> poison, <4 x i32> zeroinitializer
				%v = call <4 x half> @llvm.vp.merge.v4f16(<4 x i1> %m, <4 x half> %va, <4 x half> %vb, i32 %evl)
				ret <4 x half> %v
				}

				declare <8 x half> @llvm.vp.merge.v8f16(<8 x i1>, <8 x half>, <8 x half>, i32)

				define <8 x half> @vpmerge_vv_v8f16(<8 x half> %va, <8 x half> %vb, <8 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vv_v8f16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e16, m1, tu, mu
				; CHECK-NEXT: vmerge.vvm v9, v9, v8, v0
				; CHECK-NEXT: vmv1r.v v8, v9
				; CHECK-NEXT: ret
				%v = call <8 x half> @llvm.vp.merge.v8f16(<8 x i1> %m, <8 x half> %va, <8 x half> %vb, i32 %evl)
				ret <8 x half> %v
				}

				define <8 x half> @vpmerge_vf_v8f16(half %a, <8 x half> %vb, <8 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vf_v8f16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e16, m1, tu, mu
				; CHECK-NEXT: vfmerge.vfm v8, v8, fa0, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <8 x half> poison, half %a, i32 0
				%va = shufflevector <8 x half> %elt.head, <8 x half> poison, <8 x i32> zeroinitializer
				%v = call <8 x half> @llvm.vp.merge.v8f16(<8 x i1> %m, <8 x half> %va, <8 x half> %vb, i32 %evl)
				ret <8 x half> %v
				}

				declare <16 x half> @llvm.vp.merge.v16f16(<16 x i1>, <16 x half>, <16 x half>, i32)

				define <16 x half> @vpmerge_vv_v16f16(<16 x half> %va, <16 x half> %vb, <16 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vv_v16f16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e16, m2, tu, mu
				; CHECK-NEXT: vmerge.vvm v10, v10, v8, v0
				; CHECK-NEXT: vmv2r.v v8, v10
				; CHECK-NEXT: ret
				%v = call <16 x half> @llvm.vp.merge.v16f16(<16 x i1> %m, <16 x half> %va, <16 x half> %vb, i32 %evl)
				ret <16 x half> %v
				}

				define <16 x half> @vpmerge_vf_v16f16(half %a, <16 x half> %vb, <16 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vf_v16f16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e16, m2, tu, mu
				; CHECK-NEXT: vfmerge.vfm v8, v8, fa0, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <16 x half> poison, half %a, i32 0
				%va = shufflevector <16 x half> %elt.head, <16 x half> poison, <16 x i32> zeroinitializer
				%v = call <16 x half> @llvm.vp.merge.v16f16(<16 x i1> %m, <16 x half> %va, <16 x half> %vb, i32 %evl)
				ret <16 x half> %v
				}

				declare <2 x float> @llvm.vp.merge.v2f32(<2 x i1>, <2 x float>, <2 x float>, i32)

				define <2 x float> @vpmerge_vv_v2f32(<2 x float> %va, <2 x float> %vb, <2 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vv_v2f32:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e32, mf2, tu, mu
				; CHECK-NEXT: vmerge.vvm v9, v9, v8, v0
				; CHECK-NEXT: vmv1r.v v8, v9
				; CHECK-NEXT: ret
				%v = call <2 x float> @llvm.vp.merge.v2f32(<2 x i1> %m, <2 x float> %va, <2 x float> %vb, i32 %evl)
				ret <2 x float> %v
				}

				define <2 x float> @vpmerge_vf_v2f32(float %a, <2 x float> %vb, <2 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vf_v2f32:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e32, mf2, tu, mu
				; CHECK-NEXT: vfmerge.vfm v8, v8, fa0, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <2 x float> poison, float %a, i32 0
				%va = shufflevector <2 x float> %elt.head, <2 x float> poison, <2 x i32> zeroinitializer
				%v = call <2 x float> @llvm.vp.merge.v2f32(<2 x i1> %m, <2 x float> %va, <2 x float> %vb, i32 %evl)
				ret <2 x float> %v
				}

				declare <4 x float> @llvm.vp.merge.v4f32(<4 x i1>, <4 x float>, <4 x float>, i32)

				define <4 x float> @vpmerge_vv_v4f32(<4 x float> %va, <4 x float> %vb, <4 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vv_v4f32:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e32, m1, tu, mu
				; CHECK-NEXT: vmerge.vvm v9, v9, v8, v0
				; CHECK-NEXT: vmv1r.v v8, v9
				; CHECK-NEXT: ret
				%v = call <4 x float> @llvm.vp.merge.v4f32(<4 x i1> %m, <4 x float> %va, <4 x float> %vb, i32 %evl)
				ret <4 x float> %v
				}

				define <4 x float> @vpmerge_vf_v4f32(float %a, <4 x float> %vb, <4 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vf_v4f32:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e32, m1, tu, mu
				; CHECK-NEXT: vfmerge.vfm v8, v8, fa0, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <4 x float> poison, float %a, i32 0
				%va = shufflevector <4 x float> %elt.head, <4 x float> poison, <4 x i32> zeroinitializer
				%v = call <4 x float> @llvm.vp.merge.v4f32(<4 x i1> %m, <4 x float> %va, <4 x float> %vb, i32 %evl)
				ret <4 x float> %v
				}

				declare <8 x float> @llvm.vp.merge.v8f32(<8 x i1>, <8 x float>, <8 x float>, i32)

				define <8 x float> @vpmerge_vv_v8f32(<8 x float> %va, <8 x float> %vb, <8 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vv_v8f32:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e32, m2, tu, mu
				; CHECK-NEXT: vmerge.vvm v10, v10, v8, v0
				; CHECK-NEXT: vmv2r.v v8, v10
				; CHECK-NEXT: ret
				%v = call <8 x float> @llvm.vp.merge.v8f32(<8 x i1> %m, <8 x float> %va, <8 x float> %vb, i32 %evl)
				ret <8 x float> %v
				}

				define <8 x float> @vpmerge_vf_v8f32(float %a, <8 x float> %vb, <8 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vf_v8f32:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e32, m2, tu, mu
				; CHECK-NEXT: vfmerge.vfm v8, v8, fa0, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <8 x float> poison, float %a, i32 0
				%va = shufflevector <8 x float> %elt.head, <8 x float> poison, <8 x i32> zeroinitializer
				%v = call <8 x float> @llvm.vp.merge.v8f32(<8 x i1> %m, <8 x float> %va, <8 x float> %vb, i32 %evl)
				ret <8 x float> %v
				}

				declare <16 x float> @llvm.vp.merge.v16f32(<16 x i1>, <16 x float>, <16 x float>, i32)

				define <16 x float> @vpmerge_vv_v16f32(<16 x float> %va, <16 x float> %vb, <16 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vv_v16f32:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e32, m4, tu, mu
				; CHECK-NEXT: vmerge.vvm v12, v12, v8, v0
				; CHECK-NEXT: vmv4r.v v8, v12
				; CHECK-NEXT: ret
				%v = call <16 x float> @llvm.vp.merge.v16f32(<16 x i1> %m, <16 x float> %va, <16 x float> %vb, i32 %evl)
				ret <16 x float> %v
				}

				define <16 x float> @vpmerge_vf_v16f32(float %a, <16 x float> %vb, <16 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vf_v16f32:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e32, m4, tu, mu
				; CHECK-NEXT: vfmerge.vfm v8, v8, fa0, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <16 x float> poison, float %a, i32 0
				%va = shufflevector <16 x float> %elt.head, <16 x float> poison, <16 x i32> zeroinitializer
				%v = call <16 x float> @llvm.vp.merge.v16f32(<16 x i1> %m, <16 x float> %va, <16 x float> %vb, i32 %evl)
				ret <16 x float> %v
				}

				declare <2 x double> @llvm.vp.merge.v2f64(<2 x i1>, <2 x double>, <2 x double>, i32)

				define <2 x double> @vpmerge_vv_v2f64(<2 x double> %va, <2 x double> %vb, <2 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vv_v2f64:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e64, m1, tu, mu
				; CHECK-NEXT: vmerge.vvm v9, v9, v8, v0
				; CHECK-NEXT: vmv1r.v v8, v9
				; CHECK-NEXT: ret
				%v = call <2 x double> @llvm.vp.merge.v2f64(<2 x i1> %m, <2 x double> %va, <2 x double> %vb, i32 %evl)
				ret <2 x double> %v
				}

				define <2 x double> @vpmerge_vf_v2f64(double %a, <2 x double> %vb, <2 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vf_v2f64:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e64, m1, tu, mu
				; CHECK-NEXT: vfmerge.vfm v8, v8, fa0, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <2 x double> poison, double %a, i32 0
				%va = shufflevector <2 x double> %elt.head, <2 x double> poison, <2 x i32> zeroinitializer
				%v = call <2 x double> @llvm.vp.merge.v2f64(<2 x i1> %m, <2 x double> %va, <2 x double> %vb, i32 %evl)
				ret <2 x double> %v
				}

				declare <4 x double> @llvm.vp.merge.v4f64(<4 x i1>, <4 x double>, <4 x double>, i32)

				define <4 x double> @vpmerge_vv_v4f64(<4 x double> %va, <4 x double> %vb, <4 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vv_v4f64:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e64, m2, tu, mu
				; CHECK-NEXT: vmerge.vvm v10, v10, v8, v0
				; CHECK-NEXT: vmv2r.v v8, v10
				; CHECK-NEXT: ret
				%v = call <4 x double> @llvm.vp.merge.v4f64(<4 x i1> %m, <4 x double> %va, <4 x double> %vb, i32 %evl)
				ret <4 x double> %v
				}

				define <4 x double> @vpmerge_vf_v4f64(double %a, <4 x double> %vb, <4 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vf_v4f64:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e64, m2, tu, mu
				; CHECK-NEXT: vfmerge.vfm v8, v8, fa0, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <4 x double> poison, double %a, i32 0
				%va = shufflevector <4 x double> %elt.head, <4 x double> poison, <4 x i32> zeroinitializer
				%v = call <4 x double> @llvm.vp.merge.v4f64(<4 x i1> %m, <4 x double> %va, <4 x double> %vb, i32 %evl)
				ret <4 x double> %v
				}

				declare <8 x double> @llvm.vp.merge.v8f64(<8 x i1>, <8 x double>, <8 x double>, i32)

				define <8 x double> @vpmerge_vv_v8f64(<8 x double> %va, <8 x double> %vb, <8 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vv_v8f64:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e64, m4, tu, mu
				; CHECK-NEXT: vmerge.vvm v12, v12, v8, v0
				; CHECK-NEXT: vmv4r.v v8, v12
				; CHECK-NEXT: ret
				%v = call <8 x double> @llvm.vp.merge.v8f64(<8 x i1> %m, <8 x double> %va, <8 x double> %vb, i32 %evl)
				ret <8 x double> %v
				}

				define <8 x double> @vpmerge_vf_v8f64(double %a, <8 x double> %vb, <8 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vf_v8f64:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e64, m4, tu, mu
				; CHECK-NEXT: vfmerge.vfm v8, v8, fa0, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <8 x double> poison, double %a, i32 0
				%va = shufflevector <8 x double> %elt.head, <8 x double> poison, <8 x i32> zeroinitializer
				%v = call <8 x double> @llvm.vp.merge.v8f64(<8 x i1> %m, <8 x double> %va, <8 x double> %vb, i32 %evl)
				ret <8 x double> %v
				}

				declare <16 x double> @llvm.vp.merge.v16f64(<16 x i1>, <16 x double>, <16 x double>, i32)

				define <16 x double> @vpmerge_vv_v16f64(<16 x double> %va, <16 x double> %vb, <16 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vv_v16f64:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e64, m8, tu, mu
				; CHECK-NEXT: vmerge.vvm v16, v16, v8, v0
				; CHECK-NEXT: vmv8r.v v8, v16
				; CHECK-NEXT: ret
				%v = call <16 x double> @llvm.vp.merge.v16f64(<16 x i1> %m, <16 x double> %va, <16 x double> %vb, i32 %evl)
				ret <16 x double> %v
				}

				define <16 x double> @vpmerge_vf_v16f64(double %a, <16 x double> %vb, <16 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vf_v16f64:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e64, m8, tu, mu
				; CHECK-NEXT: vfmerge.vfm v8, v8, fa0, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <16 x double> poison, double %a, i32 0
				%va = shufflevector <16 x double> %elt.head, <16 x double> poison, <16 x i32> zeroinitializer
				%v = call <16 x double> @llvm.vp.merge.v16f64(<16 x i1> %m, <16 x double> %va, <16 x double> %vb, i32 %evl)
				ret <16 x double> %v
				}

llvm/test/CodeGen/RISCV/rvv/vpmerge-sdnode.ll

This file was added.

				; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
				; RUN: llc -mtriple=riscv32 -mattr=+d,+zfh,+v -target-abi=ilp32d \
				; RUN: -verify-machineinstrs < %s \| FileCheck %s --check-prefixes=CHECK,RV32
				; RUN: llc -mtriple=riscv64 -mattr=+d,+zfh,+v -target-abi=lp64d \
				; RUN: -verify-machineinstrs < %s \| FileCheck %s --check-prefixes=CHECK,RV64

				declare <vscale x 1 x i8> @llvm.vp.merge.nxv1i8(<vscale x 1 x i1>, <vscale x 1 x i8>, <vscale x 1 x i8>, i32)

				define <vscale x 1 x i8> @vpmerge_vv_nxv1i8(<vscale x 1 x i8> %va, <vscale x 1 x i8> %vb, <vscale x 1 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vv_nxv1i8:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e8, mf8, tu, mu
				; CHECK-NEXT: vmerge.vvm v9, v9, v8, v0
				; CHECK-NEXT: vmv1r.v v8, v9
				; CHECK-NEXT: ret
				%v = call <vscale x 1 x i8> @llvm.vp.merge.nxv1i8(<vscale x 1 x i1> %m, <vscale x 1 x i8> %va, <vscale x 1 x i8> %vb, i32 %evl)
				ret <vscale x 1 x i8> %v
				}

				define <vscale x 1 x i8> @vpmerge_vx_nxv1i8(i8 %a, <vscale x 1 x i8> %vb, <vscale x 1 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vx_nxv1i8:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a1, e8, mf8, tu, mu
				; CHECK-NEXT: vmerge.vxm v8, v8, a0, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <vscale x 1 x i8> poison, i8 %a, i32 0
				%va = shufflevector <vscale x 1 x i8> %elt.head, <vscale x 1 x i8> poison, <vscale x 1 x i32> zeroinitializer
				%v = call <vscale x 1 x i8> @llvm.vp.merge.nxv1i8(<vscale x 1 x i1> %m, <vscale x 1 x i8> %va, <vscale x 1 x i8> %vb, i32 %evl)
				ret <vscale x 1 x i8> %v
				}

				define <vscale x 1 x i8> @vpmerge_vi_nxv1i8(<vscale x 1 x i8> %vb, <vscale x 1 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vi_nxv1i8:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e8, mf8, tu, mu
				; CHECK-NEXT: vmerge.vim v8, v8, 2, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <vscale x 1 x i8> poison, i8 2, i32 0
				%va = shufflevector <vscale x 1 x i8> %elt.head, <vscale x 1 x i8> poison, <vscale x 1 x i32> zeroinitializer
				%v = call <vscale x 1 x i8> @llvm.vp.merge.nxv1i8(<vscale x 1 x i1> %m, <vscale x 1 x i8> %va, <vscale x 1 x i8> %vb, i32 %evl)
				ret <vscale x 1 x i8> %v
				}

				declare <vscale x 2 x i8> @llvm.vp.merge.nxv2i8(<vscale x 2 x i1>, <vscale x 2 x i8>, <vscale x 2 x i8>, i32)

				define <vscale x 2 x i8> @vpmerge_vv_nxv2i8(<vscale x 2 x i8> %va, <vscale x 2 x i8> %vb, <vscale x 2 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vv_nxv2i8:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e8, mf4, tu, mu
				; CHECK-NEXT: vmerge.vvm v9, v9, v8, v0
				; CHECK-NEXT: vmv1r.v v8, v9
				; CHECK-NEXT: ret
				%v = call <vscale x 2 x i8> @llvm.vp.merge.nxv2i8(<vscale x 2 x i1> %m, <vscale x 2 x i8> %va, <vscale x 2 x i8> %vb, i32 %evl)
				ret <vscale x 2 x i8> %v
				}

				define <vscale x 2 x i8> @vpmerge_vx_nxv2i8(i8 %a, <vscale x 2 x i8> %vb, <vscale x 2 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vx_nxv2i8:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a1, e8, mf4, tu, mu
				; CHECK-NEXT: vmerge.vxm v8, v8, a0, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <vscale x 2 x i8> poison, i8 %a, i32 0
				%va = shufflevector <vscale x 2 x i8> %elt.head, <vscale x 2 x i8> poison, <vscale x 2 x i32> zeroinitializer
				%v = call <vscale x 2 x i8> @llvm.vp.merge.nxv2i8(<vscale x 2 x i1> %m, <vscale x 2 x i8> %va, <vscale x 2 x i8> %vb, i32 %evl)
				ret <vscale x 2 x i8> %v
				}

				define <vscale x 2 x i8> @vpmerge_vi_nxv2i8(<vscale x 2 x i8> %vb, <vscale x 2 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vi_nxv2i8:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e8, mf4, tu, mu
				; CHECK-NEXT: vmerge.vim v8, v8, 2, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <vscale x 2 x i8> poison, i8 2, i32 0
				%va = shufflevector <vscale x 2 x i8> %elt.head, <vscale x 2 x i8> poison, <vscale x 2 x i32> zeroinitializer
				%v = call <vscale x 2 x i8> @llvm.vp.merge.nxv2i8(<vscale x 2 x i1> %m, <vscale x 2 x i8> %va, <vscale x 2 x i8> %vb, i32 %evl)
				ret <vscale x 2 x i8> %v
				}

				declare <vscale x 4 x i8> @llvm.vp.merge.nxv4i8(<vscale x 4 x i1>, <vscale x 4 x i8>, <vscale x 4 x i8>, i32)

				define <vscale x 4 x i8> @vpmerge_vv_nxv4i8(<vscale x 4 x i8> %va, <vscale x 4 x i8> %vb, <vscale x 4 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vv_nxv4i8:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e8, mf2, tu, mu
				; CHECK-NEXT: vmerge.vvm v9, v9, v8, v0
				; CHECK-NEXT: vmv1r.v v8, v9
				; CHECK-NEXT: ret
				%v = call <vscale x 4 x i8> @llvm.vp.merge.nxv4i8(<vscale x 4 x i1> %m, <vscale x 4 x i8> %va, <vscale x 4 x i8> %vb, i32 %evl)
				ret <vscale x 4 x i8> %v
				}

				define <vscale x 4 x i8> @vpmerge_vx_nxv4i8(i8 %a, <vscale x 4 x i8> %vb, <vscale x 4 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vx_nxv4i8:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a1, e8, mf2, tu, mu
				; CHECK-NEXT: vmerge.vxm v8, v8, a0, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <vscale x 4 x i8> poison, i8 %a, i32 0
				%va = shufflevector <vscale x 4 x i8> %elt.head, <vscale x 4 x i8> poison, <vscale x 4 x i32> zeroinitializer
				%v = call <vscale x 4 x i8> @llvm.vp.merge.nxv4i8(<vscale x 4 x i1> %m, <vscale x 4 x i8> %va, <vscale x 4 x i8> %vb, i32 %evl)
				ret <vscale x 4 x i8> %v
				}

				define <vscale x 4 x i8> @vpmerge_vi_nxv4i8(<vscale x 4 x i8> %vb, <vscale x 4 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vi_nxv4i8:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e8, mf2, tu, mu
				; CHECK-NEXT: vmerge.vim v8, v8, 2, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <vscale x 4 x i8> poison, i8 2, i32 0
				%va = shufflevector <vscale x 4 x i8> %elt.head, <vscale x 4 x i8> poison, <vscale x 4 x i32> zeroinitializer
				%v = call <vscale x 4 x i8> @llvm.vp.merge.nxv4i8(<vscale x 4 x i1> %m, <vscale x 4 x i8> %va, <vscale x 4 x i8> %vb, i32 %evl)
				ret <vscale x 4 x i8> %v
				}

				declare <vscale x 8 x i8> @llvm.vp.merge.nxv8i8(<vscale x 8 x i1>, <vscale x 8 x i8>, <vscale x 8 x i8>, i32)

				define <vscale x 8 x i8> @vpmerge_vv_nxv8i8(<vscale x 8 x i8> %va, <vscale x 8 x i8> %vb, <vscale x 8 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vv_nxv8i8:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e8, m1, tu, mu
				; CHECK-NEXT: vmerge.vvm v9, v9, v8, v0
				; CHECK-NEXT: vmv1r.v v8, v9
				; CHECK-NEXT: ret
				%v = call <vscale x 8 x i8> @llvm.vp.merge.nxv8i8(<vscale x 8 x i1> %m, <vscale x 8 x i8> %va, <vscale x 8 x i8> %vb, i32 %evl)
				ret <vscale x 8 x i8> %v
				}

				define <vscale x 8 x i8> @vpmerge_vx_nxv8i8(i8 %a, <vscale x 8 x i8> %vb, <vscale x 8 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vx_nxv8i8:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a1, e8, m1, tu, mu
				; CHECK-NEXT: vmerge.vxm v8, v8, a0, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <vscale x 8 x i8> poison, i8 %a, i32 0
				%va = shufflevector <vscale x 8 x i8> %elt.head, <vscale x 8 x i8> poison, <vscale x 8 x i32> zeroinitializer
				%v = call <vscale x 8 x i8> @llvm.vp.merge.nxv8i8(<vscale x 8 x i1> %m, <vscale x 8 x i8> %va, <vscale x 8 x i8> %vb, i32 %evl)
				ret <vscale x 8 x i8> %v
				}

				define <vscale x 8 x i8> @vpmerge_vi_nxv8i8(<vscale x 8 x i8> %vb, <vscale x 8 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vi_nxv8i8:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e8, m1, tu, mu
				; CHECK-NEXT: vmerge.vim v8, v8, 2, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <vscale x 8 x i8> poison, i8 2, i32 0
				%va = shufflevector <vscale x 8 x i8> %elt.head, <vscale x 8 x i8> poison, <vscale x 8 x i32> zeroinitializer
				%v = call <vscale x 8 x i8> @llvm.vp.merge.nxv8i8(<vscale x 8 x i1> %m, <vscale x 8 x i8> %va, <vscale x 8 x i8> %vb, i32 %evl)
				ret <vscale x 8 x i8> %v
				}

				declare <vscale x 16 x i8> @llvm.vp.merge.nxv16i8(<vscale x 16 x i1>, <vscale x 16 x i8>, <vscale x 16 x i8>, i32)

				define <vscale x 16 x i8> @vpmerge_vv_nxv16i8(<vscale x 16 x i8> %va, <vscale x 16 x i8> %vb, <vscale x 16 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vv_nxv16i8:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e8, m2, tu, mu
				; CHECK-NEXT: vmerge.vvm v10, v10, v8, v0
				; CHECK-NEXT: vmv2r.v v8, v10
				; CHECK-NEXT: ret
				%v = call <vscale x 16 x i8> @llvm.vp.merge.nxv16i8(<vscale x 16 x i1> %m, <vscale x 16 x i8> %va, <vscale x 16 x i8> %vb, i32 %evl)
				ret <vscale x 16 x i8> %v
				}

				define <vscale x 16 x i8> @vpmerge_vx_nxv16i8(i8 %a, <vscale x 16 x i8> %vb, <vscale x 16 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vx_nxv16i8:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a1, e8, m2, tu, mu
				; CHECK-NEXT: vmerge.vxm v8, v8, a0, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <vscale x 16 x i8> poison, i8 %a, i32 0
				%va = shufflevector <vscale x 16 x i8> %elt.head, <vscale x 16 x i8> poison, <vscale x 16 x i32> zeroinitializer
				%v = call <vscale x 16 x i8> @llvm.vp.merge.nxv16i8(<vscale x 16 x i1> %m, <vscale x 16 x i8> %va, <vscale x 16 x i8> %vb, i32 %evl)
				ret <vscale x 16 x i8> %v
				}

				define <vscale x 16 x i8> @vpmerge_vi_nxv16i8(<vscale x 16 x i8> %vb, <vscale x 16 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vi_nxv16i8:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e8, m2, tu, mu
				; CHECK-NEXT: vmerge.vim v8, v8, 2, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <vscale x 16 x i8> poison, i8 2, i32 0
				%va = shufflevector <vscale x 16 x i8> %elt.head, <vscale x 16 x i8> poison, <vscale x 16 x i32> zeroinitializer
				%v = call <vscale x 16 x i8> @llvm.vp.merge.nxv16i8(<vscale x 16 x i1> %m, <vscale x 16 x i8> %va, <vscale x 16 x i8> %vb, i32 %evl)
				ret <vscale x 16 x i8> %v
				}

				declare <vscale x 32 x i8> @llvm.vp.merge.nxv32i8(<vscale x 32 x i1>, <vscale x 32 x i8>, <vscale x 32 x i8>, i32)

				define <vscale x 32 x i8> @vpmerge_vv_nxv32i8(<vscale x 32 x i8> %va, <vscale x 32 x i8> %vb, <vscale x 32 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vv_nxv32i8:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e8, m4, tu, mu
				; CHECK-NEXT: vmerge.vvm v12, v12, v8, v0
				; CHECK-NEXT: vmv4r.v v8, v12
				; CHECK-NEXT: ret
				%v = call <vscale x 32 x i8> @llvm.vp.merge.nxv32i8(<vscale x 32 x i1> %m, <vscale x 32 x i8> %va, <vscale x 32 x i8> %vb, i32 %evl)
				ret <vscale x 32 x i8> %v
				}

				define <vscale x 32 x i8> @vpmerge_vx_nxv32i8(i8 %a, <vscale x 32 x i8> %vb, <vscale x 32 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vx_nxv32i8:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a1, e8, m4, tu, mu
				; CHECK-NEXT: vmerge.vxm v8, v8, a0, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <vscale x 32 x i8> poison, i8 %a, i32 0
				%va = shufflevector <vscale x 32 x i8> %elt.head, <vscale x 32 x i8> poison, <vscale x 32 x i32> zeroinitializer
				%v = call <vscale x 32 x i8> @llvm.vp.merge.nxv32i8(<vscale x 32 x i1> %m, <vscale x 32 x i8> %va, <vscale x 32 x i8> %vb, i32 %evl)
				ret <vscale x 32 x i8> %v
				}

				define <vscale x 32 x i8> @vpmerge_vi_nxv32i8(<vscale x 32 x i8> %vb, <vscale x 32 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vi_nxv32i8:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e8, m4, tu, mu
				; CHECK-NEXT: vmerge.vim v8, v8, 2, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <vscale x 32 x i8> poison, i8 2, i32 0
				%va = shufflevector <vscale x 32 x i8> %elt.head, <vscale x 32 x i8> poison, <vscale x 32 x i32> zeroinitializer
				%v = call <vscale x 32 x i8> @llvm.vp.merge.nxv32i8(<vscale x 32 x i1> %m, <vscale x 32 x i8> %va, <vscale x 32 x i8> %vb, i32 %evl)
				ret <vscale x 32 x i8> %v
				}

				declare <vscale x 64 x i8> @llvm.vp.merge.nxv64i8(<vscale x 64 x i1>, <vscale x 64 x i8>, <vscale x 64 x i8>, i32)

				define <vscale x 64 x i8> @vpmerge_vv_nxv64i8(<vscale x 64 x i8> %va, <vscale x 64 x i8> %vb, <vscale x 64 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vv_nxv64i8:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e8, m8, tu, mu
				; CHECK-NEXT: vmerge.vvm v16, v16, v8, v0
				; CHECK-NEXT: vmv8r.v v8, v16
				; CHECK-NEXT: ret
				%v = call <vscale x 64 x i8> @llvm.vp.merge.nxv64i8(<vscale x 64 x i1> %m, <vscale x 64 x i8> %va, <vscale x 64 x i8> %vb, i32 %evl)
				ret <vscale x 64 x i8> %v
				}

				define <vscale x 64 x i8> @vpmerge_vx_nxv64i8(i8 %a, <vscale x 64 x i8> %vb, <vscale x 64 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vx_nxv64i8:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a1, e8, m8, tu, mu
				; CHECK-NEXT: vmerge.vxm v8, v8, a0, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <vscale x 64 x i8> poison, i8 %a, i32 0
				%va = shufflevector <vscale x 64 x i8> %elt.head, <vscale x 64 x i8> poison, <vscale x 64 x i32> zeroinitializer
				%v = call <vscale x 64 x i8> @llvm.vp.merge.nxv64i8(<vscale x 64 x i1> %m, <vscale x 64 x i8> %va, <vscale x 64 x i8> %vb, i32 %evl)
				ret <vscale x 64 x i8> %v
				}

				define <vscale x 64 x i8> @vpmerge_vi_nxv64i8(<vscale x 64 x i8> %vb, <vscale x 64 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vi_nxv64i8:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e8, m8, tu, mu
				; CHECK-NEXT: vmerge.vim v8, v8, 2, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <vscale x 64 x i8> poison, i8 2, i32 0
				%va = shufflevector <vscale x 64 x i8> %elt.head, <vscale x 64 x i8> poison, <vscale x 64 x i32> zeroinitializer
				%v = call <vscale x 64 x i8> @llvm.vp.merge.nxv64i8(<vscale x 64 x i1> %m, <vscale x 64 x i8> %va, <vscale x 64 x i8> %vb, i32 %evl)
				ret <vscale x 64 x i8> %v
				}

				declare <vscale x 1 x i16> @llvm.vp.merge.nxv1i16(<vscale x 1 x i1>, <vscale x 1 x i16>, <vscale x 1 x i16>, i32)

				define <vscale x 1 x i16> @vpmerge_vv_nxv1i16(<vscale x 1 x i16> %va, <vscale x 1 x i16> %vb, <vscale x 1 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vv_nxv1i16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e16, mf4, tu, mu
				; CHECK-NEXT: vmerge.vvm v9, v9, v8, v0
				; CHECK-NEXT: vmv1r.v v8, v9
				; CHECK-NEXT: ret
				%v = call <vscale x 1 x i16> @llvm.vp.merge.nxv1i16(<vscale x 1 x i1> %m, <vscale x 1 x i16> %va, <vscale x 1 x i16> %vb, i32 %evl)
				ret <vscale x 1 x i16> %v
				}

				define <vscale x 1 x i16> @vpmerge_vx_nxv1i16(i16 %a, <vscale x 1 x i16> %vb, <vscale x 1 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vx_nxv1i16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a1, e16, mf4, tu, mu
				; CHECK-NEXT: vmerge.vxm v8, v8, a0, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <vscale x 1 x i16> poison, i16 %a, i32 0
				%va = shufflevector <vscale x 1 x i16> %elt.head, <vscale x 1 x i16> poison, <vscale x 1 x i32> zeroinitializer
				%v = call <vscale x 1 x i16> @llvm.vp.merge.nxv1i16(<vscale x 1 x i1> %m, <vscale x 1 x i16> %va, <vscale x 1 x i16> %vb, i32 %evl)
				ret <vscale x 1 x i16> %v
				}

				define <vscale x 1 x i16> @vpmerge_vi_nxv1i16(<vscale x 1 x i16> %vb, <vscale x 1 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vi_nxv1i16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e16, mf4, tu, mu
				; CHECK-NEXT: vmerge.vim v8, v8, 2, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <vscale x 1 x i16> poison, i16 2, i32 0
				%va = shufflevector <vscale x 1 x i16> %elt.head, <vscale x 1 x i16> poison, <vscale x 1 x i32> zeroinitializer
				%v = call <vscale x 1 x i16> @llvm.vp.merge.nxv1i16(<vscale x 1 x i1> %m, <vscale x 1 x i16> %va, <vscale x 1 x i16> %vb, i32 %evl)
				ret <vscale x 1 x i16> %v
				}

				declare <vscale x 2 x i16> @llvm.vp.merge.nxv2i16(<vscale x 2 x i1>, <vscale x 2 x i16>, <vscale x 2 x i16>, i32)

				define <vscale x 2 x i16> @vpmerge_vv_nxv2i16(<vscale x 2 x i16> %va, <vscale x 2 x i16> %vb, <vscale x 2 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vv_nxv2i16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e16, mf2, tu, mu
				; CHECK-NEXT: vmerge.vvm v9, v9, v8, v0
				; CHECK-NEXT: vmv1r.v v8, v9
				; CHECK-NEXT: ret
				%v = call <vscale x 2 x i16> @llvm.vp.merge.nxv2i16(<vscale x 2 x i1> %m, <vscale x 2 x i16> %va, <vscale x 2 x i16> %vb, i32 %evl)
				ret <vscale x 2 x i16> %v
				}

				define <vscale x 2 x i16> @vpmerge_vx_nxv2i16(i16 %a, <vscale x 2 x i16> %vb, <vscale x 2 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vx_nxv2i16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a1, e16, mf2, tu, mu
				; CHECK-NEXT: vmerge.vxm v8, v8, a0, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <vscale x 2 x i16> poison, i16 %a, i32 0
				%va = shufflevector <vscale x 2 x i16> %elt.head, <vscale x 2 x i16> poison, <vscale x 2 x i32> zeroinitializer
				%v = call <vscale x 2 x i16> @llvm.vp.merge.nxv2i16(<vscale x 2 x i1> %m, <vscale x 2 x i16> %va, <vscale x 2 x i16> %vb, i32 %evl)
				ret <vscale x 2 x i16> %v
				}

				define <vscale x 2 x i16> @vpmerge_vi_nxv2i16(<vscale x 2 x i16> %vb, <vscale x 2 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vi_nxv2i16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e16, mf2, tu, mu
				; CHECK-NEXT: vmerge.vim v8, v8, 2, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <vscale x 2 x i16> poison, i16 2, i32 0
				%va = shufflevector <vscale x 2 x i16> %elt.head, <vscale x 2 x i16> poison, <vscale x 2 x i32> zeroinitializer
				%v = call <vscale x 2 x i16> @llvm.vp.merge.nxv2i16(<vscale x 2 x i1> %m, <vscale x 2 x i16> %va, <vscale x 2 x i16> %vb, i32 %evl)
				ret <vscale x 2 x i16> %v
				}

				declare <vscale x 4 x i16> @llvm.vp.merge.nxv4i16(<vscale x 4 x i1>, <vscale x 4 x i16>, <vscale x 4 x i16>, i32)

				define <vscale x 4 x i16> @vpmerge_vv_nxv4i16(<vscale x 4 x i16> %va, <vscale x 4 x i16> %vb, <vscale x 4 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vv_nxv4i16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e16, m1, tu, mu
				; CHECK-NEXT: vmerge.vvm v9, v9, v8, v0
				; CHECK-NEXT: vmv1r.v v8, v9
				; CHECK-NEXT: ret
				%v = call <vscale x 4 x i16> @llvm.vp.merge.nxv4i16(<vscale x 4 x i1> %m, <vscale x 4 x i16> %va, <vscale x 4 x i16> %vb, i32 %evl)
				ret <vscale x 4 x i16> %v
				}

				define <vscale x 4 x i16> @vpmerge_vx_nxv4i16(i16 %a, <vscale x 4 x i16> %vb, <vscale x 4 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vx_nxv4i16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a1, e16, m1, tu, mu
				; CHECK-NEXT: vmerge.vxm v8, v8, a0, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <vscale x 4 x i16> poison, i16 %a, i32 0
				%va = shufflevector <vscale x 4 x i16> %elt.head, <vscale x 4 x i16> poison, <vscale x 4 x i32> zeroinitializer
				%v = call <vscale x 4 x i16> @llvm.vp.merge.nxv4i16(<vscale x 4 x i1> %m, <vscale x 4 x i16> %va, <vscale x 4 x i16> %vb, i32 %evl)
				ret <vscale x 4 x i16> %v
				}

				define <vscale x 4 x i16> @vpmerge_vi_nxv4i16(<vscale x 4 x i16> %vb, <vscale x 4 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vi_nxv4i16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e16, m1, tu, mu
				; CHECK-NEXT: vmerge.vim v8, v8, 2, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <vscale x 4 x i16> poison, i16 2, i32 0
				%va = shufflevector <vscale x 4 x i16> %elt.head, <vscale x 4 x i16> poison, <vscale x 4 x i32> zeroinitializer
				%v = call <vscale x 4 x i16> @llvm.vp.merge.nxv4i16(<vscale x 4 x i1> %m, <vscale x 4 x i16> %va, <vscale x 4 x i16> %vb, i32 %evl)
				ret <vscale x 4 x i16> %v
				}

				declare <vscale x 8 x i16> @llvm.vp.merge.nxv8i16(<vscale x 8 x i1>, <vscale x 8 x i16>, <vscale x 8 x i16>, i32)

				define <vscale x 8 x i16> @vpmerge_vv_nxv8i16(<vscale x 8 x i16> %va, <vscale x 8 x i16> %vb, <vscale x 8 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vv_nxv8i16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e16, m2, tu, mu
				; CHECK-NEXT: vmerge.vvm v10, v10, v8, v0
				; CHECK-NEXT: vmv2r.v v8, v10
				; CHECK-NEXT: ret
				%v = call <vscale x 8 x i16> @llvm.vp.merge.nxv8i16(<vscale x 8 x i1> %m, <vscale x 8 x i16> %va, <vscale x 8 x i16> %vb, i32 %evl)
				ret <vscale x 8 x i16> %v
				}

				define <vscale x 8 x i16> @vpmerge_vx_nxv8i16(i16 %a, <vscale x 8 x i16> %vb, <vscale x 8 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vx_nxv8i16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a1, e16, m2, tu, mu
				; CHECK-NEXT: vmerge.vxm v8, v8, a0, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <vscale x 8 x i16> poison, i16 %a, i32 0
				%va = shufflevector <vscale x 8 x i16> %elt.head, <vscale x 8 x i16> poison, <vscale x 8 x i32> zeroinitializer
				%v = call <vscale x 8 x i16> @llvm.vp.merge.nxv8i16(<vscale x 8 x i1> %m, <vscale x 8 x i16> %va, <vscale x 8 x i16> %vb, i32 %evl)
				ret <vscale x 8 x i16> %v
				}

				define <vscale x 8 x i16> @vpmerge_vi_nxv8i16(<vscale x 8 x i16> %vb, <vscale x 8 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vi_nxv8i16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e16, m2, tu, mu
				; CHECK-NEXT: vmerge.vim v8, v8, 2, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <vscale x 8 x i16> poison, i16 2, i32 0
				%va = shufflevector <vscale x 8 x i16> %elt.head, <vscale x 8 x i16> poison, <vscale x 8 x i32> zeroinitializer
				%v = call <vscale x 8 x i16> @llvm.vp.merge.nxv8i16(<vscale x 8 x i1> %m, <vscale x 8 x i16> %va, <vscale x 8 x i16> %vb, i32 %evl)
				ret <vscale x 8 x i16> %v
				}

				declare <vscale x 16 x i16> @llvm.vp.merge.nxv16i16(<vscale x 16 x i1>, <vscale x 16 x i16>, <vscale x 16 x i16>, i32)

				define <vscale x 16 x i16> @vpmerge_vv_nxv16i16(<vscale x 16 x i16> %va, <vscale x 16 x i16> %vb, <vscale x 16 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vv_nxv16i16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e16, m4, tu, mu
				; CHECK-NEXT: vmerge.vvm v12, v12, v8, v0
				; CHECK-NEXT: vmv4r.v v8, v12
				; CHECK-NEXT: ret
				%v = call <vscale x 16 x i16> @llvm.vp.merge.nxv16i16(<vscale x 16 x i1> %m, <vscale x 16 x i16> %va, <vscale x 16 x i16> %vb, i32 %evl)
				ret <vscale x 16 x i16> %v
				}

				define <vscale x 16 x i16> @vpmerge_vx_nxv16i16(i16 %a, <vscale x 16 x i16> %vb, <vscale x 16 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vx_nxv16i16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a1, e16, m4, tu, mu
				; CHECK-NEXT: vmerge.vxm v8, v8, a0, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <vscale x 16 x i16> poison, i16 %a, i32 0
				%va = shufflevector <vscale x 16 x i16> %elt.head, <vscale x 16 x i16> poison, <vscale x 16 x i32> zeroinitializer
				%v = call <vscale x 16 x i16> @llvm.vp.merge.nxv16i16(<vscale x 16 x i1> %m, <vscale x 16 x i16> %va, <vscale x 16 x i16> %vb, i32 %evl)
				ret <vscale x 16 x i16> %v
				}

				define <vscale x 16 x i16> @vpmerge_vi_nxv16i16(<vscale x 16 x i16> %vb, <vscale x 16 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vi_nxv16i16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e16, m4, tu, mu
				; CHECK-NEXT: vmerge.vim v8, v8, 2, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <vscale x 16 x i16> poison, i16 2, i32 0
				%va = shufflevector <vscale x 16 x i16> %elt.head, <vscale x 16 x i16> poison, <vscale x 16 x i32> zeroinitializer
				%v = call <vscale x 16 x i16> @llvm.vp.merge.nxv16i16(<vscale x 16 x i1> %m, <vscale x 16 x i16> %va, <vscale x 16 x i16> %vb, i32 %evl)
				ret <vscale x 16 x i16> %v
				}

				declare <vscale x 32 x i16> @llvm.vp.merge.nxv32i16(<vscale x 32 x i1>, <vscale x 32 x i16>, <vscale x 32 x i16>, i32)

				define <vscale x 32 x i16> @vpmerge_vv_nxv32i16(<vscale x 32 x i16> %va, <vscale x 32 x i16> %vb, <vscale x 32 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vv_nxv32i16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e16, m8, tu, mu
				; CHECK-NEXT: vmerge.vvm v16, v16, v8, v0
				; CHECK-NEXT: vmv8r.v v8, v16
				; CHECK-NEXT: ret
				%v = call <vscale x 32 x i16> @llvm.vp.merge.nxv32i16(<vscale x 32 x i1> %m, <vscale x 32 x i16> %va, <vscale x 32 x i16> %vb, i32 %evl)
				ret <vscale x 32 x i16> %v
				}

				define <vscale x 32 x i16> @vpmerge_vx_nxv32i16(i16 %a, <vscale x 32 x i16> %vb, <vscale x 32 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vx_nxv32i16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a1, e16, m8, tu, mu
				; CHECK-NEXT: vmerge.vxm v8, v8, a0, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <vscale x 32 x i16> poison, i16 %a, i32 0
				%va = shufflevector <vscale x 32 x i16> %elt.head, <vscale x 32 x i16> poison, <vscale x 32 x i32> zeroinitializer
				%v = call <vscale x 32 x i16> @llvm.vp.merge.nxv32i16(<vscale x 32 x i1> %m, <vscale x 32 x i16> %va, <vscale x 32 x i16> %vb, i32 %evl)
				ret <vscale x 32 x i16> %v
				}

				define <vscale x 32 x i16> @vpmerge_vi_nxv32i16(<vscale x 32 x i16> %vb, <vscale x 32 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vi_nxv32i16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e16, m8, tu, mu
				; CHECK-NEXT: vmerge.vim v8, v8, 2, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <vscale x 32 x i16> poison, i16 2, i32 0
				%va = shufflevector <vscale x 32 x i16> %elt.head, <vscale x 32 x i16> poison, <vscale x 32 x i32> zeroinitializer
				%v = call <vscale x 32 x i16> @llvm.vp.merge.nxv32i16(<vscale x 32 x i1> %m, <vscale x 32 x i16> %va, <vscale x 32 x i16> %vb, i32 %evl)
				ret <vscale x 32 x i16> %v
				}

				declare <vscale x 1 x i32> @llvm.vp.merge.nxv1i32(<vscale x 1 x i1>, <vscale x 1 x i32>, <vscale x 1 x i32>, i32)

				define <vscale x 1 x i32> @vpmerge_vv_nxv1i32(<vscale x 1 x i32> %va, <vscale x 1 x i32> %vb, <vscale x 1 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vv_nxv1i32:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e32, mf2, tu, mu
				; CHECK-NEXT: vmerge.vvm v9, v9, v8, v0
				; CHECK-NEXT: vmv1r.v v8, v9
				; CHECK-NEXT: ret
				%v = call <vscale x 1 x i32> @llvm.vp.merge.nxv1i32(<vscale x 1 x i1> %m, <vscale x 1 x i32> %va, <vscale x 1 x i32> %vb, i32 %evl)
				ret <vscale x 1 x i32> %v
				}

				define <vscale x 1 x i32> @vpmerge_vx_nxv1i32(i32 %a, <vscale x 1 x i32> %vb, <vscale x 1 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vx_nxv1i32:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a1, e32, mf2, tu, mu
				; CHECK-NEXT: vmerge.vxm v8, v8, a0, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <vscale x 1 x i32> poison, i32 %a, i32 0
				%va = shufflevector <vscale x 1 x i32> %elt.head, <vscale x 1 x i32> poison, <vscale x 1 x i32> zeroinitializer
				%v = call <vscale x 1 x i32> @llvm.vp.merge.nxv1i32(<vscale x 1 x i1> %m, <vscale x 1 x i32> %va, <vscale x 1 x i32> %vb, i32 %evl)
				ret <vscale x 1 x i32> %v
				}

				define <vscale x 1 x i32> @vpmerge_vi_nxv1i32(<vscale x 1 x i32> %vb, <vscale x 1 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vi_nxv1i32:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e32, mf2, tu, mu
				; CHECK-NEXT: vmerge.vim v8, v8, 2, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <vscale x 1 x i32> poison, i32 2, i32 0
				%va = shufflevector <vscale x 1 x i32> %elt.head, <vscale x 1 x i32> poison, <vscale x 1 x i32> zeroinitializer
				%v = call <vscale x 1 x i32> @llvm.vp.merge.nxv1i32(<vscale x 1 x i1> %m, <vscale x 1 x i32> %va, <vscale x 1 x i32> %vb, i32 %evl)
				ret <vscale x 1 x i32> %v
				}

				declare <vscale x 2 x i32> @llvm.vp.merge.nxv2i32(<vscale x 2 x i1>, <vscale x 2 x i32>, <vscale x 2 x i32>, i32)

				define <vscale x 2 x i32> @vpmerge_vv_nxv2i32(<vscale x 2 x i32> %va, <vscale x 2 x i32> %vb, <vscale x 2 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vv_nxv2i32:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e32, m1, tu, mu
				; CHECK-NEXT: vmerge.vvm v9, v9, v8, v0
				; CHECK-NEXT: vmv1r.v v8, v9
				; CHECK-NEXT: ret
				%v = call <vscale x 2 x i32> @llvm.vp.merge.nxv2i32(<vscale x 2 x i1> %m, <vscale x 2 x i32> %va, <vscale x 2 x i32> %vb, i32 %evl)
				ret <vscale x 2 x i32> %v
				}

				define <vscale x 2 x i32> @vpmerge_vx_nxv2i32(i32 %a, <vscale x 2 x i32> %vb, <vscale x 2 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vx_nxv2i32:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a1, e32, m1, tu, mu
				; CHECK-NEXT: vmerge.vxm v8, v8, a0, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <vscale x 2 x i32> poison, i32 %a, i32 0
				%va = shufflevector <vscale x 2 x i32> %elt.head, <vscale x 2 x i32> poison, <vscale x 2 x i32> zeroinitializer
				%v = call <vscale x 2 x i32> @llvm.vp.merge.nxv2i32(<vscale x 2 x i1> %m, <vscale x 2 x i32> %va, <vscale x 2 x i32> %vb, i32 %evl)
				ret <vscale x 2 x i32> %v
				}

				define <vscale x 2 x i32> @vpmerge_vi_nxv2i32(<vscale x 2 x i32> %vb, <vscale x 2 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vi_nxv2i32:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e32, m1, tu, mu
				; CHECK-NEXT: vmerge.vim v8, v8, 2, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <vscale x 2 x i32> poison, i32 2, i32 0
				%va = shufflevector <vscale x 2 x i32> %elt.head, <vscale x 2 x i32> poison, <vscale x 2 x i32> zeroinitializer
				%v = call <vscale x 2 x i32> @llvm.vp.merge.nxv2i32(<vscale x 2 x i1> %m, <vscale x 2 x i32> %va, <vscale x 2 x i32> %vb, i32 %evl)
				ret <vscale x 2 x i32> %v
				}

				declare <vscale x 4 x i32> @llvm.vp.merge.nxv4i32(<vscale x 4 x i1>, <vscale x 4 x i32>, <vscale x 4 x i32>, i32)

				define <vscale x 4 x i32> @vpmerge_vv_nxv4i32(<vscale x 4 x i32> %va, <vscale x 4 x i32> %vb, <vscale x 4 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vv_nxv4i32:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e32, m2, tu, mu
				; CHECK-NEXT: vmerge.vvm v10, v10, v8, v0
				; CHECK-NEXT: vmv2r.v v8, v10
				; CHECK-NEXT: ret
				%v = call <vscale x 4 x i32> @llvm.vp.merge.nxv4i32(<vscale x 4 x i1> %m, <vscale x 4 x i32> %va, <vscale x 4 x i32> %vb, i32 %evl)
				ret <vscale x 4 x i32> %v
				}

				define <vscale x 4 x i32> @vpmerge_vx_nxv4i32(i32 %a, <vscale x 4 x i32> %vb, <vscale x 4 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vx_nxv4i32:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a1, e32, m2, tu, mu
				; CHECK-NEXT: vmerge.vxm v8, v8, a0, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <vscale x 4 x i32> poison, i32 %a, i32 0
				%va = shufflevector <vscale x 4 x i32> %elt.head, <vscale x 4 x i32> poison, <vscale x 4 x i32> zeroinitializer
				%v = call <vscale x 4 x i32> @llvm.vp.merge.nxv4i32(<vscale x 4 x i1> %m, <vscale x 4 x i32> %va, <vscale x 4 x i32> %vb, i32 %evl)
				ret <vscale x 4 x i32> %v
				}

				define <vscale x 4 x i32> @vpmerge_vi_nxv4i32(<vscale x 4 x i32> %vb, <vscale x 4 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vi_nxv4i32:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e32, m2, tu, mu
				; CHECK-NEXT: vmerge.vim v8, v8, 2, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <vscale x 4 x i32> poison, i32 2, i32 0
				%va = shufflevector <vscale x 4 x i32> %elt.head, <vscale x 4 x i32> poison, <vscale x 4 x i32> zeroinitializer
				%v = call <vscale x 4 x i32> @llvm.vp.merge.nxv4i32(<vscale x 4 x i1> %m, <vscale x 4 x i32> %va, <vscale x 4 x i32> %vb, i32 %evl)
				ret <vscale x 4 x i32> %v
				}

				declare <vscale x 8 x i32> @llvm.vp.merge.nxv8i32(<vscale x 8 x i1>, <vscale x 8 x i32>, <vscale x 8 x i32>, i32)

				define <vscale x 8 x i32> @vpmerge_vv_nxv8i32(<vscale x 8 x i32> %va, <vscale x 8 x i32> %vb, <vscale x 8 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vv_nxv8i32:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e32, m4, tu, mu
				; CHECK-NEXT: vmerge.vvm v12, v12, v8, v0
				; CHECK-NEXT: vmv4r.v v8, v12
				; CHECK-NEXT: ret
				%v = call <vscale x 8 x i32> @llvm.vp.merge.nxv8i32(<vscale x 8 x i1> %m, <vscale x 8 x i32> %va, <vscale x 8 x i32> %vb, i32 %evl)
				ret <vscale x 8 x i32> %v
				}

				define <vscale x 8 x i32> @vpmerge_vx_nxv8i32(i32 %a, <vscale x 8 x i32> %vb, <vscale x 8 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vx_nxv8i32:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a1, e32, m4, tu, mu
				; CHECK-NEXT: vmerge.vxm v8, v8, a0, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <vscale x 8 x i32> poison, i32 %a, i32 0
				%va = shufflevector <vscale x 8 x i32> %elt.head, <vscale x 8 x i32> poison, <vscale x 8 x i32> zeroinitializer
				%v = call <vscale x 8 x i32> @llvm.vp.merge.nxv8i32(<vscale x 8 x i1> %m, <vscale x 8 x i32> %va, <vscale x 8 x i32> %vb, i32 %evl)
				ret <vscale x 8 x i32> %v
				}

				define <vscale x 8 x i32> @vpmerge_vi_nxv8i32(<vscale x 8 x i32> %vb, <vscale x 8 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vi_nxv8i32:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e32, m4, tu, mu
				; CHECK-NEXT: vmerge.vim v8, v8, 2, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <vscale x 8 x i32> poison, i32 2, i32 0
				%va = shufflevector <vscale x 8 x i32> %elt.head, <vscale x 8 x i32> poison, <vscale x 8 x i32> zeroinitializer
				%v = call <vscale x 8 x i32> @llvm.vp.merge.nxv8i32(<vscale x 8 x i1> %m, <vscale x 8 x i32> %va, <vscale x 8 x i32> %vb, i32 %evl)
				ret <vscale x 8 x i32> %v
				}

				declare <vscale x 16 x i32> @llvm.vp.merge.nxv16i32(<vscale x 16 x i1>, <vscale x 16 x i32>, <vscale x 16 x i32>, i32)

				define <vscale x 16 x i32> @vpmerge_vv_nxv16i32(<vscale x 16 x i32> %va, <vscale x 16 x i32> %vb, <vscale x 16 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vv_nxv16i32:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e32, m8, tu, mu
				; CHECK-NEXT: vmerge.vvm v16, v16, v8, v0
				; CHECK-NEXT: vmv8r.v v8, v16
				; CHECK-NEXT: ret
				%v = call <vscale x 16 x i32> @llvm.vp.merge.nxv16i32(<vscale x 16 x i1> %m, <vscale x 16 x i32> %va, <vscale x 16 x i32> %vb, i32 %evl)
				ret <vscale x 16 x i32> %v
				}

				define <vscale x 16 x i32> @vpmerge_vx_nxv16i32(i32 %a, <vscale x 16 x i32> %vb, <vscale x 16 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vx_nxv16i32:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a1, e32, m8, tu, mu
				; CHECK-NEXT: vmerge.vxm v8, v8, a0, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <vscale x 16 x i32> poison, i32 %a, i32 0
				%va = shufflevector <vscale x 16 x i32> %elt.head, <vscale x 16 x i32> poison, <vscale x 16 x i32> zeroinitializer
				%v = call <vscale x 16 x i32> @llvm.vp.merge.nxv16i32(<vscale x 16 x i1> %m, <vscale x 16 x i32> %va, <vscale x 16 x i32> %vb, i32 %evl)
				ret <vscale x 16 x i32> %v
				}

				define <vscale x 16 x i32> @vpmerge_vi_nxv16i32(<vscale x 16 x i32> %vb, <vscale x 16 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vi_nxv16i32:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e32, m8, tu, mu
				; CHECK-NEXT: vmerge.vim v8, v8, 2, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <vscale x 16 x i32> poison, i32 2, i32 0
				%va = shufflevector <vscale x 16 x i32> %elt.head, <vscale x 16 x i32> poison, <vscale x 16 x i32> zeroinitializer
				%v = call <vscale x 16 x i32> @llvm.vp.merge.nxv16i32(<vscale x 16 x i1> %m, <vscale x 16 x i32> %va, <vscale x 16 x i32> %vb, i32 %evl)
				ret <vscale x 16 x i32> %v
				}

				declare <vscale x 1 x i64> @llvm.vp.merge.nxv1i64(<vscale x 1 x i1>, <vscale x 1 x i64>, <vscale x 1 x i64>, i32)

				define <vscale x 1 x i64> @vpmerge_vv_nxv1i64(<vscale x 1 x i64> %va, <vscale x 1 x i64> %vb, <vscale x 1 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vv_nxv1i64:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e64, m1, tu, mu
				; CHECK-NEXT: vmerge.vvm v9, v9, v8, v0
				; CHECK-NEXT: vmv1r.v v8, v9
				; CHECK-NEXT: ret
				%v = call <vscale x 1 x i64> @llvm.vp.merge.nxv1i64(<vscale x 1 x i1> %m, <vscale x 1 x i64> %va, <vscale x 1 x i64> %vb, i32 %evl)
				ret <vscale x 1 x i64> %v
				}

				define <vscale x 1 x i64> @vpmerge_vx_nxv1i64(i64 %a, <vscale x 1 x i64> %vb, <vscale x 1 x i1> %m, i32 zeroext %evl) {
				; RV32-LABEL: vpmerge_vx_nxv1i64:
				; RV32: # %bb.0:
				; RV32-NEXT: addi sp, sp, -16
				; RV32-NEXT: .cfi_def_cfa_offset 16
				; RV32-NEXT: sw a1, 12(sp)
				; RV32-NEXT: sw a0, 8(sp)
				; RV32-NEXT: vsetvli a0, zero, e64, m1, ta, mu
				; RV32-NEXT: addi a0, sp, 8
				; RV32-NEXT: vlse64.v v9, (a0), zero
				; RV32-NEXT: vsetvli zero, a2, e64, m1, tu, mu
				; RV32-NEXT: vmerge.vvm v8, v8, v9, v0
				; RV32-NEXT: addi sp, sp, 16
				; RV32-NEXT: ret
				;
				; RV64-LABEL: vpmerge_vx_nxv1i64:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli zero, a1, e64, m1, tu, mu
				; RV64-NEXT: vmerge.vxm v8, v8, a0, v0
				; RV64-NEXT: ret
				%elt.head = insertelement <vscale x 1 x i64> poison, i64 %a, i32 0
				%va = shufflevector <vscale x 1 x i64> %elt.head, <vscale x 1 x i64> poison, <vscale x 1 x i32> zeroinitializer
				%v = call <vscale x 1 x i64> @llvm.vp.merge.nxv1i64(<vscale x 1 x i1> %m, <vscale x 1 x i64> %va, <vscale x 1 x i64> %vb, i32 %evl)
				ret <vscale x 1 x i64> %v
				}

				define <vscale x 1 x i64> @vpmerge_vi_nxv1i64(<vscale x 1 x i64> %vb, <vscale x 1 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vi_nxv1i64:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e64, m1, tu, mu
				; CHECK-NEXT: vmerge.vim v8, v8, 2, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <vscale x 1 x i64> poison, i64 2, i32 0
				%va = shufflevector <vscale x 1 x i64> %elt.head, <vscale x 1 x i64> poison, <vscale x 1 x i32> zeroinitializer
				%v = call <vscale x 1 x i64> @llvm.vp.merge.nxv1i64(<vscale x 1 x i1> %m, <vscale x 1 x i64> %va, <vscale x 1 x i64> %vb, i32 %evl)
				ret <vscale x 1 x i64> %v
				}

				declare <vscale x 2 x i64> @llvm.vp.merge.nxv2i64(<vscale x 2 x i1>, <vscale x 2 x i64>, <vscale x 2 x i64>, i32)

				define <vscale x 2 x i64> @vpmerge_vv_nxv2i64(<vscale x 2 x i64> %va, <vscale x 2 x i64> %vb, <vscale x 2 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vv_nxv2i64:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e64, m2, tu, mu
				; CHECK-NEXT: vmerge.vvm v10, v10, v8, v0
				; CHECK-NEXT: vmv2r.v v8, v10
				; CHECK-NEXT: ret
				%v = call <vscale x 2 x i64> @llvm.vp.merge.nxv2i64(<vscale x 2 x i1> %m, <vscale x 2 x i64> %va, <vscale x 2 x i64> %vb, i32 %evl)
				ret <vscale x 2 x i64> %v
				}

				define <vscale x 2 x i64> @vpmerge_vx_nxv2i64(i64 %a, <vscale x 2 x i64> %vb, <vscale x 2 x i1> %m, i32 zeroext %evl) {
				; RV32-LABEL: vpmerge_vx_nxv2i64:
				; RV32: # %bb.0:
				; RV32-NEXT: addi sp, sp, -16
				; RV32-NEXT: .cfi_def_cfa_offset 16
				; RV32-NEXT: sw a1, 12(sp)
				; RV32-NEXT: sw a0, 8(sp)
				; RV32-NEXT: vsetvli a0, zero, e64, m2, ta, mu
				; RV32-NEXT: addi a0, sp, 8
				; RV32-NEXT: vlse64.v v10, (a0), zero
				; RV32-NEXT: vsetvli zero, a2, e64, m2, tu, mu
				; RV32-NEXT: vmerge.vvm v8, v8, v10, v0
				; RV32-NEXT: addi sp, sp, 16
				; RV32-NEXT: ret
				;
				; RV64-LABEL: vpmerge_vx_nxv2i64:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli zero, a1, e64, m2, tu, mu
				; RV64-NEXT: vmerge.vxm v8, v8, a0, v0
				; RV64-NEXT: ret
				%elt.head = insertelement <vscale x 2 x i64> poison, i64 %a, i32 0
				%va = shufflevector <vscale x 2 x i64> %elt.head, <vscale x 2 x i64> poison, <vscale x 2 x i32> zeroinitializer
				%v = call <vscale x 2 x i64> @llvm.vp.merge.nxv2i64(<vscale x 2 x i1> %m, <vscale x 2 x i64> %va, <vscale x 2 x i64> %vb, i32 %evl)
				ret <vscale x 2 x i64> %v
				}

				define <vscale x 2 x i64> @vpmerge_vi_nxv2i64(<vscale x 2 x i64> %vb, <vscale x 2 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vi_nxv2i64:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e64, m2, tu, mu
				; CHECK-NEXT: vmerge.vim v8, v8, 2, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <vscale x 2 x i64> poison, i64 2, i32 0
				%va = shufflevector <vscale x 2 x i64> %elt.head, <vscale x 2 x i64> poison, <vscale x 2 x i32> zeroinitializer
				%v = call <vscale x 2 x i64> @llvm.vp.merge.nxv2i64(<vscale x 2 x i1> %m, <vscale x 2 x i64> %va, <vscale x 2 x i64> %vb, i32 %evl)
				ret <vscale x 2 x i64> %v
				}

				declare <vscale x 4 x i64> @llvm.vp.merge.nxv4i64(<vscale x 4 x i1>, <vscale x 4 x i64>, <vscale x 4 x i64>, i32)

				define <vscale x 4 x i64> @vpmerge_vv_nxv4i64(<vscale x 4 x i64> %va, <vscale x 4 x i64> %vb, <vscale x 4 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vv_nxv4i64:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e64, m4, tu, mu
				; CHECK-NEXT: vmerge.vvm v12, v12, v8, v0
				; CHECK-NEXT: vmv4r.v v8, v12
				; CHECK-NEXT: ret
				%v = call <vscale x 4 x i64> @llvm.vp.merge.nxv4i64(<vscale x 4 x i1> %m, <vscale x 4 x i64> %va, <vscale x 4 x i64> %vb, i32 %evl)
				ret <vscale x 4 x i64> %v
				}

				define <vscale x 4 x i64> @vpmerge_vx_nxv4i64(i64 %a, <vscale x 4 x i64> %vb, <vscale x 4 x i1> %m, i32 zeroext %evl) {
				; RV32-LABEL: vpmerge_vx_nxv4i64:
				; RV32: # %bb.0:
				; RV32-NEXT: addi sp, sp, -16
				; RV32-NEXT: .cfi_def_cfa_offset 16
				; RV32-NEXT: sw a1, 12(sp)
				; RV32-NEXT: sw a0, 8(sp)
				; RV32-NEXT: vsetvli a0, zero, e64, m4, ta, mu
				; RV32-NEXT: addi a0, sp, 8
				; RV32-NEXT: vlse64.v v12, (a0), zero
				; RV32-NEXT: vsetvli zero, a2, e64, m4, tu, mu
				; RV32-NEXT: vmerge.vvm v8, v8, v12, v0
				; RV32-NEXT: addi sp, sp, 16
				; RV32-NEXT: ret
				;
				; RV64-LABEL: vpmerge_vx_nxv4i64:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli zero, a1, e64, m4, tu, mu
				; RV64-NEXT: vmerge.vxm v8, v8, a0, v0
				; RV64-NEXT: ret
				%elt.head = insertelement <vscale x 4 x i64> poison, i64 %a, i32 0
				%va = shufflevector <vscale x 4 x i64> %elt.head, <vscale x 4 x i64> poison, <vscale x 4 x i32> zeroinitializer
				%v = call <vscale x 4 x i64> @llvm.vp.merge.nxv4i64(<vscale x 4 x i1> %m, <vscale x 4 x i64> %va, <vscale x 4 x i64> %vb, i32 %evl)
				ret <vscale x 4 x i64> %v
				}

				define <vscale x 4 x i64> @vpmerge_vi_nxv4i64(<vscale x 4 x i64> %vb, <vscale x 4 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vi_nxv4i64:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e64, m4, tu, mu
				; CHECK-NEXT: vmerge.vim v8, v8, 2, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <vscale x 4 x i64> poison, i64 2, i32 0
				%va = shufflevector <vscale x 4 x i64> %elt.head, <vscale x 4 x i64> poison, <vscale x 4 x i32> zeroinitializer
				%v = call <vscale x 4 x i64> @llvm.vp.merge.nxv4i64(<vscale x 4 x i1> %m, <vscale x 4 x i64> %va, <vscale x 4 x i64> %vb, i32 %evl)
				ret <vscale x 4 x i64> %v
				}

				declare <vscale x 8 x i64> @llvm.vp.merge.nxv8i64(<vscale x 8 x i1>, <vscale x 8 x i64>, <vscale x 8 x i64>, i32)

				define <vscale x 8 x i64> @vpmerge_vv_nxv8i64(<vscale x 8 x i64> %va, <vscale x 8 x i64> %vb, <vscale x 8 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vv_nxv8i64:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e64, m8, tu, mu
				; CHECK-NEXT: vmerge.vvm v16, v16, v8, v0
				; CHECK-NEXT: vmv8r.v v8, v16
				; CHECK-NEXT: ret
				%v = call <vscale x 8 x i64> @llvm.vp.merge.nxv8i64(<vscale x 8 x i1> %m, <vscale x 8 x i64> %va, <vscale x 8 x i64> %vb, i32 %evl)
				ret <vscale x 8 x i64> %v
				}

				define <vscale x 8 x i64> @vpmerge_vx_nxv8i64(i64 %a, <vscale x 8 x i64> %vb, <vscale x 8 x i1> %m, i32 zeroext %evl) {
				; RV32-LABEL: vpmerge_vx_nxv8i64:
				; RV32: # %bb.0:
				; RV32-NEXT: addi sp, sp, -16
				; RV32-NEXT: .cfi_def_cfa_offset 16
				; RV32-NEXT: sw a1, 12(sp)
				; RV32-NEXT: sw a0, 8(sp)
				; RV32-NEXT: vsetvli a0, zero, e64, m8, ta, mu
				; RV32-NEXT: addi a0, sp, 8
				; RV32-NEXT: vlse64.v v16, (a0), zero
				; RV32-NEXT: vsetvli zero, a2, e64, m8, tu, mu
				; RV32-NEXT: vmerge.vvm v8, v8, v16, v0
				; RV32-NEXT: addi sp, sp, 16
				; RV32-NEXT: ret
				;
				; RV64-LABEL: vpmerge_vx_nxv8i64:
				; RV64: # %bb.0:
				; RV64-NEXT: vsetvli zero, a1, e64, m8, tu, mu
				; RV64-NEXT: vmerge.vxm v8, v8, a0, v0
				; RV64-NEXT: ret
				%elt.head = insertelement <vscale x 8 x i64> poison, i64 %a, i32 0
				%va = shufflevector <vscale x 8 x i64> %elt.head, <vscale x 8 x i64> poison, <vscale x 8 x i32> zeroinitializer
				%v = call <vscale x 8 x i64> @llvm.vp.merge.nxv8i64(<vscale x 8 x i1> %m, <vscale x 8 x i64> %va, <vscale x 8 x i64> %vb, i32 %evl)
				ret <vscale x 8 x i64> %v
				}

				define <vscale x 8 x i64> @vpmerge_vi_nxv8i64(<vscale x 8 x i64> %vb, <vscale x 8 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vi_nxv8i64:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e64, m8, tu, mu
				; CHECK-NEXT: vmerge.vim v8, v8, 2, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <vscale x 8 x i64> poison, i64 2, i32 0
				%va = shufflevector <vscale x 8 x i64> %elt.head, <vscale x 8 x i64> poison, <vscale x 8 x i32> zeroinitializer
				%v = call <vscale x 8 x i64> @llvm.vp.merge.nxv8i64(<vscale x 8 x i1> %m, <vscale x 8 x i64> %va, <vscale x 8 x i64> %vb, i32 %evl)
				ret <vscale x 8 x i64> %v
				}

				declare <vscale x 1 x half> @llvm.vp.merge.nxv1f16(<vscale x 1 x i1>, <vscale x 1 x half>, <vscale x 1 x half>, i32)

				define <vscale x 1 x half> @vpmerge_vv_nxv1f16(<vscale x 1 x half> %va, <vscale x 1 x half> %vb, <vscale x 1 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vv_nxv1f16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e16, mf4, tu, mu
				; CHECK-NEXT: vmerge.vvm v9, v9, v8, v0
				; CHECK-NEXT: vmv1r.v v8, v9
				; CHECK-NEXT: ret
				%v = call <vscale x 1 x half> @llvm.vp.merge.nxv1f16(<vscale x 1 x i1> %m, <vscale x 1 x half> %va, <vscale x 1 x half> %vb, i32 %evl)
				ret <vscale x 1 x half> %v
				}

				define <vscale x 1 x half> @vpmerge_vf_nxv1f16(half %a, <vscale x 1 x half> %vb, <vscale x 1 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vf_nxv1f16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli a1, zero, e16, mf4, ta, mu
				; CHECK-NEXT: vfmv.v.f v9, fa0
				; CHECK-NEXT: vsetvli zero, a0, e16, mf4, tu, mu
				; CHECK-NEXT: vmerge.vvm v8, v8, v9, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <vscale x 1 x half> poison, half %a, i32 0
				%va = shufflevector <vscale x 1 x half> %elt.head, <vscale x 1 x half> poison, <vscale x 1 x i32> zeroinitializer
				%v = call <vscale x 1 x half> @llvm.vp.merge.nxv1f16(<vscale x 1 x i1> %m, <vscale x 1 x half> %va, <vscale x 1 x half> %vb, i32 %evl)
				ret <vscale x 1 x half> %v
				}

				declare <vscale x 2 x half> @llvm.vp.merge.nxv2f16(<vscale x 2 x i1>, <vscale x 2 x half>, <vscale x 2 x half>, i32)

				define <vscale x 2 x half> @vpmerge_vv_nxv2f16(<vscale x 2 x half> %va, <vscale x 2 x half> %vb, <vscale x 2 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vv_nxv2f16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e16, mf2, tu, mu
				; CHECK-NEXT: vmerge.vvm v9, v9, v8, v0
				; CHECK-NEXT: vmv1r.v v8, v9
				; CHECK-NEXT: ret
				%v = call <vscale x 2 x half> @llvm.vp.merge.nxv2f16(<vscale x 2 x i1> %m, <vscale x 2 x half> %va, <vscale x 2 x half> %vb, i32 %evl)
				ret <vscale x 2 x half> %v
				}

				define <vscale x 2 x half> @vpmerge_vf_nxv2f16(half %a, <vscale x 2 x half> %vb, <vscale x 2 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vf_nxv2f16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli a1, zero, e16, mf2, ta, mu
				; CHECK-NEXT: vfmv.v.f v9, fa0
				; CHECK-NEXT: vsetvli zero, a0, e16, mf2, tu, mu
				; CHECK-NEXT: vmerge.vvm v8, v8, v9, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <vscale x 2 x half> poison, half %a, i32 0
				%va = shufflevector <vscale x 2 x half> %elt.head, <vscale x 2 x half> poison, <vscale x 2 x i32> zeroinitializer
				%v = call <vscale x 2 x half> @llvm.vp.merge.nxv2f16(<vscale x 2 x i1> %m, <vscale x 2 x half> %va, <vscale x 2 x half> %vb, i32 %evl)
				ret <vscale x 2 x half> %v
				}

				declare <vscale x 4 x half> @llvm.vp.merge.nxv4f16(<vscale x 4 x i1>, <vscale x 4 x half>, <vscale x 4 x half>, i32)

				define <vscale x 4 x half> @vpmerge_vv_nxv4f16(<vscale x 4 x half> %va, <vscale x 4 x half> %vb, <vscale x 4 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vv_nxv4f16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e16, m1, tu, mu
				; CHECK-NEXT: vmerge.vvm v9, v9, v8, v0
				; CHECK-NEXT: vmv1r.v v8, v9
				; CHECK-NEXT: ret
				%v = call <vscale x 4 x half> @llvm.vp.merge.nxv4f16(<vscale x 4 x i1> %m, <vscale x 4 x half> %va, <vscale x 4 x half> %vb, i32 %evl)
				ret <vscale x 4 x half> %v
				}

				define <vscale x 4 x half> @vpmerge_vf_nxv4f16(half %a, <vscale x 4 x half> %vb, <vscale x 4 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vf_nxv4f16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli a1, zero, e16, m1, ta, mu
				; CHECK-NEXT: vfmv.v.f v9, fa0
				; CHECK-NEXT: vsetvli zero, a0, e16, m1, tu, mu
				; CHECK-NEXT: vmerge.vvm v8, v8, v9, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <vscale x 4 x half> poison, half %a, i32 0
				%va = shufflevector <vscale x 4 x half> %elt.head, <vscale x 4 x half> poison, <vscale x 4 x i32> zeroinitializer
				%v = call <vscale x 4 x half> @llvm.vp.merge.nxv4f16(<vscale x 4 x i1> %m, <vscale x 4 x half> %va, <vscale x 4 x half> %vb, i32 %evl)
				ret <vscale x 4 x half> %v
				}

				declare <vscale x 8 x half> @llvm.vp.merge.nxv8f16(<vscale x 8 x i1>, <vscale x 8 x half>, <vscale x 8 x half>, i32)

				define <vscale x 8 x half> @vpmerge_vv_nxv8f16(<vscale x 8 x half> %va, <vscale x 8 x half> %vb, <vscale x 8 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vv_nxv8f16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e16, m2, tu, mu
				; CHECK-NEXT: vmerge.vvm v10, v10, v8, v0
				; CHECK-NEXT: vmv2r.v v8, v10
				; CHECK-NEXT: ret
				%v = call <vscale x 8 x half> @llvm.vp.merge.nxv8f16(<vscale x 8 x i1> %m, <vscale x 8 x half> %va, <vscale x 8 x half> %vb, i32 %evl)
				ret <vscale x 8 x half> %v
				}

				define <vscale x 8 x half> @vpmerge_vf_nxv8f16(half %a, <vscale x 8 x half> %vb, <vscale x 8 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vf_nxv8f16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli a1, zero, e16, m2, ta, mu
				; CHECK-NEXT: vfmv.v.f v10, fa0
				; CHECK-NEXT: vsetvli zero, a0, e16, m2, tu, mu
				; CHECK-NEXT: vmerge.vvm v8, v8, v10, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <vscale x 8 x half> poison, half %a, i32 0
				%va = shufflevector <vscale x 8 x half> %elt.head, <vscale x 8 x half> poison, <vscale x 8 x i32> zeroinitializer
				%v = call <vscale x 8 x half> @llvm.vp.merge.nxv8f16(<vscale x 8 x i1> %m, <vscale x 8 x half> %va, <vscale x 8 x half> %vb, i32 %evl)
				ret <vscale x 8 x half> %v
				}

				declare <vscale x 16 x half> @llvm.vp.merge.nxv16f16(<vscale x 16 x i1>, <vscale x 16 x half>, <vscale x 16 x half>, i32)

				define <vscale x 16 x half> @vpmerge_vv_nxv16f16(<vscale x 16 x half> %va, <vscale x 16 x half> %vb, <vscale x 16 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vv_nxv16f16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e16, m4, tu, mu
				; CHECK-NEXT: vmerge.vvm v12, v12, v8, v0
				; CHECK-NEXT: vmv4r.v v8, v12
				; CHECK-NEXT: ret
				%v = call <vscale x 16 x half> @llvm.vp.merge.nxv16f16(<vscale x 16 x i1> %m, <vscale x 16 x half> %va, <vscale x 16 x half> %vb, i32 %evl)
				ret <vscale x 16 x half> %v
				}

				define <vscale x 16 x half> @vpmerge_vf_nxv16f16(half %a, <vscale x 16 x half> %vb, <vscale x 16 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vf_nxv16f16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli a1, zero, e16, m4, ta, mu
				; CHECK-NEXT: vfmv.v.f v12, fa0
				; CHECK-NEXT: vsetvli zero, a0, e16, m4, tu, mu
				; CHECK-NEXT: vmerge.vvm v8, v8, v12, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <vscale x 16 x half> poison, half %a, i32 0
				%va = shufflevector <vscale x 16 x half> %elt.head, <vscale x 16 x half> poison, <vscale x 16 x i32> zeroinitializer
				%v = call <vscale x 16 x half> @llvm.vp.merge.nxv16f16(<vscale x 16 x i1> %m, <vscale x 16 x half> %va, <vscale x 16 x half> %vb, i32 %evl)
				ret <vscale x 16 x half> %v
				}

				declare <vscale x 32 x half> @llvm.vp.merge.nxv32f16(<vscale x 32 x i1>, <vscale x 32 x half>, <vscale x 32 x half>, i32)

				define <vscale x 32 x half> @vpmerge_vv_nxv32f16(<vscale x 32 x half> %va, <vscale x 32 x half> %vb, <vscale x 32 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vv_nxv32f16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e16, m8, tu, mu
				; CHECK-NEXT: vmerge.vvm v16, v16, v8, v0
				; CHECK-NEXT: vmv8r.v v8, v16
				; CHECK-NEXT: ret
				%v = call <vscale x 32 x half> @llvm.vp.merge.nxv32f16(<vscale x 32 x i1> %m, <vscale x 32 x half> %va, <vscale x 32 x half> %vb, i32 %evl)
				ret <vscale x 32 x half> %v
				}

				define <vscale x 32 x half> @vpmerge_vf_nxv32f16(half %a, <vscale x 32 x half> %vb, <vscale x 32 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vf_nxv32f16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli a1, zero, e16, m8, ta, mu
				; CHECK-NEXT: vfmv.v.f v16, fa0
				; CHECK-NEXT: vsetvli zero, a0, e16, m8, tu, mu
				; CHECK-NEXT: vmerge.vvm v8, v8, v16, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <vscale x 32 x half> poison, half %a, i32 0
				%va = shufflevector <vscale x 32 x half> %elt.head, <vscale x 32 x half> poison, <vscale x 32 x i32> zeroinitializer
				%v = call <vscale x 32 x half> @llvm.vp.merge.nxv32f16(<vscale x 32 x i1> %m, <vscale x 32 x half> %va, <vscale x 32 x half> %vb, i32 %evl)
				ret <vscale x 32 x half> %v
				}

				declare <vscale x 1 x float> @llvm.vp.merge.nxv1f32(<vscale x 1 x i1>, <vscale x 1 x float>, <vscale x 1 x float>, i32)

				define <vscale x 1 x float> @vpmerge_vv_nxv1f32(<vscale x 1 x float> %va, <vscale x 1 x float> %vb, <vscale x 1 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vv_nxv1f32:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e32, mf2, tu, mu
				; CHECK-NEXT: vmerge.vvm v9, v9, v8, v0
				; CHECK-NEXT: vmv1r.v v8, v9
				; CHECK-NEXT: ret
				%v = call <vscale x 1 x float> @llvm.vp.merge.nxv1f32(<vscale x 1 x i1> %m, <vscale x 1 x float> %va, <vscale x 1 x float> %vb, i32 %evl)
				ret <vscale x 1 x float> %v
				}

				define <vscale x 1 x float> @vpmerge_vf_nxv1f32(float %a, <vscale x 1 x float> %vb, <vscale x 1 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vf_nxv1f32:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli a1, zero, e32, mf2, ta, mu
				; CHECK-NEXT: vfmv.v.f v9, fa0
				; CHECK-NEXT: vsetvli zero, a0, e32, mf2, tu, mu
				; CHECK-NEXT: vmerge.vvm v8, v8, v9, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <vscale x 1 x float> poison, float %a, i32 0
				%va = shufflevector <vscale x 1 x float> %elt.head, <vscale x 1 x float> poison, <vscale x 1 x i32> zeroinitializer
				%v = call <vscale x 1 x float> @llvm.vp.merge.nxv1f32(<vscale x 1 x i1> %m, <vscale x 1 x float> %va, <vscale x 1 x float> %vb, i32 %evl)
				ret <vscale x 1 x float> %v
				}

				declare <vscale x 2 x float> @llvm.vp.merge.nxv2f32(<vscale x 2 x i1>, <vscale x 2 x float>, <vscale x 2 x float>, i32)

				define <vscale x 2 x float> @vpmerge_vv_nxv2f32(<vscale x 2 x float> %va, <vscale x 2 x float> %vb, <vscale x 2 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vv_nxv2f32:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e32, m1, tu, mu
				; CHECK-NEXT: vmerge.vvm v9, v9, v8, v0
				; CHECK-NEXT: vmv1r.v v8, v9
				; CHECK-NEXT: ret
				%v = call <vscale x 2 x float> @llvm.vp.merge.nxv2f32(<vscale x 2 x i1> %m, <vscale x 2 x float> %va, <vscale x 2 x float> %vb, i32 %evl)
				ret <vscale x 2 x float> %v
				}

				define <vscale x 2 x float> @vpmerge_vf_nxv2f32(float %a, <vscale x 2 x float> %vb, <vscale x 2 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vf_nxv2f32:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli a1, zero, e32, m1, ta, mu
				; CHECK-NEXT: vfmv.v.f v9, fa0
				; CHECK-NEXT: vsetvli zero, a0, e32, m1, tu, mu
				; CHECK-NEXT: vmerge.vvm v8, v8, v9, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <vscale x 2 x float> poison, float %a, i32 0
				%va = shufflevector <vscale x 2 x float> %elt.head, <vscale x 2 x float> poison, <vscale x 2 x i32> zeroinitializer
				%v = call <vscale x 2 x float> @llvm.vp.merge.nxv2f32(<vscale x 2 x i1> %m, <vscale x 2 x float> %va, <vscale x 2 x float> %vb, i32 %evl)
				ret <vscale x 2 x float> %v
				}

				declare <vscale x 4 x float> @llvm.vp.merge.nxv4f32(<vscale x 4 x i1>, <vscale x 4 x float>, <vscale x 4 x float>, i32)

				define <vscale x 4 x float> @vpmerge_vv_nxv4f32(<vscale x 4 x float> %va, <vscale x 4 x float> %vb, <vscale x 4 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vv_nxv4f32:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e32, m2, tu, mu
				; CHECK-NEXT: vmerge.vvm v10, v10, v8, v0
				; CHECK-NEXT: vmv2r.v v8, v10
				; CHECK-NEXT: ret
				%v = call <vscale x 4 x float> @llvm.vp.merge.nxv4f32(<vscale x 4 x i1> %m, <vscale x 4 x float> %va, <vscale x 4 x float> %vb, i32 %evl)
				ret <vscale x 4 x float> %v
				}

				define <vscale x 4 x float> @vpmerge_vf_nxv4f32(float %a, <vscale x 4 x float> %vb, <vscale x 4 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vf_nxv4f32:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli a1, zero, e32, m2, ta, mu
				; CHECK-NEXT: vfmv.v.f v10, fa0
				; CHECK-NEXT: vsetvli zero, a0, e32, m2, tu, mu
				; CHECK-NEXT: vmerge.vvm v8, v8, v10, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <vscale x 4 x float> poison, float %a, i32 0
				%va = shufflevector <vscale x 4 x float> %elt.head, <vscale x 4 x float> poison, <vscale x 4 x i32> zeroinitializer
				%v = call <vscale x 4 x float> @llvm.vp.merge.nxv4f32(<vscale x 4 x i1> %m, <vscale x 4 x float> %va, <vscale x 4 x float> %vb, i32 %evl)
				ret <vscale x 4 x float> %v
				}

				declare <vscale x 8 x float> @llvm.vp.merge.nxv8f32(<vscale x 8 x i1>, <vscale x 8 x float>, <vscale x 8 x float>, i32)

				define <vscale x 8 x float> @vpmerge_vv_nxv8f32(<vscale x 8 x float> %va, <vscale x 8 x float> %vb, <vscale x 8 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vv_nxv8f32:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e32, m4, tu, mu
				; CHECK-NEXT: vmerge.vvm v12, v12, v8, v0
				; CHECK-NEXT: vmv4r.v v8, v12
				; CHECK-NEXT: ret
				%v = call <vscale x 8 x float> @llvm.vp.merge.nxv8f32(<vscale x 8 x i1> %m, <vscale x 8 x float> %va, <vscale x 8 x float> %vb, i32 %evl)
				ret <vscale x 8 x float> %v
				}

				define <vscale x 8 x float> @vpmerge_vf_nxv8f32(float %a, <vscale x 8 x float> %vb, <vscale x 8 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vf_nxv8f32:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli a1, zero, e32, m4, ta, mu
				; CHECK-NEXT: vfmv.v.f v12, fa0
				; CHECK-NEXT: vsetvli zero, a0, e32, m4, tu, mu
				; CHECK-NEXT: vmerge.vvm v8, v8, v12, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <vscale x 8 x float> poison, float %a, i32 0
				%va = shufflevector <vscale x 8 x float> %elt.head, <vscale x 8 x float> poison, <vscale x 8 x i32> zeroinitializer
				%v = call <vscale x 8 x float> @llvm.vp.merge.nxv8f32(<vscale x 8 x i1> %m, <vscale x 8 x float> %va, <vscale x 8 x float> %vb, i32 %evl)
				ret <vscale x 8 x float> %v
				}

				declare <vscale x 16 x float> @llvm.vp.merge.nxv16f32(<vscale x 16 x i1>, <vscale x 16 x float>, <vscale x 16 x float>, i32)

				define <vscale x 16 x float> @vpmerge_vv_nxv16f32(<vscale x 16 x float> %va, <vscale x 16 x float> %vb, <vscale x 16 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vv_nxv16f32:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e32, m8, tu, mu
				; CHECK-NEXT: vmerge.vvm v16, v16, v8, v0
				; CHECK-NEXT: vmv8r.v v8, v16
				; CHECK-NEXT: ret
				%v = call <vscale x 16 x float> @llvm.vp.merge.nxv16f32(<vscale x 16 x i1> %m, <vscale x 16 x float> %va, <vscale x 16 x float> %vb, i32 %evl)
				ret <vscale x 16 x float> %v
				}

				define <vscale x 16 x float> @vpmerge_vf_nxv16f32(float %a, <vscale x 16 x float> %vb, <vscale x 16 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vf_nxv16f32:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli a1, zero, e32, m8, ta, mu
				; CHECK-NEXT: vfmv.v.f v16, fa0
				; CHECK-NEXT: vsetvli zero, a0, e32, m8, tu, mu
				; CHECK-NEXT: vmerge.vvm v8, v8, v16, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <vscale x 16 x float> poison, float %a, i32 0
				%va = shufflevector <vscale x 16 x float> %elt.head, <vscale x 16 x float> poison, <vscale x 16 x i32> zeroinitializer
				%v = call <vscale x 16 x float> @llvm.vp.merge.nxv16f32(<vscale x 16 x i1> %m, <vscale x 16 x float> %va, <vscale x 16 x float> %vb, i32 %evl)
				ret <vscale x 16 x float> %v
				}

				declare <vscale x 1 x double> @llvm.vp.merge.nxv1f64(<vscale x 1 x i1>, <vscale x 1 x double>, <vscale x 1 x double>, i32)

				define <vscale x 1 x double> @vpmerge_vv_nxv1f64(<vscale x 1 x double> %va, <vscale x 1 x double> %vb, <vscale x 1 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vv_nxv1f64:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e64, m1, tu, mu
				; CHECK-NEXT: vmerge.vvm v9, v9, v8, v0
				; CHECK-NEXT: vmv1r.v v8, v9
				; CHECK-NEXT: ret
				%v = call <vscale x 1 x double> @llvm.vp.merge.nxv1f64(<vscale x 1 x i1> %m, <vscale x 1 x double> %va, <vscale x 1 x double> %vb, i32 %evl)
				ret <vscale x 1 x double> %v
				}

				define <vscale x 1 x double> @vpmerge_vf_nxv1f64(double %a, <vscale x 1 x double> %vb, <vscale x 1 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vf_nxv1f64:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli a1, zero, e64, m1, ta, mu
				; CHECK-NEXT: vfmv.v.f v9, fa0
				; CHECK-NEXT: vsetvli zero, a0, e64, m1, tu, mu
				; CHECK-NEXT: vmerge.vvm v8, v8, v9, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <vscale x 1 x double> poison, double %a, i32 0
				%va = shufflevector <vscale x 1 x double> %elt.head, <vscale x 1 x double> poison, <vscale x 1 x i32> zeroinitializer
				%v = call <vscale x 1 x double> @llvm.vp.merge.nxv1f64(<vscale x 1 x i1> %m, <vscale x 1 x double> %va, <vscale x 1 x double> %vb, i32 %evl)
				ret <vscale x 1 x double> %v
				}

				declare <vscale x 2 x double> @llvm.vp.merge.nxv2f64(<vscale x 2 x i1>, <vscale x 2 x double>, <vscale x 2 x double>, i32)

				define <vscale x 2 x double> @vpmerge_vv_nxv2f64(<vscale x 2 x double> %va, <vscale x 2 x double> %vb, <vscale x 2 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vv_nxv2f64:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e64, m2, tu, mu
				; CHECK-NEXT: vmerge.vvm v10, v10, v8, v0
				; CHECK-NEXT: vmv2r.v v8, v10
				; CHECK-NEXT: ret
				%v = call <vscale x 2 x double> @llvm.vp.merge.nxv2f64(<vscale x 2 x i1> %m, <vscale x 2 x double> %va, <vscale x 2 x double> %vb, i32 %evl)
				ret <vscale x 2 x double> %v
				}

				define <vscale x 2 x double> @vpmerge_vf_nxv2f64(double %a, <vscale x 2 x double> %vb, <vscale x 2 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vf_nxv2f64:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli a1, zero, e64, m2, ta, mu
				; CHECK-NEXT: vfmv.v.f v10, fa0
				; CHECK-NEXT: vsetvli zero, a0, e64, m2, tu, mu
				; CHECK-NEXT: vmerge.vvm v8, v8, v10, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <vscale x 2 x double> poison, double %a, i32 0
				%va = shufflevector <vscale x 2 x double> %elt.head, <vscale x 2 x double> poison, <vscale x 2 x i32> zeroinitializer
				%v = call <vscale x 2 x double> @llvm.vp.merge.nxv2f64(<vscale x 2 x i1> %m, <vscale x 2 x double> %va, <vscale x 2 x double> %vb, i32 %evl)
				ret <vscale x 2 x double> %v
				}

				declare <vscale x 4 x double> @llvm.vp.merge.nxv4f64(<vscale x 4 x i1>, <vscale x 4 x double>, <vscale x 4 x double>, i32)

				define <vscale x 4 x double> @vpmerge_vv_nxv4f64(<vscale x 4 x double> %va, <vscale x 4 x double> %vb, <vscale x 4 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vv_nxv4f64:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e64, m4, tu, mu
				; CHECK-NEXT: vmerge.vvm v12, v12, v8, v0
				; CHECK-NEXT: vmv4r.v v8, v12
				; CHECK-NEXT: ret
				%v = call <vscale x 4 x double> @llvm.vp.merge.nxv4f64(<vscale x 4 x i1> %m, <vscale x 4 x double> %va, <vscale x 4 x double> %vb, i32 %evl)
				ret <vscale x 4 x double> %v
				}

				define <vscale x 4 x double> @vpmerge_vf_nxv4f64(double %a, <vscale x 4 x double> %vb, <vscale x 4 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vf_nxv4f64:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli a1, zero, e64, m4, ta, mu
				; CHECK-NEXT: vfmv.v.f v12, fa0
				; CHECK-NEXT: vsetvli zero, a0, e64, m4, tu, mu
				; CHECK-NEXT: vmerge.vvm v8, v8, v12, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <vscale x 4 x double> poison, double %a, i32 0
				%va = shufflevector <vscale x 4 x double> %elt.head, <vscale x 4 x double> poison, <vscale x 4 x i32> zeroinitializer
				%v = call <vscale x 4 x double> @llvm.vp.merge.nxv4f64(<vscale x 4 x i1> %m, <vscale x 4 x double> %va, <vscale x 4 x double> %vb, i32 %evl)
				ret <vscale x 4 x double> %v
				}

				declare <vscale x 8 x double> @llvm.vp.merge.nxv8f64(<vscale x 8 x i1>, <vscale x 8 x double>, <vscale x 8 x double>, i32)

				define <vscale x 8 x double> @vpmerge_vv_nxv8f64(<vscale x 8 x double> %va, <vscale x 8 x double> %vb, <vscale x 8 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vv_nxv8f64:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli zero, a0, e64, m8, tu, mu
				; CHECK-NEXT: vmerge.vvm v16, v16, v8, v0
				; CHECK-NEXT: vmv8r.v v8, v16
				; CHECK-NEXT: ret
				%v = call <vscale x 8 x double> @llvm.vp.merge.nxv8f64(<vscale x 8 x i1> %m, <vscale x 8 x double> %va, <vscale x 8 x double> %vb, i32 %evl)
				ret <vscale x 8 x double> %v
				}

				define <vscale x 8 x double> @vpmerge_vf_nxv8f64(double %a, <vscale x 8 x double> %vb, <vscale x 8 x i1> %m, i32 zeroext %evl) {
				; CHECK-LABEL: vpmerge_vf_nxv8f64:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vsetvli a1, zero, e64, m8, ta, mu
				; CHECK-NEXT: vfmv.v.f v16, fa0
				; CHECK-NEXT: vsetvli zero, a0, e64, m8, tu, mu
				; CHECK-NEXT: vmerge.vvm v8, v8, v16, v0
				; CHECK-NEXT: ret
				%elt.head = insertelement <vscale x 8 x double> poison, double %a, i32 0
				%va = shufflevector <vscale x 8 x double> %elt.head, <vscale x 8 x double> poison, <vscale x 8 x i32> zeroinitializer
				%v = call <vscale x 8 x double> @llvm.vp.merge.nxv8f64(<vscale x 8 x i1> %m, <vscale x 8 x double> %va, <vscale x 8 x double> %vb, i32 %evl)
				ret <vscale x 8 x double> %v
				}