This is an archive of the discontinued LLVM Phabricator instance.

Differential D119303

[RISCV] Lower VECTOR_SPLICE to RVV instructions.
ClosedPublic

Authored by craig.topper on Feb 8 2022, 4:35 PM.

Download Raw Diff

Details

Reviewers

frasercrmck
rogfer01
npanchen
ABataev
arcbbb

Commits

rGb9d6e8c44150: [RISCV] Lower VECTOR_SPLICE to RVV instructions.

Summary

This lowers VECTOR_SPLICE of scalable vectors to a slidedown follow by a slideup.
Fixed vectors are encouraged to use shufflevector instruction. The equivalent patch
for fixed vectors is D119039.

I've used a tail agnostic slidedown and limited the VL to only the
elements that will not be overwritten by the slideup. The slideup
uses VLMax for its VL. It unfortunately uses tail undisturbed policy
but it isn't required as there is no tail. We just need the merge
operand to carry the bits for the lower portion of the result.

Care was taken to ensure that either the slideup or slidedown will
be able to use a .vi instruction when the immediate is small. Which
one uses the immediate depends on the sign of the immediate.

Diff Detail

Repository: rG LLVM Github Monorepo

Event Timeline

craig.topper created this revision.Feb 8 2022, 4:35 PM

Herald added subscribers: VincentWu, luke957, achieveartificialintelligence and 25 others. · View Herald TranscriptFeb 8 2022, 4:35 PM

craig.topper requested review of this revision.Feb 8 2022, 4:35 PM

Herald added a project: Restricted Project. · View Herald TranscriptFeb 8 2022, 4:35 PM

Herald added subscribers: • pcwang-thead, eopXD, MaskRay. · View Herald Transcript

Harbormaster completed remote builds in B148392: Diff 407013.Feb 8 2022, 7:52 PM

craig.topper mentioned this in D119316: [RISCV] Add a really basic cost model for SK_Splice..Feb 8 2022, 10:48 PM

This revision is now accepted and ready to land.Feb 9 2022, 8:21 AM

A few nits. I think the commit message/description could be more explicit that this is only for scalable-vector splices. Fixed-length vectors are technically supported by the intrinsic, even if they're not recommended.

llvm/lib/Target/RISCV/RISCVISelLowering.cpp
5650	This comment seems not to reflect the code on the following lines.
llvm/test/CodeGen/RISCV/rvv/vector-splice.ll
5	Do they?

frasercrmck added inline comments.Feb 9 2022, 9:45 AM

llvm/test/CodeGen/RISCV/rvv/vector-splice.ll
2034	Oh I just saw this, which probably partially answers my comment above. Why do we need this? The RVV-specific lowering code doesn't seem to care. Is there something happening at a higher level?

craig.topper added inline comments.Feb 9 2022, 10:48 AM

llvm/test/CodeGen/RISCV/rvv/vector-splice.ll
5	There's a verifier check on the range of the immediate. Without a vscale_range the only allowed constants for <vscale x 1 x *> are 0 and -1. So I increased it to give more options.

craig.topper edited the summary of this revision. (Show Details)Feb 9 2022, 10:50 AM

Herald added a subscriber: alextsao1999. · View Herald TranscriptFeb 9 2022, 10:50 AM

craig.topper added inline comments.Feb 9 2022, 10:56 AM

llvm/lib/Target/RISCV/RISCVISelLowering.cpp
5650	Oops that was written in an earlier iteration of the Offset calculations. At one point I created (VLMax - (VLMax + Imm)) for the negative immediate case and DAGCombiner wouldn't simplify it to -Imm so I did it myself.

Move comment.

craig.topper mentioned this in rG09629215c272: [RISCV] Add a really basic cost model for SK_Splice..Feb 9 2022, 11:43 AM

Moving back to Request Review to give Fraser a chance to look again

Harbormaster completed remote builds in B148527: Diff 407218.Feb 9 2022, 1:19 PM

Ping

LGTM, sorry for the delay.

llvm/test/CodeGen/RISCV/rvv/vector-splice.ll
5	Ah I see, thanks, that wasn't obvious.

This revision is now accepted and ready to land.Mar 1 2022, 7:23 AM

This revision was landed with ongoing or failed builds.Mar 1 2022, 10:14 AM

Closed by commit rGb9d6e8c44150: [RISCV] Lower VECTOR_SPLICE to RVV instructions. (authored by craig.topper). · Explain Why

This revision was automatically updated to reflect the committed changes.

craig.topper added a commit: rGb9d6e8c44150: [RISCV] Lower VECTOR_SPLICE to RVV instructions..

Revision Contents

Path

Size

llvm/

lib/

Target/

RISCV/

RISCVISelLowering.h

1 line

RISCVISelLowering.cpp

43 lines

test/

CodeGen/

RISCV/

rvv/

vector-splice.ll

2034 lines

Diff 412156

llvm/lib/Target/RISCV/RISCVISelLowering.h

Show First 20 Lines • Show All 609 Lines • ▼ Show 20 Lines	private:
SDValue lowerVECREDUCE(SDValue Op, SelectionDAG &DAG) const;		SDValue lowerVECREDUCE(SDValue Op, SelectionDAG &DAG) const;
SDValue lowerVectorMaskVecReduction(SDValue Op, SelectionDAG &DAG,		SDValue lowerVectorMaskVecReduction(SDValue Op, SelectionDAG &DAG,
bool IsVP) const;		bool IsVP) const;
SDValue lowerFPVECREDUCE(SDValue Op, SelectionDAG &DAG) const;		SDValue lowerFPVECREDUCE(SDValue Op, SelectionDAG &DAG) const;
SDValue lowerINSERT_SUBVECTOR(SDValue Op, SelectionDAG &DAG) const;		SDValue lowerINSERT_SUBVECTOR(SDValue Op, SelectionDAG &DAG) const;
SDValue lowerEXTRACT_SUBVECTOR(SDValue Op, SelectionDAG &DAG) const;		SDValue lowerEXTRACT_SUBVECTOR(SDValue Op, SelectionDAG &DAG) const;
SDValue lowerSTEP_VECTOR(SDValue Op, SelectionDAG &DAG) const;		SDValue lowerSTEP_VECTOR(SDValue Op, SelectionDAG &DAG) const;
SDValue lowerVECTOR_REVERSE(SDValue Op, SelectionDAG &DAG) const;		SDValue lowerVECTOR_REVERSE(SDValue Op, SelectionDAG &DAG) const;
		SDValue lowerVECTOR_SPLICE(SDValue Op, SelectionDAG &DAG) const;
SDValue lowerABS(SDValue Op, SelectionDAG &DAG) const;		SDValue lowerABS(SDValue Op, SelectionDAG &DAG) const;
SDValue lowerMaskedLoad(SDValue Op, SelectionDAG &DAG) const;		SDValue lowerMaskedLoad(SDValue Op, SelectionDAG &DAG) const;
SDValue lowerMaskedStore(SDValue Op, SelectionDAG &DAG) const;		SDValue lowerMaskedStore(SDValue Op, SelectionDAG &DAG) const;
SDValue lowerFixedLengthVectorFCOPYSIGNToRVV(SDValue Op,		SDValue lowerFixedLengthVectorFCOPYSIGNToRVV(SDValue Op,
SelectionDAG &DAG) const;		SelectionDAG &DAG) const;
SDValue lowerMaskedGather(SDValue Op, SelectionDAG &DAG) const;		SDValue lowerMaskedGather(SDValue Op, SelectionDAG &DAG) const;
SDValue lowerMaskedScatter(SDValue Op, SelectionDAG &DAG) const;		SDValue lowerMaskedScatter(SDValue Op, SelectionDAG &DAG) const;
SDValue lowerFixedLengthVectorLoadToRVV(SDValue Op, SelectionDAG &DAG) const;		SDValue lowerFixedLengthVectorLoadToRVV(SDValue Op, SelectionDAG &DAG) const;
▲ Show 20 Lines • Show All 83 Lines • Show Last 20 Lines

llvm/lib/Target/RISCV/RISCVISelLowering.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 669 Lines • ▼ Show 20 Lines	for (MVT VT : IntVecVTs) {

for (MVT OtherVT : MVT::integer_scalable_vector_valuetypes()) {		for (MVT OtherVT : MVT::integer_scalable_vector_valuetypes()) {
setTruncStoreAction(VT, OtherVT, Expand);		setTruncStoreAction(VT, OtherVT, Expand);
setLoadExtAction(ISD::EXTLOAD, OtherVT, VT, Expand);		setLoadExtAction(ISD::EXTLOAD, OtherVT, VT, Expand);
setLoadExtAction(ISD::SEXTLOAD, OtherVT, VT, Expand);		setLoadExtAction(ISD::SEXTLOAD, OtherVT, VT, Expand);
setLoadExtAction(ISD::ZEXTLOAD, OtherVT, VT, Expand);		setLoadExtAction(ISD::ZEXTLOAD, OtherVT, VT, Expand);
}		}

		// Splice
		setOperationAction(ISD::VECTOR_SPLICE, VT, Custom);

// Lower CTLZ_ZERO_UNDEF and CTTZ_ZERO_UNDEF if we have a floating point		// Lower CTLZ_ZERO_UNDEF and CTTZ_ZERO_UNDEF if we have a floating point
// type that can represent the value exactly.		// type that can represent the value exactly.
if (VT.getVectorElementType() != MVT::i64) {		if (VT.getVectorElementType() != MVT::i64) {
MVT FloatEltVT =		MVT FloatEltVT =
VT.getVectorElementType() == MVT::i32 ? MVT::f64 : MVT::f32;		VT.getVectorElementType() == MVT::i32 ? MVT::f64 : MVT::f32;
EVT FloatVT = MVT::getVectorVT(FloatEltVT, VT.getVectorElementCount());		EVT FloatVT = MVT::getVectorVT(FloatEltVT, VT.getVectorElementCount());
if (isTypeLegal(FloatVT)) {		if (isTypeLegal(FloatVT)) {
setOperationAction(ISD::CTLZ_ZERO_UNDEF, VT, Custom);		setOperationAction(ISD::CTLZ_ZERO_UNDEF, VT, Custom);
▲ Show 20 Lines • Show All 62 Lines • ▼ Show 20 Lines	const auto SetCommonVFPActions = [&](MVT VT) {
setOperationAction(ISD::SELECT, VT, Custom);		setOperationAction(ISD::SELECT, VT, Custom);
setOperationAction(ISD::SELECT_CC, VT, Expand);		setOperationAction(ISD::SELECT_CC, VT, Expand);

setOperationAction(ISD::CONCAT_VECTORS, VT, Custom);		setOperationAction(ISD::CONCAT_VECTORS, VT, Custom);
setOperationAction(ISD::INSERT_SUBVECTOR, VT, Custom);		setOperationAction(ISD::INSERT_SUBVECTOR, VT, Custom);
setOperationAction(ISD::EXTRACT_SUBVECTOR, VT, Custom);		setOperationAction(ISD::EXTRACT_SUBVECTOR, VT, Custom);

setOperationAction(ISD::VECTOR_REVERSE, VT, Custom);		setOperationAction(ISD::VECTOR_REVERSE, VT, Custom);
		setOperationAction(ISD::VECTOR_SPLICE, VT, Custom);

for (unsigned VPOpc : FloatingPointVPOps)		for (unsigned VPOpc : FloatingPointVPOps)
setOperationAction(VPOpc, VT, Custom);		setOperationAction(VPOpc, VT, Custom);
};		};

// Sets common extload/truncstore actions on RVV floating-point vector		// Sets common extload/truncstore actions on RVV floating-point vector
// types.		// types.
const auto SetCommonVFPExtLoadTruncStoreActions =		const auto SetCommonVFPExtLoadTruncStoreActions =
▲ Show 20 Lines • Show All 2,738 Lines • ▼ Show 20 Lines	SDValue RISCVTargetLowering::LowerOperation(SDValue Op,
case ISD::INSERT_SUBVECTOR:		case ISD::INSERT_SUBVECTOR:
return lowerINSERT_SUBVECTOR(Op, DAG);		return lowerINSERT_SUBVECTOR(Op, DAG);
case ISD::EXTRACT_SUBVECTOR:		case ISD::EXTRACT_SUBVECTOR:
return lowerEXTRACT_SUBVECTOR(Op, DAG);		return lowerEXTRACT_SUBVECTOR(Op, DAG);
case ISD::STEP_VECTOR:		case ISD::STEP_VECTOR:
return lowerSTEP_VECTOR(Op, DAG);		return lowerSTEP_VECTOR(Op, DAG);
case ISD::VECTOR_REVERSE:		case ISD::VECTOR_REVERSE:
return lowerVECTOR_REVERSE(Op, DAG);		return lowerVECTOR_REVERSE(Op, DAG);
		case ISD::VECTOR_SPLICE:
		return lowerVECTOR_SPLICE(Op, DAG);
case ISD::BUILD_VECTOR:		case ISD::BUILD_VECTOR:
return lowerBUILD_VECTOR(Op, DAG, Subtarget);		return lowerBUILD_VECTOR(Op, DAG, Subtarget);
case ISD::SPLAT_VECTOR:		case ISD::SPLAT_VECTOR:
if (Op.getValueType().getVectorElementType() == MVT::i1)		if (Op.getValueType().getVectorElementType() == MVT::i1)
return lowerVectorMaskSplat(Op, DAG);		return lowerVectorMaskSplat(Op, DAG);
return lowerSPLAT_VECTOR(Op, DAG, Subtarget);		return lowerSPLAT_VECTOR(Op, DAG, Subtarget);
case ISD::VECTOR_SHUFFLE:		case ISD::VECTOR_SHUFFLE:
return lowerVECTOR_SHUFFLE(Op, DAG, Subtarget);		return lowerVECTOR_SHUFFLE(Op, DAG, Subtarget);
▲ Show 20 Lines • Show All 2,105 Lines • ▼ Show 20 Lines	SDValue RISCVTargetLowering::lowerVECTOR_REVERSE(SDValue Op,

SDValue VID = DAG.getNode(RISCVISD::VID_VL, DL, IntVT, Mask, VL);		SDValue VID = DAG.getNode(RISCVISD::VID_VL, DL, IntVT, Mask, VL);
SDValue Indices =		SDValue Indices =
DAG.getNode(RISCVISD::SUB_VL, DL, IntVT, SplatVL, VID, Mask, VL);		DAG.getNode(RISCVISD::SUB_VL, DL, IntVT, SplatVL, VID, Mask, VL);

return DAG.getNode(GatherOpc, DL, VecVT, Op.getOperand(0), Indices, Mask, VL);		return DAG.getNode(GatherOpc, DL, VecVT, Op.getOperand(0), Indices, Mask, VL);
}		}

		SDValue RISCVTargetLowering::lowerVECTOR_SPLICE(SDValue Op,
		SelectionDAG &DAG) const {
		SDLoc DL(Op);
		SDValue V1 = Op.getOperand(0);
		SDValue V2 = Op.getOperand(1);
		MVT XLenVT = Subtarget.getXLenVT();
		MVT VecVT = Op.getSimpleValueType();

		unsigned MinElts = VecVT.getVectorMinNumElements();
		SDValue VLMax = DAG.getNode(ISD::VSCALE, DL, XLenVT,
		DAG.getConstant(MinElts, DL, XLenVT));

		int64_t ImmValue = cast<ConstantSDNode>(Op.getOperand(2))->getSExtValue();
		SDValue DownOffset, UpOffset;
		frasercrmckUnsubmitted Not Done Reply Inline Actions This comment seems not to reflect the code on the following lines. frasercrmck: This comment seems not to reflect the code on the following lines.
		craig.topperAuthorUnsubmitted Done Reply Inline Actions Oops that was written in an earlier iteration of the Offset calculations. At one point I created (VLMax - (VLMax + Imm)) for the negative immediate case and DAGCombiner wouldn't simplify it to -Imm so I did it myself. craig.topper: Oops that was written in an earlier iteration of the Offset calculations. At one point I…
		if (ImmValue >= 0) {
		// The operand is a TargetConstant, we need to rebuild it as a regular
		// constant.
		DownOffset = DAG.getConstant(ImmValue, DL, XLenVT);
		UpOffset = DAG.getNode(ISD::SUB, DL, XLenVT, VLMax, DownOffset);
		} else {
		// The operand is a TargetConstant, we need to rebuild it as a regular
		// constant rather than negating the original operand.
		UpOffset = DAG.getConstant(-ImmValue, DL, XLenVT);
		DownOffset = DAG.getNode(ISD::SUB, DL, XLenVT, VLMax, UpOffset);
		}

		MVT MaskVT = MVT::getVectorVT(MVT::i1, VecVT.getVectorElementCount());
		SDValue TrueMask = DAG.getNode(RISCVISD::VMSET_VL, DL, MaskVT, VLMax);

		SDValue SlideDown =
		DAG.getNode(RISCVISD::VSLIDEDOWN_VL, DL, VecVT, DAG.getUNDEF(VecVT), V1,
		DownOffset, TrueMask, UpOffset);
		return DAG.getNode(RISCVISD::VSLIDEUP_VL, DL, VecVT, SlideDown, V2, UpOffset,
		TrueMask,
		DAG.getTargetConstant(RISCV::VLMaxSentinel, DL, XLenVT));
		}

SDValue		SDValue
RISCVTargetLowering::lowerFixedLengthVectorLoadToRVV(SDValue Op,		RISCVTargetLowering::lowerFixedLengthVectorLoadToRVV(SDValue Op,
SelectionDAG &DAG) const {		SelectionDAG &DAG) const {
SDLoc DL(Op);		SDLoc DL(Op);
auto *Load = cast<LoadSDNode>(Op);		auto *Load = cast<LoadSDNode>(Op);

assert(allowsMemoryAccessForAlignment(*DAG.getContext(), DAG.getDataLayout(),		assert(allowsMemoryAccessForAlignment(*DAG.getContext(), DAG.getDataLayout(),
Load->getMemoryVT(),		Load->getMemoryVT(),
▲ Show 20 Lines • Show All 5,899 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/vector-splice.ll

This file was added.

				; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
				; RUN: llc -mtriple riscv64 -mattr=+m,+f,+d,+v,+zfh < %s \| FileCheck %s

				; Tests assume VLEN=128 or vscale_range_min=2.

				frasercrmckUnsubmitted Not Done Reply Inline Actions Do they? frasercrmck: Do they?
				craig.topperAuthorUnsubmitted Done Reply Inline Actions There's a verifier check on the range of the immediate. Without a vscale_range the only allowed constants for <vscale x 1 x > are 0 and -1. So I increased it to give more options. craig.topper:* There's a verifier check on the range of the immediate. Without a vscale_range the only allowed…
				frasercrmckUnsubmitted Done Reply Inline Actions Ah I see, thanks, that wasn't obvious. frasercrmck: Ah I see, thanks, that wasn't obvious.
				declare <vscale x 1 x i8> @llvm.experimental.vector.splice.nxv1i8(<vscale x 1 x i8>, <vscale x 1 x i8>, i32)

				define <vscale x 1 x i8> @splice_nxv1i8_offset_zero(<vscale x 1 x i8> %a, <vscale x 1 x i8> %b) #0 {
				; CHECK-LABEL: splice_nxv1i8_offset_zero:
				; CHECK: # %bb.0:
				; CHECK-NEXT: ret
				%res = call <vscale x 1 x i8> @llvm.experimental.vector.splice.nxv1i8(<vscale x 1 x i8> %a, <vscale x 1 x i8> %b, i32 0)
				ret <vscale x 1 x i8> %res
				}

				define <vscale x 1 x i8> @splice_nxv1i8_offset_negone(<vscale x 1 x i8> %a, <vscale x 1 x i8> %b) #0 {
				; CHECK-LABEL: splice_nxv1i8_offset_negone:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: srli a0, a0, 3
				; CHECK-NEXT: addi a0, a0, -1
				; CHECK-NEXT: vsetivli zero, 1, e8, mf8, ta, mu
				; CHECK-NEXT: vslidedown.vx v8, v8, a0
				; CHECK-NEXT: vsetvli a0, zero, e8, mf8, tu, mu
				; CHECK-NEXT: vslideup.vi v8, v9, 1
				; CHECK-NEXT: ret
				%res = call <vscale x 1 x i8> @llvm.experimental.vector.splice.nxv1i8(<vscale x 1 x i8> %a, <vscale x 1 x i8> %b, i32 -1)
				ret <vscale x 1 x i8> %res
				}

				define <vscale x 1 x i8> @splice_nxv1i8_offset_min(<vscale x 1 x i8> %a, <vscale x 1 x i8> %b) #0 {
				; CHECK-LABEL: splice_nxv1i8_offset_min:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: srli a0, a0, 3
				; CHECK-NEXT: addi a0, a0, -2
				; CHECK-NEXT: vsetivli zero, 2, e8, mf8, ta, mu
				; CHECK-NEXT: vslidedown.vx v8, v8, a0
				; CHECK-NEXT: vsetvli a0, zero, e8, mf8, tu, mu
				; CHECK-NEXT: vslideup.vi v8, v9, 2
				; CHECK-NEXT: ret
				%res = call <vscale x 1 x i8> @llvm.experimental.vector.splice.nxv1i8(<vscale x 1 x i8> %a, <vscale x 1 x i8> %b, i32 -2)
				ret <vscale x 1 x i8> %res
				}

				define <vscale x 1 x i8> @splice_nxv1i8_offset_max(<vscale x 1 x i8> %a, <vscale x 1 x i8> %b) #0 {
				; CHECK-LABEL: splice_nxv1i8_offset_max:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: srli a0, a0, 3
				; CHECK-NEXT: addi a0, a0, -1
				; CHECK-NEXT: vsetvli zero, a0, e8, mf8, ta, mu
				; CHECK-NEXT: vslidedown.vi v8, v8, 1
				; CHECK-NEXT: vsetvli a1, zero, e8, mf8, tu, mu
				; CHECK-NEXT: vslideup.vx v8, v9, a0
				; CHECK-NEXT: ret
				%res = call <vscale x 1 x i8> @llvm.experimental.vector.splice.nxv1i8(<vscale x 1 x i8> %a, <vscale x 1 x i8> %b, i32 1)
				ret <vscale x 1 x i8> %res
				}

				declare <vscale x 2 x i8> @llvm.experimental.vector.splice.nxv2i8(<vscale x 2 x i8>, <vscale x 2 x i8>, i32)

				define <vscale x 2 x i8> @splice_nxv2i8_offset_zero(<vscale x 2 x i8> %a, <vscale x 2 x i8> %b) #0 {
				; CHECK-LABEL: splice_nxv2i8_offset_zero:
				; CHECK: # %bb.0:
				; CHECK-NEXT: ret
				%res = call <vscale x 2 x i8> @llvm.experimental.vector.splice.nxv2i8(<vscale x 2 x i8> %a, <vscale x 2 x i8> %b, i32 0)
				ret <vscale x 2 x i8> %res
				}

				define <vscale x 2 x i8> @splice_nxv2i8_offset_negone(<vscale x 2 x i8> %a, <vscale x 2 x i8> %b) #0 {
				; CHECK-LABEL: splice_nxv2i8_offset_negone:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: srli a0, a0, 2
				; CHECK-NEXT: addi a0, a0, -1
				; CHECK-NEXT: vsetivli zero, 1, e8, mf4, ta, mu
				; CHECK-NEXT: vslidedown.vx v8, v8, a0
				; CHECK-NEXT: vsetvli a0, zero, e8, mf4, tu, mu
				; CHECK-NEXT: vslideup.vi v8, v9, 1
				; CHECK-NEXT: ret
				%res = call <vscale x 2 x i8> @llvm.experimental.vector.splice.nxv2i8(<vscale x 2 x i8> %a, <vscale x 2 x i8> %b, i32 -1)
				ret <vscale x 2 x i8> %res
				}

				define <vscale x 2 x i8> @splice_nxv2i8_offset_min(<vscale x 2 x i8> %a, <vscale x 2 x i8> %b) #0 {
				; CHECK-LABEL: splice_nxv2i8_offset_min:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: srli a0, a0, 2
				; CHECK-NEXT: addi a0, a0, -4
				; CHECK-NEXT: vsetivli zero, 4, e8, mf4, ta, mu
				; CHECK-NEXT: vslidedown.vx v8, v8, a0
				; CHECK-NEXT: vsetvli a0, zero, e8, mf4, tu, mu
				; CHECK-NEXT: vslideup.vi v8, v9, 4
				; CHECK-NEXT: ret
				%res = call <vscale x 2 x i8> @llvm.experimental.vector.splice.nxv2i8(<vscale x 2 x i8> %a, <vscale x 2 x i8> %b, i32 -4)
				ret <vscale x 2 x i8> %res
				}

				define <vscale x 2 x i8> @splice_nxv2i8_offset_max(<vscale x 2 x i8> %a, <vscale x 2 x i8> %b) #0 {
				; CHECK-LABEL: splice_nxv2i8_offset_max:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: srli a0, a0, 2
				; CHECK-NEXT: addi a0, a0, -3
				; CHECK-NEXT: vsetvli zero, a0, e8, mf4, ta, mu
				; CHECK-NEXT: vslidedown.vi v8, v8, 3
				; CHECK-NEXT: vsetvli a1, zero, e8, mf4, tu, mu
				; CHECK-NEXT: vslideup.vx v8, v9, a0
				; CHECK-NEXT: ret
				%res = call <vscale x 2 x i8> @llvm.experimental.vector.splice.nxv2i8(<vscale x 2 x i8> %a, <vscale x 2 x i8> %b, i32 3)
				ret <vscale x 2 x i8> %res
				}

				declare <vscale x 4 x i8> @llvm.experimental.vector.splice.nxv4i8(<vscale x 4 x i8>, <vscale x 4 x i8>, i32)

				define <vscale x 4 x i8> @splice_nxv4i8_offset_zero(<vscale x 4 x i8> %a, <vscale x 4 x i8> %b) #0 {
				; CHECK-LABEL: splice_nxv4i8_offset_zero:
				; CHECK: # %bb.0:
				; CHECK-NEXT: ret
				%res = call <vscale x 4 x i8> @llvm.experimental.vector.splice.nxv4i8(<vscale x 4 x i8> %a, <vscale x 4 x i8> %b, i32 0)
				ret <vscale x 4 x i8> %res
				}

				define <vscale x 4 x i8> @splice_nxv4i8_offset_negone(<vscale x 4 x i8> %a, <vscale x 4 x i8> %b) #0 {
				; CHECK-LABEL: splice_nxv4i8_offset_negone:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: srli a0, a0, 1
				; CHECK-NEXT: addi a0, a0, -1
				; CHECK-NEXT: vsetivli zero, 1, e8, mf2, ta, mu
				; CHECK-NEXT: vslidedown.vx v8, v8, a0
				; CHECK-NEXT: vsetvli a0, zero, e8, mf2, tu, mu
				; CHECK-NEXT: vslideup.vi v8, v9, 1
				; CHECK-NEXT: ret
				%res = call <vscale x 4 x i8> @llvm.experimental.vector.splice.nxv4i8(<vscale x 4 x i8> %a, <vscale x 4 x i8> %b, i32 -1)
				ret <vscale x 4 x i8> %res
				}

				define <vscale x 4 x i8> @splice_nxv4i8_offset_min(<vscale x 4 x i8> %a, <vscale x 4 x i8> %b) #0 {
				; CHECK-LABEL: splice_nxv4i8_offset_min:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: srli a0, a0, 1
				; CHECK-NEXT: addi a0, a0, -8
				; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
				; CHECK-NEXT: vslidedown.vx v8, v8, a0
				; CHECK-NEXT: vsetvli a0, zero, e8, mf2, tu, mu
				; CHECK-NEXT: vslideup.vi v8, v9, 8
				; CHECK-NEXT: ret
				%res = call <vscale x 4 x i8> @llvm.experimental.vector.splice.nxv4i8(<vscale x 4 x i8> %a, <vscale x 4 x i8> %b, i32 -8)
				ret <vscale x 4 x i8> %res
				}

				define <vscale x 4 x i8> @splice_nxv4i8_offset_max(<vscale x 4 x i8> %a, <vscale x 4 x i8> %b) #0 {
				; CHECK-LABEL: splice_nxv4i8_offset_max:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: srli a0, a0, 1
				; CHECK-NEXT: addi a0, a0, -7
				; CHECK-NEXT: vsetvli zero, a0, e8, mf2, ta, mu
				; CHECK-NEXT: vslidedown.vi v8, v8, 7
				; CHECK-NEXT: vsetvli a1, zero, e8, mf2, tu, mu
				; CHECK-NEXT: vslideup.vx v8, v9, a0
				; CHECK-NEXT: ret
				%res = call <vscale x 4 x i8> @llvm.experimental.vector.splice.nxv4i8(<vscale x 4 x i8> %a, <vscale x 4 x i8> %b, i32 7)
				ret <vscale x 4 x i8> %res
				}

				declare <vscale x 8 x i8> @llvm.experimental.vector.splice.nxv8i8(<vscale x 8 x i8>, <vscale x 8 x i8>, i32)

				define <vscale x 8 x i8> @splice_nxv8i8_offset_zero(<vscale x 8 x i8> %a, <vscale x 8 x i8> %b) #0 {
				; CHECK-LABEL: splice_nxv8i8_offset_zero:
				; CHECK: # %bb.0:
				; CHECK-NEXT: ret
				%res = call <vscale x 8 x i8> @llvm.experimental.vector.splice.nxv8i8(<vscale x 8 x i8> %a, <vscale x 8 x i8> %b, i32 0)
				ret <vscale x 8 x i8> %res
				}

				define <vscale x 8 x i8> @splice_nxv8i8_offset_negone(<vscale x 8 x i8> %a, <vscale x 8 x i8> %b) #0 {
				; CHECK-LABEL: splice_nxv8i8_offset_negone:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: addi a0, a0, -1
				; CHECK-NEXT: vsetivli zero, 1, e8, m1, ta, mu
				; CHECK-NEXT: vslidedown.vx v8, v8, a0
				; CHECK-NEXT: vsetvli a0, zero, e8, m1, tu, mu
				; CHECK-NEXT: vslideup.vi v8, v9, 1
				; CHECK-NEXT: ret
				%res = call <vscale x 8 x i8> @llvm.experimental.vector.splice.nxv8i8(<vscale x 8 x i8> %a, <vscale x 8 x i8> %b, i32 -1)
				ret <vscale x 8 x i8> %res
				}

				define <vscale x 8 x i8> @splice_nxv8i8_offset_min(<vscale x 8 x i8> %a, <vscale x 8 x i8> %b) #0 {
				; CHECK-LABEL: splice_nxv8i8_offset_min:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: addi a0, a0, -16
				; CHECK-NEXT: vsetivli zero, 16, e8, m1, ta, mu
				; CHECK-NEXT: vslidedown.vx v8, v8, a0
				; CHECK-NEXT: vsetvli a0, zero, e8, m1, tu, mu
				; CHECK-NEXT: vslideup.vi v8, v9, 16
				; CHECK-NEXT: ret
				%res = call <vscale x 8 x i8> @llvm.experimental.vector.splice.nxv8i8(<vscale x 8 x i8> %a, <vscale x 8 x i8> %b, i32 -16)
				ret <vscale x 8 x i8> %res
				}

				define <vscale x 8 x i8> @splice_nxv8i8_offset_max(<vscale x 8 x i8> %a, <vscale x 8 x i8> %b) #0 {
				; CHECK-LABEL: splice_nxv8i8_offset_max:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: addi a0, a0, -15
				; CHECK-NEXT: vsetvli zero, a0, e8, m1, ta, mu
				; CHECK-NEXT: vslidedown.vi v8, v8, 15
				; CHECK-NEXT: vsetvli a1, zero, e8, m1, tu, mu
				; CHECK-NEXT: vslideup.vx v8, v9, a0
				; CHECK-NEXT: ret
				%res = call <vscale x 8 x i8> @llvm.experimental.vector.splice.nxv8i8(<vscale x 8 x i8> %a, <vscale x 8 x i8> %b, i32 15)
				ret <vscale x 8 x i8> %res
				}

				declare <vscale x 16 x i8> @llvm.experimental.vector.splice.nxv16i8(<vscale x 16 x i8>, <vscale x 16 x i8>, i32)

				define <vscale x 16 x i8> @splice_nxv16i8_offset_zero(<vscale x 16 x i8> %a, <vscale x 16 x i8> %b) #0 {
				; CHECK-LABEL: splice_nxv16i8_offset_zero:
				; CHECK: # %bb.0:
				; CHECK-NEXT: ret
				%res = call <vscale x 16 x i8> @llvm.experimental.vector.splice.nxv16i8(<vscale x 16 x i8> %a, <vscale x 16 x i8> %b, i32 0)
				ret <vscale x 16 x i8> %res
				}

				define <vscale x 16 x i8> @splice_nxv16i8_offset_negone(<vscale x 16 x i8> %a, <vscale x 16 x i8> %b) #0 {
				; CHECK-LABEL: splice_nxv16i8_offset_negone:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: slli a0, a0, 1
				; CHECK-NEXT: addi a0, a0, -1
				; CHECK-NEXT: vsetivli zero, 1, e8, m2, ta, mu
				; CHECK-NEXT: vslidedown.vx v8, v8, a0
				; CHECK-NEXT: vsetvli a0, zero, e8, m2, tu, mu
				; CHECK-NEXT: vslideup.vi v8, v10, 1
				; CHECK-NEXT: ret
				%res = call <vscale x 16 x i8> @llvm.experimental.vector.splice.nxv16i8(<vscale x 16 x i8> %a, <vscale x 16 x i8> %b, i32 -1)
				ret <vscale x 16 x i8> %res
				}

				define <vscale x 16 x i8> @splice_nxv16i8_offset_min(<vscale x 16 x i8> %a, <vscale x 16 x i8> %b) #0 {
				; CHECK-LABEL: splice_nxv16i8_offset_min:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: slli a0, a0, 1
				; CHECK-NEXT: addi a0, a0, -32
				; CHECK-NEXT: li a1, 32
				; CHECK-NEXT: vsetvli zero, a1, e8, m2, ta, mu
				; CHECK-NEXT: vslidedown.vx v8, v8, a0
				; CHECK-NEXT: vsetvli a0, zero, e8, m2, tu, mu
				; CHECK-NEXT: vslideup.vx v8, v10, a1
				; CHECK-NEXT: ret
				%res = call <vscale x 16 x i8> @llvm.experimental.vector.splice.nxv16i8(<vscale x 16 x i8> %a, <vscale x 16 x i8> %b, i32 -32)
				ret <vscale x 16 x i8> %res
				}

				define <vscale x 16 x i8> @splice_nxv16i8_offset_max(<vscale x 16 x i8> %a, <vscale x 16 x i8> %b) #0 {
				; CHECK-LABEL: splice_nxv16i8_offset_max:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: slli a0, a0, 1
				; CHECK-NEXT: addi a0, a0, -31
				; CHECK-NEXT: vsetvli zero, a0, e8, m2, ta, mu
				; CHECK-NEXT: vslidedown.vi v8, v8, 31
				; CHECK-NEXT: vsetvli a1, zero, e8, m2, tu, mu
				; CHECK-NEXT: vslideup.vx v8, v10, a0
				; CHECK-NEXT: ret
				%res = call <vscale x 16 x i8> @llvm.experimental.vector.splice.nxv16i8(<vscale x 16 x i8> %a, <vscale x 16 x i8> %b, i32 31)
				ret <vscale x 16 x i8> %res
				}

				declare <vscale x 32 x i8> @llvm.experimental.vector.splice.nxv32i8(<vscale x 32 x i8>, <vscale x 32 x i8>, i32)

				define <vscale x 32 x i8> @splice_nxv32i8_offset_zero(<vscale x 32 x i8> %a, <vscale x 32 x i8> %b) #0 {
				; CHECK-LABEL: splice_nxv32i8_offset_zero:
				; CHECK: # %bb.0:
				; CHECK-NEXT: ret
				%res = call <vscale x 32 x i8> @llvm.experimental.vector.splice.nxv32i8(<vscale x 32 x i8> %a, <vscale x 32 x i8> %b, i32 0)
				ret <vscale x 32 x i8> %res
				}

				define <vscale x 32 x i8> @splice_nxv32i8_offset_negone(<vscale x 32 x i8> %a, <vscale x 32 x i8> %b) #0 {
				; CHECK-LABEL: splice_nxv32i8_offset_negone:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: slli a0, a0, 2
				; CHECK-NEXT: addi a0, a0, -1
				; CHECK-NEXT: vsetivli zero, 1, e8, m4, ta, mu
				; CHECK-NEXT: vslidedown.vx v8, v8, a0
				; CHECK-NEXT: vsetvli a0, zero, e8, m4, tu, mu
				; CHECK-NEXT: vslideup.vi v8, v12, 1
				; CHECK-NEXT: ret
				%res = call <vscale x 32 x i8> @llvm.experimental.vector.splice.nxv32i8(<vscale x 32 x i8> %a, <vscale x 32 x i8> %b, i32 -1)
				ret <vscale x 32 x i8> %res
				}

				define <vscale x 32 x i8> @splice_nxv32i8_offset_min(<vscale x 32 x i8> %a, <vscale x 32 x i8> %b) #0 {
				; CHECK-LABEL: splice_nxv32i8_offset_min:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: slli a0, a0, 2
				; CHECK-NEXT: addi a0, a0, -64
				; CHECK-NEXT: li a1, 64
				; CHECK-NEXT: vsetvli zero, a1, e8, m4, ta, mu
				; CHECK-NEXT: vslidedown.vx v8, v8, a0
				; CHECK-NEXT: vsetvli a0, zero, e8, m4, tu, mu
				; CHECK-NEXT: vslideup.vx v8, v12, a1
				; CHECK-NEXT: ret
				%res = call <vscale x 32 x i8> @llvm.experimental.vector.splice.nxv32i8(<vscale x 32 x i8> %a, <vscale x 32 x i8> %b, i32 -64)
				ret <vscale x 32 x i8> %res
				}

				define <vscale x 32 x i8> @splice_nxv32i8_offset_max(<vscale x 32 x i8> %a, <vscale x 32 x i8> %b) #0 {
				; CHECK-LABEL: splice_nxv32i8_offset_max:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: slli a0, a0, 2
				; CHECK-NEXT: addi a0, a0, -63
				; CHECK-NEXT: li a1, 63
				; CHECK-NEXT: vsetvli zero, a0, e8, m4, ta, mu
				; CHECK-NEXT: vslidedown.vx v8, v8, a1
				; CHECK-NEXT: vsetvli a1, zero, e8, m4, tu, mu
				; CHECK-NEXT: vslideup.vx v8, v12, a0
				; CHECK-NEXT: ret
				%res = call <vscale x 32 x i8> @llvm.experimental.vector.splice.nxv32i8(<vscale x 32 x i8> %a, <vscale x 32 x i8> %b, i32 63)
				ret <vscale x 32 x i8> %res
				}

				declare <vscale x 64 x i8> @llvm.experimental.vector.splice.nxv64i8(<vscale x 64 x i8>, <vscale x 64 x i8>, i32)

				define <vscale x 64 x i8> @splice_nxv64i8_offset_zero(<vscale x 64 x i8> %a, <vscale x 64 x i8> %b) #0 {
				; CHECK-LABEL: splice_nxv64i8_offset_zero:
				; CHECK: # %bb.0:
				; CHECK-NEXT: ret
				%res = call <vscale x 64 x i8> @llvm.experimental.vector.splice.nxv64i8(<vscale x 64 x i8> %a, <vscale x 64 x i8> %b, i32 0)
				ret <vscale x 64 x i8> %res
				}

				define <vscale x 64 x i8> @splice_nxv64i8_offset_negone(<vscale x 64 x i8> %a, <vscale x 64 x i8> %b) #0 {
				; CHECK-LABEL: splice_nxv64i8_offset_negone:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: slli a0, a0, 3
				; CHECK-NEXT: addi a0, a0, -1
				; CHECK-NEXT: vsetivli zero, 1, e8, m8, ta, mu
				; CHECK-NEXT: vslidedown.vx v8, v8, a0
				; CHECK-NEXT: vsetvli a0, zero, e8, m8, tu, mu
				; CHECK-NEXT: vslideup.vi v8, v16, 1
				; CHECK-NEXT: ret
				%res = call <vscale x 64 x i8> @llvm.experimental.vector.splice.nxv64i8(<vscale x 64 x i8> %a, <vscale x 64 x i8> %b, i32 -1)
				ret <vscale x 64 x i8> %res
				}

				define <vscale x 64 x i8> @splice_nxv64i8_offset_min(<vscale x 64 x i8> %a, <vscale x 64 x i8> %b) #0 {
				; CHECK-LABEL: splice_nxv64i8_offset_min:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: slli a0, a0, 3
				; CHECK-NEXT: addi a0, a0, -128
				; CHECK-NEXT: li a1, 128
				; CHECK-NEXT: vsetvli zero, a1, e8, m8, ta, mu
				; CHECK-NEXT: vslidedown.vx v8, v8, a0
				; CHECK-NEXT: vsetvli a0, zero, e8, m8, tu, mu
				; CHECK-NEXT: vslideup.vx v8, v16, a1
				; CHECK-NEXT: ret
				%res = call <vscale x 64 x i8> @llvm.experimental.vector.splice.nxv64i8(<vscale x 64 x i8> %a, <vscale x 64 x i8> %b, i32 -128)
				ret <vscale x 64 x i8> %res
				}

				define <vscale x 64 x i8> @splice_nxv64i8_offset_max(<vscale x 64 x i8> %a, <vscale x 64 x i8> %b) #0 {
				; CHECK-LABEL: splice_nxv64i8_offset_max:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: slli a0, a0, 3
				; CHECK-NEXT: addi a0, a0, -127
				; CHECK-NEXT: li a1, 127
				; CHECK-NEXT: vsetvli zero, a0, e8, m8, ta, mu
				; CHECK-NEXT: vslidedown.vx v8, v8, a1
				; CHECK-NEXT: vsetvli a1, zero, e8, m8, tu, mu
				; CHECK-NEXT: vslideup.vx v8, v16, a0
				; CHECK-NEXT: ret
				%res = call <vscale x 64 x i8> @llvm.experimental.vector.splice.nxv64i8(<vscale x 64 x i8> %a, <vscale x 64 x i8> %b, i32 127)
				ret <vscale x 64 x i8> %res
				}

				declare <vscale x 1 x i16> @llvm.experimental.vector.splice.nxv1i16(<vscale x 1 x i16>, <vscale x 1 x i16>, i32)

				define <vscale x 1 x i16> @splice_nxv1i16_offset_zero(<vscale x 1 x i16> %a, <vscale x 1 x i16> %b) #0 {
				; CHECK-LABEL: splice_nxv1i16_offset_zero:
				; CHECK: # %bb.0:
				; CHECK-NEXT: ret
				%res = call <vscale x 1 x i16> @llvm.experimental.vector.splice.nxv1i16(<vscale x 1 x i16> %a, <vscale x 1 x i16> %b, i32 0)
				ret <vscale x 1 x i16> %res
				}

				define <vscale x 1 x i16> @splice_nxv1i16_offset_negone(<vscale x 1 x i16> %a, <vscale x 1 x i16> %b) #0 {
				; CHECK-LABEL: splice_nxv1i16_offset_negone:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: srli a0, a0, 3
				; CHECK-NEXT: addi a0, a0, -1
				; CHECK-NEXT: vsetivli zero, 1, e16, mf4, ta, mu
				; CHECK-NEXT: vslidedown.vx v8, v8, a0
				; CHECK-NEXT: vsetvli a0, zero, e16, mf4, tu, mu
				; CHECK-NEXT: vslideup.vi v8, v9, 1
				; CHECK-NEXT: ret
				%res = call <vscale x 1 x i16> @llvm.experimental.vector.splice.nxv1i16(<vscale x 1 x i16> %a, <vscale x 1 x i16> %b, i32 -1)
				ret <vscale x 1 x i16> %res
				}

				define <vscale x 1 x i16> @splice_nxv1i16_offset_min(<vscale x 1 x i16> %a, <vscale x 1 x i16> %b) #0 {
				; CHECK-LABEL: splice_nxv1i16_offset_min:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: srli a0, a0, 3
				; CHECK-NEXT: addi a0, a0, -2
				; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, mu
				; CHECK-NEXT: vslidedown.vx v8, v8, a0
				; CHECK-NEXT: vsetvli a0, zero, e16, mf4, tu, mu
				; CHECK-NEXT: vslideup.vi v8, v9, 2
				; CHECK-NEXT: ret
				%res = call <vscale x 1 x i16> @llvm.experimental.vector.splice.nxv1i16(<vscale x 1 x i16> %a, <vscale x 1 x i16> %b, i32 -2)
				ret <vscale x 1 x i16> %res
				}

				define <vscale x 1 x i16> @splice_nxv1i16_offset_max(<vscale x 1 x i16> %a, <vscale x 1 x i16> %b) #0 {
				; CHECK-LABEL: splice_nxv1i16_offset_max:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: srli a0, a0, 3
				; CHECK-NEXT: addi a0, a0, -1
				; CHECK-NEXT: vsetvli zero, a0, e16, mf4, ta, mu
				; CHECK-NEXT: vslidedown.vi v8, v8, 1
				; CHECK-NEXT: vsetvli a1, zero, e16, mf4, tu, mu
				; CHECK-NEXT: vslideup.vx v8, v9, a0
				; CHECK-NEXT: ret
				%res = call <vscale x 1 x i16> @llvm.experimental.vector.splice.nxv1i16(<vscale x 1 x i16> %a, <vscale x 1 x i16> %b, i32 1)
				ret <vscale x 1 x i16> %res
				}

				declare <vscale x 2 x i16> @llvm.experimental.vector.splice.nxv2i16(<vscale x 2 x i16>, <vscale x 2 x i16>, i32)

				define <vscale x 2 x i16> @splice_nxv2i16_offset_zero(<vscale x 2 x i16> %a, <vscale x 2 x i16> %b) #0 {
				; CHECK-LABEL: splice_nxv2i16_offset_zero:
				; CHECK: # %bb.0:
				; CHECK-NEXT: ret
				%res = call <vscale x 2 x i16> @llvm.experimental.vector.splice.nxv2i16(<vscale x 2 x i16> %a, <vscale x 2 x i16> %b, i32 0)
				ret <vscale x 2 x i16> %res
				}

				define <vscale x 2 x i16> @splice_nxv2i16_offset_negone(<vscale x 2 x i16> %a, <vscale x 2 x i16> %b) #0 {
				; CHECK-LABEL: splice_nxv2i16_offset_negone:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: srli a0, a0, 2
				; CHECK-NEXT: addi a0, a0, -1
				; CHECK-NEXT: vsetivli zero, 1, e16, mf2, ta, mu
				; CHECK-NEXT: vslidedown.vx v8, v8, a0
				; CHECK-NEXT: vsetvli a0, zero, e16, mf2, tu, mu
				; CHECK-NEXT: vslideup.vi v8, v9, 1
				; CHECK-NEXT: ret
				%res = call <vscale x 2 x i16> @llvm.experimental.vector.splice.nxv2i16(<vscale x 2 x i16> %a, <vscale x 2 x i16> %b, i32 -1)
				ret <vscale x 2 x i16> %res
				}

				define <vscale x 2 x i16> @splice_nxv2i16_offset_min(<vscale x 2 x i16> %a, <vscale x 2 x i16> %b) #0 {
				; CHECK-LABEL: splice_nxv2i16_offset_min:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: srli a0, a0, 2
				; CHECK-NEXT: addi a0, a0, -4
				; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, mu
				; CHECK-NEXT: vslidedown.vx v8, v8, a0
				; CHECK-NEXT: vsetvli a0, zero, e16, mf2, tu, mu
				; CHECK-NEXT: vslideup.vi v8, v9, 4
				; CHECK-NEXT: ret
				%res = call <vscale x 2 x i16> @llvm.experimental.vector.splice.nxv2i16(<vscale x 2 x i16> %a, <vscale x 2 x i16> %b, i32 -4)
				ret <vscale x 2 x i16> %res
				}

				define <vscale x 2 x i16> @splice_nxv2i16_offset_max(<vscale x 2 x i16> %a, <vscale x 2 x i16> %b) #0 {
				; CHECK-LABEL: splice_nxv2i16_offset_max:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: srli a0, a0, 2
				; CHECK-NEXT: addi a0, a0, -3
				; CHECK-NEXT: vsetvli zero, a0, e16, mf2, ta, mu
				; CHECK-NEXT: vslidedown.vi v8, v8, 3
				; CHECK-NEXT: vsetvli a1, zero, e16, mf2, tu, mu
				; CHECK-NEXT: vslideup.vx v8, v9, a0
				; CHECK-NEXT: ret
				%res = call <vscale x 2 x i16> @llvm.experimental.vector.splice.nxv2i16(<vscale x 2 x i16> %a, <vscale x 2 x i16> %b, i32 3)
				ret <vscale x 2 x i16> %res
				}

				declare <vscale x 4 x i16> @llvm.experimental.vector.splice.nxv4i16(<vscale x 4 x i16>, <vscale x 4 x i16>, i32)

				define <vscale x 4 x i16> @splice_nxv4i16_offset_zero(<vscale x 4 x i16> %a, <vscale x 4 x i16> %b) #0 {
				; CHECK-LABEL: splice_nxv4i16_offset_zero:
				; CHECK: # %bb.0:
				; CHECK-NEXT: ret
				%res = call <vscale x 4 x i16> @llvm.experimental.vector.splice.nxv4i16(<vscale x 4 x i16> %a, <vscale x 4 x i16> %b, i32 0)
				ret <vscale x 4 x i16> %res
				}

				define <vscale x 4 x i16> @splice_nxv4i16_offset_negone(<vscale x 4 x i16> %a, <vscale x 4 x i16> %b) #0 {
				; CHECK-LABEL: splice_nxv4i16_offset_negone:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: srli a0, a0, 1
				; CHECK-NEXT: addi a0, a0, -1
				; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, mu
				; CHECK-NEXT: vslidedown.vx v8, v8, a0
				; CHECK-NEXT: vsetvli a0, zero, e16, m1, tu, mu
				; CHECK-NEXT: vslideup.vi v8, v9, 1
				; CHECK-NEXT: ret
				%res = call <vscale x 4 x i16> @llvm.experimental.vector.splice.nxv4i16(<vscale x 4 x i16> %a, <vscale x 4 x i16> %b, i32 -1)
				ret <vscale x 4 x i16> %res
				}

				define <vscale x 4 x i16> @splice_nxv4i16_offset_min(<vscale x 4 x i16> %a, <vscale x 4 x i16> %b) #0 {
				; CHECK-LABEL: splice_nxv4i16_offset_min:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: srli a0, a0, 1
				; CHECK-NEXT: addi a0, a0, -8
				; CHECK-NEXT: vsetivli zero, 8, e16, m1, ta, mu
				; CHECK-NEXT: vslidedown.vx v8, v8, a0
				; CHECK-NEXT: vsetvli a0, zero, e16, m1, tu, mu
				; CHECK-NEXT: vslideup.vi v8, v9, 8
				; CHECK-NEXT: ret
				%res = call <vscale x 4 x i16> @llvm.experimental.vector.splice.nxv4i16(<vscale x 4 x i16> %a, <vscale x 4 x i16> %b, i32 -8)
				ret <vscale x 4 x i16> %res
				}

				define <vscale x 4 x i16> @splice_nxv4i16_offset_max(<vscale x 4 x i16> %a, <vscale x 4 x i16> %b) #0 {
				; CHECK-LABEL: splice_nxv4i16_offset_max:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: srli a0, a0, 1
				; CHECK-NEXT: addi a0, a0, -7
				; CHECK-NEXT: vsetvli zero, a0, e16, m1, ta, mu
				; CHECK-NEXT: vslidedown.vi v8, v8, 7
				; CHECK-NEXT: vsetvli a1, zero, e16, m1, tu, mu
				; CHECK-NEXT: vslideup.vx v8, v9, a0
				; CHECK-NEXT: ret
				%res = call <vscale x 4 x i16> @llvm.experimental.vector.splice.nxv4i16(<vscale x 4 x i16> %a, <vscale x 4 x i16> %b, i32 7)
				ret <vscale x 4 x i16> %res
				}

				declare <vscale x 8 x i16> @llvm.experimental.vector.splice.nxv8i16(<vscale x 8 x i16>, <vscale x 8 x i16>, i32)

				define <vscale x 8 x i16> @splice_nxv8i16_offset_zero(<vscale x 8 x i16> %a, <vscale x 8 x i16> %b) #0 {
				; CHECK-LABEL: splice_nxv8i16_offset_zero:
				; CHECK: # %bb.0:
				; CHECK-NEXT: ret
				%res = call <vscale x 8 x i16> @llvm.experimental.vector.splice.nxv8i16(<vscale x 8 x i16> %a, <vscale x 8 x i16> %b, i32 0)
				ret <vscale x 8 x i16> %res
				}

				define <vscale x 8 x i16> @splice_nxv8i16_offset_negone(<vscale x 8 x i16> %a, <vscale x 8 x i16> %b) #0 {
				; CHECK-LABEL: splice_nxv8i16_offset_negone:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: addi a0, a0, -1
				; CHECK-NEXT: vsetivli zero, 1, e16, m2, ta, mu
				; CHECK-NEXT: vslidedown.vx v8, v8, a0
				; CHECK-NEXT: vsetvli a0, zero, e16, m2, tu, mu
				; CHECK-NEXT: vslideup.vi v8, v10, 1
				; CHECK-NEXT: ret
				%res = call <vscale x 8 x i16> @llvm.experimental.vector.splice.nxv8i16(<vscale x 8 x i16> %a, <vscale x 8 x i16> %b, i32 -1)
				ret <vscale x 8 x i16> %res
				}

				define <vscale x 8 x i16> @splice_nxv8i16_offset_min(<vscale x 8 x i16> %a, <vscale x 8 x i16> %b) #0 {
				; CHECK-LABEL: splice_nxv8i16_offset_min:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: addi a0, a0, -16
				; CHECK-NEXT: vsetivli zero, 16, e16, m2, ta, mu
				; CHECK-NEXT: vslidedown.vx v8, v8, a0
				; CHECK-NEXT: vsetvli a0, zero, e16, m2, tu, mu
				; CHECK-NEXT: vslideup.vi v8, v10, 16
				; CHECK-NEXT: ret
				%res = call <vscale x 8 x i16> @llvm.experimental.vector.splice.nxv8i16(<vscale x 8 x i16> %a, <vscale x 8 x i16> %b, i32 -16)
				ret <vscale x 8 x i16> %res
				}

				define <vscale x 8 x i16> @splice_nxv8i16_offset_max(<vscale x 8 x i16> %a, <vscale x 8 x i16> %b) #0 {
				; CHECK-LABEL: splice_nxv8i16_offset_max:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: addi a0, a0, -15
				; CHECK-NEXT: vsetvli zero, a0, e16, m2, ta, mu
				; CHECK-NEXT: vslidedown.vi v8, v8, 15
				; CHECK-NEXT: vsetvli a1, zero, e16, m2, tu, mu
				; CHECK-NEXT: vslideup.vx v8, v10, a0
				; CHECK-NEXT: ret
				%res = call <vscale x 8 x i16> @llvm.experimental.vector.splice.nxv8i16(<vscale x 8 x i16> %a, <vscale x 8 x i16> %b, i32 15)
				ret <vscale x 8 x i16> %res
				}

				declare <vscale x 16 x i16> @llvm.experimental.vector.splice.nxv16i16(<vscale x 16 x i16>, <vscale x 16 x i16>, i32)

				define <vscale x 16 x i16> @splice_nxv16i16_offset_zero(<vscale x 16 x i16> %a, <vscale x 16 x i16> %b) #0 {
				; CHECK-LABEL: splice_nxv16i16_offset_zero:
				; CHECK: # %bb.0:
				; CHECK-NEXT: ret
				%res = call <vscale x 16 x i16> @llvm.experimental.vector.splice.nxv16i16(<vscale x 16 x i16> %a, <vscale x 16 x i16> %b, i32 0)
				ret <vscale x 16 x i16> %res
				}

				define <vscale x 16 x i16> @splice_nxv16i16_offset_negone(<vscale x 16 x i16> %a, <vscale x 16 x i16> %b) #0 {
				; CHECK-LABEL: splice_nxv16i16_offset_negone:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: slli a0, a0, 1
				; CHECK-NEXT: addi a0, a0, -1
				; CHECK-NEXT: vsetivli zero, 1, e16, m4, ta, mu
				; CHECK-NEXT: vslidedown.vx v8, v8, a0
				; CHECK-NEXT: vsetvli a0, zero, e16, m4, tu, mu
				; CHECK-NEXT: vslideup.vi v8, v12, 1
				; CHECK-NEXT: ret
				%res = call <vscale x 16 x i16> @llvm.experimental.vector.splice.nxv16i16(<vscale x 16 x i16> %a, <vscale x 16 x i16> %b, i32 -1)
				ret <vscale x 16 x i16> %res
				}

				define <vscale x 16 x i16> @splice_nxv16i16_offset_min(<vscale x 16 x i16> %a, <vscale x 16 x i16> %b) #0 {
				; CHECK-LABEL: splice_nxv16i16_offset_min:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: slli a0, a0, 1
				; CHECK-NEXT: addi a0, a0, -32
				; CHECK-NEXT: li a1, 32
				; CHECK-NEXT: vsetvli zero, a1, e16, m4, ta, mu
				; CHECK-NEXT: vslidedown.vx v8, v8, a0
				; CHECK-NEXT: vsetvli a0, zero, e16, m4, tu, mu
				; CHECK-NEXT: vslideup.vx v8, v12, a1
				; CHECK-NEXT: ret
				%res = call <vscale x 16 x i16> @llvm.experimental.vector.splice.nxv16i16(<vscale x 16 x i16> %a, <vscale x 16 x i16> %b, i32 -32)
				ret <vscale x 16 x i16> %res
				}

				define <vscale x 16 x i16> @splice_nxv16i16_offset_max(<vscale x 16 x i16> %a, <vscale x 16 x i16> %b) #0 {
				; CHECK-LABEL: splice_nxv16i16_offset_max:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: slli a0, a0, 1
				; CHECK-NEXT: addi a0, a0, -31
				; CHECK-NEXT: vsetvli zero, a0, e16, m4, ta, mu
				; CHECK-NEXT: vslidedown.vi v8, v8, 31
				; CHECK-NEXT: vsetvli a1, zero, e16, m4, tu, mu
				; CHECK-NEXT: vslideup.vx v8, v12, a0
				; CHECK-NEXT: ret
				%res = call <vscale x 16 x i16> @llvm.experimental.vector.splice.nxv16i16(<vscale x 16 x i16> %a, <vscale x 16 x i16> %b, i32 31)
				ret <vscale x 16 x i16> %res
				}

				declare <vscale x 32 x i16> @llvm.experimental.vector.splice.nxv32i16(<vscale x 32 x i16>, <vscale x 32 x i16>, i32)

				define <vscale x 32 x i16> @splice_nxv32i16_offset_zero(<vscale x 32 x i16> %a, <vscale x 32 x i16> %b) #0 {
				; CHECK-LABEL: splice_nxv32i16_offset_zero:
				; CHECK: # %bb.0:
				; CHECK-NEXT: ret
				%res = call <vscale x 32 x i16> @llvm.experimental.vector.splice.nxv32i16(<vscale x 32 x i16> %a, <vscale x 32 x i16> %b, i32 0)
				ret <vscale x 32 x i16> %res
				}

				define <vscale x 32 x i16> @splice_nxv32i16_offset_negone(<vscale x 32 x i16> %a, <vscale x 32 x i16> %b) #0 {
				; CHECK-LABEL: splice_nxv32i16_offset_negone:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: slli a0, a0, 2
				; CHECK-NEXT: addi a0, a0, -1
				; CHECK-NEXT: vsetivli zero, 1, e16, m8, ta, mu
				; CHECK-NEXT: vslidedown.vx v8, v8, a0
				; CHECK-NEXT: vsetvli a0, zero, e16, m8, tu, mu
				; CHECK-NEXT: vslideup.vi v8, v16, 1
				; CHECK-NEXT: ret
				%res = call <vscale x 32 x i16> @llvm.experimental.vector.splice.nxv32i16(<vscale x 32 x i16> %a, <vscale x 32 x i16> %b, i32 -1)
				ret <vscale x 32 x i16> %res
				}

				define <vscale x 32 x i16> @splice_nxv32i16_offset_min(<vscale x 32 x i16> %a, <vscale x 32 x i16> %b) #0 {
				; CHECK-LABEL: splice_nxv32i16_offset_min:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: slli a0, a0, 2
				; CHECK-NEXT: addi a0, a0, -64
				; CHECK-NEXT: li a1, 64
				; CHECK-NEXT: vsetvli zero, a1, e16, m8, ta, mu
				; CHECK-NEXT: vslidedown.vx v8, v8, a0
				; CHECK-NEXT: vsetvli a0, zero, e16, m8, tu, mu
				; CHECK-NEXT: vslideup.vx v8, v16, a1
				; CHECK-NEXT: ret
				%res = call <vscale x 32 x i16> @llvm.experimental.vector.splice.nxv32i16(<vscale x 32 x i16> %a, <vscale x 32 x i16> %b, i32 -64)
				ret <vscale x 32 x i16> %res
				}

				define <vscale x 32 x i16> @splice_nxv32i16_offset_max(<vscale x 32 x i16> %a, <vscale x 32 x i16> %b) #0 {
				; CHECK-LABEL: splice_nxv32i16_offset_max:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: slli a0, a0, 2
				; CHECK-NEXT: addi a0, a0, -63
				; CHECK-NEXT: li a1, 63
				; CHECK-NEXT: vsetvli zero, a0, e16, m8, ta, mu
				; CHECK-NEXT: vslidedown.vx v8, v8, a1
				; CHECK-NEXT: vsetvli a1, zero, e16, m8, tu, mu
				; CHECK-NEXT: vslideup.vx v8, v16, a0
				; CHECK-NEXT: ret
				%res = call <vscale x 32 x i16> @llvm.experimental.vector.splice.nxv32i16(<vscale x 32 x i16> %a, <vscale x 32 x i16> %b, i32 63)
				ret <vscale x 32 x i16> %res
				}

				declare <vscale x 1 x i32> @llvm.experimental.vector.splice.nxv1i32(<vscale x 1 x i32>, <vscale x 1 x i32>, i32)

				define <vscale x 1 x i32> @splice_nxv1i32_offset_zero(<vscale x 1 x i32> %a, <vscale x 1 x i32> %b) #0 {
				; CHECK-LABEL: splice_nxv1i32_offset_zero:
				; CHECK: # %bb.0:
				; CHECK-NEXT: ret
				%res = call <vscale x 1 x i32> @llvm.experimental.vector.splice.nxv1i32(<vscale x 1 x i32> %a, <vscale x 1 x i32> %b, i32 0)
				ret <vscale x 1 x i32> %res
				}

				define <vscale x 1 x i32> @splice_nxv1i32_offset_negone(<vscale x 1 x i32> %a, <vscale x 1 x i32> %b) #0 {
				; CHECK-LABEL: splice_nxv1i32_offset_negone:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: srli a0, a0, 3
				; CHECK-NEXT: addi a0, a0, -1
				; CHECK-NEXT: vsetivli zero, 1, e32, mf2, ta, mu
				; CHECK-NEXT: vslidedown.vx v8, v8, a0
				; CHECK-NEXT: vsetvli a0, zero, e32, mf2, tu, mu
				; CHECK-NEXT: vslideup.vi v8, v9, 1
				; CHECK-NEXT: ret
				%res = call <vscale x 1 x i32> @llvm.experimental.vector.splice.nxv1i32(<vscale x 1 x i32> %a, <vscale x 1 x i32> %b, i32 -1)
				ret <vscale x 1 x i32> %res
				}

				define <vscale x 1 x i32> @splice_nxv1i32_offset_min(<vscale x 1 x i32> %a, <vscale x 1 x i32> %b) #0 {
				; CHECK-LABEL: splice_nxv1i32_offset_min:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: srli a0, a0, 3
				; CHECK-NEXT: addi a0, a0, -2
				; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
				; CHECK-NEXT: vslidedown.vx v8, v8, a0
				; CHECK-NEXT: vsetvli a0, zero, e32, mf2, tu, mu
				; CHECK-NEXT: vslideup.vi v8, v9, 2
				; CHECK-NEXT: ret
				%res = call <vscale x 1 x i32> @llvm.experimental.vector.splice.nxv1i32(<vscale x 1 x i32> %a, <vscale x 1 x i32> %b, i32 -2)
				ret <vscale x 1 x i32> %res
				}

				define <vscale x 1 x i32> @splice_nxv1i32_offset_max(<vscale x 1 x i32> %a, <vscale x 1 x i32> %b) #0 {
				; CHECK-LABEL: splice_nxv1i32_offset_max:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: srli a0, a0, 3
				; CHECK-NEXT: addi a0, a0, -1
				; CHECK-NEXT: vsetvli zero, a0, e32, mf2, ta, mu
				; CHECK-NEXT: vslidedown.vi v8, v8, 1
				; CHECK-NEXT: vsetvli a1, zero, e32, mf2, tu, mu
				; CHECK-NEXT: vslideup.vx v8, v9, a0
				; CHECK-NEXT: ret
				%res = call <vscale x 1 x i32> @llvm.experimental.vector.splice.nxv1i32(<vscale x 1 x i32> %a, <vscale x 1 x i32> %b, i32 1)
				ret <vscale x 1 x i32> %res
				}

				declare <vscale x 2 x i32> @llvm.experimental.vector.splice.nxv2i32(<vscale x 2 x i32>, <vscale x 2 x i32>, i32)

				define <vscale x 2 x i32> @splice_nxv2i32_offset_zero(<vscale x 2 x i32> %a, <vscale x 2 x i32> %b) #0 {
				; CHECK-LABEL: splice_nxv2i32_offset_zero:
				; CHECK: # %bb.0:
				; CHECK-NEXT: ret
				%res = call <vscale x 2 x i32> @llvm.experimental.vector.splice.nxv2i32(<vscale x 2 x i32> %a, <vscale x 2 x i32> %b, i32 0)
				ret <vscale x 2 x i32> %res
				}

				define <vscale x 2 x i32> @splice_nxv2i32_offset_negone(<vscale x 2 x i32> %a, <vscale x 2 x i32> %b) #0 {
				; CHECK-LABEL: splice_nxv2i32_offset_negone:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: srli a0, a0, 2
				; CHECK-NEXT: addi a0, a0, -1
				; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, mu
				; CHECK-NEXT: vslidedown.vx v8, v8, a0
				; CHECK-NEXT: vsetvli a0, zero, e32, m1, tu, mu
				; CHECK-NEXT: vslideup.vi v8, v9, 1
				; CHECK-NEXT: ret
				%res = call <vscale x 2 x i32> @llvm.experimental.vector.splice.nxv2i32(<vscale x 2 x i32> %a, <vscale x 2 x i32> %b, i32 -1)
				ret <vscale x 2 x i32> %res
				}

				define <vscale x 2 x i32> @splice_nxv2i32_offset_min(<vscale x 2 x i32> %a, <vscale x 2 x i32> %b) #0 {
				; CHECK-LABEL: splice_nxv2i32_offset_min:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: srli a0, a0, 2
				; CHECK-NEXT: addi a0, a0, -4
				; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
				; CHECK-NEXT: vslidedown.vx v8, v8, a0
				; CHECK-NEXT: vsetvli a0, zero, e32, m1, tu, mu
				; CHECK-NEXT: vslideup.vi v8, v9, 4
				; CHECK-NEXT: ret
				%res = call <vscale x 2 x i32> @llvm.experimental.vector.splice.nxv2i32(<vscale x 2 x i32> %a, <vscale x 2 x i32> %b, i32 -4)
				ret <vscale x 2 x i32> %res
				}

				define <vscale x 2 x i32> @splice_nxv2i32_offset_max(<vscale x 2 x i32> %a, <vscale x 2 x i32> %b) #0 {
				; CHECK-LABEL: splice_nxv2i32_offset_max:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: srli a0, a0, 2
				; CHECK-NEXT: addi a0, a0, -3
				; CHECK-NEXT: vsetvli zero, a0, e32, m1, ta, mu
				; CHECK-NEXT: vslidedown.vi v8, v8, 3
				; CHECK-NEXT: vsetvli a1, zero, e32, m1, tu, mu
				; CHECK-NEXT: vslideup.vx v8, v9, a0
				; CHECK-NEXT: ret
				%res = call <vscale x 2 x i32> @llvm.experimental.vector.splice.nxv2i32(<vscale x 2 x i32> %a, <vscale x 2 x i32> %b, i32 3)
				ret <vscale x 2 x i32> %res
				}

				declare <vscale x 4 x i32> @llvm.experimental.vector.splice.nxv4i32(<vscale x 4 x i32>, <vscale x 4 x i32>, i32)

				define <vscale x 4 x i32> @splice_nxv4i32_offset_zero(<vscale x 4 x i32> %a, <vscale x 4 x i32> %b) #0 {
				; CHECK-LABEL: splice_nxv4i32_offset_zero:
				; CHECK: # %bb.0:
				; CHECK-NEXT: ret
				%res = call <vscale x 4 x i32> @llvm.experimental.vector.splice.nxv4i32(<vscale x 4 x i32> %a, <vscale x 4 x i32> %b, i32 0)
				ret <vscale x 4 x i32> %res
				}

				define <vscale x 4 x i32> @splice_nxv4i32_offset_negone(<vscale x 4 x i32> %a, <vscale x 4 x i32> %b) #0 {
				; CHECK-LABEL: splice_nxv4i32_offset_negone:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: srli a0, a0, 1
				; CHECK-NEXT: addi a0, a0, -1
				; CHECK-NEXT: vsetivli zero, 1, e32, m2, ta, mu
				; CHECK-NEXT: vslidedown.vx v8, v8, a0
				; CHECK-NEXT: vsetvli a0, zero, e32, m2, tu, mu
				; CHECK-NEXT: vslideup.vi v8, v10, 1
				; CHECK-NEXT: ret
				%res = call <vscale x 4 x i32> @llvm.experimental.vector.splice.nxv4i32(<vscale x 4 x i32> %a, <vscale x 4 x i32> %b, i32 -1)
				ret <vscale x 4 x i32> %res
				}

				define <vscale x 4 x i32> @splice_nxv4i32_offset_min(<vscale x 4 x i32> %a, <vscale x 4 x i32> %b) #0 {
				; CHECK-LABEL: splice_nxv4i32_offset_min:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: srli a0, a0, 1
				; CHECK-NEXT: addi a0, a0, -8
				; CHECK-NEXT: vsetivli zero, 8, e32, m2, ta, mu
				; CHECK-NEXT: vslidedown.vx v8, v8, a0
				; CHECK-NEXT: vsetvli a0, zero, e32, m2, tu, mu
				; CHECK-NEXT: vslideup.vi v8, v10, 8
				; CHECK-NEXT: ret
				%res = call <vscale x 4 x i32> @llvm.experimental.vector.splice.nxv4i32(<vscale x 4 x i32> %a, <vscale x 4 x i32> %b, i32 -8)
				ret <vscale x 4 x i32> %res
				}

				define <vscale x 4 x i32> @splice_nxv4i32_offset_max(<vscale x 4 x i32> %a, <vscale x 4 x i32> %b) #0 {
				; CHECK-LABEL: splice_nxv4i32_offset_max:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: srli a0, a0, 1
				; CHECK-NEXT: addi a0, a0, -7
				; CHECK-NEXT: vsetvli zero, a0, e32, m2, ta, mu
				; CHECK-NEXT: vslidedown.vi v8, v8, 7
				; CHECK-NEXT: vsetvli a1, zero, e32, m2, tu, mu
				; CHECK-NEXT: vslideup.vx v8, v10, a0
				; CHECK-NEXT: ret
				%res = call <vscale x 4 x i32> @llvm.experimental.vector.splice.nxv4i32(<vscale x 4 x i32> %a, <vscale x 4 x i32> %b, i32 7)
				ret <vscale x 4 x i32> %res
				}

				declare <vscale x 8 x i32> @llvm.experimental.vector.splice.nxv8i32(<vscale x 8 x i32>, <vscale x 8 x i32>, i32)

				define <vscale x 8 x i32> @splice_nxv8i32_offset_zero(<vscale x 8 x i32> %a, <vscale x 8 x i32> %b) #0 {
				; CHECK-LABEL: splice_nxv8i32_offset_zero:
				; CHECK: # %bb.0:
				; CHECK-NEXT: ret
				%res = call <vscale x 8 x i32> @llvm.experimental.vector.splice.nxv8i32(<vscale x 8 x i32> %a, <vscale x 8 x i32> %b, i32 0)
				ret <vscale x 8 x i32> %res
				}

				define <vscale x 8 x i32> @splice_nxv8i32_offset_negone(<vscale x 8 x i32> %a, <vscale x 8 x i32> %b) #0 {
				; CHECK-LABEL: splice_nxv8i32_offset_negone:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: addi a0, a0, -1
				; CHECK-NEXT: vsetivli zero, 1, e32, m4, ta, mu
				; CHECK-NEXT: vslidedown.vx v8, v8, a0
				; CHECK-NEXT: vsetvli a0, zero, e32, m4, tu, mu
				; CHECK-NEXT: vslideup.vi v8, v12, 1
				; CHECK-NEXT: ret
				%res = call <vscale x 8 x i32> @llvm.experimental.vector.splice.nxv8i32(<vscale x 8 x i32> %a, <vscale x 8 x i32> %b, i32 -1)
				ret <vscale x 8 x i32> %res
				}

				define <vscale x 8 x i32> @splice_nxv8i32_offset_min(<vscale x 8 x i32> %a, <vscale x 8 x i32> %b) #0 {
				; CHECK-LABEL: splice_nxv8i32_offset_min:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: addi a0, a0, -16
				; CHECK-NEXT: vsetivli zero, 16, e32, m4, ta, mu
				; CHECK-NEXT: vslidedown.vx v8, v8, a0
				; CHECK-NEXT: vsetvli a0, zero, e32, m4, tu, mu
				; CHECK-NEXT: vslideup.vi v8, v12, 16
				; CHECK-NEXT: ret
				%res = call <vscale x 8 x i32> @llvm.experimental.vector.splice.nxv8i32(<vscale x 8 x i32> %a, <vscale x 8 x i32> %b, i32 -16)
				ret <vscale x 8 x i32> %res
				}

				define <vscale x 8 x i32> @splice_nxv8i32_offset_max(<vscale x 8 x i32> %a, <vscale x 8 x i32> %b) #0 {
				; CHECK-LABEL: splice_nxv8i32_offset_max:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: addi a0, a0, -15
				; CHECK-NEXT: vsetvli zero, a0, e32, m4, ta, mu
				; CHECK-NEXT: vslidedown.vi v8, v8, 15
				; CHECK-NEXT: vsetvli a1, zero, e32, m4, tu, mu
				; CHECK-NEXT: vslideup.vx v8, v12, a0
				; CHECK-NEXT: ret
				%res = call <vscale x 8 x i32> @llvm.experimental.vector.splice.nxv8i32(<vscale x 8 x i32> %a, <vscale x 8 x i32> %b, i32 15)
				ret <vscale x 8 x i32> %res
				}

				declare <vscale x 16 x i32> @llvm.experimental.vector.splice.nxv16i32(<vscale x 16 x i32>, <vscale x 16 x i32>, i32)

				define <vscale x 16 x i32> @splice_nxv16i32_offset_zero(<vscale x 16 x i32> %a, <vscale x 16 x i32> %b) #0 {
				; CHECK-LABEL: splice_nxv16i32_offset_zero:
				; CHECK: # %bb.0:
				; CHECK-NEXT: ret
				%res = call <vscale x 16 x i32> @llvm.experimental.vector.splice.nxv16i32(<vscale x 16 x i32> %a, <vscale x 16 x i32> %b, i32 0)
				ret <vscale x 16 x i32> %res
				}

				define <vscale x 16 x i32> @splice_nxv16i32_offset_negone(<vscale x 16 x i32> %a, <vscale x 16 x i32> %b) #0 {
				; CHECK-LABEL: splice_nxv16i32_offset_negone:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: slli a0, a0, 1
				; CHECK-NEXT: addi a0, a0, -1
				; CHECK-NEXT: vsetivli zero, 1, e32, m8, ta, mu
				; CHECK-NEXT: vslidedown.vx v8, v8, a0
				; CHECK-NEXT: vsetvli a0, zero, e32, m8, tu, mu
				; CHECK-NEXT: vslideup.vi v8, v16, 1
				; CHECK-NEXT: ret
				%res = call <vscale x 16 x i32> @llvm.experimental.vector.splice.nxv16i32(<vscale x 16 x i32> %a, <vscale x 16 x i32> %b, i32 -1)
				ret <vscale x 16 x i32> %res
				}

				define <vscale x 16 x i32> @splice_nxv16i32_offset_min(<vscale x 16 x i32> %a, <vscale x 16 x i32> %b) #0 {
				; CHECK-LABEL: splice_nxv16i32_offset_min:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: slli a0, a0, 1
				; CHECK-NEXT: addi a0, a0, -32
				; CHECK-NEXT: li a1, 32
				; CHECK-NEXT: vsetvli zero, a1, e32, m8, ta, mu
				; CHECK-NEXT: vslidedown.vx v8, v8, a0
				; CHECK-NEXT: vsetvli a0, zero, e32, m8, tu, mu
				; CHECK-NEXT: vslideup.vx v8, v16, a1
				; CHECK-NEXT: ret
				%res = call <vscale x 16 x i32> @llvm.experimental.vector.splice.nxv16i32(<vscale x 16 x i32> %a, <vscale x 16 x i32> %b, i32 -32)
				ret <vscale x 16 x i32> %res
				}

				define <vscale x 16 x i32> @splice_nxv16i32_offset_max(<vscale x 16 x i32> %a, <vscale x 16 x i32> %b) #0 {
				; CHECK-LABEL: splice_nxv16i32_offset_max:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: slli a0, a0, 1
				; CHECK-NEXT: addi a0, a0, -31
				; CHECK-NEXT: vsetvli zero, a0, e32, m8, ta, mu
				; CHECK-NEXT: vslidedown.vi v8, v8, 31
				; CHECK-NEXT: vsetvli a1, zero, e32, m8, tu, mu
				; CHECK-NEXT: vslideup.vx v8, v16, a0
				; CHECK-NEXT: ret
				%res = call <vscale x 16 x i32> @llvm.experimental.vector.splice.nxv16i32(<vscale x 16 x i32> %a, <vscale x 16 x i32> %b, i32 31)
				ret <vscale x 16 x i32> %res
				}

				declare <vscale x 1 x i64> @llvm.experimental.vector.splice.nxv1i64(<vscale x 1 x i64>, <vscale x 1 x i64>, i32)

				define <vscale x 1 x i64> @splice_nxv1i64_offset_zero(<vscale x 1 x i64> %a, <vscale x 1 x i64> %b) #0 {
				; CHECK-LABEL: splice_nxv1i64_offset_zero:
				; CHECK: # %bb.0:
				; CHECK-NEXT: ret
				%res = call <vscale x 1 x i64> @llvm.experimental.vector.splice.nxv1i64(<vscale x 1 x i64> %a, <vscale x 1 x i64> %b, i32 0)
				ret <vscale x 1 x i64> %res
				}

				define <vscale x 1 x i64> @splice_nxv1i64_offset_negone(<vscale x 1 x i64> %a, <vscale x 1 x i64> %b) #0 {
				; CHECK-LABEL: splice_nxv1i64_offset_negone:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: srli a0, a0, 3
				; CHECK-NEXT: addi a0, a0, -1
				; CHECK-NEXT: vsetivli zero, 1, e64, m1, ta, mu
				; CHECK-NEXT: vslidedown.vx v8, v8, a0
				; CHECK-NEXT: vsetvli a0, zero, e64, m1, tu, mu
				; CHECK-NEXT: vslideup.vi v8, v9, 1
				; CHECK-NEXT: ret
				%res = call <vscale x 1 x i64> @llvm.experimental.vector.splice.nxv1i64(<vscale x 1 x i64> %a, <vscale x 1 x i64> %b, i32 -1)
				ret <vscale x 1 x i64> %res
				}

				define <vscale x 1 x i64> @splice_nxv1i64_offset_min(<vscale x 1 x i64> %a, <vscale x 1 x i64> %b) #0 {
				; CHECK-LABEL: splice_nxv1i64_offset_min:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: srli a0, a0, 3
				; CHECK-NEXT: addi a0, a0, -2
				; CHECK-NEXT: vsetivli zero, 2, e64, m1, ta, mu
				; CHECK-NEXT: vslidedown.vx v8, v8, a0
				; CHECK-NEXT: vsetvli a0, zero, e64, m1, tu, mu
				; CHECK-NEXT: vslideup.vi v8, v9, 2
				; CHECK-NEXT: ret
				%res = call <vscale x 1 x i64> @llvm.experimental.vector.splice.nxv1i64(<vscale x 1 x i64> %a, <vscale x 1 x i64> %b, i32 -2)
				ret <vscale x 1 x i64> %res
				}

				define <vscale x 1 x i64> @splice_nxv1i64_offset_max(<vscale x 1 x i64> %a, <vscale x 1 x i64> %b) #0 {
				; CHECK-LABEL: splice_nxv1i64_offset_max:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: srli a0, a0, 3
				; CHECK-NEXT: addi a0, a0, -1
				; CHECK-NEXT: vsetvli zero, a0, e64, m1, ta, mu
				; CHECK-NEXT: vslidedown.vi v8, v8, 1
				; CHECK-NEXT: vsetvli a1, zero, e64, m1, tu, mu
				; CHECK-NEXT: vslideup.vx v8, v9, a0
				; CHECK-NEXT: ret
				%res = call <vscale x 1 x i64> @llvm.experimental.vector.splice.nxv1i64(<vscale x 1 x i64> %a, <vscale x 1 x i64> %b, i32 1)
				ret <vscale x 1 x i64> %res
				}

				declare <vscale x 2 x i64> @llvm.experimental.vector.splice.nxv2i64(<vscale x 2 x i64>, <vscale x 2 x i64>, i32)

				define <vscale x 2 x i64> @splice_nxv2i64_offset_zero(<vscale x 2 x i64> %a, <vscale x 2 x i64> %b) #0 {
				; CHECK-LABEL: splice_nxv2i64_offset_zero:
				; CHECK: # %bb.0:
				; CHECK-NEXT: ret
				%res = call <vscale x 2 x i64> @llvm.experimental.vector.splice.nxv2i64(<vscale x 2 x i64> %a, <vscale x 2 x i64> %b, i32 0)
				ret <vscale x 2 x i64> %res
				}

				define <vscale x 2 x i64> @splice_nxv2i64_offset_negone(<vscale x 2 x i64> %a, <vscale x 2 x i64> %b) #0 {
				; CHECK-LABEL: splice_nxv2i64_offset_negone:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: srli a0, a0, 2
				; CHECK-NEXT: addi a0, a0, -1
				; CHECK-NEXT: vsetivli zero, 1, e64, m2, ta, mu
				; CHECK-NEXT: vslidedown.vx v8, v8, a0
				; CHECK-NEXT: vsetvli a0, zero, e64, m2, tu, mu
				; CHECK-NEXT: vslideup.vi v8, v10, 1
				; CHECK-NEXT: ret
				%res = call <vscale x 2 x i64> @llvm.experimental.vector.splice.nxv2i64(<vscale x 2 x i64> %a, <vscale x 2 x i64> %b, i32 -1)
				ret <vscale x 2 x i64> %res
				}

				define <vscale x 2 x i64> @splice_nxv2i64_offset_min(<vscale x 2 x i64> %a, <vscale x 2 x i64> %b) #0 {
				; CHECK-LABEL: splice_nxv2i64_offset_min:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: srli a0, a0, 2
				; CHECK-NEXT: addi a0, a0, -4
				; CHECK-NEXT: vsetivli zero, 4, e64, m2, ta, mu
				; CHECK-NEXT: vslidedown.vx v8, v8, a0
				; CHECK-NEXT: vsetvli a0, zero, e64, m2, tu, mu
				; CHECK-NEXT: vslideup.vi v8, v10, 4
				; CHECK-NEXT: ret
				%res = call <vscale x 2 x i64> @llvm.experimental.vector.splice.nxv2i64(<vscale x 2 x i64> %a, <vscale x 2 x i64> %b, i32 -4)
				ret <vscale x 2 x i64> %res
				}

				define <vscale x 2 x i64> @splice_nxv2i64_offset_max(<vscale x 2 x i64> %a, <vscale x 2 x i64> %b) #0 {
				; CHECK-LABEL: splice_nxv2i64_offset_max:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: srli a0, a0, 2
				; CHECK-NEXT: addi a0, a0, -3
				; CHECK-NEXT: vsetvli zero, a0, e64, m2, ta, mu
				; CHECK-NEXT: vslidedown.vi v8, v8, 3
				; CHECK-NEXT: vsetvli a1, zero, e64, m2, tu, mu
				; CHECK-NEXT: vslideup.vx v8, v10, a0
				; CHECK-NEXT: ret
				%res = call <vscale x 2 x i64> @llvm.experimental.vector.splice.nxv2i64(<vscale x 2 x i64> %a, <vscale x 2 x i64> %b, i32 3)
				ret <vscale x 2 x i64> %res
				}

				declare <vscale x 4 x i64> @llvm.experimental.vector.splice.nxv4i64(<vscale x 4 x i64>, <vscale x 4 x i64>, i32)

				define <vscale x 4 x i64> @splice_nxv4i64_offset_zero(<vscale x 4 x i64> %a, <vscale x 4 x i64> %b) #0 {
				; CHECK-LABEL: splice_nxv4i64_offset_zero:
				; CHECK: # %bb.0:
				; CHECK-NEXT: ret
				%res = call <vscale x 4 x i64> @llvm.experimental.vector.splice.nxv4i64(<vscale x 4 x i64> %a, <vscale x 4 x i64> %b, i32 0)
				ret <vscale x 4 x i64> %res
				}

				define <vscale x 4 x i64> @splice_nxv4i64_offset_negone(<vscale x 4 x i64> %a, <vscale x 4 x i64> %b) #0 {
				; CHECK-LABEL: splice_nxv4i64_offset_negone:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: srli a0, a0, 1
				; CHECK-NEXT: addi a0, a0, -1
				; CHECK-NEXT: vsetivli zero, 1, e64, m4, ta, mu
				; CHECK-NEXT: vslidedown.vx v8, v8, a0
				; CHECK-NEXT: vsetvli a0, zero, e64, m4, tu, mu
				; CHECK-NEXT: vslideup.vi v8, v12, 1
				; CHECK-NEXT: ret
				%res = call <vscale x 4 x i64> @llvm.experimental.vector.splice.nxv4i64(<vscale x 4 x i64> %a, <vscale x 4 x i64> %b, i32 -1)
				ret <vscale x 4 x i64> %res
				}

				define <vscale x 4 x i64> @splice_nxv4i64_offset_min(<vscale x 4 x i64> %a, <vscale x 4 x i64> %b) #0 {
				; CHECK-LABEL: splice_nxv4i64_offset_min:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: srli a0, a0, 1
				; CHECK-NEXT: addi a0, a0, -8
				; CHECK-NEXT: vsetivli zero, 8, e64, m4, ta, mu
				; CHECK-NEXT: vslidedown.vx v8, v8, a0
				; CHECK-NEXT: vsetvli a0, zero, e64, m4, tu, mu
				; CHECK-NEXT: vslideup.vi v8, v12, 8
				; CHECK-NEXT: ret
				%res = call <vscale x 4 x i64> @llvm.experimental.vector.splice.nxv4i64(<vscale x 4 x i64> %a, <vscale x 4 x i64> %b, i32 -8)
				ret <vscale x 4 x i64> %res
				}

				define <vscale x 4 x i64> @splice_nxv4i64_offset_max(<vscale x 4 x i64> %a, <vscale x 4 x i64> %b) #0 {
				; CHECK-LABEL: splice_nxv4i64_offset_max:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: srli a0, a0, 1
				; CHECK-NEXT: addi a0, a0, -7
				; CHECK-NEXT: vsetvli zero, a0, e64, m4, ta, mu
				; CHECK-NEXT: vslidedown.vi v8, v8, 7
				; CHECK-NEXT: vsetvli a1, zero, e64, m4, tu, mu
				; CHECK-NEXT: vslideup.vx v8, v12, a0
				; CHECK-NEXT: ret
				%res = call <vscale x 4 x i64> @llvm.experimental.vector.splice.nxv4i64(<vscale x 4 x i64> %a, <vscale x 4 x i64> %b, i32 7)
				ret <vscale x 4 x i64> %res
				}

				declare <vscale x 8 x i64> @llvm.experimental.vector.splice.nxv8i64(<vscale x 8 x i64>, <vscale x 8 x i64>, i32)

				define <vscale x 8 x i64> @splice_nxv8i64_offset_zero(<vscale x 8 x i64> %a, <vscale x 8 x i64> %b) #0 {
				; CHECK-LABEL: splice_nxv8i64_offset_zero:
				; CHECK: # %bb.0:
				; CHECK-NEXT: ret
				%res = call <vscale x 8 x i64> @llvm.experimental.vector.splice.nxv8i64(<vscale x 8 x i64> %a, <vscale x 8 x i64> %b, i32 0)
				ret <vscale x 8 x i64> %res
				}

				define <vscale x 8 x i64> @splice_nxv8i64_offset_negone(<vscale x 8 x i64> %a, <vscale x 8 x i64> %b) #0 {
				; CHECK-LABEL: splice_nxv8i64_offset_negone:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: addi a0, a0, -1
				; CHECK-NEXT: vsetivli zero, 1, e64, m8, ta, mu
				; CHECK-NEXT: vslidedown.vx v8, v8, a0
				; CHECK-NEXT: vsetvli a0, zero, e64, m8, tu, mu
				; CHECK-NEXT: vslideup.vi v8, v16, 1
				; CHECK-NEXT: ret
				%res = call <vscale x 8 x i64> @llvm.experimental.vector.splice.nxv8i64(<vscale x 8 x i64> %a, <vscale x 8 x i64> %b, i32 -1)
				ret <vscale x 8 x i64> %res
				}

				define <vscale x 8 x i64> @splice_nxv8i64_offset_min(<vscale x 8 x i64> %a, <vscale x 8 x i64> %b) #0 {
				; CHECK-LABEL: splice_nxv8i64_offset_min:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: addi a0, a0, -16
				; CHECK-NEXT: vsetivli zero, 16, e64, m8, ta, mu
				; CHECK-NEXT: vslidedown.vx v8, v8, a0
				; CHECK-NEXT: vsetvli a0, zero, e64, m8, tu, mu
				; CHECK-NEXT: vslideup.vi v8, v16, 16
				; CHECK-NEXT: ret
				%res = call <vscale x 8 x i64> @llvm.experimental.vector.splice.nxv8i64(<vscale x 8 x i64> %a, <vscale x 8 x i64> %b, i32 -16)
				ret <vscale x 8 x i64> %res
				}

				define <vscale x 8 x i64> @splice_nxv8i64_offset_max(<vscale x 8 x i64> %a, <vscale x 8 x i64> %b) #0 {
				; CHECK-LABEL: splice_nxv8i64_offset_max:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: addi a0, a0, -15
				; CHECK-NEXT: vsetvli zero, a0, e64, m8, ta, mu
				; CHECK-NEXT: vslidedown.vi v8, v8, 15
				; CHECK-NEXT: vsetvli a1, zero, e64, m8, tu, mu
				; CHECK-NEXT: vslideup.vx v8, v16, a0
				; CHECK-NEXT: ret
				%res = call <vscale x 8 x i64> @llvm.experimental.vector.splice.nxv8i64(<vscale x 8 x i64> %a, <vscale x 8 x i64> %b, i32 15)
				ret <vscale x 8 x i64> %res
				}

				declare <vscale x 1 x half> @llvm.experimental.vector.splice.nxv1f16(<vscale x 1 x half>, <vscale x 1 x half>, i32)

				define <vscale x 1 x half> @splice_nxv1f16_offset_zero(<vscale x 1 x half> %a, <vscale x 1 x half> %b) #0 {
				; CHECK-LABEL: splice_nxv1f16_offset_zero:
				; CHECK: # %bb.0:
				; CHECK-NEXT: ret
				%res = call <vscale x 1 x half> @llvm.experimental.vector.splice.nxv1f16(<vscale x 1 x half> %a, <vscale x 1 x half> %b, i32 0)
				ret <vscale x 1 x half> %res
				}

				define <vscale x 1 x half> @splice_nxv1f16_offset_negone(<vscale x 1 x half> %a, <vscale x 1 x half> %b) #0 {
				; CHECK-LABEL: splice_nxv1f16_offset_negone:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: srli a0, a0, 3
				; CHECK-NEXT: addi a0, a0, -1
				; CHECK-NEXT: vsetivli zero, 1, e16, mf4, ta, mu
				; CHECK-NEXT: vslidedown.vx v8, v8, a0
				; CHECK-NEXT: vsetvli a0, zero, e16, mf4, tu, mu
				; CHECK-NEXT: vslideup.vi v8, v9, 1
				; CHECK-NEXT: ret
				%res = call <vscale x 1 x half> @llvm.experimental.vector.splice.nxv1f16(<vscale x 1 x half> %a, <vscale x 1 x half> %b, i32 -1)
				ret <vscale x 1 x half> %res
				}

				define <vscale x 1 x half> @splice_nxv1f16_offset_min(<vscale x 1 x half> %a, <vscale x 1 x half> %b) #0 {
				; CHECK-LABEL: splice_nxv1f16_offset_min:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: srli a0, a0, 3
				; CHECK-NEXT: addi a0, a0, -2
				; CHECK-NEXT: vsetivli zero, 2, e16, mf4, ta, mu
				; CHECK-NEXT: vslidedown.vx v8, v8, a0
				; CHECK-NEXT: vsetvli a0, zero, e16, mf4, tu, mu
				; CHECK-NEXT: vslideup.vi v8, v9, 2
				; CHECK-NEXT: ret
				%res = call <vscale x 1 x half> @llvm.experimental.vector.splice.nxv1f16(<vscale x 1 x half> %a, <vscale x 1 x half> %b, i32 -2)
				ret <vscale x 1 x half> %res
				}

				define <vscale x 1 x half> @splice_nxv1f16_offset_max(<vscale x 1 x half> %a, <vscale x 1 x half> %b) #0 {
				; CHECK-LABEL: splice_nxv1f16_offset_max:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: srli a0, a0, 3
				; CHECK-NEXT: addi a0, a0, -1
				; CHECK-NEXT: vsetvli zero, a0, e16, mf4, ta, mu
				; CHECK-NEXT: vslidedown.vi v8, v8, 1
				; CHECK-NEXT: vsetvli a1, zero, e16, mf4, tu, mu
				; CHECK-NEXT: vslideup.vx v8, v9, a0
				; CHECK-NEXT: ret
				%res = call <vscale x 1 x half> @llvm.experimental.vector.splice.nxv1f16(<vscale x 1 x half> %a, <vscale x 1 x half> %b, i32 1)
				ret <vscale x 1 x half> %res
				}

				declare <vscale x 2 x half> @llvm.experimental.vector.splice.nxv2f16(<vscale x 2 x half>, <vscale x 2 x half>, i32)

				define <vscale x 2 x half> @splice_nxv2f16_offset_zero(<vscale x 2 x half> %a, <vscale x 2 x half> %b) #0 {
				; CHECK-LABEL: splice_nxv2f16_offset_zero:
				; CHECK: # %bb.0:
				; CHECK-NEXT: ret
				%res = call <vscale x 2 x half> @llvm.experimental.vector.splice.nxv2f16(<vscale x 2 x half> %a, <vscale x 2 x half> %b, i32 0)
				ret <vscale x 2 x half> %res
				}

				define <vscale x 2 x half> @splice_nxv2f16_offset_negone(<vscale x 2 x half> %a, <vscale x 2 x half> %b) #0 {
				; CHECK-LABEL: splice_nxv2f16_offset_negone:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: srli a0, a0, 2
				; CHECK-NEXT: addi a0, a0, -1
				; CHECK-NEXT: vsetivli zero, 1, e16, mf2, ta, mu
				; CHECK-NEXT: vslidedown.vx v8, v8, a0
				; CHECK-NEXT: vsetvli a0, zero, e16, mf2, tu, mu
				; CHECK-NEXT: vslideup.vi v8, v9, 1
				; CHECK-NEXT: ret
				%res = call <vscale x 2 x half> @llvm.experimental.vector.splice.nxv2f16(<vscale x 2 x half> %a, <vscale x 2 x half> %b, i32 -1)
				ret <vscale x 2 x half> %res
				}

				define <vscale x 2 x half> @splice_nxv2f16_offset_min(<vscale x 2 x half> %a, <vscale x 2 x half> %b) #0 {
				; CHECK-LABEL: splice_nxv2f16_offset_min:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: srli a0, a0, 2
				; CHECK-NEXT: addi a0, a0, -4
				; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, mu
				; CHECK-NEXT: vslidedown.vx v8, v8, a0
				; CHECK-NEXT: vsetvli a0, zero, e16, mf2, tu, mu
				; CHECK-NEXT: vslideup.vi v8, v9, 4
				; CHECK-NEXT: ret
				%res = call <vscale x 2 x half> @llvm.experimental.vector.splice.nxv2f16(<vscale x 2 x half> %a, <vscale x 2 x half> %b, i32 -4)
				ret <vscale x 2 x half> %res
				}

				define <vscale x 2 x half> @splice_nxv2f16_offset_max(<vscale x 2 x half> %a, <vscale x 2 x half> %b) #0 {
				; CHECK-LABEL: splice_nxv2f16_offset_max:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: srli a0, a0, 2
				; CHECK-NEXT: addi a0, a0, -3
				; CHECK-NEXT: vsetvli zero, a0, e16, mf2, ta, mu
				; CHECK-NEXT: vslidedown.vi v8, v8, 3
				; CHECK-NEXT: vsetvli a1, zero, e16, mf2, tu, mu
				; CHECK-NEXT: vslideup.vx v8, v9, a0
				; CHECK-NEXT: ret
				%res = call <vscale x 2 x half> @llvm.experimental.vector.splice.nxv2f16(<vscale x 2 x half> %a, <vscale x 2 x half> %b, i32 3)
				ret <vscale x 2 x half> %res
				}

				declare <vscale x 4 x half> @llvm.experimental.vector.splice.nxv4f16(<vscale x 4 x half>, <vscale x 4 x half>, i32)

				define <vscale x 4 x half> @splice_nxv4f16_offset_zero(<vscale x 4 x half> %a, <vscale x 4 x half> %b) #0 {
				; CHECK-LABEL: splice_nxv4f16_offset_zero:
				; CHECK: # %bb.0:
				; CHECK-NEXT: ret
				%res = call <vscale x 4 x half> @llvm.experimental.vector.splice.nxv4f16(<vscale x 4 x half> %a, <vscale x 4 x half> %b, i32 0)
				ret <vscale x 4 x half> %res
				}

				define <vscale x 4 x half> @splice_nxv4f16_offset_negone(<vscale x 4 x half> %a, <vscale x 4 x half> %b) #0 {
				; CHECK-LABEL: splice_nxv4f16_offset_negone:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: srli a0, a0, 1
				; CHECK-NEXT: addi a0, a0, -1
				; CHECK-NEXT: vsetivli zero, 1, e16, m1, ta, mu
				; CHECK-NEXT: vslidedown.vx v8, v8, a0
				; CHECK-NEXT: vsetvli a0, zero, e16, m1, tu, mu
				; CHECK-NEXT: vslideup.vi v8, v9, 1
				; CHECK-NEXT: ret
				%res = call <vscale x 4 x half> @llvm.experimental.vector.splice.nxv4f16(<vscale x 4 x half> %a, <vscale x 4 x half> %b, i32 -1)
				ret <vscale x 4 x half> %res
				}

				define <vscale x 4 x half> @splice_nxv4f16_offset_min(<vscale x 4 x half> %a, <vscale x 4 x half> %b) #0 {
				; CHECK-LABEL: splice_nxv4f16_offset_min:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: srli a0, a0, 1
				; CHECK-NEXT: addi a0, a0, -8
				; CHECK-NEXT: vsetivli zero, 8, e16, m1, ta, mu
				; CHECK-NEXT: vslidedown.vx v8, v8, a0
				; CHECK-NEXT: vsetvli a0, zero, e16, m1, tu, mu
				; CHECK-NEXT: vslideup.vi v8, v9, 8
				; CHECK-NEXT: ret
				%res = call <vscale x 4 x half> @llvm.experimental.vector.splice.nxv4f16(<vscale x 4 x half> %a, <vscale x 4 x half> %b, i32 -8)
				ret <vscale x 4 x half> %res
				}

				define <vscale x 4 x half> @splice_nxv4f16_offset_max(<vscale x 4 x half> %a, <vscale x 4 x half> %b) #0 {
				; CHECK-LABEL: splice_nxv4f16_offset_max:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: srli a0, a0, 1
				; CHECK-NEXT: addi a0, a0, -7
				; CHECK-NEXT: vsetvli zero, a0, e16, m1, ta, mu
				; CHECK-NEXT: vslidedown.vi v8, v8, 7
				; CHECK-NEXT: vsetvli a1, zero, e16, m1, tu, mu
				; CHECK-NEXT: vslideup.vx v8, v9, a0
				; CHECK-NEXT: ret
				%res = call <vscale x 4 x half> @llvm.experimental.vector.splice.nxv4f16(<vscale x 4 x half> %a, <vscale x 4 x half> %b, i32 7)
				ret <vscale x 4 x half> %res
				}

				declare <vscale x 8 x half> @llvm.experimental.vector.splice.nxv8f16(<vscale x 8 x half>, <vscale x 8 x half>, i32)

				define <vscale x 8 x half> @splice_nxv8f16_offset_zero(<vscale x 8 x half> %a, <vscale x 8 x half> %b) #0 {
				; CHECK-LABEL: splice_nxv8f16_offset_zero:
				; CHECK: # %bb.0:
				; CHECK-NEXT: ret
				%res = call <vscale x 8 x half> @llvm.experimental.vector.splice.nxv8f16(<vscale x 8 x half> %a, <vscale x 8 x half> %b, i32 0)
				ret <vscale x 8 x half> %res
				}

				define <vscale x 8 x half> @splice_nxv8f16_offset_negone(<vscale x 8 x half> %a, <vscale x 8 x half> %b) #0 {
				; CHECK-LABEL: splice_nxv8f16_offset_negone:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: addi a0, a0, -1
				; CHECK-NEXT: vsetivli zero, 1, e16, m2, ta, mu
				; CHECK-NEXT: vslidedown.vx v8, v8, a0
				; CHECK-NEXT: vsetvli a0, zero, e16, m2, tu, mu
				; CHECK-NEXT: vslideup.vi v8, v10, 1
				; CHECK-NEXT: ret
				%res = call <vscale x 8 x half> @llvm.experimental.vector.splice.nxv8f16(<vscale x 8 x half> %a, <vscale x 8 x half> %b, i32 -1)
				ret <vscale x 8 x half> %res
				}

				define <vscale x 8 x half> @splice_nxv8f16_offset_min(<vscale x 8 x half> %a, <vscale x 8 x half> %b) #0 {
				; CHECK-LABEL: splice_nxv8f16_offset_min:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: addi a0, a0, -16
				; CHECK-NEXT: vsetivli zero, 16, e16, m2, ta, mu
				; CHECK-NEXT: vslidedown.vx v8, v8, a0
				; CHECK-NEXT: vsetvli a0, zero, e16, m2, tu, mu
				; CHECK-NEXT: vslideup.vi v8, v10, 16
				; CHECK-NEXT: ret
				%res = call <vscale x 8 x half> @llvm.experimental.vector.splice.nxv8f16(<vscale x 8 x half> %a, <vscale x 8 x half> %b, i32 -16)
				ret <vscale x 8 x half> %res
				}

				define <vscale x 8 x half> @splice_nxv8f16_offset_max(<vscale x 8 x half> %a, <vscale x 8 x half> %b) #0 {
				; CHECK-LABEL: splice_nxv8f16_offset_max:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: addi a0, a0, -15
				; CHECK-NEXT: vsetvli zero, a0, e16, m2, ta, mu
				; CHECK-NEXT: vslidedown.vi v8, v8, 15
				; CHECK-NEXT: vsetvli a1, zero, e16, m2, tu, mu
				; CHECK-NEXT: vslideup.vx v8, v10, a0
				; CHECK-NEXT: ret
				%res = call <vscale x 8 x half> @llvm.experimental.vector.splice.nxv8f16(<vscale x 8 x half> %a, <vscale x 8 x half> %b, i32 15)
				ret <vscale x 8 x half> %res
				}

				declare <vscale x 16 x half> @llvm.experimental.vector.splice.nxv16f16(<vscale x 16 x half>, <vscale x 16 x half>, i32)

				define <vscale x 16 x half> @splice_nxv16f16_offset_zero(<vscale x 16 x half> %a, <vscale x 16 x half> %b) #0 {
				; CHECK-LABEL: splice_nxv16f16_offset_zero:
				; CHECK: # %bb.0:
				; CHECK-NEXT: ret
				%res = call <vscale x 16 x half> @llvm.experimental.vector.splice.nxv16f16(<vscale x 16 x half> %a, <vscale x 16 x half> %b, i32 0)
				ret <vscale x 16 x half> %res
				}

				define <vscale x 16 x half> @splice_nxv16f16_offset_negone(<vscale x 16 x half> %a, <vscale x 16 x half> %b) #0 {
				; CHECK-LABEL: splice_nxv16f16_offset_negone:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: slli a0, a0, 1
				; CHECK-NEXT: addi a0, a0, -1
				; CHECK-NEXT: vsetivli zero, 1, e16, m4, ta, mu
				; CHECK-NEXT: vslidedown.vx v8, v8, a0
				; CHECK-NEXT: vsetvli a0, zero, e16, m4, tu, mu
				; CHECK-NEXT: vslideup.vi v8, v12, 1
				; CHECK-NEXT: ret
				%res = call <vscale x 16 x half> @llvm.experimental.vector.splice.nxv16f16(<vscale x 16 x half> %a, <vscale x 16 x half> %b, i32 -1)
				ret <vscale x 16 x half> %res
				}

				define <vscale x 16 x half> @splice_nxv16f16_offset_min(<vscale x 16 x half> %a, <vscale x 16 x half> %b) #0 {
				; CHECK-LABEL: splice_nxv16f16_offset_min:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: slli a0, a0, 1
				; CHECK-NEXT: addi a0, a0, -32
				; CHECK-NEXT: li a1, 32
				; CHECK-NEXT: vsetvli zero, a1, e16, m4, ta, mu
				; CHECK-NEXT: vslidedown.vx v8, v8, a0
				; CHECK-NEXT: vsetvli a0, zero, e16, m4, tu, mu
				; CHECK-NEXT: vslideup.vx v8, v12, a1
				; CHECK-NEXT: ret
				%res = call <vscale x 16 x half> @llvm.experimental.vector.splice.nxv16f16(<vscale x 16 x half> %a, <vscale x 16 x half> %b, i32 -32)
				ret <vscale x 16 x half> %res
				}

				define <vscale x 16 x half> @splice_nxv16f16_offset_max(<vscale x 16 x half> %a, <vscale x 16 x half> %b) #0 {
				; CHECK-LABEL: splice_nxv16f16_offset_max:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: slli a0, a0, 1
				; CHECK-NEXT: addi a0, a0, -31
				; CHECK-NEXT: vsetvli zero, a0, e16, m4, ta, mu
				; CHECK-NEXT: vslidedown.vi v8, v8, 31
				; CHECK-NEXT: vsetvli a1, zero, e16, m4, tu, mu
				; CHECK-NEXT: vslideup.vx v8, v12, a0
				; CHECK-NEXT: ret
				%res = call <vscale x 16 x half> @llvm.experimental.vector.splice.nxv16f16(<vscale x 16 x half> %a, <vscale x 16 x half> %b, i32 31)
				ret <vscale x 16 x half> %res
				}

				declare <vscale x 32 x half> @llvm.experimental.vector.splice.nxv32f16(<vscale x 32 x half>, <vscale x 32 x half>, i32)

				define <vscale x 32 x half> @splice_nxv32f16_offset_zero(<vscale x 32 x half> %a, <vscale x 32 x half> %b) #0 {
				; CHECK-LABEL: splice_nxv32f16_offset_zero:
				; CHECK: # %bb.0:
				; CHECK-NEXT: ret
				%res = call <vscale x 32 x half> @llvm.experimental.vector.splice.nxv32f16(<vscale x 32 x half> %a, <vscale x 32 x half> %b, i32 0)
				ret <vscale x 32 x half> %res
				}

				define <vscale x 32 x half> @splice_nxv32f16_offset_negone(<vscale x 32 x half> %a, <vscale x 32 x half> %b) #0 {
				; CHECK-LABEL: splice_nxv32f16_offset_negone:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: slli a0, a0, 2
				; CHECK-NEXT: addi a0, a0, -1
				; CHECK-NEXT: vsetivli zero, 1, e16, m8, ta, mu
				; CHECK-NEXT: vslidedown.vx v8, v8, a0
				; CHECK-NEXT: vsetvli a0, zero, e16, m8, tu, mu
				; CHECK-NEXT: vslideup.vi v8, v16, 1
				; CHECK-NEXT: ret
				%res = call <vscale x 32 x half> @llvm.experimental.vector.splice.nxv32f16(<vscale x 32 x half> %a, <vscale x 32 x half> %b, i32 -1)
				ret <vscale x 32 x half> %res
				}

				define <vscale x 32 x half> @splice_nxv32f16_offset_min(<vscale x 32 x half> %a, <vscale x 32 x half> %b) #0 {
				; CHECK-LABEL: splice_nxv32f16_offset_min:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: slli a0, a0, 2
				; CHECK-NEXT: addi a0, a0, -64
				; CHECK-NEXT: li a1, 64
				; CHECK-NEXT: vsetvli zero, a1, e16, m8, ta, mu
				; CHECK-NEXT: vslidedown.vx v8, v8, a0
				; CHECK-NEXT: vsetvli a0, zero, e16, m8, tu, mu
				; CHECK-NEXT: vslideup.vx v8, v16, a1
				; CHECK-NEXT: ret
				%res = call <vscale x 32 x half> @llvm.experimental.vector.splice.nxv32f16(<vscale x 32 x half> %a, <vscale x 32 x half> %b, i32 -64)
				ret <vscale x 32 x half> %res
				}

				define <vscale x 32 x half> @splice_nxv32f16_offset_max(<vscale x 32 x half> %a, <vscale x 32 x half> %b) #0 {
				; CHECK-LABEL: splice_nxv32f16_offset_max:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: slli a0, a0, 2
				; CHECK-NEXT: addi a0, a0, -63
				; CHECK-NEXT: li a1, 63
				; CHECK-NEXT: vsetvli zero, a0, e16, m8, ta, mu
				; CHECK-NEXT: vslidedown.vx v8, v8, a1
				; CHECK-NEXT: vsetvli a1, zero, e16, m8, tu, mu
				; CHECK-NEXT: vslideup.vx v8, v16, a0
				; CHECK-NEXT: ret
				%res = call <vscale x 32 x half> @llvm.experimental.vector.splice.nxv32f16(<vscale x 32 x half> %a, <vscale x 32 x half> %b, i32 63)
				ret <vscale x 32 x half> %res
				}

				declare <vscale x 1 x float> @llvm.experimental.vector.splice.nxv1f32(<vscale x 1 x float>, <vscale x 1 x float>, i32)

				define <vscale x 1 x float> @splice_nxv1f32_offset_zero(<vscale x 1 x float> %a, <vscale x 1 x float> %b) #0 {
				; CHECK-LABEL: splice_nxv1f32_offset_zero:
				; CHECK: # %bb.0:
				; CHECK-NEXT: ret
				%res = call <vscale x 1 x float> @llvm.experimental.vector.splice.nxv1f32(<vscale x 1 x float> %a, <vscale x 1 x float> %b, i32 0)
				ret <vscale x 1 x float> %res
				}

				define <vscale x 1 x float> @splice_nxv1f32_offset_negone(<vscale x 1 x float> %a, <vscale x 1 x float> %b) #0 {
				; CHECK-LABEL: splice_nxv1f32_offset_negone:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: srli a0, a0, 3
				; CHECK-NEXT: addi a0, a0, -1
				; CHECK-NEXT: vsetivli zero, 1, e32, mf2, ta, mu
				; CHECK-NEXT: vslidedown.vx v8, v8, a0
				; CHECK-NEXT: vsetvli a0, zero, e32, mf2, tu, mu
				; CHECK-NEXT: vslideup.vi v8, v9, 1
				; CHECK-NEXT: ret
				%res = call <vscale x 1 x float> @llvm.experimental.vector.splice.nxv1f32(<vscale x 1 x float> %a, <vscale x 1 x float> %b, i32 -1)
				ret <vscale x 1 x float> %res
				}

				define <vscale x 1 x float> @splice_nxv1f32_offset_min(<vscale x 1 x float> %a, <vscale x 1 x float> %b) #0 {
				; CHECK-LABEL: splice_nxv1f32_offset_min:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: srli a0, a0, 3
				; CHECK-NEXT: addi a0, a0, -2
				; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
				; CHECK-NEXT: vslidedown.vx v8, v8, a0
				; CHECK-NEXT: vsetvli a0, zero, e32, mf2, tu, mu
				; CHECK-NEXT: vslideup.vi v8, v9, 2
				; CHECK-NEXT: ret
				%res = call <vscale x 1 x float> @llvm.experimental.vector.splice.nxv1f32(<vscale x 1 x float> %a, <vscale x 1 x float> %b, i32 -2)
				ret <vscale x 1 x float> %res
				}

				define <vscale x 1 x float> @splice_nxv1f32_offset_max(<vscale x 1 x float> %a, <vscale x 1 x float> %b) #0 {
				; CHECK-LABEL: splice_nxv1f32_offset_max:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: srli a0, a0, 3
				; CHECK-NEXT: addi a0, a0, -1
				; CHECK-NEXT: vsetvli zero, a0, e32, mf2, ta, mu
				; CHECK-NEXT: vslidedown.vi v8, v8, 1
				; CHECK-NEXT: vsetvli a1, zero, e32, mf2, tu, mu
				; CHECK-NEXT: vslideup.vx v8, v9, a0
				; CHECK-NEXT: ret
				%res = call <vscale x 1 x float> @llvm.experimental.vector.splice.nxv1f32(<vscale x 1 x float> %a, <vscale x 1 x float> %b, i32 1)
				ret <vscale x 1 x float> %res
				}

				declare <vscale x 2 x float> @llvm.experimental.vector.splice.nxv2f32(<vscale x 2 x float>, <vscale x 2 x float>, i32)

				define <vscale x 2 x float> @splice_nxv2f32_offset_zero(<vscale x 2 x float> %a, <vscale x 2 x float> %b) #0 {
				; CHECK-LABEL: splice_nxv2f32_offset_zero:
				; CHECK: # %bb.0:
				; CHECK-NEXT: ret
				%res = call <vscale x 2 x float> @llvm.experimental.vector.splice.nxv2f32(<vscale x 2 x float> %a, <vscale x 2 x float> %b, i32 0)
				ret <vscale x 2 x float> %res
				}

				define <vscale x 2 x float> @splice_nxv2f32_offset_negone(<vscale x 2 x float> %a, <vscale x 2 x float> %b) #0 {
				; CHECK-LABEL: splice_nxv2f32_offset_negone:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: srli a0, a0, 2
				; CHECK-NEXT: addi a0, a0, -1
				; CHECK-NEXT: vsetivli zero, 1, e32, m1, ta, mu
				; CHECK-NEXT: vslidedown.vx v8, v8, a0
				; CHECK-NEXT: vsetvli a0, zero, e32, m1, tu, mu
				; CHECK-NEXT: vslideup.vi v8, v9, 1
				; CHECK-NEXT: ret
				%res = call <vscale x 2 x float> @llvm.experimental.vector.splice.nxv2f32(<vscale x 2 x float> %a, <vscale x 2 x float> %b, i32 -1)
				ret <vscale x 2 x float> %res
				}

				define <vscale x 2 x float> @splice_nxv2f32_offset_min(<vscale x 2 x float> %a, <vscale x 2 x float> %b) #0 {
				; CHECK-LABEL: splice_nxv2f32_offset_min:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: srli a0, a0, 2
				; CHECK-NEXT: addi a0, a0, -4
				; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
				; CHECK-NEXT: vslidedown.vx v8, v8, a0
				; CHECK-NEXT: vsetvli a0, zero, e32, m1, tu, mu
				; CHECK-NEXT: vslideup.vi v8, v9, 4
				; CHECK-NEXT: ret
				%res = call <vscale x 2 x float> @llvm.experimental.vector.splice.nxv2f32(<vscale x 2 x float> %a, <vscale x 2 x float> %b, i32 -4)
				ret <vscale x 2 x float> %res
				}

				define <vscale x 2 x float> @splice_nxv2f32_offset_max(<vscale x 2 x float> %a, <vscale x 2 x float> %b) #0 {
				; CHECK-LABEL: splice_nxv2f32_offset_max:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: srli a0, a0, 2
				; CHECK-NEXT: addi a0, a0, -3
				; CHECK-NEXT: vsetvli zero, a0, e32, m1, ta, mu
				; CHECK-NEXT: vslidedown.vi v8, v8, 3
				; CHECK-NEXT: vsetvli a1, zero, e32, m1, tu, mu
				; CHECK-NEXT: vslideup.vx v8, v9, a0
				; CHECK-NEXT: ret
				%res = call <vscale x 2 x float> @llvm.experimental.vector.splice.nxv2f32(<vscale x 2 x float> %a, <vscale x 2 x float> %b, i32 3)
				ret <vscale x 2 x float> %res
				}

				declare <vscale x 4 x float> @llvm.experimental.vector.splice.nxv4f32(<vscale x 4 x float>, <vscale x 4 x float>, i32)

				define <vscale x 4 x float> @splice_nxv4f32_offset_zero(<vscale x 4 x float> %a, <vscale x 4 x float> %b) #0 {
				; CHECK-LABEL: splice_nxv4f32_offset_zero:
				; CHECK: # %bb.0:
				; CHECK-NEXT: ret
				%res = call <vscale x 4 x float> @llvm.experimental.vector.splice.nxv4f32(<vscale x 4 x float> %a, <vscale x 4 x float> %b, i32 0)
				ret <vscale x 4 x float> %res
				}

				define <vscale x 4 x float> @splice_nxv4f32_offset_negone(<vscale x 4 x float> %a, <vscale x 4 x float> %b) #0 {
				; CHECK-LABEL: splice_nxv4f32_offset_negone:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: srli a0, a0, 1
				; CHECK-NEXT: addi a0, a0, -1
				; CHECK-NEXT: vsetivli zero, 1, e32, m2, ta, mu
				; CHECK-NEXT: vslidedown.vx v8, v8, a0
				; CHECK-NEXT: vsetvli a0, zero, e32, m2, tu, mu
				; CHECK-NEXT: vslideup.vi v8, v10, 1
				; CHECK-NEXT: ret
				%res = call <vscale x 4 x float> @llvm.experimental.vector.splice.nxv4f32(<vscale x 4 x float> %a, <vscale x 4 x float> %b, i32 -1)
				ret <vscale x 4 x float> %res
				}

				define <vscale x 4 x float> @splice_nxv4f32_offset_min(<vscale x 4 x float> %a, <vscale x 4 x float> %b) #0 {
				; CHECK-LABEL: splice_nxv4f32_offset_min:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: srli a0, a0, 1
				; CHECK-NEXT: addi a0, a0, -8
				; CHECK-NEXT: vsetivli zero, 8, e32, m2, ta, mu
				; CHECK-NEXT: vslidedown.vx v8, v8, a0
				; CHECK-NEXT: vsetvli a0, zero, e32, m2, tu, mu
				; CHECK-NEXT: vslideup.vi v8, v10, 8
				; CHECK-NEXT: ret
				%res = call <vscale x 4 x float> @llvm.experimental.vector.splice.nxv4f32(<vscale x 4 x float> %a, <vscale x 4 x float> %b, i32 -8)
				ret <vscale x 4 x float> %res
				}

				define <vscale x 4 x float> @splice_nxv4f32_offset_max(<vscale x 4 x float> %a, <vscale x 4 x float> %b) #0 {
				; CHECK-LABEL: splice_nxv4f32_offset_max:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: srli a0, a0, 1
				; CHECK-NEXT: addi a0, a0, -7
				; CHECK-NEXT: vsetvli zero, a0, e32, m2, ta, mu
				; CHECK-NEXT: vslidedown.vi v8, v8, 7
				; CHECK-NEXT: vsetvli a1, zero, e32, m2, tu, mu
				; CHECK-NEXT: vslideup.vx v8, v10, a0
				; CHECK-NEXT: ret
				%res = call <vscale x 4 x float> @llvm.experimental.vector.splice.nxv4f32(<vscale x 4 x float> %a, <vscale x 4 x float> %b, i32 7)
				ret <vscale x 4 x float> %res
				}

				declare <vscale x 8 x float> @llvm.experimental.vector.splice.nxv8f32(<vscale x 8 x float>, <vscale x 8 x float>, i32)

				define <vscale x 8 x float> @splice_nxv8f32_offset_zero(<vscale x 8 x float> %a, <vscale x 8 x float> %b) #0 {
				; CHECK-LABEL: splice_nxv8f32_offset_zero:
				; CHECK: # %bb.0:
				; CHECK-NEXT: ret
				%res = call <vscale x 8 x float> @llvm.experimental.vector.splice.nxv8f32(<vscale x 8 x float> %a, <vscale x 8 x float> %b, i32 0)
				ret <vscale x 8 x float> %res
				}

				define <vscale x 8 x float> @splice_nxv8f32_offset_negone(<vscale x 8 x float> %a, <vscale x 8 x float> %b) #0 {
				; CHECK-LABEL: splice_nxv8f32_offset_negone:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: addi a0, a0, -1
				; CHECK-NEXT: vsetivli zero, 1, e32, m4, ta, mu
				; CHECK-NEXT: vslidedown.vx v8, v8, a0
				; CHECK-NEXT: vsetvli a0, zero, e32, m4, tu, mu
				; CHECK-NEXT: vslideup.vi v8, v12, 1
				; CHECK-NEXT: ret
				%res = call <vscale x 8 x float> @llvm.experimental.vector.splice.nxv8f32(<vscale x 8 x float> %a, <vscale x 8 x float> %b, i32 -1)
				ret <vscale x 8 x float> %res
				}

				define <vscale x 8 x float> @splice_nxv8f32_offset_min(<vscale x 8 x float> %a, <vscale x 8 x float> %b) #0 {
				; CHECK-LABEL: splice_nxv8f32_offset_min:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: addi a0, a0, -16
				; CHECK-NEXT: vsetivli zero, 16, e32, m4, ta, mu
				; CHECK-NEXT: vslidedown.vx v8, v8, a0
				; CHECK-NEXT: vsetvli a0, zero, e32, m4, tu, mu
				; CHECK-NEXT: vslideup.vi v8, v12, 16
				; CHECK-NEXT: ret
				%res = call <vscale x 8 x float> @llvm.experimental.vector.splice.nxv8f32(<vscale x 8 x float> %a, <vscale x 8 x float> %b, i32 -16)
				ret <vscale x 8 x float> %res
				}

				define <vscale x 8 x float> @splice_nxv8f32_offset_max(<vscale x 8 x float> %a, <vscale x 8 x float> %b) #0 {
				; CHECK-LABEL: splice_nxv8f32_offset_max:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: addi a0, a0, -15
				; CHECK-NEXT: vsetvli zero, a0, e32, m4, ta, mu
				; CHECK-NEXT: vslidedown.vi v8, v8, 15
				; CHECK-NEXT: vsetvli a1, zero, e32, m4, tu, mu
				; CHECK-NEXT: vslideup.vx v8, v12, a0
				; CHECK-NEXT: ret
				%res = call <vscale x 8 x float> @llvm.experimental.vector.splice.nxv8f32(<vscale x 8 x float> %a, <vscale x 8 x float> %b, i32 15)
				ret <vscale x 8 x float> %res
				}

				declare <vscale x 16 x float> @llvm.experimental.vector.splice.nxv16f32(<vscale x 16 x float>, <vscale x 16 x float>, i32)

				define <vscale x 16 x float> @splice_nxv16f32_offset_zero(<vscale x 16 x float> %a, <vscale x 16 x float> %b) #0 {
				; CHECK-LABEL: splice_nxv16f32_offset_zero:
				; CHECK: # %bb.0:
				; CHECK-NEXT: ret
				%res = call <vscale x 16 x float> @llvm.experimental.vector.splice.nxv16f32(<vscale x 16 x float> %a, <vscale x 16 x float> %b, i32 0)
				ret <vscale x 16 x float> %res
				}

				define <vscale x 16 x float> @splice_nxv16f32_offset_negone(<vscale x 16 x float> %a, <vscale x 16 x float> %b) #0 {
				; CHECK-LABEL: splice_nxv16f32_offset_negone:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: slli a0, a0, 1
				; CHECK-NEXT: addi a0, a0, -1
				; CHECK-NEXT: vsetivli zero, 1, e32, m8, ta, mu
				; CHECK-NEXT: vslidedown.vx v8, v8, a0
				; CHECK-NEXT: vsetvli a0, zero, e32, m8, tu, mu
				; CHECK-NEXT: vslideup.vi v8, v16, 1
				; CHECK-NEXT: ret
				%res = call <vscale x 16 x float> @llvm.experimental.vector.splice.nxv16f32(<vscale x 16 x float> %a, <vscale x 16 x float> %b, i32 -1)
				ret <vscale x 16 x float> %res
				}

				define <vscale x 16 x float> @splice_nxv16f32_offset_min(<vscale x 16 x float> %a, <vscale x 16 x float> %b) #0 {
				; CHECK-LABEL: splice_nxv16f32_offset_min:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: slli a0, a0, 1
				; CHECK-NEXT: addi a0, a0, -32
				; CHECK-NEXT: li a1, 32
				; CHECK-NEXT: vsetvli zero, a1, e32, m8, ta, mu
				; CHECK-NEXT: vslidedown.vx v8, v8, a0
				; CHECK-NEXT: vsetvli a0, zero, e32, m8, tu, mu
				; CHECK-NEXT: vslideup.vx v8, v16, a1
				; CHECK-NEXT: ret
				%res = call <vscale x 16 x float> @llvm.experimental.vector.splice.nxv16f32(<vscale x 16 x float> %a, <vscale x 16 x float> %b, i32 -32)
				ret <vscale x 16 x float> %res
				}

				define <vscale x 16 x float> @splice_nxv16f32_offset_max(<vscale x 16 x float> %a, <vscale x 16 x float> %b) #0 {
				; CHECK-LABEL: splice_nxv16f32_offset_max:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: slli a0, a0, 1
				; CHECK-NEXT: addi a0, a0, -31
				; CHECK-NEXT: vsetvli zero, a0, e32, m8, ta, mu
				; CHECK-NEXT: vslidedown.vi v8, v8, 31
				; CHECK-NEXT: vsetvli a1, zero, e32, m8, tu, mu
				; CHECK-NEXT: vslideup.vx v8, v16, a0
				; CHECK-NEXT: ret
				%res = call <vscale x 16 x float> @llvm.experimental.vector.splice.nxv16f32(<vscale x 16 x float> %a, <vscale x 16 x float> %b, i32 31)
				ret <vscale x 16 x float> %res
				}

				declare <vscale x 1 x double> @llvm.experimental.vector.splice.nxv1f64(<vscale x 1 x double>, <vscale x 1 x double>, i32)

				define <vscale x 1 x double> @splice_nxv1f64_offset_zero(<vscale x 1 x double> %a, <vscale x 1 x double> %b) #0 {
				; CHECK-LABEL: splice_nxv1f64_offset_zero:
				; CHECK: # %bb.0:
				; CHECK-NEXT: ret
				%res = call <vscale x 1 x double> @llvm.experimental.vector.splice.nxv1f64(<vscale x 1 x double> %a, <vscale x 1 x double> %b, i32 0)
				ret <vscale x 1 x double> %res
				}

				define <vscale x 1 x double> @splice_nxv1f64_offset_negone(<vscale x 1 x double> %a, <vscale x 1 x double> %b) #0 {
				; CHECK-LABEL: splice_nxv1f64_offset_negone:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: srli a0, a0, 3
				; CHECK-NEXT: addi a0, a0, -1
				; CHECK-NEXT: vsetivli zero, 1, e64, m1, ta, mu
				; CHECK-NEXT: vslidedown.vx v8, v8, a0
				; CHECK-NEXT: vsetvli a0, zero, e64, m1, tu, mu
				; CHECK-NEXT: vslideup.vi v8, v9, 1
				; CHECK-NEXT: ret
				%res = call <vscale x 1 x double> @llvm.experimental.vector.splice.nxv1f64(<vscale x 1 x double> %a, <vscale x 1 x double> %b, i32 -1)
				ret <vscale x 1 x double> %res
				}

				define <vscale x 1 x double> @splice_nxv1f64_offset_min(<vscale x 1 x double> %a, <vscale x 1 x double> %b) #0 {
				; CHECK-LABEL: splice_nxv1f64_offset_min:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: srli a0, a0, 3
				; CHECK-NEXT: addi a0, a0, -2
				; CHECK-NEXT: vsetivli zero, 2, e64, m1, ta, mu
				; CHECK-NEXT: vslidedown.vx v8, v8, a0
				; CHECK-NEXT: vsetvli a0, zero, e64, m1, tu, mu
				; CHECK-NEXT: vslideup.vi v8, v9, 2
				; CHECK-NEXT: ret
				%res = call <vscale x 1 x double> @llvm.experimental.vector.splice.nxv1f64(<vscale x 1 x double> %a, <vscale x 1 x double> %b, i32 -2)
				ret <vscale x 1 x double> %res
				}

				define <vscale x 1 x double> @splice_nxv1f64_offset_max(<vscale x 1 x double> %a, <vscale x 1 x double> %b) #0 {
				; CHECK-LABEL: splice_nxv1f64_offset_max:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: srli a0, a0, 3
				; CHECK-NEXT: addi a0, a0, -1
				; CHECK-NEXT: vsetvli zero, a0, e64, m1, ta, mu
				; CHECK-NEXT: vslidedown.vi v8, v8, 1
				; CHECK-NEXT: vsetvli a1, zero, e64, m1, tu, mu
				; CHECK-NEXT: vslideup.vx v8, v9, a0
				; CHECK-NEXT: ret
				%res = call <vscale x 1 x double> @llvm.experimental.vector.splice.nxv1f64(<vscale x 1 x double> %a, <vscale x 1 x double> %b, i32 1)
				ret <vscale x 1 x double> %res
				}

				declare <vscale x 2 x double> @llvm.experimental.vector.splice.nxv2f64(<vscale x 2 x double>, <vscale x 2 x double>, i32)

				define <vscale x 2 x double> @splice_nxv2f64_offset_zero(<vscale x 2 x double> %a, <vscale x 2 x double> %b) #0 {
				; CHECK-LABEL: splice_nxv2f64_offset_zero:
				; CHECK: # %bb.0:
				; CHECK-NEXT: ret
				%res = call <vscale x 2 x double> @llvm.experimental.vector.splice.nxv2f64(<vscale x 2 x double> %a, <vscale x 2 x double> %b, i32 0)
				ret <vscale x 2 x double> %res
				}

				define <vscale x 2 x double> @splice_nxv2f64_offset_negone(<vscale x 2 x double> %a, <vscale x 2 x double> %b) #0 {
				; CHECK-LABEL: splice_nxv2f64_offset_negone:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: srli a0, a0, 2
				; CHECK-NEXT: addi a0, a0, -1
				; CHECK-NEXT: vsetivli zero, 1, e64, m2, ta, mu
				; CHECK-NEXT: vslidedown.vx v8, v8, a0
				; CHECK-NEXT: vsetvli a0, zero, e64, m2, tu, mu
				; CHECK-NEXT: vslideup.vi v8, v10, 1
				; CHECK-NEXT: ret
				%res = call <vscale x 2 x double> @llvm.experimental.vector.splice.nxv2f64(<vscale x 2 x double> %a, <vscale x 2 x double> %b, i32 -1)
				ret <vscale x 2 x double> %res
				}

				define <vscale x 2 x double> @splice_nxv2f64_offset_min(<vscale x 2 x double> %a, <vscale x 2 x double> %b) #0 {
				; CHECK-LABEL: splice_nxv2f64_offset_min:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: srli a0, a0, 2
				; CHECK-NEXT: addi a0, a0, -4
				; CHECK-NEXT: vsetivli zero, 4, e64, m2, ta, mu
				; CHECK-NEXT: vslidedown.vx v8, v8, a0
				; CHECK-NEXT: vsetvli a0, zero, e64, m2, tu, mu
				; CHECK-NEXT: vslideup.vi v8, v10, 4
				; CHECK-NEXT: ret
				%res = call <vscale x 2 x double> @llvm.experimental.vector.splice.nxv2f64(<vscale x 2 x double> %a, <vscale x 2 x double> %b, i32 -4)
				ret <vscale x 2 x double> %res
				}

				define <vscale x 2 x double> @splice_nxv2f64_offset_max(<vscale x 2 x double> %a, <vscale x 2 x double> %b) #0 {
				; CHECK-LABEL: splice_nxv2f64_offset_max:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: srli a0, a0, 2
				; CHECK-NEXT: addi a0, a0, -3
				; CHECK-NEXT: vsetvli zero, a0, e64, m2, ta, mu
				; CHECK-NEXT: vslidedown.vi v8, v8, 3
				; CHECK-NEXT: vsetvli a1, zero, e64, m2, tu, mu
				; CHECK-NEXT: vslideup.vx v8, v10, a0
				; CHECK-NEXT: ret
				%res = call <vscale x 2 x double> @llvm.experimental.vector.splice.nxv2f64(<vscale x 2 x double> %a, <vscale x 2 x double> %b, i32 3)
				ret <vscale x 2 x double> %res
				}

				declare <vscale x 4 x double> @llvm.experimental.vector.splice.nxv4f64(<vscale x 4 x double>, <vscale x 4 x double>, i32)

				define <vscale x 4 x double> @splice_nxv4f64_offset_zero(<vscale x 4 x double> %a, <vscale x 4 x double> %b) #0 {
				; CHECK-LABEL: splice_nxv4f64_offset_zero:
				; CHECK: # %bb.0:
				; CHECK-NEXT: ret
				%res = call <vscale x 4 x double> @llvm.experimental.vector.splice.nxv4f64(<vscale x 4 x double> %a, <vscale x 4 x double> %b, i32 0)
				ret <vscale x 4 x double> %res
				}

				define <vscale x 4 x double> @splice_nxv4f64_offset_negone(<vscale x 4 x double> %a, <vscale x 4 x double> %b) #0 {
				; CHECK-LABEL: splice_nxv4f64_offset_negone:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: srli a0, a0, 1
				; CHECK-NEXT: addi a0, a0, -1
				; CHECK-NEXT: vsetivli zero, 1, e64, m4, ta, mu
				; CHECK-NEXT: vslidedown.vx v8, v8, a0
				; CHECK-NEXT: vsetvli a0, zero, e64, m4, tu, mu
				; CHECK-NEXT: vslideup.vi v8, v12, 1
				; CHECK-NEXT: ret
				%res = call <vscale x 4 x double> @llvm.experimental.vector.splice.nxv4f64(<vscale x 4 x double> %a, <vscale x 4 x double> %b, i32 -1)
				ret <vscale x 4 x double> %res
				}

				define <vscale x 4 x double> @splice_nxv4f64_offset_min(<vscale x 4 x double> %a, <vscale x 4 x double> %b) #0 {
				; CHECK-LABEL: splice_nxv4f64_offset_min:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: srli a0, a0, 1
				; CHECK-NEXT: addi a0, a0, -8
				; CHECK-NEXT: vsetivli zero, 8, e64, m4, ta, mu
				; CHECK-NEXT: vslidedown.vx v8, v8, a0
				; CHECK-NEXT: vsetvli a0, zero, e64, m4, tu, mu
				; CHECK-NEXT: vslideup.vi v8, v12, 8
				; CHECK-NEXT: ret
				%res = call <vscale x 4 x double> @llvm.experimental.vector.splice.nxv4f64(<vscale x 4 x double> %a, <vscale x 4 x double> %b, i32 -8)
				ret <vscale x 4 x double> %res
				}

				define <vscale x 4 x double> @splice_nxv4f64_offset_max(<vscale x 4 x double> %a, <vscale x 4 x double> %b) #0 {
				; CHECK-LABEL: splice_nxv4f64_offset_max:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: srli a0, a0, 1
				; CHECK-NEXT: addi a0, a0, -7
				; CHECK-NEXT: vsetvli zero, a0, e64, m4, ta, mu
				; CHECK-NEXT: vslidedown.vi v8, v8, 7
				; CHECK-NEXT: vsetvli a1, zero, e64, m4, tu, mu
				; CHECK-NEXT: vslideup.vx v8, v12, a0
				; CHECK-NEXT: ret
				%res = call <vscale x 4 x double> @llvm.experimental.vector.splice.nxv4f64(<vscale x 4 x double> %a, <vscale x 4 x double> %b, i32 7)
				ret <vscale x 4 x double> %res
				}

				declare <vscale x 8 x double> @llvm.experimental.vector.splice.nxv8f64(<vscale x 8 x double>, <vscale x 8 x double>, i32)

				define <vscale x 8 x double> @splice_nxv8f64_offset_zero(<vscale x 8 x double> %a, <vscale x 8 x double> %b) #0 {
				; CHECK-LABEL: splice_nxv8f64_offset_zero:
				; CHECK: # %bb.0:
				; CHECK-NEXT: ret
				%res = call <vscale x 8 x double> @llvm.experimental.vector.splice.nxv8f64(<vscale x 8 x double> %a, <vscale x 8 x double> %b, i32 0)
				ret <vscale x 8 x double> %res
				}

				define <vscale x 8 x double> @splice_nxv8f64_offset_negone(<vscale x 8 x double> %a, <vscale x 8 x double> %b) #0 {
				; CHECK-LABEL: splice_nxv8f64_offset_negone:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: addi a0, a0, -1
				; CHECK-NEXT: vsetivli zero, 1, e64, m8, ta, mu
				; CHECK-NEXT: vslidedown.vx v8, v8, a0
				; CHECK-NEXT: vsetvli a0, zero, e64, m8, tu, mu
				; CHECK-NEXT: vslideup.vi v8, v16, 1
				; CHECK-NEXT: ret
				%res = call <vscale x 8 x double> @llvm.experimental.vector.splice.nxv8f64(<vscale x 8 x double> %a, <vscale x 8 x double> %b, i32 -1)
				ret <vscale x 8 x double> %res
				}

				define <vscale x 8 x double> @splice_nxv8f64_offset_min(<vscale x 8 x double> %a, <vscale x 8 x double> %b) #0 {
				; CHECK-LABEL: splice_nxv8f64_offset_min:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: addi a0, a0, -16
				; CHECK-NEXT: vsetivli zero, 16, e64, m8, ta, mu
				; CHECK-NEXT: vslidedown.vx v8, v8, a0
				; CHECK-NEXT: vsetvli a0, zero, e64, m8, tu, mu
				; CHECK-NEXT: vslideup.vi v8, v16, 16
				; CHECK-NEXT: ret
				%res = call <vscale x 8 x double> @llvm.experimental.vector.splice.nxv8f64(<vscale x 8 x double> %a, <vscale x 8 x double> %b, i32 -16)
				ret <vscale x 8 x double> %res
				}

				define <vscale x 8 x double> @splice_nxv8f64_offset_max(<vscale x 8 x double> %a, <vscale x 8 x double> %b) #0 {
				; CHECK-LABEL: splice_nxv8f64_offset_max:
				; CHECK: # %bb.0:
				; CHECK-NEXT: csrr a0, vlenb
				; CHECK-NEXT: addi a0, a0, -15
				; CHECK-NEXT: vsetvli zero, a0, e64, m8, ta, mu
				; CHECK-NEXT: vslidedown.vi v8, v8, 15
				; CHECK-NEXT: vsetvli a1, zero, e64, m8, tu, mu
				; CHECK-NEXT: vslideup.vx v8, v16, a0
				; CHECK-NEXT: ret
				%res = call <vscale x 8 x double> @llvm.experimental.vector.splice.nxv8f64(<vscale x 8 x double> %a, <vscale x 8 x double> %b, i32 15)
				ret <vscale x 8 x double> %res
				}

				attributes #0 = { vscale_range(2,2) }

				frasercrmckUnsubmitted Not Done Reply Inline Actions Oh I just saw this, which probably partially answers my comment above. Why do we need this? The RVV-specific lowering code doesn't seem to care. Is there something happening at a higher level? frasercrmck: Oh I just saw this, which probably partially answers my comment above. Why do we need this? The…