This is an archive of the discontinued LLVM Phabricator instance.

[RISCV] Detect bitcasted splat patterns
Needs ReviewPublic

Authored by luke on Aug 24 2023, 7:48 AM.

Download Raw Diff

Details

Reviewers

craig.topper
reames
frasercrmck

Summary

A common issue in RV32 is that i64 splats of fixed length vectors are legalized
to (bitcast v2i64 (build_vector <i32 x, i32 y, i32 x, i32 y>)).

These are then lowered in RISCVISelLowering to something like:

(insert_subvector (bitcast (extract_subvector (vmv_v_x_vl))))

RV64 doesn't have this problem since the insert_subvector and extract_subvector pairs are usually combined away, but the bitcast introduced with SEW=64 on RV32 prevents this from happening.

This patch handles the case by peeking through the inserts, bitcasts and
extracts to detect the "hidden" splats.

Diff Detail

Repository: rG LLVM Github Monorepo

Unit TestsFailed

	Time	Test
	60,030 ms	x64 debian > MLIR.Examples/standalone::test.toy

Event Timeline

luke created this revision.Aug 24 2023, 7:48 AM

Herald added a project: Restricted Project. · View Herald TranscriptAug 24 2023, 7:48 AM

Herald added subscribers: jobnoorman, asb, sunshaoce and 28 others. · View Herald Transcript

luke requested review of this revision.Aug 24 2023, 7:48 AM

Herald added a project: Restricted Project. · View Herald TranscriptAug 24 2023, 7:49 AM

Herald added subscribers: llvm-commits, wangpc, eopXD, MaskRay. · View Herald Transcript

luke added a parent revision: D158741: [RISCV] Refactor selectVSplat. NFCI.Aug 24 2023, 7:49 AM

Harbormaster completed remote builds in B254636: Diff 553133.Aug 24 2023, 9:09 AM

Should we DAGCombine some of this away? Or custom lower fixed vector bitcasts into scalable bitcast?

In D158742#4614309, @craig.topper wrote:

Should we DAGCombine some of this away? Or custom lower fixed vector bitcasts into scalable bitcast?

I tried a DAGCombine of (bitcast (build_vector)) to emit splat_vector_parts, but it's a bit awkward and results in more materialisations on the stack, because it doesn't get to take advantage of the build_vector lowering optimisations.

bitcast-buildvec-combine.diff492 KBDownload

Will try combining/lowering it to vmv_v_x_vl directly

In D158742#4616663, @luke wrote:

In D158742#4614309, @craig.topper wrote:

Should we DAGCombine some of this away? Or custom lower fixed vector bitcasts into scalable bitcast?

I tried a DAGCombine of (bitcast (build_vector)) to emit splat_vector_parts, but it's a bit awkward and results in more materialisations on the stack, because it doesn't get to take advantage of the build_vector lowering optimisations.
bitcast-buildvec-combine.diff492 KBDownload

Will try combining/lowering it to vmv_v_x_vl directly

I was asking more about the inserts and extracts. Shouldn't we end up with a scalable vector bitcast instead of a fixed vector bitcast sandwiched between inserts and extracts?

craig.topper mentioned this in D158870: [SelectionDAG][RISCV] Teach getConstant to use SPLAT_VECTOR_PARTS if vXi64 SPLAT_VECTOR is legal but i64 scalars are not..Aug 25 2023, 11:25 AM

craig.topper mentioned this in rG299b1b407148: [SelectionDAG][RISCV] Teach getConstant to use SPLAT_VECTOR_PARTS if vXi64….Aug 29 2023, 9:22 AM

Revision Contents

Path

Size

llvm/

lib/

Target/

RISCV/

RISCVISelDAGToDAG.cpp

41 lines

test/

CodeGen/

RISCV/

rvv/

fixed-vectors-ctlz-vp.ll

512 lines

fixed-vectors-ctlz.ll

20 lines

fixed-vectors-cttz-vp.ll

1094 lines

fixed-vectors-cttz.ll

329 lines

fixed-vectors-fshr-fshl-vp.ll

504 lines

fixed-vectors-int-splat.ll

37 lines

fixed-vectors-masked-load-int.ll

56 lines

fixed-vectors-masked-store-int.ll

122 lines

fixed-vectors-vadd-vp.ll

172 lines

fixed-vectors-vrol.ll

257 lines

fixed-vectors-vror.ll

397 lines

Diff 553133

llvm/lib/Target/RISCV/RISCVISelDAGToDAG.cpp

Show First 20 Lines • Show All 2,951 Lines • ▼ Show 20 Lines	if (C && isUInt<5>(C->getZExtValue())) {
VL = N;		VL = N;
}		}

return true;		return true;
}		}

static SDValue findVSplat(SDValue N) {		static SDValue findVSplat(SDValue N) {
SDValue Splat = N;		SDValue Splat = N;

		// A common pattern on RV32 is a splat that's been obfuscated through
		// bitcasts, e.g. (insert_subvector nxv2i64 (bitcast v2i64 (extract_subvector
		// v4i32 (vmv_v_x_vl nxv4i32)))
		//
		// The index doesn't matter here since is it's inserting into undef.
		if (Splat.getOpcode() == ISD::INSERT_SUBVECTOR &&
		Splat.getOperand(0).isUndef())
		Splat = Splat.getOperand(1);
		Splat = peekThroughBitcasts(Splat);
		// The index doesn't matter here because an extract of a splat will have the
		// same value no matter where it extracts from.
		if (Splat.getOpcode() == ISD::EXTRACT_SUBVECTOR)
		Splat = Splat.getOperand(0);

if (Splat.getOpcode() != RISCVISD::VMV_V_X_VL \|\|		if (Splat.getOpcode() != RISCVISD::VMV_V_X_VL \|\|
!Splat.getOperand(0).isUndef())		!Splat.getOperand(0).isUndef())
return SDValue();		return SDValue();
assert(Splat.getNumOperands() == 3 && "Unexpected number of operands");		assert(Splat.getNumOperands() == 3 && "Unexpected number of operands");

		// If the original element size is smaller than the splat's, then from the
		// perspective of N's type it's not a splat but a repeated sequence, e.g:
		//
		// (insert_subvector nxv4i32 (bitcast v4i32 (extract_subvector v2i64
		// (vmv_v_x_vl nxv2i64)))
		if (N.getSimpleValueType().getScalarSizeInBits() <
		Splat.getSimpleValueType().getScalarSizeInBits())
		return SDValue();
return Splat;		return Splat;
}		}

bool RISCVDAGToDAGISel::selectVSplat(SDValue N, SDValue &SplatVal) {		bool RISCVDAGToDAGISel::selectVSplat(SDValue N, SDValue &SplatVal) {
SDValue Splat = findVSplat(N);		SDValue Splat = findVSplat(N);
if (!Splat)		if (!Splat)
return false;		return false;

		if (Splat.getSimpleValueType().getVectorElementType() !=
		N.getSimpleValueType().getVectorElementType())
		return false;

SplatVal = Splat.getOperand(1);		SplatVal = Splat.getOperand(1);
return true;		return true;
}		}

static bool selectVSplatImmHelper(SDValue N, SDValue &SplatVal,		static bool selectVSplatImmHelper(SDValue N, SDValue &SplatVal,
SelectionDAG &DAG,		SelectionDAG &DAG,
const RISCVSubtarget &Subtarget,		const RISCVSubtarget &Subtarget,
std::function<bool(int64_t)> ValidateImm) {		std::function<bool(int64_t)> ValidateImm) {
SDValue Splat = findVSplat(N);		SDValue Splat = findVSplat(N);
if (!Splat \|\| !isa<ConstantSDNode>(Splat.getOperand(1)))		if (!Splat \|\| !isa<ConstantSDNode>(Splat.getOperand(1)))
return false;		return false;

		// Extract the constant from a RISCVISD::VMV_V_X_VL. This takes into account
		// the fact that the VMV_V_X_VL could have a smaller element type that was
		// then bitcasted to VT's larger element type.
		const unsigned EltSize = N.getScalarValueSizeInBits();
const unsigned SplatEltSize = Splat.getScalarValueSizeInBits();		const unsigned SplatEltSize = Splat.getScalarValueSizeInBits();
		assert(EltSize >= SplatEltSize);
assert(Subtarget.getXLenVT() == Splat.getOperand(1).getSimpleValueType() &&		assert(Subtarget.getXLenVT() == Splat.getOperand(1).getSimpleValueType() &&
"Unexpected splat operand type");		"Unexpected splat operand type");

// The semantics of RISCVISD::VMV_V_X_VL is that when the operand		// The semantics of RISCVISD::VMV_V_X_VL is that when the operand
// type is wider than the resulting vector element type: an implicit		// type is wider than the resulting vector element type: an implicit
// truncation first takes place. Therefore, perform a manual		// truncation first takes place. Therefore, perform a manual
// truncation/sign-extension in order to ignore any truncated bits and catch		// truncation/sign-extension in order to ignore any truncated bits and catch
// any zero-extended immediate.		// any zero-extended immediate.
// For example, we wish to match (i8 -1) -> (XLenVT 255) as a simm5 by first		// For example, we wish to match (i8 -1) -> (XLenVT 255) as a simm5 by first
// sign-extending to (XLenVT -1).		// sign-extending to (XLenVT -1).
APInt SplatConst = Splat.getConstantOperandAPInt(1).sextOrTrunc(SplatEltSize);		APInt SplatConst = Splat.getConstantOperandAPInt(1).sextOrTrunc(SplatEltSize);

int64_t SplatImm = SplatConst.getSExtValue();		// Get the splat value, which may be smaller than N's element size if it was
		// bitcasted.
		APInt Const(EltSize, 0);
		for (unsigned I = 0; I < EltSize / SplatEltSize; I++)
		Const.insertBits(SplatConst, I * SplatEltSize);

		int64_t SplatImm = Const.getSExtValue();

if (!ValidateImm(SplatImm))		if (!ValidateImm(SplatImm))
return false;		return false;

SplatVal = DAG.getTargetConstant(SplatImm, SDLoc(N), Subtarget.getXLenVT());		SplatVal = DAG.getTargetConstant(SplatImm, SDLoc(N), Subtarget.getXLenVT());
return true;		return true;
}		}

▲ Show 20 Lines • Show All 651 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-ctlz-vp.ll

	Show First 20 Lines • Show All 1,457 Lines • ▼ Show 20 Lines
	; RV32-NEXT: vor.vv v8, v8, v9, v0.t			; RV32-NEXT: vor.vv v8, v8, v9, v0.t
	; RV32-NEXT: vsrl.vi v9, v8, 8, v0.t			; RV32-NEXT: vsrl.vi v9, v8, 8, v0.t
	; RV32-NEXT: vor.vv v8, v8, v9, v0.t			; RV32-NEXT: vor.vv v8, v8, v9, v0.t
	; RV32-NEXT: vsrl.vi v9, v8, 16, v0.t			; RV32-NEXT: vsrl.vi v9, v8, 16, v0.t
	; RV32-NEXT: vor.vv v8, v8, v9, v0.t			; RV32-NEXT: vor.vv v8, v8, v9, v0.t
	; RV32-NEXT: li a1, 32			; RV32-NEXT: li a1, 32
	; RV32-NEXT: vsrl.vx v9, v8, a1, v0.t			; RV32-NEXT: vsrl.vx v9, v8, a1, v0.t
	; RV32-NEXT: vor.vv v8, v8, v9, v0.t			; RV32-NEXT: vor.vv v8, v8, v9, v0.t
	; RV32-NEXT: vsetivli zero, 4, e32, m1, ta, ma			; RV32-NEXT: vnot.v v8, v8, v0.t
	; RV32-NEXT: vmv.v.i v9, -1
	; RV32-NEXT: vsetvli zero, a0, e64, m1, ta, ma
	; RV32-NEXT: vxor.vv v8, v8, v9, v0.t
	; RV32-NEXT: vsrl.vi v9, v8, 1, v0.t			; RV32-NEXT: vsrl.vi v9, v8, 1, v0.t
	; RV32-NEXT: lui a1, 349525			; RV32-NEXT: lui a1, 349525
	; RV32-NEXT: addi a1, a1, 1365			; RV32-NEXT: addi a1, a1, 1365
	; RV32-NEXT: vsetivli zero, 4, e32, m1, ta, ma			; RV32-NEXT: vsetivli zero, 4, e32, m1, ta, ma
	; RV32-NEXT: vmv.v.x v10, a1			; RV32-NEXT: vmv.v.x v10, a1
	; RV32-NEXT: vsetvli zero, a0, e64, m1, ta, ma			; RV32-NEXT: vsetvli zero, a0, e64, m1, ta, ma
	; RV32-NEXT: vand.vv v9, v9, v10, v0.t			; RV32-NEXT: vand.vv v9, v9, v10, v0.t
	; RV32-NEXT: vsub.vv v8, v8, v9, v0.t			; RV32-NEXT: vsub.vv v8, v8, v9, v0.t
	▲ Show 20 Lines • Show All 87 Lines • ▼ Show 20 Lines
	; RV32-NEXT: vor.vv v8, v8, v9			; RV32-NEXT: vor.vv v8, v8, v9
	; RV32-NEXT: vsrl.vi v9, v8, 8			; RV32-NEXT: vsrl.vi v9, v8, 8
	; RV32-NEXT: vor.vv v8, v8, v9			; RV32-NEXT: vor.vv v8, v8, v9
	; RV32-NEXT: vsrl.vi v9, v8, 16			; RV32-NEXT: vsrl.vi v9, v8, 16
	; RV32-NEXT: vor.vv v8, v8, v9			; RV32-NEXT: vor.vv v8, v8, v9
	; RV32-NEXT: li a1, 32			; RV32-NEXT: li a1, 32
	; RV32-NEXT: vsrl.vx v9, v8, a1			; RV32-NEXT: vsrl.vx v9, v8, a1
	; RV32-NEXT: vor.vv v8, v8, v9			; RV32-NEXT: vor.vv v8, v8, v9
	; RV32-NEXT: vsetivli zero, 4, e32, m1, ta, ma			; RV32-NEXT: vnot.v v8, v8
	; RV32-NEXT: vmv.v.i v9, -1
	; RV32-NEXT: vsetvli zero, a0, e64, m1, ta, ma
	; RV32-NEXT: vxor.vv v8, v8, v9
	; RV32-NEXT: vsrl.vi v9, v8, 1			; RV32-NEXT: vsrl.vi v9, v8, 1
	; RV32-NEXT: lui a1, 349525			; RV32-NEXT: lui a1, 349525
	; RV32-NEXT: addi a1, a1, 1365			; RV32-NEXT: addi a1, a1, 1365
	; RV32-NEXT: vsetivli zero, 4, e32, m1, ta, ma			; RV32-NEXT: vsetivli zero, 4, e32, m1, ta, ma
	; RV32-NEXT: vmv.v.x v10, a1			; RV32-NEXT: vmv.v.x v10, a1
	; RV32-NEXT: vsetvli zero, a0, e64, m1, ta, ma			; RV32-NEXT: vsetvli zero, a0, e64, m1, ta, ma
	; RV32-NEXT: vand.vv v9, v9, v10			; RV32-NEXT: vand.vv v9, v9, v10
	; RV32-NEXT: vsub.vv v8, v8, v9			; RV32-NEXT: vsub.vv v8, v8, v9
	▲ Show 20 Lines • Show All 91 Lines • ▼ Show 20 Lines
	; RV32-NEXT: vor.vv v8, v8, v10, v0.t			; RV32-NEXT: vor.vv v8, v8, v10, v0.t
	; RV32-NEXT: vsrl.vi v10, v8, 8, v0.t			; RV32-NEXT: vsrl.vi v10, v8, 8, v0.t
	; RV32-NEXT: vor.vv v8, v8, v10, v0.t			; RV32-NEXT: vor.vv v8, v8, v10, v0.t
	; RV32-NEXT: vsrl.vi v10, v8, 16, v0.t			; RV32-NEXT: vsrl.vi v10, v8, 16, v0.t
	; RV32-NEXT: vor.vv v8, v8, v10, v0.t			; RV32-NEXT: vor.vv v8, v8, v10, v0.t
	; RV32-NEXT: li a1, 32			; RV32-NEXT: li a1, 32
	; RV32-NEXT: vsrl.vx v10, v8, a1, v0.t			; RV32-NEXT: vsrl.vx v10, v8, a1, v0.t
	; RV32-NEXT: vor.vv v8, v8, v10, v0.t			; RV32-NEXT: vor.vv v8, v8, v10, v0.t
	; RV32-NEXT: vsetivli zero, 8, e32, m2, ta, ma			; RV32-NEXT: vnot.v v8, v8, v0.t
	; RV32-NEXT: vmv.v.i v10, -1
	; RV32-NEXT: vsetvli zero, a0, e64, m2, ta, ma
	; RV32-NEXT: vxor.vv v8, v8, v10, v0.t
	; RV32-NEXT: vsrl.vi v10, v8, 1, v0.t			; RV32-NEXT: vsrl.vi v10, v8, 1, v0.t
	; RV32-NEXT: lui a1, 349525			; RV32-NEXT: lui a1, 349525
	; RV32-NEXT: addi a1, a1, 1365			; RV32-NEXT: addi a1, a1, 1365
	; RV32-NEXT: vsetivli zero, 8, e32, m2, ta, ma			; RV32-NEXT: vsetivli zero, 8, e32, m2, ta, ma
	; RV32-NEXT: vmv.v.x v12, a1			; RV32-NEXT: vmv.v.x v12, a1
	; RV32-NEXT: vsetvli zero, a0, e64, m2, ta, ma			; RV32-NEXT: vsetvli zero, a0, e64, m2, ta, ma
	; RV32-NEXT: vand.vv v10, v10, v12, v0.t			; RV32-NEXT: vand.vv v10, v10, v12, v0.t
	; RV32-NEXT: vsub.vv v8, v8, v10, v0.t			; RV32-NEXT: vsub.vv v8, v8, v10, v0.t
	▲ Show 20 Lines • Show All 87 Lines • ▼ Show 20 Lines
	; RV32-NEXT: vor.vv v8, v8, v10			; RV32-NEXT: vor.vv v8, v8, v10
	; RV32-NEXT: vsrl.vi v10, v8, 8			; RV32-NEXT: vsrl.vi v10, v8, 8
	; RV32-NEXT: vor.vv v8, v8, v10			; RV32-NEXT: vor.vv v8, v8, v10
	; RV32-NEXT: vsrl.vi v10, v8, 16			; RV32-NEXT: vsrl.vi v10, v8, 16
	; RV32-NEXT: vor.vv v8, v8, v10			; RV32-NEXT: vor.vv v8, v8, v10
	; RV32-NEXT: li a1, 32			; RV32-NEXT: li a1, 32
	; RV32-NEXT: vsrl.vx v10, v8, a1			; RV32-NEXT: vsrl.vx v10, v8, a1
	; RV32-NEXT: vor.vv v8, v8, v10			; RV32-NEXT: vor.vv v8, v8, v10
	; RV32-NEXT: vsetivli zero, 8, e32, m2, ta, ma			; RV32-NEXT: vnot.v v8, v8
	; RV32-NEXT: vmv.v.i v10, -1
	; RV32-NEXT: vsetvli zero, a0, e64, m2, ta, ma
	; RV32-NEXT: vxor.vv v8, v8, v10
	; RV32-NEXT: vsrl.vi v10, v8, 1			; RV32-NEXT: vsrl.vi v10, v8, 1
	; RV32-NEXT: lui a1, 349525			; RV32-NEXT: lui a1, 349525
	; RV32-NEXT: addi a1, a1, 1365			; RV32-NEXT: addi a1, a1, 1365
	; RV32-NEXT: vsetivli zero, 8, e32, m2, ta, ma			; RV32-NEXT: vsetivli zero, 8, e32, m2, ta, ma
	; RV32-NEXT: vmv.v.x v12, a1			; RV32-NEXT: vmv.v.x v12, a1
	; RV32-NEXT: vsetvli zero, a0, e64, m2, ta, ma			; RV32-NEXT: vsetvli zero, a0, e64, m2, ta, ma
	; RV32-NEXT: vand.vv v10, v10, v12			; RV32-NEXT: vand.vv v10, v10, v12
	; RV32-NEXT: vsub.vv v8, v8, v10			; RV32-NEXT: vsub.vv v8, v8, v10
	▲ Show 20 Lines • Show All 91 Lines • ▼ Show 20 Lines
	; RV32-NEXT: vor.vv v8, v8, v12, v0.t			; RV32-NEXT: vor.vv v8, v8, v12, v0.t
	; RV32-NEXT: vsrl.vi v12, v8, 8, v0.t			; RV32-NEXT: vsrl.vi v12, v8, 8, v0.t
	; RV32-NEXT: vor.vv v8, v8, v12, v0.t			; RV32-NEXT: vor.vv v8, v8, v12, v0.t
	; RV32-NEXT: vsrl.vi v12, v8, 16, v0.t			; RV32-NEXT: vsrl.vi v12, v8, 16, v0.t
	; RV32-NEXT: vor.vv v8, v8, v12, v0.t			; RV32-NEXT: vor.vv v8, v8, v12, v0.t
	; RV32-NEXT: li a1, 32			; RV32-NEXT: li a1, 32
	; RV32-NEXT: vsrl.vx v12, v8, a1, v0.t			; RV32-NEXT: vsrl.vx v12, v8, a1, v0.t
	; RV32-NEXT: vor.vv v8, v8, v12, v0.t			; RV32-NEXT: vor.vv v8, v8, v12, v0.t
	; RV32-NEXT: vsetivli zero, 16, e32, m4, ta, ma			; RV32-NEXT: vnot.v v8, v8, v0.t
	; RV32-NEXT: vmv.v.i v12, -1
	; RV32-NEXT: vsetvli zero, a0, e64, m4, ta, ma
	; RV32-NEXT: vxor.vv v8, v8, v12, v0.t
	; RV32-NEXT: vsrl.vi v12, v8, 1, v0.t			; RV32-NEXT: vsrl.vi v12, v8, 1, v0.t
	; RV32-NEXT: lui a1, 349525			; RV32-NEXT: lui a1, 349525
	; RV32-NEXT: addi a1, a1, 1365			; RV32-NEXT: addi a1, a1, 1365
	; RV32-NEXT: vsetivli zero, 16, e32, m4, ta, ma			; RV32-NEXT: vsetivli zero, 16, e32, m4, ta, ma
	; RV32-NEXT: vmv.v.x v16, a1			; RV32-NEXT: vmv.v.x v16, a1
	; RV32-NEXT: vsetvli zero, a0, e64, m4, ta, ma			; RV32-NEXT: vsetvli zero, a0, e64, m4, ta, ma
	; RV32-NEXT: vand.vv v12, v12, v16, v0.t			; RV32-NEXT: vand.vv v12, v12, v16, v0.t
	; RV32-NEXT: vsub.vv v8, v8, v12, v0.t			; RV32-NEXT: vsub.vv v8, v8, v12, v0.t
	▲ Show 20 Lines • Show All 87 Lines • ▼ Show 20 Lines
	; RV32-NEXT: vor.vv v8, v8, v12			; RV32-NEXT: vor.vv v8, v8, v12
	; RV32-NEXT: vsrl.vi v12, v8, 8			; RV32-NEXT: vsrl.vi v12, v8, 8
	; RV32-NEXT: vor.vv v8, v8, v12			; RV32-NEXT: vor.vv v8, v8, v12
	; RV32-NEXT: vsrl.vi v12, v8, 16			; RV32-NEXT: vsrl.vi v12, v8, 16
	; RV32-NEXT: vor.vv v8, v8, v12			; RV32-NEXT: vor.vv v8, v8, v12
	; RV32-NEXT: li a1, 32			; RV32-NEXT: li a1, 32
	; RV32-NEXT: vsrl.vx v12, v8, a1			; RV32-NEXT: vsrl.vx v12, v8, a1
	; RV32-NEXT: vor.vv v8, v8, v12			; RV32-NEXT: vor.vv v8, v8, v12
	; RV32-NEXT: vsetivli zero, 16, e32, m4, ta, ma			; RV32-NEXT: vnot.v v8, v8
	; RV32-NEXT: vmv.v.i v12, -1
	; RV32-NEXT: vsetvli zero, a0, e64, m4, ta, ma
	; RV32-NEXT: vxor.vv v8, v8, v12
	; RV32-NEXT: vsrl.vi v12, v8, 1			; RV32-NEXT: vsrl.vi v12, v8, 1
	; RV32-NEXT: lui a1, 349525			; RV32-NEXT: lui a1, 349525
	; RV32-NEXT: addi a1, a1, 1365			; RV32-NEXT: addi a1, a1, 1365
	; RV32-NEXT: vsetivli zero, 16, e32, m4, ta, ma			; RV32-NEXT: vsetivli zero, 16, e32, m4, ta, ma
	; RV32-NEXT: vmv.v.x v16, a1			; RV32-NEXT: vmv.v.x v16, a1
	; RV32-NEXT: vsetvli zero, a0, e64, m4, ta, ma			; RV32-NEXT: vsetvli zero, a0, e64, m4, ta, ma
	; RV32-NEXT: vand.vv v12, v12, v16			; RV32-NEXT: vand.vv v12, v12, v16
	; RV32-NEXT: vsub.vv v8, v8, v12			; RV32-NEXT: vsub.vv v8, v8, v12
	▲ Show 20 Lines • Show All 91 Lines • ▼ Show 20 Lines
	; RV32-NEXT: vor.vv v8, v8, v16, v0.t			; RV32-NEXT: vor.vv v8, v8, v16, v0.t
	; RV32-NEXT: vsrl.vi v16, v8, 8, v0.t			; RV32-NEXT: vsrl.vi v16, v8, 8, v0.t
	; RV32-NEXT: vor.vv v8, v8, v16, v0.t			; RV32-NEXT: vor.vv v8, v8, v16, v0.t
	; RV32-NEXT: vsrl.vi v16, v8, 16, v0.t			; RV32-NEXT: vsrl.vi v16, v8, 16, v0.t
	; RV32-NEXT: vor.vv v8, v8, v16, v0.t			; RV32-NEXT: vor.vv v8, v8, v16, v0.t
	; RV32-NEXT: li a1, 32			; RV32-NEXT: li a1, 32
	; RV32-NEXT: vsrl.vx v16, v8, a1, v0.t			; RV32-NEXT: vsrl.vx v16, v8, a1, v0.t
	; RV32-NEXT: vor.vv v8, v8, v16, v0.t			; RV32-NEXT: vor.vv v8, v8, v16, v0.t
	; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma			; RV32-NEXT: vnot.v v8, v8, v0.t
	; RV32-NEXT: vmv.v.i v16, -1
	; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma
	; RV32-NEXT: vxor.vv v8, v8, v16, v0.t
	; RV32-NEXT: vsrl.vi v16, v8, 1, v0.t			; RV32-NEXT: vsrl.vi v16, v8, 1, v0.t
	; RV32-NEXT: lui a2, 349525			; RV32-NEXT: lui a2, 349525
	; RV32-NEXT: addi a2, a2, 1365			; RV32-NEXT: addi a2, a2, 1365
	; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma			; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma
	; RV32-NEXT: vmv.v.x v24, a2			; RV32-NEXT: vmv.v.x v24, a2
	; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma			; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma
	; RV32-NEXT: vand.vv v16, v16, v24, v0.t			; RV32-NEXT: vand.vv v16, v16, v24, v0.t
	; RV32-NEXT: vsub.vv v8, v8, v16, v0.t			; RV32-NEXT: vsub.vv v8, v8, v16, v0.t
	▲ Show 20 Lines • Show All 87 Lines • ▼ Show 20 Lines
	; RV32-NEXT: vor.vv v8, v8, v16			; RV32-NEXT: vor.vv v8, v8, v16
	; RV32-NEXT: vsrl.vi v16, v8, 8			; RV32-NEXT: vsrl.vi v16, v8, 8
	; RV32-NEXT: vor.vv v8, v8, v16			; RV32-NEXT: vor.vv v8, v8, v16
	; RV32-NEXT: vsrl.vi v16, v8, 16			; RV32-NEXT: vsrl.vi v16, v8, 16
	; RV32-NEXT: vor.vv v8, v8, v16			; RV32-NEXT: vor.vv v8, v8, v16
	; RV32-NEXT: li a1, 32			; RV32-NEXT: li a1, 32
	; RV32-NEXT: vsrl.vx v16, v8, a1			; RV32-NEXT: vsrl.vx v16, v8, a1
	; RV32-NEXT: vor.vv v8, v8, v16			; RV32-NEXT: vor.vv v8, v8, v16
	; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma			; RV32-NEXT: vnot.v v8, v8
	; RV32-NEXT: vmv.v.i v16, -1
	; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma
	; RV32-NEXT: vxor.vv v8, v8, v16
	; RV32-NEXT: vsrl.vi v16, v8, 1			; RV32-NEXT: vsrl.vi v16, v8, 1
	; RV32-NEXT: lui a2, 349525			; RV32-NEXT: lui a2, 349525
	; RV32-NEXT: addi a2, a2, 1365			; RV32-NEXT: addi a2, a2, 1365
	; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma			; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma
	; RV32-NEXT: vmv.v.x v24, a2			; RV32-NEXT: vmv.v.x v24, a2
	; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma			; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma
	; RV32-NEXT: vand.vv v16, v16, v24			; RV32-NEXT: vand.vv v16, v16, v24
	; RV32-NEXT: vsub.vv v8, v8, v16			; RV32-NEXT: vsub.vv v8, v8, v16
	▲ Show 20 Lines • Show All 91 Lines • ▼ Show 20 Lines
	; RV32-NEXT: vor.vv v8, v8, v16, v0.t			; RV32-NEXT: vor.vv v8, v8, v16, v0.t
	; RV32-NEXT: vsrl.vi v16, v8, 8, v0.t			; RV32-NEXT: vsrl.vi v16, v8, 8, v0.t
	; RV32-NEXT: vor.vv v8, v8, v16, v0.t			; RV32-NEXT: vor.vv v8, v8, v16, v0.t
	; RV32-NEXT: vsrl.vi v16, v8, 16, v0.t			; RV32-NEXT: vsrl.vi v16, v8, 16, v0.t
	; RV32-NEXT: vor.vv v8, v8, v16, v0.t			; RV32-NEXT: vor.vv v8, v8, v16, v0.t
	; RV32-NEXT: li a1, 32			; RV32-NEXT: li a1, 32
	; RV32-NEXT: vsrl.vx v16, v8, a1, v0.t			; RV32-NEXT: vsrl.vx v16, v8, a1, v0.t
	; RV32-NEXT: vor.vv v8, v8, v16, v0.t			; RV32-NEXT: vor.vv v8, v8, v16, v0.t
	; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma			; RV32-NEXT: vnot.v v8, v8, v0.t
	; RV32-NEXT: vmv.v.i v16, -1
	; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma
	; RV32-NEXT: vxor.vv v8, v8, v16, v0.t
	; RV32-NEXT: vsrl.vi v16, v8, 1, v0.t			; RV32-NEXT: vsrl.vi v16, v8, 1, v0.t
	; RV32-NEXT: lui a2, 349525			; RV32-NEXT: lui a2, 349525
	; RV32-NEXT: addi a2, a2, 1365			; RV32-NEXT: addi a2, a2, 1365
	; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma			; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma
	; RV32-NEXT: vmv.v.x v24, a2			; RV32-NEXT: vmv.v.x v24, a2
	; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma			; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma
	; RV32-NEXT: vand.vv v16, v16, v24, v0.t			; RV32-NEXT: vand.vv v16, v16, v24, v0.t
	; RV32-NEXT: vsub.vv v8, v8, v16, v0.t			; RV32-NEXT: vsub.vv v8, v8, v16, v0.t
	▲ Show 20 Lines • Show All 87 Lines • ▼ Show 20 Lines
	; RV32-NEXT: vor.vv v8, v8, v16			; RV32-NEXT: vor.vv v8, v8, v16
	; RV32-NEXT: vsrl.vi v16, v8, 8			; RV32-NEXT: vsrl.vi v16, v8, 8
	; RV32-NEXT: vor.vv v8, v8, v16			; RV32-NEXT: vor.vv v8, v8, v16
	; RV32-NEXT: vsrl.vi v16, v8, 16			; RV32-NEXT: vsrl.vi v16, v8, 16
	; RV32-NEXT: vor.vv v8, v8, v16			; RV32-NEXT: vor.vv v8, v8, v16
	; RV32-NEXT: li a1, 32			; RV32-NEXT: li a1, 32
	; RV32-NEXT: vsrl.vx v16, v8, a1			; RV32-NEXT: vsrl.vx v16, v8, a1
	; RV32-NEXT: vor.vv v8, v8, v16			; RV32-NEXT: vor.vv v8, v8, v16
	; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma			; RV32-NEXT: vnot.v v8, v8
	; RV32-NEXT: vmv.v.i v16, -1
	; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma
	; RV32-NEXT: vxor.vv v8, v8, v16
	; RV32-NEXT: vsrl.vi v16, v8, 1			; RV32-NEXT: vsrl.vi v16, v8, 1
	; RV32-NEXT: lui a2, 349525			; RV32-NEXT: lui a2, 349525
	; RV32-NEXT: addi a2, a2, 1365			; RV32-NEXT: addi a2, a2, 1365
	; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma			; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma
	; RV32-NEXT: vmv.v.x v24, a2			; RV32-NEXT: vmv.v.x v24, a2
	; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma			; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma
	; RV32-NEXT: vand.vv v16, v16, v24			; RV32-NEXT: vand.vv v16, v16, v24
	; RV32-NEXT: vsub.vv v8, v8, v16			; RV32-NEXT: vsub.vv v8, v8, v16
	▲ Show 20 Lines • Show All 111 Lines • ▼ Show 20 Lines
	; RV32-NEXT: vor.vv v8, v8, v16, v0.t			; RV32-NEXT: vor.vv v8, v8, v16, v0.t
	; RV32-NEXT: vsrl.vi v16, v8, 8, v0.t			; RV32-NEXT: vsrl.vi v16, v8, 8, v0.t
	; RV32-NEXT: vor.vv v8, v8, v16, v0.t			; RV32-NEXT: vor.vv v8, v8, v16, v0.t
	; RV32-NEXT: vsrl.vi v16, v8, 16, v0.t			; RV32-NEXT: vsrl.vi v16, v8, 16, v0.t
	; RV32-NEXT: vor.vv v8, v8, v16, v0.t			; RV32-NEXT: vor.vv v8, v8, v16, v0.t
	; RV32-NEXT: li a1, 32			; RV32-NEXT: li a1, 32
	; RV32-NEXT: vsrl.vx v16, v8, a1, v0.t			; RV32-NEXT: vsrl.vx v16, v8, a1, v0.t
	; RV32-NEXT: vor.vv v8, v8, v16, v0.t			; RV32-NEXT: vor.vv v8, v8, v16, v0.t
	; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma			; RV32-NEXT: vnot.v v8, v8, v0.t
	; RV32-NEXT: vmv.v.i v16, -1
	; RV32-NEXT: csrr a3, vlenb			; RV32-NEXT: csrr a3, vlenb
	; RV32-NEXT: li a4, 24			; RV32-NEXT: li a4, 40
	; RV32-NEXT: mul a3, a3, a4			; RV32-NEXT: mul a3, a3, a4
	; RV32-NEXT: add a3, sp, a3			; RV32-NEXT: add a3, sp, a3
	; RV32-NEXT: addi a3, a3, 16			; RV32-NEXT: addi a3, a3, 16
	; RV32-NEXT: vs8r.v v16, (a3) # Unknown-size Folded Spill			; RV32-NEXT: vs8r.v v8, (a3) # Unknown-size Folded Spill
	; RV32-NEXT: vsetvli zero, a2, e64, m8, ta, ma			; RV32-NEXT: vsrl.vi v8, v8, 1, v0.t
	; RV32-NEXT: vxor.vv v8, v8, v16, v0.t
	; RV32-NEXT: csrr a3, vlenb			; RV32-NEXT: csrr a3, vlenb
	; RV32-NEXT: li a4, 40			; RV32-NEXT: li a4, 48
	; RV32-NEXT: mul a3, a3, a4			; RV32-NEXT: mul a3, a3, a4
	; RV32-NEXT: add a3, sp, a3			; RV32-NEXT: add a3, sp, a3
	; RV32-NEXT: addi a3, a3, 16			; RV32-NEXT: addi a3, a3, 16
	; RV32-NEXT: vs8r.v v8, (a3) # Unknown-size Folded Spill			; RV32-NEXT: vs8r.v v8, (a3) # Unknown-size Folded Spill
	; RV32-NEXT: lui a3, 349525			; RV32-NEXT: lui a3, 349525
	; RV32-NEXT: addi a3, a3, 1365			; RV32-NEXT: addi a3, a3, 1365
	; RV32-NEXT: vsrl.vi v8, v8, 1, v0.t
	; RV32-NEXT: csrr a4, vlenb
	; RV32-NEXT: li a5, 48
	; RV32-NEXT: mul a4, a4, a5
	; RV32-NEXT: add a4, sp, a4
	; RV32-NEXT: addi a4, a4, 16
	; RV32-NEXT: vs8r.v v8, (a4) # Unknown-size Folded Spill
	; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma			; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma
	; RV32-NEXT: vmv.v.x v8, a3			; RV32-NEXT: vmv.v.x v8, a3
	; RV32-NEXT: csrr a3, vlenb			; RV32-NEXT: csrr a3, vlenb
	; RV32-NEXT: slli a3, a3, 4			; RV32-NEXT: li a4, 24
				; RV32-NEXT: mul a3, a3, a4
	; RV32-NEXT: add a3, sp, a3			; RV32-NEXT: add a3, sp, a3
	; RV32-NEXT: addi a3, a3, 16			; RV32-NEXT: addi a3, a3, 16
	; RV32-NEXT: vs8r.v v8, (a3) # Unknown-size Folded Spill			; RV32-NEXT: vs8r.v v8, (a3) # Unknown-size Folded Spill
	; RV32-NEXT: vsetvli zero, a2, e64, m8, ta, ma			; RV32-NEXT: vsetvli zero, a2, e64, m8, ta, ma
	; RV32-NEXT: csrr a3, vlenb			; RV32-NEXT: csrr a3, vlenb
	; RV32-NEXT: li a4, 48			; RV32-NEXT: li a4, 48
	; RV32-NEXT: mul a3, a3, a4			; RV32-NEXT: mul a3, a3, a4
	; RV32-NEXT: add a3, sp, a3			; RV32-NEXT: add a3, sp, a3
	Show All 27 Lines
	; RV32-NEXT: csrr a3, vlenb			; RV32-NEXT: csrr a3, vlenb
	; RV32-NEXT: li a4, 40			; RV32-NEXT: li a4, 40
	; RV32-NEXT: mul a3, a3, a4			; RV32-NEXT: mul a3, a3, a4
	; RV32-NEXT: add a3, sp, a3			; RV32-NEXT: add a3, sp, a3
	; RV32-NEXT: addi a3, a3, 16			; RV32-NEXT: addi a3, a3, 16
	; RV32-NEXT: vl8r.v v16, (a3) # Unknown-size Folded Reload			; RV32-NEXT: vl8r.v v16, (a3) # Unknown-size Folded Reload
	; RV32-NEXT: vand.vv v16, v16, v8, v0.t			; RV32-NEXT: vand.vv v16, v16, v8, v0.t
	; RV32-NEXT: csrr a3, vlenb			; RV32-NEXT: csrr a3, vlenb
	; RV32-NEXT: slli a3, a3, 3			; RV32-NEXT: slli a3, a3, 4
	; RV32-NEXT: add a3, sp, a3			; RV32-NEXT: add a3, sp, a3
	; RV32-NEXT: addi a3, a3, 16			; RV32-NEXT: addi a3, a3, 16
	; RV32-NEXT: vs8r.v v16, (a3) # Unknown-size Folded Spill			; RV32-NEXT: vs8r.v v16, (a3) # Unknown-size Folded Spill
	; RV32-NEXT: csrr a3, vlenb			; RV32-NEXT: csrr a3, vlenb
	; RV32-NEXT: li a4, 40			; RV32-NEXT: li a4, 40
	; RV32-NEXT: mul a3, a3, a4			; RV32-NEXT: mul a3, a3, a4
	; RV32-NEXT: add a3, sp, a3			; RV32-NEXT: add a3, sp, a3
	; RV32-NEXT: addi a3, a3, 16			; RV32-NEXT: addi a3, a3, 16
	; RV32-NEXT: vl8r.v v16, (a3) # Unknown-size Folded Reload			; RV32-NEXT: vl8r.v v16, (a3) # Unknown-size Folded Reload
	; RV32-NEXT: vsrl.vi v16, v16, 2, v0.t			; RV32-NEXT: vsrl.vi v16, v16, 2, v0.t
	; RV32-NEXT: vand.vv v16, v16, v8, v0.t			; RV32-NEXT: vand.vv v16, v16, v8, v0.t
	; RV32-NEXT: csrr a3, vlenb			; RV32-NEXT: csrr a3, vlenb
	; RV32-NEXT: slli a3, a3, 3			; RV32-NEXT: slli a3, a3, 4
	; RV32-NEXT: add a3, sp, a3			; RV32-NEXT: add a3, sp, a3
	; RV32-NEXT: addi a3, a3, 16			; RV32-NEXT: addi a3, a3, 16
	; RV32-NEXT: vl8r.v v8, (a3) # Unknown-size Folded Reload			; RV32-NEXT: vl8r.v v8, (a3) # Unknown-size Folded Reload
	; RV32-NEXT: vadd.vv v8, v8, v16, v0.t			; RV32-NEXT: vadd.vv v8, v8, v16, v0.t
	; RV32-NEXT: vsrl.vi v16, v8, 4, v0.t			; RV32-NEXT: vsrl.vi v16, v8, 4, v0.t
	; RV32-NEXT: vadd.vv v16, v8, v16, v0.t			; RV32-NEXT: vadd.vv v16, v8, v16, v0.t
	; RV32-NEXT: lui a3, 61681			; RV32-NEXT: lui a3, 61681
	; RV32-NEXT: addi a3, a3, -241			; RV32-NEXT: addi a3, a3, -241
	; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma			; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma
	; RV32-NEXT: vmv.v.x v8, a3			; RV32-NEXT: vmv.v.x v8, a3
	; RV32-NEXT: csrr a3, vlenb			; RV32-NEXT: csrr a3, vlenb
	; RV32-NEXT: li a4, 40			; RV32-NEXT: li a4, 40
	; RV32-NEXT: mul a3, a3, a4			; RV32-NEXT: mul a3, a3, a4
	; RV32-NEXT: add a3, sp, a3			; RV32-NEXT: add a3, sp, a3
	; RV32-NEXT: addi a3, a3, 16			; RV32-NEXT: addi a3, a3, 16
	; RV32-NEXT: vs8r.v v8, (a3) # Unknown-size Folded Spill			; RV32-NEXT: vs8r.v v8, (a3) # Unknown-size Folded Spill
	; RV32-NEXT: vsetvli zero, a2, e64, m8, ta, ma			; RV32-NEXT: vsetvli zero, a2, e64, m8, ta, ma
	; RV32-NEXT: vand.vv v8, v16, v8, v0.t			; RV32-NEXT: vand.vv v8, v16, v8, v0.t
	; RV32-NEXT: lui a3, 4112			; RV32-NEXT: lui a3, 4112
	; RV32-NEXT: addi a3, a3, 257			; RV32-NEXT: addi a3, a3, 257
	; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma			; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma
	; RV32-NEXT: vmv.v.x v16, a3			; RV32-NEXT: vmv.v.x v16, a3
	; RV32-NEXT: addi a3, sp, 16			; RV32-NEXT: csrr a3, vlenb
				; RV32-NEXT: slli a3, a3, 3
				; RV32-NEXT: add a3, sp, a3
				; RV32-NEXT: addi a3, a3, 16
	; RV32-NEXT: vs8r.v v16, (a3) # Unknown-size Folded Spill			; RV32-NEXT: vs8r.v v16, (a3) # Unknown-size Folded Spill
	; RV32-NEXT: vsetvli zero, a2, e64, m8, ta, ma			; RV32-NEXT: vsetvli zero, a2, e64, m8, ta, ma
	; RV32-NEXT: vmul.vv v8, v8, v16, v0.t			; RV32-NEXT: vmul.vv v8, v8, v16, v0.t
	; RV32-NEXT: li a2, 56			; RV32-NEXT: li a2, 56
	; RV32-NEXT: vsrl.vx v8, v8, a2, v0.t			; RV32-NEXT: vsrl.vx v8, v8, a2, v0.t
	; RV32-NEXT: csrr a3, vlenb			; RV32-NEXT: csrr a3, vlenb
	; RV32-NEXT: slli a3, a3, 3			; RV32-NEXT: slli a3, a3, 4
	; RV32-NEXT: add a3, sp, a3			; RV32-NEXT: add a3, sp, a3
	; RV32-NEXT: addi a3, a3, 16			; RV32-NEXT: addi a3, a3, 16
	; RV32-NEXT: vs8r.v v8, (a3) # Unknown-size Folded Spill			; RV32-NEXT: vs8r.v v8, (a3) # Unknown-size Folded Spill
	; RV32-NEXT: addi a3, a0, -16			; RV32-NEXT: addi a3, a0, -16
	; RV32-NEXT: sltu a0, a0, a3			; RV32-NEXT: sltu a0, a0, a3
	; RV32-NEXT: addi a0, a0, -1			; RV32-NEXT: addi a0, a0, -1
	; RV32-NEXT: and a0, a0, a3			; RV32-NEXT: and a0, a0, a3
	; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma			; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma
	Show All 10 Lines
	; RV32-NEXT: vsrl.vi v16, v8, 4, v0.t			; RV32-NEXT: vsrl.vi v16, v8, 4, v0.t
	; RV32-NEXT: vor.vv v8, v8, v16, v0.t			; RV32-NEXT: vor.vv v8, v8, v16, v0.t
	; RV32-NEXT: vsrl.vi v16, v8, 8, v0.t			; RV32-NEXT: vsrl.vi v16, v8, 8, v0.t
	; RV32-NEXT: vor.vv v8, v8, v16, v0.t			; RV32-NEXT: vor.vv v8, v8, v16, v0.t
	; RV32-NEXT: vsrl.vi v16, v8, 16, v0.t			; RV32-NEXT: vsrl.vi v16, v8, 16, v0.t
	; RV32-NEXT: vor.vv v8, v8, v16, v0.t			; RV32-NEXT: vor.vv v8, v8, v16, v0.t
	; RV32-NEXT: vsrl.vx v16, v8, a1, v0.t			; RV32-NEXT: vsrl.vx v16, v8, a1, v0.t
	; RV32-NEXT: vor.vv v8, v8, v16, v0.t			; RV32-NEXT: vor.vv v8, v8, v16, v0.t
	; RV32-NEXT: csrr a0, vlenb			; RV32-NEXT: vnot.v v8, v8, v0.t
	; RV32-NEXT: li a1, 24			; RV32-NEXT: addi a0, sp, 16
	; RV32-NEXT: mul a0, a0, a1
	; RV32-NEXT: add a0, sp, a0
	; RV32-NEXT: addi a0, a0, 16
	; RV32-NEXT: vl8r.v v16, (a0) # Unknown-size Folded Reload
	; RV32-NEXT: vxor.vv v8, v8, v16, v0.t
	; RV32-NEXT: csrr a0, vlenb
	; RV32-NEXT: li a1, 24
	; RV32-NEXT: mul a0, a0, a1
	; RV32-NEXT: add a0, sp, a0
	; RV32-NEXT: addi a0, a0, 16
	; RV32-NEXT: vs8r.v v8, (a0) # Unknown-size Folded Spill			; RV32-NEXT: vs8r.v v8, (a0) # Unknown-size Folded Spill
	; RV32-NEXT: vsrl.vi v16, v8, 1, v0.t			; RV32-NEXT: vsrl.vi v16, v8, 1, v0.t
	; RV32-NEXT: csrr a0, vlenb			; RV32-NEXT: csrr a0, vlenb
	; RV32-NEXT: slli a0, a0, 5			; RV32-NEXT: slli a0, a0, 5
	; RV32-NEXT: add a0, sp, a0			; RV32-NEXT: add a0, sp, a0
	; RV32-NEXT: addi a0, a0, 16			; RV32-NEXT: addi a0, a0, 16
	; RV32-NEXT: vs8r.v v16, (a0) # Unknown-size Folded Spill			; RV32-NEXT: vs8r.v v16, (a0) # Unknown-size Folded Spill
	; RV32-NEXT: csrr a0, vlenb			; RV32-NEXT: csrr a0, vlenb
	; RV32-NEXT: slli a0, a0, 4			; RV32-NEXT: li a1, 24
				; RV32-NEXT: mul a0, a0, a1
	; RV32-NEXT: add a0, sp, a0			; RV32-NEXT: add a0, sp, a0
	; RV32-NEXT: addi a0, a0, 16			; RV32-NEXT: addi a0, a0, 16
	; RV32-NEXT: vl8r.v v16, (a0) # Unknown-size Folded Reload			; RV32-NEXT: vl8r.v v16, (a0) # Unknown-size Folded Reload
	; RV32-NEXT: csrr a0, vlenb			; RV32-NEXT: csrr a0, vlenb
	; RV32-NEXT: slli a0, a0, 5			; RV32-NEXT: slli a0, a0, 5
	; RV32-NEXT: add a0, sp, a0			; RV32-NEXT: add a0, sp, a0
	; RV32-NEXT: addi a0, a0, 16			; RV32-NEXT: addi a0, a0, 16
	; RV32-NEXT: vl8r.v v8, (a0) # Unknown-size Folded Reload			; RV32-NEXT: vl8r.v v8, (a0) # Unknown-size Folded Reload
	; RV32-NEXT: vand.vv v16, v8, v16, v0.t			; RV32-NEXT: vand.vv v16, v8, v16, v0.t
	; RV32-NEXT: csrr a0, vlenb			; RV32-NEXT: addi a0, sp, 16
	; RV32-NEXT: li a1, 24
	; RV32-NEXT: mul a0, a0, a1
	; RV32-NEXT: add a0, sp, a0
	; RV32-NEXT: addi a0, a0, 16
	; RV32-NEXT: vl8r.v v8, (a0) # Unknown-size Folded Reload			; RV32-NEXT: vl8r.v v8, (a0) # Unknown-size Folded Reload
	; RV32-NEXT: vsub.vv v8, v8, v16, v0.t			; RV32-NEXT: vsub.vv v8, v8, v16, v0.t
	; RV32-NEXT: csrr a0, vlenb			; RV32-NEXT: csrr a0, vlenb
	; RV32-NEXT: li a1, 48			; RV32-NEXT: li a1, 48
	; RV32-NEXT: mul a0, a0, a1			; RV32-NEXT: mul a0, a0, a1
	; RV32-NEXT: add a0, sp, a0			; RV32-NEXT: add a0, sp, a0
	; RV32-NEXT: addi a0, a0, 16			; RV32-NEXT: addi a0, a0, 16
	; RV32-NEXT: vl8r.v v16, (a0) # Unknown-size Folded Reload			; RV32-NEXT: vl8r.v v16, (a0) # Unknown-size Folded Reload
	Show All 21 Lines
	; RV32-NEXT: vadd.vv v8, v8, v16, v0.t			; RV32-NEXT: vadd.vv v8, v8, v16, v0.t
	; RV32-NEXT: csrr a0, vlenb			; RV32-NEXT: csrr a0, vlenb
	; RV32-NEXT: li a1, 40			; RV32-NEXT: li a1, 40
	; RV32-NEXT: mul a0, a0, a1			; RV32-NEXT: mul a0, a0, a1
	; RV32-NEXT: add a0, sp, a0			; RV32-NEXT: add a0, sp, a0
	; RV32-NEXT: addi a0, a0, 16			; RV32-NEXT: addi a0, a0, 16
	; RV32-NEXT: vl8r.v v16, (a0) # Unknown-size Folded Reload			; RV32-NEXT: vl8r.v v16, (a0) # Unknown-size Folded Reload
	; RV32-NEXT: vand.vv v8, v8, v16, v0.t			; RV32-NEXT: vand.vv v8, v8, v16, v0.t
	; RV32-NEXT: addi a0, sp, 16			; RV32-NEXT: csrr a0, vlenb
				; RV32-NEXT: slli a0, a0, 3
				; RV32-NEXT: add a0, sp, a0
				; RV32-NEXT: addi a0, a0, 16
	; RV32-NEXT: vl8r.v v16, (a0) # Unknown-size Folded Reload			; RV32-NEXT: vl8r.v v16, (a0) # Unknown-size Folded Reload
	; RV32-NEXT: vmul.vv v8, v8, v16, v0.t			; RV32-NEXT: vmul.vv v8, v8, v16, v0.t
	; RV32-NEXT: vsrl.vx v16, v8, a2, v0.t			; RV32-NEXT: vsrl.vx v16, v8, a2, v0.t
	; RV32-NEXT: csrr a0, vlenb			; RV32-NEXT: csrr a0, vlenb
	; RV32-NEXT: slli a0, a0, 3			; RV32-NEXT: slli a0, a0, 4
	; RV32-NEXT: add a0, sp, a0			; RV32-NEXT: add a0, sp, a0
	; RV32-NEXT: addi a0, a0, 16			; RV32-NEXT: addi a0, a0, 16
	; RV32-NEXT: vl8r.v v8, (a0) # Unknown-size Folded Reload			; RV32-NEXT: vl8r.v v8, (a0) # Unknown-size Folded Reload
	; RV32-NEXT: csrr a0, vlenb			; RV32-NEXT: csrr a0, vlenb
	; RV32-NEXT: li a1, 56			; RV32-NEXT: li a1, 56
	; RV32-NEXT: mul a0, a0, a1			; RV32-NEXT: mul a0, a0, a1
	; RV32-NEXT: add sp, sp, a0			; RV32-NEXT: add sp, sp, a0
	; RV32-NEXT: addi sp, sp, 16			; RV32-NEXT: addi sp, sp, 16
	▲ Show 20 Lines • Show All 111 Lines • ▼ Show 20 Lines
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%v = call <32 x i64> @llvm.vp.ctlz.v32i64(<32 x i64> %va, i1 false, <32 x i1> %m, i32 %evl)			%v = call <32 x i64> @llvm.vp.ctlz.v32i64(<32 x i64> %va, i1 false, <32 x i1> %m, i32 %evl)
	ret <32 x i64> %v			ret <32 x i64> %v
	}			}

	define <32 x i64> @vp_ctlz_v32i64_unmasked(<32 x i64> %va, i32 zeroext %evl) {			define <32 x i64> @vp_ctlz_v32i64_unmasked(<32 x i64> %va, i32 zeroext %evl) {
	; RV32-LABEL: vp_ctlz_v32i64_unmasked:			; RV32-LABEL: vp_ctlz_v32i64_unmasked:
	; RV32: # %bb.0:			; RV32: # %bb.0:
	; RV32-NEXT: li a1, 16
	; RV32-NEXT: vmv8r.v v0, v16
	; RV32-NEXT: mv a2, a0
	; RV32-NEXT: bltu a0, a1, .LBB35_2
	; RV32-NEXT: # %bb.1:
	; RV32-NEXT: li a2, 16			; RV32-NEXT: li a2, 16
				; RV32-NEXT: vmv8r.v v24, v16
				; RV32-NEXT: mv a1, a0
				; RV32-NEXT: bltu a0, a2, .LBB35_2
				; RV32-NEXT: # %bb.1:
				; RV32-NEXT: li a1, 16
	; RV32-NEXT: .LBB35_2:			; RV32-NEXT: .LBB35_2:
	; RV32-NEXT: addi sp, sp, -16			; RV32-NEXT: addi sp, sp, -16
	; RV32-NEXT: .cfi_def_cfa_offset 16			; RV32-NEXT: .cfi_def_cfa_offset 16
	; RV32-NEXT: csrr a1, vlenb			; RV32-NEXT: csrr a2, vlenb
	; RV32-NEXT: li a3, 40			; RV32-NEXT: slli a2, a2, 5
	; RV32-NEXT: mul a1, a1, a3			; RV32-NEXT: sub sp, sp, a2
	; RV32-NEXT: sub sp, sp, a1			; RV32-NEXT: .cfi_escape 0x0f, 0x0d, 0x72, 0x00, 0x11, 0x10, 0x22, 0x11, 0x20, 0x92, 0xa2, 0x38, 0x00, 0x1e, 0x22 # sp + 16 + 32 * vlenb
	; RV32-NEXT: .cfi_escape 0x0f, 0x0d, 0x72, 0x00, 0x11, 0x10, 0x22, 0x11, 0x28, 0x92, 0xa2, 0x38, 0x00, 0x1e, 0x22 # sp + 16 + 40 * vlenb			; RV32-NEXT: vsetvli zero, a1, e64, m8, ta, ma
	; RV32-NEXT: vsetvli zero, a2, e64, m8, ta, ma
	; RV32-NEXT: vsrl.vi v16, v8, 1			; RV32-NEXT: vsrl.vi v16, v8, 1
	; RV32-NEXT: vor.vv v8, v8, v16			; RV32-NEXT: vor.vv v8, v8, v16
	; RV32-NEXT: vsrl.vi v16, v8, 2			; RV32-NEXT: vsrl.vi v16, v8, 2
	; RV32-NEXT: vor.vv v8, v8, v16			; RV32-NEXT: vor.vv v8, v8, v16
	; RV32-NEXT: vsrl.vi v16, v8, 4			; RV32-NEXT: vsrl.vi v16, v8, 4
	; RV32-NEXT: vor.vv v8, v8, v16			; RV32-NEXT: vor.vv v8, v8, v16
	; RV32-NEXT: vsrl.vi v16, v8, 8			; RV32-NEXT: vsrl.vi v16, v8, 8
	; RV32-NEXT: vor.vv v8, v8, v16			; RV32-NEXT: vor.vv v8, v8, v16
	; RV32-NEXT: vsrl.vi v16, v8, 16			; RV32-NEXT: vsrl.vi v16, v8, 16
	; RV32-NEXT: vor.vv v8, v8, v16			; RV32-NEXT: vor.vv v8, v8, v16
	; RV32-NEXT: li a1, 32			; RV32-NEXT: li a2, 32
	; RV32-NEXT: vsrl.vx v16, v8, a1			; RV32-NEXT: vsrl.vx v16, v8, a2
	; RV32-NEXT: vor.vv v8, v8, v16			; RV32-NEXT: vor.vv v8, v8, v16
	; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma			; RV32-NEXT: vnot.v v8, v8
	; RV32-NEXT: vmv.v.i v16, -1
	; RV32-NEXT: csrr a3, vlenb
	; RV32-NEXT: slli a3, a3, 5
	; RV32-NEXT: add a3, sp, a3
	; RV32-NEXT: addi a3, a3, 16
	; RV32-NEXT: vs8r.v v16, (a3) # Unknown-size Folded Spill
	; RV32-NEXT: vsetvli zero, a2, e64, m8, ta, ma
	; RV32-NEXT: vxor.vv v8, v8, v16
	; RV32-NEXT: vsrl.vi v16, v8, 1			; RV32-NEXT: vsrl.vi v16, v8, 1
	; RV32-NEXT: lui a3, 349525			; RV32-NEXT: lui a3, 349525
	; RV32-NEXT: addi a3, a3, 1365			; RV32-NEXT: addi a3, a3, 1365
	; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma			; RV32-NEXT: vsetvli zero, a2, e32, m8, ta, ma
	; RV32-NEXT: vmv.v.x v24, a3			; RV32-NEXT: vmv.v.x v0, a3
	; RV32-NEXT: csrr a3, vlenb			; RV32-NEXT: csrr a3, vlenb
	; RV32-NEXT: li a4, 24			; RV32-NEXT: li a4, 24
	; RV32-NEXT: mul a3, a3, a4			; RV32-NEXT: mul a3, a3, a4
	; RV32-NEXT: add a3, sp, a3			; RV32-NEXT: add a3, sp, a3
	; RV32-NEXT: addi a3, a3, 16			; RV32-NEXT: addi a3, a3, 16
	; RV32-NEXT: vs8r.v v24, (a3) # Unknown-size Folded Spill			; RV32-NEXT: vs8r.v v0, (a3) # Unknown-size Folded Spill
	; RV32-NEXT: vsetvli zero, a2, e64, m8, ta, ma			; RV32-NEXT: vsetvli zero, a1, e64, m8, ta, ma
	; RV32-NEXT: vand.vv v16, v16, v24			; RV32-NEXT: vand.vv v16, v16, v0
	; RV32-NEXT: vsub.vv v8, v8, v16			; RV32-NEXT: vsub.vv v8, v8, v16
	; RV32-NEXT: lui a3, 209715			; RV32-NEXT: lui a3, 209715
	; RV32-NEXT: addi a3, a3, 819			; RV32-NEXT: addi a3, a3, 819
	; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma			; RV32-NEXT: vsetvli zero, a2, e32, m8, ta, ma
	; RV32-NEXT: vmv.v.x v16, a3			; RV32-NEXT: vmv.v.x v0, a3
	; RV32-NEXT: vsetvli zero, a2, e64, m8, ta, ma			; RV32-NEXT: vsetvli zero, a1, e64, m8, ta, ma
	; RV32-NEXT: vand.vv v24, v8, v16			; RV32-NEXT: vand.vv v16, v8, v0
	; RV32-NEXT: vsrl.vi v8, v8, 2			; RV32-NEXT: vsrl.vi v8, v8, 2
	; RV32-NEXT: vand.vv v8, v8, v16			; RV32-NEXT: vand.vv v8, v8, v0
	; RV32-NEXT: vadd.vv v8, v24, v8			; RV32-NEXT: vadd.vv v8, v16, v8
	; RV32-NEXT: vsrl.vi v24, v8, 4			; RV32-NEXT: vsrl.vi v16, v8, 4
	; RV32-NEXT: vadd.vv v8, v8, v24			; RV32-NEXT: vadd.vv v8, v8, v16
	; RV32-NEXT: lui a3, 61681			; RV32-NEXT: lui a3, 61681
	; RV32-NEXT: addi a3, a3, -241			; RV32-NEXT: addi a3, a3, -241
	; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma			; RV32-NEXT: vsetvli zero, a2, e32, m8, ta, ma
	; RV32-NEXT: vmv.v.x v24, a3			; RV32-NEXT: vmv.v.x v16, a3
	; RV32-NEXT: csrr a3, vlenb			; RV32-NEXT: csrr a3, vlenb
	; RV32-NEXT: slli a3, a3, 4			; RV32-NEXT: slli a3, a3, 4
	; RV32-NEXT: add a3, sp, a3			; RV32-NEXT: add a3, sp, a3
	; RV32-NEXT: addi a3, a3, 16			; RV32-NEXT: addi a3, a3, 16
	; RV32-NEXT: vs8r.v v24, (a3) # Unknown-size Folded Spill			; RV32-NEXT: vs8r.v v16, (a3) # Unknown-size Folded Spill
	; RV32-NEXT: vsetvli zero, a2, e64, m8, ta, ma			; RV32-NEXT: vsetvli zero, a1, e64, m8, ta, ma
	; RV32-NEXT: vand.vv v8, v8, v24			; RV32-NEXT: vand.vv v8, v8, v16
	; RV32-NEXT: lui a3, 4112			; RV32-NEXT: lui a3, 4112
	; RV32-NEXT: addi a3, a3, 257			; RV32-NEXT: addi a3, a3, 257
	; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma			; RV32-NEXT: vsetvli zero, a2, e32, m8, ta, ma
	; RV32-NEXT: vmv.v.x v24, a3			; RV32-NEXT: vmv.v.x v16, a3
	; RV32-NEXT: addi a3, sp, 16			; RV32-NEXT: addi a3, sp, 16
	; RV32-NEXT: vs8r.v v24, (a3) # Unknown-size Folded Spill			; RV32-NEXT: vs8r.v v16, (a3) # Unknown-size Folded Spill
	; RV32-NEXT: vsetvli zero, a2, e64, m8, ta, ma			; RV32-NEXT: vsetvli zero, a1, e64, m8, ta, ma
	; RV32-NEXT: vmul.vv v8, v8, v24			; RV32-NEXT: vmul.vv v8, v8, v16
	; RV32-NEXT: li a2, 56			; RV32-NEXT: li a1, 56
	; RV32-NEXT: vsrl.vx v8, v8, a2			; RV32-NEXT: vsrl.vx v8, v8, a1
	; RV32-NEXT: csrr a3, vlenb			; RV32-NEXT: csrr a3, vlenb
	; RV32-NEXT: slli a3, a3, 3			; RV32-NEXT: slli a3, a3, 3
	; RV32-NEXT: add a3, sp, a3			; RV32-NEXT: add a3, sp, a3
	; RV32-NEXT: addi a3, a3, 16			; RV32-NEXT: addi a3, a3, 16
	; RV32-NEXT: vs8r.v v8, (a3) # Unknown-size Folded Spill			; RV32-NEXT: vs8r.v v8, (a3) # Unknown-size Folded Spill
	; RV32-NEXT: addi a3, a0, -16			; RV32-NEXT: addi a3, a0, -16
	; RV32-NEXT: sltu a0, a0, a3			; RV32-NEXT: sltu a0, a0, a3
	; RV32-NEXT: addi a0, a0, -1			; RV32-NEXT: addi a0, a0, -1
	; RV32-NEXT: and a0, a0, a3			; RV32-NEXT: and a0, a0, a3
	; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma			; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma
	; RV32-NEXT: vsrl.vi v8, v0, 1			; RV32-NEXT: vsrl.vi v8, v24, 1
	; RV32-NEXT: vor.vv v8, v0, v8			; RV32-NEXT: vor.vv v8, v24, v8
	; RV32-NEXT: vsrl.vi v0, v8, 2			; RV32-NEXT: vsrl.vi v24, v8, 2
	; RV32-NEXT: vor.vv v8, v8, v0			; RV32-NEXT: vor.vv v8, v8, v24
	; RV32-NEXT: vsrl.vi v0, v8, 4			; RV32-NEXT: vsrl.vi v24, v8, 4
	; RV32-NEXT: vor.vv v8, v8, v0			; RV32-NEXT: vor.vv v8, v8, v24
	; RV32-NEXT: vsrl.vi v0, v8, 8			; RV32-NEXT: vsrl.vi v24, v8, 8
	; RV32-NEXT: vor.vv v8, v8, v0			; RV32-NEXT: vor.vv v8, v8, v24
	; RV32-NEXT: vsrl.vi v0, v8, 16			; RV32-NEXT: vsrl.vi v24, v8, 16
	; RV32-NEXT: vor.vv v8, v8, v0			; RV32-NEXT: vor.vv v8, v8, v24
	; RV32-NEXT: vsrl.vx v0, v8, a1			; RV32-NEXT: vsrl.vx v24, v8, a2
	; RV32-NEXT: vor.vv v8, v8, v0			; RV32-NEXT: vor.vv v8, v8, v24
	; RV32-NEXT: csrr a0, vlenb			; RV32-NEXT: vnot.v v8, v8
	; RV32-NEXT: slli a0, a0, 5			; RV32-NEXT: vsrl.vi v24, v8, 1
	; RV32-NEXT: add a0, sp, a0
	; RV32-NEXT: addi a0, a0, 16
	; RV32-NEXT: vl8r.v v0, (a0) # Unknown-size Folded Reload
	; RV32-NEXT: vxor.vv v8, v8, v0
	; RV32-NEXT: vsrl.vi v0, v8, 1
	; RV32-NEXT: csrr a0, vlenb			; RV32-NEXT: csrr a0, vlenb
	; RV32-NEXT: li a1, 24			; RV32-NEXT: li a2, 24
	; RV32-NEXT: mul a0, a0, a1			; RV32-NEXT: mul a0, a0, a2
	; RV32-NEXT: add a0, sp, a0			; RV32-NEXT: add a0, sp, a0
	; RV32-NEXT: addi a0, a0, 16			; RV32-NEXT: addi a0, a0, 16
	; RV32-NEXT: vl8r.v v24, (a0) # Unknown-size Folded Reload			; RV32-NEXT: vl8r.v v16, (a0) # Unknown-size Folded Reload
	; RV32-NEXT: vand.vv v0, v0, v24			; RV32-NEXT: vand.vv v24, v24, v16
	; RV32-NEXT: vsub.vv v8, v8, v0			; RV32-NEXT: vsub.vv v8, v8, v24
	; RV32-NEXT: vand.vv v0, v8, v16			; RV32-NEXT: vand.vv v24, v8, v0
	; RV32-NEXT: vsrl.vi v8, v8, 2			; RV32-NEXT: vsrl.vi v8, v8, 2
	; RV32-NEXT: vand.vv v8, v8, v16			; RV32-NEXT: vand.vv v8, v8, v0
	; RV32-NEXT: vadd.vv v8, v0, v8			; RV32-NEXT: vadd.vv v8, v24, v8
	; RV32-NEXT: vsrl.vi v16, v8, 4			; RV32-NEXT: vsrl.vi v24, v8, 4
	; RV32-NEXT: vadd.vv v8, v8, v16			; RV32-NEXT: vadd.vv v8, v8, v24
	; RV32-NEXT: csrr a0, vlenb			; RV32-NEXT: csrr a0, vlenb
	; RV32-NEXT: slli a0, a0, 4			; RV32-NEXT: slli a0, a0, 4
	; RV32-NEXT: add a0, sp, a0			; RV32-NEXT: add a0, sp, a0
	; RV32-NEXT: addi a0, a0, 16			; RV32-NEXT: addi a0, a0, 16
	; RV32-NEXT: vl8r.v v16, (a0) # Unknown-size Folded Reload			; RV32-NEXT: vl8r.v v16, (a0) # Unknown-size Folded Reload
	; RV32-NEXT: vand.vv v8, v8, v16			; RV32-NEXT: vand.vv v8, v8, v16
	; RV32-NEXT: addi a0, sp, 16			; RV32-NEXT: addi a0, sp, 16
	; RV32-NEXT: vl8r.v v16, (a0) # Unknown-size Folded Reload			; RV32-NEXT: vl8r.v v16, (a0) # Unknown-size Folded Reload
	; RV32-NEXT: vmul.vv v8, v8, v16			; RV32-NEXT: vmul.vv v8, v8, v16
	; RV32-NEXT: vsrl.vx v16, v8, a2			; RV32-NEXT: vsrl.vx v16, v8, a1
	; RV32-NEXT: csrr a0, vlenb			; RV32-NEXT: csrr a0, vlenb
	; RV32-NEXT: slli a0, a0, 3			; RV32-NEXT: slli a0, a0, 3
	; RV32-NEXT: add a0, sp, a0			; RV32-NEXT: add a0, sp, a0
	; RV32-NEXT: addi a0, a0, 16			; RV32-NEXT: addi a0, a0, 16
	; RV32-NEXT: vl8r.v v8, (a0) # Unknown-size Folded Reload			; RV32-NEXT: vl8r.v v8, (a0) # Unknown-size Folded Reload
	; RV32-NEXT: csrr a0, vlenb			; RV32-NEXT: csrr a0, vlenb
	; RV32-NEXT: li a1, 40			; RV32-NEXT: slli a0, a0, 5
	; RV32-NEXT: mul a0, a0, a1
	; RV32-NEXT: add sp, sp, a0			; RV32-NEXT: add sp, sp, a0
	; RV32-NEXT: addi sp, sp, 16			; RV32-NEXT: addi sp, sp, 16
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vp_ctlz_v32i64_unmasked:			; RV64-LABEL: vp_ctlz_v32i64_unmasked:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: li a2, 16			; RV64-NEXT: li a2, 16
	; RV64-NEXT: mv a1, a0			; RV64-NEXT: mv a1, a0
	▲ Show 20 Lines • Show All 1,510 Lines • ▼ Show 20 Lines
	; RV32-NEXT: vor.vv v8, v8, v9, v0.t			; RV32-NEXT: vor.vv v8, v8, v9, v0.t
	; RV32-NEXT: vsrl.vi v9, v8, 8, v0.t			; RV32-NEXT: vsrl.vi v9, v8, 8, v0.t
	; RV32-NEXT: vor.vv v8, v8, v9, v0.t			; RV32-NEXT: vor.vv v8, v8, v9, v0.t
	; RV32-NEXT: vsrl.vi v9, v8, 16, v0.t			; RV32-NEXT: vsrl.vi v9, v8, 16, v0.t
	; RV32-NEXT: vor.vv v8, v8, v9, v0.t			; RV32-NEXT: vor.vv v8, v8, v9, v0.t
	; RV32-NEXT: li a1, 32			; RV32-NEXT: li a1, 32
	; RV32-NEXT: vsrl.vx v9, v8, a1, v0.t			; RV32-NEXT: vsrl.vx v9, v8, a1, v0.t
	; RV32-NEXT: vor.vv v8, v8, v9, v0.t			; RV32-NEXT: vor.vv v8, v8, v9, v0.t
	; RV32-NEXT: vsetivli zero, 4, e32, m1, ta, ma			; RV32-NEXT: vnot.v v8, v8, v0.t
	; RV32-NEXT: vmv.v.i v9, -1
	; RV32-NEXT: vsetvli zero, a0, e64, m1, ta, ma
	; RV32-NEXT: vxor.vv v8, v8, v9, v0.t
	; RV32-NEXT: vsrl.vi v9, v8, 1, v0.t			; RV32-NEXT: vsrl.vi v9, v8, 1, v0.t
	; RV32-NEXT: lui a1, 349525			; RV32-NEXT: lui a1, 349525
	; RV32-NEXT: addi a1, a1, 1365			; RV32-NEXT: addi a1, a1, 1365
	; RV32-NEXT: vsetivli zero, 4, e32, m1, ta, ma			; RV32-NEXT: vsetivli zero, 4, e32, m1, ta, ma
	; RV32-NEXT: vmv.v.x v10, a1			; RV32-NEXT: vmv.v.x v10, a1
	; RV32-NEXT: vsetvli zero, a0, e64, m1, ta, ma			; RV32-NEXT: vsetvli zero, a0, e64, m1, ta, ma
	; RV32-NEXT: vand.vv v9, v9, v10, v0.t			; RV32-NEXT: vand.vv v9, v9, v10, v0.t
	; RV32-NEXT: vsub.vv v8, v8, v9, v0.t			; RV32-NEXT: vsub.vv v8, v8, v9, v0.t
	▲ Show 20 Lines • Show All 87 Lines • ▼ Show 20 Lines
	; RV32-NEXT: vor.vv v8, v8, v9			; RV32-NEXT: vor.vv v8, v8, v9
	; RV32-NEXT: vsrl.vi v9, v8, 8			; RV32-NEXT: vsrl.vi v9, v8, 8
	; RV32-NEXT: vor.vv v8, v8, v9			; RV32-NEXT: vor.vv v8, v8, v9
	; RV32-NEXT: vsrl.vi v9, v8, 16			; RV32-NEXT: vsrl.vi v9, v8, 16
	; RV32-NEXT: vor.vv v8, v8, v9			; RV32-NEXT: vor.vv v8, v8, v9
	; RV32-NEXT: li a1, 32			; RV32-NEXT: li a1, 32
	; RV32-NEXT: vsrl.vx v9, v8, a1			; RV32-NEXT: vsrl.vx v9, v8, a1
	; RV32-NEXT: vor.vv v8, v8, v9			; RV32-NEXT: vor.vv v8, v8, v9
	; RV32-NEXT: vsetivli zero, 4, e32, m1, ta, ma			; RV32-NEXT: vnot.v v8, v8
	; RV32-NEXT: vmv.v.i v9, -1
	; RV32-NEXT: vsetvli zero, a0, e64, m1, ta, ma
	; RV32-NEXT: vxor.vv v8, v8, v9
	; RV32-NEXT: vsrl.vi v9, v8, 1			; RV32-NEXT: vsrl.vi v9, v8, 1
	; RV32-NEXT: lui a1, 349525			; RV32-NEXT: lui a1, 349525
	; RV32-NEXT: addi a1, a1, 1365			; RV32-NEXT: addi a1, a1, 1365
	; RV32-NEXT: vsetivli zero, 4, e32, m1, ta, ma			; RV32-NEXT: vsetivli zero, 4, e32, m1, ta, ma
	; RV32-NEXT: vmv.v.x v10, a1			; RV32-NEXT: vmv.v.x v10, a1
	; RV32-NEXT: vsetvli zero, a0, e64, m1, ta, ma			; RV32-NEXT: vsetvli zero, a0, e64, m1, ta, ma
	; RV32-NEXT: vand.vv v9, v9, v10			; RV32-NEXT: vand.vv v9, v9, v10
	; RV32-NEXT: vsub.vv v8, v8, v9			; RV32-NEXT: vsub.vv v8, v8, v9
	▲ Show 20 Lines • Show All 89 Lines • ▼ Show 20 Lines
	; RV32-NEXT: vor.vv v8, v8, v10, v0.t			; RV32-NEXT: vor.vv v8, v8, v10, v0.t
	; RV32-NEXT: vsrl.vi v10, v8, 8, v0.t			; RV32-NEXT: vsrl.vi v10, v8, 8, v0.t
	; RV32-NEXT: vor.vv v8, v8, v10, v0.t			; RV32-NEXT: vor.vv v8, v8, v10, v0.t
	; RV32-NEXT: vsrl.vi v10, v8, 16, v0.t			; RV32-NEXT: vsrl.vi v10, v8, 16, v0.t
	; RV32-NEXT: vor.vv v8, v8, v10, v0.t			; RV32-NEXT: vor.vv v8, v8, v10, v0.t
	; RV32-NEXT: li a1, 32			; RV32-NEXT: li a1, 32
	; RV32-NEXT: vsrl.vx v10, v8, a1, v0.t			; RV32-NEXT: vsrl.vx v10, v8, a1, v0.t
	; RV32-NEXT: vor.vv v8, v8, v10, v0.t			; RV32-NEXT: vor.vv v8, v8, v10, v0.t
	; RV32-NEXT: vsetivli zero, 8, e32, m2, ta, ma			; RV32-NEXT: vnot.v v8, v8, v0.t
	; RV32-NEXT: vmv.v.i v10, -1
	; RV32-NEXT: vsetvli zero, a0, e64, m2, ta, ma
	; RV32-NEXT: vxor.vv v8, v8, v10, v0.t
	; RV32-NEXT: vsrl.vi v10, v8, 1, v0.t			; RV32-NEXT: vsrl.vi v10, v8, 1, v0.t
	; RV32-NEXT: lui a1, 349525			; RV32-NEXT: lui a1, 349525
	; RV32-NEXT: addi a1, a1, 1365			; RV32-NEXT: addi a1, a1, 1365
	; RV32-NEXT: vsetivli zero, 8, e32, m2, ta, ma			; RV32-NEXT: vsetivli zero, 8, e32, m2, ta, ma
	; RV32-NEXT: vmv.v.x v12, a1			; RV32-NEXT: vmv.v.x v12, a1
	; RV32-NEXT: vsetvli zero, a0, e64, m2, ta, ma			; RV32-NEXT: vsetvli zero, a0, e64, m2, ta, ma
	; RV32-NEXT: vand.vv v10, v10, v12, v0.t			; RV32-NEXT: vand.vv v10, v10, v12, v0.t
	; RV32-NEXT: vsub.vv v8, v8, v10, v0.t			; RV32-NEXT: vsub.vv v8, v8, v10, v0.t
	▲ Show 20 Lines • Show All 87 Lines • ▼ Show 20 Lines
	; RV32-NEXT: vor.vv v8, v8, v10			; RV32-NEXT: vor.vv v8, v8, v10
	; RV32-NEXT: vsrl.vi v10, v8, 8			; RV32-NEXT: vsrl.vi v10, v8, 8
	; RV32-NEXT: vor.vv v8, v8, v10			; RV32-NEXT: vor.vv v8, v8, v10
	; RV32-NEXT: vsrl.vi v10, v8, 16			; RV32-NEXT: vsrl.vi v10, v8, 16
	; RV32-NEXT: vor.vv v8, v8, v10			; RV32-NEXT: vor.vv v8, v8, v10
	; RV32-NEXT: li a1, 32			; RV32-NEXT: li a1, 32
	; RV32-NEXT: vsrl.vx v10, v8, a1			; RV32-NEXT: vsrl.vx v10, v8, a1
	; RV32-NEXT: vor.vv v8, v8, v10			; RV32-NEXT: vor.vv v8, v8, v10
	; RV32-NEXT: vsetivli zero, 8, e32, m2, ta, ma			; RV32-NEXT: vnot.v v8, v8
	; RV32-NEXT: vmv.v.i v10, -1
	; RV32-NEXT: vsetvli zero, a0, e64, m2, ta, ma
	; RV32-NEXT: vxor.vv v8, v8, v10
	; RV32-NEXT: vsrl.vi v10, v8, 1			; RV32-NEXT: vsrl.vi v10, v8, 1
	; RV32-NEXT: lui a1, 349525			; RV32-NEXT: lui a1, 349525
	; RV32-NEXT: addi a1, a1, 1365			; RV32-NEXT: addi a1, a1, 1365
	; RV32-NEXT: vsetivli zero, 8, e32, m2, ta, ma			; RV32-NEXT: vsetivli zero, 8, e32, m2, ta, ma
	; RV32-NEXT: vmv.v.x v12, a1			; RV32-NEXT: vmv.v.x v12, a1
	; RV32-NEXT: vsetvli zero, a0, e64, m2, ta, ma			; RV32-NEXT: vsetvli zero, a0, e64, m2, ta, ma
	; RV32-NEXT: vand.vv v10, v10, v12			; RV32-NEXT: vand.vv v10, v10, v12
	; RV32-NEXT: vsub.vv v8, v8, v10			; RV32-NEXT: vsub.vv v8, v8, v10
	▲ Show 20 Lines • Show All 89 Lines • ▼ Show 20 Lines
	; RV32-NEXT: vor.vv v8, v8, v12, v0.t			; RV32-NEXT: vor.vv v8, v8, v12, v0.t
	; RV32-NEXT: vsrl.vi v12, v8, 8, v0.t			; RV32-NEXT: vsrl.vi v12, v8, 8, v0.t
	; RV32-NEXT: vor.vv v8, v8, v12, v0.t			; RV32-NEXT: vor.vv v8, v8, v12, v0.t
	; RV32-NEXT: vsrl.vi v12, v8, 16, v0.t			; RV32-NEXT: vsrl.vi v12, v8, 16, v0.t
	; RV32-NEXT: vor.vv v8, v8, v12, v0.t			; RV32-NEXT: vor.vv v8, v8, v12, v0.t
	; RV32-NEXT: li a1, 32			; RV32-NEXT: li a1, 32
	; RV32-NEXT: vsrl.vx v12, v8, a1, v0.t			; RV32-NEXT: vsrl.vx v12, v8, a1, v0.t
	; RV32-NEXT: vor.vv v8, v8, v12, v0.t			; RV32-NEXT: vor.vv v8, v8, v12, v0.t
	; RV32-NEXT: vsetivli zero, 16, e32, m4, ta, ma			; RV32-NEXT: vnot.v v8, v8, v0.t
	; RV32-NEXT: vmv.v.i v12, -1
	; RV32-NEXT: vsetvli zero, a0, e64, m4, ta, ma
	; RV32-NEXT: vxor.vv v8, v8, v12, v0.t
	; RV32-NEXT: vsrl.vi v12, v8, 1, v0.t			; RV32-NEXT: vsrl.vi v12, v8, 1, v0.t
	; RV32-NEXT: lui a1, 349525			; RV32-NEXT: lui a1, 349525
	; RV32-NEXT: addi a1, a1, 1365			; RV32-NEXT: addi a1, a1, 1365
	; RV32-NEXT: vsetivli zero, 16, e32, m4, ta, ma			; RV32-NEXT: vsetivli zero, 16, e32, m4, ta, ma
	; RV32-NEXT: vmv.v.x v16, a1			; RV32-NEXT: vmv.v.x v16, a1
	; RV32-NEXT: vsetvli zero, a0, e64, m4, ta, ma			; RV32-NEXT: vsetvli zero, a0, e64, m4, ta, ma
	; RV32-NEXT: vand.vv v12, v12, v16, v0.t			; RV32-NEXT: vand.vv v12, v12, v16, v0.t
	; RV32-NEXT: vsub.vv v8, v8, v12, v0.t			; RV32-NEXT: vsub.vv v8, v8, v12, v0.t
	▲ Show 20 Lines • Show All 87 Lines • ▼ Show 20 Lines
	; RV32-NEXT: vor.vv v8, v8, v12			; RV32-NEXT: vor.vv v8, v8, v12
	; RV32-NEXT: vsrl.vi v12, v8, 8			; RV32-NEXT: vsrl.vi v12, v8, 8
	; RV32-NEXT: vor.vv v8, v8, v12			; RV32-NEXT: vor.vv v8, v8, v12
	; RV32-NEXT: vsrl.vi v12, v8, 16			; RV32-NEXT: vsrl.vi v12, v8, 16
	; RV32-NEXT: vor.vv v8, v8, v12			; RV32-NEXT: vor.vv v8, v8, v12
	; RV32-NEXT: li a1, 32			; RV32-NEXT: li a1, 32
	; RV32-NEXT: vsrl.vx v12, v8, a1			; RV32-NEXT: vsrl.vx v12, v8, a1
	; RV32-NEXT: vor.vv v8, v8, v12			; RV32-NEXT: vor.vv v8, v8, v12
	; RV32-NEXT: vsetivli zero, 16, e32, m4, ta, ma			; RV32-NEXT: vnot.v v8, v8
	; RV32-NEXT: vmv.v.i v12, -1
	; RV32-NEXT: vsetvli zero, a0, e64, m4, ta, ma
	; RV32-NEXT: vxor.vv v8, v8, v12
	; RV32-NEXT: vsrl.vi v12, v8, 1			; RV32-NEXT: vsrl.vi v12, v8, 1
	; RV32-NEXT: lui a1, 349525			; RV32-NEXT: lui a1, 349525
	; RV32-NEXT: addi a1, a1, 1365			; RV32-NEXT: addi a1, a1, 1365
	; RV32-NEXT: vsetivli zero, 16, e32, m4, ta, ma			; RV32-NEXT: vsetivli zero, 16, e32, m4, ta, ma
	; RV32-NEXT: vmv.v.x v16, a1			; RV32-NEXT: vmv.v.x v16, a1
	; RV32-NEXT: vsetvli zero, a0, e64, m4, ta, ma			; RV32-NEXT: vsetvli zero, a0, e64, m4, ta, ma
	; RV32-NEXT: vand.vv v12, v12, v16			; RV32-NEXT: vand.vv v12, v12, v16
	; RV32-NEXT: vsub.vv v8, v8, v12			; RV32-NEXT: vsub.vv v8, v8, v12
	▲ Show 20 Lines • Show All 89 Lines • ▼ Show 20 Lines
	; RV32-NEXT: vor.vv v8, v8, v16, v0.t			; RV32-NEXT: vor.vv v8, v8, v16, v0.t
	; RV32-NEXT: vsrl.vi v16, v8, 8, v0.t			; RV32-NEXT: vsrl.vi v16, v8, 8, v0.t
	; RV32-NEXT: vor.vv v8, v8, v16, v0.t			; RV32-NEXT: vor.vv v8, v8, v16, v0.t
	; RV32-NEXT: vsrl.vi v16, v8, 16, v0.t			; RV32-NEXT: vsrl.vi v16, v8, 16, v0.t
	; RV32-NEXT: vor.vv v8, v8, v16, v0.t			; RV32-NEXT: vor.vv v8, v8, v16, v0.t
	; RV32-NEXT: li a1, 32			; RV32-NEXT: li a1, 32
	; RV32-NEXT: vsrl.vx v16, v8, a1, v0.t			; RV32-NEXT: vsrl.vx v16, v8, a1, v0.t
	; RV32-NEXT: vor.vv v8, v8, v16, v0.t			; RV32-NEXT: vor.vv v8, v8, v16, v0.t
	; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma			; RV32-NEXT: vnot.v v8, v8, v0.t
	; RV32-NEXT: vmv.v.i v16, -1
	; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma
	; RV32-NEXT: vxor.vv v8, v8, v16, v0.t
	; RV32-NEXT: vsrl.vi v16, v8, 1, v0.t			; RV32-NEXT: vsrl.vi v16, v8, 1, v0.t
	; RV32-NEXT: lui a2, 349525			; RV32-NEXT: lui a2, 349525
	; RV32-NEXT: addi a2, a2, 1365			; RV32-NEXT: addi a2, a2, 1365
	; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma			; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma
	; RV32-NEXT: vmv.v.x v24, a2			; RV32-NEXT: vmv.v.x v24, a2
	; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma			; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma
	; RV32-NEXT: vand.vv v16, v16, v24, v0.t			; RV32-NEXT: vand.vv v16, v16, v24, v0.t
	; RV32-NEXT: vsub.vv v8, v8, v16, v0.t			; RV32-NEXT: vsub.vv v8, v8, v16, v0.t
	▲ Show 20 Lines • Show All 87 Lines • ▼ Show 20 Lines
	; RV32-NEXT: vor.vv v8, v8, v16			; RV32-NEXT: vor.vv v8, v8, v16
	; RV32-NEXT: vsrl.vi v16, v8, 8			; RV32-NEXT: vsrl.vi v16, v8, 8
	; RV32-NEXT: vor.vv v8, v8, v16			; RV32-NEXT: vor.vv v8, v8, v16
	; RV32-NEXT: vsrl.vi v16, v8, 16			; RV32-NEXT: vsrl.vi v16, v8, 16
	; RV32-NEXT: vor.vv v8, v8, v16			; RV32-NEXT: vor.vv v8, v8, v16
	; RV32-NEXT: li a1, 32			; RV32-NEXT: li a1, 32
	; RV32-NEXT: vsrl.vx v16, v8, a1			; RV32-NEXT: vsrl.vx v16, v8, a1
	; RV32-NEXT: vor.vv v8, v8, v16			; RV32-NEXT: vor.vv v8, v8, v16
	; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma			; RV32-NEXT: vnot.v v8, v8
	; RV32-NEXT: vmv.v.i v16, -1
	; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma
	; RV32-NEXT: vxor.vv v8, v8, v16
	; RV32-NEXT: vsrl.vi v16, v8, 1			; RV32-NEXT: vsrl.vi v16, v8, 1
	; RV32-NEXT: lui a2, 349525			; RV32-NEXT: lui a2, 349525
	; RV32-NEXT: addi a2, a2, 1365			; RV32-NEXT: addi a2, a2, 1365
	; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma			; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma
	; RV32-NEXT: vmv.v.x v24, a2			; RV32-NEXT: vmv.v.x v24, a2
	; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma			; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma
	; RV32-NEXT: vand.vv v16, v16, v24			; RV32-NEXT: vand.vv v16, v16, v24
	; RV32-NEXT: vsub.vv v8, v8, v16			; RV32-NEXT: vsub.vv v8, v8, v16
	▲ Show 20 Lines • Show All 89 Lines • ▼ Show 20 Lines
	; RV32-NEXT: vor.vv v8, v8, v16, v0.t			; RV32-NEXT: vor.vv v8, v8, v16, v0.t
	; RV32-NEXT: vsrl.vi v16, v8, 8, v0.t			; RV32-NEXT: vsrl.vi v16, v8, 8, v0.t
	; RV32-NEXT: vor.vv v8, v8, v16, v0.t			; RV32-NEXT: vor.vv v8, v8, v16, v0.t
	; RV32-NEXT: vsrl.vi v16, v8, 16, v0.t			; RV32-NEXT: vsrl.vi v16, v8, 16, v0.t
	; RV32-NEXT: vor.vv v8, v8, v16, v0.t			; RV32-NEXT: vor.vv v8, v8, v16, v0.t
	; RV32-NEXT: li a1, 32			; RV32-NEXT: li a1, 32
	; RV32-NEXT: vsrl.vx v16, v8, a1, v0.t			; RV32-NEXT: vsrl.vx v16, v8, a1, v0.t
	; RV32-NEXT: vor.vv v8, v8, v16, v0.t			; RV32-NEXT: vor.vv v8, v8, v16, v0.t
	; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma			; RV32-NEXT: vnot.v v8, v8, v0.t
	; RV32-NEXT: vmv.v.i v16, -1
	; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma
	; RV32-NEXT: vxor.vv v8, v8, v16, v0.t
	; RV32-NEXT: vsrl.vi v16, v8, 1, v0.t			; RV32-NEXT: vsrl.vi v16, v8, 1, v0.t
	; RV32-NEXT: lui a2, 349525			; RV32-NEXT: lui a2, 349525
	; RV32-NEXT: addi a2, a2, 1365			; RV32-NEXT: addi a2, a2, 1365
	; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma			; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma
	; RV32-NEXT: vmv.v.x v24, a2			; RV32-NEXT: vmv.v.x v24, a2
	; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma			; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma
	; RV32-NEXT: vand.vv v16, v16, v24, v0.t			; RV32-NEXT: vand.vv v16, v16, v24, v0.t
	; RV32-NEXT: vsub.vv v8, v8, v16, v0.t			; RV32-NEXT: vsub.vv v8, v8, v16, v0.t
	▲ Show 20 Lines • Show All 87 Lines • ▼ Show 20 Lines
	; RV32-NEXT: vor.vv v8, v8, v16			; RV32-NEXT: vor.vv v8, v8, v16
	; RV32-NEXT: vsrl.vi v16, v8, 8			; RV32-NEXT: vsrl.vi v16, v8, 8
	; RV32-NEXT: vor.vv v8, v8, v16			; RV32-NEXT: vor.vv v8, v8, v16
	; RV32-NEXT: vsrl.vi v16, v8, 16			; RV32-NEXT: vsrl.vi v16, v8, 16
	; RV32-NEXT: vor.vv v8, v8, v16			; RV32-NEXT: vor.vv v8, v8, v16
	; RV32-NEXT: li a1, 32			; RV32-NEXT: li a1, 32
	; RV32-NEXT: vsrl.vx v16, v8, a1			; RV32-NEXT: vsrl.vx v16, v8, a1
	; RV32-NEXT: vor.vv v8, v8, v16			; RV32-NEXT: vor.vv v8, v8, v16
	; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma			; RV32-NEXT: vnot.v v8, v8
	; RV32-NEXT: vmv.v.i v16, -1
	; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma
	; RV32-NEXT: vxor.vv v8, v8, v16
	; RV32-NEXT: vsrl.vi v16, v8, 1			; RV32-NEXT: vsrl.vi v16, v8, 1
	; RV32-NEXT: lui a2, 349525			; RV32-NEXT: lui a2, 349525
	; RV32-NEXT: addi a2, a2, 1365			; RV32-NEXT: addi a2, a2, 1365
	; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma			; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma
	; RV32-NEXT: vmv.v.x v24, a2			; RV32-NEXT: vmv.v.x v24, a2
	; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma			; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma
	; RV32-NEXT: vand.vv v16, v16, v24			; RV32-NEXT: vand.vv v16, v16, v24
	; RV32-NEXT: vsub.vv v8, v8, v16			; RV32-NEXT: vsub.vv v8, v8, v16
	▲ Show 20 Lines • Show All 109 Lines • ▼ Show 20 Lines
	; RV32-NEXT: vor.vv v8, v8, v16, v0.t			; RV32-NEXT: vor.vv v8, v8, v16, v0.t
	; RV32-NEXT: vsrl.vi v16, v8, 8, v0.t			; RV32-NEXT: vsrl.vi v16, v8, 8, v0.t
	; RV32-NEXT: vor.vv v8, v8, v16, v0.t			; RV32-NEXT: vor.vv v8, v8, v16, v0.t
	; RV32-NEXT: vsrl.vi v16, v8, 16, v0.t			; RV32-NEXT: vsrl.vi v16, v8, 16, v0.t
	; RV32-NEXT: vor.vv v8, v8, v16, v0.t			; RV32-NEXT: vor.vv v8, v8, v16, v0.t
	; RV32-NEXT: li a1, 32			; RV32-NEXT: li a1, 32
	; RV32-NEXT: vsrl.vx v16, v8, a1, v0.t			; RV32-NEXT: vsrl.vx v16, v8, a1, v0.t
	; RV32-NEXT: vor.vv v8, v8, v16, v0.t			; RV32-NEXT: vor.vv v8, v8, v16, v0.t
	; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma			; RV32-NEXT: vnot.v v8, v8, v0.t
	; RV32-NEXT: vmv.v.i v16, -1
	; RV32-NEXT: csrr a3, vlenb			; RV32-NEXT: csrr a3, vlenb
	; RV32-NEXT: li a4, 24			; RV32-NEXT: li a4, 40
	; RV32-NEXT: mul a3, a3, a4			; RV32-NEXT: mul a3, a3, a4
	; RV32-NEXT: add a3, sp, a3			; RV32-NEXT: add a3, sp, a3
	; RV32-NEXT: addi a3, a3, 16			; RV32-NEXT: addi a3, a3, 16
	; RV32-NEXT: vs8r.v v16, (a3) # Unknown-size Folded Spill			; RV32-NEXT: vs8r.v v8, (a3) # Unknown-size Folded Spill
	; RV32-NEXT: vsetvli zero, a2, e64, m8, ta, ma			; RV32-NEXT: vsrl.vi v8, v8, 1, v0.t
	; RV32-NEXT: vxor.vv v8, v8, v16, v0.t
	; RV32-NEXT: csrr a3, vlenb			; RV32-NEXT: csrr a3, vlenb
	; RV32-NEXT: li a4, 40			; RV32-NEXT: li a4, 48
	; RV32-NEXT: mul a3, a3, a4			; RV32-NEXT: mul a3, a3, a4
	; RV32-NEXT: add a3, sp, a3			; RV32-NEXT: add a3, sp, a3
	; RV32-NEXT: addi a3, a3, 16			; RV32-NEXT: addi a3, a3, 16
	; RV32-NEXT: vs8r.v v8, (a3) # Unknown-size Folded Spill			; RV32-NEXT: vs8r.v v8, (a3) # Unknown-size Folded Spill
	; RV32-NEXT: lui a3, 349525			; RV32-NEXT: lui a3, 349525
	; RV32-NEXT: addi a3, a3, 1365			; RV32-NEXT: addi a3, a3, 1365
	; RV32-NEXT: vsrl.vi v8, v8, 1, v0.t
	; RV32-NEXT: csrr a4, vlenb
	; RV32-NEXT: li a5, 48
	; RV32-NEXT: mul a4, a4, a5
	; RV32-NEXT: add a4, sp, a4
	; RV32-NEXT: addi a4, a4, 16
	; RV32-NEXT: vs8r.v v8, (a4) # Unknown-size Folded Spill
	; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma			; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma
	; RV32-NEXT: vmv.v.x v8, a3			; RV32-NEXT: vmv.v.x v8, a3
	; RV32-NEXT: csrr a3, vlenb			; RV32-NEXT: csrr a3, vlenb
	; RV32-NEXT: slli a3, a3, 4			; RV32-NEXT: li a4, 24
				; RV32-NEXT: mul a3, a3, a4
	; RV32-NEXT: add a3, sp, a3			; RV32-NEXT: add a3, sp, a3
	; RV32-NEXT: addi a3, a3, 16			; RV32-NEXT: addi a3, a3, 16
	; RV32-NEXT: vs8r.v v8, (a3) # Unknown-size Folded Spill			; RV32-NEXT: vs8r.v v8, (a3) # Unknown-size Folded Spill
	; RV32-NEXT: vsetvli zero, a2, e64, m8, ta, ma			; RV32-NEXT: vsetvli zero, a2, e64, m8, ta, ma
	; RV32-NEXT: csrr a3, vlenb			; RV32-NEXT: csrr a3, vlenb
	; RV32-NEXT: li a4, 48			; RV32-NEXT: li a4, 48
	; RV32-NEXT: mul a3, a3, a4			; RV32-NEXT: mul a3, a3, a4
	; RV32-NEXT: add a3, sp, a3			; RV32-NEXT: add a3, sp, a3
	Show All 27 Lines
	; RV32-NEXT: csrr a3, vlenb			; RV32-NEXT: csrr a3, vlenb
	; RV32-NEXT: li a4, 40			; RV32-NEXT: li a4, 40
	; RV32-NEXT: mul a3, a3, a4			; RV32-NEXT: mul a3, a3, a4
	; RV32-NEXT: add a3, sp, a3			; RV32-NEXT: add a3, sp, a3
	; RV32-NEXT: addi a3, a3, 16			; RV32-NEXT: addi a3, a3, 16
	; RV32-NEXT: vl8r.v v16, (a3) # Unknown-size Folded Reload			; RV32-NEXT: vl8r.v v16, (a3) # Unknown-size Folded Reload
	; RV32-NEXT: vand.vv v16, v16, v8, v0.t			; RV32-NEXT: vand.vv v16, v16, v8, v0.t
	; RV32-NEXT: csrr a3, vlenb			; RV32-NEXT: csrr a3, vlenb
	; RV32-NEXT: slli a3, a3, 3			; RV32-NEXT: slli a3, a3, 4
	; RV32-NEXT: add a3, sp, a3			; RV32-NEXT: add a3, sp, a3
	; RV32-NEXT: addi a3, a3, 16			; RV32-NEXT: addi a3, a3, 16
	; RV32-NEXT: vs8r.v v16, (a3) # Unknown-size Folded Spill			; RV32-NEXT: vs8r.v v16, (a3) # Unknown-size Folded Spill
	; RV32-NEXT: csrr a3, vlenb			; RV32-NEXT: csrr a3, vlenb
	; RV32-NEXT: li a4, 40			; RV32-NEXT: li a4, 40
	; RV32-NEXT: mul a3, a3, a4			; RV32-NEXT: mul a3, a3, a4
	; RV32-NEXT: add a3, sp, a3			; RV32-NEXT: add a3, sp, a3
	; RV32-NEXT: addi a3, a3, 16			; RV32-NEXT: addi a3, a3, 16
	; RV32-NEXT: vl8r.v v16, (a3) # Unknown-size Folded Reload			; RV32-NEXT: vl8r.v v16, (a3) # Unknown-size Folded Reload
	; RV32-NEXT: vsrl.vi v16, v16, 2, v0.t			; RV32-NEXT: vsrl.vi v16, v16, 2, v0.t
	; RV32-NEXT: vand.vv v16, v16, v8, v0.t			; RV32-NEXT: vand.vv v16, v16, v8, v0.t
	; RV32-NEXT: csrr a3, vlenb			; RV32-NEXT: csrr a3, vlenb
	; RV32-NEXT: slli a3, a3, 3			; RV32-NEXT: slli a3, a3, 4
	; RV32-NEXT: add a3, sp, a3			; RV32-NEXT: add a3, sp, a3
	; RV32-NEXT: addi a3, a3, 16			; RV32-NEXT: addi a3, a3, 16
	; RV32-NEXT: vl8r.v v8, (a3) # Unknown-size Folded Reload			; RV32-NEXT: vl8r.v v8, (a3) # Unknown-size Folded Reload
	; RV32-NEXT: vadd.vv v8, v8, v16, v0.t			; RV32-NEXT: vadd.vv v8, v8, v16, v0.t
	; RV32-NEXT: vsrl.vi v16, v8, 4, v0.t			; RV32-NEXT: vsrl.vi v16, v8, 4, v0.t
	; RV32-NEXT: vadd.vv v16, v8, v16, v0.t			; RV32-NEXT: vadd.vv v16, v8, v16, v0.t
	; RV32-NEXT: lui a3, 61681			; RV32-NEXT: lui a3, 61681
	; RV32-NEXT: addi a3, a3, -241			; RV32-NEXT: addi a3, a3, -241
	; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma			; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma
	; RV32-NEXT: vmv.v.x v8, a3			; RV32-NEXT: vmv.v.x v8, a3
	; RV32-NEXT: csrr a3, vlenb			; RV32-NEXT: csrr a3, vlenb
	; RV32-NEXT: li a4, 40			; RV32-NEXT: li a4, 40
	; RV32-NEXT: mul a3, a3, a4			; RV32-NEXT: mul a3, a3, a4
	; RV32-NEXT: add a3, sp, a3			; RV32-NEXT: add a3, sp, a3
	; RV32-NEXT: addi a3, a3, 16			; RV32-NEXT: addi a3, a3, 16
	; RV32-NEXT: vs8r.v v8, (a3) # Unknown-size Folded Spill			; RV32-NEXT: vs8r.v v8, (a3) # Unknown-size Folded Spill
	; RV32-NEXT: vsetvli zero, a2, e64, m8, ta, ma			; RV32-NEXT: vsetvli zero, a2, e64, m8, ta, ma
	; RV32-NEXT: vand.vv v8, v16, v8, v0.t			; RV32-NEXT: vand.vv v8, v16, v8, v0.t
	; RV32-NEXT: lui a3, 4112			; RV32-NEXT: lui a3, 4112
	; RV32-NEXT: addi a3, a3, 257			; RV32-NEXT: addi a3, a3, 257
	; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma			; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma
	; RV32-NEXT: vmv.v.x v16, a3			; RV32-NEXT: vmv.v.x v16, a3
	; RV32-NEXT: addi a3, sp, 16			; RV32-NEXT: csrr a3, vlenb
				; RV32-NEXT: slli a3, a3, 3
				; RV32-NEXT: add a3, sp, a3
				; RV32-NEXT: addi a3, a3, 16
	; RV32-NEXT: vs8r.v v16, (a3) # Unknown-size Folded Spill			; RV32-NEXT: vs8r.v v16, (a3) # Unknown-size Folded Spill
	; RV32-NEXT: vsetvli zero, a2, e64, m8, ta, ma			; RV32-NEXT: vsetvli zero, a2, e64, m8, ta, ma
	; RV32-NEXT: vmul.vv v8, v8, v16, v0.t			; RV32-NEXT: vmul.vv v8, v8, v16, v0.t
	; RV32-NEXT: li a2, 56			; RV32-NEXT: li a2, 56
	; RV32-NEXT: vsrl.vx v8, v8, a2, v0.t			; RV32-NEXT: vsrl.vx v8, v8, a2, v0.t
	; RV32-NEXT: csrr a3, vlenb			; RV32-NEXT: csrr a3, vlenb
	; RV32-NEXT: slli a3, a3, 3			; RV32-NEXT: slli a3, a3, 4
	; RV32-NEXT: add a3, sp, a3			; RV32-NEXT: add a3, sp, a3
	; RV32-NEXT: addi a3, a3, 16			; RV32-NEXT: addi a3, a3, 16
	; RV32-NEXT: vs8r.v v8, (a3) # Unknown-size Folded Spill			; RV32-NEXT: vs8r.v v8, (a3) # Unknown-size Folded Spill
	; RV32-NEXT: addi a3, a0, -16			; RV32-NEXT: addi a3, a0, -16
	; RV32-NEXT: sltu a0, a0, a3			; RV32-NEXT: sltu a0, a0, a3
	; RV32-NEXT: addi a0, a0, -1			; RV32-NEXT: addi a0, a0, -1
	; RV32-NEXT: and a0, a0, a3			; RV32-NEXT: and a0, a0, a3
	; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma			; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma
	Show All 10 Lines
	; RV32-NEXT: vsrl.vi v16, v8, 4, v0.t			; RV32-NEXT: vsrl.vi v16, v8, 4, v0.t
	; RV32-NEXT: vor.vv v8, v8, v16, v0.t			; RV32-NEXT: vor.vv v8, v8, v16, v0.t
	; RV32-NEXT: vsrl.vi v16, v8, 8, v0.t			; RV32-NEXT: vsrl.vi v16, v8, 8, v0.t
	; RV32-NEXT: vor.vv v8, v8, v16, v0.t			; RV32-NEXT: vor.vv v8, v8, v16, v0.t
	; RV32-NEXT: vsrl.vi v16, v8, 16, v0.t			; RV32-NEXT: vsrl.vi v16, v8, 16, v0.t
	; RV32-NEXT: vor.vv v8, v8, v16, v0.t			; RV32-NEXT: vor.vv v8, v8, v16, v0.t
	; RV32-NEXT: vsrl.vx v16, v8, a1, v0.t			; RV32-NEXT: vsrl.vx v16, v8, a1, v0.t
	; RV32-NEXT: vor.vv v8, v8, v16, v0.t			; RV32-NEXT: vor.vv v8, v8, v16, v0.t
	; RV32-NEXT: csrr a0, vlenb			; RV32-NEXT: vnot.v v8, v8, v0.t
	; RV32-NEXT: li a1, 24			; RV32-NEXT: addi a0, sp, 16
	; RV32-NEXT: mul a0, a0, a1
	; RV32-NEXT: add a0, sp, a0
	; RV32-NEXT: addi a0, a0, 16
	; RV32-NEXT: vl8r.v v16, (a0) # Unknown-size Folded Reload
	; RV32-NEXT: vxor.vv v8, v8, v16, v0.t
	; RV32-NEXT: csrr a0, vlenb
	; RV32-NEXT: li a1, 24
	; RV32-NEXT: mul a0, a0, a1
	; RV32-NEXT: add a0, sp, a0
	; RV32-NEXT: addi a0, a0, 16
	; RV32-NEXT: vs8r.v v8, (a0) # Unknown-size Folded Spill			; RV32-NEXT: vs8r.v v8, (a0) # Unknown-size Folded Spill
	; RV32-NEXT: vsrl.vi v16, v8, 1, v0.t			; RV32-NEXT: vsrl.vi v16, v8, 1, v0.t
	; RV32-NEXT: csrr a0, vlenb			; RV32-NEXT: csrr a0, vlenb
	; RV32-NEXT: slli a0, a0, 5			; RV32-NEXT: slli a0, a0, 5
	; RV32-NEXT: add a0, sp, a0			; RV32-NEXT: add a0, sp, a0
	; RV32-NEXT: addi a0, a0, 16			; RV32-NEXT: addi a0, a0, 16
	; RV32-NEXT: vs8r.v v16, (a0) # Unknown-size Folded Spill			; RV32-NEXT: vs8r.v v16, (a0) # Unknown-size Folded Spill
	; RV32-NEXT: csrr a0, vlenb			; RV32-NEXT: csrr a0, vlenb
	; RV32-NEXT: slli a0, a0, 4			; RV32-NEXT: li a1, 24
				; RV32-NEXT: mul a0, a0, a1
	; RV32-NEXT: add a0, sp, a0			; RV32-NEXT: add a0, sp, a0
	; RV32-NEXT: addi a0, a0, 16			; RV32-NEXT: addi a0, a0, 16
	; RV32-NEXT: vl8r.v v16, (a0) # Unknown-size Folded Reload			; RV32-NEXT: vl8r.v v16, (a0) # Unknown-size Folded Reload
	; RV32-NEXT: csrr a0, vlenb			; RV32-NEXT: csrr a0, vlenb
	; RV32-NEXT: slli a0, a0, 5			; RV32-NEXT: slli a0, a0, 5
	; RV32-NEXT: add a0, sp, a0			; RV32-NEXT: add a0, sp, a0
	; RV32-NEXT: addi a0, a0, 16			; RV32-NEXT: addi a0, a0, 16
	; RV32-NEXT: vl8r.v v8, (a0) # Unknown-size Folded Reload			; RV32-NEXT: vl8r.v v8, (a0) # Unknown-size Folded Reload
	; RV32-NEXT: vand.vv v16, v8, v16, v0.t			; RV32-NEXT: vand.vv v16, v8, v16, v0.t
	; RV32-NEXT: csrr a0, vlenb			; RV32-NEXT: addi a0, sp, 16
	; RV32-NEXT: li a1, 24
	; RV32-NEXT: mul a0, a0, a1
	; RV32-NEXT: add a0, sp, a0
	; RV32-NEXT: addi a0, a0, 16
	; RV32-NEXT: vl8r.v v8, (a0) # Unknown-size Folded Reload			; RV32-NEXT: vl8r.v v8, (a0) # Unknown-size Folded Reload
	; RV32-NEXT: vsub.vv v8, v8, v16, v0.t			; RV32-NEXT: vsub.vv v8, v8, v16, v0.t
	; RV32-NEXT: csrr a0, vlenb			; RV32-NEXT: csrr a0, vlenb
	; RV32-NEXT: li a1, 48			; RV32-NEXT: li a1, 48
	; RV32-NEXT: mul a0, a0, a1			; RV32-NEXT: mul a0, a0, a1
	; RV32-NEXT: add a0, sp, a0			; RV32-NEXT: add a0, sp, a0
	; RV32-NEXT: addi a0, a0, 16			; RV32-NEXT: addi a0, a0, 16
	; RV32-NEXT: vl8r.v v16, (a0) # Unknown-size Folded Reload			; RV32-NEXT: vl8r.v v16, (a0) # Unknown-size Folded Reload
	Show All 21 Lines
	; RV32-NEXT: vadd.vv v8, v8, v16, v0.t			; RV32-NEXT: vadd.vv v8, v8, v16, v0.t
	; RV32-NEXT: csrr a0, vlenb			; RV32-NEXT: csrr a0, vlenb
	; RV32-NEXT: li a1, 40			; RV32-NEXT: li a1, 40
	; RV32-NEXT: mul a0, a0, a1			; RV32-NEXT: mul a0, a0, a1
	; RV32-NEXT: add a0, sp, a0			; RV32-NEXT: add a0, sp, a0
	; RV32-NEXT: addi a0, a0, 16			; RV32-NEXT: addi a0, a0, 16
	; RV32-NEXT: vl8r.v v16, (a0) # Unknown-size Folded Reload			; RV32-NEXT: vl8r.v v16, (a0) # Unknown-size Folded Reload
	; RV32-NEXT: vand.vv v8, v8, v16, v0.t			; RV32-NEXT: vand.vv v8, v8, v16, v0.t
	; RV32-NEXT: addi a0, sp, 16			; RV32-NEXT: csrr a0, vlenb
				; RV32-NEXT: slli a0, a0, 3
				; RV32-NEXT: add a0, sp, a0
				; RV32-NEXT: addi a0, a0, 16
	; RV32-NEXT: vl8r.v v16, (a0) # Unknown-size Folded Reload			; RV32-NEXT: vl8r.v v16, (a0) # Unknown-size Folded Reload
	; RV32-NEXT: vmul.vv v8, v8, v16, v0.t			; RV32-NEXT: vmul.vv v8, v8, v16, v0.t
	; RV32-NEXT: vsrl.vx v16, v8, a2, v0.t			; RV32-NEXT: vsrl.vx v16, v8, a2, v0.t
	; RV32-NEXT: csrr a0, vlenb			; RV32-NEXT: csrr a0, vlenb
	; RV32-NEXT: slli a0, a0, 3			; RV32-NEXT: slli a0, a0, 4
	; RV32-NEXT: add a0, sp, a0			; RV32-NEXT: add a0, sp, a0
	; RV32-NEXT: addi a0, a0, 16			; RV32-NEXT: addi a0, a0, 16
	; RV32-NEXT: vl8r.v v8, (a0) # Unknown-size Folded Reload			; RV32-NEXT: vl8r.v v8, (a0) # Unknown-size Folded Reload
	; RV32-NEXT: csrr a0, vlenb			; RV32-NEXT: csrr a0, vlenb
	; RV32-NEXT: li a1, 56			; RV32-NEXT: li a1, 56
	; RV32-NEXT: mul a0, a0, a1			; RV32-NEXT: mul a0, a0, a1
	; RV32-NEXT: add sp, sp, a0			; RV32-NEXT: add sp, sp, a0
	; RV32-NEXT: addi sp, sp, 16			; RV32-NEXT: addi sp, sp, 16
	▲ Show 20 Lines • Show All 111 Lines • ▼ Show 20 Lines
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%v = call <32 x i64> @llvm.vp.ctlz.v32i64(<32 x i64> %va, i1 true, <32 x i1> %m, i32 %evl)			%v = call <32 x i64> @llvm.vp.ctlz.v32i64(<32 x i64> %va, i1 true, <32 x i1> %m, i32 %evl)
	ret <32 x i64> %v			ret <32 x i64> %v
	}			}

	define <32 x i64> @vp_ctlz_zero_undef_v32i64_unmasked(<32 x i64> %va, i32 zeroext %evl) {			define <32 x i64> @vp_ctlz_zero_undef_v32i64_unmasked(<32 x i64> %va, i32 zeroext %evl) {
	; RV32-LABEL: vp_ctlz_zero_undef_v32i64_unmasked:			; RV32-LABEL: vp_ctlz_zero_undef_v32i64_unmasked:
	; RV32: # %bb.0:			; RV32: # %bb.0:
	; RV32-NEXT: li a1, 16
	; RV32-NEXT: vmv8r.v v0, v16
	; RV32-NEXT: mv a2, a0
	; RV32-NEXT: bltu a0, a1, .LBB71_2
	; RV32-NEXT: # %bb.1:
	; RV32-NEXT: li a2, 16			; RV32-NEXT: li a2, 16
				; RV32-NEXT: vmv8r.v v24, v16
				; RV32-NEXT: mv a1, a0
				; RV32-NEXT: bltu a0, a2, .LBB71_2
				; RV32-NEXT: # %bb.1:
				; RV32-NEXT: li a1, 16
	; RV32-NEXT: .LBB71_2:			; RV32-NEXT: .LBB71_2:
	; RV32-NEXT: addi sp, sp, -16			; RV32-NEXT: addi sp, sp, -16
	; RV32-NEXT: .cfi_def_cfa_offset 16			; RV32-NEXT: .cfi_def_cfa_offset 16
	; RV32-NEXT: csrr a1, vlenb			; RV32-NEXT: csrr a2, vlenb
	; RV32-NEXT: li a3, 40			; RV32-NEXT: slli a2, a2, 5
	; RV32-NEXT: mul a1, a1, a3			; RV32-NEXT: sub sp, sp, a2
	; RV32-NEXT: sub sp, sp, a1			; RV32-NEXT: .cfi_escape 0x0f, 0x0d, 0x72, 0x00, 0x11, 0x10, 0x22, 0x11, 0x20, 0x92, 0xa2, 0x38, 0x00, 0x1e, 0x22 # sp + 16 + 32 * vlenb
	; RV32-NEXT: .cfi_escape 0x0f, 0x0d, 0x72, 0x00, 0x11, 0x10, 0x22, 0x11, 0x28, 0x92, 0xa2, 0x38, 0x00, 0x1e, 0x22 # sp + 16 + 40 * vlenb			; RV32-NEXT: vsetvli zero, a1, e64, m8, ta, ma
	; RV32-NEXT: vsetvli zero, a2, e64, m8, ta, ma
	; RV32-NEXT: vsrl.vi v16, v8, 1			; RV32-NEXT: vsrl.vi v16, v8, 1
	; RV32-NEXT: vor.vv v8, v8, v16			; RV32-NEXT: vor.vv v8, v8, v16
	; RV32-NEXT: vsrl.vi v16, v8, 2			; RV32-NEXT: vsrl.vi v16, v8, 2
	; RV32-NEXT: vor.vv v8, v8, v16			; RV32-NEXT: vor.vv v8, v8, v16
	; RV32-NEXT: vsrl.vi v16, v8, 4			; RV32-NEXT: vsrl.vi v16, v8, 4
	; RV32-NEXT: vor.vv v8, v8, v16			; RV32-NEXT: vor.vv v8, v8, v16
	; RV32-NEXT: vsrl.vi v16, v8, 8			; RV32-NEXT: vsrl.vi v16, v8, 8
	; RV32-NEXT: vor.vv v8, v8, v16			; RV32-NEXT: vor.vv v8, v8, v16
	; RV32-NEXT: vsrl.vi v16, v8, 16			; RV32-NEXT: vsrl.vi v16, v8, 16
	; RV32-NEXT: vor.vv v8, v8, v16			; RV32-NEXT: vor.vv v8, v8, v16
	; RV32-NEXT: li a1, 32			; RV32-NEXT: li a2, 32
	; RV32-NEXT: vsrl.vx v16, v8, a1			; RV32-NEXT: vsrl.vx v16, v8, a2
	; RV32-NEXT: vor.vv v8, v8, v16			; RV32-NEXT: vor.vv v8, v8, v16
	; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma			; RV32-NEXT: vnot.v v8, v8
	; RV32-NEXT: vmv.v.i v16, -1
	; RV32-NEXT: csrr a3, vlenb
	; RV32-NEXT: slli a3, a3, 5
	; RV32-NEXT: add a3, sp, a3
	; RV32-NEXT: addi a3, a3, 16
	; RV32-NEXT: vs8r.v v16, (a3) # Unknown-size Folded Spill
	; RV32-NEXT: vsetvli zero, a2, e64, m8, ta, ma
	; RV32-NEXT: vxor.vv v8, v8, v16
	; RV32-NEXT: vsrl.vi v16, v8, 1			; RV32-NEXT: vsrl.vi v16, v8, 1
	; RV32-NEXT: lui a3, 349525			; RV32-NEXT: lui a3, 349525
	; RV32-NEXT: addi a3, a3, 1365			; RV32-NEXT: addi a3, a3, 1365
	; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma			; RV32-NEXT: vsetvli zero, a2, e32, m8, ta, ma
	; RV32-NEXT: vmv.v.x v24, a3			; RV32-NEXT: vmv.v.x v0, a3
	; RV32-NEXT: csrr a3, vlenb			; RV32-NEXT: csrr a3, vlenb
	; RV32-NEXT: li a4, 24			; RV32-NEXT: li a4, 24
	; RV32-NEXT: mul a3, a3, a4			; RV32-NEXT: mul a3, a3, a4
	; RV32-NEXT: add a3, sp, a3			; RV32-NEXT: add a3, sp, a3
	; RV32-NEXT: addi a3, a3, 16			; RV32-NEXT: addi a3, a3, 16
	; RV32-NEXT: vs8r.v v24, (a3) # Unknown-size Folded Spill			; RV32-NEXT: vs8r.v v0, (a3) # Unknown-size Folded Spill
	; RV32-NEXT: vsetvli zero, a2, e64, m8, ta, ma			; RV32-NEXT: vsetvli zero, a1, e64, m8, ta, ma
	; RV32-NEXT: vand.vv v16, v16, v24			; RV32-NEXT: vand.vv v16, v16, v0
	; RV32-NEXT: vsub.vv v8, v8, v16			; RV32-NEXT: vsub.vv v8, v8, v16
	; RV32-NEXT: lui a3, 209715			; RV32-NEXT: lui a3, 209715
	; RV32-NEXT: addi a3, a3, 819			; RV32-NEXT: addi a3, a3, 819
	; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma			; RV32-NEXT: vsetvli zero, a2, e32, m8, ta, ma
	; RV32-NEXT: vmv.v.x v16, a3			; RV32-NEXT: vmv.v.x v0, a3
	; RV32-NEXT: vsetvli zero, a2, e64, m8, ta, ma			; RV32-NEXT: vsetvli zero, a1, e64, m8, ta, ma
	; RV32-NEXT: vand.vv v24, v8, v16			; RV32-NEXT: vand.vv v16, v8, v0
	; RV32-NEXT: vsrl.vi v8, v8, 2			; RV32-NEXT: vsrl.vi v8, v8, 2
	; RV32-NEXT: vand.vv v8, v8, v16			; RV32-NEXT: vand.vv v8, v8, v0
	; RV32-NEXT: vadd.vv v8, v24, v8			; RV32-NEXT: vadd.vv v8, v16, v8
	; RV32-NEXT: vsrl.vi v24, v8, 4			; RV32-NEXT: vsrl.vi v16, v8, 4
	; RV32-NEXT: vadd.vv v8, v8, v24			; RV32-NEXT: vadd.vv v8, v8, v16
	; RV32-NEXT: lui a3, 61681			; RV32-NEXT: lui a3, 61681
	; RV32-NEXT: addi a3, a3, -241			; RV32-NEXT: addi a3, a3, -241
	; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma			; RV32-NEXT: vsetvli zero, a2, e32, m8, ta, ma
	; RV32-NEXT: vmv.v.x v24, a3			; RV32-NEXT: vmv.v.x v16, a3
	; RV32-NEXT: csrr a3, vlenb			; RV32-NEXT: csrr a3, vlenb
	; RV32-NEXT: slli a3, a3, 4			; RV32-NEXT: slli a3, a3, 4
	; RV32-NEXT: add a3, sp, a3			; RV32-NEXT: add a3, sp, a3
	; RV32-NEXT: addi a3, a3, 16			; RV32-NEXT: addi a3, a3, 16
	; RV32-NEXT: vs8r.v v24, (a3) # Unknown-size Folded Spill			; RV32-NEXT: vs8r.v v16, (a3) # Unknown-size Folded Spill
	; RV32-NEXT: vsetvli zero, a2, e64, m8, ta, ma			; RV32-NEXT: vsetvli zero, a1, e64, m8, ta, ma
	; RV32-NEXT: vand.vv v8, v8, v24			; RV32-NEXT: vand.vv v8, v8, v16
	; RV32-NEXT: lui a3, 4112			; RV32-NEXT: lui a3, 4112
	; RV32-NEXT: addi a3, a3, 257			; RV32-NEXT: addi a3, a3, 257
	; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma			; RV32-NEXT: vsetvli zero, a2, e32, m8, ta, ma
	; RV32-NEXT: vmv.v.x v24, a3			; RV32-NEXT: vmv.v.x v16, a3
	; RV32-NEXT: addi a3, sp, 16			; RV32-NEXT: addi a3, sp, 16
	; RV32-NEXT: vs8r.v v24, (a3) # Unknown-size Folded Spill			; RV32-NEXT: vs8r.v v16, (a3) # Unknown-size Folded Spill
	; RV32-NEXT: vsetvli zero, a2, e64, m8, ta, ma			; RV32-NEXT: vsetvli zero, a1, e64, m8, ta, ma
	; RV32-NEXT: vmul.vv v8, v8, v24			; RV32-NEXT: vmul.vv v8, v8, v16
	; RV32-NEXT: li a2, 56			; RV32-NEXT: li a1, 56
	; RV32-NEXT: vsrl.vx v8, v8, a2			; RV32-NEXT: vsrl.vx v8, v8, a1
	; RV32-NEXT: csrr a3, vlenb			; RV32-NEXT: csrr a3, vlenb
	; RV32-NEXT: slli a3, a3, 3			; RV32-NEXT: slli a3, a3, 3
	; RV32-NEXT: add a3, sp, a3			; RV32-NEXT: add a3, sp, a3
	; RV32-NEXT: addi a3, a3, 16			; RV32-NEXT: addi a3, a3, 16
	; RV32-NEXT: vs8r.v v8, (a3) # Unknown-size Folded Spill			; RV32-NEXT: vs8r.v v8, (a3) # Unknown-size Folded Spill
	; RV32-NEXT: addi a3, a0, -16			; RV32-NEXT: addi a3, a0, -16
	; RV32-NEXT: sltu a0, a0, a3			; RV32-NEXT: sltu a0, a0, a3
	; RV32-NEXT: addi a0, a0, -1			; RV32-NEXT: addi a0, a0, -1
	; RV32-NEXT: and a0, a0, a3			; RV32-NEXT: and a0, a0, a3
	; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma			; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma
	; RV32-NEXT: vsrl.vi v8, v0, 1			; RV32-NEXT: vsrl.vi v8, v24, 1
	; RV32-NEXT: vor.vv v8, v0, v8			; RV32-NEXT: vor.vv v8, v24, v8
	; RV32-NEXT: vsrl.vi v0, v8, 2			; RV32-NEXT: vsrl.vi v24, v8, 2
	; RV32-NEXT: vor.vv v8, v8, v0			; RV32-NEXT: vor.vv v8, v8, v24
	; RV32-NEXT: vsrl.vi v0, v8, 4			; RV32-NEXT: vsrl.vi v24, v8, 4
	; RV32-NEXT: vor.vv v8, v8, v0			; RV32-NEXT: vor.vv v8, v8, v24
	; RV32-NEXT: vsrl.vi v0, v8, 8			; RV32-NEXT: vsrl.vi v24, v8, 8
	; RV32-NEXT: vor.vv v8, v8, v0			; RV32-NEXT: vor.vv v8, v8, v24
	; RV32-NEXT: vsrl.vi v0, v8, 16			; RV32-NEXT: vsrl.vi v24, v8, 16
	; RV32-NEXT: vor.vv v8, v8, v0			; RV32-NEXT: vor.vv v8, v8, v24
	; RV32-NEXT: vsrl.vx v0, v8, a1			; RV32-NEXT: vsrl.vx v24, v8, a2
	; RV32-NEXT: vor.vv v8, v8, v0			; RV32-NEXT: vor.vv v8, v8, v24
	; RV32-NEXT: csrr a0, vlenb			; RV32-NEXT: vnot.v v8, v8
	; RV32-NEXT: slli a0, a0, 5			; RV32-NEXT: vsrl.vi v24, v8, 1
	; RV32-NEXT: add a0, sp, a0
	; RV32-NEXT: addi a0, a0, 16
	; RV32-NEXT: vl8r.v v0, (a0) # Unknown-size Folded Reload
	; RV32-NEXT: vxor.vv v8, v8, v0
	; RV32-NEXT: vsrl.vi v0, v8, 1
	; RV32-NEXT: csrr a0, vlenb			; RV32-NEXT: csrr a0, vlenb
	; RV32-NEXT: li a1, 24			; RV32-NEXT: li a2, 24
	; RV32-NEXT: mul a0, a0, a1			; RV32-NEXT: mul a0, a0, a2
	; RV32-NEXT: add a0, sp, a0			; RV32-NEXT: add a0, sp, a0
	; RV32-NEXT: addi a0, a0, 16			; RV32-NEXT: addi a0, a0, 16
	; RV32-NEXT: vl8r.v v24, (a0) # Unknown-size Folded Reload			; RV32-NEXT: vl8r.v v16, (a0) # Unknown-size Folded Reload
	; RV32-NEXT: vand.vv v0, v0, v24			; RV32-NEXT: vand.vv v24, v24, v16
	; RV32-NEXT: vsub.vv v8, v8, v0			; RV32-NEXT: vsub.vv v8, v8, v24
	; RV32-NEXT: vand.vv v0, v8, v16			; RV32-NEXT: vand.vv v24, v8, v0
	; RV32-NEXT: vsrl.vi v8, v8, 2			; RV32-NEXT: vsrl.vi v8, v8, 2
	; RV32-NEXT: vand.vv v8, v8, v16			; RV32-NEXT: vand.vv v8, v8, v0
	; RV32-NEXT: vadd.vv v8, v0, v8			; RV32-NEXT: vadd.vv v8, v24, v8
	; RV32-NEXT: vsrl.vi v16, v8, 4			; RV32-NEXT: vsrl.vi v24, v8, 4
	; RV32-NEXT: vadd.vv v8, v8, v16			; RV32-NEXT: vadd.vv v8, v8, v24
	; RV32-NEXT: csrr a0, vlenb			; RV32-NEXT: csrr a0, vlenb
	; RV32-NEXT: slli a0, a0, 4			; RV32-NEXT: slli a0, a0, 4
	; RV32-NEXT: add a0, sp, a0			; RV32-NEXT: add a0, sp, a0
	; RV32-NEXT: addi a0, a0, 16			; RV32-NEXT: addi a0, a0, 16
	; RV32-NEXT: vl8r.v v16, (a0) # Unknown-size Folded Reload			; RV32-NEXT: vl8r.v v16, (a0) # Unknown-size Folded Reload
	; RV32-NEXT: vand.vv v8, v8, v16			; RV32-NEXT: vand.vv v8, v8, v16
	; RV32-NEXT: addi a0, sp, 16			; RV32-NEXT: addi a0, sp, 16
	; RV32-NEXT: vl8r.v v16, (a0) # Unknown-size Folded Reload			; RV32-NEXT: vl8r.v v16, (a0) # Unknown-size Folded Reload
	; RV32-NEXT: vmul.vv v8, v8, v16			; RV32-NEXT: vmul.vv v8, v8, v16
	; RV32-NEXT: vsrl.vx v16, v8, a2			; RV32-NEXT: vsrl.vx v16, v8, a1
	; RV32-NEXT: csrr a0, vlenb			; RV32-NEXT: csrr a0, vlenb
	; RV32-NEXT: slli a0, a0, 3			; RV32-NEXT: slli a0, a0, 3
	; RV32-NEXT: add a0, sp, a0			; RV32-NEXT: add a0, sp, a0
	; RV32-NEXT: addi a0, a0, 16			; RV32-NEXT: addi a0, a0, 16
	; RV32-NEXT: vl8r.v v8, (a0) # Unknown-size Folded Reload			; RV32-NEXT: vl8r.v v8, (a0) # Unknown-size Folded Reload
	; RV32-NEXT: csrr a0, vlenb			; RV32-NEXT: csrr a0, vlenb
	; RV32-NEXT: li a1, 40			; RV32-NEXT: slli a0, a0, 5
	; RV32-NEXT: mul a0, a0, a1
	; RV32-NEXT: add sp, sp, a0			; RV32-NEXT: add sp, sp, a0
	; RV32-NEXT: addi sp, sp, 16			; RV32-NEXT: addi sp, sp, 16
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vp_ctlz_zero_undef_v32i64_unmasked:			; RV64-LABEL: vp_ctlz_zero_undef_v32i64_unmasked:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: li a2, 16			; RV64-NEXT: li a2, 16
	; RV64-NEXT: mv a1, a0			; RV64-NEXT: mv a1, a0
	▲ Show 20 Lines • Show All 84 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-ctlz.ll

	Show First 20 Lines • Show All 469 Lines • ▼ Show 20 Lines
	; LMULMAX2-RV32I-NEXT: vor.vv v8, v8, v9			; LMULMAX2-RV32I-NEXT: vor.vv v8, v8, v9
	; LMULMAX2-RV32I-NEXT: vsrl.vi v9, v8, 8			; LMULMAX2-RV32I-NEXT: vsrl.vi v9, v8, 8
	; LMULMAX2-RV32I-NEXT: vor.vv v8, v8, v9			; LMULMAX2-RV32I-NEXT: vor.vv v8, v8, v9
	; LMULMAX2-RV32I-NEXT: vsrl.vi v9, v8, 16			; LMULMAX2-RV32I-NEXT: vsrl.vi v9, v8, 16
	; LMULMAX2-RV32I-NEXT: vor.vv v8, v8, v9			; LMULMAX2-RV32I-NEXT: vor.vv v8, v8, v9
	; LMULMAX2-RV32I-NEXT: li a1, 32			; LMULMAX2-RV32I-NEXT: li a1, 32
	; LMULMAX2-RV32I-NEXT: vsrl.vx v9, v8, a1			; LMULMAX2-RV32I-NEXT: vsrl.vx v9, v8, a1
	; LMULMAX2-RV32I-NEXT: vor.vv v8, v8, v9			; LMULMAX2-RV32I-NEXT: vor.vv v8, v8, v9
	; LMULMAX2-RV32I-NEXT: vsetivli zero, 4, e32, m1, ta, ma			; LMULMAX2-RV32I-NEXT: vnot.v v8, v8
	; LMULMAX2-RV32I-NEXT: vmv.v.i v9, -1
	; LMULMAX2-RV32I-NEXT: vsetivli zero, 2, e64, m1, ta, ma
	; LMULMAX2-RV32I-NEXT: vxor.vv v8, v8, v9
	; LMULMAX2-RV32I-NEXT: vsrl.vi v9, v8, 1			; LMULMAX2-RV32I-NEXT: vsrl.vi v9, v8, 1
	; LMULMAX2-RV32I-NEXT: lui a1, 349525			; LMULMAX2-RV32I-NEXT: lui a1, 349525
	; LMULMAX2-RV32I-NEXT: addi a1, a1, 1365			; LMULMAX2-RV32I-NEXT: addi a1, a1, 1365
	; LMULMAX2-RV32I-NEXT: vsetivli zero, 4, e32, m1, ta, ma			; LMULMAX2-RV32I-NEXT: vsetivli zero, 4, e32, m1, ta, ma
	; LMULMAX2-RV32I-NEXT: vmv.v.x v10, a1			; LMULMAX2-RV32I-NEXT: vmv.v.x v10, a1
	; LMULMAX2-RV32I-NEXT: vsetivli zero, 2, e64, m1, ta, ma			; LMULMAX2-RV32I-NEXT: vsetivli zero, 2, e64, m1, ta, ma
	; LMULMAX2-RV32I-NEXT: vand.vv v9, v9, v10			; LMULMAX2-RV32I-NEXT: vand.vv v9, v9, v10
	; LMULMAX2-RV32I-NEXT: vsub.vv v8, v8, v9			; LMULMAX2-RV32I-NEXT: vsub.vv v8, v8, v9
	▲ Show 20 Lines • Show All 677 Lines • ▼ Show 20 Lines
	; LMULMAX2-RV32I-NEXT: vor.vv v8, v8, v10			; LMULMAX2-RV32I-NEXT: vor.vv v8, v8, v10
	; LMULMAX2-RV32I-NEXT: vsrl.vi v10, v8, 8			; LMULMAX2-RV32I-NEXT: vsrl.vi v10, v8, 8
	; LMULMAX2-RV32I-NEXT: vor.vv v8, v8, v10			; LMULMAX2-RV32I-NEXT: vor.vv v8, v8, v10
	; LMULMAX2-RV32I-NEXT: vsrl.vi v10, v8, 16			; LMULMAX2-RV32I-NEXT: vsrl.vi v10, v8, 16
	; LMULMAX2-RV32I-NEXT: vor.vv v8, v8, v10			; LMULMAX2-RV32I-NEXT: vor.vv v8, v8, v10
	; LMULMAX2-RV32I-NEXT: li a1, 32			; LMULMAX2-RV32I-NEXT: li a1, 32
	; LMULMAX2-RV32I-NEXT: vsrl.vx v10, v8, a1			; LMULMAX2-RV32I-NEXT: vsrl.vx v10, v8, a1
	; LMULMAX2-RV32I-NEXT: vor.vv v8, v8, v10			; LMULMAX2-RV32I-NEXT: vor.vv v8, v8, v10
	; LMULMAX2-RV32I-NEXT: vsetivli zero, 8, e32, m2, ta, ma			; LMULMAX2-RV32I-NEXT: vnot.v v8, v8
	; LMULMAX2-RV32I-NEXT: vmv.v.i v10, -1
	; LMULMAX2-RV32I-NEXT: vsetivli zero, 4, e64, m2, ta, ma
	; LMULMAX2-RV32I-NEXT: vxor.vv v8, v8, v10
	; LMULMAX2-RV32I-NEXT: vsrl.vi v10, v8, 1			; LMULMAX2-RV32I-NEXT: vsrl.vi v10, v8, 1
	; LMULMAX2-RV32I-NEXT: lui a1, 349525			; LMULMAX2-RV32I-NEXT: lui a1, 349525
	; LMULMAX2-RV32I-NEXT: addi a1, a1, 1365			; LMULMAX2-RV32I-NEXT: addi a1, a1, 1365
	; LMULMAX2-RV32I-NEXT: vsetivli zero, 8, e32, m2, ta, ma			; LMULMAX2-RV32I-NEXT: vsetivli zero, 8, e32, m2, ta, ma
	; LMULMAX2-RV32I-NEXT: vmv.v.x v12, a1			; LMULMAX2-RV32I-NEXT: vmv.v.x v12, a1
	; LMULMAX2-RV32I-NEXT: vsetivli zero, 4, e64, m2, ta, ma			; LMULMAX2-RV32I-NEXT: vsetivli zero, 4, e64, m2, ta, ma
	; LMULMAX2-RV32I-NEXT: vand.vv v10, v10, v12			; LMULMAX2-RV32I-NEXT: vand.vv v10, v10, v12
	; LMULMAX2-RV32I-NEXT: vsub.vv v8, v8, v10			; LMULMAX2-RV32I-NEXT: vsub.vv v8, v8, v10
	▲ Show 20 Lines • Show All 605 Lines • ▼ Show 20 Lines
	; LMULMAX2-RV32I-NEXT: vor.vv v8, v8, v9			; LMULMAX2-RV32I-NEXT: vor.vv v8, v8, v9
	; LMULMAX2-RV32I-NEXT: vsrl.vi v9, v8, 8			; LMULMAX2-RV32I-NEXT: vsrl.vi v9, v8, 8
	; LMULMAX2-RV32I-NEXT: vor.vv v8, v8, v9			; LMULMAX2-RV32I-NEXT: vor.vv v8, v8, v9
	; LMULMAX2-RV32I-NEXT: vsrl.vi v9, v8, 16			; LMULMAX2-RV32I-NEXT: vsrl.vi v9, v8, 16
	; LMULMAX2-RV32I-NEXT: vor.vv v8, v8, v9			; LMULMAX2-RV32I-NEXT: vor.vv v8, v8, v9
	; LMULMAX2-RV32I-NEXT: li a1, 32			; LMULMAX2-RV32I-NEXT: li a1, 32
	; LMULMAX2-RV32I-NEXT: vsrl.vx v9, v8, a1			; LMULMAX2-RV32I-NEXT: vsrl.vx v9, v8, a1
	; LMULMAX2-RV32I-NEXT: vor.vv v8, v8, v9			; LMULMAX2-RV32I-NEXT: vor.vv v8, v8, v9
	; LMULMAX2-RV32I-NEXT: vsetivli zero, 4, e32, m1, ta, ma			; LMULMAX2-RV32I-NEXT: vnot.v v8, v8
	; LMULMAX2-RV32I-NEXT: vmv.v.i v9, -1
	; LMULMAX2-RV32I-NEXT: vsetivli zero, 2, e64, m1, ta, ma
	; LMULMAX2-RV32I-NEXT: vxor.vv v8, v8, v9
	; LMULMAX2-RV32I-NEXT: vsrl.vi v9, v8, 1			; LMULMAX2-RV32I-NEXT: vsrl.vi v9, v8, 1
	; LMULMAX2-RV32I-NEXT: lui a1, 349525			; LMULMAX2-RV32I-NEXT: lui a1, 349525
	; LMULMAX2-RV32I-NEXT: addi a1, a1, 1365			; LMULMAX2-RV32I-NEXT: addi a1, a1, 1365
	; LMULMAX2-RV32I-NEXT: vsetivli zero, 4, e32, m1, ta, ma			; LMULMAX2-RV32I-NEXT: vsetivli zero, 4, e32, m1, ta, ma
	; LMULMAX2-RV32I-NEXT: vmv.v.x v10, a1			; LMULMAX2-RV32I-NEXT: vmv.v.x v10, a1
	; LMULMAX2-RV32I-NEXT: vsetivli zero, 2, e64, m1, ta, ma			; LMULMAX2-RV32I-NEXT: vsetivli zero, 2, e64, m1, ta, ma
	; LMULMAX2-RV32I-NEXT: vand.vv v9, v9, v10			; LMULMAX2-RV32I-NEXT: vand.vv v9, v9, v10
	; LMULMAX2-RV32I-NEXT: vsub.vv v8, v8, v9			; LMULMAX2-RV32I-NEXT: vsub.vv v8, v8, v9
	▲ Show 20 Lines • Show All 647 Lines • ▼ Show 20 Lines
	; LMULMAX2-RV32I-NEXT: vor.vv v8, v8, v10			; LMULMAX2-RV32I-NEXT: vor.vv v8, v8, v10
	; LMULMAX2-RV32I-NEXT: vsrl.vi v10, v8, 8			; LMULMAX2-RV32I-NEXT: vsrl.vi v10, v8, 8
	; LMULMAX2-RV32I-NEXT: vor.vv v8, v8, v10			; LMULMAX2-RV32I-NEXT: vor.vv v8, v8, v10
	; LMULMAX2-RV32I-NEXT: vsrl.vi v10, v8, 16			; LMULMAX2-RV32I-NEXT: vsrl.vi v10, v8, 16
	; LMULMAX2-RV32I-NEXT: vor.vv v8, v8, v10			; LMULMAX2-RV32I-NEXT: vor.vv v8, v8, v10
	; LMULMAX2-RV32I-NEXT: li a1, 32			; LMULMAX2-RV32I-NEXT: li a1, 32
	; LMULMAX2-RV32I-NEXT: vsrl.vx v10, v8, a1			; LMULMAX2-RV32I-NEXT: vsrl.vx v10, v8, a1
	; LMULMAX2-RV32I-NEXT: vor.vv v8, v8, v10			; LMULMAX2-RV32I-NEXT: vor.vv v8, v8, v10
	; LMULMAX2-RV32I-NEXT: vsetivli zero, 8, e32, m2, ta, ma			; LMULMAX2-RV32I-NEXT: vnot.v v8, v8
	; LMULMAX2-RV32I-NEXT: vmv.v.i v10, -1
	; LMULMAX2-RV32I-NEXT: vsetivli zero, 4, e64, m2, ta, ma
	; LMULMAX2-RV32I-NEXT: vxor.vv v8, v8, v10
	; LMULMAX2-RV32I-NEXT: vsrl.vi v10, v8, 1			; LMULMAX2-RV32I-NEXT: vsrl.vi v10, v8, 1
	; LMULMAX2-RV32I-NEXT: lui a1, 349525			; LMULMAX2-RV32I-NEXT: lui a1, 349525
	; LMULMAX2-RV32I-NEXT: addi a1, a1, 1365			; LMULMAX2-RV32I-NEXT: addi a1, a1, 1365
	; LMULMAX2-RV32I-NEXT: vsetivli zero, 8, e32, m2, ta, ma			; LMULMAX2-RV32I-NEXT: vsetivli zero, 8, e32, m2, ta, ma
	; LMULMAX2-RV32I-NEXT: vmv.v.x v12, a1			; LMULMAX2-RV32I-NEXT: vmv.v.x v12, a1
	; LMULMAX2-RV32I-NEXT: vsetivli zero, 4, e64, m2, ta, ma			; LMULMAX2-RV32I-NEXT: vsetivli zero, 4, e64, m2, ta, ma
	; LMULMAX2-RV32I-NEXT: vand.vv v10, v10, v12			; LMULMAX2-RV32I-NEXT: vand.vv v10, v10, v12
	; LMULMAX2-RV32I-NEXT: vsub.vv v8, v8, v10			; LMULMAX2-RV32I-NEXT: vsub.vv v8, v8, v10
	▲ Show 20 Lines • Show All 163 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-cttz-vp.ll

Show First 20 Lines • Show All 1,230 Lines • ▼ Show 20 Lines
declare <2 x i64> @llvm.vp.cttz.v2i64(<2 x i64>, i1 immarg, <2 x i1>, i32)		declare <2 x i64> @llvm.vp.cttz.v2i64(<2 x i64>, i1 immarg, <2 x i1>, i32)

define <2 x i64> @vp_cttz_v2i64(<2 x i64> %va, <2 x i1> %m, i32 zeroext %evl) {		define <2 x i64> @vp_cttz_v2i64(<2 x i64> %va, <2 x i1> %m, i32 zeroext %evl) {
; RV32-LABEL: vp_cttz_v2i64:		; RV32-LABEL: vp_cttz_v2i64:
; RV32: # %bb.0:		; RV32: # %bb.0:
; RV32-NEXT: li a1, 1		; RV32-NEXT: li a1, 1
; RV32-NEXT: vsetvli zero, a0, e64, m1, ta, ma		; RV32-NEXT: vsetvli zero, a0, e64, m1, ta, ma
; RV32-NEXT: vsub.vx v9, v8, a1, v0.t		; RV32-NEXT: vsub.vx v9, v8, a1, v0.t
; RV32-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; RV32-NEXT: vnot.v v8, v8, v0.t
; RV32-NEXT: vmv.v.i v10, -1
; RV32-NEXT: vsetvli zero, a0, e64, m1, ta, ma
; RV32-NEXT: vxor.vv v8, v8, v10, v0.t
; RV32-NEXT: vand.vv v8, v8, v9, v0.t		; RV32-NEXT: vand.vv v8, v8, v9, v0.t
; RV32-NEXT: vsrl.vi v9, v8, 1, v0.t		; RV32-NEXT: vsrl.vi v9, v8, 1, v0.t
; RV32-NEXT: lui a1, 349525		; RV32-NEXT: lui a1, 349525
; RV32-NEXT: addi a1, a1, 1365		; RV32-NEXT: addi a1, a1, 1365
; RV32-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; RV32-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; RV32-NEXT: vmv.v.x v10, a1		; RV32-NEXT: vmv.v.x v10, a1
; RV32-NEXT: vsetvli zero, a0, e64, m1, ta, ma		; RV32-NEXT: vsetvli zero, a0, e64, m1, ta, ma
; RV32-NEXT: vand.vv v9, v9, v10, v0.t		; RV32-NEXT: vand.vv v9, v9, v10, v0.t
▲ Show 20 Lines • Show All 67 Lines • ▼ Show 20 Lines
}		}

define <2 x i64> @vp_cttz_v2i64_unmasked(<2 x i64> %va, i32 zeroext %evl) {		define <2 x i64> @vp_cttz_v2i64_unmasked(<2 x i64> %va, i32 zeroext %evl) {
; RV32-LABEL: vp_cttz_v2i64_unmasked:		; RV32-LABEL: vp_cttz_v2i64_unmasked:
; RV32: # %bb.0:		; RV32: # %bb.0:
; RV32-NEXT: li a1, 1		; RV32-NEXT: li a1, 1
; RV32-NEXT: vsetvli zero, a0, e64, m1, ta, ma		; RV32-NEXT: vsetvli zero, a0, e64, m1, ta, ma
; RV32-NEXT: vsub.vx v9, v8, a1		; RV32-NEXT: vsub.vx v9, v8, a1
; RV32-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; RV32-NEXT: vnot.v v8, v8
; RV32-NEXT: vmv.v.i v10, -1
; RV32-NEXT: vsetvli zero, a0, e64, m1, ta, ma
; RV32-NEXT: vxor.vv v8, v8, v10
; RV32-NEXT: vand.vv v8, v8, v9		; RV32-NEXT: vand.vv v8, v8, v9
; RV32-NEXT: vsrl.vi v9, v8, 1		; RV32-NEXT: vsrl.vi v9, v8, 1
; RV32-NEXT: lui a1, 349525		; RV32-NEXT: lui a1, 349525
; RV32-NEXT: addi a1, a1, 1365		; RV32-NEXT: addi a1, a1, 1365
; RV32-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; RV32-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; RV32-NEXT: vmv.v.x v10, a1		; RV32-NEXT: vmv.v.x v10, a1
; RV32-NEXT: vsetvli zero, a0, e64, m1, ta, ma		; RV32-NEXT: vsetvli zero, a0, e64, m1, ta, ma
; RV32-NEXT: vand.vv v9, v9, v10		; RV32-NEXT: vand.vv v9, v9, v10
▲ Show 20 Lines • Show All 71 Lines • ▼ Show 20 Lines
declare <4 x i64> @llvm.vp.cttz.v4i64(<4 x i64>, i1 immarg, <4 x i1>, i32)		declare <4 x i64> @llvm.vp.cttz.v4i64(<4 x i64>, i1 immarg, <4 x i1>, i32)

define <4 x i64> @vp_cttz_v4i64(<4 x i64> %va, <4 x i1> %m, i32 zeroext %evl) {		define <4 x i64> @vp_cttz_v4i64(<4 x i64> %va, <4 x i1> %m, i32 zeroext %evl) {
; RV32-LABEL: vp_cttz_v4i64:		; RV32-LABEL: vp_cttz_v4i64:
; RV32: # %bb.0:		; RV32: # %bb.0:
; RV32-NEXT: li a1, 1		; RV32-NEXT: li a1, 1
; RV32-NEXT: vsetvli zero, a0, e64, m2, ta, ma		; RV32-NEXT: vsetvli zero, a0, e64, m2, ta, ma
; RV32-NEXT: vsub.vx v10, v8, a1, v0.t		; RV32-NEXT: vsub.vx v10, v8, a1, v0.t
; RV32-NEXT: vsetivli zero, 8, e32, m2, ta, ma		; RV32-NEXT: vnot.v v8, v8, v0.t
; RV32-NEXT: vmv.v.i v12, -1
; RV32-NEXT: vsetvli zero, a0, e64, m2, ta, ma
; RV32-NEXT: vxor.vv v8, v8, v12, v0.t
; RV32-NEXT: vand.vv v8, v8, v10, v0.t		; RV32-NEXT: vand.vv v8, v8, v10, v0.t
; RV32-NEXT: vsrl.vi v10, v8, 1, v0.t		; RV32-NEXT: vsrl.vi v10, v8, 1, v0.t
; RV32-NEXT: lui a1, 349525		; RV32-NEXT: lui a1, 349525
; RV32-NEXT: addi a1, a1, 1365		; RV32-NEXT: addi a1, a1, 1365
; RV32-NEXT: vsetivli zero, 8, e32, m2, ta, ma		; RV32-NEXT: vsetivli zero, 8, e32, m2, ta, ma
; RV32-NEXT: vmv.v.x v12, a1		; RV32-NEXT: vmv.v.x v12, a1
; RV32-NEXT: vsetvli zero, a0, e64, m2, ta, ma		; RV32-NEXT: vsetvli zero, a0, e64, m2, ta, ma
; RV32-NEXT: vand.vv v10, v10, v12, v0.t		; RV32-NEXT: vand.vv v10, v10, v12, v0.t
▲ Show 20 Lines • Show All 67 Lines • ▼ Show 20 Lines
}		}

define <4 x i64> @vp_cttz_v4i64_unmasked(<4 x i64> %va, i32 zeroext %evl) {		define <4 x i64> @vp_cttz_v4i64_unmasked(<4 x i64> %va, i32 zeroext %evl) {
; RV32-LABEL: vp_cttz_v4i64_unmasked:		; RV32-LABEL: vp_cttz_v4i64_unmasked:
; RV32: # %bb.0:		; RV32: # %bb.0:
; RV32-NEXT: li a1, 1		; RV32-NEXT: li a1, 1
; RV32-NEXT: vsetvli zero, a0, e64, m2, ta, ma		; RV32-NEXT: vsetvli zero, a0, e64, m2, ta, ma
; RV32-NEXT: vsub.vx v10, v8, a1		; RV32-NEXT: vsub.vx v10, v8, a1
; RV32-NEXT: vsetivli zero, 8, e32, m2, ta, ma		; RV32-NEXT: vnot.v v8, v8
; RV32-NEXT: vmv.v.i v12, -1
; RV32-NEXT: vsetvli zero, a0, e64, m2, ta, ma
; RV32-NEXT: vxor.vv v8, v8, v12
; RV32-NEXT: vand.vv v8, v8, v10		; RV32-NEXT: vand.vv v8, v8, v10
; RV32-NEXT: vsrl.vi v10, v8, 1		; RV32-NEXT: vsrl.vi v10, v8, 1
; RV32-NEXT: lui a1, 349525		; RV32-NEXT: lui a1, 349525
; RV32-NEXT: addi a1, a1, 1365		; RV32-NEXT: addi a1, a1, 1365
; RV32-NEXT: vsetivli zero, 8, e32, m2, ta, ma		; RV32-NEXT: vsetivli zero, 8, e32, m2, ta, ma
; RV32-NEXT: vmv.v.x v12, a1		; RV32-NEXT: vmv.v.x v12, a1
; RV32-NEXT: vsetvli zero, a0, e64, m2, ta, ma		; RV32-NEXT: vsetvli zero, a0, e64, m2, ta, ma
; RV32-NEXT: vand.vv v10, v10, v12		; RV32-NEXT: vand.vv v10, v10, v12
▲ Show 20 Lines • Show All 71 Lines • ▼ Show 20 Lines
declare <8 x i64> @llvm.vp.cttz.v8i64(<8 x i64>, i1 immarg, <8 x i1>, i32)		declare <8 x i64> @llvm.vp.cttz.v8i64(<8 x i64>, i1 immarg, <8 x i1>, i32)

define <8 x i64> @vp_cttz_v8i64(<8 x i64> %va, <8 x i1> %m, i32 zeroext %evl) {		define <8 x i64> @vp_cttz_v8i64(<8 x i64> %va, <8 x i1> %m, i32 zeroext %evl) {
; RV32-LABEL: vp_cttz_v8i64:		; RV32-LABEL: vp_cttz_v8i64:
; RV32: # %bb.0:		; RV32: # %bb.0:
; RV32-NEXT: li a1, 1		; RV32-NEXT: li a1, 1
; RV32-NEXT: vsetvli zero, a0, e64, m4, ta, ma		; RV32-NEXT: vsetvli zero, a0, e64, m4, ta, ma
; RV32-NEXT: vsub.vx v12, v8, a1, v0.t		; RV32-NEXT: vsub.vx v12, v8, a1, v0.t
; RV32-NEXT: vsetivli zero, 16, e32, m4, ta, ma		; RV32-NEXT: vnot.v v8, v8, v0.t
; RV32-NEXT: vmv.v.i v16, -1
; RV32-NEXT: vsetvli zero, a0, e64, m4, ta, ma
; RV32-NEXT: vxor.vv v8, v8, v16, v0.t
; RV32-NEXT: vand.vv v8, v8, v12, v0.t		; RV32-NEXT: vand.vv v8, v8, v12, v0.t
; RV32-NEXT: vsrl.vi v12, v8, 1, v0.t		; RV32-NEXT: vsrl.vi v12, v8, 1, v0.t
; RV32-NEXT: lui a1, 349525		; RV32-NEXT: lui a1, 349525
; RV32-NEXT: addi a1, a1, 1365		; RV32-NEXT: addi a1, a1, 1365
; RV32-NEXT: vsetivli zero, 16, e32, m4, ta, ma		; RV32-NEXT: vsetivli zero, 16, e32, m4, ta, ma
; RV32-NEXT: vmv.v.x v16, a1		; RV32-NEXT: vmv.v.x v16, a1
; RV32-NEXT: vsetvli zero, a0, e64, m4, ta, ma		; RV32-NEXT: vsetvli zero, a0, e64, m4, ta, ma
; RV32-NEXT: vand.vv v12, v12, v16, v0.t		; RV32-NEXT: vand.vv v12, v12, v16, v0.t
▲ Show 20 Lines • Show All 67 Lines • ▼ Show 20 Lines
}		}

define <8 x i64> @vp_cttz_v8i64_unmasked(<8 x i64> %va, i32 zeroext %evl) {		define <8 x i64> @vp_cttz_v8i64_unmasked(<8 x i64> %va, i32 zeroext %evl) {
; RV32-LABEL: vp_cttz_v8i64_unmasked:		; RV32-LABEL: vp_cttz_v8i64_unmasked:
; RV32: # %bb.0:		; RV32: # %bb.0:
; RV32-NEXT: li a1, 1		; RV32-NEXT: li a1, 1
; RV32-NEXT: vsetvli zero, a0, e64, m4, ta, ma		; RV32-NEXT: vsetvli zero, a0, e64, m4, ta, ma
; RV32-NEXT: vsub.vx v12, v8, a1		; RV32-NEXT: vsub.vx v12, v8, a1
; RV32-NEXT: vsetivli zero, 16, e32, m4, ta, ma		; RV32-NEXT: vnot.v v8, v8
; RV32-NEXT: vmv.v.i v16, -1
; RV32-NEXT: vsetvli zero, a0, e64, m4, ta, ma
; RV32-NEXT: vxor.vv v8, v8, v16
; RV32-NEXT: vand.vv v8, v8, v12		; RV32-NEXT: vand.vv v8, v8, v12
; RV32-NEXT: vsrl.vi v12, v8, 1		; RV32-NEXT: vsrl.vi v12, v8, 1
; RV32-NEXT: lui a1, 349525		; RV32-NEXT: lui a1, 349525
; RV32-NEXT: addi a1, a1, 1365		; RV32-NEXT: addi a1, a1, 1365
; RV32-NEXT: vsetivli zero, 16, e32, m4, ta, ma		; RV32-NEXT: vsetivli zero, 16, e32, m4, ta, ma
; RV32-NEXT: vmv.v.x v16, a1		; RV32-NEXT: vmv.v.x v16, a1
; RV32-NEXT: vsetvli zero, a0, e64, m4, ta, ma		; RV32-NEXT: vsetvli zero, a0, e64, m4, ta, ma
; RV32-NEXT: vand.vv v12, v12, v16		; RV32-NEXT: vand.vv v12, v12, v16
▲ Show 20 Lines • Show All 71 Lines • ▼ Show 20 Lines
declare <15 x i64> @llvm.vp.cttz.v15i64(<15 x i64>, i1 immarg, <15 x i1>, i32)		declare <15 x i64> @llvm.vp.cttz.v15i64(<15 x i64>, i1 immarg, <15 x i1>, i32)

define <15 x i64> @vp_cttz_v15i64(<15 x i64> %va, <15 x i1> %m, i32 zeroext %evl) {		define <15 x i64> @vp_cttz_v15i64(<15 x i64> %va, <15 x i1> %m, i32 zeroext %evl) {
; RV32-LABEL: vp_cttz_v15i64:		; RV32-LABEL: vp_cttz_v15i64:
; RV32: # %bb.0:		; RV32: # %bb.0:
; RV32-NEXT: li a1, 1		; RV32-NEXT: li a1, 1
; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma		; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma
; RV32-NEXT: vsub.vx v16, v8, a1, v0.t		; RV32-NEXT: vsub.vx v16, v8, a1, v0.t
; RV32-NEXT: li a1, 32		; RV32-NEXT: vnot.v v8, v8, v0.t
; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma
; RV32-NEXT: vmv.v.i v24, -1
; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma
; RV32-NEXT: vxor.vv v8, v8, v24, v0.t
; RV32-NEXT: vand.vv v8, v8, v16, v0.t		; RV32-NEXT: vand.vv v8, v8, v16, v0.t
; RV32-NEXT: vsrl.vi v16, v8, 1, v0.t		; RV32-NEXT: vsrl.vi v16, v8, 1, v0.t
; RV32-NEXT: lui a2, 349525		; RV32-NEXT: lui a1, 349525
; RV32-NEXT: addi a2, a2, 1365		; RV32-NEXT: addi a1, a1, 1365
; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma		; RV32-NEXT: li a2, 32
; RV32-NEXT: vmv.v.x v24, a2		; RV32-NEXT: vsetvli zero, a2, e32, m8, ta, ma
		; RV32-NEXT: vmv.v.x v24, a1
; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma		; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma
; RV32-NEXT: vand.vv v16, v16, v24, v0.t		; RV32-NEXT: vand.vv v16, v16, v24, v0.t
; RV32-NEXT: vsub.vv v8, v8, v16, v0.t		; RV32-NEXT: vsub.vv v8, v8, v16, v0.t
; RV32-NEXT: lui a2, 209715		; RV32-NEXT: lui a1, 209715
; RV32-NEXT: addi a2, a2, 819		; RV32-NEXT: addi a1, a1, 819
; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma		; RV32-NEXT: vsetvli zero, a2, e32, m8, ta, ma
; RV32-NEXT: vmv.v.x v16, a2		; RV32-NEXT: vmv.v.x v16, a1
; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma		; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma
; RV32-NEXT: vand.vv v24, v8, v16, v0.t		; RV32-NEXT: vand.vv v24, v8, v16, v0.t
; RV32-NEXT: vsrl.vi v8, v8, 2, v0.t		; RV32-NEXT: vsrl.vi v8, v8, 2, v0.t
; RV32-NEXT: vand.vv v8, v8, v16, v0.t		; RV32-NEXT: vand.vv v8, v8, v16, v0.t
; RV32-NEXT: vadd.vv v8, v24, v8, v0.t		; RV32-NEXT: vadd.vv v8, v24, v8, v0.t
; RV32-NEXT: vsrl.vi v16, v8, 4, v0.t		; RV32-NEXT: vsrl.vi v16, v8, 4, v0.t
; RV32-NEXT: vadd.vv v8, v8, v16, v0.t		; RV32-NEXT: vadd.vv v8, v8, v16, v0.t
; RV32-NEXT: lui a2, 61681		; RV32-NEXT: lui a1, 61681
; RV32-NEXT: addi a2, a2, -241		; RV32-NEXT: addi a1, a1, -241
; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma		; RV32-NEXT: vsetvli zero, a2, e32, m8, ta, ma
; RV32-NEXT: vmv.v.x v16, a2		; RV32-NEXT: vmv.v.x v16, a1
; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma		; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma
; RV32-NEXT: vand.vv v8, v8, v16, v0.t		; RV32-NEXT: vand.vv v8, v8, v16, v0.t
; RV32-NEXT: lui a2, 4112		; RV32-NEXT: lui a1, 4112
; RV32-NEXT: addi a2, a2, 257		; RV32-NEXT: addi a1, a1, 257
; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma		; RV32-NEXT: vsetvli zero, a2, e32, m8, ta, ma
; RV32-NEXT: vmv.v.x v16, a2		; RV32-NEXT: vmv.v.x v16, a1
; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma		; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma
; RV32-NEXT: vmul.vv v8, v8, v16, v0.t		; RV32-NEXT: vmul.vv v8, v8, v16, v0.t
; RV32-NEXT: li a0, 56		; RV32-NEXT: li a0, 56
; RV32-NEXT: vsrl.vx v8, v8, a0, v0.t		; RV32-NEXT: vsrl.vx v8, v8, a0, v0.t
; RV32-NEXT: ret		; RV32-NEXT: ret
;		;
; RV64-LABEL: vp_cttz_v15i64:		; RV64-LABEL: vp_cttz_v15i64:
; RV64: # %bb.0:		; RV64: # %bb.0:
Show All 37 Lines
}		}

define <15 x i64> @vp_cttz_v15i64_unmasked(<15 x i64> %va, i32 zeroext %evl) {		define <15 x i64> @vp_cttz_v15i64_unmasked(<15 x i64> %va, i32 zeroext %evl) {
; RV32-LABEL: vp_cttz_v15i64_unmasked:		; RV32-LABEL: vp_cttz_v15i64_unmasked:
; RV32: # %bb.0:		; RV32: # %bb.0:
; RV32-NEXT: li a1, 1		; RV32-NEXT: li a1, 1
; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma		; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma
; RV32-NEXT: vsub.vx v16, v8, a1		; RV32-NEXT: vsub.vx v16, v8, a1
; RV32-NEXT: li a1, 32		; RV32-NEXT: vnot.v v8, v8
; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma
; RV32-NEXT: vmv.v.i v24, -1
; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma
; RV32-NEXT: vxor.vv v8, v8, v24
; RV32-NEXT: vand.vv v8, v8, v16		; RV32-NEXT: vand.vv v8, v8, v16
; RV32-NEXT: vsrl.vi v16, v8, 1		; RV32-NEXT: vsrl.vi v16, v8, 1
; RV32-NEXT: lui a2, 349525		; RV32-NEXT: lui a1, 349525
; RV32-NEXT: addi a2, a2, 1365		; RV32-NEXT: addi a1, a1, 1365
; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma		; RV32-NEXT: li a2, 32
; RV32-NEXT: vmv.v.x v24, a2		; RV32-NEXT: vsetvli zero, a2, e32, m8, ta, ma
		; RV32-NEXT: vmv.v.x v24, a1
; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma		; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma
; RV32-NEXT: vand.vv v16, v16, v24		; RV32-NEXT: vand.vv v16, v16, v24
; RV32-NEXT: vsub.vv v8, v8, v16		; RV32-NEXT: vsub.vv v8, v8, v16
; RV32-NEXT: lui a2, 209715		; RV32-NEXT: lui a1, 209715
; RV32-NEXT: addi a2, a2, 819		; RV32-NEXT: addi a1, a1, 819
; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma		; RV32-NEXT: vsetvli zero, a2, e32, m8, ta, ma
; RV32-NEXT: vmv.v.x v16, a2		; RV32-NEXT: vmv.v.x v16, a1
; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma		; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma
; RV32-NEXT: vand.vv v24, v8, v16		; RV32-NEXT: vand.vv v24, v8, v16
; RV32-NEXT: vsrl.vi v8, v8, 2		; RV32-NEXT: vsrl.vi v8, v8, 2
; RV32-NEXT: vand.vv v8, v8, v16		; RV32-NEXT: vand.vv v8, v8, v16
; RV32-NEXT: vadd.vv v8, v24, v8		; RV32-NEXT: vadd.vv v8, v24, v8
; RV32-NEXT: vsrl.vi v16, v8, 4		; RV32-NEXT: vsrl.vi v16, v8, 4
; RV32-NEXT: vadd.vv v8, v8, v16		; RV32-NEXT: vadd.vv v8, v8, v16
; RV32-NEXT: lui a2, 61681		; RV32-NEXT: lui a1, 61681
; RV32-NEXT: addi a2, a2, -241		; RV32-NEXT: addi a1, a1, -241
; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma		; RV32-NEXT: vsetvli zero, a2, e32, m8, ta, ma
; RV32-NEXT: vmv.v.x v16, a2		; RV32-NEXT: vmv.v.x v16, a1
; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma		; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma
; RV32-NEXT: vand.vv v8, v8, v16		; RV32-NEXT: vand.vv v8, v8, v16
; RV32-NEXT: lui a2, 4112		; RV32-NEXT: lui a1, 4112
; RV32-NEXT: addi a2, a2, 257		; RV32-NEXT: addi a1, a1, 257
; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma		; RV32-NEXT: vsetvli zero, a2, e32, m8, ta, ma
; RV32-NEXT: vmv.v.x v16, a2		; RV32-NEXT: vmv.v.x v16, a1
; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma		; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma
; RV32-NEXT: vmul.vv v8, v8, v16		; RV32-NEXT: vmul.vv v8, v8, v16
; RV32-NEXT: li a0, 56		; RV32-NEXT: li a0, 56
; RV32-NEXT: vsrl.vx v8, v8, a0		; RV32-NEXT: vsrl.vx v8, v8, a0
; RV32-NEXT: ret		; RV32-NEXT: ret
;		;
; RV64-LABEL: vp_cttz_v15i64_unmasked:		; RV64-LABEL: vp_cttz_v15i64_unmasked:
; RV64: # %bb.0:		; RV64: # %bb.0:
▲ Show 20 Lines • Show All 41 Lines • ▼ Show 20 Lines
declare <16 x i64> @llvm.vp.cttz.v16i64(<16 x i64>, i1 immarg, <16 x i1>, i32)		declare <16 x i64> @llvm.vp.cttz.v16i64(<16 x i64>, i1 immarg, <16 x i1>, i32)

define <16 x i64> @vp_cttz_v16i64(<16 x i64> %va, <16 x i1> %m, i32 zeroext %evl) {		define <16 x i64> @vp_cttz_v16i64(<16 x i64> %va, <16 x i1> %m, i32 zeroext %evl) {
; RV32-LABEL: vp_cttz_v16i64:		; RV32-LABEL: vp_cttz_v16i64:
; RV32: # %bb.0:		; RV32: # %bb.0:
; RV32-NEXT: li a1, 1		; RV32-NEXT: li a1, 1
; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma		; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma
; RV32-NEXT: vsub.vx v16, v8, a1, v0.t		; RV32-NEXT: vsub.vx v16, v8, a1, v0.t
; RV32-NEXT: li a1, 32		; RV32-NEXT: vnot.v v8, v8, v0.t
; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma
; RV32-NEXT: vmv.v.i v24, -1
; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma
; RV32-NEXT: vxor.vv v8, v8, v24, v0.t
; RV32-NEXT: vand.vv v8, v8, v16, v0.t		; RV32-NEXT: vand.vv v8, v8, v16, v0.t
; RV32-NEXT: vsrl.vi v16, v8, 1, v0.t		; RV32-NEXT: vsrl.vi v16, v8, 1, v0.t
; RV32-NEXT: lui a2, 349525		; RV32-NEXT: lui a1, 349525
; RV32-NEXT: addi a2, a2, 1365		; RV32-NEXT: addi a1, a1, 1365
; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma		; RV32-NEXT: li a2, 32
; RV32-NEXT: vmv.v.x v24, a2		; RV32-NEXT: vsetvli zero, a2, e32, m8, ta, ma
		; RV32-NEXT: vmv.v.x v24, a1
; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma		; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma
; RV32-NEXT: vand.vv v16, v16, v24, v0.t		; RV32-NEXT: vand.vv v16, v16, v24, v0.t
; RV32-NEXT: vsub.vv v8, v8, v16, v0.t		; RV32-NEXT: vsub.vv v8, v8, v16, v0.t
; RV32-NEXT: lui a2, 209715		; RV32-NEXT: lui a1, 209715
; RV32-NEXT: addi a2, a2, 819		; RV32-NEXT: addi a1, a1, 819
; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma		; RV32-NEXT: vsetvli zero, a2, e32, m8, ta, ma
; RV32-NEXT: vmv.v.x v16, a2		; RV32-NEXT: vmv.v.x v16, a1
; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma		; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma
; RV32-NEXT: vand.vv v24, v8, v16, v0.t		; RV32-NEXT: vand.vv v24, v8, v16, v0.t
; RV32-NEXT: vsrl.vi v8, v8, 2, v0.t		; RV32-NEXT: vsrl.vi v8, v8, 2, v0.t
; RV32-NEXT: vand.vv v8, v8, v16, v0.t		; RV32-NEXT: vand.vv v8, v8, v16, v0.t
; RV32-NEXT: vadd.vv v8, v24, v8, v0.t		; RV32-NEXT: vadd.vv v8, v24, v8, v0.t
; RV32-NEXT: vsrl.vi v16, v8, 4, v0.t		; RV32-NEXT: vsrl.vi v16, v8, 4, v0.t
; RV32-NEXT: vadd.vv v8, v8, v16, v0.t		; RV32-NEXT: vadd.vv v8, v8, v16, v0.t
; RV32-NEXT: lui a2, 61681		; RV32-NEXT: lui a1, 61681
; RV32-NEXT: addi a2, a2, -241		; RV32-NEXT: addi a1, a1, -241
; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma		; RV32-NEXT: vsetvli zero, a2, e32, m8, ta, ma
; RV32-NEXT: vmv.v.x v16, a2		; RV32-NEXT: vmv.v.x v16, a1
; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma		; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma
; RV32-NEXT: vand.vv v8, v8, v16, v0.t		; RV32-NEXT: vand.vv v8, v8, v16, v0.t
; RV32-NEXT: lui a2, 4112		; RV32-NEXT: lui a1, 4112
; RV32-NEXT: addi a2, a2, 257		; RV32-NEXT: addi a1, a1, 257
; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma		; RV32-NEXT: vsetvli zero, a2, e32, m8, ta, ma
; RV32-NEXT: vmv.v.x v16, a2		; RV32-NEXT: vmv.v.x v16, a1
; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma		; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma
; RV32-NEXT: vmul.vv v8, v8, v16, v0.t		; RV32-NEXT: vmul.vv v8, v8, v16, v0.t
; RV32-NEXT: li a0, 56		; RV32-NEXT: li a0, 56
; RV32-NEXT: vsrl.vx v8, v8, a0, v0.t		; RV32-NEXT: vsrl.vx v8, v8, a0, v0.t
; RV32-NEXT: ret		; RV32-NEXT: ret
;		;
; RV64-LABEL: vp_cttz_v16i64:		; RV64-LABEL: vp_cttz_v16i64:
; RV64: # %bb.0:		; RV64: # %bb.0:
Show All 37 Lines
}		}

define <16 x i64> @vp_cttz_v16i64_unmasked(<16 x i64> %va, i32 zeroext %evl) {		define <16 x i64> @vp_cttz_v16i64_unmasked(<16 x i64> %va, i32 zeroext %evl) {
; RV32-LABEL: vp_cttz_v16i64_unmasked:		; RV32-LABEL: vp_cttz_v16i64_unmasked:
; RV32: # %bb.0:		; RV32: # %bb.0:
; RV32-NEXT: li a1, 1		; RV32-NEXT: li a1, 1
; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma		; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma
; RV32-NEXT: vsub.vx v16, v8, a1		; RV32-NEXT: vsub.vx v16, v8, a1
; RV32-NEXT: li a1, 32		; RV32-NEXT: vnot.v v8, v8
; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma
; RV32-NEXT: vmv.v.i v24, -1
; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma
; RV32-NEXT: vxor.vv v8, v8, v24
; RV32-NEXT: vand.vv v8, v8, v16		; RV32-NEXT: vand.vv v8, v8, v16
; RV32-NEXT: vsrl.vi v16, v8, 1		; RV32-NEXT: vsrl.vi v16, v8, 1
; RV32-NEXT: lui a2, 349525		; RV32-NEXT: lui a1, 349525
; RV32-NEXT: addi a2, a2, 1365		; RV32-NEXT: addi a1, a1, 1365
; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma		; RV32-NEXT: li a2, 32
; RV32-NEXT: vmv.v.x v24, a2		; RV32-NEXT: vsetvli zero, a2, e32, m8, ta, ma
		; RV32-NEXT: vmv.v.x v24, a1
; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma		; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma
; RV32-NEXT: vand.vv v16, v16, v24		; RV32-NEXT: vand.vv v16, v16, v24
; RV32-NEXT: vsub.vv v8, v8, v16		; RV32-NEXT: vsub.vv v8, v8, v16
; RV32-NEXT: lui a2, 209715		; RV32-NEXT: lui a1, 209715
; RV32-NEXT: addi a2, a2, 819		; RV32-NEXT: addi a1, a1, 819
; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma		; RV32-NEXT: vsetvli zero, a2, e32, m8, ta, ma
; RV32-NEXT: vmv.v.x v16, a2		; RV32-NEXT: vmv.v.x v16, a1
; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma		; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma
; RV32-NEXT: vand.vv v24, v8, v16		; RV32-NEXT: vand.vv v24, v8, v16
; RV32-NEXT: vsrl.vi v8, v8, 2		; RV32-NEXT: vsrl.vi v8, v8, 2
; RV32-NEXT: vand.vv v8, v8, v16		; RV32-NEXT: vand.vv v8, v8, v16
; RV32-NEXT: vadd.vv v8, v24, v8		; RV32-NEXT: vadd.vv v8, v24, v8
; RV32-NEXT: vsrl.vi v16, v8, 4		; RV32-NEXT: vsrl.vi v16, v8, 4
; RV32-NEXT: vadd.vv v8, v8, v16		; RV32-NEXT: vadd.vv v8, v8, v16
; RV32-NEXT: lui a2, 61681		; RV32-NEXT: lui a1, 61681
; RV32-NEXT: addi a2, a2, -241		; RV32-NEXT: addi a1, a1, -241
; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma		; RV32-NEXT: vsetvli zero, a2, e32, m8, ta, ma
; RV32-NEXT: vmv.v.x v16, a2		; RV32-NEXT: vmv.v.x v16, a1
; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma		; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma
; RV32-NEXT: vand.vv v8, v8, v16		; RV32-NEXT: vand.vv v8, v8, v16
; RV32-NEXT: lui a2, 4112		; RV32-NEXT: lui a1, 4112
; RV32-NEXT: addi a2, a2, 257		; RV32-NEXT: addi a1, a1, 257
; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma		; RV32-NEXT: vsetvli zero, a2, e32, m8, ta, ma
; RV32-NEXT: vmv.v.x v16, a2		; RV32-NEXT: vmv.v.x v16, a1
; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma		; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma
; RV32-NEXT: vmul.vv v8, v8, v16		; RV32-NEXT: vmul.vv v8, v8, v16
; RV32-NEXT: li a0, 56		; RV32-NEXT: li a0, 56
; RV32-NEXT: vsrl.vx v8, v8, a0		; RV32-NEXT: vsrl.vx v8, v8, a0
; RV32-NEXT: ret		; RV32-NEXT: ret
;		;
; RV64-LABEL: vp_cttz_v16i64_unmasked:		; RV64-LABEL: vp_cttz_v16i64_unmasked:
; RV64: # %bb.0:		; RV64: # %bb.0:
▲ Show 20 Lines • Show All 41 Lines • ▼ Show 20 Lines
declare <32 x i64> @llvm.vp.cttz.v32i64(<32 x i64>, i1 immarg, <32 x i1>, i32)		declare <32 x i64> @llvm.vp.cttz.v32i64(<32 x i64>, i1 immarg, <32 x i1>, i32)

define <32 x i64> @vp_cttz_v32i64(<32 x i64> %va, <32 x i1> %m, i32 zeroext %evl) {		define <32 x i64> @vp_cttz_v32i64(<32 x i64> %va, <32 x i1> %m, i32 zeroext %evl) {
; RV32-LABEL: vp_cttz_v32i64:		; RV32-LABEL: vp_cttz_v32i64:
; RV32: # %bb.0:		; RV32: # %bb.0:
; RV32-NEXT: addi sp, sp, -16		; RV32-NEXT: addi sp, sp, -16
; RV32-NEXT: .cfi_def_cfa_offset 16		; RV32-NEXT: .cfi_def_cfa_offset 16
; RV32-NEXT: csrr a1, vlenb		; RV32-NEXT: csrr a1, vlenb
; RV32-NEXT: slli a1, a1, 6		; RV32-NEXT: li a2, 56
		; RV32-NEXT: mul a1, a1, a2
; RV32-NEXT: sub sp, sp, a1		; RV32-NEXT: sub sp, sp, a1
; RV32-NEXT: .cfi_escape 0x0f, 0x0e, 0x72, 0x00, 0x11, 0x10, 0x22, 0x11, 0xc0, 0x00, 0x92, 0xa2, 0x38, 0x00, 0x1e, 0x22 # sp + 16 + 64 * vlenb		; RV32-NEXT: .cfi_escape 0x0f, 0x0d, 0x72, 0x00, 0x11, 0x10, 0x22, 0x11, 0x38, 0x92, 0xa2, 0x38, 0x00, 0x1e, 0x22 # sp + 16 + 56 * vlenb
; RV32-NEXT: csrr a1, vlenb		; RV32-NEXT: csrr a1, vlenb
; RV32-NEXT: li a2, 40		; RV32-NEXT: slli a1, a1, 5
; RV32-NEXT: mul a1, a1, a2
; RV32-NEXT: add a1, sp, a1		; RV32-NEXT: add a1, sp, a1
; RV32-NEXT: addi a1, a1, 16		; RV32-NEXT: addi a1, a1, 16
; RV32-NEXT: vs8r.v v16, (a1) # Unknown-size Folded Spill		; RV32-NEXT: vs8r.v v16, (a1) # Unknown-size Folded Spill
; RV32-NEXT: vmv8r.v v16, v8
; RV32-NEXT: vsetivli zero, 2, e8, mf4, ta, ma		; RV32-NEXT: vsetivli zero, 2, e8, mf4, ta, ma
; RV32-NEXT: li a1, 16		; RV32-NEXT: li a1, 16
; RV32-NEXT: vslidedown.vi v24, v0, 2		; RV32-NEXT: vslidedown.vi v24, v0, 2
; RV32-NEXT: mv a2, a0		; RV32-NEXT: mv a2, a0
; RV32-NEXT: bltu a0, a1, .LBB34_2		; RV32-NEXT: bltu a0, a1, .LBB34_2
; RV32-NEXT: # %bb.1:		; RV32-NEXT: # %bb.1:
; RV32-NEXT: li a2, 16		; RV32-NEXT: li a2, 16
; RV32-NEXT: .LBB34_2:		; RV32-NEXT: .LBB34_2:
; RV32-NEXT: li a1, 1		; RV32-NEXT: li a1, 1
; RV32-NEXT: vsetvli zero, a2, e64, m8, ta, ma		; RV32-NEXT: vsetvli zero, a2, e64, m8, ta, ma
; RV32-NEXT: vsub.vx v8, v16, a1, v0.t		; RV32-NEXT: vsub.vx v16, v8, a1, v0.t
		; RV32-NEXT: vnot.v v8, v8, v0.t
		; RV32-NEXT: vand.vv v8, v8, v16, v0.t
; RV32-NEXT: csrr a3, vlenb		; RV32-NEXT: csrr a3, vlenb
; RV32-NEXT: li a4, 56		; RV32-NEXT: li a4, 40
; RV32-NEXT: mul a3, a3, a4		; RV32-NEXT: mul a3, a3, a4
; RV32-NEXT: add a3, sp, a3		; RV32-NEXT: add a3, sp, a3
; RV32-NEXT: addi a3, a3, 16		; RV32-NEXT: addi a3, a3, 16
; RV32-NEXT: vs8r.v v8, (a3) # Unknown-size Folded Spill		; RV32-NEXT: vs8r.v v8, (a3) # Unknown-size Folded Spill
; RV32-NEXT: li a3, 32
; RV32-NEXT: vsetvli zero, a3, e32, m8, ta, ma
; RV32-NEXT: vmv.v.i v8, -1
; RV32-NEXT: csrr a4, vlenb
; RV32-NEXT: slli a4, a4, 5
; RV32-NEXT: add a4, sp, a4
; RV32-NEXT: addi a4, a4, 16
; RV32-NEXT: vs8r.v v8, (a4) # Unknown-size Folded Spill
; RV32-NEXT: vsetvli zero, a2, e64, m8, ta, ma
; RV32-NEXT: vxor.vv v16, v16, v8, v0.t
; RV32-NEXT: csrr a4, vlenb
; RV32-NEXT: li a5, 56
; RV32-NEXT: mul a4, a4, a5
; RV32-NEXT: add a4, sp, a4
; RV32-NEXT: addi a4, a4, 16
; RV32-NEXT: vl8r.v v8, (a4) # Unknown-size Folded Reload
; RV32-NEXT: vand.vv v8, v16, v8, v0.t
; RV32-NEXT: csrr a4, vlenb
; RV32-NEXT: li a5, 48
; RV32-NEXT: mul a4, a4, a5
; RV32-NEXT: add a4, sp, a4
; RV32-NEXT: addi a4, a4, 16
; RV32-NEXT: vs8r.v v8, (a4) # Unknown-size Folded Spill
; RV32-NEXT: lui a4, 349525
; RV32-NEXT: addi a4, a4, 1365
; RV32-NEXT: vsrl.vi v8, v8, 1, v0.t		; RV32-NEXT: vsrl.vi v8, v8, 1, v0.t
; RV32-NEXT: csrr a5, vlenb		; RV32-NEXT: csrr a3, vlenb
; RV32-NEXT: li a6, 56		; RV32-NEXT: li a4, 48
; RV32-NEXT: mul a5, a5, a6		; RV32-NEXT: mul a3, a3, a4
; RV32-NEXT: add a5, sp, a5		; RV32-NEXT: add a3, sp, a3
; RV32-NEXT: addi a5, a5, 16		; RV32-NEXT: addi a3, a3, 16
; RV32-NEXT: vs8r.v v8, (a5) # Unknown-size Folded Spill		; RV32-NEXT: vs8r.v v8, (a3) # Unknown-size Folded Spill
; RV32-NEXT: vsetvli zero, a3, e32, m8, ta, ma		; RV32-NEXT: lui a3, 349525
; RV32-NEXT: vmv.v.x v8, a4		; RV32-NEXT: addi a3, a3, 1365
; RV32-NEXT: csrr a4, vlenb		; RV32-NEXT: li a4, 32
		; RV32-NEXT: vsetvli zero, a4, e32, m8, ta, ma
		; RV32-NEXT: vmv.v.x v8, a3
		; RV32-NEXT: csrr a3, vlenb
; RV32-NEXT: li a5, 24		; RV32-NEXT: li a5, 24
; RV32-NEXT: mul a4, a4, a5		; RV32-NEXT: mul a3, a3, a5
; RV32-NEXT: add a4, sp, a4		; RV32-NEXT: add a3, sp, a3
; RV32-NEXT: addi a4, a4, 16		; RV32-NEXT: addi a3, a3, 16
; RV32-NEXT: vs8r.v v8, (a4) # Unknown-size Folded Spill		; RV32-NEXT: vs8r.v v8, (a3) # Unknown-size Folded Spill
; RV32-NEXT: vsetvli zero, a2, e64, m8, ta, ma		; RV32-NEXT: vsetvli zero, a2, e64, m8, ta, ma
; RV32-NEXT: csrr a4, vlenb		; RV32-NEXT: csrr a3, vlenb
; RV32-NEXT: li a5, 56
; RV32-NEXT: mul a4, a4, a5
; RV32-NEXT: add a4, sp, a4
; RV32-NEXT: addi a4, a4, 16
; RV32-NEXT: vl8r.v v16, (a4) # Unknown-size Folded Reload
; RV32-NEXT: vand.vv v16, v16, v8, v0.t
; RV32-NEXT: csrr a4, vlenb
; RV32-NEXT: li a5, 48		; RV32-NEXT: li a5, 48
; RV32-NEXT: mul a4, a4, a5		; RV32-NEXT: mul a3, a3, a5
; RV32-NEXT: add a4, sp, a4		; RV32-NEXT: add a3, sp, a3
; RV32-NEXT: addi a4, a4, 16		; RV32-NEXT: addi a3, a3, 16
; RV32-NEXT: vl8r.v v8, (a4) # Unknown-size Folded Reload		; RV32-NEXT: vl8r.v v16, (a3) # Unknown-size Folded Reload
		; RV32-NEXT: vand.vv v16, v16, v8, v0.t
		; RV32-NEXT: csrr a3, vlenb
		; RV32-NEXT: li a5, 40
		; RV32-NEXT: mul a3, a3, a5
		; RV32-NEXT: add a3, sp, a3
		; RV32-NEXT: addi a3, a3, 16
		; RV32-NEXT: vl8r.v v8, (a3) # Unknown-size Folded Reload
; RV32-NEXT: vsub.vv v8, v8, v16, v0.t		; RV32-NEXT: vsub.vv v8, v8, v16, v0.t
; RV32-NEXT: csrr a4, vlenb		; RV32-NEXT: csrr a3, vlenb
		; RV32-NEXT: li a5, 40
		; RV32-NEXT: mul a3, a3, a5
		; RV32-NEXT: add a3, sp, a3
		; RV32-NEXT: addi a3, a3, 16
		; RV32-NEXT: vs8r.v v8, (a3) # Unknown-size Folded Spill
		; RV32-NEXT: lui a3, 209715
		; RV32-NEXT: addi a3, a3, 819
		; RV32-NEXT: vsetvli zero, a4, e32, m8, ta, ma
		; RV32-NEXT: vmv.v.x v8, a3
		; RV32-NEXT: csrr a3, vlenb
; RV32-NEXT: li a5, 48		; RV32-NEXT: li a5, 48
; RV32-NEXT: mul a4, a4, a5		; RV32-NEXT: mul a3, a3, a5
; RV32-NEXT: add a4, sp, a4		; RV32-NEXT: add a3, sp, a3
; RV32-NEXT: addi a4, a4, 16		; RV32-NEXT: addi a3, a3, 16
; RV32-NEXT: vs8r.v v8, (a4) # Unknown-size Folded Spill		; RV32-NEXT: vs8r.v v8, (a3) # Unknown-size Folded Spill
; RV32-NEXT: lui a4, 209715
; RV32-NEXT: addi a4, a4, 819
; RV32-NEXT: vsetvli zero, a3, e32, m8, ta, ma
; RV32-NEXT: vmv.v.x v8, a4
; RV32-NEXT: csrr a4, vlenb
; RV32-NEXT: li a5, 56
; RV32-NEXT: mul a4, a4, a5
; RV32-NEXT: add a4, sp, a4
; RV32-NEXT: addi a4, a4, 16
; RV32-NEXT: vs8r.v v8, (a4) # Unknown-size Folded Spill
; RV32-NEXT: vsetvli zero, a2, e64, m8, ta, ma		; RV32-NEXT: vsetvli zero, a2, e64, m8, ta, ma
; RV32-NEXT: csrr a4, vlenb		; RV32-NEXT: csrr a3, vlenb
; RV32-NEXT: li a5, 48		; RV32-NEXT: li a5, 40
; RV32-NEXT: mul a4, a4, a5		; RV32-NEXT: mul a3, a3, a5
; RV32-NEXT: add a4, sp, a4		; RV32-NEXT: add a3, sp, a3
; RV32-NEXT: addi a4, a4, 16		; RV32-NEXT: addi a3, a3, 16
; RV32-NEXT: vl8r.v v16, (a4) # Unknown-size Folded Reload		; RV32-NEXT: vl8r.v v16, (a3) # Unknown-size Folded Reload
; RV32-NEXT: vand.vv v16, v16, v8, v0.t		; RV32-NEXT: vand.vv v16, v16, v8, v0.t
; RV32-NEXT: csrr a4, vlenb		; RV32-NEXT: csrr a3, vlenb
; RV32-NEXT: slli a4, a4, 4		; RV32-NEXT: slli a3, a3, 4
; RV32-NEXT: add a4, sp, a4		; RV32-NEXT: add a3, sp, a3
; RV32-NEXT: addi a4, a4, 16		; RV32-NEXT: addi a3, a3, 16
; RV32-NEXT: vs8r.v v16, (a4) # Unknown-size Folded Spill		; RV32-NEXT: vs8r.v v16, (a3) # Unknown-size Folded Spill
; RV32-NEXT: csrr a4, vlenb		; RV32-NEXT: csrr a3, vlenb
; RV32-NEXT: li a5, 48		; RV32-NEXT: li a5, 40
; RV32-NEXT: mul a4, a4, a5		; RV32-NEXT: mul a3, a3, a5
; RV32-NEXT: add a4, sp, a4		; RV32-NEXT: add a3, sp, a3
; RV32-NEXT: addi a4, a4, 16		; RV32-NEXT: addi a3, a3, 16
; RV32-NEXT: vl8r.v v16, (a4) # Unknown-size Folded Reload		; RV32-NEXT: vl8r.v v16, (a3) # Unknown-size Folded Reload
; RV32-NEXT: vsrl.vi v16, v16, 2, v0.t		; RV32-NEXT: vsrl.vi v16, v16, 2, v0.t
; RV32-NEXT: vand.vv v16, v16, v8, v0.t		; RV32-NEXT: vand.vv v16, v16, v8, v0.t
; RV32-NEXT: csrr a4, vlenb		; RV32-NEXT: csrr a3, vlenb
; RV32-NEXT: slli a4, a4, 4		; RV32-NEXT: slli a3, a3, 4
; RV32-NEXT: add a4, sp, a4		; RV32-NEXT: add a3, sp, a3
; RV32-NEXT: addi a4, a4, 16		; RV32-NEXT: addi a3, a3, 16
; RV32-NEXT: vl8r.v v8, (a4) # Unknown-size Folded Reload		; RV32-NEXT: vl8r.v v8, (a3) # Unknown-size Folded Reload
; RV32-NEXT: vadd.vv v8, v8, v16, v0.t		; RV32-NEXT: vadd.vv v8, v8, v16, v0.t
; RV32-NEXT: vsrl.vi v16, v8, 4, v0.t		; RV32-NEXT: vsrl.vi v16, v8, 4, v0.t
; RV32-NEXT: vadd.vv v16, v8, v16, v0.t		; RV32-NEXT: vadd.vv v16, v8, v16, v0.t
; RV32-NEXT: lui a4, 61681		; RV32-NEXT: lui a3, 61681
; RV32-NEXT: addi a4, a4, -241		; RV32-NEXT: addi a3, a3, -241
; RV32-NEXT: vsetvli zero, a3, e32, m8, ta, ma		; RV32-NEXT: vsetvli zero, a4, e32, m8, ta, ma
; RV32-NEXT: vmv.v.x v8, a4		; RV32-NEXT: vmv.v.x v8, a3
; RV32-NEXT: csrr a4, vlenb		; RV32-NEXT: csrr a3, vlenb
; RV32-NEXT: li a5, 48		; RV32-NEXT: li a5, 40
; RV32-NEXT: mul a4, a4, a5		; RV32-NEXT: mul a3, a3, a5
; RV32-NEXT: add a4, sp, a4		; RV32-NEXT: add a3, sp, a3
; RV32-NEXT: addi a4, a4, 16		; RV32-NEXT: addi a3, a3, 16
; RV32-NEXT: vs8r.v v8, (a4) # Unknown-size Folded Spill		; RV32-NEXT: vs8r.v v8, (a3) # Unknown-size Folded Spill
; RV32-NEXT: vsetvli zero, a2, e64, m8, ta, ma		; RV32-NEXT: vsetvli zero, a2, e64, m8, ta, ma
; RV32-NEXT: vand.vv v8, v16, v8, v0.t		; RV32-NEXT: vand.vv v8, v16, v8, v0.t
; RV32-NEXT: lui a4, 4112		; RV32-NEXT: lui a3, 4112
; RV32-NEXT: addi a4, a4, 257		; RV32-NEXT: addi a3, a3, 257
; RV32-NEXT: vsetvli zero, a3, e32, m8, ta, ma		; RV32-NEXT: vsetvli zero, a4, e32, m8, ta, ma
; RV32-NEXT: vmv.v.x v16, a4		; RV32-NEXT: vmv.v.x v16, a3
; RV32-NEXT: csrr a3, vlenb		; RV32-NEXT: csrr a3, vlenb
; RV32-NEXT: slli a3, a3, 3		; RV32-NEXT: slli a3, a3, 3
; RV32-NEXT: add a3, sp, a3		; RV32-NEXT: add a3, sp, a3
; RV32-NEXT: addi a3, a3, 16		; RV32-NEXT: addi a3, a3, 16
; RV32-NEXT: vs8r.v v16, (a3) # Unknown-size Folded Spill		; RV32-NEXT: vs8r.v v16, (a3) # Unknown-size Folded Spill
; RV32-NEXT: vsetvli zero, a2, e64, m8, ta, ma		; RV32-NEXT: vsetvli zero, a2, e64, m8, ta, ma
; RV32-NEXT: vmul.vv v8, v8, v16, v0.t		; RV32-NEXT: vmul.vv v8, v8, v16, v0.t
; RV32-NEXT: li a2, 56		; RV32-NEXT: li a2, 56
; RV32-NEXT: vsrl.vx v8, v8, a2, v0.t		; RV32-NEXT: vsrl.vx v8, v8, a2, v0.t
; RV32-NEXT: csrr a3, vlenb		; RV32-NEXT: csrr a3, vlenb
; RV32-NEXT: slli a3, a3, 4		; RV32-NEXT: slli a3, a3, 4
; RV32-NEXT: add a3, sp, a3		; RV32-NEXT: add a3, sp, a3
; RV32-NEXT: addi a3, a3, 16		; RV32-NEXT: addi a3, a3, 16
; RV32-NEXT: vs8r.v v8, (a3) # Unknown-size Folded Spill		; RV32-NEXT: vs8r.v v8, (a3) # Unknown-size Folded Spill
; RV32-NEXT: addi a3, a0, -16		; RV32-NEXT: addi a3, a0, -16
; RV32-NEXT: sltu a0, a0, a3		; RV32-NEXT: sltu a0, a0, a3
; RV32-NEXT: addi a0, a0, -1		; RV32-NEXT: addi a0, a0, -1
; RV32-NEXT: and a0, a0, a3		; RV32-NEXT: and a0, a0, a3
; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma		; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma
; RV32-NEXT: vmv1r.v v0, v24		; RV32-NEXT: vmv1r.v v0, v24
; RV32-NEXT: csrr a0, vlenb		; RV32-NEXT: csrr a0, vlenb
; RV32-NEXT: li a3, 40		; RV32-NEXT: slli a0, a0, 5
; RV32-NEXT: mul a0, a0, a3
; RV32-NEXT: add a0, sp, a0		; RV32-NEXT: add a0, sp, a0
; RV32-NEXT: addi a0, a0, 16		; RV32-NEXT: addi a0, a0, 16
; RV32-NEXT: vl8r.v v16, (a0) # Unknown-size Folded Reload		; RV32-NEXT: vl8r.v v16, (a0) # Unknown-size Folded Reload
; RV32-NEXT: vsub.vx v8, v16, a1, v0.t		; RV32-NEXT: vsub.vx v8, v16, a1, v0.t
; RV32-NEXT: addi a0, sp, 16		; RV32-NEXT: vnot.v v16, v16, v0.t
; RV32-NEXT: vs8r.v v8, (a0) # Unknown-size Folded Spill
; RV32-NEXT: csrr a0, vlenb
; RV32-NEXT: slli a0, a0, 5
; RV32-NEXT: add a0, sp, a0
; RV32-NEXT: addi a0, a0, 16
; RV32-NEXT: vl8r.v v8, (a0) # Unknown-size Folded Reload
; RV32-NEXT: vxor.vv v16, v16, v8, v0.t
; RV32-NEXT: addi a0, sp, 16
; RV32-NEXT: vl8r.v v8, (a0) # Unknown-size Folded Reload
; RV32-NEXT: vand.vv v8, v16, v8, v0.t		; RV32-NEXT: vand.vv v8, v16, v8, v0.t
; RV32-NEXT: csrr a0, vlenb		; RV32-NEXT: addi a0, sp, 16
; RV32-NEXT: slli a0, a0, 5
; RV32-NEXT: add a0, sp, a0
; RV32-NEXT: addi a0, a0, 16
; RV32-NEXT: vs8r.v v8, (a0) # Unknown-size Folded Spill		; RV32-NEXT: vs8r.v v8, (a0) # Unknown-size Folded Spill
; RV32-NEXT: vsrl.vi v16, v8, 1, v0.t		; RV32-NEXT: vsrl.vi v16, v8, 1, v0.t
; RV32-NEXT: csrr a0, vlenb		; RV32-NEXT: csrr a0, vlenb
; RV32-NEXT: li a1, 40		; RV32-NEXT: slli a0, a0, 5
; RV32-NEXT: mul a0, a0, a1
; RV32-NEXT: add a0, sp, a0		; RV32-NEXT: add a0, sp, a0
; RV32-NEXT: addi a0, a0, 16		; RV32-NEXT: addi a0, a0, 16
; RV32-NEXT: vs8r.v v16, (a0) # Unknown-size Folded Spill		; RV32-NEXT: vs8r.v v16, (a0) # Unknown-size Folded Spill
; RV32-NEXT: csrr a0, vlenb		; RV32-NEXT: csrr a0, vlenb
; RV32-NEXT: li a1, 24		; RV32-NEXT: li a1, 24
; RV32-NEXT: mul a0, a0, a1		; RV32-NEXT: mul a0, a0, a1
; RV32-NEXT: add a0, sp, a0		; RV32-NEXT: add a0, sp, a0
; RV32-NEXT: addi a0, a0, 16		; RV32-NEXT: addi a0, a0, 16
; RV32-NEXT: vl8r.v v16, (a0) # Unknown-size Folded Reload		; RV32-NEXT: vl8r.v v16, (a0) # Unknown-size Folded Reload
; RV32-NEXT: csrr a0, vlenb		; RV32-NEXT: csrr a0, vlenb
; RV32-NEXT: li a1, 40		; RV32-NEXT: slli a0, a0, 5
; RV32-NEXT: mul a0, a0, a1
; RV32-NEXT: add a0, sp, a0		; RV32-NEXT: add a0, sp, a0
; RV32-NEXT: addi a0, a0, 16		; RV32-NEXT: addi a0, a0, 16
; RV32-NEXT: vl8r.v v8, (a0) # Unknown-size Folded Reload		; RV32-NEXT: vl8r.v v8, (a0) # Unknown-size Folded Reload
; RV32-NEXT: vand.vv v16, v8, v16, v0.t		; RV32-NEXT: vand.vv v16, v8, v16, v0.t
; RV32-NEXT: csrr a0, vlenb		; RV32-NEXT: addi a0, sp, 16
; RV32-NEXT: slli a0, a0, 5
; RV32-NEXT: add a0, sp, a0
; RV32-NEXT: addi a0, a0, 16
; RV32-NEXT: vl8r.v v8, (a0) # Unknown-size Folded Reload		; RV32-NEXT: vl8r.v v8, (a0) # Unknown-size Folded Reload
; RV32-NEXT: vsub.vv v8, v8, v16, v0.t		; RV32-NEXT: vsub.vv v8, v8, v16, v0.t
; RV32-NEXT: csrr a0, vlenb		; RV32-NEXT: csrr a0, vlenb
; RV32-NEXT: li a1, 56		; RV32-NEXT: li a1, 48
; RV32-NEXT: mul a0, a0, a1		; RV32-NEXT: mul a0, a0, a1
; RV32-NEXT: add a0, sp, a0		; RV32-NEXT: add a0, sp, a0
; RV32-NEXT: addi a0, a0, 16		; RV32-NEXT: addi a0, a0, 16
; RV32-NEXT: vl8r.v v16, (a0) # Unknown-size Folded Reload		; RV32-NEXT: vl8r.v v16, (a0) # Unknown-size Folded Reload
; RV32-NEXT: vand.vv v16, v8, v16, v0.t		; RV32-NEXT: vand.vv v16, v8, v16, v0.t
; RV32-NEXT: csrr a0, vlenb		; RV32-NEXT: csrr a0, vlenb
; RV32-NEXT: li a1, 40		; RV32-NEXT: slli a0, a0, 5
; RV32-NEXT: mul a0, a0, a1
; RV32-NEXT: add a0, sp, a0		; RV32-NEXT: add a0, sp, a0
; RV32-NEXT: addi a0, a0, 16		; RV32-NEXT: addi a0, a0, 16
; RV32-NEXT: vs8r.v v16, (a0) # Unknown-size Folded Spill		; RV32-NEXT: vs8r.v v16, (a0) # Unknown-size Folded Spill
; RV32-NEXT: vsrl.vi v8, v8, 2, v0.t		; RV32-NEXT: vsrl.vi v8, v8, 2, v0.t
; RV32-NEXT: csrr a0, vlenb		; RV32-NEXT: csrr a0, vlenb
; RV32-NEXT: li a1, 56		; RV32-NEXT: li a1, 48
; RV32-NEXT: mul a0, a0, a1		; RV32-NEXT: mul a0, a0, a1
; RV32-NEXT: add a0, sp, a0		; RV32-NEXT: add a0, sp, a0
; RV32-NEXT: addi a0, a0, 16		; RV32-NEXT: addi a0, a0, 16
; RV32-NEXT: vl8r.v v16, (a0) # Unknown-size Folded Reload		; RV32-NEXT: vl8r.v v16, (a0) # Unknown-size Folded Reload
; RV32-NEXT: vand.vv v8, v8, v16, v0.t		; RV32-NEXT: vand.vv v8, v8, v16, v0.t
; RV32-NEXT: csrr a0, vlenb		; RV32-NEXT: csrr a0, vlenb
; RV32-NEXT: li a1, 40		; RV32-NEXT: slli a0, a0, 5
; RV32-NEXT: mul a0, a0, a1
; RV32-NEXT: add a0, sp, a0		; RV32-NEXT: add a0, sp, a0
; RV32-NEXT: addi a0, a0, 16		; RV32-NEXT: addi a0, a0, 16
; RV32-NEXT: vl8r.v v16, (a0) # Unknown-size Folded Reload		; RV32-NEXT: vl8r.v v16, (a0) # Unknown-size Folded Reload
; RV32-NEXT: vadd.vv v8, v16, v8, v0.t		; RV32-NEXT: vadd.vv v8, v16, v8, v0.t
; RV32-NEXT: vsrl.vi v16, v8, 4, v0.t		; RV32-NEXT: vsrl.vi v16, v8, 4, v0.t
; RV32-NEXT: vadd.vv v8, v8, v16, v0.t		; RV32-NEXT: vadd.vv v8, v8, v16, v0.t
; RV32-NEXT: csrr a0, vlenb		; RV32-NEXT: csrr a0, vlenb
; RV32-NEXT: li a1, 48		; RV32-NEXT: li a1, 40
; RV32-NEXT: mul a0, a0, a1		; RV32-NEXT: mul a0, a0, a1
; RV32-NEXT: add a0, sp, a0		; RV32-NEXT: add a0, sp, a0
; RV32-NEXT: addi a0, a0, 16		; RV32-NEXT: addi a0, a0, 16
; RV32-NEXT: vl8r.v v16, (a0) # Unknown-size Folded Reload		; RV32-NEXT: vl8r.v v16, (a0) # Unknown-size Folded Reload
; RV32-NEXT: vand.vv v8, v8, v16, v0.t		; RV32-NEXT: vand.vv v8, v8, v16, v0.t
; RV32-NEXT: csrr a0, vlenb		; RV32-NEXT: csrr a0, vlenb
; RV32-NEXT: slli a0, a0, 3		; RV32-NEXT: slli a0, a0, 3
; RV32-NEXT: add a0, sp, a0		; RV32-NEXT: add a0, sp, a0
; RV32-NEXT: addi a0, a0, 16		; RV32-NEXT: addi a0, a0, 16
; RV32-NEXT: vl8r.v v16, (a0) # Unknown-size Folded Reload		; RV32-NEXT: vl8r.v v16, (a0) # Unknown-size Folded Reload
; RV32-NEXT: vmul.vv v8, v8, v16, v0.t		; RV32-NEXT: vmul.vv v8, v8, v16, v0.t
; RV32-NEXT: vsrl.vx v16, v8, a2, v0.t		; RV32-NEXT: vsrl.vx v16, v8, a2, v0.t
; RV32-NEXT: csrr a0, vlenb		; RV32-NEXT: csrr a0, vlenb
; RV32-NEXT: slli a0, a0, 4		; RV32-NEXT: slli a0, a0, 4
; RV32-NEXT: add a0, sp, a0		; RV32-NEXT: add a0, sp, a0
; RV32-NEXT: addi a0, a0, 16		; RV32-NEXT: addi a0, a0, 16
; RV32-NEXT: vl8r.v v8, (a0) # Unknown-size Folded Reload		; RV32-NEXT: vl8r.v v8, (a0) # Unknown-size Folded Reload
; RV32-NEXT: csrr a0, vlenb		; RV32-NEXT: csrr a0, vlenb
; RV32-NEXT: slli a0, a0, 6		; RV32-NEXT: li a1, 56
		; RV32-NEXT: mul a0, a0, a1
; RV32-NEXT: add sp, sp, a0		; RV32-NEXT: add sp, sp, a0
; RV32-NEXT: addi sp, sp, 16		; RV32-NEXT: addi sp, sp, 16
; RV32-NEXT: ret		; RV32-NEXT: ret
;		;
; RV64-LABEL: vp_cttz_v32i64:		; RV64-LABEL: vp_cttz_v32i64:
; RV64: # %bb.0:		; RV64: # %bb.0:
; RV64-NEXT: addi sp, sp, -16		; RV64-NEXT: addi sp, sp, -16
; RV64-NEXT: .cfi_def_cfa_offset 16		; RV64-NEXT: .cfi_def_cfa_offset 16
▲ Show 20 Lines • Show All 86 Lines • ▼ Show 20 Lines	; RV64-NEXT: ret
%v = call <32 x i64> @llvm.vp.cttz.v32i64(<32 x i64> %va, i1 false, <32 x i1> %m, i32 %evl)		%v = call <32 x i64> @llvm.vp.cttz.v32i64(<32 x i64> %va, i1 false, <32 x i1> %m, i32 %evl)
ret <32 x i64> %v		ret <32 x i64> %v
}		}

define <32 x i64> @vp_cttz_v32i64_unmasked(<32 x i64> %va, i32 zeroext %evl) {		define <32 x i64> @vp_cttz_v32i64_unmasked(<32 x i64> %va, i32 zeroext %evl) {
; RV32-LABEL: vp_cttz_v32i64_unmasked:		; RV32-LABEL: vp_cttz_v32i64_unmasked:
; RV32: # %bb.0:		; RV32: # %bb.0:
; RV32-NEXT: li a2, 16		; RV32-NEXT: li a2, 16
; RV32-NEXT: vmv8r.v v0, v16		; RV32-NEXT: vmv8r.v v24, v16
; RV32-NEXT: mv a1, a0		; RV32-NEXT: mv a1, a0
; RV32-NEXT: bltu a0, a2, .LBB35_2		; RV32-NEXT: bltu a0, a2, .LBB35_2
; RV32-NEXT: # %bb.1:		; RV32-NEXT: # %bb.1:
; RV32-NEXT: li a1, 16		; RV32-NEXT: li a1, 16
; RV32-NEXT: .LBB35_2:		; RV32-NEXT: .LBB35_2:
; RV32-NEXT: addi sp, sp, -16		; RV32-NEXT: addi sp, sp, -16
; RV32-NEXT: .cfi_def_cfa_offset 16		; RV32-NEXT: .cfi_def_cfa_offset 16
; RV32-NEXT: csrr a2, vlenb		; RV32-NEXT: csrr a2, vlenb
; RV32-NEXT: li a3, 40		; RV32-NEXT: slli a2, a2, 5
; RV32-NEXT: mul a2, a2, a3
; RV32-NEXT: sub sp, sp, a2		; RV32-NEXT: sub sp, sp, a2
; RV32-NEXT: .cfi_escape 0x0f, 0x0d, 0x72, 0x00, 0x11, 0x10, 0x22, 0x11, 0x28, 0x92, 0xa2, 0x38, 0x00, 0x1e, 0x22 # sp + 16 + 40 * vlenb		; RV32-NEXT: .cfi_escape 0x0f, 0x0d, 0x72, 0x00, 0x11, 0x10, 0x22, 0x11, 0x20, 0x92, 0xa2, 0x38, 0x00, 0x1e, 0x22 # sp + 16 + 32 * vlenb
; RV32-NEXT: li a2, 1		; RV32-NEXT: li a2, 1
; RV32-NEXT: vsetvli zero, a1, e64, m8, ta, ma		; RV32-NEXT: vsetvli zero, a1, e64, m8, ta, ma
; RV32-NEXT: vsub.vx v16, v8, a2		; RV32-NEXT: vsub.vx v16, v8, a2
; RV32-NEXT: li a3, 32		; RV32-NEXT: vnot.v v8, v8
; RV32-NEXT: vsetvli zero, a3, e32, m8, ta, ma
; RV32-NEXT: vmv.v.i v24, -1
; RV32-NEXT: csrr a4, vlenb
; RV32-NEXT: slli a4, a4, 5
; RV32-NEXT: add a4, sp, a4
; RV32-NEXT: addi a4, a4, 16
; RV32-NEXT: vs8r.v v24, (a4) # Unknown-size Folded Spill
; RV32-NEXT: vsetvli zero, a1, e64, m8, ta, ma
; RV32-NEXT: vxor.vv v8, v8, v24
; RV32-NEXT: vand.vv v8, v8, v16		; RV32-NEXT: vand.vv v8, v8, v16
; RV32-NEXT: vsrl.vi v16, v8, 1		; RV32-NEXT: vsrl.vi v16, v8, 1
; RV32-NEXT: lui a4, 349525		; RV32-NEXT: lui a3, 349525
; RV32-NEXT: addi a4, a4, 1365		; RV32-NEXT: addi a3, a3, 1365
; RV32-NEXT: vsetvli zero, a3, e32, m8, ta, ma		; RV32-NEXT: li a4, 32
; RV32-NEXT: vmv.v.x v24, a4		; RV32-NEXT: vsetvli zero, a4, e32, m8, ta, ma
; RV32-NEXT: csrr a4, vlenb		; RV32-NEXT: vmv.v.x v0, a3
		; RV32-NEXT: csrr a3, vlenb
; RV32-NEXT: li a5, 24		; RV32-NEXT: li a5, 24
; RV32-NEXT: mul a4, a4, a5		; RV32-NEXT: mul a3, a3, a5
; RV32-NEXT: add a4, sp, a4		; RV32-NEXT: add a3, sp, a3
; RV32-NEXT: addi a4, a4, 16		; RV32-NEXT: addi a3, a3, 16
; RV32-NEXT: vs8r.v v24, (a4) # Unknown-size Folded Spill		; RV32-NEXT: vs8r.v v0, (a3) # Unknown-size Folded Spill
; RV32-NEXT: vsetvli zero, a1, e64, m8, ta, ma		; RV32-NEXT: vsetvli zero, a1, e64, m8, ta, ma
; RV32-NEXT: vand.vv v16, v16, v24		; RV32-NEXT: vand.vv v16, v16, v0
; RV32-NEXT: vsub.vv v8, v8, v16		; RV32-NEXT: vsub.vv v8, v8, v16
; RV32-NEXT: lui a4, 209715		; RV32-NEXT: lui a3, 209715
; RV32-NEXT: addi a4, a4, 819		; RV32-NEXT: addi a3, a3, 819
; RV32-NEXT: vsetvli zero, a3, e32, m8, ta, ma		; RV32-NEXT: vsetvli zero, a4, e32, m8, ta, ma
; RV32-NEXT: vmv.v.x v16, a4		; RV32-NEXT: vmv.v.x v0, a3
; RV32-NEXT: vsetvli zero, a1, e64, m8, ta, ma		; RV32-NEXT: vsetvli zero, a1, e64, m8, ta, ma
; RV32-NEXT: vand.vv v24, v8, v16		; RV32-NEXT: vand.vv v16, v8, v0
; RV32-NEXT: vsrl.vi v8, v8, 2		; RV32-NEXT: vsrl.vi v8, v8, 2
; RV32-NEXT: vand.vv v8, v8, v16		; RV32-NEXT: vand.vv v8, v8, v0
; RV32-NEXT: vadd.vv v8, v24, v8		; RV32-NEXT: vadd.vv v8, v16, v8
; RV32-NEXT: vsrl.vi v24, v8, 4		; RV32-NEXT: vsrl.vi v16, v8, 4
; RV32-NEXT: vadd.vv v8, v8, v24		; RV32-NEXT: vadd.vv v8, v8, v16
; RV32-NEXT: lui a4, 61681		; RV32-NEXT: lui a3, 61681
; RV32-NEXT: addi a4, a4, -241		; RV32-NEXT: addi a3, a3, -241
; RV32-NEXT: vsetvli zero, a3, e32, m8, ta, ma		; RV32-NEXT: vsetvli zero, a4, e32, m8, ta, ma
; RV32-NEXT: vmv.v.x v24, a4		; RV32-NEXT: vmv.v.x v16, a3
; RV32-NEXT: csrr a4, vlenb		; RV32-NEXT: csrr a3, vlenb
; RV32-NEXT: slli a4, a4, 4		; RV32-NEXT: slli a3, a3, 4
; RV32-NEXT: add a4, sp, a4		; RV32-NEXT: add a3, sp, a3
; RV32-NEXT: addi a4, a4, 16		; RV32-NEXT: addi a3, a3, 16
; RV32-NEXT: vs8r.v v24, (a4) # Unknown-size Folded Spill		; RV32-NEXT: vs8r.v v16, (a3) # Unknown-size Folded Spill
; RV32-NEXT: vsetvli zero, a1, e64, m8, ta, ma		; RV32-NEXT: vsetvli zero, a1, e64, m8, ta, ma
; RV32-NEXT: vand.vv v8, v8, v24		; RV32-NEXT: vand.vv v8, v8, v16
; RV32-NEXT: lui a4, 4112		; RV32-NEXT: lui a3, 4112
; RV32-NEXT: addi a4, a4, 257		; RV32-NEXT: addi a3, a3, 257
; RV32-NEXT: vsetvli zero, a3, e32, m8, ta, ma		; RV32-NEXT: vsetvli zero, a4, e32, m8, ta, ma
; RV32-NEXT: vmv.v.x v24, a4		; RV32-NEXT: vmv.v.x v16, a3
; RV32-NEXT: addi a3, sp, 16		; RV32-NEXT: addi a3, sp, 16
; RV32-NEXT: vs8r.v v24, (a3) # Unknown-size Folded Spill		; RV32-NEXT: vs8r.v v16, (a3) # Unknown-size Folded Spill
; RV32-NEXT: vsetvli zero, a1, e64, m8, ta, ma		; RV32-NEXT: vsetvli zero, a1, e64, m8, ta, ma
; RV32-NEXT: vmul.vv v8, v8, v24		; RV32-NEXT: vmul.vv v8, v8, v16
; RV32-NEXT: li a1, 56		; RV32-NEXT: li a1, 56
; RV32-NEXT: vsrl.vx v8, v8, a1		; RV32-NEXT: vsrl.vx v8, v8, a1
; RV32-NEXT: csrr a3, vlenb		; RV32-NEXT: csrr a3, vlenb
; RV32-NEXT: slli a3, a3, 3		; RV32-NEXT: slli a3, a3, 3
; RV32-NEXT: add a3, sp, a3		; RV32-NEXT: add a3, sp, a3
; RV32-NEXT: addi a3, a3, 16		; RV32-NEXT: addi a3, a3, 16
; RV32-NEXT: vs8r.v v8, (a3) # Unknown-size Folded Spill		; RV32-NEXT: vs8r.v v8, (a3) # Unknown-size Folded Spill
; RV32-NEXT: addi a3, a0, -16		; RV32-NEXT: addi a3, a0, -16
; RV32-NEXT: sltu a0, a0, a3		; RV32-NEXT: sltu a0, a0, a3
; RV32-NEXT: addi a0, a0, -1		; RV32-NEXT: addi a0, a0, -1
; RV32-NEXT: and a0, a0, a3		; RV32-NEXT: and a0, a0, a3
; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma		; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma
; RV32-NEXT: csrr a0, vlenb		; RV32-NEXT: vsub.vx v8, v24, a2
; RV32-NEXT: slli a0, a0, 5		; RV32-NEXT: vnot.v v24, v24
; RV32-NEXT: add a0, sp, a0		; RV32-NEXT: vand.vv v8, v24, v8
; RV32-NEXT: addi a0, a0, 16		; RV32-NEXT: vsrl.vi v24, v8, 1
; RV32-NEXT: vl8r.v v8, (a0) # Unknown-size Folded Reload
; RV32-NEXT: vxor.vv v8, v0, v8
; RV32-NEXT: vsub.vx v0, v0, a2
; RV32-NEXT: vand.vv v8, v8, v0
; RV32-NEXT: vsrl.vi v0, v8, 1
; RV32-NEXT: csrr a0, vlenb		; RV32-NEXT: csrr a0, vlenb
; RV32-NEXT: li a2, 24		; RV32-NEXT: li a2, 24
; RV32-NEXT: mul a0, a0, a2		; RV32-NEXT: mul a0, a0, a2
; RV32-NEXT: add a0, sp, a0		; RV32-NEXT: add a0, sp, a0
; RV32-NEXT: addi a0, a0, 16		; RV32-NEXT: addi a0, a0, 16
; RV32-NEXT: vl8r.v v24, (a0) # Unknown-size Folded Reload		; RV32-NEXT: vl8r.v v16, (a0) # Unknown-size Folded Reload
; RV32-NEXT: vand.vv v0, v0, v24		; RV32-NEXT: vand.vv v24, v24, v16
; RV32-NEXT: vsub.vv v8, v8, v0		; RV32-NEXT: vsub.vv v8, v8, v24
; RV32-NEXT: vand.vv v0, v8, v16		; RV32-NEXT: vand.vv v24, v8, v0
; RV32-NEXT: vsrl.vi v8, v8, 2		; RV32-NEXT: vsrl.vi v8, v8, 2
; RV32-NEXT: vand.vv v8, v8, v16		; RV32-NEXT: vand.vv v8, v8, v0
; RV32-NEXT: vadd.vv v8, v0, v8		; RV32-NEXT: vadd.vv v8, v24, v8
; RV32-NEXT: vsrl.vi v16, v8, 4		; RV32-NEXT: vsrl.vi v24, v8, 4
; RV32-NEXT: vadd.vv v8, v8, v16		; RV32-NEXT: vadd.vv v8, v8, v24
; RV32-NEXT: csrr a0, vlenb		; RV32-NEXT: csrr a0, vlenb
; RV32-NEXT: slli a0, a0, 4		; RV32-NEXT: slli a0, a0, 4
; RV32-NEXT: add a0, sp, a0		; RV32-NEXT: add a0, sp, a0
; RV32-NEXT: addi a0, a0, 16		; RV32-NEXT: addi a0, a0, 16
; RV32-NEXT: vl8r.v v16, (a0) # Unknown-size Folded Reload		; RV32-NEXT: vl8r.v v16, (a0) # Unknown-size Folded Reload
; RV32-NEXT: vand.vv v8, v8, v16		; RV32-NEXT: vand.vv v8, v8, v16
; RV32-NEXT: addi a0, sp, 16		; RV32-NEXT: addi a0, sp, 16
; RV32-NEXT: vl8r.v v16, (a0) # Unknown-size Folded Reload		; RV32-NEXT: vl8r.v v16, (a0) # Unknown-size Folded Reload
; RV32-NEXT: vmul.vv v8, v8, v16		; RV32-NEXT: vmul.vv v8, v8, v16
; RV32-NEXT: vsrl.vx v16, v8, a1		; RV32-NEXT: vsrl.vx v16, v8, a1
; RV32-NEXT: csrr a0, vlenb		; RV32-NEXT: csrr a0, vlenb
; RV32-NEXT: slli a0, a0, 3		; RV32-NEXT: slli a0, a0, 3
; RV32-NEXT: add a0, sp, a0		; RV32-NEXT: add a0, sp, a0
; RV32-NEXT: addi a0, a0, 16		; RV32-NEXT: addi a0, a0, 16
; RV32-NEXT: vl8r.v v8, (a0) # Unknown-size Folded Reload		; RV32-NEXT: vl8r.v v8, (a0) # Unknown-size Folded Reload
; RV32-NEXT: csrr a0, vlenb		; RV32-NEXT: csrr a0, vlenb
; RV32-NEXT: li a1, 40		; RV32-NEXT: slli a0, a0, 5
; RV32-NEXT: mul a0, a0, a1
; RV32-NEXT: add sp, sp, a0		; RV32-NEXT: add sp, sp, a0
; RV32-NEXT: addi sp, sp, 16		; RV32-NEXT: addi sp, sp, 16
; RV32-NEXT: ret		; RV32-NEXT: ret
;		;
; RV64-LABEL: vp_cttz_v32i64_unmasked:		; RV64-LABEL: vp_cttz_v32i64_unmasked:
; RV64: # %bb.0:		; RV64: # %bb.0:
; RV64-NEXT: li a2, 16		; RV64-NEXT: li a2, 16
; RV64-NEXT: mv a1, a0		; RV64-NEXT: mv a1, a0
▲ Show 20 Lines • Show All 1,263 Lines • ▼ Show 20 Lines
}		}

define <2 x i64> @vp_cttz_zero_undef_v2i64(<2 x i64> %va, <2 x i1> %m, i32 zeroext %evl) {		define <2 x i64> @vp_cttz_zero_undef_v2i64(<2 x i64> %va, <2 x i1> %m, i32 zeroext %evl) {
; RV32-LABEL: vp_cttz_zero_undef_v2i64:		; RV32-LABEL: vp_cttz_zero_undef_v2i64:
; RV32: # %bb.0:		; RV32: # %bb.0:
; RV32-NEXT: li a1, 1		; RV32-NEXT: li a1, 1
; RV32-NEXT: vsetvli zero, a0, e64, m1, ta, ma		; RV32-NEXT: vsetvli zero, a0, e64, m1, ta, ma
; RV32-NEXT: vsub.vx v9, v8, a1, v0.t		; RV32-NEXT: vsub.vx v9, v8, a1, v0.t
; RV32-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; RV32-NEXT: vnot.v v8, v8, v0.t
; RV32-NEXT: vmv.v.i v10, -1
; RV32-NEXT: vsetvli zero, a0, e64, m1, ta, ma
; RV32-NEXT: vxor.vv v8, v8, v10, v0.t
; RV32-NEXT: vand.vv v8, v8, v9, v0.t		; RV32-NEXT: vand.vv v8, v8, v9, v0.t
; RV32-NEXT: vsrl.vi v9, v8, 1, v0.t		; RV32-NEXT: vsrl.vi v9, v8, 1, v0.t
; RV32-NEXT: lui a1, 349525		; RV32-NEXT: lui a1, 349525
; RV32-NEXT: addi a1, a1, 1365		; RV32-NEXT: addi a1, a1, 1365
; RV32-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; RV32-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; RV32-NEXT: vmv.v.x v10, a1		; RV32-NEXT: vmv.v.x v10, a1
; RV32-NEXT: vsetvli zero, a0, e64, m1, ta, ma		; RV32-NEXT: vsetvli zero, a0, e64, m1, ta, ma
; RV32-NEXT: vand.vv v9, v9, v10, v0.t		; RV32-NEXT: vand.vv v9, v9, v10, v0.t
▲ Show 20 Lines • Show All 67 Lines • ▼ Show 20 Lines
}		}

define <2 x i64> @vp_cttz_zero_undef_v2i64_unmasked(<2 x i64> %va, i32 zeroext %evl) {		define <2 x i64> @vp_cttz_zero_undef_v2i64_unmasked(<2 x i64> %va, i32 zeroext %evl) {
; RV32-LABEL: vp_cttz_zero_undef_v2i64_unmasked:		; RV32-LABEL: vp_cttz_zero_undef_v2i64_unmasked:
; RV32: # %bb.0:		; RV32: # %bb.0:
; RV32-NEXT: li a1, 1		; RV32-NEXT: li a1, 1
; RV32-NEXT: vsetvli zero, a0, e64, m1, ta, ma		; RV32-NEXT: vsetvli zero, a0, e64, m1, ta, ma
; RV32-NEXT: vsub.vx v9, v8, a1		; RV32-NEXT: vsub.vx v9, v8, a1
; RV32-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; RV32-NEXT: vnot.v v8, v8
; RV32-NEXT: vmv.v.i v10, -1
; RV32-NEXT: vsetvli zero, a0, e64, m1, ta, ma
; RV32-NEXT: vxor.vv v8, v8, v10
; RV32-NEXT: vand.vv v8, v8, v9		; RV32-NEXT: vand.vv v8, v8, v9
; RV32-NEXT: vsrl.vi v9, v8, 1		; RV32-NEXT: vsrl.vi v9, v8, 1
; RV32-NEXT: lui a1, 349525		; RV32-NEXT: lui a1, 349525
; RV32-NEXT: addi a1, a1, 1365		; RV32-NEXT: addi a1, a1, 1365
; RV32-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; RV32-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; RV32-NEXT: vmv.v.x v10, a1		; RV32-NEXT: vmv.v.x v10, a1
; RV32-NEXT: vsetvli zero, a0, e64, m1, ta, ma		; RV32-NEXT: vsetvli zero, a0, e64, m1, ta, ma
; RV32-NEXT: vand.vv v9, v9, v10		; RV32-NEXT: vand.vv v9, v9, v10
▲ Show 20 Lines • Show All 69 Lines • ▼ Show 20 Lines
}		}

define <4 x i64> @vp_cttz_zero_undef_v4i64(<4 x i64> %va, <4 x i1> %m, i32 zeroext %evl) {		define <4 x i64> @vp_cttz_zero_undef_v4i64(<4 x i64> %va, <4 x i1> %m, i32 zeroext %evl) {
; RV32-LABEL: vp_cttz_zero_undef_v4i64:		; RV32-LABEL: vp_cttz_zero_undef_v4i64:
; RV32: # %bb.0:		; RV32: # %bb.0:
; RV32-NEXT: li a1, 1		; RV32-NEXT: li a1, 1
; RV32-NEXT: vsetvli zero, a0, e64, m2, ta, ma		; RV32-NEXT: vsetvli zero, a0, e64, m2, ta, ma
; RV32-NEXT: vsub.vx v10, v8, a1, v0.t		; RV32-NEXT: vsub.vx v10, v8, a1, v0.t
; RV32-NEXT: vsetivli zero, 8, e32, m2, ta, ma		; RV32-NEXT: vnot.v v8, v8, v0.t
; RV32-NEXT: vmv.v.i v12, -1
; RV32-NEXT: vsetvli zero, a0, e64, m2, ta, ma
; RV32-NEXT: vxor.vv v8, v8, v12, v0.t
; RV32-NEXT: vand.vv v8, v8, v10, v0.t		; RV32-NEXT: vand.vv v8, v8, v10, v0.t
; RV32-NEXT: vsrl.vi v10, v8, 1, v0.t		; RV32-NEXT: vsrl.vi v10, v8, 1, v0.t
; RV32-NEXT: lui a1, 349525		; RV32-NEXT: lui a1, 349525
; RV32-NEXT: addi a1, a1, 1365		; RV32-NEXT: addi a1, a1, 1365
; RV32-NEXT: vsetivli zero, 8, e32, m2, ta, ma		; RV32-NEXT: vsetivli zero, 8, e32, m2, ta, ma
; RV32-NEXT: vmv.v.x v12, a1		; RV32-NEXT: vmv.v.x v12, a1
; RV32-NEXT: vsetvli zero, a0, e64, m2, ta, ma		; RV32-NEXT: vsetvli zero, a0, e64, m2, ta, ma
; RV32-NEXT: vand.vv v10, v10, v12, v0.t		; RV32-NEXT: vand.vv v10, v10, v12, v0.t
▲ Show 20 Lines • Show All 67 Lines • ▼ Show 20 Lines
}		}

define <4 x i64> @vp_cttz_zero_undef_v4i64_unmasked(<4 x i64> %va, i32 zeroext %evl) {		define <4 x i64> @vp_cttz_zero_undef_v4i64_unmasked(<4 x i64> %va, i32 zeroext %evl) {
; RV32-LABEL: vp_cttz_zero_undef_v4i64_unmasked:		; RV32-LABEL: vp_cttz_zero_undef_v4i64_unmasked:
; RV32: # %bb.0:		; RV32: # %bb.0:
; RV32-NEXT: li a1, 1		; RV32-NEXT: li a1, 1
; RV32-NEXT: vsetvli zero, a0, e64, m2, ta, ma		; RV32-NEXT: vsetvli zero, a0, e64, m2, ta, ma
; RV32-NEXT: vsub.vx v10, v8, a1		; RV32-NEXT: vsub.vx v10, v8, a1
; RV32-NEXT: vsetivli zero, 8, e32, m2, ta, ma		; RV32-NEXT: vnot.v v8, v8
; RV32-NEXT: vmv.v.i v12, -1
; RV32-NEXT: vsetvli zero, a0, e64, m2, ta, ma
; RV32-NEXT: vxor.vv v8, v8, v12
; RV32-NEXT: vand.vv v8, v8, v10		; RV32-NEXT: vand.vv v8, v8, v10
; RV32-NEXT: vsrl.vi v10, v8, 1		; RV32-NEXT: vsrl.vi v10, v8, 1
; RV32-NEXT: lui a1, 349525		; RV32-NEXT: lui a1, 349525
; RV32-NEXT: addi a1, a1, 1365		; RV32-NEXT: addi a1, a1, 1365
; RV32-NEXT: vsetivli zero, 8, e32, m2, ta, ma		; RV32-NEXT: vsetivli zero, 8, e32, m2, ta, ma
; RV32-NEXT: vmv.v.x v12, a1		; RV32-NEXT: vmv.v.x v12, a1
; RV32-NEXT: vsetvli zero, a0, e64, m2, ta, ma		; RV32-NEXT: vsetvli zero, a0, e64, m2, ta, ma
; RV32-NEXT: vand.vv v10, v10, v12		; RV32-NEXT: vand.vv v10, v10, v12
▲ Show 20 Lines • Show All 69 Lines • ▼ Show 20 Lines
}		}

define <8 x i64> @vp_cttz_zero_undef_v8i64(<8 x i64> %va, <8 x i1> %m, i32 zeroext %evl) {		define <8 x i64> @vp_cttz_zero_undef_v8i64(<8 x i64> %va, <8 x i1> %m, i32 zeroext %evl) {
; RV32-LABEL: vp_cttz_zero_undef_v8i64:		; RV32-LABEL: vp_cttz_zero_undef_v8i64:
; RV32: # %bb.0:		; RV32: # %bb.0:
; RV32-NEXT: li a1, 1		; RV32-NEXT: li a1, 1
; RV32-NEXT: vsetvli zero, a0, e64, m4, ta, ma		; RV32-NEXT: vsetvli zero, a0, e64, m4, ta, ma
; RV32-NEXT: vsub.vx v12, v8, a1, v0.t		; RV32-NEXT: vsub.vx v12, v8, a1, v0.t
; RV32-NEXT: vsetivli zero, 16, e32, m4, ta, ma		; RV32-NEXT: vnot.v v8, v8, v0.t
; RV32-NEXT: vmv.v.i v16, -1
; RV32-NEXT: vsetvli zero, a0, e64, m4, ta, ma
; RV32-NEXT: vxor.vv v8, v8, v16, v0.t
; RV32-NEXT: vand.vv v8, v8, v12, v0.t		; RV32-NEXT: vand.vv v8, v8, v12, v0.t
; RV32-NEXT: vsrl.vi v12, v8, 1, v0.t		; RV32-NEXT: vsrl.vi v12, v8, 1, v0.t
; RV32-NEXT: lui a1, 349525		; RV32-NEXT: lui a1, 349525
; RV32-NEXT: addi a1, a1, 1365		; RV32-NEXT: addi a1, a1, 1365
; RV32-NEXT: vsetivli zero, 16, e32, m4, ta, ma		; RV32-NEXT: vsetivli zero, 16, e32, m4, ta, ma
; RV32-NEXT: vmv.v.x v16, a1		; RV32-NEXT: vmv.v.x v16, a1
; RV32-NEXT: vsetvli zero, a0, e64, m4, ta, ma		; RV32-NEXT: vsetvli zero, a0, e64, m4, ta, ma
; RV32-NEXT: vand.vv v12, v12, v16, v0.t		; RV32-NEXT: vand.vv v12, v12, v16, v0.t
▲ Show 20 Lines • Show All 67 Lines • ▼ Show 20 Lines
}		}

define <8 x i64> @vp_cttz_zero_undef_v8i64_unmasked(<8 x i64> %va, i32 zeroext %evl) {		define <8 x i64> @vp_cttz_zero_undef_v8i64_unmasked(<8 x i64> %va, i32 zeroext %evl) {
; RV32-LABEL: vp_cttz_zero_undef_v8i64_unmasked:		; RV32-LABEL: vp_cttz_zero_undef_v8i64_unmasked:
; RV32: # %bb.0:		; RV32: # %bb.0:
; RV32-NEXT: li a1, 1		; RV32-NEXT: li a1, 1
; RV32-NEXT: vsetvli zero, a0, e64, m4, ta, ma		; RV32-NEXT: vsetvli zero, a0, e64, m4, ta, ma
; RV32-NEXT: vsub.vx v12, v8, a1		; RV32-NEXT: vsub.vx v12, v8, a1
; RV32-NEXT: vsetivli zero, 16, e32, m4, ta, ma		; RV32-NEXT: vnot.v v8, v8
; RV32-NEXT: vmv.v.i v16, -1
; RV32-NEXT: vsetvli zero, a0, e64, m4, ta, ma
; RV32-NEXT: vxor.vv v8, v8, v16
; RV32-NEXT: vand.vv v8, v8, v12		; RV32-NEXT: vand.vv v8, v8, v12
; RV32-NEXT: vsrl.vi v12, v8, 1		; RV32-NEXT: vsrl.vi v12, v8, 1
; RV32-NEXT: lui a1, 349525		; RV32-NEXT: lui a1, 349525
; RV32-NEXT: addi a1, a1, 1365		; RV32-NEXT: addi a1, a1, 1365
; RV32-NEXT: vsetivli zero, 16, e32, m4, ta, ma		; RV32-NEXT: vsetivli zero, 16, e32, m4, ta, ma
; RV32-NEXT: vmv.v.x v16, a1		; RV32-NEXT: vmv.v.x v16, a1
; RV32-NEXT: vsetvli zero, a0, e64, m4, ta, ma		; RV32-NEXT: vsetvli zero, a0, e64, m4, ta, ma
; RV32-NEXT: vand.vv v12, v12, v16		; RV32-NEXT: vand.vv v12, v12, v16
▲ Show 20 Lines • Show All 69 Lines • ▼ Show 20 Lines
}		}

define <15 x i64> @vp_cttz_zero_undef_v15i64(<15 x i64> %va, <15 x i1> %m, i32 zeroext %evl) {		define <15 x i64> @vp_cttz_zero_undef_v15i64(<15 x i64> %va, <15 x i1> %m, i32 zeroext %evl) {
; RV32-LABEL: vp_cttz_zero_undef_v15i64:		; RV32-LABEL: vp_cttz_zero_undef_v15i64:
; RV32: # %bb.0:		; RV32: # %bb.0:
; RV32-NEXT: li a1, 1		; RV32-NEXT: li a1, 1
; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma		; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma
; RV32-NEXT: vsub.vx v16, v8, a1, v0.t		; RV32-NEXT: vsub.vx v16, v8, a1, v0.t
; RV32-NEXT: li a1, 32		; RV32-NEXT: vnot.v v8, v8, v0.t
; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma
; RV32-NEXT: vmv.v.i v24, -1
; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma
; RV32-NEXT: vxor.vv v8, v8, v24, v0.t
; RV32-NEXT: vand.vv v8, v8, v16, v0.t		; RV32-NEXT: vand.vv v8, v8, v16, v0.t
; RV32-NEXT: vsrl.vi v16, v8, 1, v0.t		; RV32-NEXT: vsrl.vi v16, v8, 1, v0.t
; RV32-NEXT: lui a2, 349525		; RV32-NEXT: lui a1, 349525
; RV32-NEXT: addi a2, a2, 1365		; RV32-NEXT: addi a1, a1, 1365
; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma		; RV32-NEXT: li a2, 32
; RV32-NEXT: vmv.v.x v24, a2		; RV32-NEXT: vsetvli zero, a2, e32, m8, ta, ma
		; RV32-NEXT: vmv.v.x v24, a1
; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma		; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma
; RV32-NEXT: vand.vv v16, v16, v24, v0.t		; RV32-NEXT: vand.vv v16, v16, v24, v0.t
; RV32-NEXT: vsub.vv v8, v8, v16, v0.t		; RV32-NEXT: vsub.vv v8, v8, v16, v0.t
; RV32-NEXT: lui a2, 209715		; RV32-NEXT: lui a1, 209715
; RV32-NEXT: addi a2, a2, 819		; RV32-NEXT: addi a1, a1, 819
; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma		; RV32-NEXT: vsetvli zero, a2, e32, m8, ta, ma
; RV32-NEXT: vmv.v.x v16, a2		; RV32-NEXT: vmv.v.x v16, a1
; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma		; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma
; RV32-NEXT: vand.vv v24, v8, v16, v0.t		; RV32-NEXT: vand.vv v24, v8, v16, v0.t
; RV32-NEXT: vsrl.vi v8, v8, 2, v0.t		; RV32-NEXT: vsrl.vi v8, v8, 2, v0.t
; RV32-NEXT: vand.vv v8, v8, v16, v0.t		; RV32-NEXT: vand.vv v8, v8, v16, v0.t
; RV32-NEXT: vadd.vv v8, v24, v8, v0.t		; RV32-NEXT: vadd.vv v8, v24, v8, v0.t
; RV32-NEXT: vsrl.vi v16, v8, 4, v0.t		; RV32-NEXT: vsrl.vi v16, v8, 4, v0.t
; RV32-NEXT: vadd.vv v8, v8, v16, v0.t		; RV32-NEXT: vadd.vv v8, v8, v16, v0.t
; RV32-NEXT: lui a2, 61681		; RV32-NEXT: lui a1, 61681
; RV32-NEXT: addi a2, a2, -241		; RV32-NEXT: addi a1, a1, -241
; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma		; RV32-NEXT: vsetvli zero, a2, e32, m8, ta, ma
; RV32-NEXT: vmv.v.x v16, a2		; RV32-NEXT: vmv.v.x v16, a1
; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma		; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma
; RV32-NEXT: vand.vv v8, v8, v16, v0.t		; RV32-NEXT: vand.vv v8, v8, v16, v0.t
; RV32-NEXT: lui a2, 4112		; RV32-NEXT: lui a1, 4112
; RV32-NEXT: addi a2, a2, 257		; RV32-NEXT: addi a1, a1, 257
; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma		; RV32-NEXT: vsetvli zero, a2, e32, m8, ta, ma
; RV32-NEXT: vmv.v.x v16, a2		; RV32-NEXT: vmv.v.x v16, a1
; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma		; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma
; RV32-NEXT: vmul.vv v8, v8, v16, v0.t		; RV32-NEXT: vmul.vv v8, v8, v16, v0.t
; RV32-NEXT: li a0, 56		; RV32-NEXT: li a0, 56
; RV32-NEXT: vsrl.vx v8, v8, a0, v0.t		; RV32-NEXT: vsrl.vx v8, v8, a0, v0.t
; RV32-NEXT: ret		; RV32-NEXT: ret
;		;
; RV64-LABEL: vp_cttz_zero_undef_v15i64:		; RV64-LABEL: vp_cttz_zero_undef_v15i64:
; RV64: # %bb.0:		; RV64: # %bb.0:
Show All 37 Lines
}		}

define <15 x i64> @vp_cttz_zero_undef_v15i64_unmasked(<15 x i64> %va, i32 zeroext %evl) {		define <15 x i64> @vp_cttz_zero_undef_v15i64_unmasked(<15 x i64> %va, i32 zeroext %evl) {
; RV32-LABEL: vp_cttz_zero_undef_v15i64_unmasked:		; RV32-LABEL: vp_cttz_zero_undef_v15i64_unmasked:
; RV32: # %bb.0:		; RV32: # %bb.0:
; RV32-NEXT: li a1, 1		; RV32-NEXT: li a1, 1
; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma		; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma
; RV32-NEXT: vsub.vx v16, v8, a1		; RV32-NEXT: vsub.vx v16, v8, a1
; RV32-NEXT: li a1, 32		; RV32-NEXT: vnot.v v8, v8
; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma
; RV32-NEXT: vmv.v.i v24, -1
; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma
; RV32-NEXT: vxor.vv v8, v8, v24
; RV32-NEXT: vand.vv v8, v8, v16		; RV32-NEXT: vand.vv v8, v8, v16
; RV32-NEXT: vsrl.vi v16, v8, 1		; RV32-NEXT: vsrl.vi v16, v8, 1
; RV32-NEXT: lui a2, 349525		; RV32-NEXT: lui a1, 349525
; RV32-NEXT: addi a2, a2, 1365		; RV32-NEXT: addi a1, a1, 1365
; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma		; RV32-NEXT: li a2, 32
; RV32-NEXT: vmv.v.x v24, a2		; RV32-NEXT: vsetvli zero, a2, e32, m8, ta, ma
		; RV32-NEXT: vmv.v.x v24, a1
; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma		; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma
; RV32-NEXT: vand.vv v16, v16, v24		; RV32-NEXT: vand.vv v16, v16, v24
; RV32-NEXT: vsub.vv v8, v8, v16		; RV32-NEXT: vsub.vv v8, v8, v16
; RV32-NEXT: lui a2, 209715		; RV32-NEXT: lui a1, 209715
; RV32-NEXT: addi a2, a2, 819		; RV32-NEXT: addi a1, a1, 819
; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma		; RV32-NEXT: vsetvli zero, a2, e32, m8, ta, ma
; RV32-NEXT: vmv.v.x v16, a2		; RV32-NEXT: vmv.v.x v16, a1
; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma		; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma
; RV32-NEXT: vand.vv v24, v8, v16		; RV32-NEXT: vand.vv v24, v8, v16
; RV32-NEXT: vsrl.vi v8, v8, 2		; RV32-NEXT: vsrl.vi v8, v8, 2
; RV32-NEXT: vand.vv v8, v8, v16		; RV32-NEXT: vand.vv v8, v8, v16
; RV32-NEXT: vadd.vv v8, v24, v8		; RV32-NEXT: vadd.vv v8, v24, v8
; RV32-NEXT: vsrl.vi v16, v8, 4		; RV32-NEXT: vsrl.vi v16, v8, 4
; RV32-NEXT: vadd.vv v8, v8, v16		; RV32-NEXT: vadd.vv v8, v8, v16
; RV32-NEXT: lui a2, 61681		; RV32-NEXT: lui a1, 61681
; RV32-NEXT: addi a2, a2, -241		; RV32-NEXT: addi a1, a1, -241
; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma		; RV32-NEXT: vsetvli zero, a2, e32, m8, ta, ma
; RV32-NEXT: vmv.v.x v16, a2		; RV32-NEXT: vmv.v.x v16, a1
; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma		; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma
; RV32-NEXT: vand.vv v8, v8, v16		; RV32-NEXT: vand.vv v8, v8, v16
; RV32-NEXT: lui a2, 4112		; RV32-NEXT: lui a1, 4112
; RV32-NEXT: addi a2, a2, 257		; RV32-NEXT: addi a1, a1, 257
; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma		; RV32-NEXT: vsetvli zero, a2, e32, m8, ta, ma
; RV32-NEXT: vmv.v.x v16, a2		; RV32-NEXT: vmv.v.x v16, a1
; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma		; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma
; RV32-NEXT: vmul.vv v8, v8, v16		; RV32-NEXT: vmul.vv v8, v8, v16
; RV32-NEXT: li a0, 56		; RV32-NEXT: li a0, 56
; RV32-NEXT: vsrl.vx v8, v8, a0		; RV32-NEXT: vsrl.vx v8, v8, a0
; RV32-NEXT: ret		; RV32-NEXT: ret
;		;
; RV64-LABEL: vp_cttz_zero_undef_v15i64_unmasked:		; RV64-LABEL: vp_cttz_zero_undef_v15i64_unmasked:
; RV64: # %bb.0:		; RV64: # %bb.0:
Show All 39 Lines
}		}

define <16 x i64> @vp_cttz_zero_undef_v16i64(<16 x i64> %va, <16 x i1> %m, i32 zeroext %evl) {		define <16 x i64> @vp_cttz_zero_undef_v16i64(<16 x i64> %va, <16 x i1> %m, i32 zeroext %evl) {
; RV32-LABEL: vp_cttz_zero_undef_v16i64:		; RV32-LABEL: vp_cttz_zero_undef_v16i64:
; RV32: # %bb.0:		; RV32: # %bb.0:
; RV32-NEXT: li a1, 1		; RV32-NEXT: li a1, 1
; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma		; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma
; RV32-NEXT: vsub.vx v16, v8, a1, v0.t		; RV32-NEXT: vsub.vx v16, v8, a1, v0.t
; RV32-NEXT: li a1, 32		; RV32-NEXT: vnot.v v8, v8, v0.t
; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma
; RV32-NEXT: vmv.v.i v24, -1
; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma
; RV32-NEXT: vxor.vv v8, v8, v24, v0.t
; RV32-NEXT: vand.vv v8, v8, v16, v0.t		; RV32-NEXT: vand.vv v8, v8, v16, v0.t
; RV32-NEXT: vsrl.vi v16, v8, 1, v0.t		; RV32-NEXT: vsrl.vi v16, v8, 1, v0.t
; RV32-NEXT: lui a2, 349525		; RV32-NEXT: lui a1, 349525
; RV32-NEXT: addi a2, a2, 1365		; RV32-NEXT: addi a1, a1, 1365
; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma		; RV32-NEXT: li a2, 32
; RV32-NEXT: vmv.v.x v24, a2		; RV32-NEXT: vsetvli zero, a2, e32, m8, ta, ma
		; RV32-NEXT: vmv.v.x v24, a1
; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma		; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma
; RV32-NEXT: vand.vv v16, v16, v24, v0.t		; RV32-NEXT: vand.vv v16, v16, v24, v0.t
; RV32-NEXT: vsub.vv v8, v8, v16, v0.t		; RV32-NEXT: vsub.vv v8, v8, v16, v0.t
; RV32-NEXT: lui a2, 209715		; RV32-NEXT: lui a1, 209715
; RV32-NEXT: addi a2, a2, 819		; RV32-NEXT: addi a1, a1, 819
; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma		; RV32-NEXT: vsetvli zero, a2, e32, m8, ta, ma
; RV32-NEXT: vmv.v.x v16, a2		; RV32-NEXT: vmv.v.x v16, a1
; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma		; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma
; RV32-NEXT: vand.vv v24, v8, v16, v0.t		; RV32-NEXT: vand.vv v24, v8, v16, v0.t
; RV32-NEXT: vsrl.vi v8, v8, 2, v0.t		; RV32-NEXT: vsrl.vi v8, v8, 2, v0.t
; RV32-NEXT: vand.vv v8, v8, v16, v0.t		; RV32-NEXT: vand.vv v8, v8, v16, v0.t
; RV32-NEXT: vadd.vv v8, v24, v8, v0.t		; RV32-NEXT: vadd.vv v8, v24, v8, v0.t
; RV32-NEXT: vsrl.vi v16, v8, 4, v0.t		; RV32-NEXT: vsrl.vi v16, v8, 4, v0.t
; RV32-NEXT: vadd.vv v8, v8, v16, v0.t		; RV32-NEXT: vadd.vv v8, v8, v16, v0.t
; RV32-NEXT: lui a2, 61681		; RV32-NEXT: lui a1, 61681
; RV32-NEXT: addi a2, a2, -241		; RV32-NEXT: addi a1, a1, -241
; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma		; RV32-NEXT: vsetvli zero, a2, e32, m8, ta, ma
; RV32-NEXT: vmv.v.x v16, a2		; RV32-NEXT: vmv.v.x v16, a1
; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma		; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma
; RV32-NEXT: vand.vv v8, v8, v16, v0.t		; RV32-NEXT: vand.vv v8, v8, v16, v0.t
; RV32-NEXT: lui a2, 4112		; RV32-NEXT: lui a1, 4112
; RV32-NEXT: addi a2, a2, 257		; RV32-NEXT: addi a1, a1, 257
; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma		; RV32-NEXT: vsetvli zero, a2, e32, m8, ta, ma
; RV32-NEXT: vmv.v.x v16, a2		; RV32-NEXT: vmv.v.x v16, a1
; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma		; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma
; RV32-NEXT: vmul.vv v8, v8, v16, v0.t		; RV32-NEXT: vmul.vv v8, v8, v16, v0.t
; RV32-NEXT: li a0, 56		; RV32-NEXT: li a0, 56
; RV32-NEXT: vsrl.vx v8, v8, a0, v0.t		; RV32-NEXT: vsrl.vx v8, v8, a0, v0.t
; RV32-NEXT: ret		; RV32-NEXT: ret
;		;
; RV64-LABEL: vp_cttz_zero_undef_v16i64:		; RV64-LABEL: vp_cttz_zero_undef_v16i64:
; RV64: # %bb.0:		; RV64: # %bb.0:
Show All 37 Lines
}		}

define <16 x i64> @vp_cttz_zero_undef_v16i64_unmasked(<16 x i64> %va, i32 zeroext %evl) {		define <16 x i64> @vp_cttz_zero_undef_v16i64_unmasked(<16 x i64> %va, i32 zeroext %evl) {
; RV32-LABEL: vp_cttz_zero_undef_v16i64_unmasked:		; RV32-LABEL: vp_cttz_zero_undef_v16i64_unmasked:
; RV32: # %bb.0:		; RV32: # %bb.0:
; RV32-NEXT: li a1, 1		; RV32-NEXT: li a1, 1
; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma		; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma
; RV32-NEXT: vsub.vx v16, v8, a1		; RV32-NEXT: vsub.vx v16, v8, a1
; RV32-NEXT: li a1, 32		; RV32-NEXT: vnot.v v8, v8
; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma
; RV32-NEXT: vmv.v.i v24, -1
; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma
; RV32-NEXT: vxor.vv v8, v8, v24
; RV32-NEXT: vand.vv v8, v8, v16		; RV32-NEXT: vand.vv v8, v8, v16
; RV32-NEXT: vsrl.vi v16, v8, 1		; RV32-NEXT: vsrl.vi v16, v8, 1
; RV32-NEXT: lui a2, 349525		; RV32-NEXT: lui a1, 349525
; RV32-NEXT: addi a2, a2, 1365		; RV32-NEXT: addi a1, a1, 1365
; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma		; RV32-NEXT: li a2, 32
; RV32-NEXT: vmv.v.x v24, a2		; RV32-NEXT: vsetvli zero, a2, e32, m8, ta, ma
		; RV32-NEXT: vmv.v.x v24, a1
; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma		; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma
; RV32-NEXT: vand.vv v16, v16, v24		; RV32-NEXT: vand.vv v16, v16, v24
; RV32-NEXT: vsub.vv v8, v8, v16		; RV32-NEXT: vsub.vv v8, v8, v16
; RV32-NEXT: lui a2, 209715		; RV32-NEXT: lui a1, 209715
; RV32-NEXT: addi a2, a2, 819		; RV32-NEXT: addi a1, a1, 819
; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma		; RV32-NEXT: vsetvli zero, a2, e32, m8, ta, ma
; RV32-NEXT: vmv.v.x v16, a2		; RV32-NEXT: vmv.v.x v16, a1
; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma		; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma
; RV32-NEXT: vand.vv v24, v8, v16		; RV32-NEXT: vand.vv v24, v8, v16
; RV32-NEXT: vsrl.vi v8, v8, 2		; RV32-NEXT: vsrl.vi v8, v8, 2
; RV32-NEXT: vand.vv v8, v8, v16		; RV32-NEXT: vand.vv v8, v8, v16
; RV32-NEXT: vadd.vv v8, v24, v8		; RV32-NEXT: vadd.vv v8, v24, v8
; RV32-NEXT: vsrl.vi v16, v8, 4		; RV32-NEXT: vsrl.vi v16, v8, 4
; RV32-NEXT: vadd.vv v8, v8, v16		; RV32-NEXT: vadd.vv v8, v8, v16
; RV32-NEXT: lui a2, 61681		; RV32-NEXT: lui a1, 61681
; RV32-NEXT: addi a2, a2, -241		; RV32-NEXT: addi a1, a1, -241
; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma		; RV32-NEXT: vsetvli zero, a2, e32, m8, ta, ma
; RV32-NEXT: vmv.v.x v16, a2		; RV32-NEXT: vmv.v.x v16, a1
; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma		; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma
; RV32-NEXT: vand.vv v8, v8, v16		; RV32-NEXT: vand.vv v8, v8, v16
; RV32-NEXT: lui a2, 4112		; RV32-NEXT: lui a1, 4112
; RV32-NEXT: addi a2, a2, 257		; RV32-NEXT: addi a1, a1, 257
; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma		; RV32-NEXT: vsetvli zero, a2, e32, m8, ta, ma
; RV32-NEXT: vmv.v.x v16, a2		; RV32-NEXT: vmv.v.x v16, a1
; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma		; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma
; RV32-NEXT: vmul.vv v8, v8, v16		; RV32-NEXT: vmul.vv v8, v8, v16
; RV32-NEXT: li a0, 56		; RV32-NEXT: li a0, 56
; RV32-NEXT: vsrl.vx v8, v8, a0		; RV32-NEXT: vsrl.vx v8, v8, a0
; RV32-NEXT: ret		; RV32-NEXT: ret
;		;
; RV64-LABEL: vp_cttz_zero_undef_v16i64_unmasked:		; RV64-LABEL: vp_cttz_zero_undef_v16i64_unmasked:
; RV64: # %bb.0:		; RV64: # %bb.0:
Show All 39 Lines
}		}

define <32 x i64> @vp_cttz_zero_undef_v32i64(<32 x i64> %va, <32 x i1> %m, i32 zeroext %evl) {		define <32 x i64> @vp_cttz_zero_undef_v32i64(<32 x i64> %va, <32 x i1> %m, i32 zeroext %evl) {
; RV32-LABEL: vp_cttz_zero_undef_v32i64:		; RV32-LABEL: vp_cttz_zero_undef_v32i64:
; RV32: # %bb.0:		; RV32: # %bb.0:
; RV32-NEXT: addi sp, sp, -16		; RV32-NEXT: addi sp, sp, -16
; RV32-NEXT: .cfi_def_cfa_offset 16		; RV32-NEXT: .cfi_def_cfa_offset 16
; RV32-NEXT: csrr a1, vlenb		; RV32-NEXT: csrr a1, vlenb
; RV32-NEXT: slli a1, a1, 6		; RV32-NEXT: li a2, 56
		; RV32-NEXT: mul a1, a1, a2
; RV32-NEXT: sub sp, sp, a1		; RV32-NEXT: sub sp, sp, a1
; RV32-NEXT: .cfi_escape 0x0f, 0x0e, 0x72, 0x00, 0x11, 0x10, 0x22, 0x11, 0xc0, 0x00, 0x92, 0xa2, 0x38, 0x00, 0x1e, 0x22 # sp + 16 + 64 * vlenb		; RV32-NEXT: .cfi_escape 0x0f, 0x0d, 0x72, 0x00, 0x11, 0x10, 0x22, 0x11, 0x38, 0x92, 0xa2, 0x38, 0x00, 0x1e, 0x22 # sp + 16 + 56 * vlenb
; RV32-NEXT: csrr a1, vlenb		; RV32-NEXT: csrr a1, vlenb
; RV32-NEXT: li a2, 40		; RV32-NEXT: slli a1, a1, 5
; RV32-NEXT: mul a1, a1, a2
; RV32-NEXT: add a1, sp, a1		; RV32-NEXT: add a1, sp, a1
; RV32-NEXT: addi a1, a1, 16		; RV32-NEXT: addi a1, a1, 16
; RV32-NEXT: vs8r.v v16, (a1) # Unknown-size Folded Spill		; RV32-NEXT: vs8r.v v16, (a1) # Unknown-size Folded Spill
; RV32-NEXT: vmv8r.v v16, v8
; RV32-NEXT: vsetivli zero, 2, e8, mf4, ta, ma		; RV32-NEXT: vsetivli zero, 2, e8, mf4, ta, ma
; RV32-NEXT: li a1, 16		; RV32-NEXT: li a1, 16
; RV32-NEXT: vslidedown.vi v24, v0, 2		; RV32-NEXT: vslidedown.vi v24, v0, 2
; RV32-NEXT: mv a2, a0		; RV32-NEXT: mv a2, a0
; RV32-NEXT: bltu a0, a1, .LBB70_2		; RV32-NEXT: bltu a0, a1, .LBB70_2
; RV32-NEXT: # %bb.1:		; RV32-NEXT: # %bb.1:
; RV32-NEXT: li a2, 16		; RV32-NEXT: li a2, 16
; RV32-NEXT: .LBB70_2:		; RV32-NEXT: .LBB70_2:
; RV32-NEXT: li a1, 1		; RV32-NEXT: li a1, 1
; RV32-NEXT: vsetvli zero, a2, e64, m8, ta, ma		; RV32-NEXT: vsetvli zero, a2, e64, m8, ta, ma
; RV32-NEXT: vsub.vx v8, v16, a1, v0.t		; RV32-NEXT: vsub.vx v16, v8, a1, v0.t
		; RV32-NEXT: vnot.v v8, v8, v0.t
		; RV32-NEXT: vand.vv v8, v8, v16, v0.t
; RV32-NEXT: csrr a3, vlenb		; RV32-NEXT: csrr a3, vlenb
; RV32-NEXT: li a4, 56		; RV32-NEXT: li a4, 40
; RV32-NEXT: mul a3, a3, a4		; RV32-NEXT: mul a3, a3, a4
; RV32-NEXT: add a3, sp, a3		; RV32-NEXT: add a3, sp, a3
; RV32-NEXT: addi a3, a3, 16		; RV32-NEXT: addi a3, a3, 16
; RV32-NEXT: vs8r.v v8, (a3) # Unknown-size Folded Spill		; RV32-NEXT: vs8r.v v8, (a3) # Unknown-size Folded Spill
; RV32-NEXT: li a3, 32
; RV32-NEXT: vsetvli zero, a3, e32, m8, ta, ma
; RV32-NEXT: vmv.v.i v8, -1
; RV32-NEXT: csrr a4, vlenb
; RV32-NEXT: slli a4, a4, 5
; RV32-NEXT: add a4, sp, a4
; RV32-NEXT: addi a4, a4, 16
; RV32-NEXT: vs8r.v v8, (a4) # Unknown-size Folded Spill
; RV32-NEXT: vsetvli zero, a2, e64, m8, ta, ma
; RV32-NEXT: vxor.vv v16, v16, v8, v0.t
; RV32-NEXT: csrr a4, vlenb
; RV32-NEXT: li a5, 56
; RV32-NEXT: mul a4, a4, a5
; RV32-NEXT: add a4, sp, a4
; RV32-NEXT: addi a4, a4, 16
; RV32-NEXT: vl8r.v v8, (a4) # Unknown-size Folded Reload
; RV32-NEXT: vand.vv v8, v16, v8, v0.t
; RV32-NEXT: csrr a4, vlenb
; RV32-NEXT: li a5, 48
; RV32-NEXT: mul a4, a4, a5
; RV32-NEXT: add a4, sp, a4
; RV32-NEXT: addi a4, a4, 16
; RV32-NEXT: vs8r.v v8, (a4) # Unknown-size Folded Spill
; RV32-NEXT: lui a4, 349525
; RV32-NEXT: addi a4, a4, 1365
; RV32-NEXT: vsrl.vi v8, v8, 1, v0.t		; RV32-NEXT: vsrl.vi v8, v8, 1, v0.t
; RV32-NEXT: csrr a5, vlenb		; RV32-NEXT: csrr a3, vlenb
; RV32-NEXT: li a6, 56		; RV32-NEXT: li a4, 48
; RV32-NEXT: mul a5, a5, a6		; RV32-NEXT: mul a3, a3, a4
; RV32-NEXT: add a5, sp, a5		; RV32-NEXT: add a3, sp, a3
; RV32-NEXT: addi a5, a5, 16		; RV32-NEXT: addi a3, a3, 16
; RV32-NEXT: vs8r.v v8, (a5) # Unknown-size Folded Spill		; RV32-NEXT: vs8r.v v8, (a3) # Unknown-size Folded Spill
; RV32-NEXT: vsetvli zero, a3, e32, m8, ta, ma		; RV32-NEXT: lui a3, 349525
; RV32-NEXT: vmv.v.x v8, a4		; RV32-NEXT: addi a3, a3, 1365
; RV32-NEXT: csrr a4, vlenb		; RV32-NEXT: li a4, 32
		; RV32-NEXT: vsetvli zero, a4, e32, m8, ta, ma
		; RV32-NEXT: vmv.v.x v8, a3
		; RV32-NEXT: csrr a3, vlenb
; RV32-NEXT: li a5, 24		; RV32-NEXT: li a5, 24
; RV32-NEXT: mul a4, a4, a5		; RV32-NEXT: mul a3, a3, a5
; RV32-NEXT: add a4, sp, a4		; RV32-NEXT: add a3, sp, a3
; RV32-NEXT: addi a4, a4, 16		; RV32-NEXT: addi a3, a3, 16
; RV32-NEXT: vs8r.v v8, (a4) # Unknown-size Folded Spill		; RV32-NEXT: vs8r.v v8, (a3) # Unknown-size Folded Spill
; RV32-NEXT: vsetvli zero, a2, e64, m8, ta, ma		; RV32-NEXT: vsetvli zero, a2, e64, m8, ta, ma
; RV32-NEXT: csrr a4, vlenb		; RV32-NEXT: csrr a3, vlenb
; RV32-NEXT: li a5, 56
; RV32-NEXT: mul a4, a4, a5
; RV32-NEXT: add a4, sp, a4
; RV32-NEXT: addi a4, a4, 16
; RV32-NEXT: vl8r.v v16, (a4) # Unknown-size Folded Reload
; RV32-NEXT: vand.vv v16, v16, v8, v0.t
; RV32-NEXT: csrr a4, vlenb
; RV32-NEXT: li a5, 48		; RV32-NEXT: li a5, 48
; RV32-NEXT: mul a4, a4, a5		; RV32-NEXT: mul a3, a3, a5
; RV32-NEXT: add a4, sp, a4		; RV32-NEXT: add a3, sp, a3
; RV32-NEXT: addi a4, a4, 16		; RV32-NEXT: addi a3, a3, 16
; RV32-NEXT: vl8r.v v8, (a4) # Unknown-size Folded Reload		; RV32-NEXT: vl8r.v v16, (a3) # Unknown-size Folded Reload
		; RV32-NEXT: vand.vv v16, v16, v8, v0.t
		; RV32-NEXT: csrr a3, vlenb
		; RV32-NEXT: li a5, 40
		; RV32-NEXT: mul a3, a3, a5
		; RV32-NEXT: add a3, sp, a3
		; RV32-NEXT: addi a3, a3, 16
		; RV32-NEXT: vl8r.v v8, (a3) # Unknown-size Folded Reload
; RV32-NEXT: vsub.vv v8, v8, v16, v0.t		; RV32-NEXT: vsub.vv v8, v8, v16, v0.t
; RV32-NEXT: csrr a4, vlenb		; RV32-NEXT: csrr a3, vlenb
		; RV32-NEXT: li a5, 40
		; RV32-NEXT: mul a3, a3, a5
		; RV32-NEXT: add a3, sp, a3
		; RV32-NEXT: addi a3, a3, 16
		; RV32-NEXT: vs8r.v v8, (a3) # Unknown-size Folded Spill
		; RV32-NEXT: lui a3, 209715
		; RV32-NEXT: addi a3, a3, 819
		; RV32-NEXT: vsetvli zero, a4, e32, m8, ta, ma
		; RV32-NEXT: vmv.v.x v8, a3
		; RV32-NEXT: csrr a3, vlenb
; RV32-NEXT: li a5, 48		; RV32-NEXT: li a5, 48
; RV32-NEXT: mul a4, a4, a5		; RV32-NEXT: mul a3, a3, a5
; RV32-NEXT: add a4, sp, a4		; RV32-NEXT: add a3, sp, a3
; RV32-NEXT: addi a4, a4, 16		; RV32-NEXT: addi a3, a3, 16
; RV32-NEXT: vs8r.v v8, (a4) # Unknown-size Folded Spill		; RV32-NEXT: vs8r.v v8, (a3) # Unknown-size Folded Spill
; RV32-NEXT: lui a4, 209715
; RV32-NEXT: addi a4, a4, 819
; RV32-NEXT: vsetvli zero, a3, e32, m8, ta, ma
; RV32-NEXT: vmv.v.x v8, a4
; RV32-NEXT: csrr a4, vlenb
; RV32-NEXT: li a5, 56
; RV32-NEXT: mul a4, a4, a5
; RV32-NEXT: add a4, sp, a4
; RV32-NEXT: addi a4, a4, 16
; RV32-NEXT: vs8r.v v8, (a4) # Unknown-size Folded Spill
; RV32-NEXT: vsetvli zero, a2, e64, m8, ta, ma		; RV32-NEXT: vsetvli zero, a2, e64, m8, ta, ma
; RV32-NEXT: csrr a4, vlenb		; RV32-NEXT: csrr a3, vlenb
; RV32-NEXT: li a5, 48		; RV32-NEXT: li a5, 40
; RV32-NEXT: mul a4, a4, a5		; RV32-NEXT: mul a3, a3, a5
; RV32-NEXT: add a4, sp, a4		; RV32-NEXT: add a3, sp, a3
; RV32-NEXT: addi a4, a4, 16		; RV32-NEXT: addi a3, a3, 16
; RV32-NEXT: vl8r.v v16, (a4) # Unknown-size Folded Reload		; RV32-NEXT: vl8r.v v16, (a3) # Unknown-size Folded Reload
; RV32-NEXT: vand.vv v16, v16, v8, v0.t		; RV32-NEXT: vand.vv v16, v16, v8, v0.t
; RV32-NEXT: csrr a4, vlenb		; RV32-NEXT: csrr a3, vlenb
; RV32-NEXT: slli a4, a4, 4		; RV32-NEXT: slli a3, a3, 4
; RV32-NEXT: add a4, sp, a4		; RV32-NEXT: add a3, sp, a3
; RV32-NEXT: addi a4, a4, 16		; RV32-NEXT: addi a3, a3, 16
; RV32-NEXT: vs8r.v v16, (a4) # Unknown-size Folded Spill		; RV32-NEXT: vs8r.v v16, (a3) # Unknown-size Folded Spill
; RV32-NEXT: csrr a4, vlenb		; RV32-NEXT: csrr a3, vlenb
; RV32-NEXT: li a5, 48		; RV32-NEXT: li a5, 40
; RV32-NEXT: mul a4, a4, a5		; RV32-NEXT: mul a3, a3, a5
; RV32-NEXT: add a4, sp, a4		; RV32-NEXT: add a3, sp, a3
; RV32-NEXT: addi a4, a4, 16		; RV32-NEXT: addi a3, a3, 16
; RV32-NEXT: vl8r.v v16, (a4) # Unknown-size Folded Reload		; RV32-NEXT: vl8r.v v16, (a3) # Unknown-size Folded Reload
; RV32-NEXT: vsrl.vi v16, v16, 2, v0.t		; RV32-NEXT: vsrl.vi v16, v16, 2, v0.t
; RV32-NEXT: vand.vv v16, v16, v8, v0.t		; RV32-NEXT: vand.vv v16, v16, v8, v0.t
; RV32-NEXT: csrr a4, vlenb		; RV32-NEXT: csrr a3, vlenb
; RV32-NEXT: slli a4, a4, 4		; RV32-NEXT: slli a3, a3, 4
; RV32-NEXT: add a4, sp, a4		; RV32-NEXT: add a3, sp, a3
; RV32-NEXT: addi a4, a4, 16		; RV32-NEXT: addi a3, a3, 16
; RV32-NEXT: vl8r.v v8, (a4) # Unknown-size Folded Reload		; RV32-NEXT: vl8r.v v8, (a3) # Unknown-size Folded Reload
; RV32-NEXT: vadd.vv v8, v8, v16, v0.t		; RV32-NEXT: vadd.vv v8, v8, v16, v0.t
; RV32-NEXT: vsrl.vi v16, v8, 4, v0.t		; RV32-NEXT: vsrl.vi v16, v8, 4, v0.t
; RV32-NEXT: vadd.vv v16, v8, v16, v0.t		; RV32-NEXT: vadd.vv v16, v8, v16, v0.t
; RV32-NEXT: lui a4, 61681		; RV32-NEXT: lui a3, 61681
; RV32-NEXT: addi a4, a4, -241		; RV32-NEXT: addi a3, a3, -241
; RV32-NEXT: vsetvli zero, a3, e32, m8, ta, ma		; RV32-NEXT: vsetvli zero, a4, e32, m8, ta, ma
; RV32-NEXT: vmv.v.x v8, a4		; RV32-NEXT: vmv.v.x v8, a3
; RV32-NEXT: csrr a4, vlenb		; RV32-NEXT: csrr a3, vlenb
; RV32-NEXT: li a5, 48		; RV32-NEXT: li a5, 40
; RV32-NEXT: mul a4, a4, a5		; RV32-NEXT: mul a3, a3, a5
; RV32-NEXT: add a4, sp, a4		; RV32-NEXT: add a3, sp, a3
; RV32-NEXT: addi a4, a4, 16		; RV32-NEXT: addi a3, a3, 16
; RV32-NEXT: vs8r.v v8, (a4) # Unknown-size Folded Spill		; RV32-NEXT: vs8r.v v8, (a3) # Unknown-size Folded Spill
; RV32-NEXT: vsetvli zero, a2, e64, m8, ta, ma		; RV32-NEXT: vsetvli zero, a2, e64, m8, ta, ma
; RV32-NEXT: vand.vv v8, v16, v8, v0.t		; RV32-NEXT: vand.vv v8, v16, v8, v0.t
; RV32-NEXT: lui a4, 4112		; RV32-NEXT: lui a3, 4112
; RV32-NEXT: addi a4, a4, 257		; RV32-NEXT: addi a3, a3, 257
; RV32-NEXT: vsetvli zero, a3, e32, m8, ta, ma		; RV32-NEXT: vsetvli zero, a4, e32, m8, ta, ma
; RV32-NEXT: vmv.v.x v16, a4		; RV32-NEXT: vmv.v.x v16, a3
; RV32-NEXT: csrr a3, vlenb		; RV32-NEXT: csrr a3, vlenb
; RV32-NEXT: slli a3, a3, 3		; RV32-NEXT: slli a3, a3, 3
; RV32-NEXT: add a3, sp, a3		; RV32-NEXT: add a3, sp, a3
; RV32-NEXT: addi a3, a3, 16		; RV32-NEXT: addi a3, a3, 16
; RV32-NEXT: vs8r.v v16, (a3) # Unknown-size Folded Spill		; RV32-NEXT: vs8r.v v16, (a3) # Unknown-size Folded Spill
; RV32-NEXT: vsetvli zero, a2, e64, m8, ta, ma		; RV32-NEXT: vsetvli zero, a2, e64, m8, ta, ma
; RV32-NEXT: vmul.vv v8, v8, v16, v0.t		; RV32-NEXT: vmul.vv v8, v8, v16, v0.t
; RV32-NEXT: li a2, 56		; RV32-NEXT: li a2, 56
; RV32-NEXT: vsrl.vx v8, v8, a2, v0.t		; RV32-NEXT: vsrl.vx v8, v8, a2, v0.t
; RV32-NEXT: csrr a3, vlenb		; RV32-NEXT: csrr a3, vlenb
; RV32-NEXT: slli a3, a3, 4		; RV32-NEXT: slli a3, a3, 4
; RV32-NEXT: add a3, sp, a3		; RV32-NEXT: add a3, sp, a3
; RV32-NEXT: addi a3, a3, 16		; RV32-NEXT: addi a3, a3, 16
; RV32-NEXT: vs8r.v v8, (a3) # Unknown-size Folded Spill		; RV32-NEXT: vs8r.v v8, (a3) # Unknown-size Folded Spill
; RV32-NEXT: addi a3, a0, -16		; RV32-NEXT: addi a3, a0, -16
; RV32-NEXT: sltu a0, a0, a3		; RV32-NEXT: sltu a0, a0, a3
; RV32-NEXT: addi a0, a0, -1		; RV32-NEXT: addi a0, a0, -1
; RV32-NEXT: and a0, a0, a3		; RV32-NEXT: and a0, a0, a3
; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma		; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma
; RV32-NEXT: vmv1r.v v0, v24		; RV32-NEXT: vmv1r.v v0, v24
; RV32-NEXT: csrr a0, vlenb		; RV32-NEXT: csrr a0, vlenb
; RV32-NEXT: li a3, 40		; RV32-NEXT: slli a0, a0, 5
; RV32-NEXT: mul a0, a0, a3
; RV32-NEXT: add a0, sp, a0		; RV32-NEXT: add a0, sp, a0
; RV32-NEXT: addi a0, a0, 16		; RV32-NEXT: addi a0, a0, 16
; RV32-NEXT: vl8r.v v16, (a0) # Unknown-size Folded Reload		; RV32-NEXT: vl8r.v v16, (a0) # Unknown-size Folded Reload
; RV32-NEXT: vsub.vx v8, v16, a1, v0.t		; RV32-NEXT: vsub.vx v8, v16, a1, v0.t
; RV32-NEXT: addi a0, sp, 16		; RV32-NEXT: vnot.v v16, v16, v0.t
; RV32-NEXT: vs8r.v v8, (a0) # Unknown-size Folded Spill
; RV32-NEXT: csrr a0, vlenb
; RV32-NEXT: slli a0, a0, 5
; RV32-NEXT: add a0, sp, a0
; RV32-NEXT: addi a0, a0, 16
; RV32-NEXT: vl8r.v v8, (a0) # Unknown-size Folded Reload
; RV32-NEXT: vxor.vv v16, v16, v8, v0.t
; RV32-NEXT: addi a0, sp, 16
; RV32-NEXT: vl8r.v v8, (a0) # Unknown-size Folded Reload
; RV32-NEXT: vand.vv v8, v16, v8, v0.t		; RV32-NEXT: vand.vv v8, v16, v8, v0.t
; RV32-NEXT: csrr a0, vlenb		; RV32-NEXT: addi a0, sp, 16
; RV32-NEXT: slli a0, a0, 5
; RV32-NEXT: add a0, sp, a0
; RV32-NEXT: addi a0, a0, 16
; RV32-NEXT: vs8r.v v8, (a0) # Unknown-size Folded Spill		; RV32-NEXT: vs8r.v v8, (a0) # Unknown-size Folded Spill
; RV32-NEXT: vsrl.vi v16, v8, 1, v0.t		; RV32-NEXT: vsrl.vi v16, v8, 1, v0.t
; RV32-NEXT: csrr a0, vlenb		; RV32-NEXT: csrr a0, vlenb
; RV32-NEXT: li a1, 40		; RV32-NEXT: slli a0, a0, 5
; RV32-NEXT: mul a0, a0, a1
; RV32-NEXT: add a0, sp, a0		; RV32-NEXT: add a0, sp, a0
; RV32-NEXT: addi a0, a0, 16		; RV32-NEXT: addi a0, a0, 16
; RV32-NEXT: vs8r.v v16, (a0) # Unknown-size Folded Spill		; RV32-NEXT: vs8r.v v16, (a0) # Unknown-size Folded Spill
; RV32-NEXT: csrr a0, vlenb		; RV32-NEXT: csrr a0, vlenb
; RV32-NEXT: li a1, 24		; RV32-NEXT: li a1, 24
; RV32-NEXT: mul a0, a0, a1		; RV32-NEXT: mul a0, a0, a1
; RV32-NEXT: add a0, sp, a0		; RV32-NEXT: add a0, sp, a0
; RV32-NEXT: addi a0, a0, 16		; RV32-NEXT: addi a0, a0, 16
; RV32-NEXT: vl8r.v v16, (a0) # Unknown-size Folded Reload		; RV32-NEXT: vl8r.v v16, (a0) # Unknown-size Folded Reload
; RV32-NEXT: csrr a0, vlenb		; RV32-NEXT: csrr a0, vlenb
; RV32-NEXT: li a1, 40		; RV32-NEXT: slli a0, a0, 5
; RV32-NEXT: mul a0, a0, a1
; RV32-NEXT: add a0, sp, a0		; RV32-NEXT: add a0, sp, a0
; RV32-NEXT: addi a0, a0, 16		; RV32-NEXT: addi a0, a0, 16
; RV32-NEXT: vl8r.v v8, (a0) # Unknown-size Folded Reload		; RV32-NEXT: vl8r.v v8, (a0) # Unknown-size Folded Reload
; RV32-NEXT: vand.vv v16, v8, v16, v0.t		; RV32-NEXT: vand.vv v16, v8, v16, v0.t
; RV32-NEXT: csrr a0, vlenb		; RV32-NEXT: addi a0, sp, 16
; RV32-NEXT: slli a0, a0, 5
; RV32-NEXT: add a0, sp, a0
; RV32-NEXT: addi a0, a0, 16
; RV32-NEXT: vl8r.v v8, (a0) # Unknown-size Folded Reload		; RV32-NEXT: vl8r.v v8, (a0) # Unknown-size Folded Reload
; RV32-NEXT: vsub.vv v8, v8, v16, v0.t		; RV32-NEXT: vsub.vv v8, v8, v16, v0.t
; RV32-NEXT: csrr a0, vlenb		; RV32-NEXT: csrr a0, vlenb
; RV32-NEXT: li a1, 56		; RV32-NEXT: li a1, 48
; RV32-NEXT: mul a0, a0, a1		; RV32-NEXT: mul a0, a0, a1
; RV32-NEXT: add a0, sp, a0		; RV32-NEXT: add a0, sp, a0
; RV32-NEXT: addi a0, a0, 16		; RV32-NEXT: addi a0, a0, 16
; RV32-NEXT: vl8r.v v16, (a0) # Unknown-size Folded Reload		; RV32-NEXT: vl8r.v v16, (a0) # Unknown-size Folded Reload
; RV32-NEXT: vand.vv v16, v8, v16, v0.t		; RV32-NEXT: vand.vv v16, v8, v16, v0.t
; RV32-NEXT: csrr a0, vlenb		; RV32-NEXT: csrr a0, vlenb
; RV32-NEXT: li a1, 40		; RV32-NEXT: slli a0, a0, 5
; RV32-NEXT: mul a0, a0, a1
; RV32-NEXT: add a0, sp, a0		; RV32-NEXT: add a0, sp, a0
; RV32-NEXT: addi a0, a0, 16		; RV32-NEXT: addi a0, a0, 16
; RV32-NEXT: vs8r.v v16, (a0) # Unknown-size Folded Spill		; RV32-NEXT: vs8r.v v16, (a0) # Unknown-size Folded Spill
; RV32-NEXT: vsrl.vi v8, v8, 2, v0.t		; RV32-NEXT: vsrl.vi v8, v8, 2, v0.t
; RV32-NEXT: csrr a0, vlenb		; RV32-NEXT: csrr a0, vlenb
; RV32-NEXT: li a1, 56		; RV32-NEXT: li a1, 48
; RV32-NEXT: mul a0, a0, a1		; RV32-NEXT: mul a0, a0, a1
; RV32-NEXT: add a0, sp, a0		; RV32-NEXT: add a0, sp, a0
; RV32-NEXT: addi a0, a0, 16		; RV32-NEXT: addi a0, a0, 16
; RV32-NEXT: vl8r.v v16, (a0) # Unknown-size Folded Reload		; RV32-NEXT: vl8r.v v16, (a0) # Unknown-size Folded Reload
; RV32-NEXT: vand.vv v8, v8, v16, v0.t		; RV32-NEXT: vand.vv v8, v8, v16, v0.t
; RV32-NEXT: csrr a0, vlenb		; RV32-NEXT: csrr a0, vlenb
; RV32-NEXT: li a1, 40		; RV32-NEXT: slli a0, a0, 5
; RV32-NEXT: mul a0, a0, a1
; RV32-NEXT: add a0, sp, a0		; RV32-NEXT: add a0, sp, a0
; RV32-NEXT: addi a0, a0, 16		; RV32-NEXT: addi a0, a0, 16
; RV32-NEXT: vl8r.v v16, (a0) # Unknown-size Folded Reload		; RV32-NEXT: vl8r.v v16, (a0) # Unknown-size Folded Reload
; RV32-NEXT: vadd.vv v8, v16, v8, v0.t		; RV32-NEXT: vadd.vv v8, v16, v8, v0.t
; RV32-NEXT: vsrl.vi v16, v8, 4, v0.t		; RV32-NEXT: vsrl.vi v16, v8, 4, v0.t
; RV32-NEXT: vadd.vv v8, v8, v16, v0.t		; RV32-NEXT: vadd.vv v8, v8, v16, v0.t
; RV32-NEXT: csrr a0, vlenb		; RV32-NEXT: csrr a0, vlenb
; RV32-NEXT: li a1, 48		; RV32-NEXT: li a1, 40
; RV32-NEXT: mul a0, a0, a1		; RV32-NEXT: mul a0, a0, a1
; RV32-NEXT: add a0, sp, a0		; RV32-NEXT: add a0, sp, a0
; RV32-NEXT: addi a0, a0, 16		; RV32-NEXT: addi a0, a0, 16
; RV32-NEXT: vl8r.v v16, (a0) # Unknown-size Folded Reload		; RV32-NEXT: vl8r.v v16, (a0) # Unknown-size Folded Reload
; RV32-NEXT: vand.vv v8, v8, v16, v0.t		; RV32-NEXT: vand.vv v8, v8, v16, v0.t
; RV32-NEXT: csrr a0, vlenb		; RV32-NEXT: csrr a0, vlenb
; RV32-NEXT: slli a0, a0, 3		; RV32-NEXT: slli a0, a0, 3
; RV32-NEXT: add a0, sp, a0		; RV32-NEXT: add a0, sp, a0
; RV32-NEXT: addi a0, a0, 16		; RV32-NEXT: addi a0, a0, 16
; RV32-NEXT: vl8r.v v16, (a0) # Unknown-size Folded Reload		; RV32-NEXT: vl8r.v v16, (a0) # Unknown-size Folded Reload
; RV32-NEXT: vmul.vv v8, v8, v16, v0.t		; RV32-NEXT: vmul.vv v8, v8, v16, v0.t
; RV32-NEXT: vsrl.vx v16, v8, a2, v0.t		; RV32-NEXT: vsrl.vx v16, v8, a2, v0.t
; RV32-NEXT: csrr a0, vlenb		; RV32-NEXT: csrr a0, vlenb
; RV32-NEXT: slli a0, a0, 4		; RV32-NEXT: slli a0, a0, 4
; RV32-NEXT: add a0, sp, a0		; RV32-NEXT: add a0, sp, a0
; RV32-NEXT: addi a0, a0, 16		; RV32-NEXT: addi a0, a0, 16
; RV32-NEXT: vl8r.v v8, (a0) # Unknown-size Folded Reload		; RV32-NEXT: vl8r.v v8, (a0) # Unknown-size Folded Reload
; RV32-NEXT: csrr a0, vlenb		; RV32-NEXT: csrr a0, vlenb
; RV32-NEXT: slli a0, a0, 6		; RV32-NEXT: li a1, 56
		; RV32-NEXT: mul a0, a0, a1
; RV32-NEXT: add sp, sp, a0		; RV32-NEXT: add sp, sp, a0
; RV32-NEXT: addi sp, sp, 16		; RV32-NEXT: addi sp, sp, 16
; RV32-NEXT: ret		; RV32-NEXT: ret
;		;
; RV64-LABEL: vp_cttz_zero_undef_v32i64:		; RV64-LABEL: vp_cttz_zero_undef_v32i64:
; RV64: # %bb.0:		; RV64: # %bb.0:
; RV64-NEXT: addi sp, sp, -16		; RV64-NEXT: addi sp, sp, -16
; RV64-NEXT: .cfi_def_cfa_offset 16		; RV64-NEXT: .cfi_def_cfa_offset 16
▲ Show 20 Lines • Show All 86 Lines • ▼ Show 20 Lines	; RV64-NEXT: ret
%v = call <32 x i64> @llvm.vp.cttz.v32i64(<32 x i64> %va, i1 true, <32 x i1> %m, i32 %evl)		%v = call <32 x i64> @llvm.vp.cttz.v32i64(<32 x i64> %va, i1 true, <32 x i1> %m, i32 %evl)
ret <32 x i64> %v		ret <32 x i64> %v
}		}

define <32 x i64> @vp_cttz_zero_undef_v32i64_unmasked(<32 x i64> %va, i32 zeroext %evl) {		define <32 x i64> @vp_cttz_zero_undef_v32i64_unmasked(<32 x i64> %va, i32 zeroext %evl) {
; RV32-LABEL: vp_cttz_zero_undef_v32i64_unmasked:		; RV32-LABEL: vp_cttz_zero_undef_v32i64_unmasked:
; RV32: # %bb.0:		; RV32: # %bb.0:
; RV32-NEXT: li a2, 16		; RV32-NEXT: li a2, 16
; RV32-NEXT: vmv8r.v v0, v16		; RV32-NEXT: vmv8r.v v24, v16
; RV32-NEXT: mv a1, a0		; RV32-NEXT: mv a1, a0
; RV32-NEXT: bltu a0, a2, .LBB71_2		; RV32-NEXT: bltu a0, a2, .LBB71_2
; RV32-NEXT: # %bb.1:		; RV32-NEXT: # %bb.1:
; RV32-NEXT: li a1, 16		; RV32-NEXT: li a1, 16
; RV32-NEXT: .LBB71_2:		; RV32-NEXT: .LBB71_2:
; RV32-NEXT: addi sp, sp, -16		; RV32-NEXT: addi sp, sp, -16
; RV32-NEXT: .cfi_def_cfa_offset 16		; RV32-NEXT: .cfi_def_cfa_offset 16
; RV32-NEXT: csrr a2, vlenb		; RV32-NEXT: csrr a2, vlenb
; RV32-NEXT: li a3, 40		; RV32-NEXT: slli a2, a2, 5
; RV32-NEXT: mul a2, a2, a3
; RV32-NEXT: sub sp, sp, a2		; RV32-NEXT: sub sp, sp, a2
; RV32-NEXT: .cfi_escape 0x0f, 0x0d, 0x72, 0x00, 0x11, 0x10, 0x22, 0x11, 0x28, 0x92, 0xa2, 0x38, 0x00, 0x1e, 0x22 # sp + 16 + 40 * vlenb		; RV32-NEXT: .cfi_escape 0x0f, 0x0d, 0x72, 0x00, 0x11, 0x10, 0x22, 0x11, 0x20, 0x92, 0xa2, 0x38, 0x00, 0x1e, 0x22 # sp + 16 + 32 * vlenb
; RV32-NEXT: li a2, 1		; RV32-NEXT: li a2, 1
; RV32-NEXT: vsetvli zero, a1, e64, m8, ta, ma		; RV32-NEXT: vsetvli zero, a1, e64, m8, ta, ma
; RV32-NEXT: vsub.vx v16, v8, a2		; RV32-NEXT: vsub.vx v16, v8, a2
; RV32-NEXT: li a3, 32		; RV32-NEXT: vnot.v v8, v8
; RV32-NEXT: vsetvli zero, a3, e32, m8, ta, ma
; RV32-NEXT: vmv.v.i v24, -1
; RV32-NEXT: csrr a4, vlenb
; RV32-NEXT: slli a4, a4, 5
; RV32-NEXT: add a4, sp, a4
; RV32-NEXT: addi a4, a4, 16
; RV32-NEXT: vs8r.v v24, (a4) # Unknown-size Folded Spill
; RV32-NEXT: vsetvli zero, a1, e64, m8, ta, ma
; RV32-NEXT: vxor.vv v8, v8, v24
; RV32-NEXT: vand.vv v8, v8, v16		; RV32-NEXT: vand.vv v8, v8, v16
; RV32-NEXT: vsrl.vi v16, v8, 1		; RV32-NEXT: vsrl.vi v16, v8, 1
; RV32-NEXT: lui a4, 349525		; RV32-NEXT: lui a3, 349525
; RV32-NEXT: addi a4, a4, 1365		; RV32-NEXT: addi a3, a3, 1365
; RV32-NEXT: vsetvli zero, a3, e32, m8, ta, ma		; RV32-NEXT: li a4, 32
; RV32-NEXT: vmv.v.x v24, a4		; RV32-NEXT: vsetvli zero, a4, e32, m8, ta, ma
; RV32-NEXT: csrr a4, vlenb		; RV32-NEXT: vmv.v.x v0, a3
		; RV32-NEXT: csrr a3, vlenb
; RV32-NEXT: li a5, 24		; RV32-NEXT: li a5, 24
; RV32-NEXT: mul a4, a4, a5		; RV32-NEXT: mul a3, a3, a5
; RV32-NEXT: add a4, sp, a4		; RV32-NEXT: add a3, sp, a3
; RV32-NEXT: addi a4, a4, 16		; RV32-NEXT: addi a3, a3, 16
; RV32-NEXT: vs8r.v v24, (a4) # Unknown-size Folded Spill		; RV32-NEXT: vs8r.v v0, (a3) # Unknown-size Folded Spill
; RV32-NEXT: vsetvli zero, a1, e64, m8, ta, ma		; RV32-NEXT: vsetvli zero, a1, e64, m8, ta, ma
; RV32-NEXT: vand.vv v16, v16, v24		; RV32-NEXT: vand.vv v16, v16, v0
; RV32-NEXT: vsub.vv v8, v8, v16		; RV32-NEXT: vsub.vv v8, v8, v16
; RV32-NEXT: lui a4, 209715		; RV32-NEXT: lui a3, 209715
; RV32-NEXT: addi a4, a4, 819		; RV32-NEXT: addi a3, a3, 819
; RV32-NEXT: vsetvli zero, a3, e32, m8, ta, ma		; RV32-NEXT: vsetvli zero, a4, e32, m8, ta, ma
; RV32-NEXT: vmv.v.x v16, a4		; RV32-NEXT: vmv.v.x v0, a3
; RV32-NEXT: vsetvli zero, a1, e64, m8, ta, ma		; RV32-NEXT: vsetvli zero, a1, e64, m8, ta, ma
; RV32-NEXT: vand.vv v24, v8, v16		; RV32-NEXT: vand.vv v16, v8, v0
; RV32-NEXT: vsrl.vi v8, v8, 2		; RV32-NEXT: vsrl.vi v8, v8, 2
; RV32-NEXT: vand.vv v8, v8, v16		; RV32-NEXT: vand.vv v8, v8, v0
; RV32-NEXT: vadd.vv v8, v24, v8		; RV32-NEXT: vadd.vv v8, v16, v8
; RV32-NEXT: vsrl.vi v24, v8, 4		; RV32-NEXT: vsrl.vi v16, v8, 4
; RV32-NEXT: vadd.vv v8, v8, v24		; RV32-NEXT: vadd.vv v8, v8, v16
; RV32-NEXT: lui a4, 61681		; RV32-NEXT: lui a3, 61681
; RV32-NEXT: addi a4, a4, -241		; RV32-NEXT: addi a3, a3, -241
; RV32-NEXT: vsetvli zero, a3, e32, m8, ta, ma		; RV32-NEXT: vsetvli zero, a4, e32, m8, ta, ma
; RV32-NEXT: vmv.v.x v24, a4		; RV32-NEXT: vmv.v.x v16, a3
; RV32-NEXT: csrr a4, vlenb		; RV32-NEXT: csrr a3, vlenb
; RV32-NEXT: slli a4, a4, 4		; RV32-NEXT: slli a3, a3, 4
; RV32-NEXT: add a4, sp, a4		; RV32-NEXT: add a3, sp, a3
; RV32-NEXT: addi a4, a4, 16		; RV32-NEXT: addi a3, a3, 16
; RV32-NEXT: vs8r.v v24, (a4) # Unknown-size Folded Spill		; RV32-NEXT: vs8r.v v16, (a3) # Unknown-size Folded Spill
; RV32-NEXT: vsetvli zero, a1, e64, m8, ta, ma		; RV32-NEXT: vsetvli zero, a1, e64, m8, ta, ma
; RV32-NEXT: vand.vv v8, v8, v24		; RV32-NEXT: vand.vv v8, v8, v16
; RV32-NEXT: lui a4, 4112		; RV32-NEXT: lui a3, 4112
; RV32-NEXT: addi a4, a4, 257		; RV32-NEXT: addi a3, a3, 257
; RV32-NEXT: vsetvli zero, a3, e32, m8, ta, ma		; RV32-NEXT: vsetvli zero, a4, e32, m8, ta, ma
; RV32-NEXT: vmv.v.x v24, a4		; RV32-NEXT: vmv.v.x v16, a3
; RV32-NEXT: addi a3, sp, 16		; RV32-NEXT: addi a3, sp, 16
; RV32-NEXT: vs8r.v v24, (a3) # Unknown-size Folded Spill		; RV32-NEXT: vs8r.v v16, (a3) # Unknown-size Folded Spill
; RV32-NEXT: vsetvli zero, a1, e64, m8, ta, ma		; RV32-NEXT: vsetvli zero, a1, e64, m8, ta, ma
; RV32-NEXT: vmul.vv v8, v8, v24		; RV32-NEXT: vmul.vv v8, v8, v16
; RV32-NEXT: li a1, 56		; RV32-NEXT: li a1, 56
; RV32-NEXT: vsrl.vx v8, v8, a1		; RV32-NEXT: vsrl.vx v8, v8, a1
; RV32-NEXT: csrr a3, vlenb		; RV32-NEXT: csrr a3, vlenb
; RV32-NEXT: slli a3, a3, 3		; RV32-NEXT: slli a3, a3, 3
; RV32-NEXT: add a3, sp, a3		; RV32-NEXT: add a3, sp, a3
; RV32-NEXT: addi a3, a3, 16		; RV32-NEXT: addi a3, a3, 16
; RV32-NEXT: vs8r.v v8, (a3) # Unknown-size Folded Spill		; RV32-NEXT: vs8r.v v8, (a3) # Unknown-size Folded Spill
; RV32-NEXT: addi a3, a0, -16		; RV32-NEXT: addi a3, a0, -16
; RV32-NEXT: sltu a0, a0, a3		; RV32-NEXT: sltu a0, a0, a3
; RV32-NEXT: addi a0, a0, -1		; RV32-NEXT: addi a0, a0, -1
; RV32-NEXT: and a0, a0, a3		; RV32-NEXT: and a0, a0, a3
; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma		; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma
; RV32-NEXT: csrr a0, vlenb		; RV32-NEXT: vsub.vx v8, v24, a2
; RV32-NEXT: slli a0, a0, 5		; RV32-NEXT: vnot.v v24, v24
; RV32-NEXT: add a0, sp, a0		; RV32-NEXT: vand.vv v8, v24, v8
; RV32-NEXT: addi a0, a0, 16		; RV32-NEXT: vsrl.vi v24, v8, 1
; RV32-NEXT: vl8r.v v8, (a0) # Unknown-size Folded Reload
; RV32-NEXT: vxor.vv v8, v0, v8
; RV32-NEXT: vsub.vx v0, v0, a2
; RV32-NEXT: vand.vv v8, v8, v0
; RV32-NEXT: vsrl.vi v0, v8, 1
; RV32-NEXT: csrr a0, vlenb		; RV32-NEXT: csrr a0, vlenb
; RV32-NEXT: li a2, 24		; RV32-NEXT: li a2, 24
; RV32-NEXT: mul a0, a0, a2		; RV32-NEXT: mul a0, a0, a2
; RV32-NEXT: add a0, sp, a0		; RV32-NEXT: add a0, sp, a0
; RV32-NEXT: addi a0, a0, 16		; RV32-NEXT: addi a0, a0, 16
; RV32-NEXT: vl8r.v v24, (a0) # Unknown-size Folded Reload		; RV32-NEXT: vl8r.v v16, (a0) # Unknown-size Folded Reload
; RV32-NEXT: vand.vv v0, v0, v24		; RV32-NEXT: vand.vv v24, v24, v16
; RV32-NEXT: vsub.vv v8, v8, v0		; RV32-NEXT: vsub.vv v8, v8, v24
; RV32-NEXT: vand.vv v0, v8, v16		; RV32-NEXT: vand.vv v24, v8, v0
; RV32-NEXT: vsrl.vi v8, v8, 2		; RV32-NEXT: vsrl.vi v8, v8, 2
; RV32-NEXT: vand.vv v8, v8, v16		; RV32-NEXT: vand.vv v8, v8, v0
; RV32-NEXT: vadd.vv v8, v0, v8		; RV32-NEXT: vadd.vv v8, v24, v8
; RV32-NEXT: vsrl.vi v16, v8, 4		; RV32-NEXT: vsrl.vi v24, v8, 4
; RV32-NEXT: vadd.vv v8, v8, v16		; RV32-NEXT: vadd.vv v8, v8, v24
; RV32-NEXT: csrr a0, vlenb		; RV32-NEXT: csrr a0, vlenb
; RV32-NEXT: slli a0, a0, 4		; RV32-NEXT: slli a0, a0, 4
; RV32-NEXT: add a0, sp, a0		; RV32-NEXT: add a0, sp, a0
; RV32-NEXT: addi a0, a0, 16		; RV32-NEXT: addi a0, a0, 16
; RV32-NEXT: vl8r.v v16, (a0) # Unknown-size Folded Reload		; RV32-NEXT: vl8r.v v16, (a0) # Unknown-size Folded Reload
; RV32-NEXT: vand.vv v8, v8, v16		; RV32-NEXT: vand.vv v8, v8, v16
; RV32-NEXT: addi a0, sp, 16		; RV32-NEXT: addi a0, sp, 16
; RV32-NEXT: vl8r.v v16, (a0) # Unknown-size Folded Reload		; RV32-NEXT: vl8r.v v16, (a0) # Unknown-size Folded Reload
; RV32-NEXT: vmul.vv v8, v8, v16		; RV32-NEXT: vmul.vv v8, v8, v16
; RV32-NEXT: vsrl.vx v16, v8, a1		; RV32-NEXT: vsrl.vx v16, v8, a1
; RV32-NEXT: csrr a0, vlenb		; RV32-NEXT: csrr a0, vlenb
; RV32-NEXT: slli a0, a0, 3		; RV32-NEXT: slli a0, a0, 3
; RV32-NEXT: add a0, sp, a0		; RV32-NEXT: add a0, sp, a0
; RV32-NEXT: addi a0, a0, 16		; RV32-NEXT: addi a0, a0, 16
; RV32-NEXT: vl8r.v v8, (a0) # Unknown-size Folded Reload		; RV32-NEXT: vl8r.v v8, (a0) # Unknown-size Folded Reload
; RV32-NEXT: csrr a0, vlenb		; RV32-NEXT: csrr a0, vlenb
; RV32-NEXT: li a1, 40		; RV32-NEXT: slli a0, a0, 5
; RV32-NEXT: mul a0, a0, a1
; RV32-NEXT: add sp, sp, a0		; RV32-NEXT: add sp, sp, a0
; RV32-NEXT: addi sp, sp, 16		; RV32-NEXT: addi sp, sp, 16
; RV32-NEXT: ret		; RV32-NEXT: ret
;		;
; RV64-LABEL: vp_cttz_zero_undef_v32i64_unmasked:		; RV64-LABEL: vp_cttz_zero_undef_v32i64_unmasked:
; RV64: # %bb.0:		; RV64: # %bb.0:
; RV64-NEXT: li a2, 16		; RV64-NEXT: li a2, 16
; RV64-NEXT: mv a1, a0		; RV64-NEXT: mv a1, a0
▲ Show 20 Lines • Show All 64 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-cttz.ll

	Show First 20 Lines • Show All 454 Lines • ▼ Show 20 Lines

	define void @cttz_v2i64(ptr %x, ptr %y) nounwind {			define void @cttz_v2i64(ptr %x, ptr %y) nounwind {
	; LMULMAX2-RV32I-LABEL: cttz_v2i64:			; LMULMAX2-RV32I-LABEL: cttz_v2i64:
	; LMULMAX2-RV32I: # %bb.0:			; LMULMAX2-RV32I: # %bb.0:
	; LMULMAX2-RV32I-NEXT: vsetivli zero, 2, e64, m1, ta, ma			; LMULMAX2-RV32I-NEXT: vsetivli zero, 2, e64, m1, ta, ma
	; LMULMAX2-RV32I-NEXT: vle64.v v8, (a0)			; LMULMAX2-RV32I-NEXT: vle64.v v8, (a0)
	; LMULMAX2-RV32I-NEXT: li a1, 1			; LMULMAX2-RV32I-NEXT: li a1, 1
	; LMULMAX2-RV32I-NEXT: vsub.vx v9, v8, a1			; LMULMAX2-RV32I-NEXT: vsub.vx v9, v8, a1
	; LMULMAX2-RV32I-NEXT: vsetivli zero, 4, e32, m1, ta, ma			; LMULMAX2-RV32I-NEXT: vnot.v v8, v8
	; LMULMAX2-RV32I-NEXT: vmv.v.i v10, -1
	; LMULMAX2-RV32I-NEXT: vsetivli zero, 2, e64, m1, ta, ma
	; LMULMAX2-RV32I-NEXT: vxor.vv v8, v8, v10
	; LMULMAX2-RV32I-NEXT: vand.vv v8, v8, v9			; LMULMAX2-RV32I-NEXT: vand.vv v8, v8, v9
	; LMULMAX2-RV32I-NEXT: vsrl.vi v9, v8, 1			; LMULMAX2-RV32I-NEXT: vsrl.vi v9, v8, 1
	; LMULMAX2-RV32I-NEXT: lui a1, 349525			; LMULMAX2-RV32I-NEXT: lui a1, 349525
	; LMULMAX2-RV32I-NEXT: addi a1, a1, 1365			; LMULMAX2-RV32I-NEXT: addi a1, a1, 1365
	; LMULMAX2-RV32I-NEXT: vsetivli zero, 4, e32, m1, ta, ma			; LMULMAX2-RV32I-NEXT: vsetivli zero, 4, e32, m1, ta, ma
	; LMULMAX2-RV32I-NEXT: vmv.v.x v10, a1			; LMULMAX2-RV32I-NEXT: vmv.v.x v10, a1
	; LMULMAX2-RV32I-NEXT: vsetivli zero, 2, e64, m1, ta, ma			; LMULMAX2-RV32I-NEXT: vsetivli zero, 2, e64, m1, ta, ma
	; LMULMAX2-RV32I-NEXT: vand.vv v9, v9, v10			; LMULMAX2-RV32I-NEXT: vand.vv v9, v9, v10
	▲ Show 20 Lines • Show All 65 Lines • ▼ Show 20 Lines
	; LMULMAX2-RV64I-NEXT: vsrl.vx v8, v8, a1			; LMULMAX2-RV64I-NEXT: vsrl.vx v8, v8, a1
	; LMULMAX2-RV64I-NEXT: vse64.v v8, (a0)			; LMULMAX2-RV64I-NEXT: vse64.v v8, (a0)
	; LMULMAX2-RV64I-NEXT: ret			; LMULMAX2-RV64I-NEXT: ret
	;			;
	; LMULMAX2-RV32F-LABEL: cttz_v2i64:			; LMULMAX2-RV32F-LABEL: cttz_v2i64:
	; LMULMAX2-RV32F: # %bb.0:			; LMULMAX2-RV32F: # %bb.0:
	; LMULMAX2-RV32F-NEXT: vsetivli zero, 2, e64, m1, ta, ma			; LMULMAX2-RV32F-NEXT: vsetivli zero, 2, e64, m1, ta, ma
	; LMULMAX2-RV32F-NEXT: vle64.v v8, (a0)			; LMULMAX2-RV32F-NEXT: vle64.v v8, (a0)
	; LMULMAX2-RV32F-NEXT: vsetivli zero, 4, e32, m1, ta, ma			; LMULMAX2-RV32F-NEXT: vrsub.vi v9, v8, 0
	; LMULMAX2-RV32F-NEXT: vmv.v.i v9, 0			; LMULMAX2-RV32F-NEXT: vand.vv v9, v8, v9
	; LMULMAX2-RV32F-NEXT: vsetivli zero, 2, e64, m1, ta, ma
	; LMULMAX2-RV32F-NEXT: vmseq.vv v0, v8, v9
	; LMULMAX2-RV32F-NEXT: vsub.vv v9, v9, v8
	; LMULMAX2-RV32F-NEXT: vand.vv v8, v8, v9
	; LMULMAX2-RV32F-NEXT: fsrmi a1, 1			; LMULMAX2-RV32F-NEXT: fsrmi a1, 1
	; LMULMAX2-RV32F-NEXT: vsetvli zero, zero, e32, mf2, ta, ma			; LMULMAX2-RV32F-NEXT: vsetvli zero, zero, e32, mf2, ta, ma
	; LMULMAX2-RV32F-NEXT: vfncvt.f.xu.w v9, v8			; LMULMAX2-RV32F-NEXT: vfncvt.f.xu.w v10, v9
	; LMULMAX2-RV32F-NEXT: fsrm a1			; LMULMAX2-RV32F-NEXT: fsrm a1
	; LMULMAX2-RV32F-NEXT: vsrl.vi v8, v9, 23			; LMULMAX2-RV32F-NEXT: vsrl.vi v9, v10, 23
	; LMULMAX2-RV32F-NEXT: vsetvli zero, zero, e64, m1, ta, ma			; LMULMAX2-RV32F-NEXT: vsetvli zero, zero, e64, m1, ta, ma
	; LMULMAX2-RV32F-NEXT: vzext.vf2 v9, v8			; LMULMAX2-RV32F-NEXT: vzext.vf2 v10, v9
	; LMULMAX2-RV32F-NEXT: li a1, 127			; LMULMAX2-RV32F-NEXT: li a1, 127
	; LMULMAX2-RV32F-NEXT: vsub.vx v8, v9, a1			; LMULMAX2-RV32F-NEXT: vsub.vx v9, v10, a1
				; LMULMAX2-RV32F-NEXT: vmseq.vi v0, v8, 0
	; LMULMAX2-RV32F-NEXT: li a1, 64			; LMULMAX2-RV32F-NEXT: li a1, 64
	; LMULMAX2-RV32F-NEXT: vmerge.vxm v8, v8, a1, v0			; LMULMAX2-RV32F-NEXT: vmerge.vxm v8, v9, a1, v0
	; LMULMAX2-RV32F-NEXT: vse64.v v8, (a0)			; LMULMAX2-RV32F-NEXT: vse64.v v8, (a0)
	; LMULMAX2-RV32F-NEXT: ret			; LMULMAX2-RV32F-NEXT: ret
	;			;
	; LMULMAX2-RV64F-LABEL: cttz_v2i64:			; LMULMAX2-RV64F-LABEL: cttz_v2i64:
	; LMULMAX2-RV64F: # %bb.0:			; LMULMAX2-RV64F: # %bb.0:
	; LMULMAX2-RV64F-NEXT: vsetivli zero, 2, e64, m1, ta, ma			; LMULMAX2-RV64F-NEXT: vsetivli zero, 2, e64, m1, ta, ma
	; LMULMAX2-RV64F-NEXT: vle64.v v8, (a0)			; LMULMAX2-RV64F-NEXT: vle64.v v8, (a0)
	; LMULMAX2-RV64F-NEXT: vrsub.vi v9, v8, 0			; LMULMAX2-RV64F-NEXT: vrsub.vi v9, v8, 0
	Show All 11 Lines
	; LMULMAX2-RV64F-NEXT: vmerge.vxm v8, v10, a1, v0			; LMULMAX2-RV64F-NEXT: vmerge.vxm v8, v10, a1, v0
	; LMULMAX2-RV64F-NEXT: vse64.v v8, (a0)			; LMULMAX2-RV64F-NEXT: vse64.v v8, (a0)
	; LMULMAX2-RV64F-NEXT: ret			; LMULMAX2-RV64F-NEXT: ret
	;			;
	; LMULMAX2-RV32D-LABEL: cttz_v2i64:			; LMULMAX2-RV32D-LABEL: cttz_v2i64:
	; LMULMAX2-RV32D: # %bb.0:			; LMULMAX2-RV32D: # %bb.0:
	; LMULMAX2-RV32D-NEXT: vsetivli zero, 2, e64, m1, ta, ma			; LMULMAX2-RV32D-NEXT: vsetivli zero, 2, e64, m1, ta, ma
	; LMULMAX2-RV32D-NEXT: vle64.v v8, (a0)			; LMULMAX2-RV32D-NEXT: vle64.v v8, (a0)
	; LMULMAX2-RV32D-NEXT: vsetivli zero, 4, e32, m1, ta, ma			; LMULMAX2-RV32D-NEXT: vrsub.vi v9, v8, 0
	; LMULMAX2-RV32D-NEXT: vmv.v.i v9, 0			; LMULMAX2-RV32D-NEXT: vand.vv v9, v8, v9
	; LMULMAX2-RV32D-NEXT: vsetivli zero, 2, e64, m1, ta, ma
	; LMULMAX2-RV32D-NEXT: vmseq.vv v0, v8, v9
	; LMULMAX2-RV32D-NEXT: vsub.vv v9, v9, v8
	; LMULMAX2-RV32D-NEXT: vand.vv v8, v8, v9
	; LMULMAX2-RV32D-NEXT: fsrmi a1, 1			; LMULMAX2-RV32D-NEXT: fsrmi a1, 1
	; LMULMAX2-RV32D-NEXT: vfcvt.f.xu.v v8, v8			; LMULMAX2-RV32D-NEXT: vfcvt.f.xu.v v9, v9
	; LMULMAX2-RV32D-NEXT: fsrm a1			; LMULMAX2-RV32D-NEXT: fsrm a1
	; LMULMAX2-RV32D-NEXT: li a1, 52			; LMULMAX2-RV32D-NEXT: li a1, 52
	; LMULMAX2-RV32D-NEXT: vsrl.vx v8, v8, a1			; LMULMAX2-RV32D-NEXT: vsrl.vx v9, v9, a1
	; LMULMAX2-RV32D-NEXT: li a1, 1023			; LMULMAX2-RV32D-NEXT: li a1, 1023
	; LMULMAX2-RV32D-NEXT: vsub.vx v8, v8, a1			; LMULMAX2-RV32D-NEXT: vsub.vx v9, v9, a1
				; LMULMAX2-RV32D-NEXT: vmseq.vi v0, v8, 0
	; LMULMAX2-RV32D-NEXT: li a1, 64			; LMULMAX2-RV32D-NEXT: li a1, 64
	; LMULMAX2-RV32D-NEXT: vmerge.vxm v8, v8, a1, v0			; LMULMAX2-RV32D-NEXT: vmerge.vxm v8, v9, a1, v0
	; LMULMAX2-RV32D-NEXT: vse64.v v8, (a0)			; LMULMAX2-RV32D-NEXT: vse64.v v8, (a0)
	; LMULMAX2-RV32D-NEXT: ret			; LMULMAX2-RV32D-NEXT: ret
	;			;
	; LMULMAX2-RV64D-LABEL: cttz_v2i64:			; LMULMAX2-RV64D-LABEL: cttz_v2i64:
	; LMULMAX2-RV64D: # %bb.0:			; LMULMAX2-RV64D: # %bb.0:
	; LMULMAX2-RV64D-NEXT: vsetivli zero, 2, e64, m1, ta, ma			; LMULMAX2-RV64D-NEXT: vsetivli zero, 2, e64, m1, ta, ma
	; LMULMAX2-RV64D-NEXT: vle64.v v8, (a0)			; LMULMAX2-RV64D-NEXT: vle64.v v8, (a0)
	; LMULMAX2-RV64D-NEXT: vrsub.vi v9, v8, 0			; LMULMAX2-RV64D-NEXT: vrsub.vi v9, v8, 0
	; LMULMAX2-RV64D-NEXT: vand.vv v9, v8, v9			; LMULMAX2-RV64D-NEXT: vand.vv v9, v8, v9
	; LMULMAX2-RV64D-NEXT: fsrmi a1, 1			; LMULMAX2-RV64D-NEXT: fsrmi a1, 1
	; LMULMAX2-RV64D-NEXT: vfcvt.f.xu.v v9, v9			; LMULMAX2-RV64D-NEXT: vfcvt.f.xu.v v9, v9
	; LMULMAX2-RV64D-NEXT: fsrm a1			; LMULMAX2-RV64D-NEXT: fsrm a1
	; LMULMAX2-RV64D-NEXT: li a1, 52			; LMULMAX2-RV64D-NEXT: li a1, 52
	; LMULMAX2-RV64D-NEXT: vsrl.vx v9, v9, a1			; LMULMAX2-RV64D-NEXT: vsrl.vx v9, v9, a1
	; LMULMAX2-RV64D-NEXT: li a1, 1023			; LMULMAX2-RV64D-NEXT: li a1, 1023
	; LMULMAX2-RV64D-NEXT: vsub.vx v9, v9, a1			; LMULMAX2-RV64D-NEXT: vsub.vx v9, v9, a1
	; LMULMAX2-RV64D-NEXT: vmseq.vi v0, v8, 0			; LMULMAX2-RV64D-NEXT: vmseq.vi v0, v8, 0
	; LMULMAX2-RV64D-NEXT: li a1, 64			; LMULMAX2-RV64D-NEXT: li a1, 64
	; LMULMAX2-RV64D-NEXT: vmerge.vxm v8, v9, a1, v0			; LMULMAX2-RV64D-NEXT: vmerge.vxm v8, v9, a1, v0
	; LMULMAX2-RV64D-NEXT: vse64.v v8, (a0)			; LMULMAX2-RV64D-NEXT: vse64.v v8, (a0)
	; LMULMAX2-RV64D-NEXT: ret			; LMULMAX2-RV64D-NEXT: ret
	;			;
	; LMULMAX8-RV32-LABEL: cttz_v2i64:			; LMULMAX8-LABEL: cttz_v2i64:
	; LMULMAX8-RV32: # %bb.0:			; LMULMAX8: # %bb.0:
	; LMULMAX8-RV32-NEXT: vsetivli zero, 2, e64, m1, ta, ma			; LMULMAX8-NEXT: vsetivli zero, 2, e64, m1, ta, ma
	; LMULMAX8-RV32-NEXT: vle64.v v8, (a0)			; LMULMAX8-NEXT: vle64.v v8, (a0)
	; LMULMAX8-RV32-NEXT: vsetivli zero, 4, e32, m1, ta, ma			; LMULMAX8-NEXT: vrsub.vi v9, v8, 0
	; LMULMAX8-RV32-NEXT: vmv.v.i v9, 0			; LMULMAX8-NEXT: vand.vv v9, v8, v9
	; LMULMAX8-RV32-NEXT: vsetivli zero, 2, e64, m1, ta, ma			; LMULMAX8-NEXT: fsrmi a1, 1
	; LMULMAX8-RV32-NEXT: vmseq.vv v0, v8, v9			; LMULMAX8-NEXT: vfcvt.f.xu.v v9, v9
	; LMULMAX8-RV32-NEXT: vsub.vv v9, v9, v8			; LMULMAX8-NEXT: fsrm a1
	; LMULMAX8-RV32-NEXT: vand.vv v8, v8, v9			; LMULMAX8-NEXT: li a1, 52
	; LMULMAX8-RV32-NEXT: fsrmi a1, 1			; LMULMAX8-NEXT: vsrl.vx v9, v9, a1
	; LMULMAX8-RV32-NEXT: vfcvt.f.xu.v v8, v8			; LMULMAX8-NEXT: li a1, 1023
	; LMULMAX8-RV32-NEXT: fsrm a1			; LMULMAX8-NEXT: vsub.vx v9, v9, a1
	; LMULMAX8-RV32-NEXT: li a1, 52			; LMULMAX8-NEXT: vmseq.vi v0, v8, 0
	; LMULMAX8-RV32-NEXT: vsrl.vx v8, v8, a1			; LMULMAX8-NEXT: li a1, 64
	; LMULMAX8-RV32-NEXT: li a1, 1023			; LMULMAX8-NEXT: vmerge.vxm v8, v9, a1, v0
	; LMULMAX8-RV32-NEXT: vsub.vx v8, v8, a1			; LMULMAX8-NEXT: vse64.v v8, (a0)
	; LMULMAX8-RV32-NEXT: li a1, 64			; LMULMAX8-NEXT: ret
	; LMULMAX8-RV32-NEXT: vmerge.vxm v8, v8, a1, v0
	; LMULMAX8-RV32-NEXT: vse64.v v8, (a0)
	; LMULMAX8-RV32-NEXT: ret
	;
	; LMULMAX8-RV64-LABEL: cttz_v2i64:
	; LMULMAX8-RV64: # %bb.0:
	; LMULMAX8-RV64-NEXT: vsetivli zero, 2, e64, m1, ta, ma
	; LMULMAX8-RV64-NEXT: vle64.v v8, (a0)
	; LMULMAX8-RV64-NEXT: vrsub.vi v9, v8, 0
	; LMULMAX8-RV64-NEXT: vand.vv v9, v8, v9
	; LMULMAX8-RV64-NEXT: fsrmi a1, 1
	; LMULMAX8-RV64-NEXT: vfcvt.f.xu.v v9, v9
	; LMULMAX8-RV64-NEXT: fsrm a1
	; LMULMAX8-RV64-NEXT: li a1, 52
	; LMULMAX8-RV64-NEXT: vsrl.vx v9, v9, a1
	; LMULMAX8-RV64-NEXT: li a1, 1023
	; LMULMAX8-RV64-NEXT: vsub.vx v9, v9, a1
	; LMULMAX8-RV64-NEXT: vmseq.vi v0, v8, 0
	; LMULMAX8-RV64-NEXT: li a1, 64
	; LMULMAX8-RV64-NEXT: vmerge.vxm v8, v9, a1, v0
	; LMULMAX8-RV64-NEXT: vse64.v v8, (a0)
	; LMULMAX8-RV64-NEXT: ret
	;			;
	; ZVBB-LABEL: cttz_v2i64:			; ZVBB-LABEL: cttz_v2i64:
	; ZVBB: # %bb.0:			; ZVBB: # %bb.0:
	; ZVBB-NEXT: vsetivli zero, 2, e64, m1, ta, ma			; ZVBB-NEXT: vsetivli zero, 2, e64, m1, ta, ma
	; ZVBB-NEXT: vle64.v v8, (a0)			; ZVBB-NEXT: vle64.v v8, (a0)
	; ZVBB-NEXT: vctz.v v8, v8			; ZVBB-NEXT: vctz.v v8, v8
	; ZVBB-NEXT: vse64.v v8, (a0)			; ZVBB-NEXT: vse64.v v8, (a0)
	; ZVBB-NEXT: ret			; ZVBB-NEXT: ret
	▲ Show 20 Lines • Show All 462 Lines • ▼ Show 20 Lines

	define void @cttz_v4i64(ptr %x, ptr %y) nounwind {			define void @cttz_v4i64(ptr %x, ptr %y) nounwind {
	; LMULMAX2-RV32I-LABEL: cttz_v4i64:			; LMULMAX2-RV32I-LABEL: cttz_v4i64:
	; LMULMAX2-RV32I: # %bb.0:			; LMULMAX2-RV32I: # %bb.0:
	; LMULMAX2-RV32I-NEXT: vsetivli zero, 4, e64, m2, ta, ma			; LMULMAX2-RV32I-NEXT: vsetivli zero, 4, e64, m2, ta, ma
	; LMULMAX2-RV32I-NEXT: vle64.v v8, (a0)			; LMULMAX2-RV32I-NEXT: vle64.v v8, (a0)
	; LMULMAX2-RV32I-NEXT: li a1, 1			; LMULMAX2-RV32I-NEXT: li a1, 1
	; LMULMAX2-RV32I-NEXT: vsub.vx v10, v8, a1			; LMULMAX2-RV32I-NEXT: vsub.vx v10, v8, a1
	; LMULMAX2-RV32I-NEXT: vsetivli zero, 8, e32, m2, ta, ma			; LMULMAX2-RV32I-NEXT: vnot.v v8, v8
	; LMULMAX2-RV32I-NEXT: vmv.v.i v12, -1
	; LMULMAX2-RV32I-NEXT: vsetivli zero, 4, e64, m2, ta, ma
	; LMULMAX2-RV32I-NEXT: vxor.vv v8, v8, v12
	; LMULMAX2-RV32I-NEXT: vand.vv v8, v8, v10			; LMULMAX2-RV32I-NEXT: vand.vv v8, v8, v10
	; LMULMAX2-RV32I-NEXT: vsrl.vi v10, v8, 1			; LMULMAX2-RV32I-NEXT: vsrl.vi v10, v8, 1
	; LMULMAX2-RV32I-NEXT: lui a1, 349525			; LMULMAX2-RV32I-NEXT: lui a1, 349525
	; LMULMAX2-RV32I-NEXT: addi a1, a1, 1365			; LMULMAX2-RV32I-NEXT: addi a1, a1, 1365
	; LMULMAX2-RV32I-NEXT: vsetivli zero, 8, e32, m2, ta, ma			; LMULMAX2-RV32I-NEXT: vsetivli zero, 8, e32, m2, ta, ma
	; LMULMAX2-RV32I-NEXT: vmv.v.x v12, a1			; LMULMAX2-RV32I-NEXT: vmv.v.x v12, a1
	; LMULMAX2-RV32I-NEXT: vsetivli zero, 4, e64, m2, ta, ma			; LMULMAX2-RV32I-NEXT: vsetivli zero, 4, e64, m2, ta, ma
	; LMULMAX2-RV32I-NEXT: vand.vv v10, v10, v12			; LMULMAX2-RV32I-NEXT: vand.vv v10, v10, v12
	▲ Show 20 Lines • Show All 65 Lines • ▼ Show 20 Lines
	; LMULMAX2-RV64I-NEXT: vsrl.vx v8, v8, a1			; LMULMAX2-RV64I-NEXT: vsrl.vx v8, v8, a1
	; LMULMAX2-RV64I-NEXT: vse64.v v8, (a0)			; LMULMAX2-RV64I-NEXT: vse64.v v8, (a0)
	; LMULMAX2-RV64I-NEXT: ret			; LMULMAX2-RV64I-NEXT: ret
	;			;
	; LMULMAX2-RV32F-LABEL: cttz_v4i64:			; LMULMAX2-RV32F-LABEL: cttz_v4i64:
	; LMULMAX2-RV32F: # %bb.0:			; LMULMAX2-RV32F: # %bb.0:
	; LMULMAX2-RV32F-NEXT: vsetivli zero, 4, e64, m2, ta, ma			; LMULMAX2-RV32F-NEXT: vsetivli zero, 4, e64, m2, ta, ma
	; LMULMAX2-RV32F-NEXT: vle64.v v8, (a0)			; LMULMAX2-RV32F-NEXT: vle64.v v8, (a0)
	; LMULMAX2-RV32F-NEXT: vsetivli zero, 8, e32, m2, ta, ma			; LMULMAX2-RV32F-NEXT: vrsub.vi v10, v8, 0
	; LMULMAX2-RV32F-NEXT: vmv.v.i v10, 0			; LMULMAX2-RV32F-NEXT: vand.vv v10, v8, v10
	; LMULMAX2-RV32F-NEXT: vsetivli zero, 4, e64, m2, ta, ma
	; LMULMAX2-RV32F-NEXT: vmseq.vv v0, v8, v10
	; LMULMAX2-RV32F-NEXT: vsub.vv v10, v10, v8
	; LMULMAX2-RV32F-NEXT: vand.vv v8, v8, v10
	; LMULMAX2-RV32F-NEXT: fsrmi a1, 1			; LMULMAX2-RV32F-NEXT: fsrmi a1, 1
	; LMULMAX2-RV32F-NEXT: vsetvli zero, zero, e32, m1, ta, ma			; LMULMAX2-RV32F-NEXT: vsetvli zero, zero, e32, m1, ta, ma
	; LMULMAX2-RV32F-NEXT: vfncvt.f.xu.w v10, v8			; LMULMAX2-RV32F-NEXT: vfncvt.f.xu.w v12, v10
	; LMULMAX2-RV32F-NEXT: fsrm a1			; LMULMAX2-RV32F-NEXT: fsrm a1
	; LMULMAX2-RV32F-NEXT: vsrl.vi v8, v10, 23			; LMULMAX2-RV32F-NEXT: vsrl.vi v10, v12, 23
	; LMULMAX2-RV32F-NEXT: vsetvli zero, zero, e64, m2, ta, ma			; LMULMAX2-RV32F-NEXT: vsetvli zero, zero, e64, m2, ta, ma
	; LMULMAX2-RV32F-NEXT: vzext.vf2 v10, v8			; LMULMAX2-RV32F-NEXT: vzext.vf2 v12, v10
	; LMULMAX2-RV32F-NEXT: li a1, 127			; LMULMAX2-RV32F-NEXT: li a1, 127
	; LMULMAX2-RV32F-NEXT: vsub.vx v8, v10, a1			; LMULMAX2-RV32F-NEXT: vsub.vx v10, v12, a1
				; LMULMAX2-RV32F-NEXT: vmseq.vi v0, v8, 0
	; LMULMAX2-RV32F-NEXT: li a1, 64			; LMULMAX2-RV32F-NEXT: li a1, 64
	; LMULMAX2-RV32F-NEXT: vmerge.vxm v8, v8, a1, v0			; LMULMAX2-RV32F-NEXT: vmerge.vxm v8, v10, a1, v0
	; LMULMAX2-RV32F-NEXT: vse64.v v8, (a0)			; LMULMAX2-RV32F-NEXT: vse64.v v8, (a0)
	; LMULMAX2-RV32F-NEXT: ret			; LMULMAX2-RV32F-NEXT: ret
	;			;
	; LMULMAX2-RV64F-LABEL: cttz_v4i64:			; LMULMAX2-RV64F-LABEL: cttz_v4i64:
	; LMULMAX2-RV64F: # %bb.0:			; LMULMAX2-RV64F: # %bb.0:
	; LMULMAX2-RV64F-NEXT: vsetivli zero, 4, e64, m2, ta, ma			; LMULMAX2-RV64F-NEXT: vsetivli zero, 4, e64, m2, ta, ma
	; LMULMAX2-RV64F-NEXT: vle64.v v8, (a0)			; LMULMAX2-RV64F-NEXT: vle64.v v8, (a0)
	; LMULMAX2-RV64F-NEXT: vrsub.vi v10, v8, 0			; LMULMAX2-RV64F-NEXT: vrsub.vi v10, v8, 0
	Show All 11 Lines
	; LMULMAX2-RV64F-NEXT: vmerge.vxm v8, v12, a1, v0			; LMULMAX2-RV64F-NEXT: vmerge.vxm v8, v12, a1, v0
	; LMULMAX2-RV64F-NEXT: vse64.v v8, (a0)			; LMULMAX2-RV64F-NEXT: vse64.v v8, (a0)
	; LMULMAX2-RV64F-NEXT: ret			; LMULMAX2-RV64F-NEXT: ret
	;			;
	; LMULMAX2-RV32D-LABEL: cttz_v4i64:			; LMULMAX2-RV32D-LABEL: cttz_v4i64:
	; LMULMAX2-RV32D: # %bb.0:			; LMULMAX2-RV32D: # %bb.0:
	; LMULMAX2-RV32D-NEXT: vsetivli zero, 4, e64, m2, ta, ma			; LMULMAX2-RV32D-NEXT: vsetivli zero, 4, e64, m2, ta, ma
	; LMULMAX2-RV32D-NEXT: vle64.v v8, (a0)			; LMULMAX2-RV32D-NEXT: vle64.v v8, (a0)
	; LMULMAX2-RV32D-NEXT: vsetivli zero, 8, e32, m2, ta, ma			; LMULMAX2-RV32D-NEXT: vrsub.vi v10, v8, 0
	; LMULMAX2-RV32D-NEXT: vmv.v.i v10, 0			; LMULMAX2-RV32D-NEXT: vand.vv v10, v8, v10
	; LMULMAX2-RV32D-NEXT: vsetivli zero, 4, e64, m2, ta, ma
	; LMULMAX2-RV32D-NEXT: vmseq.vv v0, v8, v10
	; LMULMAX2-RV32D-NEXT: vsub.vv v10, v10, v8
	; LMULMAX2-RV32D-NEXT: vand.vv v8, v8, v10
	; LMULMAX2-RV32D-NEXT: fsrmi a1, 1			; LMULMAX2-RV32D-NEXT: fsrmi a1, 1
	; LMULMAX2-RV32D-NEXT: vfcvt.f.xu.v v8, v8			; LMULMAX2-RV32D-NEXT: vfcvt.f.xu.v v10, v10
	; LMULMAX2-RV32D-NEXT: fsrm a1			; LMULMAX2-RV32D-NEXT: fsrm a1
	; LMULMAX2-RV32D-NEXT: li a1, 52			; LMULMAX2-RV32D-NEXT: li a1, 52
	; LMULMAX2-RV32D-NEXT: vsrl.vx v8, v8, a1			; LMULMAX2-RV32D-NEXT: vsrl.vx v10, v10, a1
	; LMULMAX2-RV32D-NEXT: li a1, 1023			; LMULMAX2-RV32D-NEXT: li a1, 1023
	; LMULMAX2-RV32D-NEXT: vsub.vx v8, v8, a1			; LMULMAX2-RV32D-NEXT: vsub.vx v10, v10, a1
				; LMULMAX2-RV32D-NEXT: vmseq.vi v0, v8, 0
	; LMULMAX2-RV32D-NEXT: li a1, 64			; LMULMAX2-RV32D-NEXT: li a1, 64
	; LMULMAX2-RV32D-NEXT: vmerge.vxm v8, v8, a1, v0			; LMULMAX2-RV32D-NEXT: vmerge.vxm v8, v10, a1, v0
	; LMULMAX2-RV32D-NEXT: vse64.v v8, (a0)			; LMULMAX2-RV32D-NEXT: vse64.v v8, (a0)
	; LMULMAX2-RV32D-NEXT: ret			; LMULMAX2-RV32D-NEXT: ret
	;			;
	; LMULMAX2-RV64D-LABEL: cttz_v4i64:			; LMULMAX2-RV64D-LABEL: cttz_v4i64:
	; LMULMAX2-RV64D: # %bb.0:			; LMULMAX2-RV64D: # %bb.0:
	; LMULMAX2-RV64D-NEXT: vsetivli zero, 4, e64, m2, ta, ma			; LMULMAX2-RV64D-NEXT: vsetivli zero, 4, e64, m2, ta, ma
	; LMULMAX2-RV64D-NEXT: vle64.v v8, (a0)			; LMULMAX2-RV64D-NEXT: vle64.v v8, (a0)
	; LMULMAX2-RV64D-NEXT: vrsub.vi v10, v8, 0			; LMULMAX2-RV64D-NEXT: vrsub.vi v10, v8, 0
	; LMULMAX2-RV64D-NEXT: vand.vv v10, v8, v10			; LMULMAX2-RV64D-NEXT: vand.vv v10, v8, v10
	; LMULMAX2-RV64D-NEXT: fsrmi a1, 1			; LMULMAX2-RV64D-NEXT: fsrmi a1, 1
	; LMULMAX2-RV64D-NEXT: vfcvt.f.xu.v v10, v10			; LMULMAX2-RV64D-NEXT: vfcvt.f.xu.v v10, v10
	; LMULMAX2-RV64D-NEXT: fsrm a1			; LMULMAX2-RV64D-NEXT: fsrm a1
	; LMULMAX2-RV64D-NEXT: li a1, 52			; LMULMAX2-RV64D-NEXT: li a1, 52
	; LMULMAX2-RV64D-NEXT: vsrl.vx v10, v10, a1			; LMULMAX2-RV64D-NEXT: vsrl.vx v10, v10, a1
	; LMULMAX2-RV64D-NEXT: li a1, 1023			; LMULMAX2-RV64D-NEXT: li a1, 1023
	; LMULMAX2-RV64D-NEXT: vsub.vx v10, v10, a1			; LMULMAX2-RV64D-NEXT: vsub.vx v10, v10, a1
	; LMULMAX2-RV64D-NEXT: vmseq.vi v0, v8, 0			; LMULMAX2-RV64D-NEXT: vmseq.vi v0, v8, 0
	; LMULMAX2-RV64D-NEXT: li a1, 64			; LMULMAX2-RV64D-NEXT: li a1, 64
	; LMULMAX2-RV64D-NEXT: vmerge.vxm v8, v10, a1, v0			; LMULMAX2-RV64D-NEXT: vmerge.vxm v8, v10, a1, v0
	; LMULMAX2-RV64D-NEXT: vse64.v v8, (a0)			; LMULMAX2-RV64D-NEXT: vse64.v v8, (a0)
	; LMULMAX2-RV64D-NEXT: ret			; LMULMAX2-RV64D-NEXT: ret
	;			;
	; LMULMAX8-RV32-LABEL: cttz_v4i64:			; LMULMAX8-LABEL: cttz_v4i64:
	; LMULMAX8-RV32: # %bb.0:			; LMULMAX8: # %bb.0:
	; LMULMAX8-RV32-NEXT: vsetivli zero, 4, e64, m2, ta, ma			; LMULMAX8-NEXT: vsetivli zero, 4, e64, m2, ta, ma
	; LMULMAX8-RV32-NEXT: vle64.v v8, (a0)			; LMULMAX8-NEXT: vle64.v v8, (a0)
	; LMULMAX8-RV32-NEXT: vsetivli zero, 8, e32, m2, ta, ma			; LMULMAX8-NEXT: vrsub.vi v10, v8, 0
	; LMULMAX8-RV32-NEXT: vmv.v.i v10, 0			; LMULMAX8-NEXT: vand.vv v10, v8, v10
	; LMULMAX8-RV32-NEXT: vsetivli zero, 4, e64, m2, ta, ma			; LMULMAX8-NEXT: fsrmi a1, 1
	; LMULMAX8-RV32-NEXT: vmseq.vv v0, v8, v10			; LMULMAX8-NEXT: vfcvt.f.xu.v v10, v10
	; LMULMAX8-RV32-NEXT: vsub.vv v10, v10, v8			; LMULMAX8-NEXT: fsrm a1
	; LMULMAX8-RV32-NEXT: vand.vv v8, v8, v10			; LMULMAX8-NEXT: li a1, 52
	; LMULMAX8-RV32-NEXT: fsrmi a1, 1			; LMULMAX8-NEXT: vsrl.vx v10, v10, a1
	; LMULMAX8-RV32-NEXT: vfcvt.f.xu.v v8, v8			; LMULMAX8-NEXT: li a1, 1023
	; LMULMAX8-RV32-NEXT: fsrm a1			; LMULMAX8-NEXT: vsub.vx v10, v10, a1
	; LMULMAX8-RV32-NEXT: li a1, 52			; LMULMAX8-NEXT: vmseq.vi v0, v8, 0
	; LMULMAX8-RV32-NEXT: vsrl.vx v8, v8, a1			; LMULMAX8-NEXT: li a1, 64
	; LMULMAX8-RV32-NEXT: li a1, 1023			; LMULMAX8-NEXT: vmerge.vxm v8, v10, a1, v0
	; LMULMAX8-RV32-NEXT: vsub.vx v8, v8, a1			; LMULMAX8-NEXT: vse64.v v8, (a0)
	; LMULMAX8-RV32-NEXT: li a1, 64			; LMULMAX8-NEXT: ret
	; LMULMAX8-RV32-NEXT: vmerge.vxm v8, v8, a1, v0
	; LMULMAX8-RV32-NEXT: vse64.v v8, (a0)
	; LMULMAX8-RV32-NEXT: ret
	;
	; LMULMAX8-RV64-LABEL: cttz_v4i64:
	; LMULMAX8-RV64: # %bb.0:
	; LMULMAX8-RV64-NEXT: vsetivli zero, 4, e64, m2, ta, ma
	; LMULMAX8-RV64-NEXT: vle64.v v8, (a0)
	; LMULMAX8-RV64-NEXT: vrsub.vi v10, v8, 0
	; LMULMAX8-RV64-NEXT: vand.vv v10, v8, v10
	; LMULMAX8-RV64-NEXT: fsrmi a1, 1
	; LMULMAX8-RV64-NEXT: vfcvt.f.xu.v v10, v10
	; LMULMAX8-RV64-NEXT: fsrm a1
	; LMULMAX8-RV64-NEXT: li a1, 52
	; LMULMAX8-RV64-NEXT: vsrl.vx v10, v10, a1
	; LMULMAX8-RV64-NEXT: li a1, 1023
	; LMULMAX8-RV64-NEXT: vsub.vx v10, v10, a1
	; LMULMAX8-RV64-NEXT: vmseq.vi v0, v8, 0
	; LMULMAX8-RV64-NEXT: li a1, 64
	; LMULMAX8-RV64-NEXT: vmerge.vxm v8, v10, a1, v0
	; LMULMAX8-RV64-NEXT: vse64.v v8, (a0)
	; LMULMAX8-RV64-NEXT: ret
	;			;
	; ZVBB-LABEL: cttz_v4i64:			; ZVBB-LABEL: cttz_v4i64:
	; ZVBB: # %bb.0:			; ZVBB: # %bb.0:
	; ZVBB-NEXT: vsetivli zero, 4, e64, m2, ta, ma			; ZVBB-NEXT: vsetivli zero, 4, e64, m2, ta, ma
	; ZVBB-NEXT: vle64.v v8, (a0)			; ZVBB-NEXT: vle64.v v8, (a0)
	; ZVBB-NEXT: vctz.v v8, v8			; ZVBB-NEXT: vctz.v v8, v8
	; ZVBB-NEXT: vse64.v v8, (a0)			; ZVBB-NEXT: vse64.v v8, (a0)
	; ZVBB-NEXT: ret			; ZVBB-NEXT: ret
	▲ Show 20 Lines • Show All 411 Lines • ▼ Show 20 Lines

	define void @cttz_zero_undef_v2i64(ptr %x, ptr %y) nounwind {			define void @cttz_zero_undef_v2i64(ptr %x, ptr %y) nounwind {
	; LMULMAX2-RV32I-LABEL: cttz_zero_undef_v2i64:			; LMULMAX2-RV32I-LABEL: cttz_zero_undef_v2i64:
	; LMULMAX2-RV32I: # %bb.0:			; LMULMAX2-RV32I: # %bb.0:
	; LMULMAX2-RV32I-NEXT: vsetivli zero, 2, e64, m1, ta, ma			; LMULMAX2-RV32I-NEXT: vsetivli zero, 2, e64, m1, ta, ma
	; LMULMAX2-RV32I-NEXT: vle64.v v8, (a0)			; LMULMAX2-RV32I-NEXT: vle64.v v8, (a0)
	; LMULMAX2-RV32I-NEXT: li a1, 1			; LMULMAX2-RV32I-NEXT: li a1, 1
	; LMULMAX2-RV32I-NEXT: vsub.vx v9, v8, a1			; LMULMAX2-RV32I-NEXT: vsub.vx v9, v8, a1
	; LMULMAX2-RV32I-NEXT: vsetivli zero, 4, e32, m1, ta, ma			; LMULMAX2-RV32I-NEXT: vnot.v v8, v8
	; LMULMAX2-RV32I-NEXT: vmv.v.i v10, -1
	; LMULMAX2-RV32I-NEXT: vsetivli zero, 2, e64, m1, ta, ma
	; LMULMAX2-RV32I-NEXT: vxor.vv v8, v8, v10
	; LMULMAX2-RV32I-NEXT: vand.vv v8, v8, v9			; LMULMAX2-RV32I-NEXT: vand.vv v8, v8, v9
	; LMULMAX2-RV32I-NEXT: vsrl.vi v9, v8, 1			; LMULMAX2-RV32I-NEXT: vsrl.vi v9, v8, 1
	; LMULMAX2-RV32I-NEXT: lui a1, 349525			; LMULMAX2-RV32I-NEXT: lui a1, 349525
	; LMULMAX2-RV32I-NEXT: addi a1, a1, 1365			; LMULMAX2-RV32I-NEXT: addi a1, a1, 1365
	; LMULMAX2-RV32I-NEXT: vsetivli zero, 4, e32, m1, ta, ma			; LMULMAX2-RV32I-NEXT: vsetivli zero, 4, e32, m1, ta, ma
	; LMULMAX2-RV32I-NEXT: vmv.v.x v10, a1			; LMULMAX2-RV32I-NEXT: vmv.v.x v10, a1
	; LMULMAX2-RV32I-NEXT: vsetivli zero, 2, e64, m1, ta, ma			; LMULMAX2-RV32I-NEXT: vsetivli zero, 2, e64, m1, ta, ma
	; LMULMAX2-RV32I-NEXT: vand.vv v9, v9, v10			; LMULMAX2-RV32I-NEXT: vand.vv v9, v9, v10
	▲ Show 20 Lines • Show All 65 Lines • ▼ Show 20 Lines
	; LMULMAX2-RV64I-NEXT: vsrl.vx v8, v8, a1			; LMULMAX2-RV64I-NEXT: vsrl.vx v8, v8, a1
	; LMULMAX2-RV64I-NEXT: vse64.v v8, (a0)			; LMULMAX2-RV64I-NEXT: vse64.v v8, (a0)
	; LMULMAX2-RV64I-NEXT: ret			; LMULMAX2-RV64I-NEXT: ret
	;			;
	; LMULMAX2-RV32F-LABEL: cttz_zero_undef_v2i64:			; LMULMAX2-RV32F-LABEL: cttz_zero_undef_v2i64:
	; LMULMAX2-RV32F: # %bb.0:			; LMULMAX2-RV32F: # %bb.0:
	; LMULMAX2-RV32F-NEXT: vsetivli zero, 2, e64, m1, ta, ma			; LMULMAX2-RV32F-NEXT: vsetivli zero, 2, e64, m1, ta, ma
	; LMULMAX2-RV32F-NEXT: vle64.v v8, (a0)			; LMULMAX2-RV32F-NEXT: vle64.v v8, (a0)
	; LMULMAX2-RV32F-NEXT: vsetivli zero, 4, e32, m1, ta, ma			; LMULMAX2-RV32F-NEXT: vrsub.vi v9, v8, 0
	; LMULMAX2-RV32F-NEXT: vmv.v.i v9, 0
	; LMULMAX2-RV32F-NEXT: vsetivli zero, 2, e64, m1, ta, ma
	; LMULMAX2-RV32F-NEXT: vsub.vv v9, v9, v8
	; LMULMAX2-RV32F-NEXT: vand.vv v8, v8, v9			; LMULMAX2-RV32F-NEXT: vand.vv v8, v8, v9
	; LMULMAX2-RV32F-NEXT: fsrmi a1, 1			; LMULMAX2-RV32F-NEXT: fsrmi a1, 1
	; LMULMAX2-RV32F-NEXT: vsetvli zero, zero, e32, mf2, ta, ma			; LMULMAX2-RV32F-NEXT: vsetvli zero, zero, e32, mf2, ta, ma
	; LMULMAX2-RV32F-NEXT: vfncvt.f.xu.w v9, v8			; LMULMAX2-RV32F-NEXT: vfncvt.f.xu.w v9, v8
	; LMULMAX2-RV32F-NEXT: fsrm a1			; LMULMAX2-RV32F-NEXT: fsrm a1
	; LMULMAX2-RV32F-NEXT: vsrl.vi v8, v9, 23			; LMULMAX2-RV32F-NEXT: vsrl.vi v8, v9, 23
	; LMULMAX2-RV32F-NEXT: vsetvli zero, zero, e64, m1, ta, ma			; LMULMAX2-RV32F-NEXT: vsetvli zero, zero, e64, m1, ta, ma
	; LMULMAX2-RV32F-NEXT: vzext.vf2 v9, v8			; LMULMAX2-RV32F-NEXT: vzext.vf2 v9, v8
	Show All 17 Lines
	; LMULMAX2-RV64F-NEXT: vwsubu.vx v9, v8, a1			; LMULMAX2-RV64F-NEXT: vwsubu.vx v9, v8, a1
	; LMULMAX2-RV64F-NEXT: vse64.v v9, (a0)			; LMULMAX2-RV64F-NEXT: vse64.v v9, (a0)
	; LMULMAX2-RV64F-NEXT: ret			; LMULMAX2-RV64F-NEXT: ret
	;			;
	; LMULMAX2-RV32D-LABEL: cttz_zero_undef_v2i64:			; LMULMAX2-RV32D-LABEL: cttz_zero_undef_v2i64:
	; LMULMAX2-RV32D: # %bb.0:			; LMULMAX2-RV32D: # %bb.0:
	; LMULMAX2-RV32D-NEXT: vsetivli zero, 2, e64, m1, ta, ma			; LMULMAX2-RV32D-NEXT: vsetivli zero, 2, e64, m1, ta, ma
	; LMULMAX2-RV32D-NEXT: vle64.v v8, (a0)			; LMULMAX2-RV32D-NEXT: vle64.v v8, (a0)
	; LMULMAX2-RV32D-NEXT: vsetivli zero, 4, e32, m1, ta, ma			; LMULMAX2-RV32D-NEXT: vrsub.vi v9, v8, 0
	; LMULMAX2-RV32D-NEXT: vmv.v.i v9, 0
	; LMULMAX2-RV32D-NEXT: vsetivli zero, 2, e64, m1, ta, ma
	; LMULMAX2-RV32D-NEXT: vsub.vv v9, v9, v8
	; LMULMAX2-RV32D-NEXT: vand.vv v8, v8, v9			; LMULMAX2-RV32D-NEXT: vand.vv v8, v8, v9
	; LMULMAX2-RV32D-NEXT: fsrmi a1, 1			; LMULMAX2-RV32D-NEXT: fsrmi a1, 1
	; LMULMAX2-RV32D-NEXT: vfcvt.f.xu.v v8, v8			; LMULMAX2-RV32D-NEXT: vfcvt.f.xu.v v8, v8
	; LMULMAX2-RV32D-NEXT: fsrm a1			; LMULMAX2-RV32D-NEXT: fsrm a1
	; LMULMAX2-RV32D-NEXT: li a1, 52			; LMULMAX2-RV32D-NEXT: li a1, 52
	; LMULMAX2-RV32D-NEXT: vsrl.vx v8, v8, a1			; LMULMAX2-RV32D-NEXT: vsrl.vx v8, v8, a1
	; LMULMAX2-RV32D-NEXT: li a1, 1023			; LMULMAX2-RV32D-NEXT: li a1, 1023
	; LMULMAX2-RV32D-NEXT: vsub.vx v8, v8, a1			; LMULMAX2-RV32D-NEXT: vsub.vx v8, v8, a1
	Show All 11 Lines
	; LMULMAX2-RV64D-NEXT: fsrm a1			; LMULMAX2-RV64D-NEXT: fsrm a1
	; LMULMAX2-RV64D-NEXT: li a1, 52			; LMULMAX2-RV64D-NEXT: li a1, 52
	; LMULMAX2-RV64D-NEXT: vsrl.vx v8, v8, a1			; LMULMAX2-RV64D-NEXT: vsrl.vx v8, v8, a1
	; LMULMAX2-RV64D-NEXT: li a1, 1023			; LMULMAX2-RV64D-NEXT: li a1, 1023
	; LMULMAX2-RV64D-NEXT: vsub.vx v8, v8, a1			; LMULMAX2-RV64D-NEXT: vsub.vx v8, v8, a1
	; LMULMAX2-RV64D-NEXT: vse64.v v8, (a0)			; LMULMAX2-RV64D-NEXT: vse64.v v8, (a0)
	; LMULMAX2-RV64D-NEXT: ret			; LMULMAX2-RV64D-NEXT: ret
	;			;
	; LMULMAX8-RV32-LABEL: cttz_zero_undef_v2i64:			; LMULMAX8-LABEL: cttz_zero_undef_v2i64:
	; LMULMAX8-RV32: # %bb.0:			; LMULMAX8: # %bb.0:
	; LMULMAX8-RV32-NEXT: vsetivli zero, 2, e64, m1, ta, ma			; LMULMAX8-NEXT: vsetivli zero, 2, e64, m1, ta, ma
	; LMULMAX8-RV32-NEXT: vle64.v v8, (a0)			; LMULMAX8-NEXT: vle64.v v8, (a0)
	; LMULMAX8-RV32-NEXT: vsetivli zero, 4, e32, m1, ta, ma			; LMULMAX8-NEXT: vrsub.vi v9, v8, 0
	; LMULMAX8-RV32-NEXT: vmv.v.i v9, 0			; LMULMAX8-NEXT: vand.vv v8, v8, v9
	; LMULMAX8-RV32-NEXT: vsetivli zero, 2, e64, m1, ta, ma			; LMULMAX8-NEXT: fsrmi a1, 1
	; LMULMAX8-RV32-NEXT: vsub.vv v9, v9, v8			; LMULMAX8-NEXT: vfcvt.f.xu.v v8, v8
	; LMULMAX8-RV32-NEXT: vand.vv v8, v8, v9			; LMULMAX8-NEXT: fsrm a1
	; LMULMAX8-RV32-NEXT: fsrmi a1, 1			; LMULMAX8-NEXT: li a1, 52
	; LMULMAX8-RV32-NEXT: vfcvt.f.xu.v v8, v8			; LMULMAX8-NEXT: vsrl.vx v8, v8, a1
	; LMULMAX8-RV32-NEXT: fsrm a1			; LMULMAX8-NEXT: li a1, 1023
	; LMULMAX8-RV32-NEXT: li a1, 52			; LMULMAX8-NEXT: vsub.vx v8, v8, a1
	; LMULMAX8-RV32-NEXT: vsrl.vx v8, v8, a1			; LMULMAX8-NEXT: vse64.v v8, (a0)
	; LMULMAX8-RV32-NEXT: li a1, 1023			; LMULMAX8-NEXT: ret
	; LMULMAX8-RV32-NEXT: vsub.vx v8, v8, a1
	; LMULMAX8-RV32-NEXT: vse64.v v8, (a0)
	; LMULMAX8-RV32-NEXT: ret
	;
	; LMULMAX8-RV64-LABEL: cttz_zero_undef_v2i64:
	; LMULMAX8-RV64: # %bb.0:
	; LMULMAX8-RV64-NEXT: vsetivli zero, 2, e64, m1, ta, ma
	; LMULMAX8-RV64-NEXT: vle64.v v8, (a0)
	; LMULMAX8-RV64-NEXT: vrsub.vi v9, v8, 0
	; LMULMAX8-RV64-NEXT: vand.vv v8, v8, v9
	; LMULMAX8-RV64-NEXT: fsrmi a1, 1
	; LMULMAX8-RV64-NEXT: vfcvt.f.xu.v v8, v8
	; LMULMAX8-RV64-NEXT: fsrm a1
	; LMULMAX8-RV64-NEXT: li a1, 52
	; LMULMAX8-RV64-NEXT: vsrl.vx v8, v8, a1
	; LMULMAX8-RV64-NEXT: li a1, 1023
	; LMULMAX8-RV64-NEXT: vsub.vx v8, v8, a1
	; LMULMAX8-RV64-NEXT: vse64.v v8, (a0)
	; LMULMAX8-RV64-NEXT: ret
	;			;
	; ZVBB-LABEL: cttz_zero_undef_v2i64:			; ZVBB-LABEL: cttz_zero_undef_v2i64:
	; ZVBB: # %bb.0:			; ZVBB: # %bb.0:
	; ZVBB-NEXT: vsetivli zero, 2, e64, m1, ta, ma			; ZVBB-NEXT: vsetivli zero, 2, e64, m1, ta, ma
	; ZVBB-NEXT: vle64.v v8, (a0)			; ZVBB-NEXT: vle64.v v8, (a0)
	; ZVBB-NEXT: vctz.v v8, v8			; ZVBB-NEXT: vctz.v v8, v8
	; ZVBB-NEXT: vse64.v v8, (a0)			; ZVBB-NEXT: vse64.v v8, (a0)
	; ZVBB-NEXT: ret			; ZVBB-NEXT: ret
	▲ Show 20 Lines • Show All 438 Lines • ▼ Show 20 Lines

	define void @cttz_zero_undef_v4i64(ptr %x, ptr %y) nounwind {			define void @cttz_zero_undef_v4i64(ptr %x, ptr %y) nounwind {
	; LMULMAX2-RV32I-LABEL: cttz_zero_undef_v4i64:			; LMULMAX2-RV32I-LABEL: cttz_zero_undef_v4i64:
	; LMULMAX2-RV32I: # %bb.0:			; LMULMAX2-RV32I: # %bb.0:
	; LMULMAX2-RV32I-NEXT: vsetivli zero, 4, e64, m2, ta, ma			; LMULMAX2-RV32I-NEXT: vsetivli zero, 4, e64, m2, ta, ma
	; LMULMAX2-RV32I-NEXT: vle64.v v8, (a0)			; LMULMAX2-RV32I-NEXT: vle64.v v8, (a0)
	; LMULMAX2-RV32I-NEXT: li a1, 1			; LMULMAX2-RV32I-NEXT: li a1, 1
	; LMULMAX2-RV32I-NEXT: vsub.vx v10, v8, a1			; LMULMAX2-RV32I-NEXT: vsub.vx v10, v8, a1
	; LMULMAX2-RV32I-NEXT: vsetivli zero, 8, e32, m2, ta, ma			; LMULMAX2-RV32I-NEXT: vnot.v v8, v8
	; LMULMAX2-RV32I-NEXT: vmv.v.i v12, -1
	; LMULMAX2-RV32I-NEXT: vsetivli zero, 4, e64, m2, ta, ma
	; LMULMAX2-RV32I-NEXT: vxor.vv v8, v8, v12
	; LMULMAX2-RV32I-NEXT: vand.vv v8, v8, v10			; LMULMAX2-RV32I-NEXT: vand.vv v8, v8, v10
	; LMULMAX2-RV32I-NEXT: vsrl.vi v10, v8, 1			; LMULMAX2-RV32I-NEXT: vsrl.vi v10, v8, 1
	; LMULMAX2-RV32I-NEXT: lui a1, 349525			; LMULMAX2-RV32I-NEXT: lui a1, 349525
	; LMULMAX2-RV32I-NEXT: addi a1, a1, 1365			; LMULMAX2-RV32I-NEXT: addi a1, a1, 1365
	; LMULMAX2-RV32I-NEXT: vsetivli zero, 8, e32, m2, ta, ma			; LMULMAX2-RV32I-NEXT: vsetivli zero, 8, e32, m2, ta, ma
	; LMULMAX2-RV32I-NEXT: vmv.v.x v12, a1			; LMULMAX2-RV32I-NEXT: vmv.v.x v12, a1
	; LMULMAX2-RV32I-NEXT: vsetivli zero, 4, e64, m2, ta, ma			; LMULMAX2-RV32I-NEXT: vsetivli zero, 4, e64, m2, ta, ma
	; LMULMAX2-RV32I-NEXT: vand.vv v10, v10, v12			; LMULMAX2-RV32I-NEXT: vand.vv v10, v10, v12
	▲ Show 20 Lines • Show All 65 Lines • ▼ Show 20 Lines
	; LMULMAX2-RV64I-NEXT: vsrl.vx v8, v8, a1			; LMULMAX2-RV64I-NEXT: vsrl.vx v8, v8, a1
	; LMULMAX2-RV64I-NEXT: vse64.v v8, (a0)			; LMULMAX2-RV64I-NEXT: vse64.v v8, (a0)
	; LMULMAX2-RV64I-NEXT: ret			; LMULMAX2-RV64I-NEXT: ret
	;			;
	; LMULMAX2-RV32F-LABEL: cttz_zero_undef_v4i64:			; LMULMAX2-RV32F-LABEL: cttz_zero_undef_v4i64:
	; LMULMAX2-RV32F: # %bb.0:			; LMULMAX2-RV32F: # %bb.0:
	; LMULMAX2-RV32F-NEXT: vsetivli zero, 4, e64, m2, ta, ma			; LMULMAX2-RV32F-NEXT: vsetivli zero, 4, e64, m2, ta, ma
	; LMULMAX2-RV32F-NEXT: vle64.v v8, (a0)			; LMULMAX2-RV32F-NEXT: vle64.v v8, (a0)
	; LMULMAX2-RV32F-NEXT: vsetivli zero, 8, e32, m2, ta, ma			; LMULMAX2-RV32F-NEXT: vrsub.vi v10, v8, 0
	; LMULMAX2-RV32F-NEXT: vmv.v.i v10, 0
	; LMULMAX2-RV32F-NEXT: vsetivli zero, 4, e64, m2, ta, ma
	; LMULMAX2-RV32F-NEXT: vsub.vv v10, v10, v8
	; LMULMAX2-RV32F-NEXT: vand.vv v8, v8, v10			; LMULMAX2-RV32F-NEXT: vand.vv v8, v8, v10
	; LMULMAX2-RV32F-NEXT: fsrmi a1, 1			; LMULMAX2-RV32F-NEXT: fsrmi a1, 1
	; LMULMAX2-RV32F-NEXT: vsetvli zero, zero, e32, m1, ta, ma			; LMULMAX2-RV32F-NEXT: vsetvli zero, zero, e32, m1, ta, ma
	; LMULMAX2-RV32F-NEXT: vfncvt.f.xu.w v10, v8			; LMULMAX2-RV32F-NEXT: vfncvt.f.xu.w v10, v8
	; LMULMAX2-RV32F-NEXT: fsrm a1			; LMULMAX2-RV32F-NEXT: fsrm a1
	; LMULMAX2-RV32F-NEXT: vsrl.vi v8, v10, 23			; LMULMAX2-RV32F-NEXT: vsrl.vi v8, v10, 23
	; LMULMAX2-RV32F-NEXT: vsetvli zero, zero, e64, m2, ta, ma			; LMULMAX2-RV32F-NEXT: vsetvli zero, zero, e64, m2, ta, ma
	; LMULMAX2-RV32F-NEXT: vzext.vf2 v10, v8			; LMULMAX2-RV32F-NEXT: vzext.vf2 v10, v8
	Show All 17 Lines
	; LMULMAX2-RV64F-NEXT: vwsubu.vx v10, v8, a1			; LMULMAX2-RV64F-NEXT: vwsubu.vx v10, v8, a1
	; LMULMAX2-RV64F-NEXT: vse64.v v10, (a0)			; LMULMAX2-RV64F-NEXT: vse64.v v10, (a0)
	; LMULMAX2-RV64F-NEXT: ret			; LMULMAX2-RV64F-NEXT: ret
	;			;
	; LMULMAX2-RV32D-LABEL: cttz_zero_undef_v4i64:			; LMULMAX2-RV32D-LABEL: cttz_zero_undef_v4i64:
	; LMULMAX2-RV32D: # %bb.0:			; LMULMAX2-RV32D: # %bb.0:
	; LMULMAX2-RV32D-NEXT: vsetivli zero, 4, e64, m2, ta, ma			; LMULMAX2-RV32D-NEXT: vsetivli zero, 4, e64, m2, ta, ma
	; LMULMAX2-RV32D-NEXT: vle64.v v8, (a0)			; LMULMAX2-RV32D-NEXT: vle64.v v8, (a0)
	; LMULMAX2-RV32D-NEXT: vsetivli zero, 8, e32, m2, ta, ma			; LMULMAX2-RV32D-NEXT: vrsub.vi v10, v8, 0
	; LMULMAX2-RV32D-NEXT: vmv.v.i v10, 0
	; LMULMAX2-RV32D-NEXT: vsetivli zero, 4, e64, m2, ta, ma
	; LMULMAX2-RV32D-NEXT: vsub.vv v10, v10, v8
	; LMULMAX2-RV32D-NEXT: vand.vv v8, v8, v10			; LMULMAX2-RV32D-NEXT: vand.vv v8, v8, v10
	; LMULMAX2-RV32D-NEXT: fsrmi a1, 1			; LMULMAX2-RV32D-NEXT: fsrmi a1, 1
	; LMULMAX2-RV32D-NEXT: vfcvt.f.xu.v v8, v8			; LMULMAX2-RV32D-NEXT: vfcvt.f.xu.v v8, v8
	; LMULMAX2-RV32D-NEXT: fsrm a1			; LMULMAX2-RV32D-NEXT: fsrm a1
	; LMULMAX2-RV32D-NEXT: li a1, 52			; LMULMAX2-RV32D-NEXT: li a1, 52
	; LMULMAX2-RV32D-NEXT: vsrl.vx v8, v8, a1			; LMULMAX2-RV32D-NEXT: vsrl.vx v8, v8, a1
	; LMULMAX2-RV32D-NEXT: li a1, 1023			; LMULMAX2-RV32D-NEXT: li a1, 1023
	; LMULMAX2-RV32D-NEXT: vsub.vx v8, v8, a1			; LMULMAX2-RV32D-NEXT: vsub.vx v8, v8, a1
	Show All 11 Lines
	; LMULMAX2-RV64D-NEXT: fsrm a1			; LMULMAX2-RV64D-NEXT: fsrm a1
	; LMULMAX2-RV64D-NEXT: li a1, 52			; LMULMAX2-RV64D-NEXT: li a1, 52
	; LMULMAX2-RV64D-NEXT: vsrl.vx v8, v8, a1			; LMULMAX2-RV64D-NEXT: vsrl.vx v8, v8, a1
	; LMULMAX2-RV64D-NEXT: li a1, 1023			; LMULMAX2-RV64D-NEXT: li a1, 1023
	; LMULMAX2-RV64D-NEXT: vsub.vx v8, v8, a1			; LMULMAX2-RV64D-NEXT: vsub.vx v8, v8, a1
	; LMULMAX2-RV64D-NEXT: vse64.v v8, (a0)			; LMULMAX2-RV64D-NEXT: vse64.v v8, (a0)
	; LMULMAX2-RV64D-NEXT: ret			; LMULMAX2-RV64D-NEXT: ret
	;			;
	; LMULMAX8-RV32-LABEL: cttz_zero_undef_v4i64:			; LMULMAX8-LABEL: cttz_zero_undef_v4i64:
	; LMULMAX8-RV32: # %bb.0:			; LMULMAX8: # %bb.0:
	; LMULMAX8-RV32-NEXT: vsetivli zero, 4, e64, m2, ta, ma			; LMULMAX8-NEXT: vsetivli zero, 4, e64, m2, ta, ma
	; LMULMAX8-RV32-NEXT: vle64.v v8, (a0)			; LMULMAX8-NEXT: vle64.v v8, (a0)
	; LMULMAX8-RV32-NEXT: vsetivli zero, 8, e32, m2, ta, ma			; LMULMAX8-NEXT: vrsub.vi v10, v8, 0
	; LMULMAX8-RV32-NEXT: vmv.v.i v10, 0			; LMULMAX8-NEXT: vand.vv v8, v8, v10
	; LMULMAX8-RV32-NEXT: vsetivli zero, 4, e64, m2, ta, ma			; LMULMAX8-NEXT: fsrmi a1, 1
	; LMULMAX8-RV32-NEXT: vsub.vv v10, v10, v8			; LMULMAX8-NEXT: vfcvt.f.xu.v v8, v8
	; LMULMAX8-RV32-NEXT: vand.vv v8, v8, v10			; LMULMAX8-NEXT: fsrm a1
	; LMULMAX8-RV32-NEXT: fsrmi a1, 1			; LMULMAX8-NEXT: li a1, 52
	; LMULMAX8-RV32-NEXT: vfcvt.f.xu.v v8, v8			; LMULMAX8-NEXT: vsrl.vx v8, v8, a1
	; LMULMAX8-RV32-NEXT: fsrm a1			; LMULMAX8-NEXT: li a1, 1023
	; LMULMAX8-RV32-NEXT: li a1, 52			; LMULMAX8-NEXT: vsub.vx v8, v8, a1
	; LMULMAX8-RV32-NEXT: vsrl.vx v8, v8, a1			; LMULMAX8-NEXT: vse64.v v8, (a0)
	; LMULMAX8-RV32-NEXT: li a1, 1023			; LMULMAX8-NEXT: ret
	; LMULMAX8-RV32-NEXT: vsub.vx v8, v8, a1
	; LMULMAX8-RV32-NEXT: vse64.v v8, (a0)
	; LMULMAX8-RV32-NEXT: ret
	;
	; LMULMAX8-RV64-LABEL: cttz_zero_undef_v4i64:
	; LMULMAX8-RV64: # %bb.0:
	; LMULMAX8-RV64-NEXT: vsetivli zero, 4, e64, m2, ta, ma
	; LMULMAX8-RV64-NEXT: vle64.v v8, (a0)
	; LMULMAX8-RV64-NEXT: vrsub.vi v10, v8, 0
	; LMULMAX8-RV64-NEXT: vand.vv v8, v8, v10
	; LMULMAX8-RV64-NEXT: fsrmi a1, 1
	; LMULMAX8-RV64-NEXT: vfcvt.f.xu.v v8, v8
	; LMULMAX8-RV64-NEXT: fsrm a1
	; LMULMAX8-RV64-NEXT: li a1, 52
	; LMULMAX8-RV64-NEXT: vsrl.vx v8, v8, a1
	; LMULMAX8-RV64-NEXT: li a1, 1023
	; LMULMAX8-RV64-NEXT: vsub.vx v8, v8, a1
	; LMULMAX8-RV64-NEXT: vse64.v v8, (a0)
	; LMULMAX8-RV64-NEXT: ret
	;			;
	; ZVBB-LABEL: cttz_zero_undef_v4i64:			; ZVBB-LABEL: cttz_zero_undef_v4i64:
	; ZVBB: # %bb.0:			; ZVBB: # %bb.0:
	; ZVBB-NEXT: vsetivli zero, 4, e64, m2, ta, ma			; ZVBB-NEXT: vsetivli zero, 4, e64, m2, ta, ma
	; ZVBB-NEXT: vle64.v v8, (a0)			; ZVBB-NEXT: vle64.v v8, (a0)
	; ZVBB-NEXT: vctz.v v8, v8			; ZVBB-NEXT: vctz.v v8, v8
	; ZVBB-NEXT: vse64.v v8, (a0)			; ZVBB-NEXT: vse64.v v8, (a0)
	; ZVBB-NEXT: ret			; ZVBB-NEXT: ret
	%a = load <4 x i64>, ptr %x			%a = load <4 x i64>, ptr %x
	%b = load <4 x i64>, ptr %y			%b = load <4 x i64>, ptr %y
	%c = call <4 x i64> @llvm.cttz.v4i64(<4 x i64> %a, i1 true)			%c = call <4 x i64> @llvm.cttz.v4i64(<4 x i64> %a, i1 true)
	store <4 x i64> %c, ptr %x			store <4 x i64> %c, ptr %x
	ret void			ret void
	}			}
				;; NOTE: These prefixes are unused and the list is autogenerated. Do not add tests below this line:
				; LMULMAX8-RV32: {{.*}}
				; LMULMAX8-RV64: {{.*}}

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-fshr-fshl-vp.ll

	Show First 20 Lines • Show All 516 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: vor.vv v8, v8, v12, v0.t			; CHECK-NEXT: vor.vv v8, v8, v12, v0.t
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%res = call <16 x i32> @llvm.vp.fshl.v16i32(<16 x i32> %a, <16 x i32> %b, <16 x i32> %c, <16 x i1> %m, i32 %evl)			%res = call <16 x i32> @llvm.vp.fshl.v16i32(<16 x i32> %a, <16 x i32> %b, <16 x i32> %c, <16 x i1> %m, i32 %evl)
	ret <16 x i32> %res			ret <16 x i32> %res
	}			}

	declare <2 x i64> @llvm.vp.fshr.v2i64(<2 x i64>, <2 x i64>, <2 x i64>, <2 x i1>, i32)			declare <2 x i64> @llvm.vp.fshr.v2i64(<2 x i64>, <2 x i64>, <2 x i64>, <2 x i1>, i32)
	define <2 x i64> @fshr_v2i64(<2 x i64> %a, <2 x i64> %b, <2 x i64> %c, <2 x i1> %m, i32 zeroext %evl) {			define <2 x i64> @fshr_v2i64(<2 x i64> %a, <2 x i64> %b, <2 x i64> %c, <2 x i1> %m, i32 zeroext %evl) {
	; RV32-LABEL: fshr_v2i64:			; CHECK-LABEL: fshr_v2i64:
	; RV32: # %bb.0:			; CHECK: # %bb.0:
	; RV32-NEXT: li a1, 63			; CHECK-NEXT: li a1, 63
	; RV32-NEXT: vsetvli zero, a0, e64, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a0, e64, m1, ta, ma
	; RV32-NEXT: vand.vx v11, v10, a1, v0.t			; CHECK-NEXT: vand.vx v11, v10, a1, v0.t
	; RV32-NEXT: vsrl.vv v9, v9, v11, v0.t			; CHECK-NEXT: vsrl.vv v9, v9, v11, v0.t
	; RV32-NEXT: vsetivli zero, 4, e32, m1, ta, ma			; CHECK-NEXT: vnot.v v10, v10, v0.t
	; RV32-NEXT: vmv.v.i v11, -1			; CHECK-NEXT: vand.vx v10, v10, a1, v0.t
	; RV32-NEXT: vsetvli zero, a0, e64, m1, ta, ma			; CHECK-NEXT: vsll.vi v8, v8, 1, v0.t
	; RV32-NEXT: vxor.vv v10, v10, v11, v0.t			; CHECK-NEXT: vsll.vv v8, v8, v10, v0.t
	; RV32-NEXT: vand.vx v10, v10, a1, v0.t			; CHECK-NEXT: vor.vv v8, v8, v9, v0.t
	; RV32-NEXT: vsll.vi v8, v8, 1, v0.t			; CHECK-NEXT: ret
	; RV32-NEXT: vsll.vv v8, v8, v10, v0.t
	; RV32-NEXT: vor.vv v8, v8, v9, v0.t
	; RV32-NEXT: ret
	;
	; RV64-LABEL: fshr_v2i64:
	; RV64: # %bb.0:
	; RV64-NEXT: li a1, 63
	; RV64-NEXT: vsetvli zero, a0, e64, m1, ta, ma
	; RV64-NEXT: vand.vx v11, v10, a1, v0.t
	; RV64-NEXT: vsrl.vv v9, v9, v11, v0.t
	; RV64-NEXT: vnot.v v10, v10, v0.t
	; RV64-NEXT: vand.vx v10, v10, a1, v0.t
	; RV64-NEXT: vsll.vi v8, v8, 1, v0.t
	; RV64-NEXT: vsll.vv v8, v8, v10, v0.t
	; RV64-NEXT: vor.vv v8, v8, v9, v0.t
	; RV64-NEXT: ret
	%res = call <2 x i64> @llvm.vp.fshr.v2i64(<2 x i64> %a, <2 x i64> %b, <2 x i64> %c, <2 x i1> %m, i32 %evl)			%res = call <2 x i64> @llvm.vp.fshr.v2i64(<2 x i64> %a, <2 x i64> %b, <2 x i64> %c, <2 x i1> %m, i32 %evl)
	ret <2 x i64> %res			ret <2 x i64> %res
	}			}

	declare <2 x i64> @llvm.vp.fshl.v2i64(<2 x i64>, <2 x i64>, <2 x i64>, <2 x i1>, i32)			declare <2 x i64> @llvm.vp.fshl.v2i64(<2 x i64>, <2 x i64>, <2 x i64>, <2 x i1>, i32)
	define <2 x i64> @fshl_v2i64(<2 x i64> %a, <2 x i64> %b, <2 x i64> %c, <2 x i1> %m, i32 zeroext %evl) {			define <2 x i64> @fshl_v2i64(<2 x i64> %a, <2 x i64> %b, <2 x i64> %c, <2 x i1> %m, i32 zeroext %evl) {
	; RV32-LABEL: fshl_v2i64:			; CHECK-LABEL: fshl_v2i64:
	; RV32: # %bb.0:			; CHECK: # %bb.0:
	; RV32-NEXT: li a1, 63			; CHECK-NEXT: li a1, 63
	; RV32-NEXT: vsetvli zero, a0, e64, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a0, e64, m1, ta, ma
	; RV32-NEXT: vand.vx v11, v10, a1, v0.t			; CHECK-NEXT: vand.vx v11, v10, a1, v0.t
	; RV32-NEXT: vsll.vv v8, v8, v11, v0.t			; CHECK-NEXT: vsll.vv v8, v8, v11, v0.t
	; RV32-NEXT: vsetivli zero, 4, e32, m1, ta, ma			; CHECK-NEXT: vnot.v v10, v10, v0.t
	; RV32-NEXT: vmv.v.i v11, -1			; CHECK-NEXT: vand.vx v10, v10, a1, v0.t
	; RV32-NEXT: vsetvli zero, a0, e64, m1, ta, ma			; CHECK-NEXT: vsrl.vi v9, v9, 1, v0.t
	; RV32-NEXT: vxor.vv v10, v10, v11, v0.t			; CHECK-NEXT: vsrl.vv v9, v9, v10, v0.t
	; RV32-NEXT: vand.vx v10, v10, a1, v0.t			; CHECK-NEXT: vor.vv v8, v8, v9, v0.t
	; RV32-NEXT: vsrl.vi v9, v9, 1, v0.t			; CHECK-NEXT: ret
	; RV32-NEXT: vsrl.vv v9, v9, v10, v0.t
	; RV32-NEXT: vor.vv v8, v8, v9, v0.t
	; RV32-NEXT: ret
	;
	; RV64-LABEL: fshl_v2i64:
	; RV64: # %bb.0:
	; RV64-NEXT: li a1, 63
	; RV64-NEXT: vsetvli zero, a0, e64, m1, ta, ma
	; RV64-NEXT: vand.vx v11, v10, a1, v0.t
	; RV64-NEXT: vsll.vv v8, v8, v11, v0.t
	; RV64-NEXT: vnot.v v10, v10, v0.t
	; RV64-NEXT: vand.vx v10, v10, a1, v0.t
	; RV64-NEXT: vsrl.vi v9, v9, 1, v0.t
	; RV64-NEXT: vsrl.vv v9, v9, v10, v0.t
	; RV64-NEXT: vor.vv v8, v8, v9, v0.t
	; RV64-NEXT: ret
	%res = call <2 x i64> @llvm.vp.fshl.v2i64(<2 x i64> %a, <2 x i64> %b, <2 x i64> %c, <2 x i1> %m, i32 %evl)			%res = call <2 x i64> @llvm.vp.fshl.v2i64(<2 x i64> %a, <2 x i64> %b, <2 x i64> %c, <2 x i1> %m, i32 %evl)
	ret <2 x i64> %res			ret <2 x i64> %res
	}			}

	declare <4 x i64> @llvm.vp.fshr.v4i64(<4 x i64>, <4 x i64>, <4 x i64>, <4 x i1>, i32)			declare <4 x i64> @llvm.vp.fshr.v4i64(<4 x i64>, <4 x i64>, <4 x i64>, <4 x i1>, i32)
	define <4 x i64> @fshr_v4i64(<4 x i64> %a, <4 x i64> %b, <4 x i64> %c, <4 x i1> %m, i32 zeroext %evl) {			define <4 x i64> @fshr_v4i64(<4 x i64> %a, <4 x i64> %b, <4 x i64> %c, <4 x i1> %m, i32 zeroext %evl) {
	; RV32-LABEL: fshr_v4i64:			; CHECK-LABEL: fshr_v4i64:
	; RV32: # %bb.0:			; CHECK: # %bb.0:
	; RV32-NEXT: li a1, 63			; CHECK-NEXT: li a1, 63
	; RV32-NEXT: vsetvli zero, a0, e64, m2, ta, ma			; CHECK-NEXT: vsetvli zero, a0, e64, m2, ta, ma
	; RV32-NEXT: vand.vx v14, v12, a1, v0.t			; CHECK-NEXT: vand.vx v14, v12, a1, v0.t
	; RV32-NEXT: vsrl.vv v10, v10, v14, v0.t			; CHECK-NEXT: vsrl.vv v10, v10, v14, v0.t
	; RV32-NEXT: vsetivli zero, 8, e32, m2, ta, ma			; CHECK-NEXT: vnot.v v12, v12, v0.t
	; RV32-NEXT: vmv.v.i v14, -1			; CHECK-NEXT: vand.vx v12, v12, a1, v0.t
	; RV32-NEXT: vsetvli zero, a0, e64, m2, ta, ma			; CHECK-NEXT: vsll.vi v8, v8, 1, v0.t
	; RV32-NEXT: vxor.vv v12, v12, v14, v0.t			; CHECK-NEXT: vsll.vv v8, v8, v12, v0.t
	; RV32-NEXT: vand.vx v12, v12, a1, v0.t			; CHECK-NEXT: vor.vv v8, v8, v10, v0.t
	; RV32-NEXT: vsll.vi v8, v8, 1, v0.t			; CHECK-NEXT: ret
	; RV32-NEXT: vsll.vv v8, v8, v12, v0.t
	; RV32-NEXT: vor.vv v8, v8, v10, v0.t
	; RV32-NEXT: ret
	;
	; RV64-LABEL: fshr_v4i64:
	; RV64: # %bb.0:
	; RV64-NEXT: li a1, 63
	; RV64-NEXT: vsetvli zero, a0, e64, m2, ta, ma
	; RV64-NEXT: vand.vx v14, v12, a1, v0.t
	; RV64-NEXT: vsrl.vv v10, v10, v14, v0.t
	; RV64-NEXT: vnot.v v12, v12, v0.t
	; RV64-NEXT: vand.vx v12, v12, a1, v0.t
	; RV64-NEXT: vsll.vi v8, v8, 1, v0.t
	; RV64-NEXT: vsll.vv v8, v8, v12, v0.t
	; RV64-NEXT: vor.vv v8, v8, v10, v0.t
	; RV64-NEXT: ret
	%res = call <4 x i64> @llvm.vp.fshr.v4i64(<4 x i64> %a, <4 x i64> %b, <4 x i64> %c, <4 x i1> %m, i32 %evl)			%res = call <4 x i64> @llvm.vp.fshr.v4i64(<4 x i64> %a, <4 x i64> %b, <4 x i64> %c, <4 x i1> %m, i32 %evl)
	ret <4 x i64> %res			ret <4 x i64> %res
	}			}

	declare <4 x i64> @llvm.vp.fshl.v4i64(<4 x i64>, <4 x i64>, <4 x i64>, <4 x i1>, i32)			declare <4 x i64> @llvm.vp.fshl.v4i64(<4 x i64>, <4 x i64>, <4 x i64>, <4 x i1>, i32)
	define <4 x i64> @fshl_v4i64(<4 x i64> %a, <4 x i64> %b, <4 x i64> %c, <4 x i1> %m, i32 zeroext %evl) {			define <4 x i64> @fshl_v4i64(<4 x i64> %a, <4 x i64> %b, <4 x i64> %c, <4 x i1> %m, i32 zeroext %evl) {
	; RV32-LABEL: fshl_v4i64:			; CHECK-LABEL: fshl_v4i64:
	; RV32: # %bb.0:			; CHECK: # %bb.0:
	; RV32-NEXT: li a1, 63			; CHECK-NEXT: li a1, 63
	; RV32-NEXT: vsetvli zero, a0, e64, m2, ta, ma			; CHECK-NEXT: vsetvli zero, a0, e64, m2, ta, ma
	; RV32-NEXT: vand.vx v14, v12, a1, v0.t			; CHECK-NEXT: vand.vx v14, v12, a1, v0.t
	; RV32-NEXT: vsll.vv v8, v8, v14, v0.t			; CHECK-NEXT: vsll.vv v8, v8, v14, v0.t
	; RV32-NEXT: vsetivli zero, 8, e32, m2, ta, ma			; CHECK-NEXT: vnot.v v12, v12, v0.t
	; RV32-NEXT: vmv.v.i v14, -1			; CHECK-NEXT: vand.vx v12, v12, a1, v0.t
	; RV32-NEXT: vsetvli zero, a0, e64, m2, ta, ma			; CHECK-NEXT: vsrl.vi v10, v10, 1, v0.t
	; RV32-NEXT: vxor.vv v12, v12, v14, v0.t			; CHECK-NEXT: vsrl.vv v10, v10, v12, v0.t
	; RV32-NEXT: vand.vx v12, v12, a1, v0.t			; CHECK-NEXT: vor.vv v8, v8, v10, v0.t
	; RV32-NEXT: vsrl.vi v10, v10, 1, v0.t			; CHECK-NEXT: ret
	; RV32-NEXT: vsrl.vv v10, v10, v12, v0.t
	; RV32-NEXT: vor.vv v8, v8, v10, v0.t
	; RV32-NEXT: ret
	;
	; RV64-LABEL: fshl_v4i64:
	; RV64: # %bb.0:
	; RV64-NEXT: li a1, 63
	; RV64-NEXT: vsetvli zero, a0, e64, m2, ta, ma
	; RV64-NEXT: vand.vx v14, v12, a1, v0.t
	; RV64-NEXT: vsll.vv v8, v8, v14, v0.t
	; RV64-NEXT: vnot.v v12, v12, v0.t
	; RV64-NEXT: vand.vx v12, v12, a1, v0.t
	; RV64-NEXT: vsrl.vi v10, v10, 1, v0.t
	; RV64-NEXT: vsrl.vv v10, v10, v12, v0.t
	; RV64-NEXT: vor.vv v8, v8, v10, v0.t
	; RV64-NEXT: ret
	%res = call <4 x i64> @llvm.vp.fshl.v4i64(<4 x i64> %a, <4 x i64> %b, <4 x i64> %c, <4 x i1> %m, i32 %evl)			%res = call <4 x i64> @llvm.vp.fshl.v4i64(<4 x i64> %a, <4 x i64> %b, <4 x i64> %c, <4 x i1> %m, i32 %evl)
	ret <4 x i64> %res			ret <4 x i64> %res
	}			}

	declare <7 x i64> @llvm.vp.fshr.v7i64(<7 x i64>, <7 x i64>, <7 x i64>, <7 x i1>, i32)			declare <7 x i64> @llvm.vp.fshr.v7i64(<7 x i64>, <7 x i64>, <7 x i64>, <7 x i1>, i32)
	define <7 x i64> @fshr_v7i64(<7 x i64> %a, <7 x i64> %b, <7 x i64> %c, <7 x i1> %m, i32 zeroext %evl) {			define <7 x i64> @fshr_v7i64(<7 x i64> %a, <7 x i64> %b, <7 x i64> %c, <7 x i1> %m, i32 zeroext %evl) {
	; RV32-LABEL: fshr_v7i64:			; CHECK-LABEL: fshr_v7i64:
	; RV32: # %bb.0:			; CHECK: # %bb.0:
	; RV32-NEXT: li a1, 63			; CHECK-NEXT: li a1, 63
	; RV32-NEXT: vsetvli zero, a0, e64, m4, ta, ma			; CHECK-NEXT: vsetvli zero, a0, e64, m4, ta, ma
	; RV32-NEXT: vand.vx v20, v16, a1, v0.t			; CHECK-NEXT: vand.vx v20, v16, a1, v0.t
	; RV32-NEXT: vsrl.vv v12, v12, v20, v0.t			; CHECK-NEXT: vsrl.vv v12, v12, v20, v0.t
	; RV32-NEXT: vsetivli zero, 16, e32, m4, ta, ma			; CHECK-NEXT: vnot.v v16, v16, v0.t
	; RV32-NEXT: vmv.v.i v20, -1			; CHECK-NEXT: vand.vx v16, v16, a1, v0.t
	; RV32-NEXT: vsetvli zero, a0, e64, m4, ta, ma			; CHECK-NEXT: vsll.vi v8, v8, 1, v0.t
	; RV32-NEXT: vxor.vv v16, v16, v20, v0.t			; CHECK-NEXT: vsll.vv v8, v8, v16, v0.t
	; RV32-NEXT: vand.vx v16, v16, a1, v0.t			; CHECK-NEXT: vor.vv v8, v8, v12, v0.t
	; RV32-NEXT: vsll.vi v8, v8, 1, v0.t			; CHECK-NEXT: ret
	; RV32-NEXT: vsll.vv v8, v8, v16, v0.t
	; RV32-NEXT: vor.vv v8, v8, v12, v0.t
	; RV32-NEXT: ret
	;
	; RV64-LABEL: fshr_v7i64:
	; RV64: # %bb.0:
	; RV64-NEXT: li a1, 63
	; RV64-NEXT: vsetvli zero, a0, e64, m4, ta, ma
	; RV64-NEXT: vand.vx v20, v16, a1, v0.t
	; RV64-NEXT: vsrl.vv v12, v12, v20, v0.t
	; RV64-NEXT: vnot.v v16, v16, v0.t
	; RV64-NEXT: vand.vx v16, v16, a1, v0.t
	; RV64-NEXT: vsll.vi v8, v8, 1, v0.t
	; RV64-NEXT: vsll.vv v8, v8, v16, v0.t
	; RV64-NEXT: vor.vv v8, v8, v12, v0.t
	; RV64-NEXT: ret
	%res = call <7 x i64> @llvm.vp.fshr.v7i64(<7 x i64> %a, <7 x i64> %b, <7 x i64> %c, <7 x i1> %m, i32 %evl)			%res = call <7 x i64> @llvm.vp.fshr.v7i64(<7 x i64> %a, <7 x i64> %b, <7 x i64> %c, <7 x i1> %m, i32 %evl)
	ret <7 x i64> %res			ret <7 x i64> %res
	}			}

	declare <7 x i64> @llvm.vp.fshl.v7i64(<7 x i64>, <7 x i64>, <7 x i64>, <7 x i1>, i32)			declare <7 x i64> @llvm.vp.fshl.v7i64(<7 x i64>, <7 x i64>, <7 x i64>, <7 x i1>, i32)
	define <7 x i64> @fshl_v7i64(<7 x i64> %a, <7 x i64> %b, <7 x i64> %c, <7 x i1> %m, i32 zeroext %evl) {			define <7 x i64> @fshl_v7i64(<7 x i64> %a, <7 x i64> %b, <7 x i64> %c, <7 x i1> %m, i32 zeroext %evl) {
	; RV32-LABEL: fshl_v7i64:			; CHECK-LABEL: fshl_v7i64:
	; RV32: # %bb.0:			; CHECK: # %bb.0:
	; RV32-NEXT: li a1, 63			; CHECK-NEXT: li a1, 63
	; RV32-NEXT: vsetvli zero, a0, e64, m4, ta, ma			; CHECK-NEXT: vsetvli zero, a0, e64, m4, ta, ma
	; RV32-NEXT: vand.vx v20, v16, a1, v0.t			; CHECK-NEXT: vand.vx v20, v16, a1, v0.t
	; RV32-NEXT: vsll.vv v8, v8, v20, v0.t			; CHECK-NEXT: vsll.vv v8, v8, v20, v0.t
	; RV32-NEXT: vsetivli zero, 16, e32, m4, ta, ma			; CHECK-NEXT: vnot.v v16, v16, v0.t
	; RV32-NEXT: vmv.v.i v20, -1			; CHECK-NEXT: vand.vx v16, v16, a1, v0.t
	; RV32-NEXT: vsetvli zero, a0, e64, m4, ta, ma			; CHECK-NEXT: vsrl.vi v12, v12, 1, v0.t
	; RV32-NEXT: vxor.vv v16, v16, v20, v0.t			; CHECK-NEXT: vsrl.vv v12, v12, v16, v0.t
	; RV32-NEXT: vand.vx v16, v16, a1, v0.t			; CHECK-NEXT: vor.vv v8, v8, v12, v0.t
	; RV32-NEXT: vsrl.vi v12, v12, 1, v0.t			; CHECK-NEXT: ret
	; RV32-NEXT: vsrl.vv v12, v12, v16, v0.t
	; RV32-NEXT: vor.vv v8, v8, v12, v0.t
	; RV32-NEXT: ret
	;
	; RV64-LABEL: fshl_v7i64:
	; RV64: # %bb.0:
	; RV64-NEXT: li a1, 63
	; RV64-NEXT: vsetvli zero, a0, e64, m4, ta, ma
	; RV64-NEXT: vand.vx v20, v16, a1, v0.t
	; RV64-NEXT: vsll.vv v8, v8, v20, v0.t
	; RV64-NEXT: vnot.v v16, v16, v0.t
	; RV64-NEXT: vand.vx v16, v16, a1, v0.t
	; RV64-NEXT: vsrl.vi v12, v12, 1, v0.t
	; RV64-NEXT: vsrl.vv v12, v12, v16, v0.t
	; RV64-NEXT: vor.vv v8, v8, v12, v0.t
	; RV64-NEXT: ret
	%res = call <7 x i64> @llvm.vp.fshl.v7i64(<7 x i64> %a, <7 x i64> %b, <7 x i64> %c, <7 x i1> %m, i32 %evl)			%res = call <7 x i64> @llvm.vp.fshl.v7i64(<7 x i64> %a, <7 x i64> %b, <7 x i64> %c, <7 x i1> %m, i32 %evl)
	ret <7 x i64> %res			ret <7 x i64> %res
	}			}

	declare <8 x i64> @llvm.vp.fshr.v8i64(<8 x i64>, <8 x i64>, <8 x i64>, <8 x i1>, i32)			declare <8 x i64> @llvm.vp.fshr.v8i64(<8 x i64>, <8 x i64>, <8 x i64>, <8 x i1>, i32)
	define <8 x i64> @fshr_v8i64(<8 x i64> %a, <8 x i64> %b, <8 x i64> %c, <8 x i1> %m, i32 zeroext %evl) {			define <8 x i64> @fshr_v8i64(<8 x i64> %a, <8 x i64> %b, <8 x i64> %c, <8 x i1> %m, i32 zeroext %evl) {
	; RV32-LABEL: fshr_v8i64:			; CHECK-LABEL: fshr_v8i64:
	; RV32: # %bb.0:			; CHECK: # %bb.0:
	; RV32-NEXT: li a1, 63			; CHECK-NEXT: li a1, 63
	; RV32-NEXT: vsetvli zero, a0, e64, m4, ta, ma			; CHECK-NEXT: vsetvli zero, a0, e64, m4, ta, ma
	; RV32-NEXT: vand.vx v20, v16, a1, v0.t			; CHECK-NEXT: vand.vx v20, v16, a1, v0.t
	; RV32-NEXT: vsrl.vv v12, v12, v20, v0.t			; CHECK-NEXT: vsrl.vv v12, v12, v20, v0.t
	; RV32-NEXT: vsetivli zero, 16, e32, m4, ta, ma			; CHECK-NEXT: vnot.v v16, v16, v0.t
	; RV32-NEXT: vmv.v.i v20, -1			; CHECK-NEXT: vand.vx v16, v16, a1, v0.t
	; RV32-NEXT: vsetvli zero, a0, e64, m4, ta, ma			; CHECK-NEXT: vsll.vi v8, v8, 1, v0.t
	; RV32-NEXT: vxor.vv v16, v16, v20, v0.t			; CHECK-NEXT: vsll.vv v8, v8, v16, v0.t
	; RV32-NEXT: vand.vx v16, v16, a1, v0.t			; CHECK-NEXT: vor.vv v8, v8, v12, v0.t
	; RV32-NEXT: vsll.vi v8, v8, 1, v0.t			; CHECK-NEXT: ret
	; RV32-NEXT: vsll.vv v8, v8, v16, v0.t
	; RV32-NEXT: vor.vv v8, v8, v12, v0.t
	; RV32-NEXT: ret
	;
	; RV64-LABEL: fshr_v8i64:
	; RV64: # %bb.0:
	; RV64-NEXT: li a1, 63
	; RV64-NEXT: vsetvli zero, a0, e64, m4, ta, ma
	; RV64-NEXT: vand.vx v20, v16, a1, v0.t
	; RV64-NEXT: vsrl.vv v12, v12, v20, v0.t
	; RV64-NEXT: vnot.v v16, v16, v0.t
	; RV64-NEXT: vand.vx v16, v16, a1, v0.t
	; RV64-NEXT: vsll.vi v8, v8, 1, v0.t
	; RV64-NEXT: vsll.vv v8, v8, v16, v0.t
	; RV64-NEXT: vor.vv v8, v8, v12, v0.t
	; RV64-NEXT: ret
	%res = call <8 x i64> @llvm.vp.fshr.v8i64(<8 x i64> %a, <8 x i64> %b, <8 x i64> %c, <8 x i1> %m, i32 %evl)			%res = call <8 x i64> @llvm.vp.fshr.v8i64(<8 x i64> %a, <8 x i64> %b, <8 x i64> %c, <8 x i1> %m, i32 %evl)
	ret <8 x i64> %res			ret <8 x i64> %res
	}			}

	declare <8 x i64> @llvm.vp.fshl.v8i64(<8 x i64>, <8 x i64>, <8 x i64>, <8 x i1>, i32)			declare <8 x i64> @llvm.vp.fshl.v8i64(<8 x i64>, <8 x i64>, <8 x i64>, <8 x i1>, i32)
	define <8 x i64> @fshl_v8i64(<8 x i64> %a, <8 x i64> %b, <8 x i64> %c, <8 x i1> %m, i32 zeroext %evl) {			define <8 x i64> @fshl_v8i64(<8 x i64> %a, <8 x i64> %b, <8 x i64> %c, <8 x i1> %m, i32 zeroext %evl) {
	; RV32-LABEL: fshl_v8i64:			; CHECK-LABEL: fshl_v8i64:
	; RV32: # %bb.0:			; CHECK: # %bb.0:
	; RV32-NEXT: li a1, 63			; CHECK-NEXT: li a1, 63
	; RV32-NEXT: vsetvli zero, a0, e64, m4, ta, ma			; CHECK-NEXT: vsetvli zero, a0, e64, m4, ta, ma
	; RV32-NEXT: vand.vx v20, v16, a1, v0.t			; CHECK-NEXT: vand.vx v20, v16, a1, v0.t
	; RV32-NEXT: vsll.vv v8, v8, v20, v0.t			; CHECK-NEXT: vsll.vv v8, v8, v20, v0.t
	; RV32-NEXT: vsetivli zero, 16, e32, m4, ta, ma			; CHECK-NEXT: vnot.v v16, v16, v0.t
	; RV32-NEXT: vmv.v.i v20, -1			; CHECK-NEXT: vand.vx v16, v16, a1, v0.t
	; RV32-NEXT: vsetvli zero, a0, e64, m4, ta, ma			; CHECK-NEXT: vsrl.vi v12, v12, 1, v0.t
	; RV32-NEXT: vxor.vv v16, v16, v20, v0.t			; CHECK-NEXT: vsrl.vv v12, v12, v16, v0.t
	; RV32-NEXT: vand.vx v16, v16, a1, v0.t			; CHECK-NEXT: vor.vv v8, v8, v12, v0.t
	; RV32-NEXT: vsrl.vi v12, v12, 1, v0.t			; CHECK-NEXT: ret
	; RV32-NEXT: vsrl.vv v12, v12, v16, v0.t
	; RV32-NEXT: vor.vv v8, v8, v12, v0.t
	; RV32-NEXT: ret
	;
	; RV64-LABEL: fshl_v8i64:
	; RV64: # %bb.0:
	; RV64-NEXT: li a1, 63
	; RV64-NEXT: vsetvli zero, a0, e64, m4, ta, ma
	; RV64-NEXT: vand.vx v20, v16, a1, v0.t
	; RV64-NEXT: vsll.vv v8, v8, v20, v0.t
	; RV64-NEXT: vnot.v v16, v16, v0.t
	; RV64-NEXT: vand.vx v16, v16, a1, v0.t
	; RV64-NEXT: vsrl.vi v12, v12, 1, v0.t
	; RV64-NEXT: vsrl.vv v12, v12, v16, v0.t
	; RV64-NEXT: vor.vv v8, v8, v12, v0.t
	; RV64-NEXT: ret
	%res = call <8 x i64> @llvm.vp.fshl.v8i64(<8 x i64> %a, <8 x i64> %b, <8 x i64> %c, <8 x i1> %m, i32 %evl)			%res = call <8 x i64> @llvm.vp.fshl.v8i64(<8 x i64> %a, <8 x i64> %b, <8 x i64> %c, <8 x i1> %m, i32 %evl)
	ret <8 x i64> %res			ret <8 x i64> %res
	}			}

	declare <16 x i64> @llvm.vp.fshr.v16i64(<16 x i64>, <16 x i64>, <16 x i64>, <16 x i1>, i32)			declare <16 x i64> @llvm.vp.fshr.v16i64(<16 x i64>, <16 x i64>, <16 x i64>, <16 x i1>, i32)
	define <16 x i64> @fshr_v16i64(<16 x i64> %a, <16 x i64> %b, <16 x i64> %c, <16 x i1> %m, i32 zeroext %evl) {			define <16 x i64> @fshr_v16i64(<16 x i64> %a, <16 x i64> %b, <16 x i64> %c, <16 x i1> %m, i32 zeroext %evl) {
	; RV32-LABEL: fshr_v16i64:			; CHECK-LABEL: fshr_v16i64:
	; RV32: # %bb.0:			; CHECK: # %bb.0:
	; RV32-NEXT: addi sp, sp, -16			; CHECK-NEXT: addi sp, sp, -16
	; RV32-NEXT: .cfi_def_cfa_offset 16			; CHECK-NEXT: .cfi_def_cfa_offset 16
	; RV32-NEXT: csrr a2, vlenb			; CHECK-NEXT: csrr a2, vlenb
	; RV32-NEXT: slli a2, a2, 3			; CHECK-NEXT: slli a2, a2, 3
	; RV32-NEXT: sub sp, sp, a2			; CHECK-NEXT: sub sp, sp, a2
	; RV32-NEXT: .cfi_escape 0x0f, 0x0d, 0x72, 0x00, 0x11, 0x10, 0x22, 0x11, 0x08, 0x92, 0xa2, 0x38, 0x00, 0x1e, 0x22 # sp + 16 + 8 * vlenb			; CHECK-NEXT: .cfi_escape 0x0f, 0x0d, 0x72, 0x00, 0x11, 0x10, 0x22, 0x11, 0x08, 0x92, 0xa2, 0x38, 0x00, 0x1e, 0x22 # sp + 16 + 8 * vlenb
	; RV32-NEXT: vsetivli zero, 16, e64, m8, ta, ma			; CHECK-NEXT: vsetivli zero, 16, e64, m8, ta, ma
	; RV32-NEXT: vle64.v v24, (a0)			; CHECK-NEXT: vle64.v v24, (a0)
	; RV32-NEXT: addi a0, sp, 16			; CHECK-NEXT: addi a0, sp, 16
	; RV32-NEXT: vs8r.v v8, (a0) # Unknown-size Folded Spill			; CHECK-NEXT: vs8r.v v8, (a0) # Unknown-size Folded Spill
	; RV32-NEXT: li a0, 63			; CHECK-NEXT: li a0, 63
	; RV32-NEXT: vsetvli zero, a1, e64, m8, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e64, m8, ta, ma
	; RV32-NEXT: vand.vx v8, v24, a0, v0.t			; CHECK-NEXT: vand.vx v8, v24, a0, v0.t
	; RV32-NEXT: vsrl.vv v16, v16, v8, v0.t			; CHECK-NEXT: vsrl.vv v16, v16, v8, v0.t
	; RV32-NEXT: li a2, 32			; CHECK-NEXT: vnot.v v8, v24, v0.t
	; RV32-NEXT: vsetvli zero, a2, e32, m8, ta, ma			; CHECK-NEXT: vand.vx v8, v8, a0, v0.t
	; RV32-NEXT: vmv.v.i v8, -1			; CHECK-NEXT: addi a0, sp, 16
	; RV32-NEXT: vsetvli zero, a1, e64, m8, ta, ma			; CHECK-NEXT: vl8r.v v24, (a0) # Unknown-size Folded Reload
	; RV32-NEXT: vxor.vv v8, v24, v8, v0.t			; CHECK-NEXT: vsll.vi v24, v24, 1, v0.t
	; RV32-NEXT: vand.vx v8, v8, a0, v0.t			; CHECK-NEXT: vsll.vv v8, v24, v8, v0.t
	; RV32-NEXT: addi a0, sp, 16			; CHECK-NEXT: vor.vv v8, v8, v16, v0.t
	; RV32-NEXT: vl8r.v v24, (a0) # Unknown-size Folded Reload			; CHECK-NEXT: csrr a0, vlenb
	; RV32-NEXT: vsll.vi v24, v24, 1, v0.t			; CHECK-NEXT: slli a0, a0, 3
	; RV32-NEXT: vsll.vv v8, v24, v8, v0.t			; CHECK-NEXT: add sp, sp, a0
	; RV32-NEXT: vor.vv v8, v8, v16, v0.t			; CHECK-NEXT: addi sp, sp, 16
	; RV32-NEXT: csrr a0, vlenb			; CHECK-NEXT: ret
	; RV32-NEXT: slli a0, a0, 3
	; RV32-NEXT: add sp, sp, a0
	; RV32-NEXT: addi sp, sp, 16
	; RV32-NEXT: ret
	;
	; RV64-LABEL: fshr_v16i64:
	; RV64: # %bb.0:
	; RV64-NEXT: addi sp, sp, -16
	; RV64-NEXT: .cfi_def_cfa_offset 16
	; RV64-NEXT: csrr a2, vlenb
	; RV64-NEXT: slli a2, a2, 3
	; RV64-NEXT: sub sp, sp, a2
	; RV64-NEXT: .cfi_escape 0x0f, 0x0d, 0x72, 0x00, 0x11, 0x10, 0x22, 0x11, 0x08, 0x92, 0xa2, 0x38, 0x00, 0x1e, 0x22 # sp + 16 + 8 * vlenb
	; RV64-NEXT: vsetivli zero, 16, e64, m8, ta, ma
	; RV64-NEXT: vle64.v v24, (a0)
	; RV64-NEXT: addi a0, sp, 16
	; RV64-NEXT: vs8r.v v8, (a0) # Unknown-size Folded Spill
	; RV64-NEXT: li a0, 63
	; RV64-NEXT: vsetvli zero, a1, e64, m8, ta, ma
	; RV64-NEXT: vand.vx v8, v24, a0, v0.t
	; RV64-NEXT: vsrl.vv v16, v16, v8, v0.t
	; RV64-NEXT: vnot.v v8, v24, v0.t
	; RV64-NEXT: vand.vx v8, v8, a0, v0.t
	; RV64-NEXT: addi a0, sp, 16
	; RV64-NEXT: vl8r.v v24, (a0) # Unknown-size Folded Reload
	; RV64-NEXT: vsll.vi v24, v24, 1, v0.t
	; RV64-NEXT: vsll.vv v8, v24, v8, v0.t
	; RV64-NEXT: vor.vv v8, v8, v16, v0.t
	; RV64-NEXT: csrr a0, vlenb
	; RV64-NEXT: slli a0, a0, 3
	; RV64-NEXT: add sp, sp, a0
	; RV64-NEXT: addi sp, sp, 16
	; RV64-NEXT: ret
	%res = call <16 x i64> @llvm.vp.fshr.v16i64(<16 x i64> %a, <16 x i64> %b, <16 x i64> %c, <16 x i1> %m, i32 %evl)			%res = call <16 x i64> @llvm.vp.fshr.v16i64(<16 x i64> %a, <16 x i64> %b, <16 x i64> %c, <16 x i1> %m, i32 %evl)
	ret <16 x i64> %res			ret <16 x i64> %res
	}			}

	declare <16 x i64> @llvm.vp.fshl.v16i64(<16 x i64>, <16 x i64>, <16 x i64>, <16 x i1>, i32)			declare <16 x i64> @llvm.vp.fshl.v16i64(<16 x i64>, <16 x i64>, <16 x i64>, <16 x i1>, i32)
	define <16 x i64> @fshl_v16i64(<16 x i64> %a, <16 x i64> %b, <16 x i64> %c, <16 x i1> %m, i32 zeroext %evl) {			define <16 x i64> @fshl_v16i64(<16 x i64> %a, <16 x i64> %b, <16 x i64> %c, <16 x i1> %m, i32 zeroext %evl) {
	; RV32-LABEL: fshl_v16i64:			; CHECK-LABEL: fshl_v16i64:
	; RV32: # %bb.0:			; CHECK: # %bb.0:
	; RV32-NEXT: addi sp, sp, -16			; CHECK-NEXT: addi sp, sp, -16
	; RV32-NEXT: .cfi_def_cfa_offset 16			; CHECK-NEXT: .cfi_def_cfa_offset 16
	; RV32-NEXT: csrr a2, vlenb			; CHECK-NEXT: csrr a2, vlenb
	; RV32-NEXT: slli a2, a2, 3			; CHECK-NEXT: slli a2, a2, 3
	; RV32-NEXT: sub sp, sp, a2			; CHECK-NEXT: sub sp, sp, a2
	; RV32-NEXT: .cfi_escape 0x0f, 0x0d, 0x72, 0x00, 0x11, 0x10, 0x22, 0x11, 0x08, 0x92, 0xa2, 0x38, 0x00, 0x1e, 0x22 # sp + 16 + 8 * vlenb			; CHECK-NEXT: .cfi_escape 0x0f, 0x0d, 0x72, 0x00, 0x11, 0x10, 0x22, 0x11, 0x08, 0x92, 0xa2, 0x38, 0x00, 0x1e, 0x22 # sp + 16 + 8 * vlenb
	; RV32-NEXT: vsetivli zero, 16, e64, m8, ta, ma			; CHECK-NEXT: vsetivli zero, 16, e64, m8, ta, ma
	; RV32-NEXT: vle64.v v24, (a0)			; CHECK-NEXT: vle64.v v24, (a0)
	; RV32-NEXT: addi a0, sp, 16			; CHECK-NEXT: addi a0, sp, 16
	; RV32-NEXT: vs8r.v v16, (a0) # Unknown-size Folded Spill			; CHECK-NEXT: vs8r.v v16, (a0) # Unknown-size Folded Spill
	; RV32-NEXT: vmv8r.v v16, v8			; CHECK-NEXT: vmv8r.v v16, v8
	; RV32-NEXT: li a0, 63			; CHECK-NEXT: li a0, 63
	; RV32-NEXT: vsetvli zero, a1, e64, m8, ta, ma			; CHECK-NEXT: vsetvli zero, a1, e64, m8, ta, ma
	; RV32-NEXT: vand.vx v8, v24, a0, v0.t			; CHECK-NEXT: vand.vx v8, v24, a0, v0.t
	; RV32-NEXT: vsll.vv v8, v16, v8, v0.t			; CHECK-NEXT: vsll.vv v8, v16, v8, v0.t
	; RV32-NEXT: li a2, 32			; CHECK-NEXT: vnot.v v16, v24, v0.t
	; RV32-NEXT: vsetvli zero, a2, e32, m8, ta, ma			; CHECK-NEXT: vand.vx v16, v16, a0, v0.t
	; RV32-NEXT: vmv.v.i v16, -1			; CHECK-NEXT: addi a0, sp, 16
	; RV32-NEXT: vsetvli zero, a1, e64, m8, ta, ma			; CHECK-NEXT: vl8r.v v24, (a0) # Unknown-size Folded Reload
	; RV32-NEXT: vxor.vv v16, v24, v16, v0.t			; CHECK-NEXT: vsrl.vi v24, v24, 1, v0.t
	; RV32-NEXT: vand.vx v16, v16, a0, v0.t			; CHECK-NEXT: vsrl.vv v16, v24, v16, v0.t
	; RV32-NEXT: addi a0, sp, 16			; CHECK-NEXT: vor.vv v8, v8, v16, v0.t
	; RV32-NEXT: vl8r.v v24, (a0) # Unknown-size Folded Reload			; CHECK-NEXT: csrr a0, vlenb
	; RV32-NEXT: vsrl.vi v24, v24, 1, v0.t			; CHECK-NEXT: slli a0, a0, 3
	; RV32-NEXT: vsrl.vv v16, v24, v16, v0.t			; CHECK-NEXT: add sp, sp, a0
	; RV32-NEXT: vor.vv v8, v8, v16, v0.t			; CHECK-NEXT: addi sp, sp, 16
	; RV32-NEXT: csrr a0, vlenb			; CHECK-NEXT: ret
	; RV32-NEXT: slli a0, a0, 3
	; RV32-NEXT: add sp, sp, a0
	; RV32-NEXT: addi sp, sp, 16
	; RV32-NEXT: ret
	;
	; RV64-LABEL: fshl_v16i64:
	; RV64: # %bb.0:
	; RV64-NEXT: addi sp, sp, -16
	; RV64-NEXT: .cfi_def_cfa_offset 16
	; RV64-NEXT: csrr a2, vlenb
	; RV64-NEXT: slli a2, a2, 3
	; RV64-NEXT: sub sp, sp, a2
	; RV64-NEXT: .cfi_escape 0x0f, 0x0d, 0x72, 0x00, 0x11, 0x10, 0x22, 0x11, 0x08, 0x92, 0xa2, 0x38, 0x00, 0x1e, 0x22 # sp + 16 + 8 * vlenb
	; RV64-NEXT: vsetivli zero, 16, e64, m8, ta, ma
	; RV64-NEXT: vle64.v v24, (a0)
	; RV64-NEXT: addi a0, sp, 16
	; RV64-NEXT: vs8r.v v16, (a0) # Unknown-size Folded Spill
	; RV64-NEXT: vmv8r.v v16, v8
	; RV64-NEXT: li a0, 63
	; RV64-NEXT: vsetvli zero, a1, e64, m8, ta, ma
	; RV64-NEXT: vand.vx v8, v24, a0, v0.t
	; RV64-NEXT: vsll.vv v8, v16, v8, v0.t
	; RV64-NEXT: vnot.v v16, v24, v0.t
	; RV64-NEXT: vand.vx v16, v16, a0, v0.t
	; RV64-NEXT: addi a0, sp, 16
	; RV64-NEXT: vl8r.v v24, (a0) # Unknown-size Folded Reload
	; RV64-NEXT: vsrl.vi v24, v24, 1, v0.t
	; RV64-NEXT: vsrl.vv v16, v24, v16, v0.t
	; RV64-NEXT: vor.vv v8, v8, v16, v0.t
	; RV64-NEXT: csrr a0, vlenb
	; RV64-NEXT: slli a0, a0, 3
	; RV64-NEXT: add sp, sp, a0
	; RV64-NEXT: addi sp, sp, 16
	; RV64-NEXT: ret
	%res = call <16 x i64> @llvm.vp.fshl.v16i64(<16 x i64> %a, <16 x i64> %b, <16 x i64> %c, <16 x i1> %m, i32 %evl)			%res = call <16 x i64> @llvm.vp.fshl.v16i64(<16 x i64> %a, <16 x i64> %b, <16 x i64> %c, <16 x i1> %m, i32 %evl)
	ret <16 x i64> %res			ret <16 x i64> %res
	}			}
				;; NOTE: These prefixes are unused and the list is autogenerated. Do not add tests below this line:
				; RV32: {{.*}}
				; RV64: {{.*}}

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-int-splat.ll

	Show First 20 Lines • Show All 753 Lines • ▼ Show 20 Lines
	; LMULMAX2-LABEL: splat_allones_with_use_v4i64:			; LMULMAX2-LABEL: splat_allones_with_use_v4i64:
	; LMULMAX2: # %bb.0:			; LMULMAX2: # %bb.0:
	; LMULMAX2-NEXT: vsetivli zero, 4, e64, m2, ta, ma			; LMULMAX2-NEXT: vsetivli zero, 4, e64, m2, ta, ma
	; LMULMAX2-NEXT: vle64.v v8, (a0)			; LMULMAX2-NEXT: vle64.v v8, (a0)
	; LMULMAX2-NEXT: vadd.vi v8, v8, -1			; LMULMAX2-NEXT: vadd.vi v8, v8, -1
	; LMULMAX2-NEXT: vse64.v v8, (a0)			; LMULMAX2-NEXT: vse64.v v8, (a0)
	; LMULMAX2-NEXT: ret			; LMULMAX2-NEXT: ret
	;			;
	; LMULMAX1-RV32-LABEL: splat_allones_with_use_v4i64:			; LMULMAX1-LABEL: splat_allones_with_use_v4i64:
	; LMULMAX1-RV32: # %bb.0:			; LMULMAX1: # %bb.0:
	; LMULMAX1-RV32-NEXT: vsetivli zero, 2, e64, m1, ta, ma			; LMULMAX1-NEXT: vsetivli zero, 2, e64, m1, ta, ma
	; LMULMAX1-RV32-NEXT: vle64.v v8, (a0)			; LMULMAX1-NEXT: addi a1, a0, 16
	; LMULMAX1-RV32-NEXT: addi a1, a0, 16			; LMULMAX1-NEXT: vle64.v v8, (a1)
	; LMULMAX1-RV32-NEXT: vle64.v v9, (a1)			; LMULMAX1-NEXT: vle64.v v9, (a0)
	; LMULMAX1-RV32-NEXT: vsetivli zero, 4, e32, m1, ta, ma			; LMULMAX1-NEXT: vadd.vi v8, v8, -1
	; LMULMAX1-RV32-NEXT: vmv.v.i v10, -1			; LMULMAX1-NEXT: vadd.vi v9, v9, -1
	; LMULMAX1-RV32-NEXT: vsetivli zero, 2, e64, m1, ta, ma			; LMULMAX1-NEXT: vse64.v v9, (a0)
	; LMULMAX1-RV32-NEXT: vadd.vv v9, v9, v10			; LMULMAX1-NEXT: vse64.v v8, (a1)
	; LMULMAX1-RV32-NEXT: vadd.vv v8, v8, v10			; LMULMAX1-NEXT: ret
	; LMULMAX1-RV32-NEXT: vse64.v v8, (a0)
	; LMULMAX1-RV32-NEXT: vse64.v v9, (a1)
	; LMULMAX1-RV32-NEXT: ret
	;
	; LMULMAX1-RV64-LABEL: splat_allones_with_use_v4i64:
	; LMULMAX1-RV64: # %bb.0:
	; LMULMAX1-RV64-NEXT: vsetivli zero, 2, e64, m1, ta, ma
	; LMULMAX1-RV64-NEXT: addi a1, a0, 16
	; LMULMAX1-RV64-NEXT: vle64.v v8, (a1)
	; LMULMAX1-RV64-NEXT: vle64.v v9, (a0)
	; LMULMAX1-RV64-NEXT: vadd.vi v8, v8, -1
	; LMULMAX1-RV64-NEXT: vadd.vi v9, v9, -1
	; LMULMAX1-RV64-NEXT: vse64.v v9, (a0)
	; LMULMAX1-RV64-NEXT: vse64.v v8, (a1)
	; LMULMAX1-RV64-NEXT: ret
	%a = load <4 x i64>, ptr %x			%a = load <4 x i64>, ptr %x
	%b = add <4 x i64> %a, <i64 -1, i64 -1, i64 -1, i64 -1>			%b = add <4 x i64> %a, <i64 -1, i64 -1, i64 -1, i64 -1>
	store <4 x i64> %b, ptr %x			store <4 x i64> %b, ptr %x
	ret void			ret void
	}			}

	; This test used to crash at LMUL=8 when inserting a v16i64 subvector into			; This test used to crash at LMUL=8 when inserting a v16i64 subvector into
	; nxv8i64 at index 0: the v16i64 type was used to get the LMUL, the size of			; nxv8i64 at index 0: the v16i64 type was used to get the LMUL, the size of
	▲ Show 20 Lines • Show All 177 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-masked-load-int.ll

Show First 20 Lines • Show All 391 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%mask = icmp eq <32 x i32> %m, zeroinitializer		%mask = icmp eq <32 x i32> %m, zeroinitializer
%load = call <32 x i32> @llvm.masked.load.v32i32(ptr %a, i32 8, <32 x i1> %mask, <32 x i32> undef)		%load = call <32 x i32> @llvm.masked.load.v32i32(ptr %a, i32 8, <32 x i1> %mask, <32 x i32> undef)
store <32 x i32> %load, ptr %res_ptr		store <32 x i32> %load, ptr %res_ptr
ret void		ret void
}		}
declare <32 x i32> @llvm.masked.load.v32i32(ptr, i32, <32 x i1>, <32 x i32>)		declare <32 x i32> @llvm.masked.load.v32i32(ptr, i32, <32 x i1>, <32 x i32>)

define void @masked_load_v32i64(ptr %a, ptr %m_ptr, ptr %res_ptr) nounwind {		define void @masked_load_v32i64(ptr %a, ptr %m_ptr, ptr %res_ptr) nounwind {
; RV32-LABEL: masked_load_v32i64:		; CHECK-LABEL: masked_load_v32i64:
; RV32: # %bb.0:		; CHECK: # %bb.0:
; RV32-NEXT: addi a3, a1, 128		; CHECK-NEXT: addi a3, a1, 128
; RV32-NEXT: vsetivli zero, 16, e64, m8, ta, ma		; CHECK-NEXT: vsetivli zero, 16, e64, m8, ta, ma
; RV32-NEXT: vle64.v v16, (a3)		; CHECK-NEXT: vle64.v v16, (a1)
; RV32-NEXT: vle64.v v0, (a1)		; CHECK-NEXT: vle64.v v24, (a3)
; RV32-NEXT: li a1, 32		; CHECK-NEXT: vmseq.vi v8, v16, 0
; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma		; CHECK-NEXT: vmseq.vi v0, v24, 0
; RV32-NEXT: vmv.v.i v24, 0		; CHECK-NEXT: addi a1, a0, 128
; RV32-NEXT: vsetivli zero, 16, e64, m8, ta, ma		; CHECK-NEXT: vle64.v v16, (a1), v0.t
; RV32-NEXT: vmseq.vv v8, v0, v24		; CHECK-NEXT: vmv1r.v v0, v8
; RV32-NEXT: vmseq.vv v0, v16, v24		; CHECK-NEXT: vle64.v v8, (a0), v0.t
; RV32-NEXT: addi a1, a0, 128		; CHECK-NEXT: vse64.v v8, (a2)
; RV32-NEXT: vle64.v v16, (a1), v0.t		; CHECK-NEXT: addi a0, a2, 128
; RV32-NEXT: vmv1r.v v0, v8		; CHECK-NEXT: vse64.v v16, (a0)
; RV32-NEXT: vle64.v v8, (a0), v0.t		; CHECK-NEXT: ret
; RV32-NEXT: vse64.v v8, (a2)
; RV32-NEXT: addi a0, a2, 128
; RV32-NEXT: vse64.v v16, (a0)
; RV32-NEXT: ret
;
; RV64-LABEL: masked_load_v32i64:
; RV64: # %bb.0:
; RV64-NEXT: addi a3, a1, 128
; RV64-NEXT: vsetivli zero, 16, e64, m8, ta, ma
; RV64-NEXT: vle64.v v16, (a1)
; RV64-NEXT: vle64.v v24, (a3)
; RV64-NEXT: vmseq.vi v8, v16, 0
; RV64-NEXT: vmseq.vi v0, v24, 0
; RV64-NEXT: addi a1, a0, 128
; RV64-NEXT: vle64.v v16, (a1), v0.t
; RV64-NEXT: vmv1r.v v0, v8
; RV64-NEXT: vle64.v v8, (a0), v0.t
; RV64-NEXT: vse64.v v8, (a2)
; RV64-NEXT: addi a0, a2, 128
; RV64-NEXT: vse64.v v16, (a0)
; RV64-NEXT: ret
%m = load <32 x i64>, ptr %m_ptr		%m = load <32 x i64>, ptr %m_ptr
%mask = icmp eq <32 x i64> %m, zeroinitializer		%mask = icmp eq <32 x i64> %m, zeroinitializer
%load = call <32 x i64> @llvm.masked.load.v32i64(ptr %a, i32 8, <32 x i1> %mask, <32 x i64> undef)		%load = call <32 x i64> @llvm.masked.load.v32i64(ptr %a, i32 8, <32 x i1> %mask, <32 x i64> undef)
store <32 x i64> %load, ptr %res_ptr		store <32 x i64> %load, ptr %res_ptr
ret void		ret void
}		}
declare <32 x i64> @llvm.masked.load.v32i64(ptr, i32, <32 x i1>, <32 x i64>)		declare <32 x i64> @llvm.masked.load.v32i64(ptr, i32, <32 x i1>, <32 x i64>)

▲ Show 20 Lines • Show All 97 Lines • ▼ Show 20 Lines
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%m = load <256 x i8>, ptr %m_ptr		%m = load <256 x i8>, ptr %m_ptr
%mask = icmp eq <256 x i8> %m, zeroinitializer		%mask = icmp eq <256 x i8> %m, zeroinitializer
%load = call <256 x i8> @llvm.masked.load.v256i8(ptr %a, i32 8, <256 x i1> %mask, <256 x i8> undef)		%load = call <256 x i8> @llvm.masked.load.v256i8(ptr %a, i32 8, <256 x i1> %mask, <256 x i8> undef)
store <256 x i8> %load, ptr %res_ptr		store <256 x i8> %load, ptr %res_ptr
ret void		ret void
}		}
declare <256 x i8> @llvm.masked.load.v256i8(ptr, i32, <256 x i1>, <256 x i8>)		declare <256 x i8> @llvm.masked.load.v256i8(ptr, i32, <256 x i1>, <256 x i8>)
		;; NOTE: These prefixes are unused and the list is autogenerated. Do not add tests below this line:
		; RV32: {{.*}}
		; RV64: {{.*}}

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-masked-store-int.ll

Show First 20 Lines • Show All 391 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%mask = icmp eq <32 x i32> %m, zeroinitializer		%mask = icmp eq <32 x i32> %m, zeroinitializer
%val = load <32 x i32>, ptr %val_ptr		%val = load <32 x i32>, ptr %val_ptr
call void @llvm.masked.store.v32i32.p0(<32 x i32> %val, ptr %a, i32 8, <32 x i1> %mask)		call void @llvm.masked.store.v32i32.p0(<32 x i32> %val, ptr %a, i32 8, <32 x i1> %mask)
ret void		ret void
}		}
declare void @llvm.masked.store.v32i32.p0(<32 x i32>, ptr, i32, <32 x i1>)		declare void @llvm.masked.store.v32i32.p0(<32 x i32>, ptr, i32, <32 x i1>)

define void @masked_store_v32i64(ptr %val_ptr, ptr %a, ptr %m_ptr) nounwind {		define void @masked_store_v32i64(ptr %val_ptr, ptr %a, ptr %m_ptr) nounwind {
; RV32-LABEL: masked_store_v32i64:		; CHECK-LABEL: masked_store_v32i64:
; RV32: # %bb.0:		; CHECK: # %bb.0:
; RV32-NEXT: addi sp, sp, -16		; CHECK-NEXT: addi sp, sp, -16
; RV32-NEXT: csrr a3, vlenb		; CHECK-NEXT: csrr a3, vlenb
; RV32-NEXT: slli a3, a3, 4		; CHECK-NEXT: slli a3, a3, 4
; RV32-NEXT: sub sp, sp, a3		; CHECK-NEXT: sub sp, sp, a3
; RV32-NEXT: addi a3, a2, 128		; CHECK-NEXT: vsetivli zero, 16, e64, m8, ta, ma
; RV32-NEXT: vsetivli zero, 16, e64, m8, ta, ma		; CHECK-NEXT: vle64.v v8, (a2)
; RV32-NEXT: vle64.v v8, (a3)		; CHECK-NEXT: addi a2, a2, 128
; RV32-NEXT: csrr a3, vlenb		; CHECK-NEXT: vle64.v v16, (a2)
; RV32-NEXT: slli a3, a3, 3		; CHECK-NEXT: csrr a2, vlenb
; RV32-NEXT: add a3, sp, a3		; CHECK-NEXT: slli a2, a2, 3
; RV32-NEXT: addi a3, a3, 16		; CHECK-NEXT: add a2, sp, a2
; RV32-NEXT: vs8r.v v8, (a3) # Unknown-size Folded Spill		; CHECK-NEXT: addi a2, a2, 16
; RV32-NEXT: vle64.v v24, (a2)		; CHECK-NEXT: vs8r.v v16, (a2) # Unknown-size Folded Spill
; RV32-NEXT: li a2, 32		; CHECK-NEXT: vmseq.vi v0, v8, 0
; RV32-NEXT: vsetvli zero, a2, e32, m8, ta, ma		; CHECK-NEXT: vle64.v v24, (a0)
; RV32-NEXT: vmv.v.i v8, 0		; CHECK-NEXT: addi a0, a0, 128
; RV32-NEXT: vsetivli zero, 16, e64, m8, ta, ma		; CHECK-NEXT: vle64.v v8, (a0)
; RV32-NEXT: vmseq.vv v1, v24, v8		; CHECK-NEXT: addi a0, sp, 16
; RV32-NEXT: addi a2, a0, 128		; CHECK-NEXT: vs8r.v v8, (a0) # Unknown-size Folded Spill
; RV32-NEXT: vle64.v v24, (a2)		; CHECK-NEXT: csrr a0, vlenb
; RV32-NEXT: vle64.v v16, (a0)		; CHECK-NEXT: slli a0, a0, 3
; RV32-NEXT: addi a0, sp, 16		; CHECK-NEXT: add a0, sp, a0
; RV32-NEXT: vs8r.v v16, (a0) # Unknown-size Folded Spill		; CHECK-NEXT: addi a0, a0, 16
; RV32-NEXT: csrr a0, vlenb		; CHECK-NEXT: vl8r.v v16, (a0) # Unknown-size Folded Reload
; RV32-NEXT: slli a0, a0, 3		; CHECK-NEXT: vmseq.vi v8, v16, 0
; RV32-NEXT: add a0, sp, a0		; CHECK-NEXT: vse64.v v24, (a1), v0.t
; RV32-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a1, 128
; RV32-NEXT: vl8r.v v16, (a0) # Unknown-size Folded Reload		; CHECK-NEXT: vmv1r.v v0, v8
; RV32-NEXT: vmseq.vv v0, v16, v8		; CHECK-NEXT: addi a1, sp, 16
; RV32-NEXT: addi a0, a1, 128		; CHECK-NEXT: vl8r.v v8, (a1) # Unknown-size Folded Reload
; RV32-NEXT: vse64.v v24, (a0), v0.t		; CHECK-NEXT: vse64.v v8, (a0), v0.t
; RV32-NEXT: vmv1r.v v0, v1		; CHECK-NEXT: csrr a0, vlenb
; RV32-NEXT: addi a0, sp, 16		; CHECK-NEXT: slli a0, a0, 4
; RV32-NEXT: vl8r.v v8, (a0) # Unknown-size Folded Reload		; CHECK-NEXT: add sp, sp, a0
; RV32-NEXT: vse64.v v8, (a1), v0.t		; CHECK-NEXT: addi sp, sp, 16
; RV32-NEXT: csrr a0, vlenb		; CHECK-NEXT: ret
; RV32-NEXT: slli a0, a0, 4
; RV32-NEXT: add sp, sp, a0
; RV32-NEXT: addi sp, sp, 16
; RV32-NEXT: ret
;
; RV64-LABEL: masked_store_v32i64:
; RV64: # %bb.0:
; RV64-NEXT: addi sp, sp, -16
; RV64-NEXT: csrr a3, vlenb
; RV64-NEXT: slli a3, a3, 4
; RV64-NEXT: sub sp, sp, a3
; RV64-NEXT: vsetivli zero, 16, e64, m8, ta, ma
; RV64-NEXT: vle64.v v8, (a2)
; RV64-NEXT: addi a2, a2, 128
; RV64-NEXT: vle64.v v16, (a2)
; RV64-NEXT: csrr a2, vlenb
; RV64-NEXT: slli a2, a2, 3
; RV64-NEXT: add a2, sp, a2
; RV64-NEXT: addi a2, a2, 16
; RV64-NEXT: vs8r.v v16, (a2) # Unknown-size Folded Spill
; RV64-NEXT: vmseq.vi v0, v8, 0
; RV64-NEXT: vle64.v v24, (a0)
; RV64-NEXT: addi a0, a0, 128
; RV64-NEXT: vle64.v v8, (a0)
; RV64-NEXT: addi a0, sp, 16
; RV64-NEXT: vs8r.v v8, (a0) # Unknown-size Folded Spill
; RV64-NEXT: csrr a0, vlenb
; RV64-NEXT: slli a0, a0, 3
; RV64-NEXT: add a0, sp, a0
; RV64-NEXT: addi a0, a0, 16
; RV64-NEXT: vl8r.v v16, (a0) # Unknown-size Folded Reload
; RV64-NEXT: vmseq.vi v8, v16, 0
; RV64-NEXT: vse64.v v24, (a1), v0.t
; RV64-NEXT: addi a0, a1, 128
; RV64-NEXT: vmv1r.v v0, v8
; RV64-NEXT: addi a1, sp, 16
; RV64-NEXT: vl8r.v v8, (a1) # Unknown-size Folded Reload
; RV64-NEXT: vse64.v v8, (a0), v0.t
; RV64-NEXT: csrr a0, vlenb
; RV64-NEXT: slli a0, a0, 4
; RV64-NEXT: add sp, sp, a0
; RV64-NEXT: addi sp, sp, 16
; RV64-NEXT: ret
%m = load <32 x i64>, ptr %m_ptr		%m = load <32 x i64>, ptr %m_ptr
%mask = icmp eq <32 x i64> %m, zeroinitializer		%mask = icmp eq <32 x i64> %m, zeroinitializer
%val = load <32 x i64>, ptr %val_ptr		%val = load <32 x i64>, ptr %val_ptr
call void @llvm.masked.store.v32i64.p0(<32 x i64> %val, ptr %a, i32 8, <32 x i1> %mask)		call void @llvm.masked.store.v32i64.p0(<32 x i64> %val, ptr %a, i32 8, <32 x i1> %mask)
ret void		ret void
}		}
declare void @llvm.masked.store.v32i64.p0(<32 x i64>, ptr, i32, <32 x i1>)		declare void @llvm.masked.store.v32i64.p0(<32 x i64>, ptr, i32, <32 x i1>)

▲ Show 20 Lines • Show All 189 Lines • ▼ Show 20 Lines
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%m = load <256 x i8>, ptr %m_ptr		%m = load <256 x i8>, ptr %m_ptr
%mask = icmp eq <256 x i8> %m, zeroinitializer		%mask = icmp eq <256 x i8> %m, zeroinitializer
%val = load <256 x i8>, ptr %val_ptr		%val = load <256 x i8>, ptr %val_ptr
call void @llvm.masked.store.v256i8.p0(<256 x i8> %val, ptr %a, i32 8, <256 x i1> %mask)		call void @llvm.masked.store.v256i8.p0(<256 x i8> %val, ptr %a, i32 8, <256 x i1> %mask)
ret void		ret void
}		}
declare void @llvm.masked.store.v256i8.p0(<256 x i8>, ptr, i32, <256 x i1>)		declare void @llvm.masked.store.v256i8.p0(<256 x i8>, ptr, i32, <256 x i1>)
		;; NOTE: These prefixes are unused and the list is autogenerated. Do not add tests below this line:
		; RV32: {{.*}}
		; RV64: {{.*}}

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-vadd-vp.ll

Show First 20 Lines • Show All 1,520 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
ret <16 x i64> %v		ret <16 x i64> %v
}		}

; Test that split-legalization works as expected.		; Test that split-legalization works as expected.

declare <32 x i64> @llvm.vp.add.v32i64(<32 x i64>, <32 x i64>, <32 x i1>, i32)		declare <32 x i64> @llvm.vp.add.v32i64(<32 x i64>, <32 x i64>, <32 x i1>, i32)

define <32 x i64> @vadd_vx_v32i64(<32 x i64> %va, <32 x i1> %m, i32 zeroext %evl) {		define <32 x i64> @vadd_vx_v32i64(<32 x i64> %va, <32 x i1> %m, i32 zeroext %evl) {
; RV32-LABEL: vadd_vx_v32i64:		; CHECK-LABEL: vadd_vx_v32i64:
; RV32: # %bb.0:		; CHECK: # %bb.0:
; RV32-NEXT: vsetivli zero, 2, e8, mf4, ta, ma		; CHECK-NEXT: vsetivli zero, 2, e8, mf4, ta, ma
; RV32-NEXT: vslidedown.vi v1, v0, 2		; CHECK-NEXT: li a2, 16
; RV32-NEXT: li a1, 32		; CHECK-NEXT: vslidedown.vi v24, v0, 2
; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma		; CHECK-NEXT: mv a1, a0
; RV32-NEXT: li a2, 16		; CHECK-NEXT: bltu a0, a2, .LBB108_2
; RV32-NEXT: vmv.v.i v24, -1		; CHECK-NEXT: # %bb.1:
; RV32-NEXT: mv a1, a0		; CHECK-NEXT: li a1, 16
; RV32-NEXT: bltu a0, a2, .LBB108_2		; CHECK-NEXT: .LBB108_2:
; RV32-NEXT: # %bb.1:		; CHECK-NEXT: vsetvli zero, a1, e64, m8, ta, ma
; RV32-NEXT: li a1, 16		; CHECK-NEXT: vadd.vi v8, v8, -1, v0.t
; RV32-NEXT: .LBB108_2:		; CHECK-NEXT: addi a1, a0, -16
; RV32-NEXT: vsetvli zero, a1, e64, m8, ta, ma		; CHECK-NEXT: sltu a0, a0, a1
; RV32-NEXT: vadd.vv v8, v8, v24, v0.t		; CHECK-NEXT: addi a0, a0, -1
; RV32-NEXT: addi a1, a0, -16		; CHECK-NEXT: and a0, a0, a1
; RV32-NEXT: sltu a0, a0, a1		; CHECK-NEXT: vsetvli zero, a0, e64, m8, ta, ma
; RV32-NEXT: addi a0, a0, -1		; CHECK-NEXT: vmv1r.v v0, v24
; RV32-NEXT: and a0, a0, a1		; CHECK-NEXT: vadd.vi v16, v16, -1, v0.t
; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma		; CHECK-NEXT: ret
; RV32-NEXT: vmv1r.v v0, v1
; RV32-NEXT: vadd.vv v16, v16, v24, v0.t
; RV32-NEXT: ret
;
; RV64-LABEL: vadd_vx_v32i64:
; RV64: # %bb.0:
; RV64-NEXT: vsetivli zero, 2, e8, mf4, ta, ma
; RV64-NEXT: li a2, 16
; RV64-NEXT: vslidedown.vi v24, v0, 2
; RV64-NEXT: mv a1, a0
; RV64-NEXT: bltu a0, a2, .LBB108_2
; RV64-NEXT: # %bb.1:
; RV64-NEXT: li a1, 16
; RV64-NEXT: .LBB108_2:
; RV64-NEXT: vsetvli zero, a1, e64, m8, ta, ma
; RV64-NEXT: vadd.vi v8, v8, -1, v0.t
; RV64-NEXT: addi a1, a0, -16
; RV64-NEXT: sltu a0, a0, a1
; RV64-NEXT: addi a0, a0, -1
; RV64-NEXT: and a0, a0, a1
; RV64-NEXT: vsetvli zero, a0, e64, m8, ta, ma
; RV64-NEXT: vmv1r.v v0, v24
; RV64-NEXT: vadd.vi v16, v16, -1, v0.t
; RV64-NEXT: ret
%elt.head = insertelement <32 x i64> poison, i64 -1, i32 0		%elt.head = insertelement <32 x i64> poison, i64 -1, i32 0
%vb = shufflevector <32 x i64> %elt.head, <32 x i64> poison, <32 x i32> zeroinitializer		%vb = shufflevector <32 x i64> %elt.head, <32 x i64> poison, <32 x i32> zeroinitializer
%v = call <32 x i64> @llvm.vp.add.v32i64(<32 x i64> %va, <32 x i64> %vb, <32 x i1> %m, i32 %evl)		%v = call <32 x i64> @llvm.vp.add.v32i64(<32 x i64> %va, <32 x i64> %vb, <32 x i1> %m, i32 %evl)
ret <32 x i64> %v		ret <32 x i64> %v
}		}

define <32 x i64> @vadd_vi_v32i64_unmasked(<32 x i64> %va, i32 zeroext %evl) {		define <32 x i64> @vadd_vi_v32i64_unmasked(<32 x i64> %va, i32 zeroext %evl) {
; RV32-LABEL: vadd_vi_v32i64_unmasked:		; CHECK-LABEL: vadd_vi_v32i64_unmasked:
; RV32: # %bb.0:		; CHECK: # %bb.0:
; RV32-NEXT: li a1, 32		; CHECK-NEXT: li a2, 16
; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma		; CHECK-NEXT: mv a1, a0
; RV32-NEXT: li a2, 16		; CHECK-NEXT: bltu a0, a2, .LBB109_2
; RV32-NEXT: vmv.v.i v24, -1		; CHECK-NEXT: # %bb.1:
; RV32-NEXT: mv a1, a0		; CHECK-NEXT: li a1, 16
; RV32-NEXT: bltu a0, a2, .LBB109_2		; CHECK-NEXT: .LBB109_2:
; RV32-NEXT: # %bb.1:		; CHECK-NEXT: vsetvli zero, a1, e64, m8, ta, ma
; RV32-NEXT: li a1, 16		; CHECK-NEXT: vadd.vi v8, v8, -1
; RV32-NEXT: .LBB109_2:		; CHECK-NEXT: addi a1, a0, -16
; RV32-NEXT: vsetvli zero, a1, e64, m8, ta, ma		; CHECK-NEXT: sltu a0, a0, a1
; RV32-NEXT: vadd.vv v8, v8, v24		; CHECK-NEXT: addi a0, a0, -1
; RV32-NEXT: addi a1, a0, -16		; CHECK-NEXT: and a0, a0, a1
; RV32-NEXT: sltu a0, a0, a1		; CHECK-NEXT: vsetvli zero, a0, e64, m8, ta, ma
; RV32-NEXT: addi a0, a0, -1		; CHECK-NEXT: vadd.vi v16, v16, -1
; RV32-NEXT: and a0, a0, a1		; CHECK-NEXT: ret
; RV32-NEXT: vsetvli zero, a0, e64, m8, ta, ma
; RV32-NEXT: vadd.vv v16, v16, v24
; RV32-NEXT: ret
;
; RV64-LABEL: vadd_vi_v32i64_unmasked:
; RV64: # %bb.0:
; RV64-NEXT: li a2, 16
; RV64-NEXT: mv a1, a0
; RV64-NEXT: bltu a0, a2, .LBB109_2
; RV64-NEXT: # %bb.1:
; RV64-NEXT: li a1, 16
; RV64-NEXT: .LBB109_2:
; RV64-NEXT: vsetvli zero, a1, e64, m8, ta, ma
; RV64-NEXT: vadd.vi v8, v8, -1
; RV64-NEXT: addi a1, a0, -16
; RV64-NEXT: sltu a0, a0, a1
; RV64-NEXT: addi a0, a0, -1
; RV64-NEXT: and a0, a0, a1
; RV64-NEXT: vsetvli zero, a0, e64, m8, ta, ma
; RV64-NEXT: vadd.vi v16, v16, -1
; RV64-NEXT: ret
%elt.head = insertelement <32 x i64> poison, i64 -1, i32 0		%elt.head = insertelement <32 x i64> poison, i64 -1, i32 0
%vb = shufflevector <32 x i64> %elt.head, <32 x i64> poison, <32 x i32> zeroinitializer		%vb = shufflevector <32 x i64> %elt.head, <32 x i64> poison, <32 x i32> zeroinitializer
%head = insertelement <32 x i1> poison, i1 true, i32 0		%head = insertelement <32 x i1> poison, i1 true, i32 0
%m = shufflevector <32 x i1> %head, <32 x i1> poison, <32 x i32> zeroinitializer		%m = shufflevector <32 x i1> %head, <32 x i1> poison, <32 x i32> zeroinitializer
%v = call <32 x i64> @llvm.vp.add.v32i64(<32 x i64> %va, <32 x i64> %vb, <32 x i1> %m, i32 %evl)		%v = call <32 x i64> @llvm.vp.add.v32i64(<32 x i64> %va, <32 x i64> %vb, <32 x i1> %m, i32 %evl)
ret <32 x i64> %v		ret <32 x i64> %v
}		}

; FIXME: We don't match vadd.vi on RV32.		; FIXME: We don't match vadd.vi on RV32.

define <32 x i64> @vadd_vx_v32i64_evl12(<32 x i64> %va, <32 x i1> %m) {		define <32 x i64> @vadd_vx_v32i64_evl12(<32 x i64> %va, <32 x i1> %m) {
; RV32-LABEL: vadd_vx_v32i64_evl12:		; CHECK-LABEL: vadd_vx_v32i64_evl12:
; RV32: # %bb.0:		; CHECK: # %bb.0:
; RV32-NEXT: li a0, 32		; CHECK-NEXT: vsetivli zero, 12, e64, m8, ta, ma
; RV32-NEXT: vsetvli zero, a0, e32, m8, ta, ma		; CHECK-NEXT: vadd.vi v8, v8, -1, v0.t
; RV32-NEXT: vmv.v.i v16, -1		; CHECK-NEXT: ret
; RV32-NEXT: vsetivli zero, 12, e64, m8, ta, ma
; RV32-NEXT: vadd.vv v8, v8, v16, v0.t
; RV32-NEXT: ret
;
; RV64-LABEL: vadd_vx_v32i64_evl12:
; RV64: # %bb.0:
; RV64-NEXT: vsetivli zero, 12, e64, m8, ta, ma
; RV64-NEXT: vadd.vi v8, v8, -1, v0.t
; RV64-NEXT: ret
%elt.head = insertelement <32 x i64> poison, i64 -1, i32 0		%elt.head = insertelement <32 x i64> poison, i64 -1, i32 0
%vb = shufflevector <32 x i64> %elt.head, <32 x i64> poison, <32 x i32> zeroinitializer		%vb = shufflevector <32 x i64> %elt.head, <32 x i64> poison, <32 x i32> zeroinitializer
%v = call <32 x i64> @llvm.vp.add.v32i64(<32 x i64> %va, <32 x i64> %vb, <32 x i1> %m, i32 12)		%v = call <32 x i64> @llvm.vp.add.v32i64(<32 x i64> %va, <32 x i64> %vb, <32 x i1> %m, i32 12)
ret <32 x i64> %v		ret <32 x i64> %v
}		}

define <32 x i64> @vadd_vx_v32i64_evl27(<32 x i64> %va, <32 x i1> %m) {		define <32 x i64> @vadd_vx_v32i64_evl27(<32 x i64> %va, <32 x i1> %m) {
; RV32-LABEL: vadd_vx_v32i64_evl27:		; CHECK-LABEL: vadd_vx_v32i64_evl27:
; RV32: # %bb.0:		; CHECK: # %bb.0:
; RV32-NEXT: vsetivli zero, 2, e8, mf4, ta, ma		; CHECK-NEXT: vsetivli zero, 2, e8, mf4, ta, ma
; RV32-NEXT: vslidedown.vi v1, v0, 2		; CHECK-NEXT: vslidedown.vi v24, v0, 2
; RV32-NEXT: li a0, 32		; CHECK-NEXT: vsetivli zero, 16, e64, m8, ta, ma
; RV32-NEXT: vsetvli zero, a0, e32, m8, ta, ma		; CHECK-NEXT: vadd.vi v8, v8, -1, v0.t
; RV32-NEXT: vmv.v.i v24, -1		; CHECK-NEXT: vsetivli zero, 11, e64, m8, ta, ma
; RV32-NEXT: vsetivli zero, 16, e64, m8, ta, ma		; CHECK-NEXT: vmv1r.v v0, v24
; RV32-NEXT: vadd.vv v8, v8, v24, v0.t		; CHECK-NEXT: vadd.vi v16, v16, -1, v0.t
; RV32-NEXT: vsetivli zero, 11, e64, m8, ta, ma		; CHECK-NEXT: ret
; RV32-NEXT: vmv1r.v v0, v1
; RV32-NEXT: vadd.vv v16, v16, v24, v0.t
; RV32-NEXT: ret
;
; RV64-LABEL: vadd_vx_v32i64_evl27:
; RV64: # %bb.0:
; RV64-NEXT: vsetivli zero, 2, e8, mf4, ta, ma
; RV64-NEXT: vslidedown.vi v24, v0, 2
; RV64-NEXT: vsetivli zero, 16, e64, m8, ta, ma
; RV64-NEXT: vadd.vi v8, v8, -1, v0.t
; RV64-NEXT: vsetivli zero, 11, e64, m8, ta, ma
; RV64-NEXT: vmv1r.v v0, v24
; RV64-NEXT: vadd.vi v16, v16, -1, v0.t
; RV64-NEXT: ret
%elt.head = insertelement <32 x i64> poison, i64 -1, i32 0		%elt.head = insertelement <32 x i64> poison, i64 -1, i32 0
%vb = shufflevector <32 x i64> %elt.head, <32 x i64> poison, <32 x i32> zeroinitializer		%vb = shufflevector <32 x i64> %elt.head, <32 x i64> poison, <32 x i32> zeroinitializer
%v = call <32 x i64> @llvm.vp.add.v32i64(<32 x i64> %va, <32 x i64> %vb, <32 x i1> %m, i32 27)		%v = call <32 x i64> @llvm.vp.add.v32i64(<32 x i64> %va, <32 x i64> %vb, <32 x i1> %m, i32 27)
ret <32 x i64> %v		ret <32 x i64> %v
}		}

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-vrol.ll

Show First 20 Lines • Show All 873 Lines • ▼ Show 20 Lines

declare <1 x i64> @llvm.fshl.v1i64(<1 x i64>, <1 x i64>, <1 x i64>)		declare <1 x i64> @llvm.fshl.v1i64(<1 x i64>, <1 x i64>, <1 x i64>)

define <1 x i64> @vrol_vv_v1i64(<1 x i64> %a, <1 x i64> %b) {		define <1 x i64> @vrol_vv_v1i64(<1 x i64> %a, <1 x i64> %b) {
; CHECK-RV32-LABEL: vrol_vv_v1i64:		; CHECK-RV32-LABEL: vrol_vv_v1i64:
; CHECK-RV32: # %bb.0:		; CHECK-RV32: # %bb.0:
; CHECK-RV32-NEXT: vsetivli zero, 2, e32, mf2, ta, ma		; CHECK-RV32-NEXT: vsetivli zero, 2, e32, mf2, ta, ma
; CHECK-RV32-NEXT: vmv.v.i v10, 0		; CHECK-RV32-NEXT: vmv.v.i v10, 0
; CHECK-RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; CHECK-RV32-NEXT: vsub.vv v11, v10, v9
; CHECK-RV32-NEXT: li a0, 63		; CHECK-RV32-NEXT: li a0, 63
; CHECK-RV32-NEXT: vsetvli zero, zero, e32, mf2, tu, ma		; CHECK-RV32-NEXT: vsetvli zero, zero, e32, mf2, tu, ma
; CHECK-RV32-NEXT: vmv.s.x v10, a0		; CHECK-RV32-NEXT: vmv.s.x v10, a0
; CHECK-RV32-NEXT: vsetvli zero, zero, e64, m1, ta, ma		; CHECK-RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
		; CHECK-RV32-NEXT: vrsub.vi v11, v9, 0
; CHECK-RV32-NEXT: vand.vv v11, v11, v10		; CHECK-RV32-NEXT: vand.vv v11, v11, v10
; CHECK-RV32-NEXT: vsrl.vv v11, v8, v11		; CHECK-RV32-NEXT: vsrl.vv v11, v8, v11
; CHECK-RV32-NEXT: vand.vv v9, v9, v10		; CHECK-RV32-NEXT: vand.vv v9, v9, v10
; CHECK-RV32-NEXT: vsll.vv v8, v8, v9		; CHECK-RV32-NEXT: vsll.vv v8, v8, v9
; CHECK-RV32-NEXT: vor.vv v8, v8, v11		; CHECK-RV32-NEXT: vor.vv v8, v8, v11
; CHECK-RV32-NEXT: ret		; CHECK-RV32-NEXT: ret
;		;
; CHECK-RV64-LABEL: vrol_vv_v1i64:		; CHECK-RV64-LABEL: vrol_vv_v1i64:
Show All 15 Lines
; CHECK-ZVBB-NEXT: ret		; CHECK-ZVBB-NEXT: ret
%x = call <1 x i64> @llvm.fshl.v1i64(<1 x i64> %a, <1 x i64> %a, <1 x i64> %b)		%x = call <1 x i64> @llvm.fshl.v1i64(<1 x i64> %a, <1 x i64> %a, <1 x i64> %b)
ret <1 x i64> %x		ret <1 x i64> %x
}		}

define <1 x i64> @vrol_vx_v1i64(<1 x i64> %a, i64 %b) {		define <1 x i64> @vrol_vx_v1i64(<1 x i64> %a, i64 %b) {
; CHECK-RV32-LABEL: vrol_vx_v1i64:		; CHECK-RV32-LABEL: vrol_vx_v1i64:
; CHECK-RV32: # %bb.0:		; CHECK-RV32: # %bb.0:
; CHECK-RV32-NEXT: vsetivli zero, 2, e32, mf2, ta, ma
; CHECK-RV32-NEXT: vmv.v.i v9, 0
; CHECK-RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma		; CHECK-RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; CHECK-RV32-NEXT: vsub.vx v10, v9, a0		; CHECK-RV32-NEXT: vmv.v.x v9, a0
		; CHECK-RV32-NEXT: vsetivli zero, 2, e32, mf2, ta, ma
		; CHECK-RV32-NEXT: vmv.v.i v10, 0
; CHECK-RV32-NEXT: li a1, 63		; CHECK-RV32-NEXT: li a1, 63
; CHECK-RV32-NEXT: vsetvli zero, zero, e32, mf2, tu, ma		; CHECK-RV32-NEXT: vsetvli zero, zero, e32, mf2, tu, ma
; CHECK-RV32-NEXT: vmv.s.x v9, a1		; CHECK-RV32-NEXT: vmv.s.x v10, a1
; CHECK-RV32-NEXT: vsetvli zero, zero, e64, m1, ta, ma		; CHECK-RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; CHECK-RV32-NEXT: vand.vv v10, v10, v9		; CHECK-RV32-NEXT: vrsub.vi v9, v9, 0
; CHECK-RV32-NEXT: vsrl.vv v10, v8, v10		; CHECK-RV32-NEXT: vand.vv v9, v9, v10
; CHECK-RV32-NEXT: vand.vx v9, v9, a0		; CHECK-RV32-NEXT: vsrl.vv v9, v8, v9
; CHECK-RV32-NEXT: vsll.vv v8, v8, v9		; CHECK-RV32-NEXT: vand.vx v10, v10, a0
; CHECK-RV32-NEXT: vor.vv v8, v8, v10		; CHECK-RV32-NEXT: vsll.vv v8, v8, v10
		; CHECK-RV32-NEXT: vor.vv v8, v8, v9
; CHECK-RV32-NEXT: ret		; CHECK-RV32-NEXT: ret
;		;
; CHECK-RV64-LABEL: vrol_vx_v1i64:		; CHECK-RV64-LABEL: vrol_vx_v1i64:
; CHECK-RV64: # %bb.0:		; CHECK-RV64: # %bb.0:
; CHECK-RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma		; CHECK-RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; CHECK-RV64-NEXT: vmv.v.x v9, a0		; CHECK-RV64-NEXT: vmv.v.x v9, a0
; CHECK-RV64-NEXT: li a0, 63		; CHECK-RV64-NEXT: li a0, 63
; CHECK-RV64-NEXT: vand.vx v10, v9, a0		; CHECK-RV64-NEXT: vand.vx v10, v9, a0
Show All 13 Lines	; CHECK-ZVBB-NEXT: ret
%b.splat = shufflevector <1 x i64> %b.head, <1 x i64> poison, <1 x i32> zeroinitializer		%b.splat = shufflevector <1 x i64> %b.head, <1 x i64> poison, <1 x i32> zeroinitializer
%x = call <1 x i64> @llvm.fshl.v1i64(<1 x i64> %a, <1 x i64> %a, <1 x i64> %b.splat)		%x = call <1 x i64> @llvm.fshl.v1i64(<1 x i64> %a, <1 x i64> %a, <1 x i64> %b.splat)
ret <1 x i64> %x		ret <1 x i64> %x
}		}

declare <2 x i64> @llvm.fshl.v2i64(<2 x i64>, <2 x i64>, <2 x i64>)		declare <2 x i64> @llvm.fshl.v2i64(<2 x i64>, <2 x i64>, <2 x i64>)

define <2 x i64> @vrol_vv_v2i64(<2 x i64> %a, <2 x i64> %b) {		define <2 x i64> @vrol_vv_v2i64(<2 x i64> %a, <2 x i64> %b) {
; CHECK-RV32-LABEL: vrol_vv_v2i64:		; CHECK-LABEL: vrol_vv_v2i64:
; CHECK-RV32: # %bb.0:		; CHECK: # %bb.0:
; CHECK-RV32-NEXT: li a0, 63		; CHECK-NEXT: li a0, 63
; CHECK-RV32-NEXT: vsetivli zero, 2, e64, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 2, e64, m1, ta, ma
; CHECK-RV32-NEXT: vand.vx v10, v9, a0		; CHECK-NEXT: vand.vx v10, v9, a0
; CHECK-RV32-NEXT: vsll.vv v10, v8, v10		; CHECK-NEXT: vsll.vv v10, v8, v10
; CHECK-RV32-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vrsub.vi v9, v9, 0
; CHECK-RV32-NEXT: vmv.v.i v11, 0		; CHECK-NEXT: vand.vx v9, v9, a0
; CHECK-RV32-NEXT: vsetivli zero, 2, e64, m1, ta, ma		; CHECK-NEXT: vsrl.vv v8, v8, v9
; CHECK-RV32-NEXT: vsub.vv v9, v11, v9		; CHECK-NEXT: vor.vv v8, v10, v8
; CHECK-RV32-NEXT: vand.vx v9, v9, a0		; CHECK-NEXT: ret
; CHECK-RV32-NEXT: vsrl.vv v8, v8, v9
; CHECK-RV32-NEXT: vor.vv v8, v10, v8
; CHECK-RV32-NEXT: ret
;
; CHECK-RV64-LABEL: vrol_vv_v2i64:
; CHECK-RV64: # %bb.0:
; CHECK-RV64-NEXT: li a0, 63
; CHECK-RV64-NEXT: vsetivli zero, 2, e64, m1, ta, ma
; CHECK-RV64-NEXT: vand.vx v10, v9, a0
; CHECK-RV64-NEXT: vsll.vv v10, v8, v10
; CHECK-RV64-NEXT: vrsub.vi v9, v9, 0
; CHECK-RV64-NEXT: vand.vx v9, v9, a0
; CHECK-RV64-NEXT: vsrl.vv v8, v8, v9
; CHECK-RV64-NEXT: vor.vv v8, v10, v8
; CHECK-RV64-NEXT: ret
;		;
; CHECK-ZVBB-LABEL: vrol_vv_v2i64:		; CHECK-ZVBB-LABEL: vrol_vv_v2i64:
; CHECK-ZVBB: # %bb.0:		; CHECK-ZVBB: # %bb.0:
; CHECK-ZVBB-NEXT: vsetivli zero, 2, e64, m1, ta, ma		; CHECK-ZVBB-NEXT: vsetivli zero, 2, e64, m1, ta, ma
; CHECK-ZVBB-NEXT: vrol.vv v8, v8, v9		; CHECK-ZVBB-NEXT: vrol.vv v8, v8, v9
; CHECK-ZVBB-NEXT: ret		; CHECK-ZVBB-NEXT: ret
%x = call <2 x i64> @llvm.fshl.v2i64(<2 x i64> %a, <2 x i64> %a, <2 x i64> %b)		%x = call <2 x i64> @llvm.fshl.v2i64(<2 x i64> %a, <2 x i64> %a, <2 x i64> %b)
ret <2 x i64> %x		ret <2 x i64> %x
}		}

define <2 x i64> @vrol_vx_v2i64(<2 x i64> %a, i64 %b) {		define <2 x i64> @vrol_vx_v2i64(<2 x i64> %a, i64 %b) {
; CHECK-RV32-LABEL: vrol_vx_v2i64:		; CHECK-LABEL: vrol_vx_v2i64:
; CHECK-RV32: # %bb.0:		; CHECK: # %bb.0:
; CHECK-RV32-NEXT: vsetivli zero, 2, e64, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 2, e64, m1, ta, ma
; CHECK-RV32-NEXT: vmv.v.x v9, a0		; CHECK-NEXT: vmv.v.x v9, a0
; CHECK-RV32-NEXT: li a1, 63		; CHECK-NEXT: li a0, 63
; CHECK-RV32-NEXT: vand.vx v9, v9, a1		; CHECK-NEXT: vand.vx v10, v9, a0
; CHECK-RV32-NEXT: vsll.vv v9, v8, v9		; CHECK-NEXT: vsll.vv v10, v8, v10
; CHECK-RV32-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vrsub.vi v9, v9, 0
; CHECK-RV32-NEXT: vmv.v.i v10, 0		; CHECK-NEXT: vand.vx v9, v9, a0
; CHECK-RV32-NEXT: vsetivli zero, 2, e64, m1, ta, ma		; CHECK-NEXT: vsrl.vv v8, v8, v9
; CHECK-RV32-NEXT: vsub.vx v10, v10, a0		; CHECK-NEXT: vor.vv v8, v10, v8
; CHECK-RV32-NEXT: vand.vx v10, v10, a1		; CHECK-NEXT: ret
; CHECK-RV32-NEXT: vsrl.vv v8, v8, v10
; CHECK-RV32-NEXT: vor.vv v8, v9, v8
; CHECK-RV32-NEXT: ret
;
; CHECK-RV64-LABEL: vrol_vx_v2i64:
; CHECK-RV64: # %bb.0:
; CHECK-RV64-NEXT: vsetivli zero, 2, e64, m1, ta, ma
; CHECK-RV64-NEXT: vmv.v.x v9, a0
; CHECK-RV64-NEXT: li a0, 63
; CHECK-RV64-NEXT: vand.vx v10, v9, a0
; CHECK-RV64-NEXT: vsll.vv v10, v8, v10
; CHECK-RV64-NEXT: vrsub.vi v9, v9, 0
; CHECK-RV64-NEXT: vand.vx v9, v9, a0
; CHECK-RV64-NEXT: vsrl.vv v8, v8, v9
; CHECK-RV64-NEXT: vor.vv v8, v10, v8
; CHECK-RV64-NEXT: ret
;		;
; CHECK-ZVBB-LABEL: vrol_vx_v2i64:		; CHECK-ZVBB-LABEL: vrol_vx_v2i64:
; CHECK-ZVBB: # %bb.0:		; CHECK-ZVBB: # %bb.0:
; CHECK-ZVBB-NEXT: vsetivli zero, 2, e64, m1, ta, ma		; CHECK-ZVBB-NEXT: vsetivli zero, 2, e64, m1, ta, ma
; CHECK-ZVBB-NEXT: vrol.vx v8, v8, a0		; CHECK-ZVBB-NEXT: vrol.vx v8, v8, a0
; CHECK-ZVBB-NEXT: ret		; CHECK-ZVBB-NEXT: ret
%b.head = insertelement <2 x i64> poison, i64 %b, i32 0		%b.head = insertelement <2 x i64> poison, i64 %b, i32 0
%b.splat = shufflevector <2 x i64> %b.head, <2 x i64> poison, <2 x i32> zeroinitializer		%b.splat = shufflevector <2 x i64> %b.head, <2 x i64> poison, <2 x i32> zeroinitializer
%x = call <2 x i64> @llvm.fshl.v2i64(<2 x i64> %a, <2 x i64> %a, <2 x i64> %b.splat)		%x = call <2 x i64> @llvm.fshl.v2i64(<2 x i64> %a, <2 x i64> %a, <2 x i64> %b.splat)
ret <2 x i64> %x		ret <2 x i64> %x
}		}

declare <4 x i64> @llvm.fshl.v4i64(<4 x i64>, <4 x i64>, <4 x i64>)		declare <4 x i64> @llvm.fshl.v4i64(<4 x i64>, <4 x i64>, <4 x i64>)

define <4 x i64> @vrol_vv_v4i64(<4 x i64> %a, <4 x i64> %b) {		define <4 x i64> @vrol_vv_v4i64(<4 x i64> %a, <4 x i64> %b) {
; CHECK-RV32-LABEL: vrol_vv_v4i64:		; CHECK-LABEL: vrol_vv_v4i64:
; CHECK-RV32: # %bb.0:		; CHECK: # %bb.0:
; CHECK-RV32-NEXT: li a0, 63		; CHECK-NEXT: li a0, 63
; CHECK-RV32-NEXT: vsetivli zero, 4, e64, m2, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e64, m2, ta, ma
; CHECK-RV32-NEXT: vand.vx v12, v10, a0		; CHECK-NEXT: vand.vx v12, v10, a0
; CHECK-RV32-NEXT: vsll.vv v12, v8, v12		; CHECK-NEXT: vsll.vv v12, v8, v12
; CHECK-RV32-NEXT: vsetivli zero, 8, e32, m2, ta, ma		; CHECK-NEXT: vrsub.vi v10, v10, 0
; CHECK-RV32-NEXT: vmv.v.i v14, 0		; CHECK-NEXT: vand.vx v10, v10, a0
; CHECK-RV32-NEXT: vsetivli zero, 4, e64, m2, ta, ma		; CHECK-NEXT: vsrl.vv v8, v8, v10
; CHECK-RV32-NEXT: vsub.vv v10, v14, v10		; CHECK-NEXT: vor.vv v8, v12, v8
; CHECK-RV32-NEXT: vand.vx v10, v10, a0		; CHECK-NEXT: ret
; CHECK-RV32-NEXT: vsrl.vv v8, v8, v10
; CHECK-RV32-NEXT: vor.vv v8, v12, v8
; CHECK-RV32-NEXT: ret
;
; CHECK-RV64-LABEL: vrol_vv_v4i64:
; CHECK-RV64: # %bb.0:
; CHECK-RV64-NEXT: li a0, 63
; CHECK-RV64-NEXT: vsetivli zero, 4, e64, m2, ta, ma
; CHECK-RV64-NEXT: vand.vx v12, v10, a0
; CHECK-RV64-NEXT: vsll.vv v12, v8, v12
; CHECK-RV64-NEXT: vrsub.vi v10, v10, 0
; CHECK-RV64-NEXT: vand.vx v10, v10, a0
; CHECK-RV64-NEXT: vsrl.vv v8, v8, v10
; CHECK-RV64-NEXT: vor.vv v8, v12, v8
; CHECK-RV64-NEXT: ret
;		;
; CHECK-ZVBB-LABEL: vrol_vv_v4i64:		; CHECK-ZVBB-LABEL: vrol_vv_v4i64:
; CHECK-ZVBB: # %bb.0:		; CHECK-ZVBB: # %bb.0:
; CHECK-ZVBB-NEXT: vsetivli zero, 4, e64, m2, ta, ma		; CHECK-ZVBB-NEXT: vsetivli zero, 4, e64, m2, ta, ma
; CHECK-ZVBB-NEXT: vrol.vv v8, v8, v10		; CHECK-ZVBB-NEXT: vrol.vv v8, v8, v10
; CHECK-ZVBB-NEXT: ret		; CHECK-ZVBB-NEXT: ret
%x = call <4 x i64> @llvm.fshl.v4i64(<4 x i64> %a, <4 x i64> %a, <4 x i64> %b)		%x = call <4 x i64> @llvm.fshl.v4i64(<4 x i64> %a, <4 x i64> %a, <4 x i64> %b)
ret <4 x i64> %x		ret <4 x i64> %x
}		}

define <4 x i64> @vrol_vx_v4i64(<4 x i64> %a, i64 %b) {		define <4 x i64> @vrol_vx_v4i64(<4 x i64> %a, i64 %b) {
; CHECK-RV32-LABEL: vrol_vx_v4i64:		; CHECK-LABEL: vrol_vx_v4i64:
; CHECK-RV32: # %bb.0:		; CHECK: # %bb.0:
; CHECK-RV32-NEXT: vsetivli zero, 4, e64, m2, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e64, m2, ta, ma
; CHECK-RV32-NEXT: vmv.v.x v10, a0		; CHECK-NEXT: vmv.v.x v10, a0
; CHECK-RV32-NEXT: li a1, 63		; CHECK-NEXT: li a0, 63
; CHECK-RV32-NEXT: vand.vx v10, v10, a1		; CHECK-NEXT: vand.vx v12, v10, a0
; CHECK-RV32-NEXT: vsll.vv v10, v8, v10		; CHECK-NEXT: vsll.vv v12, v8, v12
; CHECK-RV32-NEXT: vsetivli zero, 8, e32, m2, ta, ma		; CHECK-NEXT: vrsub.vi v10, v10, 0
; CHECK-RV32-NEXT: vmv.v.i v12, 0		; CHECK-NEXT: vand.vx v10, v10, a0
; CHECK-RV32-NEXT: vsetivli zero, 4, e64, m2, ta, ma		; CHECK-NEXT: vsrl.vv v8, v8, v10
; CHECK-RV32-NEXT: vsub.vx v12, v12, a0		; CHECK-NEXT: vor.vv v8, v12, v8
; CHECK-RV32-NEXT: vand.vx v12, v12, a1		; CHECK-NEXT: ret
; CHECK-RV32-NEXT: vsrl.vv v8, v8, v12
; CHECK-RV32-NEXT: vor.vv v8, v10, v8
; CHECK-RV32-NEXT: ret
;
; CHECK-RV64-LABEL: vrol_vx_v4i64:
; CHECK-RV64: # %bb.0:
; CHECK-RV64-NEXT: vsetivli zero, 4, e64, m2, ta, ma
; CHECK-RV64-NEXT: vmv.v.x v10, a0
; CHECK-RV64-NEXT: li a0, 63
; CHECK-RV64-NEXT: vand.vx v12, v10, a0
; CHECK-RV64-NEXT: vsll.vv v12, v8, v12
; CHECK-RV64-NEXT: vrsub.vi v10, v10, 0
; CHECK-RV64-NEXT: vand.vx v10, v10, a0
; CHECK-RV64-NEXT: vsrl.vv v8, v8, v10
; CHECK-RV64-NEXT: vor.vv v8, v12, v8
; CHECK-RV64-NEXT: ret
;		;
; CHECK-ZVBB-LABEL: vrol_vx_v4i64:		; CHECK-ZVBB-LABEL: vrol_vx_v4i64:
; CHECK-ZVBB: # %bb.0:		; CHECK-ZVBB: # %bb.0:
; CHECK-ZVBB-NEXT: vsetivli zero, 4, e64, m2, ta, ma		; CHECK-ZVBB-NEXT: vsetivli zero, 4, e64, m2, ta, ma
; CHECK-ZVBB-NEXT: vrol.vx v8, v8, a0		; CHECK-ZVBB-NEXT: vrol.vx v8, v8, a0
; CHECK-ZVBB-NEXT: ret		; CHECK-ZVBB-NEXT: ret
%b.head = insertelement <4 x i64> poison, i64 %b, i32 0		%b.head = insertelement <4 x i64> poison, i64 %b, i32 0
%b.splat = shufflevector <4 x i64> %b.head, <4 x i64> poison, <4 x i32> zeroinitializer		%b.splat = shufflevector <4 x i64> %b.head, <4 x i64> poison, <4 x i32> zeroinitializer
%x = call <4 x i64> @llvm.fshl.v4i64(<4 x i64> %a, <4 x i64> %a, <4 x i64> %b.splat)		%x = call <4 x i64> @llvm.fshl.v4i64(<4 x i64> %a, <4 x i64> %a, <4 x i64> %b.splat)
ret <4 x i64> %x		ret <4 x i64> %x
}		}

declare <8 x i64> @llvm.fshl.v8i64(<8 x i64>, <8 x i64>, <8 x i64>)		declare <8 x i64> @llvm.fshl.v8i64(<8 x i64>, <8 x i64>, <8 x i64>)

define <8 x i64> @vrol_vv_v8i64(<8 x i64> %a, <8 x i64> %b) {		define <8 x i64> @vrol_vv_v8i64(<8 x i64> %a, <8 x i64> %b) {
; CHECK-RV32-LABEL: vrol_vv_v8i64:		; CHECK-LABEL: vrol_vv_v8i64:
; CHECK-RV32: # %bb.0:		; CHECK: # %bb.0:
; CHECK-RV32-NEXT: li a0, 63		; CHECK-NEXT: li a0, 63
; CHECK-RV32-NEXT: vsetivli zero, 8, e64, m4, ta, ma		; CHECK-NEXT: vsetivli zero, 8, e64, m4, ta, ma
; CHECK-RV32-NEXT: vand.vx v16, v12, a0		; CHECK-NEXT: vand.vx v16, v12, a0
; CHECK-RV32-NEXT: vsll.vv v16, v8, v16		; CHECK-NEXT: vsll.vv v16, v8, v16
; CHECK-RV32-NEXT: vsetivli zero, 16, e32, m4, ta, ma		; CHECK-NEXT: vrsub.vi v12, v12, 0
; CHECK-RV32-NEXT: vmv.v.i v20, 0		; CHECK-NEXT: vand.vx v12, v12, a0
; CHECK-RV32-NEXT: vsetivli zero, 8, e64, m4, ta, ma		; CHECK-NEXT: vsrl.vv v8, v8, v12
; CHECK-RV32-NEXT: vsub.vv v12, v20, v12		; CHECK-NEXT: vor.vv v8, v16, v8
; CHECK-RV32-NEXT: vand.vx v12, v12, a0		; CHECK-NEXT: ret
; CHECK-RV32-NEXT: vsrl.vv v8, v8, v12
; CHECK-RV32-NEXT: vor.vv v8, v16, v8
; CHECK-RV32-NEXT: ret
;
; CHECK-RV64-LABEL: vrol_vv_v8i64:
; CHECK-RV64: # %bb.0:
; CHECK-RV64-NEXT: li a0, 63
; CHECK-RV64-NEXT: vsetivli zero, 8, e64, m4, ta, ma
; CHECK-RV64-NEXT: vand.vx v16, v12, a0
; CHECK-RV64-NEXT: vsll.vv v16, v8, v16
; CHECK-RV64-NEXT: vrsub.vi v12, v12, 0
; CHECK-RV64-NEXT: vand.vx v12, v12, a0
; CHECK-RV64-NEXT: vsrl.vv v8, v8, v12
; CHECK-RV64-NEXT: vor.vv v8, v16, v8
; CHECK-RV64-NEXT: ret
;		;
; CHECK-ZVBB-LABEL: vrol_vv_v8i64:		; CHECK-ZVBB-LABEL: vrol_vv_v8i64:
; CHECK-ZVBB: # %bb.0:		; CHECK-ZVBB: # %bb.0:
; CHECK-ZVBB-NEXT: vsetivli zero, 8, e64, m4, ta, ma		; CHECK-ZVBB-NEXT: vsetivli zero, 8, e64, m4, ta, ma
; CHECK-ZVBB-NEXT: vrol.vv v8, v8, v12		; CHECK-ZVBB-NEXT: vrol.vv v8, v8, v12
; CHECK-ZVBB-NEXT: ret		; CHECK-ZVBB-NEXT: ret
%x = call <8 x i64> @llvm.fshl.v8i64(<8 x i64> %a, <8 x i64> %a, <8 x i64> %b)		%x = call <8 x i64> @llvm.fshl.v8i64(<8 x i64> %a, <8 x i64> %a, <8 x i64> %b)
ret <8 x i64> %x		ret <8 x i64> %x
}		}

define <8 x i64> @vrol_vx_v8i64(<8 x i64> %a, i64 %b) {		define <8 x i64> @vrol_vx_v8i64(<8 x i64> %a, i64 %b) {
; CHECK-RV32-LABEL: vrol_vx_v8i64:		; CHECK-LABEL: vrol_vx_v8i64:
; CHECK-RV32: # %bb.0:		; CHECK: # %bb.0:
; CHECK-RV32-NEXT: vsetivli zero, 8, e64, m4, ta, ma		; CHECK-NEXT: vsetivli zero, 8, e64, m4, ta, ma
; CHECK-RV32-NEXT: vmv.v.x v12, a0		; CHECK-NEXT: vmv.v.x v12, a0
; CHECK-RV32-NEXT: li a1, 63		; CHECK-NEXT: li a0, 63
; CHECK-RV32-NEXT: vand.vx v12, v12, a1		; CHECK-NEXT: vand.vx v16, v12, a0
; CHECK-RV32-NEXT: vsll.vv v12, v8, v12		; CHECK-NEXT: vsll.vv v16, v8, v16
; CHECK-RV32-NEXT: vsetivli zero, 16, e32, m4, ta, ma		; CHECK-NEXT: vrsub.vi v12, v12, 0
; CHECK-RV32-NEXT: vmv.v.i v16, 0		; CHECK-NEXT: vand.vx v12, v12, a0
; CHECK-RV32-NEXT: vsetivli zero, 8, e64, m4, ta, ma		; CHECK-NEXT: vsrl.vv v8, v8, v12
; CHECK-RV32-NEXT: vsub.vx v16, v16, a0		; CHECK-NEXT: vor.vv v8, v16, v8
; CHECK-RV32-NEXT: vand.vx v16, v16, a1		; CHECK-NEXT: ret
; CHECK-RV32-NEXT: vsrl.vv v8, v8, v16
; CHECK-RV32-NEXT: vor.vv v8, v12, v8
; CHECK-RV32-NEXT: ret
;
; CHECK-RV64-LABEL: vrol_vx_v8i64:
; CHECK-RV64: # %bb.0:
; CHECK-RV64-NEXT: vsetivli zero, 8, e64, m4, ta, ma
; CHECK-RV64-NEXT: vmv.v.x v12, a0
; CHECK-RV64-NEXT: li a0, 63
; CHECK-RV64-NEXT: vand.vx v16, v12, a0
; CHECK-RV64-NEXT: vsll.vv v16, v8, v16
; CHECK-RV64-NEXT: vrsub.vi v12, v12, 0
; CHECK-RV64-NEXT: vand.vx v12, v12, a0
; CHECK-RV64-NEXT: vsrl.vv v8, v8, v12
; CHECK-RV64-NEXT: vor.vv v8, v16, v8
; CHECK-RV64-NEXT: ret
;		;
; CHECK-ZVBB-LABEL: vrol_vx_v8i64:		; CHECK-ZVBB-LABEL: vrol_vx_v8i64:
; CHECK-ZVBB: # %bb.0:		; CHECK-ZVBB: # %bb.0:
; CHECK-ZVBB-NEXT: vsetivli zero, 8, e64, m4, ta, ma		; CHECK-ZVBB-NEXT: vsetivli zero, 8, e64, m4, ta, ma
; CHECK-ZVBB-NEXT: vrol.vx v8, v8, a0		; CHECK-ZVBB-NEXT: vrol.vx v8, v8, a0
; CHECK-ZVBB-NEXT: ret		; CHECK-ZVBB-NEXT: ret
%b.head = insertelement <8 x i64> poison, i64 %b, i32 0		%b.head = insertelement <8 x i64> poison, i64 %b, i32 0
%b.splat = shufflevector <8 x i64> %b.head, <8 x i64> poison, <8 x i32> zeroinitializer		%b.splat = shufflevector <8 x i64> %b.head, <8 x i64> poison, <8 x i32> zeroinitializer
%x = call <8 x i64> @llvm.fshl.v8i64(<8 x i64> %a, <8 x i64> %a, <8 x i64> %b.splat)		%x = call <8 x i64> @llvm.fshl.v8i64(<8 x i64> %a, <8 x i64> %a, <8 x i64> %b.splat)
ret <8 x i64> %x		ret <8 x i64> %x
}		}

;; NOTE: These prefixes are unused and the list is autogenerated. Do not add tests below this line:		;; NOTE: These prefixes are unused and the list is autogenerated. Do not add tests below this line:
; CHECK-ZVBB32: {{.*}}		; CHECK-ZVBB32: {{.*}}
; CHECK-ZVBB64: {{.*}}		; CHECK-ZVBB64: {{.*}}

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-vror.ll

Show First 20 Lines • Show All 1,552 Lines • ▼ Show 20 Lines
declare <1 x i64> @llvm.fshr.v1i64(<1 x i64>, <1 x i64>, <1 x i64>)		declare <1 x i64> @llvm.fshr.v1i64(<1 x i64>, <1 x i64>, <1 x i64>)
declare <1 x i64> @llvm.fshl.v1i64(<1 x i64>, <1 x i64>, <1 x i64>)		declare <1 x i64> @llvm.fshl.v1i64(<1 x i64>, <1 x i64>, <1 x i64>)

define <1 x i64> @vror_vv_v1i64(<1 x i64> %a, <1 x i64> %b) {		define <1 x i64> @vror_vv_v1i64(<1 x i64> %a, <1 x i64> %b) {
; CHECK-RV32-LABEL: vror_vv_v1i64:		; CHECK-RV32-LABEL: vror_vv_v1i64:
; CHECK-RV32: # %bb.0:		; CHECK-RV32: # %bb.0:
; CHECK-RV32-NEXT: vsetivli zero, 2, e32, mf2, ta, ma		; CHECK-RV32-NEXT: vsetivli zero, 2, e32, mf2, ta, ma
; CHECK-RV32-NEXT: vmv.v.i v10, 0		; CHECK-RV32-NEXT: vmv.v.i v10, 0
; CHECK-RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; CHECK-RV32-NEXT: vsub.vv v11, v10, v9
; CHECK-RV32-NEXT: li a0, 63		; CHECK-RV32-NEXT: li a0, 63
; CHECK-RV32-NEXT: vsetvli zero, zero, e32, mf2, tu, ma		; CHECK-RV32-NEXT: vsetvli zero, zero, e32, mf2, tu, ma
; CHECK-RV32-NEXT: vmv.s.x v10, a0		; CHECK-RV32-NEXT: vmv.s.x v10, a0
; CHECK-RV32-NEXT: vsetvli zero, zero, e64, m1, ta, ma		; CHECK-RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
		; CHECK-RV32-NEXT: vrsub.vi v11, v9, 0
; CHECK-RV32-NEXT: vand.vv v11, v11, v10		; CHECK-RV32-NEXT: vand.vv v11, v11, v10
; CHECK-RV32-NEXT: vsll.vv v11, v8, v11		; CHECK-RV32-NEXT: vsll.vv v11, v8, v11
; CHECK-RV32-NEXT: vand.vv v9, v9, v10		; CHECK-RV32-NEXT: vand.vv v9, v9, v10
; CHECK-RV32-NEXT: vsrl.vv v8, v8, v9		; CHECK-RV32-NEXT: vsrl.vv v8, v8, v9
; CHECK-RV32-NEXT: vor.vv v8, v8, v11		; CHECK-RV32-NEXT: vor.vv v8, v8, v11
; CHECK-RV32-NEXT: ret		; CHECK-RV32-NEXT: ret
;		;
; CHECK-RV64-LABEL: vror_vv_v1i64:		; CHECK-RV64-LABEL: vror_vv_v1i64:
Show All 15 Lines
; CHECK-ZVBB-NEXT: ret		; CHECK-ZVBB-NEXT: ret
%x = call <1 x i64> @llvm.fshr.v1i64(<1 x i64> %a, <1 x i64> %a, <1 x i64> %b)		%x = call <1 x i64> @llvm.fshr.v1i64(<1 x i64> %a, <1 x i64> %a, <1 x i64> %b)
ret <1 x i64> %x		ret <1 x i64> %x
}		}

define <1 x i64> @vror_vx_v1i64(<1 x i64> %a, i64 %b) {		define <1 x i64> @vror_vx_v1i64(<1 x i64> %a, i64 %b) {
; CHECK-RV32-LABEL: vror_vx_v1i64:		; CHECK-RV32-LABEL: vror_vx_v1i64:
; CHECK-RV32: # %bb.0:		; CHECK-RV32: # %bb.0:
; CHECK-RV32-NEXT: vsetivli zero, 2, e32, mf2, ta, ma
; CHECK-RV32-NEXT: vmv.v.i v9, 0
; CHECK-RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma		; CHECK-RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; CHECK-RV32-NEXT: vsub.vx v10, v9, a0		; CHECK-RV32-NEXT: vmv.v.x v9, a0
		; CHECK-RV32-NEXT: vsetivli zero, 2, e32, mf2, ta, ma
		; CHECK-RV32-NEXT: vmv.v.i v10, 0
; CHECK-RV32-NEXT: li a1, 63		; CHECK-RV32-NEXT: li a1, 63
; CHECK-RV32-NEXT: vsetvli zero, zero, e32, mf2, tu, ma		; CHECK-RV32-NEXT: vsetvli zero, zero, e32, mf2, tu, ma
; CHECK-RV32-NEXT: vmv.s.x v9, a1		; CHECK-RV32-NEXT: vmv.s.x v10, a1
; CHECK-RV32-NEXT: vsetvli zero, zero, e64, m1, ta, ma		; CHECK-RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; CHECK-RV32-NEXT: vand.vv v10, v10, v9		; CHECK-RV32-NEXT: vrsub.vi v9, v9, 0
; CHECK-RV32-NEXT: vsll.vv v10, v8, v10		; CHECK-RV32-NEXT: vand.vv v9, v9, v10
; CHECK-RV32-NEXT: vand.vx v9, v9, a0		; CHECK-RV32-NEXT: vsll.vv v9, v8, v9
; CHECK-RV32-NEXT: vsrl.vv v8, v8, v9		; CHECK-RV32-NEXT: vand.vx v10, v10, a0
; CHECK-RV32-NEXT: vor.vv v8, v8, v10		; CHECK-RV32-NEXT: vsrl.vv v8, v8, v10
		; CHECK-RV32-NEXT: vor.vv v8, v8, v9
; CHECK-RV32-NEXT: ret		; CHECK-RV32-NEXT: ret
;		;
; CHECK-RV64-LABEL: vror_vx_v1i64:		; CHECK-RV64-LABEL: vror_vx_v1i64:
; CHECK-RV64: # %bb.0:		; CHECK-RV64: # %bb.0:
; CHECK-RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma		; CHECK-RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; CHECK-RV64-NEXT: vmv.v.x v9, a0		; CHECK-RV64-NEXT: vmv.v.x v9, a0
; CHECK-RV64-NEXT: li a0, 63		; CHECK-RV64-NEXT: li a0, 63
; CHECK-RV64-NEXT: vand.vx v10, v9, a0		; CHECK-RV64-NEXT: vand.vx v10, v9, a0
Show All 15 Lines	; CHECK-ZVBB-NEXT: ret
ret <1 x i64> %x		ret <1 x i64> %x
}		}

define <1 x i64> @vror_vi_v1i64(<1 x i64> %a) {		define <1 x i64> @vror_vi_v1i64(<1 x i64> %a) {
; CHECK-RV32-LABEL: vror_vi_v1i64:		; CHECK-RV32-LABEL: vror_vi_v1i64:
; CHECK-RV32: # %bb.0:		; CHECK-RV32: # %bb.0:
; CHECK-RV32-NEXT: vsetivli zero, 2, e32, mf2, ta, ma		; CHECK-RV32-NEXT: vsetivli zero, 2, e32, mf2, ta, ma
; CHECK-RV32-NEXT: vmv.v.i v9, 0		; CHECK-RV32-NEXT: vmv.v.i v9, 0
; CHECK-RV32-NEXT: li a0, 1
; CHECK-RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; CHECK-RV32-NEXT: vsub.vx v10, v9, a0
; CHECK-RV32-NEXT: li a0, 63		; CHECK-RV32-NEXT: li a0, 63
; CHECK-RV32-NEXT: vsetvli zero, zero, e32, mf2, tu, ma		; CHECK-RV32-NEXT: vsetvli zero, zero, e32, mf2, tu, ma
; CHECK-RV32-NEXT: vmv.s.x v9, a0		; CHECK-RV32-NEXT: vmv.s.x v9, a0
; CHECK-RV32-NEXT: vsetvli zero, zero, e64, m1, ta, ma		; CHECK-RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
		; CHECK-RV32-NEXT: vmv.v.i v10, 1
		; CHECK-RV32-NEXT: vrsub.vi v10, v10, 0
; CHECK-RV32-NEXT: vand.vv v10, v10, v9		; CHECK-RV32-NEXT: vand.vv v10, v10, v9
; CHECK-RV32-NEXT: vsll.vv v10, v8, v10		; CHECK-RV32-NEXT: vsll.vv v10, v8, v10
; CHECK-RV32-NEXT: vand.vi v9, v9, 1		; CHECK-RV32-NEXT: vand.vi v9, v9, 1
; CHECK-RV32-NEXT: vsrl.vv v8, v8, v9		; CHECK-RV32-NEXT: vsrl.vv v8, v8, v9
; CHECK-RV32-NEXT: vor.vv v8, v8, v10		; CHECK-RV32-NEXT: vor.vv v8, v8, v10
; CHECK-RV32-NEXT: ret		; CHECK-RV32-NEXT: ret
;		;
; CHECK-RV64-LABEL: vror_vi_v1i64:		; CHECK-RV64-LABEL: vror_vi_v1i64:
Show All 14 Lines	; CHECK-ZVBB-NEXT: ret
ret <1 x i64> %x		ret <1 x i64> %x
}		}

define <1 x i64> @vror_vi_rotl_v1i64(<1 x i64> %a) {		define <1 x i64> @vror_vi_rotl_v1i64(<1 x i64> %a) {
; CHECK-RV32-LABEL: vror_vi_rotl_v1i64:		; CHECK-RV32-LABEL: vror_vi_rotl_v1i64:
; CHECK-RV32: # %bb.0:		; CHECK-RV32: # %bb.0:
; CHECK-RV32-NEXT: vsetivli zero, 2, e32, mf2, ta, ma		; CHECK-RV32-NEXT: vsetivli zero, 2, e32, mf2, ta, ma
; CHECK-RV32-NEXT: vmv.v.i v9, 0		; CHECK-RV32-NEXT: vmv.v.i v9, 0
; CHECK-RV32-NEXT: li a0, 1
; CHECK-RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
; CHECK-RV32-NEXT: vsub.vx v10, v9, a0
; CHECK-RV32-NEXT: li a0, 63		; CHECK-RV32-NEXT: li a0, 63
; CHECK-RV32-NEXT: vsetvli zero, zero, e32, mf2, tu, ma		; CHECK-RV32-NEXT: vsetvli zero, zero, e32, mf2, tu, ma
; CHECK-RV32-NEXT: vmv.s.x v9, a0		; CHECK-RV32-NEXT: vmv.s.x v9, a0
; CHECK-RV32-NEXT: vsetvli zero, zero, e64, m1, ta, ma		; CHECK-RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
		; CHECK-RV32-NEXT: vmv.v.i v10, 1
		; CHECK-RV32-NEXT: vrsub.vi v10, v10, 0
; CHECK-RV32-NEXT: vand.vv v10, v10, v9		; CHECK-RV32-NEXT: vand.vv v10, v10, v9
; CHECK-RV32-NEXT: vsrl.vv v10, v8, v10		; CHECK-RV32-NEXT: vsrl.vv v10, v8, v10
; CHECK-RV32-NEXT: vand.vi v9, v9, 1		; CHECK-RV32-NEXT: vand.vi v9, v9, 1
; CHECK-RV32-NEXT: vsll.vv v8, v8, v9		; CHECK-RV32-NEXT: vsll.vv v8, v8, v9
; CHECK-RV32-NEXT: vor.vv v8, v8, v10		; CHECK-RV32-NEXT: vor.vv v8, v8, v10
; CHECK-RV32-NEXT: ret		; CHECK-RV32-NEXT: ret
;		;
; CHECK-RV64-LABEL: vror_vi_rotl_v1i64:		; CHECK-RV64-LABEL: vror_vi_rotl_v1i64:
Show All 13 Lines	; CHECK-ZVBB-NEXT: ret
%x = call <1 x i64> @llvm.fshl.v1i64(<1 x i64> %a, <1 x i64> %a, <1 x i64> shufflevector(<1 x i64> insertelement(<1 x i64> poison, i64 1, i32 0), <1 x i64> poison, <1 x i32> zeroinitializer))		%x = call <1 x i64> @llvm.fshl.v1i64(<1 x i64> %a, <1 x i64> %a, <1 x i64> shufflevector(<1 x i64> insertelement(<1 x i64> poison, i64 1, i32 0), <1 x i64> poison, <1 x i32> zeroinitializer))
ret <1 x i64> %x		ret <1 x i64> %x
}		}

declare <2 x i64> @llvm.fshr.v2i64(<2 x i64>, <2 x i64>, <2 x i64>)		declare <2 x i64> @llvm.fshr.v2i64(<2 x i64>, <2 x i64>, <2 x i64>)
declare <2 x i64> @llvm.fshl.v2i64(<2 x i64>, <2 x i64>, <2 x i64>)		declare <2 x i64> @llvm.fshl.v2i64(<2 x i64>, <2 x i64>, <2 x i64>)

define <2 x i64> @vror_vv_v2i64(<2 x i64> %a, <2 x i64> %b) {		define <2 x i64> @vror_vv_v2i64(<2 x i64> %a, <2 x i64> %b) {
; CHECK-RV32-LABEL: vror_vv_v2i64:		; CHECK-LABEL: vror_vv_v2i64:
; CHECK-RV32: # %bb.0:		; CHECK: # %bb.0:
; CHECK-RV32-NEXT: li a0, 63		; CHECK-NEXT: li a0, 63
; CHECK-RV32-NEXT: vsetivli zero, 2, e64, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 2, e64, m1, ta, ma
; CHECK-RV32-NEXT: vand.vx v10, v9, a0		; CHECK-NEXT: vand.vx v10, v9, a0
; CHECK-RV32-NEXT: vsrl.vv v10, v8, v10		; CHECK-NEXT: vsrl.vv v10, v8, v10
; CHECK-RV32-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vrsub.vi v9, v9, 0
; CHECK-RV32-NEXT: vmv.v.i v11, 0		; CHECK-NEXT: vand.vx v9, v9, a0
; CHECK-RV32-NEXT: vsetivli zero, 2, e64, m1, ta, ma		; CHECK-NEXT: vsll.vv v8, v8, v9
; CHECK-RV32-NEXT: vsub.vv v9, v11, v9		; CHECK-NEXT: vor.vv v8, v10, v8
; CHECK-RV32-NEXT: vand.vx v9, v9, a0		; CHECK-NEXT: ret
; CHECK-RV32-NEXT: vsll.vv v8, v8, v9
; CHECK-RV32-NEXT: vor.vv v8, v10, v8
; CHECK-RV32-NEXT: ret
;
; CHECK-RV64-LABEL: vror_vv_v2i64:
; CHECK-RV64: # %bb.0:
; CHECK-RV64-NEXT: li a0, 63
; CHECK-RV64-NEXT: vsetivli zero, 2, e64, m1, ta, ma
; CHECK-RV64-NEXT: vand.vx v10, v9, a0
; CHECK-RV64-NEXT: vsrl.vv v10, v8, v10
; CHECK-RV64-NEXT: vrsub.vi v9, v9, 0
; CHECK-RV64-NEXT: vand.vx v9, v9, a0
; CHECK-RV64-NEXT: vsll.vv v8, v8, v9
; CHECK-RV64-NEXT: vor.vv v8, v10, v8
; CHECK-RV64-NEXT: ret
;		;
; CHECK-ZVBB-LABEL: vror_vv_v2i64:		; CHECK-ZVBB-LABEL: vror_vv_v2i64:
; CHECK-ZVBB: # %bb.0:		; CHECK-ZVBB: # %bb.0:
; CHECK-ZVBB-NEXT: vsetivli zero, 2, e64, m1, ta, ma		; CHECK-ZVBB-NEXT: vsetivli zero, 2, e64, m1, ta, ma
; CHECK-ZVBB-NEXT: vror.vv v8, v8, v9		; CHECK-ZVBB-NEXT: vror.vv v8, v8, v9
; CHECK-ZVBB-NEXT: ret		; CHECK-ZVBB-NEXT: ret
%x = call <2 x i64> @llvm.fshr.v2i64(<2 x i64> %a, <2 x i64> %a, <2 x i64> %b)		%x = call <2 x i64> @llvm.fshr.v2i64(<2 x i64> %a, <2 x i64> %a, <2 x i64> %b)
ret <2 x i64> %x		ret <2 x i64> %x
}		}

define <2 x i64> @vror_vx_v2i64(<2 x i64> %a, i64 %b) {		define <2 x i64> @vror_vx_v2i64(<2 x i64> %a, i64 %b) {
; CHECK-RV32-LABEL: vror_vx_v2i64:		; CHECK-LABEL: vror_vx_v2i64:
; CHECK-RV32: # %bb.0:		; CHECK: # %bb.0:
; CHECK-RV32-NEXT: vsetivli zero, 2, e64, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 2, e64, m1, ta, ma
; CHECK-RV32-NEXT: vmv.v.x v9, a0		; CHECK-NEXT: vmv.v.x v9, a0
; CHECK-RV32-NEXT: li a1, 63		; CHECK-NEXT: li a0, 63
; CHECK-RV32-NEXT: vand.vx v9, v9, a1		; CHECK-NEXT: vand.vx v10, v9, a0
; CHECK-RV32-NEXT: vsrl.vv v9, v8, v9		; CHECK-NEXT: vsrl.vv v10, v8, v10
; CHECK-RV32-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vrsub.vi v9, v9, 0
; CHECK-RV32-NEXT: vmv.v.i v10, 0		; CHECK-NEXT: vand.vx v9, v9, a0
; CHECK-RV32-NEXT: vsetivli zero, 2, e64, m1, ta, ma		; CHECK-NEXT: vsll.vv v8, v8, v9
; CHECK-RV32-NEXT: vsub.vx v10, v10, a0		; CHECK-NEXT: vor.vv v8, v10, v8
; CHECK-RV32-NEXT: vand.vx v10, v10, a1		; CHECK-NEXT: ret
; CHECK-RV32-NEXT: vsll.vv v8, v8, v10
; CHECK-RV32-NEXT: vor.vv v8, v9, v8
; CHECK-RV32-NEXT: ret
;
; CHECK-RV64-LABEL: vror_vx_v2i64:
; CHECK-RV64: # %bb.0:
; CHECK-RV64-NEXT: vsetivli zero, 2, e64, m1, ta, ma
; CHECK-RV64-NEXT: vmv.v.x v9, a0
; CHECK-RV64-NEXT: li a0, 63
; CHECK-RV64-NEXT: vand.vx v10, v9, a0
; CHECK-RV64-NEXT: vsrl.vv v10, v8, v10
; CHECK-RV64-NEXT: vrsub.vi v9, v9, 0
; CHECK-RV64-NEXT: vand.vx v9, v9, a0
; CHECK-RV64-NEXT: vsll.vv v8, v8, v9
; CHECK-RV64-NEXT: vor.vv v8, v10, v8
; CHECK-RV64-NEXT: ret
;		;
; CHECK-ZVBB-LABEL: vror_vx_v2i64:		; CHECK-ZVBB-LABEL: vror_vx_v2i64:
; CHECK-ZVBB: # %bb.0:		; CHECK-ZVBB: # %bb.0:
; CHECK-ZVBB-NEXT: vsetivli zero, 2, e64, m1, ta, ma		; CHECK-ZVBB-NEXT: vsetivli zero, 2, e64, m1, ta, ma
; CHECK-ZVBB-NEXT: vror.vx v8, v8, a0		; CHECK-ZVBB-NEXT: vror.vx v8, v8, a0
; CHECK-ZVBB-NEXT: ret		; CHECK-ZVBB-NEXT: ret
%b.head = insertelement <2 x i64> poison, i64 %b, i32 0		%b.head = insertelement <2 x i64> poison, i64 %b, i32 0
%b.splat = shufflevector <2 x i64> %b.head, <2 x i64> poison, <2 x i32> zeroinitializer		%b.splat = shufflevector <2 x i64> %b.head, <2 x i64> poison, <2 x i32> zeroinitializer
%x = call <2 x i64> @llvm.fshr.v2i64(<2 x i64> %a, <2 x i64> %a, <2 x i64> %b.splat)		%x = call <2 x i64> @llvm.fshr.v2i64(<2 x i64> %a, <2 x i64> %a, <2 x i64> %b.splat)
ret <2 x i64> %x		ret <2 x i64> %x
}		}

define <2 x i64> @vror_vi_v2i64(<2 x i64> %a) {		define <2 x i64> @vror_vi_v2i64(<2 x i64> %a) {
; CHECK-RV32-LABEL: vror_vi_v2i64:		; CHECK-RV32-LABEL: vror_vi_v2i64:
; CHECK-RV32: # %bb.0:		; CHECK-RV32: # %bb.0:
; CHECK-RV32-NEXT: li a0, 63
; CHECK-RV32-NEXT: vsetivli zero, 2, e64, m1, ta, ma		; CHECK-RV32-NEXT: vsetivli zero, 2, e64, m1, ta, ma
; CHECK-RV32-NEXT: vmv.v.x v9, a0		; CHECK-RV32-NEXT: vmv.v.i v9, 1
; CHECK-RV32-NEXT: vand.vi v9, v9, 1		; CHECK-RV32-NEXT: vrsub.vi v9, v9, 0
; CHECK-RV32-NEXT: vsrl.vv v9, v8, v9		; CHECK-RV32-NEXT: li a0, 63
; CHECK-RV32-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-RV32-NEXT: vand.vx v9, v9, a0
; CHECK-RV32-NEXT: vmv.v.i v10, 0		; CHECK-RV32-NEXT: vsll.vv v9, v8, v9
; CHECK-RV32-NEXT: li a1, 1		; CHECK-RV32-NEXT: vmv.v.x v10, a0
; CHECK-RV32-NEXT: vsetivli zero, 2, e64, m1, ta, ma		; CHECK-RV32-NEXT: vand.vi v10, v10, 1
; CHECK-RV32-NEXT: vsub.vx v10, v10, a1		; CHECK-RV32-NEXT: vsrl.vv v8, v8, v10
; CHECK-RV32-NEXT: vand.vx v10, v10, a0		; CHECK-RV32-NEXT: vor.vv v8, v8, v9
; CHECK-RV32-NEXT: vsll.vv v8, v8, v10
; CHECK-RV32-NEXT: vor.vv v8, v9, v8
; CHECK-RV32-NEXT: ret		; CHECK-RV32-NEXT: ret
;		;
; CHECK-RV64-LABEL: vror_vi_v2i64:		; CHECK-RV64-LABEL: vror_vi_v2i64:
; CHECK-RV64: # %bb.0:		; CHECK-RV64: # %bb.0:
; CHECK-RV64-NEXT: li a0, 63		; CHECK-RV64-NEXT: li a0, 63
; CHECK-RV64-NEXT: vsetivli zero, 2, e64, m1, ta, ma		; CHECK-RV64-NEXT: vsetivli zero, 2, e64, m1, ta, ma
; CHECK-RV64-NEXT: vsll.vx v9, v8, a0		; CHECK-RV64-NEXT: vsll.vx v9, v8, a0
; CHECK-RV64-NEXT: vsrl.vi v8, v8, 1		; CHECK-RV64-NEXT: vsrl.vi v8, v8, 1
; CHECK-RV64-NEXT: vor.vv v8, v8, v9		; CHECK-RV64-NEXT: vor.vv v8, v8, v9
; CHECK-RV64-NEXT: ret		; CHECK-RV64-NEXT: ret
;		;
; CHECK-ZVBB-LABEL: vror_vi_v2i64:		; CHECK-ZVBB-LABEL: vror_vi_v2i64:
; CHECK-ZVBB: # %bb.0:		; CHECK-ZVBB: # %bb.0:
; CHECK-ZVBB-NEXT: vsetivli zero, 2, e64, m1, ta, ma		; CHECK-ZVBB-NEXT: vsetivli zero, 2, e64, m1, ta, ma
; CHECK-ZVBB-NEXT: vror.vi v8, v8, 1		; CHECK-ZVBB-NEXT: vror.vi v8, v8, 1
; CHECK-ZVBB-NEXT: ret		; CHECK-ZVBB-NEXT: ret
%x = call <2 x i64> @llvm.fshr.v2i64(<2 x i64> %a, <2 x i64> %a, <2 x i64> shufflevector(<2 x i64> insertelement(<2 x i64> poison, i64 1, i32 0), <2 x i64> poison, <2 x i32> zeroinitializer))		%x = call <2 x i64> @llvm.fshr.v2i64(<2 x i64> %a, <2 x i64> %a, <2 x i64> shufflevector(<2 x i64> insertelement(<2 x i64> poison, i64 1, i32 0), <2 x i64> poison, <2 x i32> zeroinitializer))
ret <2 x i64> %x		ret <2 x i64> %x
}		}

define <2 x i64> @vror_vi_rotl_v2i64(<2 x i64> %a) {		define <2 x i64> @vror_vi_rotl_v2i64(<2 x i64> %a) {
; CHECK-RV32-LABEL: vror_vi_rotl_v2i64:		; CHECK-RV32-LABEL: vror_vi_rotl_v2i64:
; CHECK-RV32: # %bb.0:		; CHECK-RV32: # %bb.0:
; CHECK-RV32-NEXT: li a0, 63
; CHECK-RV32-NEXT: vsetivli zero, 2, e64, m1, ta, ma
; CHECK-RV32-NEXT: vmv.v.x v9, a0
; CHECK-RV32-NEXT: vand.vi v9, v9, 1
; CHECK-RV32-NEXT: vsll.vv v9, v8, v9
; CHECK-RV32-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-RV32-NEXT: vmv.v.i v10, 0
; CHECK-RV32-NEXT: li a1, 1
; CHECK-RV32-NEXT: vsetivli zero, 2, e64, m1, ta, ma		; CHECK-RV32-NEXT: vsetivli zero, 2, e64, m1, ta, ma
; CHECK-RV32-NEXT: vsub.vx v10, v10, a1		; CHECK-RV32-NEXT: vmv.v.i v9, 1
; CHECK-RV32-NEXT: vand.vx v10, v10, a0		; CHECK-RV32-NEXT: vrsub.vi v9, v9, 0
; CHECK-RV32-NEXT: vsrl.vv v8, v8, v10		; CHECK-RV32-NEXT: li a0, 63
; CHECK-RV32-NEXT: vor.vv v8, v9, v8		; CHECK-RV32-NEXT: vand.vx v9, v9, a0
		; CHECK-RV32-NEXT: vsrl.vv v9, v8, v9
		; CHECK-RV32-NEXT: vmv.v.x v10, a0
		; CHECK-RV32-NEXT: vand.vi v10, v10, 1
		; CHECK-RV32-NEXT: vsll.vv v8, v8, v10
		; CHECK-RV32-NEXT: vor.vv v8, v8, v9
; CHECK-RV32-NEXT: ret		; CHECK-RV32-NEXT: ret
;		;
; CHECK-RV64-LABEL: vror_vi_rotl_v2i64:		; CHECK-RV64-LABEL: vror_vi_rotl_v2i64:
; CHECK-RV64: # %bb.0:		; CHECK-RV64: # %bb.0:
; CHECK-RV64-NEXT: li a0, 63		; CHECK-RV64-NEXT: li a0, 63
; CHECK-RV64-NEXT: vsetivli zero, 2, e64, m1, ta, ma		; CHECK-RV64-NEXT: vsetivli zero, 2, e64, m1, ta, ma
; CHECK-RV64-NEXT: vsrl.vx v9, v8, a0		; CHECK-RV64-NEXT: vsrl.vx v9, v8, a0
; CHECK-RV64-NEXT: vadd.vv v8, v8, v8		; CHECK-RV64-NEXT: vadd.vv v8, v8, v8
; CHECK-RV64-NEXT: vor.vv v8, v8, v9		; CHECK-RV64-NEXT: vor.vv v8, v8, v9
; CHECK-RV64-NEXT: ret		; CHECK-RV64-NEXT: ret
;		;
; CHECK-ZVBB-LABEL: vror_vi_rotl_v2i64:		; CHECK-ZVBB-LABEL: vror_vi_rotl_v2i64:
; CHECK-ZVBB: # %bb.0:		; CHECK-ZVBB: # %bb.0:
; CHECK-ZVBB-NEXT: vsetivli zero, 2, e64, m1, ta, ma		; CHECK-ZVBB-NEXT: vsetivli zero, 2, e64, m1, ta, ma
; CHECK-ZVBB-NEXT: vror.vi v8, v8, 63		; CHECK-ZVBB-NEXT: vror.vi v8, v8, 63
; CHECK-ZVBB-NEXT: ret		; CHECK-ZVBB-NEXT: ret
%x = call <2 x i64> @llvm.fshl.v2i64(<2 x i64> %a, <2 x i64> %a, <2 x i64> shufflevector(<2 x i64> insertelement(<2 x i64> poison, i64 1, i32 0), <2 x i64> poison, <2 x i32> zeroinitializer))		%x = call <2 x i64> @llvm.fshl.v2i64(<2 x i64> %a, <2 x i64> %a, <2 x i64> shufflevector(<2 x i64> insertelement(<2 x i64> poison, i64 1, i32 0), <2 x i64> poison, <2 x i32> zeroinitializer))
ret <2 x i64> %x		ret <2 x i64> %x
}		}

declare <4 x i64> @llvm.fshr.v4i64(<4 x i64>, <4 x i64>, <4 x i64>)		declare <4 x i64> @llvm.fshr.v4i64(<4 x i64>, <4 x i64>, <4 x i64>)
declare <4 x i64> @llvm.fshl.v4i64(<4 x i64>, <4 x i64>, <4 x i64>)		declare <4 x i64> @llvm.fshl.v4i64(<4 x i64>, <4 x i64>, <4 x i64>)

define <4 x i64> @vror_vv_v4i64(<4 x i64> %a, <4 x i64> %b) {		define <4 x i64> @vror_vv_v4i64(<4 x i64> %a, <4 x i64> %b) {
; CHECK-RV32-LABEL: vror_vv_v4i64:		; CHECK-LABEL: vror_vv_v4i64:
; CHECK-RV32: # %bb.0:		; CHECK: # %bb.0:
; CHECK-RV32-NEXT: li a0, 63		; CHECK-NEXT: li a0, 63
; CHECK-RV32-NEXT: vsetivli zero, 4, e64, m2, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e64, m2, ta, ma
; CHECK-RV32-NEXT: vand.vx v12, v10, a0		; CHECK-NEXT: vand.vx v12, v10, a0
; CHECK-RV32-NEXT: vsrl.vv v12, v8, v12		; CHECK-NEXT: vsrl.vv v12, v8, v12
; CHECK-RV32-NEXT: vsetivli zero, 8, e32, m2, ta, ma		; CHECK-NEXT: vrsub.vi v10, v10, 0
; CHECK-RV32-NEXT: vmv.v.i v14, 0		; CHECK-NEXT: vand.vx v10, v10, a0
; CHECK-RV32-NEXT: vsetivli zero, 4, e64, m2, ta, ma		; CHECK-NEXT: vsll.vv v8, v8, v10
; CHECK-RV32-NEXT: vsub.vv v10, v14, v10		; CHECK-NEXT: vor.vv v8, v12, v8
; CHECK-RV32-NEXT: vand.vx v10, v10, a0		; CHECK-NEXT: ret
; CHECK-RV32-NEXT: vsll.vv v8, v8, v10
; CHECK-RV32-NEXT: vor.vv v8, v12, v8
; CHECK-RV32-NEXT: ret
;
; CHECK-RV64-LABEL: vror_vv_v4i64:
; CHECK-RV64: # %bb.0:
; CHECK-RV64-NEXT: li a0, 63
; CHECK-RV64-NEXT: vsetivli zero, 4, e64, m2, ta, ma
; CHECK-RV64-NEXT: vand.vx v12, v10, a0
; CHECK-RV64-NEXT: vsrl.vv v12, v8, v12
; CHECK-RV64-NEXT: vrsub.vi v10, v10, 0
; CHECK-RV64-NEXT: vand.vx v10, v10, a0
; CHECK-RV64-NEXT: vsll.vv v8, v8, v10
; CHECK-RV64-NEXT: vor.vv v8, v12, v8
; CHECK-RV64-NEXT: ret
;		;
; CHECK-ZVBB-LABEL: vror_vv_v4i64:		; CHECK-ZVBB-LABEL: vror_vv_v4i64:
; CHECK-ZVBB: # %bb.0:		; CHECK-ZVBB: # %bb.0:
; CHECK-ZVBB-NEXT: vsetivli zero, 4, e64, m2, ta, ma		; CHECK-ZVBB-NEXT: vsetivli zero, 4, e64, m2, ta, ma
; CHECK-ZVBB-NEXT: vror.vv v8, v8, v10		; CHECK-ZVBB-NEXT: vror.vv v8, v8, v10
; CHECK-ZVBB-NEXT: ret		; CHECK-ZVBB-NEXT: ret
%x = call <4 x i64> @llvm.fshr.v4i64(<4 x i64> %a, <4 x i64> %a, <4 x i64> %b)		%x = call <4 x i64> @llvm.fshr.v4i64(<4 x i64> %a, <4 x i64> %a, <4 x i64> %b)
ret <4 x i64> %x		ret <4 x i64> %x
}		}

define <4 x i64> @vror_vx_v4i64(<4 x i64> %a, i64 %b) {		define <4 x i64> @vror_vx_v4i64(<4 x i64> %a, i64 %b) {
; CHECK-RV32-LABEL: vror_vx_v4i64:		; CHECK-LABEL: vror_vx_v4i64:
; CHECK-RV32: # %bb.0:		; CHECK: # %bb.0:
; CHECK-RV32-NEXT: vsetivli zero, 4, e64, m2, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e64, m2, ta, ma
; CHECK-RV32-NEXT: vmv.v.x v10, a0		; CHECK-NEXT: vmv.v.x v10, a0
; CHECK-RV32-NEXT: li a1, 63		; CHECK-NEXT: li a0, 63
; CHECK-RV32-NEXT: vand.vx v10, v10, a1		; CHECK-NEXT: vand.vx v12, v10, a0
; CHECK-RV32-NEXT: vsrl.vv v10, v8, v10		; CHECK-NEXT: vsrl.vv v12, v8, v12
; CHECK-RV32-NEXT: vsetivli zero, 8, e32, m2, ta, ma		; CHECK-NEXT: vrsub.vi v10, v10, 0
; CHECK-RV32-NEXT: vmv.v.i v12, 0		; CHECK-NEXT: vand.vx v10, v10, a0
; CHECK-RV32-NEXT: vsetivli zero, 4, e64, m2, ta, ma		; CHECK-NEXT: vsll.vv v8, v8, v10
; CHECK-RV32-NEXT: vsub.vx v12, v12, a0		; CHECK-NEXT: vor.vv v8, v12, v8
; CHECK-RV32-NEXT: vand.vx v12, v12, a1		; CHECK-NEXT: ret
; CHECK-RV32-NEXT: vsll.vv v8, v8, v12
; CHECK-RV32-NEXT: vor.vv v8, v10, v8
; CHECK-RV32-NEXT: ret
;
; CHECK-RV64-LABEL: vror_vx_v4i64:
; CHECK-RV64: # %bb.0:
; CHECK-RV64-NEXT: vsetivli zero, 4, e64, m2, ta, ma
; CHECK-RV64-NEXT: vmv.v.x v10, a0
; CHECK-RV64-NEXT: li a0, 63
; CHECK-RV64-NEXT: vand.vx v12, v10, a0
; CHECK-RV64-NEXT: vsrl.vv v12, v8, v12
; CHECK-RV64-NEXT: vrsub.vi v10, v10, 0
; CHECK-RV64-NEXT: vand.vx v10, v10, a0
; CHECK-RV64-NEXT: vsll.vv v8, v8, v10
; CHECK-RV64-NEXT: vor.vv v8, v12, v8
; CHECK-RV64-NEXT: ret
;		;
; CHECK-ZVBB-LABEL: vror_vx_v4i64:		; CHECK-ZVBB-LABEL: vror_vx_v4i64:
; CHECK-ZVBB: # %bb.0:		; CHECK-ZVBB: # %bb.0:
; CHECK-ZVBB-NEXT: vsetivli zero, 4, e64, m2, ta, ma		; CHECK-ZVBB-NEXT: vsetivli zero, 4, e64, m2, ta, ma
; CHECK-ZVBB-NEXT: vror.vx v8, v8, a0		; CHECK-ZVBB-NEXT: vror.vx v8, v8, a0
; CHECK-ZVBB-NEXT: ret		; CHECK-ZVBB-NEXT: ret
%b.head = insertelement <4 x i64> poison, i64 %b, i32 0		%b.head = insertelement <4 x i64> poison, i64 %b, i32 0
%b.splat = shufflevector <4 x i64> %b.head, <4 x i64> poison, <4 x i32> zeroinitializer		%b.splat = shufflevector <4 x i64> %b.head, <4 x i64> poison, <4 x i32> zeroinitializer
%x = call <4 x i64> @llvm.fshr.v4i64(<4 x i64> %a, <4 x i64> %a, <4 x i64> %b.splat)		%x = call <4 x i64> @llvm.fshr.v4i64(<4 x i64> %a, <4 x i64> %a, <4 x i64> %b.splat)
ret <4 x i64> %x		ret <4 x i64> %x
}		}

define <4 x i64> @vror_vi_v4i64(<4 x i64> %a) {		define <4 x i64> @vror_vi_v4i64(<4 x i64> %a) {
; CHECK-RV32-LABEL: vror_vi_v4i64:		; CHECK-RV32-LABEL: vror_vi_v4i64:
; CHECK-RV32: # %bb.0:		; CHECK-RV32: # %bb.0:
; CHECK-RV32-NEXT: li a0, 63
; CHECK-RV32-NEXT: vsetivli zero, 4, e64, m2, ta, ma		; CHECK-RV32-NEXT: vsetivli zero, 4, e64, m2, ta, ma
; CHECK-RV32-NEXT: vmv.v.x v10, a0		; CHECK-RV32-NEXT: vmv.v.i v10, 1
; CHECK-RV32-NEXT: vand.vi v10, v10, 1		; CHECK-RV32-NEXT: vrsub.vi v10, v10, 0
; CHECK-RV32-NEXT: vsrl.vv v10, v8, v10		; CHECK-RV32-NEXT: li a0, 63
; CHECK-RV32-NEXT: vsetivli zero, 8, e32, m2, ta, ma		; CHECK-RV32-NEXT: vand.vx v10, v10, a0
; CHECK-RV32-NEXT: vmv.v.i v12, 0		; CHECK-RV32-NEXT: vsll.vv v10, v8, v10
; CHECK-RV32-NEXT: li a1, 1		; CHECK-RV32-NEXT: vmv.v.x v12, a0
; CHECK-RV32-NEXT: vsetivli zero, 4, e64, m2, ta, ma		; CHECK-RV32-NEXT: vand.vi v12, v12, 1
; CHECK-RV32-NEXT: vsub.vx v12, v12, a1		; CHECK-RV32-NEXT: vsrl.vv v8, v8, v12
; CHECK-RV32-NEXT: vand.vx v12, v12, a0		; CHECK-RV32-NEXT: vor.vv v8, v8, v10
; CHECK-RV32-NEXT: vsll.vv v8, v8, v12
; CHECK-RV32-NEXT: vor.vv v8, v10, v8
; CHECK-RV32-NEXT: ret		; CHECK-RV32-NEXT: ret
;		;
; CHECK-RV64-LABEL: vror_vi_v4i64:		; CHECK-RV64-LABEL: vror_vi_v4i64:
; CHECK-RV64: # %bb.0:		; CHECK-RV64: # %bb.0:
; CHECK-RV64-NEXT: li a0, 63		; CHECK-RV64-NEXT: li a0, 63
; CHECK-RV64-NEXT: vsetivli zero, 4, e64, m2, ta, ma		; CHECK-RV64-NEXT: vsetivli zero, 4, e64, m2, ta, ma
; CHECK-RV64-NEXT: vsll.vx v10, v8, a0		; CHECK-RV64-NEXT: vsll.vx v10, v8, a0
; CHECK-RV64-NEXT: vsrl.vi v8, v8, 1		; CHECK-RV64-NEXT: vsrl.vi v8, v8, 1
; CHECK-RV64-NEXT: vor.vv v8, v8, v10		; CHECK-RV64-NEXT: vor.vv v8, v8, v10
; CHECK-RV64-NEXT: ret		; CHECK-RV64-NEXT: ret
;		;
; CHECK-ZVBB-LABEL: vror_vi_v4i64:		; CHECK-ZVBB-LABEL: vror_vi_v4i64:
; CHECK-ZVBB: # %bb.0:		; CHECK-ZVBB: # %bb.0:
; CHECK-ZVBB-NEXT: vsetivli zero, 4, e64, m2, ta, ma		; CHECK-ZVBB-NEXT: vsetivli zero, 4, e64, m2, ta, ma
; CHECK-ZVBB-NEXT: vror.vi v8, v8, 1		; CHECK-ZVBB-NEXT: vror.vi v8, v8, 1
; CHECK-ZVBB-NEXT: ret		; CHECK-ZVBB-NEXT: ret
%x = call <4 x i64> @llvm.fshr.v4i64(<4 x i64> %a, <4 x i64> %a, <4 x i64> shufflevector(<4 x i64> insertelement(<4 x i64> poison, i64 1, i32 0), <4 x i64> poison, <4 x i32> zeroinitializer))		%x = call <4 x i64> @llvm.fshr.v4i64(<4 x i64> %a, <4 x i64> %a, <4 x i64> shufflevector(<4 x i64> insertelement(<4 x i64> poison, i64 1, i32 0), <4 x i64> poison, <4 x i32> zeroinitializer))
ret <4 x i64> %x		ret <4 x i64> %x
}		}

define <4 x i64> @vror_vi_rotl_v4i64(<4 x i64> %a) {		define <4 x i64> @vror_vi_rotl_v4i64(<4 x i64> %a) {
; CHECK-RV32-LABEL: vror_vi_rotl_v4i64:		; CHECK-RV32-LABEL: vror_vi_rotl_v4i64:
; CHECK-RV32: # %bb.0:		; CHECK-RV32: # %bb.0:
; CHECK-RV32-NEXT: li a0, 63
; CHECK-RV32-NEXT: vsetivli zero, 4, e64, m2, ta, ma
; CHECK-RV32-NEXT: vmv.v.x v10, a0
; CHECK-RV32-NEXT: vand.vi v10, v10, 1
; CHECK-RV32-NEXT: vsll.vv v10, v8, v10
; CHECK-RV32-NEXT: vsetivli zero, 8, e32, m2, ta, ma
; CHECK-RV32-NEXT: vmv.v.i v12, 0
; CHECK-RV32-NEXT: li a1, 1
; CHECK-RV32-NEXT: vsetivli zero, 4, e64, m2, ta, ma		; CHECK-RV32-NEXT: vsetivli zero, 4, e64, m2, ta, ma
; CHECK-RV32-NEXT: vsub.vx v12, v12, a1		; CHECK-RV32-NEXT: vmv.v.i v10, 1
; CHECK-RV32-NEXT: vand.vx v12, v12, a0		; CHECK-RV32-NEXT: vrsub.vi v10, v10, 0
; CHECK-RV32-NEXT: vsrl.vv v8, v8, v12		; CHECK-RV32-NEXT: li a0, 63
; CHECK-RV32-NEXT: vor.vv v8, v10, v8		; CHECK-RV32-NEXT: vand.vx v10, v10, a0
		; CHECK-RV32-NEXT: vsrl.vv v10, v8, v10
		; CHECK-RV32-NEXT: vmv.v.x v12, a0
		; CHECK-RV32-NEXT: vand.vi v12, v12, 1
		; CHECK-RV32-NEXT: vsll.vv v8, v8, v12
		; CHECK-RV32-NEXT: vor.vv v8, v8, v10
; CHECK-RV32-NEXT: ret		; CHECK-RV32-NEXT: ret
;		;
; CHECK-RV64-LABEL: vror_vi_rotl_v4i64:		; CHECK-RV64-LABEL: vror_vi_rotl_v4i64:
; CHECK-RV64: # %bb.0:		; CHECK-RV64: # %bb.0:
; CHECK-RV64-NEXT: li a0, 63		; CHECK-RV64-NEXT: li a0, 63
; CHECK-RV64-NEXT: vsetivli zero, 4, e64, m2, ta, ma		; CHECK-RV64-NEXT: vsetivli zero, 4, e64, m2, ta, ma
; CHECK-RV64-NEXT: vsrl.vx v10, v8, a0		; CHECK-RV64-NEXT: vsrl.vx v10, v8, a0
; CHECK-RV64-NEXT: vadd.vv v8, v8, v8		; CHECK-RV64-NEXT: vadd.vv v8, v8, v8
; CHECK-RV64-NEXT: vor.vv v8, v8, v10		; CHECK-RV64-NEXT: vor.vv v8, v8, v10
; CHECK-RV64-NEXT: ret		; CHECK-RV64-NEXT: ret
;		;
; CHECK-ZVBB-LABEL: vror_vi_rotl_v4i64:		; CHECK-ZVBB-LABEL: vror_vi_rotl_v4i64:
; CHECK-ZVBB: # %bb.0:		; CHECK-ZVBB: # %bb.0:
; CHECK-ZVBB-NEXT: vsetivli zero, 4, e64, m2, ta, ma		; CHECK-ZVBB-NEXT: vsetivli zero, 4, e64, m2, ta, ma
; CHECK-ZVBB-NEXT: vror.vi v8, v8, 63		; CHECK-ZVBB-NEXT: vror.vi v8, v8, 63
; CHECK-ZVBB-NEXT: ret		; CHECK-ZVBB-NEXT: ret
%x = call <4 x i64> @llvm.fshl.v4i64(<4 x i64> %a, <4 x i64> %a, <4 x i64> shufflevector(<4 x i64> insertelement(<4 x i64> poison, i64 1, i32 0), <4 x i64> poison, <4 x i32> zeroinitializer))		%x = call <4 x i64> @llvm.fshl.v4i64(<4 x i64> %a, <4 x i64> %a, <4 x i64> shufflevector(<4 x i64> insertelement(<4 x i64> poison, i64 1, i32 0), <4 x i64> poison, <4 x i32> zeroinitializer))
ret <4 x i64> %x		ret <4 x i64> %x
}		}

declare <8 x i64> @llvm.fshr.v8i64(<8 x i64>, <8 x i64>, <8 x i64>)		declare <8 x i64> @llvm.fshr.v8i64(<8 x i64>, <8 x i64>, <8 x i64>)
declare <8 x i64> @llvm.fshl.v8i64(<8 x i64>, <8 x i64>, <8 x i64>)		declare <8 x i64> @llvm.fshl.v8i64(<8 x i64>, <8 x i64>, <8 x i64>)

define <8 x i64> @vror_vv_v8i64(<8 x i64> %a, <8 x i64> %b) {		define <8 x i64> @vror_vv_v8i64(<8 x i64> %a, <8 x i64> %b) {
; CHECK-RV32-LABEL: vror_vv_v8i64:		; CHECK-LABEL: vror_vv_v8i64:
; CHECK-RV32: # %bb.0:		; CHECK: # %bb.0:
; CHECK-RV32-NEXT: li a0, 63		; CHECK-NEXT: li a0, 63
; CHECK-RV32-NEXT: vsetivli zero, 8, e64, m4, ta, ma		; CHECK-NEXT: vsetivli zero, 8, e64, m4, ta, ma
; CHECK-RV32-NEXT: vand.vx v16, v12, a0		; CHECK-NEXT: vand.vx v16, v12, a0
; CHECK-RV32-NEXT: vsrl.vv v16, v8, v16		; CHECK-NEXT: vsrl.vv v16, v8, v16
; CHECK-RV32-NEXT: vsetivli zero, 16, e32, m4, ta, ma		; CHECK-NEXT: vrsub.vi v12, v12, 0
; CHECK-RV32-NEXT: vmv.v.i v20, 0		; CHECK-NEXT: vand.vx v12, v12, a0
; CHECK-RV32-NEXT: vsetivli zero, 8, e64, m4, ta, ma		; CHECK-NEXT: vsll.vv v8, v8, v12
; CHECK-RV32-NEXT: vsub.vv v12, v20, v12		; CHECK-NEXT: vor.vv v8, v16, v8
; CHECK-RV32-NEXT: vand.vx v12, v12, a0		; CHECK-NEXT: ret
; CHECK-RV32-NEXT: vsll.vv v8, v8, v12
; CHECK-RV32-NEXT: vor.vv v8, v16, v8
; CHECK-RV32-NEXT: ret
;
; CHECK-RV64-LABEL: vror_vv_v8i64:
; CHECK-RV64: # %bb.0:
; CHECK-RV64-NEXT: li a0, 63
; CHECK-RV64-NEXT: vsetivli zero, 8, e64, m4, ta, ma
; CHECK-RV64-NEXT: vand.vx v16, v12, a0
; CHECK-RV64-NEXT: vsrl.vv v16, v8, v16
; CHECK-RV64-NEXT: vrsub.vi v12, v12, 0
; CHECK-RV64-NEXT: vand.vx v12, v12, a0
; CHECK-RV64-NEXT: vsll.vv v8, v8, v12
; CHECK-RV64-NEXT: vor.vv v8, v16, v8
; CHECK-RV64-NEXT: ret
;		;
; CHECK-ZVBB-LABEL: vror_vv_v8i64:		; CHECK-ZVBB-LABEL: vror_vv_v8i64:
; CHECK-ZVBB: # %bb.0:		; CHECK-ZVBB: # %bb.0:
; CHECK-ZVBB-NEXT: vsetivli zero, 8, e64, m4, ta, ma		; CHECK-ZVBB-NEXT: vsetivli zero, 8, e64, m4, ta, ma
; CHECK-ZVBB-NEXT: vror.vv v8, v8, v12		; CHECK-ZVBB-NEXT: vror.vv v8, v8, v12
; CHECK-ZVBB-NEXT: ret		; CHECK-ZVBB-NEXT: ret
%x = call <8 x i64> @llvm.fshr.v8i64(<8 x i64> %a, <8 x i64> %a, <8 x i64> %b)		%x = call <8 x i64> @llvm.fshr.v8i64(<8 x i64> %a, <8 x i64> %a, <8 x i64> %b)
ret <8 x i64> %x		ret <8 x i64> %x
}		}

define <8 x i64> @vror_vx_v8i64(<8 x i64> %a, i64 %b) {		define <8 x i64> @vror_vx_v8i64(<8 x i64> %a, i64 %b) {
; CHECK-RV32-LABEL: vror_vx_v8i64:		; CHECK-LABEL: vror_vx_v8i64:
; CHECK-RV32: # %bb.0:		; CHECK: # %bb.0:
; CHECK-RV32-NEXT: vsetivli zero, 8, e64, m4, ta, ma		; CHECK-NEXT: vsetivli zero, 8, e64, m4, ta, ma
; CHECK-RV32-NEXT: vmv.v.x v12, a0		; CHECK-NEXT: vmv.v.x v12, a0
; CHECK-RV32-NEXT: li a1, 63		; CHECK-NEXT: li a0, 63
; CHECK-RV32-NEXT: vand.vx v12, v12, a1		; CHECK-NEXT: vand.vx v16, v12, a0
; CHECK-RV32-NEXT: vsrl.vv v12, v8, v12		; CHECK-NEXT: vsrl.vv v16, v8, v16
; CHECK-RV32-NEXT: vsetivli zero, 16, e32, m4, ta, ma		; CHECK-NEXT: vrsub.vi v12, v12, 0
; CHECK-RV32-NEXT: vmv.v.i v16, 0		; CHECK-NEXT: vand.vx v12, v12, a0
; CHECK-RV32-NEXT: vsetivli zero, 8, e64, m4, ta, ma		; CHECK-NEXT: vsll.vv v8, v8, v12
; CHECK-RV32-NEXT: vsub.vx v16, v16, a0		; CHECK-NEXT: vor.vv v8, v16, v8
; CHECK-RV32-NEXT: vand.vx v16, v16, a1		; CHECK-NEXT: ret
; CHECK-RV32-NEXT: vsll.vv v8, v8, v16
; CHECK-RV32-NEXT: vor.vv v8, v12, v8
; CHECK-RV32-NEXT: ret
;
; CHECK-RV64-LABEL: vror_vx_v8i64:
; CHECK-RV64: # %bb.0:
; CHECK-RV64-NEXT: vsetivli zero, 8, e64, m4, ta, ma
; CHECK-RV64-NEXT: vmv.v.x v12, a0
; CHECK-RV64-NEXT: li a0, 63
; CHECK-RV64-NEXT: vand.vx v16, v12, a0
; CHECK-RV64-NEXT: vsrl.vv v16, v8, v16
; CHECK-RV64-NEXT: vrsub.vi v12, v12, 0
; CHECK-RV64-NEXT: vand.vx v12, v12, a0
; CHECK-RV64-NEXT: vsll.vv v8, v8, v12
; CHECK-RV64-NEXT: vor.vv v8, v16, v8
; CHECK-RV64-NEXT: ret
;		;
; CHECK-ZVBB-LABEL: vror_vx_v8i64:		; CHECK-ZVBB-LABEL: vror_vx_v8i64:
; CHECK-ZVBB: # %bb.0:		; CHECK-ZVBB: # %bb.0:
; CHECK-ZVBB-NEXT: vsetivli zero, 8, e64, m4, ta, ma		; CHECK-ZVBB-NEXT: vsetivli zero, 8, e64, m4, ta, ma
; CHECK-ZVBB-NEXT: vror.vx v8, v8, a0		; CHECK-ZVBB-NEXT: vror.vx v8, v8, a0
; CHECK-ZVBB-NEXT: ret		; CHECK-ZVBB-NEXT: ret
%b.head = insertelement <8 x i64> poison, i64 %b, i32 0		%b.head = insertelement <8 x i64> poison, i64 %b, i32 0
%b.splat = shufflevector <8 x i64> %b.head, <8 x i64> poison, <8 x i32> zeroinitializer		%b.splat = shufflevector <8 x i64> %b.head, <8 x i64> poison, <8 x i32> zeroinitializer
%x = call <8 x i64> @llvm.fshr.v8i64(<8 x i64> %a, <8 x i64> %a, <8 x i64> %b.splat)		%x = call <8 x i64> @llvm.fshr.v8i64(<8 x i64> %a, <8 x i64> %a, <8 x i64> %b.splat)
ret <8 x i64> %x		ret <8 x i64> %x
}		}

define <8 x i64> @vror_vi_v8i64(<8 x i64> %a) {		define <8 x i64> @vror_vi_v8i64(<8 x i64> %a) {
; CHECK-RV32-LABEL: vror_vi_v8i64:		; CHECK-RV32-LABEL: vror_vi_v8i64:
; CHECK-RV32: # %bb.0:		; CHECK-RV32: # %bb.0:
; CHECK-RV32-NEXT: li a0, 63
; CHECK-RV32-NEXT: vsetivli zero, 8, e64, m4, ta, ma		; CHECK-RV32-NEXT: vsetivli zero, 8, e64, m4, ta, ma
; CHECK-RV32-NEXT: vmv.v.x v12, a0		; CHECK-RV32-NEXT: vmv.v.i v12, 1
; CHECK-RV32-NEXT: vand.vi v12, v12, 1		; CHECK-RV32-NEXT: vrsub.vi v12, v12, 0
; CHECK-RV32-NEXT: vsrl.vv v12, v8, v12		; CHECK-RV32-NEXT: li a0, 63
; CHECK-RV32-NEXT: vsetivli zero, 16, e32, m4, ta, ma		; CHECK-RV32-NEXT: vand.vx v12, v12, a0
; CHECK-RV32-NEXT: vmv.v.i v16, 0		; CHECK-RV32-NEXT: vsll.vv v12, v8, v12
; CHECK-RV32-NEXT: li a1, 1		; CHECK-RV32-NEXT: vmv.v.x v16, a0
; CHECK-RV32-NEXT: vsetivli zero, 8, e64, m4, ta, ma		; CHECK-RV32-NEXT: vand.vi v16, v16, 1
; CHECK-RV32-NEXT: vsub.vx v16, v16, a1		; CHECK-RV32-NEXT: vsrl.vv v8, v8, v16
; CHECK-RV32-NEXT: vand.vx v16, v16, a0		; CHECK-RV32-NEXT: vor.vv v8, v8, v12
; CHECK-RV32-NEXT: vsll.vv v8, v8, v16
; CHECK-RV32-NEXT: vor.vv v8, v12, v8
; CHECK-RV32-NEXT: ret		; CHECK-RV32-NEXT: ret
;		;
; CHECK-RV64-LABEL: vror_vi_v8i64:		; CHECK-RV64-LABEL: vror_vi_v8i64:
; CHECK-RV64: # %bb.0:		; CHECK-RV64: # %bb.0:
; CHECK-RV64-NEXT: li a0, 63		; CHECK-RV64-NEXT: li a0, 63
; CHECK-RV64-NEXT: vsetivli zero, 8, e64, m4, ta, ma		; CHECK-RV64-NEXT: vsetivli zero, 8, e64, m4, ta, ma
; CHECK-RV64-NEXT: vsll.vx v12, v8, a0		; CHECK-RV64-NEXT: vsll.vx v12, v8, a0
; CHECK-RV64-NEXT: vsrl.vi v8, v8, 1		; CHECK-RV64-NEXT: vsrl.vi v8, v8, 1
; CHECK-RV64-NEXT: vor.vv v8, v8, v12		; CHECK-RV64-NEXT: vor.vv v8, v8, v12
; CHECK-RV64-NEXT: ret		; CHECK-RV64-NEXT: ret
;		;
; CHECK-ZVBB-LABEL: vror_vi_v8i64:		; CHECK-ZVBB-LABEL: vror_vi_v8i64:
; CHECK-ZVBB: # %bb.0:		; CHECK-ZVBB: # %bb.0:
; CHECK-ZVBB-NEXT: vsetivli zero, 8, e64, m4, ta, ma		; CHECK-ZVBB-NEXT: vsetivli zero, 8, e64, m4, ta, ma
; CHECK-ZVBB-NEXT: vror.vi v8, v8, 1		; CHECK-ZVBB-NEXT: vror.vi v8, v8, 1
; CHECK-ZVBB-NEXT: ret		; CHECK-ZVBB-NEXT: ret
%x = call <8 x i64> @llvm.fshr.v8i64(<8 x i64> %a, <8 x i64> %a, <8 x i64> shufflevector(<8 x i64> insertelement(<8 x i64> poison, i64 1, i32 0), <8 x i64> poison, <8 x i32> zeroinitializer))		%x = call <8 x i64> @llvm.fshr.v8i64(<8 x i64> %a, <8 x i64> %a, <8 x i64> shufflevector(<8 x i64> insertelement(<8 x i64> poison, i64 1, i32 0), <8 x i64> poison, <8 x i32> zeroinitializer))
ret <8 x i64> %x		ret <8 x i64> %x
}		}

define <8 x i64> @vror_vi_rotl_v8i64(<8 x i64> %a) {		define <8 x i64> @vror_vi_rotl_v8i64(<8 x i64> %a) {
; CHECK-RV32-LABEL: vror_vi_rotl_v8i64:		; CHECK-RV32-LABEL: vror_vi_rotl_v8i64:
; CHECK-RV32: # %bb.0:		; CHECK-RV32: # %bb.0:
; CHECK-RV32-NEXT: li a0, 63
; CHECK-RV32-NEXT: vsetivli zero, 8, e64, m4, ta, ma
; CHECK-RV32-NEXT: vmv.v.x v12, a0
; CHECK-RV32-NEXT: vand.vi v12, v12, 1
; CHECK-RV32-NEXT: vsll.vv v12, v8, v12
; CHECK-RV32-NEXT: vsetivli zero, 16, e32, m4, ta, ma
; CHECK-RV32-NEXT: vmv.v.i v16, 0
; CHECK-RV32-NEXT: li a1, 1
; CHECK-RV32-NEXT: vsetivli zero, 8, e64, m4, ta, ma		; CHECK-RV32-NEXT: vsetivli zero, 8, e64, m4, ta, ma
; CHECK-RV32-NEXT: vsub.vx v16, v16, a1		; CHECK-RV32-NEXT: vmv.v.i v12, 1
; CHECK-RV32-NEXT: vand.vx v16, v16, a0		; CHECK-RV32-NEXT: vrsub.vi v12, v12, 0
; CHECK-RV32-NEXT: vsrl.vv v8, v8, v16		; CHECK-RV32-NEXT: li a0, 63
; CHECK-RV32-NEXT: vor.vv v8, v12, v8		; CHECK-RV32-NEXT: vand.vx v12, v12, a0
		; CHECK-RV32-NEXT: vsrl.vv v12, v8, v12
		; CHECK-RV32-NEXT: vmv.v.x v16, a0
		; CHECK-RV32-NEXT: vand.vi v16, v16, 1
		; CHECK-RV32-NEXT: vsll.vv v8, v8, v16
		; CHECK-RV32-NEXT: vor.vv v8, v8, v12
; CHECK-RV32-NEXT: ret		; CHECK-RV32-NEXT: ret
;		;
; CHECK-RV64-LABEL: vror_vi_rotl_v8i64:		; CHECK-RV64-LABEL: vror_vi_rotl_v8i64:
; CHECK-RV64: # %bb.0:		; CHECK-RV64: # %bb.0:
; CHECK-RV64-NEXT: li a0, 63		; CHECK-RV64-NEXT: li a0, 63
; CHECK-RV64-NEXT: vsetivli zero, 8, e64, m4, ta, ma		; CHECK-RV64-NEXT: vsetivli zero, 8, e64, m4, ta, ma
; CHECK-RV64-NEXT: vsrl.vx v12, v8, a0		; CHECK-RV64-NEXT: vsrl.vx v12, v8, a0
; CHECK-RV64-NEXT: vadd.vv v8, v8, v8		; CHECK-RV64-NEXT: vadd.vv v8, v8, v8
Show All 15 Lines