Diff 380991

llvm/lib/CodeGen/SelectionDAG/TargetLowering.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

//===-- TargetLowering.cpp - Implement the TargetLowering class -----------===//		//===-- TargetLowering.cpp - Implement the TargetLowering class -----------===//
		Lint: Lint Inline Actions clang-format not found in user’s local PATH; not linting file. Lint: Lint: clang-format not found in user’s local PATH; not linting file.
//		//
// Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.		// Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.
// See https://llvm.org/LICENSE.txt for license information.		// See https://llvm.org/LICENSE.txt for license information.
// SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception		// SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception
//		//
//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//
//		//
▲ Show 20 Lines • Show All 7,055 Lines • ▼ Show 20 Lines	bool TargetLowering::expandCTLZ(SDNode *Node, SDValue &Result,

// If the ZERO_UNDEF version is supported use that and handle the zero case.		// If the ZERO_UNDEF version is supported use that and handle the zero case.
if (isOperationLegalOrCustom(ISD::CTLZ_ZERO_UNDEF, VT)) {		if (isOperationLegalOrCustom(ISD::CTLZ_ZERO_UNDEF, VT)) {
EVT SetCCVT =		EVT SetCCVT =
getSetCCResultType(DAG.getDataLayout(), *DAG.getContext(), VT);		getSetCCResultType(DAG.getDataLayout(), *DAG.getContext(), VT);
SDValue CTLZ = DAG.getNode(ISD::CTLZ_ZERO_UNDEF, dl, VT, Op);		SDValue CTLZ = DAG.getNode(ISD::CTLZ_ZERO_UNDEF, dl, VT, Op);
SDValue Zero = DAG.getConstant(0, dl, VT);		SDValue Zero = DAG.getConstant(0, dl, VT);
SDValue SrcIsZero = DAG.getSetCC(dl, SetCCVT, Op, Zero, ISD::SETEQ);		SDValue SrcIsZero = DAG.getSetCC(dl, SetCCVT, Op, Zero, ISD::SETEQ);
Result = DAG.getNode(ISD::SELECT, dl, VT, SrcIsZero,		Result = DAG.getSelect(dl, VT, SrcIsZero,
DAG.getConstant(NumBitsPerElt, dl, VT), CTLZ);		DAG.getConstant(NumBitsPerElt, dl, VT), CTLZ);
		craig.topperAuthorUnsubmitted Done Reply Inline Actions This is needed to get VSELECT for vectors. craig.topper: This is needed to get VSELECT for vectors.
return true;		return true;
}		}

// Only expand vector types if we have the appropriate vector bit operations.		// Only expand vector types if we have the appropriate vector bit operations.
// This includes the operations needed to expand CTPOP if it isn't supported.		// This includes the operations needed to expand CTPOP if it isn't supported.
if (VT.isVector() && (!isPowerOf2_32(NumBitsPerElt) \|\|		if (VT.isVector() && (!isPowerOf2_32(NumBitsPerElt) \|\|
(!isOperationLegalOrCustom(ISD::CTPOP, VT) &&		(!isOperationLegalOrCustom(ISD::CTPOP, VT) &&
!canExpandVectorCTPOP(*this, VT)) \|\|		!canExpandVectorCTPOP(*this, VT)) \|\|
Show All 36 Lines	bool TargetLowering::expandCTTZ(SDNode *Node, SDValue &Result,

// If the ZERO_UNDEF version is supported use that and handle the zero case.		// If the ZERO_UNDEF version is supported use that and handle the zero case.
if (isOperationLegalOrCustom(ISD::CTTZ_ZERO_UNDEF, VT)) {		if (isOperationLegalOrCustom(ISD::CTTZ_ZERO_UNDEF, VT)) {
EVT SetCCVT =		EVT SetCCVT =
getSetCCResultType(DAG.getDataLayout(), *DAG.getContext(), VT);		getSetCCResultType(DAG.getDataLayout(), *DAG.getContext(), VT);
SDValue CTTZ = DAG.getNode(ISD::CTTZ_ZERO_UNDEF, dl, VT, Op);		SDValue CTTZ = DAG.getNode(ISD::CTTZ_ZERO_UNDEF, dl, VT, Op);
SDValue Zero = DAG.getConstant(0, dl, VT);		SDValue Zero = DAG.getConstant(0, dl, VT);
SDValue SrcIsZero = DAG.getSetCC(dl, SetCCVT, Op, Zero, ISD::SETEQ);		SDValue SrcIsZero = DAG.getSetCC(dl, SetCCVT, Op, Zero, ISD::SETEQ);
Result = DAG.getNode(ISD::SELECT, dl, VT, SrcIsZero,		Result = DAG.getSelect(dl, VT, SrcIsZero,
DAG.getConstant(NumBitsPerElt, dl, VT), CTTZ);		DAG.getConstant(NumBitsPerElt, dl, VT), CTTZ);
		craig.topperAuthorUnsubmitted Done Reply Inline Actions This isn't tested by this patch but makes it consistent with CTLZ. craig.topper: This isn't tested by this patch but makes it consistent with CTLZ.
return true;		return true;
}		}

// Only expand vector types if we have the appropriate vector bit operations.		// Only expand vector types if we have the appropriate vector bit operations.
// This includes the operations needed to expand CTPOP if it isn't supported.		// This includes the operations needed to expand CTPOP if it isn't supported.
if (VT.isVector() && (!isPowerOf2_32(NumBitsPerElt) \|\|		if (VT.isVector() && (!isPowerOf2_32(NumBitsPerElt) \|\|
(!isOperationLegalOrCustom(ISD::CTPOP, VT) &&		(!isOperationLegalOrCustom(ISD::CTPOP, VT) &&
!isOperationLegalOrCustom(ISD::CTLZ, VT) &&		!isOperationLegalOrCustom(ISD::CTLZ, VT) &&
▲ Show 20 Lines • Show All 1,845 Lines • Show Last 20 Lines

llvm/lib/Target/RISCV/RISCVISelLowering.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

//===-- RISCVISelLowering.cpp - RISCV DAG Lowering Implementation --------===//		//===-- RISCVISelLowering.cpp - RISCV DAG Lowering Implementation --------===//
		Lint: Lint Inline Actions clang-format not found in user’s local PATH; not linting file. Lint: Lint: clang-format not found in user’s local PATH; not linting file.
//		//
// Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.		// Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.
// See https://llvm.org/LICENSE.txt for license information.		// See https://llvm.org/LICENSE.txt for license information.
// SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception		// SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception
//		//
//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//
//		//
▲ Show 20 Lines • Show All 590 Lines • ▼ Show 20 Lines	for (MVT VT : IntVecVTs) {

for (MVT OtherVT : MVT::integer_scalable_vector_valuetypes()) {		for (MVT OtherVT : MVT::integer_scalable_vector_valuetypes()) {
setTruncStoreAction(VT, OtherVT, Expand);		setTruncStoreAction(VT, OtherVT, Expand);
setLoadExtAction(ISD::EXTLOAD, OtherVT, VT, Expand);		setLoadExtAction(ISD::EXTLOAD, OtherVT, VT, Expand);
setLoadExtAction(ISD::SEXTLOAD, OtherVT, VT, Expand);		setLoadExtAction(ISD::SEXTLOAD, OtherVT, VT, Expand);
setLoadExtAction(ISD::ZEXTLOAD, OtherVT, VT, Expand);		setLoadExtAction(ISD::ZEXTLOAD, OtherVT, VT, Expand);
}		}
}		}

		frasercrmckUnsubmitted Not Done Reply Inline Actions Could maybe update this comment to use the actual ISD names for both nodes we're dealing with. frasercrmck: Could maybe update this comment to use the actual ISD names for both nodes we're dealing with.
// Expand various CCs to best match the RVV ISA, which natively supports UNE		// Expand various CCs to best match the RVV ISA, which natively supports UNE
// but no other unordered comparisons, and supports all ordered comparisons		// but no other unordered comparisons, and supports all ordered comparisons
// except ONE. Additionally, we expand GT,OGT,GE,OGE for optimization		// except ONE. Additionally, we expand GT,OGT,GE,OGE for optimization
// purposes; they are expanded to their swapped-operand CCs (LT,OLT,LE,OLE),		// purposes; they are expanded to their swapped-operand CCs (LT,OLT,LE,OLE),
// and we pattern-match those back to the "original", swapping operands once		// and we pattern-match those back to the "original", swapping operands once
// more. This way we catch both operations and both "vf" and "fv" forms with		// more. This way we catch both operations and both "vf" and "fv" forms with
// fewer patterns.		// fewer patterns.
static const ISD::CondCode VFPCCToExpand[] = {		static const ISD::CondCode VFPCCToExpand[] = {
▲ Show 20 Lines • Show All 198 Lines • ▼ Show 20 Lines	if (Subtarget.useRVVForFixedLengthVectors()) {
// Custom-lower reduction operations to set up the corresponding custom		// Custom-lower reduction operations to set up the corresponding custom
// nodes' operands.		// nodes' operands.
setOperationAction(ISD::VECREDUCE_ADD, VT, Custom);		setOperationAction(ISD::VECREDUCE_ADD, VT, Custom);
setOperationAction(ISD::VECREDUCE_SMAX, VT, Custom);		setOperationAction(ISD::VECREDUCE_SMAX, VT, Custom);
setOperationAction(ISD::VECREDUCE_SMIN, VT, Custom);		setOperationAction(ISD::VECREDUCE_SMIN, VT, Custom);
setOperationAction(ISD::VECREDUCE_UMAX, VT, Custom);		setOperationAction(ISD::VECREDUCE_UMAX, VT, Custom);
setOperationAction(ISD::VECREDUCE_UMIN, VT, Custom);		setOperationAction(ISD::VECREDUCE_UMIN, VT, Custom);

		// Lower CTLZ_UNDEF if we have a floating point type that can represent
		// the value exactly.
		if (((VT.getVectorElementType() == MVT::i8 \|\|
		VT.getVectorElementType() == MVT::i16) &&
		Subtarget.hasStdExtF()) \|\|
		(VT.getVectorElementType() == MVT::i32 && Subtarget.hasStdExtD())) {
		setOperationAction(ISD::CTLZ_ZERO_UNDEF, VT, Custom);
		setOperationAction(ISD::CTTZ_ZERO_UNDEF, VT, Custom);
		}

for (unsigned VPOpc : IntegerVPOps)		for (unsigned VPOpc : IntegerVPOps)
setOperationAction(VPOpc, VT, Custom);		setOperationAction(VPOpc, VT, Custom);
}		}

		frasercrmckUnsubmitted Not Done Reply Inline Actions Same here as above. frasercrmck: Same here as above.
for (MVT VT : MVT::fp_fixedlen_vector_valuetypes()) {		for (MVT VT : MVT::fp_fixedlen_vector_valuetypes()) {
if (!useRVVForFixedLengthVectorVT(VT))		if (!useRVVForFixedLengthVectorVT(VT))
continue;		continue;

// By default everything must be expanded.		// By default everything must be expanded.
for (unsigned Op = 0; Op < ISD::BUILTIN_OP_END; ++Op)		for (unsigned Op = 0; Op < ISD::BUILTIN_OP_END; ++Op)
setOperationAction(Op, VT, Expand);		setOperationAction(Op, VT, Expand);
for (MVT OtherVT : MVT::fp_fixedlen_vector_valuetypes()) {		for (MVT OtherVT : MVT::fp_fixedlen_vector_valuetypes()) {
▲ Show 20 Lines • Show All 1,439 Lines • ▼ Show 20 Lines	static SDValue getRVVFPExtendOrRound(SDValue Op, MVT VT, MVT ContainerVT,
SDValue Mask, VL;		SDValue Mask, VL;
std::tie(Mask, VL) = getDefaultVLOps(VT, ContainerVT, DL, DAG, Subtarget);		std::tie(Mask, VL) = getDefaultVLOps(VT, ContainerVT, DL, DAG, Subtarget);
unsigned RVVOpc = ContainerVT.bitsGT(Op.getSimpleValueType())		unsigned RVVOpc = ContainerVT.bitsGT(Op.getSimpleValueType())
? RISCVISD::FP_EXTEND_VL		? RISCVISD::FP_EXTEND_VL
: RISCVISD::FP_ROUND_VL;		: RISCVISD::FP_ROUND_VL;
return DAG.getNode(RVVOpc, DL, ContainerVT, Op, Mask, VL);		return DAG.getNode(RVVOpc, DL, ContainerVT, Op, Mask, VL);
}		}

		// Lower CTLZ_ZERO_UNDEF or CTTZ_ZERO_UNDEF by converting to FP and extracting
		// the exponent.
		static SDValue lowerCTLZ_CTTZ_ZERO_UNDEF(SDValue Op, SelectionDAG &DAG) {
		MVT VT = Op.getSimpleValueType();
		unsigned EltSize = VT.getScalarSizeInBits();
		SDValue Src = Op.getOperand(0);
		SDLoc DL(Op);

		// We need a FP type that can represent the value.
		MVT FloatEltVT = EltSize == 32 ? MVT::f64 : MVT::f32;
		EVT FloatVT = EVT::getVectorVT(*DAG.getContext(), FloatEltVT,
		VT.getVectorElementCount());

		// Make sure the float type is legal. If not, split the operation in half.
		frasercrmckUnsubmitted Not Done Reply Inline Actions This comment seems stale since we're no longer falling back. frasercrmck: This comment seems stale since we're no longer falling back.
		// FIXME: Not all of the operations in the final sequence need to be split.
		// We need something like X86's SplitOpsAndApply.
		const TargetLowering &TLI = DAG.getTargetLoweringInfo();
		if (!TLI.isTypeLegal(FloatVT)) {
		SDValue Lo, Hi;
		std::tie(Lo, Hi) = DAG.SplitVector(Src, DL);

		EVT LoVT, HiVT;
		std::tie(LoVT, HiVT) = DAG.GetSplitDestVTs(VT);
		return DAG.getNode(ISD::CONCAT_VECTORS, DL, VT,
		DAG.getNode(Op.getOpcode(), DL, LoVT, Lo),
		DAG.getNode(Op.getOpcode(), DL, HiVT, Hi));
		}

		// For CTTZ_ZERO_UNDEF, we need to extract the lowest set bit using X & -X.
		// The trailing zero count is equal to log2 of this single bit value.
		if (Op.getOpcode() == ISD::CTTZ_ZERO_UNDEF) {
		SDValue Neg =
		DAG.getNode(ISD::SUB, DL, VT, DAG.getConstant(0, DL, VT), Src);
		Src = DAG.getNode(ISD::AND, DL, VT, Src, Neg);
		}

		// We have a legal FP type, convert to it.
		SDValue FloatVal = DAG.getNode(ISD::UINT_TO_FP, DL, FloatVT, Src);
		// Bitcast to integer and shift the exponent to the LSB.
		EVT IntVT = FloatVT.changeVectorElementTypeToInteger();
		SDValue Bitcast = DAG.getBitcast(IntVT, FloatVal);
		unsigned ShiftAmt = FloatEltVT == MVT::f64 ? 52 : 23;
		SDValue Shift = DAG.getNode(ISD::SRL, DL, IntVT, Bitcast,
		DAG.getConstant(ShiftAmt, DL, IntVT));
		// Truncate back to original type to allow vnsrl.
		SDValue Trunc = DAG.getNode(ISD::TRUNCATE, DL, VT, Shift);
		// The exponent contains log2 of the value in biased form.
		unsigned ExponentBias = FloatEltVT == MVT::f64 ? 1023 : 127;

		// For trailing zeros, we just need to subtract the bias.
		if (Op.getOpcode() == ISD::CTTZ_ZERO_UNDEF)
		return DAG.getNode(ISD::SUB, DL, VT, Trunc,
		DAG.getConstant(ExponentBias, DL, VT));

		// For leading zeros, we need to remove the bias and convert from log2 to
		// leading zeros. We can do this by subtracting from (Bias + (EltSize - 1)).
		unsigned Adjust = ExponentBias + (EltSize - 1);
		return DAG.getNode(ISD::SUB, DL, VT, DAG.getConstant(Adjust, DL, VT), Trunc);
		}

// While RVV has alignment restrictions, we should always be able to load as a		// While RVV has alignment restrictions, we should always be able to load as a
// legal equivalently-sized byte-typed vector instead. This method is		// legal equivalently-sized byte-typed vector instead. This method is
// responsible for re-expressing a ISD::LOAD via a correctly-aligned type. If		// responsible for re-expressing a ISD::LOAD via a correctly-aligned type. If
// the load is already correctly-aligned, it returns SDValue().		// the load is already correctly-aligned, it returns SDValue().
SDValue RISCVTargetLowering::expandUnalignedRVVLoad(SDValue Op,		SDValue RISCVTargetLowering::expandUnalignedRVVLoad(SDValue Op,
SelectionDAG &DAG) const {		SelectionDAG &DAG) const {
auto *Load = cast<LoadSDNode>(Op);		auto *Load = cast<LoadSDNode>(Op);
assert(Load && Load->getMemoryVT().isVector() && "Expected vector load");		assert(Load && Load->getMemoryVT().isVector() && "Expected vector load");
▲ Show 20 Lines • Show All 598 Lines • ▼ Show 20 Lines	SDValue RISCVTargetLowering::LowerOperation(SDValue Op,
case ISD::UMAX:		case ISD::UMAX:
return lowerToScalableOp(Op, DAG, RISCVISD::UMAX_VL);		return lowerToScalableOp(Op, DAG, RISCVISD::UMAX_VL);
case ISD::FMINNUM:		case ISD::FMINNUM:
return lowerToScalableOp(Op, DAG, RISCVISD::FMINNUM_VL);		return lowerToScalableOp(Op, DAG, RISCVISD::FMINNUM_VL);
case ISD::FMAXNUM:		case ISD::FMAXNUM:
return lowerToScalableOp(Op, DAG, RISCVISD::FMAXNUM_VL);		return lowerToScalableOp(Op, DAG, RISCVISD::FMAXNUM_VL);
case ISD::ABS:		case ISD::ABS:
return lowerABS(Op, DAG);		return lowerABS(Op, DAG);
		case ISD::CTLZ_ZERO_UNDEF:
		case ISD::CTTZ_ZERO_UNDEF:
		return lowerCTLZ_CTTZ_ZERO_UNDEF(Op, DAG);
case ISD::VSELECT:		case ISD::VSELECT:
return lowerFixedLengthVectorSelectToRVV(Op, DAG);		return lowerFixedLengthVectorSelectToRVV(Op, DAG);
case ISD::FCOPYSIGN:		case ISD::FCOPYSIGN:
return lowerFixedLengthVectorFCOPYSIGNToRVV(Op, DAG);		return lowerFixedLengthVectorFCOPYSIGNToRVV(Op, DAG);
case ISD::MGATHER:		case ISD::MGATHER:
case ISD::VP_GATHER:		case ISD::VP_GATHER:
return lowerMaskedGather(Op, DAG);		return lowerMaskedGather(Op, DAG);
case ISD::MSCATTER:		case ISD::MSCATTER:
▲ Show 20 Lines • Show All 7,014 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-ctlz.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc -mtriple=riscv32 -mattr=+m,+experimental-v -riscv-v-vector-bits-min=128 -riscv-v-fixed-length-vector-lmul-max=2 -verify-machineinstrs < %s \| FileCheck %s --check-prefixes=LMULMAX2-RV32			; RUN: llc -mtriple=riscv32 -mattr=+m,+experimental-v -riscv-v-vector-bits-min=128 -riscv-v-fixed-length-vector-lmul-max=2 -verify-machineinstrs < %s \| FileCheck %s --check-prefixes=LMULMAX2-RV32,LMULMAX2-RV32I
	; RUN: llc -mtriple=riscv64 -mattr=+m,+experimental-v -riscv-v-vector-bits-min=128 -riscv-v-fixed-length-vector-lmul-max=2 -verify-machineinstrs < %s \| FileCheck %s --check-prefixes=LMULMAX2-RV64			; RUN: llc -mtriple=riscv64 -mattr=+m,+experimental-v -riscv-v-vector-bits-min=128 -riscv-v-fixed-length-vector-lmul-max=2 -verify-machineinstrs < %s \| FileCheck %s --check-prefixes=LMULMAX2-RV64,LMULMAX2-RV64I
	; RUN: llc -mtriple=riscv32 -mattr=+m,+experimental-v -riscv-v-vector-bits-min=128 -riscv-v-fixed-length-vector-lmul-max=1 -verify-machineinstrs < %s \| FileCheck %s --check-prefixes=LMULMAX1-RV32			; RUN: llc -mtriple=riscv32 -mattr=+m,+experimental-v -riscv-v-vector-bits-min=128 -riscv-v-fixed-length-vector-lmul-max=1 -verify-machineinstrs < %s \| FileCheck %s --check-prefixes=LMULMAX1-RV32,LMULMAX1-RV32I
	; RUN: llc -mtriple=riscv64 -mattr=+m,+experimental-v -riscv-v-vector-bits-min=128 -riscv-v-fixed-length-vector-lmul-max=1 -verify-machineinstrs < %s \| FileCheck %s --check-prefixes=LMULMAX1-RV64			; RUN: llc -mtriple=riscv64 -mattr=+m,+experimental-v -riscv-v-vector-bits-min=128 -riscv-v-fixed-length-vector-lmul-max=1 -verify-machineinstrs < %s \| FileCheck %s --check-prefixes=LMULMAX1-RV64,LMULMAX1-RV32I
				; RUN: llc -mtriple=riscv32 -mattr=+m,+experimental-v,+d -riscv-v-vector-bits-min=128 -riscv-v-fixed-length-vector-lmul-max=2 -verify-machineinstrs < %s \| FileCheck %s --check-prefixes=LMULMAX2-RV32,LMULMAX2-RV32D
				; RUN: llc -mtriple=riscv64 -mattr=+m,+experimental-v,+d -riscv-v-vector-bits-min=128 -riscv-v-fixed-length-vector-lmul-max=2 -verify-machineinstrs < %s \| FileCheck %s --check-prefixes=LMULMAX2-RV64,LMULMAX2-RV64D
				; RUN: llc -mtriple=riscv32 -mattr=+m,+experimental-v,+d -riscv-v-vector-bits-min=128 -riscv-v-fixed-length-vector-lmul-max=1 -verify-machineinstrs < %s \| FileCheck %s --check-prefixes=LMULMAX1-RV32,LMULMAX1-RV32D
				; RUN: llc -mtriple=riscv64 -mattr=+m,+experimental-v,+d -riscv-v-vector-bits-min=128 -riscv-v-fixed-length-vector-lmul-max=1 -verify-machineinstrs < %s \| FileCheck %s --check-prefixes=LMULMAX1-RV64,LMULMAX1-RV64D
				; RUN: llc -mtriple=riscv32 -mattr=+m,+experimental-v,+d -riscv-v-vector-bits-min=128 -riscv-v-fixed-length-vector-lmul-max=8 -verify-machineinstrs < %s \| FileCheck %s --check-prefixes=LMULMAX8-RV32
				; RUN: llc -mtriple=riscv64 -mattr=+m,+experimental-v,+d -riscv-v-vector-bits-min=128 -riscv-v-fixed-length-vector-lmul-max=8 -verify-machineinstrs < %s \| FileCheck %s --check-prefixes=LMULMAX8-RV64

	define void @ctlz_v16i8(<16 x i8>* %x, <16 x i8>* %y) nounwind {			define void @ctlz_v16i8(<16 x i8>* %x, <16 x i8>* %y) nounwind {
	; LMULMAX2-RV32-LABEL: ctlz_v16i8:			; LMULMAX2-RV32I-LABEL: ctlz_v16i8:
	; LMULMAX2-RV32: # %bb.0:			; LMULMAX2-RV32I: # %bb.0:
	; LMULMAX2-RV32-NEXT: vsetivli zero, 16, e8, m1, ta, mu			; LMULMAX2-RV32I-NEXT: vsetivli zero, 16, e8, m1, ta, mu
	; LMULMAX2-RV32-NEXT: vle8.v v8, (a0)			; LMULMAX2-RV32I-NEXT: vle8.v v8, (a0)
	; LMULMAX2-RV32-NEXT: vsrl.vi v9, v8, 1			; LMULMAX2-RV32I-NEXT: vsrl.vi v9, v8, 1
	; LMULMAX2-RV32-NEXT: vor.vv v8, v8, v9			; LMULMAX2-RV32I-NEXT: vor.vv v8, v8, v9
	; LMULMAX2-RV32-NEXT: vsrl.vi v9, v8, 2			; LMULMAX2-RV32I-NEXT: vsrl.vi v9, v8, 2
	; LMULMAX2-RV32-NEXT: vor.vv v8, v8, v9			; LMULMAX2-RV32I-NEXT: vor.vv v8, v8, v9
	; LMULMAX2-RV32-NEXT: vsrl.vi v9, v8, 4			; LMULMAX2-RV32I-NEXT: vsrl.vi v9, v8, 4
	; LMULMAX2-RV32-NEXT: vor.vv v8, v8, v9			; LMULMAX2-RV32I-NEXT: vor.vv v8, v8, v9
	; LMULMAX2-RV32-NEXT: vxor.vi v8, v8, -1			; LMULMAX2-RV32I-NEXT: vxor.vi v8, v8, -1
	; LMULMAX2-RV32-NEXT: vsrl.vi v9, v8, 1			; LMULMAX2-RV32I-NEXT: vsrl.vi v9, v8, 1
	; LMULMAX2-RV32-NEXT: addi a1, zero, 85			; LMULMAX2-RV32I-NEXT: addi a1, zero, 85
	; LMULMAX2-RV32-NEXT: vand.vx v9, v9, a1			; LMULMAX2-RV32I-NEXT: vand.vx v9, v9, a1
	; LMULMAX2-RV32-NEXT: vsub.vv v8, v8, v9			; LMULMAX2-RV32I-NEXT: vsub.vv v8, v8, v9
	; LMULMAX2-RV32-NEXT: addi a1, zero, 51			; LMULMAX2-RV32I-NEXT: addi a1, zero, 51
	; LMULMAX2-RV32-NEXT: vand.vx v9, v8, a1			; LMULMAX2-RV32I-NEXT: vand.vx v9, v8, a1
	; LMULMAX2-RV32-NEXT: vsrl.vi v8, v8, 2			; LMULMAX2-RV32I-NEXT: vsrl.vi v8, v8, 2
	; LMULMAX2-RV32-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV32I-NEXT: vand.vx v8, v8, a1
	; LMULMAX2-RV32-NEXT: vadd.vv v8, v9, v8			; LMULMAX2-RV32I-NEXT: vadd.vv v8, v9, v8
	; LMULMAX2-RV32-NEXT: vsrl.vi v9, v8, 4			; LMULMAX2-RV32I-NEXT: vsrl.vi v9, v8, 4
	; LMULMAX2-RV32-NEXT: vadd.vv v8, v8, v9			; LMULMAX2-RV32I-NEXT: vadd.vv v8, v8, v9
	; LMULMAX2-RV32-NEXT: vand.vi v8, v8, 15			; LMULMAX2-RV32I-NEXT: vand.vi v8, v8, 15
	; LMULMAX2-RV32-NEXT: vse8.v v8, (a0)			; LMULMAX2-RV32I-NEXT: vse8.v v8, (a0)
	; LMULMAX2-RV32-NEXT: ret			; LMULMAX2-RV32I-NEXT: ret
	;			;
	; LMULMAX2-RV64-LABEL: ctlz_v16i8:			; LMULMAX2-RV64I-LABEL: ctlz_v16i8:
	; LMULMAX2-RV64: # %bb.0:			; LMULMAX2-RV64I: # %bb.0:
	; LMULMAX2-RV64-NEXT: vsetivli zero, 16, e8, m1, ta, mu			; LMULMAX2-RV64I-NEXT: vsetivli zero, 16, e8, m1, ta, mu
	; LMULMAX2-RV64-NEXT: vle8.v v8, (a0)			; LMULMAX2-RV64I-NEXT: vle8.v v8, (a0)
	; LMULMAX2-RV64-NEXT: vsrl.vi v9, v8, 1			; LMULMAX2-RV64I-NEXT: vsrl.vi v9, v8, 1
	; LMULMAX2-RV64-NEXT: vor.vv v8, v8, v9			; LMULMAX2-RV64I-NEXT: vor.vv v8, v8, v9
	; LMULMAX2-RV64-NEXT: vsrl.vi v9, v8, 2			; LMULMAX2-RV64I-NEXT: vsrl.vi v9, v8, 2
	; LMULMAX2-RV64-NEXT: vor.vv v8, v8, v9			; LMULMAX2-RV64I-NEXT: vor.vv v8, v8, v9
	; LMULMAX2-RV64-NEXT: vsrl.vi v9, v8, 4			; LMULMAX2-RV64I-NEXT: vsrl.vi v9, v8, 4
	; LMULMAX2-RV64-NEXT: vor.vv v8, v8, v9			; LMULMAX2-RV64I-NEXT: vor.vv v8, v8, v9
	; LMULMAX2-RV64-NEXT: vxor.vi v8, v8, -1			; LMULMAX2-RV64I-NEXT: vxor.vi v8, v8, -1
	; LMULMAX2-RV64-NEXT: vsrl.vi v9, v8, 1			; LMULMAX2-RV64I-NEXT: vsrl.vi v9, v8, 1
	; LMULMAX2-RV64-NEXT: addi a1, zero, 85			; LMULMAX2-RV64I-NEXT: addi a1, zero, 85
	; LMULMAX2-RV64-NEXT: vand.vx v9, v9, a1			; LMULMAX2-RV64I-NEXT: vand.vx v9, v9, a1
	; LMULMAX2-RV64-NEXT: vsub.vv v8, v8, v9			; LMULMAX2-RV64I-NEXT: vsub.vv v8, v8, v9
	; LMULMAX2-RV64-NEXT: addi a1, zero, 51			; LMULMAX2-RV64I-NEXT: addi a1, zero, 51
	; LMULMAX2-RV64-NEXT: vand.vx v9, v8, a1			; LMULMAX2-RV64I-NEXT: vand.vx v9, v8, a1
	; LMULMAX2-RV64-NEXT: vsrl.vi v8, v8, 2			; LMULMAX2-RV64I-NEXT: vsrl.vi v8, v8, 2
	; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV64I-NEXT: vand.vx v8, v8, a1
	; LMULMAX2-RV64-NEXT: vadd.vv v8, v9, v8			; LMULMAX2-RV64I-NEXT: vadd.vv v8, v9, v8
	; LMULMAX2-RV64-NEXT: vsrl.vi v9, v8, 4			; LMULMAX2-RV64I-NEXT: vsrl.vi v9, v8, 4
	; LMULMAX2-RV64-NEXT: vadd.vv v8, v8, v9			; LMULMAX2-RV64I-NEXT: vadd.vv v8, v8, v9
	; LMULMAX2-RV64-NEXT: vand.vi v8, v8, 15			; LMULMAX2-RV64I-NEXT: vand.vi v8, v8, 15
	; LMULMAX2-RV64-NEXT: vse8.v v8, (a0)			; LMULMAX2-RV64I-NEXT: vse8.v v8, (a0)
	; LMULMAX2-RV64-NEXT: ret			; LMULMAX2-RV64I-NEXT: ret
	;			;
	; LMULMAX1-RV32-LABEL: ctlz_v16i8:			; LMULMAX1-RV32I-LABEL: ctlz_v16i8:
	; LMULMAX1-RV32: # %bb.0:			; LMULMAX1-RV32I: # %bb.0:
	; LMULMAX1-RV32-NEXT: vsetivli zero, 16, e8, m1, ta, mu			; LMULMAX1-RV32I-NEXT: vsetivli zero, 16, e8, m1, ta, mu
	; LMULMAX1-RV32-NEXT: vle8.v v8, (a0)			; LMULMAX1-RV32I-NEXT: vle8.v v8, (a0)
	; LMULMAX1-RV32-NEXT: vsrl.vi v9, v8, 1			; LMULMAX1-RV32I-NEXT: vsrl.vi v9, v8, 1
	; LMULMAX1-RV32-NEXT: vor.vv v8, v8, v9			; LMULMAX1-RV32I-NEXT: vor.vv v8, v8, v9
	; LMULMAX1-RV32-NEXT: vsrl.vi v9, v8, 2			; LMULMAX1-RV32I-NEXT: vsrl.vi v9, v8, 2
	; LMULMAX1-RV32-NEXT: vor.vv v8, v8, v9			; LMULMAX1-RV32I-NEXT: vor.vv v8, v8, v9
	; LMULMAX1-RV32-NEXT: vsrl.vi v9, v8, 4			; LMULMAX1-RV32I-NEXT: vsrl.vi v9, v8, 4
	; LMULMAX1-RV32-NEXT: vor.vv v8, v8, v9			; LMULMAX1-RV32I-NEXT: vor.vv v8, v8, v9
	; LMULMAX1-RV32-NEXT: vxor.vi v8, v8, -1			; LMULMAX1-RV32I-NEXT: vxor.vi v8, v8, -1
	; LMULMAX1-RV32-NEXT: vsrl.vi v9, v8, 1			; LMULMAX1-RV32I-NEXT: vsrl.vi v9, v8, 1
	; LMULMAX1-RV32-NEXT: addi a1, zero, 85			; LMULMAX1-RV32I-NEXT: addi a1, zero, 85
	; LMULMAX1-RV32-NEXT: vand.vx v9, v9, a1			; LMULMAX1-RV32I-NEXT: vand.vx v9, v9, a1
	; LMULMAX1-RV32-NEXT: vsub.vv v8, v8, v9			; LMULMAX1-RV32I-NEXT: vsub.vv v8, v8, v9
	; LMULMAX1-RV32-NEXT: addi a1, zero, 51			; LMULMAX1-RV32I-NEXT: addi a1, zero, 51
	; LMULMAX1-RV32-NEXT: vand.vx v9, v8, a1			; LMULMAX1-RV32I-NEXT: vand.vx v9, v8, a1
	; LMULMAX1-RV32-NEXT: vsrl.vi v8, v8, 2			; LMULMAX1-RV32I-NEXT: vsrl.vi v8, v8, 2
	; LMULMAX1-RV32-NEXT: vand.vx v8, v8, a1			; LMULMAX1-RV32I-NEXT: vand.vx v8, v8, a1
	; LMULMAX1-RV32-NEXT: vadd.vv v8, v9, v8			; LMULMAX1-RV32I-NEXT: vadd.vv v8, v9, v8
	; LMULMAX1-RV32-NEXT: vsrl.vi v9, v8, 4			; LMULMAX1-RV32I-NEXT: vsrl.vi v9, v8, 4
	; LMULMAX1-RV32-NEXT: vadd.vv v8, v8, v9			; LMULMAX1-RV32I-NEXT: vadd.vv v8, v8, v9
	; LMULMAX1-RV32-NEXT: vand.vi v8, v8, 15			; LMULMAX1-RV32I-NEXT: vand.vi v8, v8, 15
	; LMULMAX1-RV32-NEXT: vse8.v v8, (a0)			; LMULMAX1-RV32I-NEXT: vse8.v v8, (a0)
	; LMULMAX1-RV32-NEXT: ret			; LMULMAX1-RV32I-NEXT: ret
	;			;
	; LMULMAX1-RV64-LABEL: ctlz_v16i8:			; LMULMAX2-RV32D-LABEL: ctlz_v16i8:
	; LMULMAX1-RV64: # %bb.0:			; LMULMAX2-RV32D: # %bb.0:
	; LMULMAX1-RV64-NEXT: vsetivli zero, 16, e8, m1, ta, mu			; LMULMAX2-RV32D-NEXT: vsetivli zero, 16, e8, m1, ta, mu
	; LMULMAX1-RV64-NEXT: vle8.v v8, (a0)			; LMULMAX2-RV32D-NEXT: vle8.v v8, (a0)
	; LMULMAX1-RV64-NEXT: vsrl.vi v9, v8, 1			; LMULMAX2-RV32D-NEXT: vsetivli zero, 8, e32, m2, ta, mu
	; LMULMAX1-RV64-NEXT: vor.vv v8, v8, v9			; LMULMAX2-RV32D-NEXT: vzext.vf4 v10, v8
	; LMULMAX1-RV64-NEXT: vsrl.vi v9, v8, 2			; LMULMAX2-RV32D-NEXT: vfcvt.f.xu.v v10, v10
	; LMULMAX1-RV64-NEXT: vor.vv v8, v8, v9			; LMULMAX2-RV32D-NEXT: vsetvli zero, zero, e16, m1, ta, mu
	; LMULMAX1-RV64-NEXT: vsrl.vi v9, v8, 4			; LMULMAX2-RV32D-NEXT: vnsrl.wi v9, v10, 23
	; LMULMAX1-RV64-NEXT: vor.vv v8, v8, v9			; LMULMAX2-RV32D-NEXT: vsetvli zero, zero, e8, mf2, ta, mu
	; LMULMAX1-RV64-NEXT: vxor.vi v8, v8, -1			; LMULMAX2-RV32D-NEXT: vnsrl.wi v9, v9, 0
	; LMULMAX1-RV64-NEXT: vsrl.vi v9, v8, 1			; LMULMAX2-RV32D-NEXT: addi a1, zero, 134
	; LMULMAX1-RV64-NEXT: addi a1, zero, 85			; LMULMAX2-RV32D-NEXT: vrsub.vx v9, v9, a1
	; LMULMAX1-RV64-NEXT: vand.vx v9, v9, a1			; LMULMAX2-RV32D-NEXT: vsetivli zero, 16, e8, m1, ta, mu
	; LMULMAX1-RV64-NEXT: vsub.vv v8, v8, v9			; LMULMAX2-RV32D-NEXT: vmv.v.i v10, 0
	; LMULMAX1-RV64-NEXT: addi a1, zero, 51			; LMULMAX2-RV32D-NEXT: vsetivli zero, 8, e8, m1, tu, mu
	; LMULMAX1-RV64-NEXT: vand.vx v9, v8, a1			; LMULMAX2-RV32D-NEXT: vslideup.vi v10, v9, 0
	; LMULMAX1-RV64-NEXT: vsrl.vi v8, v8, 2			; LMULMAX2-RV32D-NEXT: vsetvli zero, zero, e8, m1, ta, mu
	; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV32D-NEXT: vslidedown.vi v9, v8, 8
	; LMULMAX1-RV64-NEXT: vadd.vv v8, v9, v8			; LMULMAX2-RV32D-NEXT: vsetivli zero, 8, e32, m2, ta, mu
	; LMULMAX1-RV64-NEXT: vsrl.vi v9, v8, 4			; LMULMAX2-RV32D-NEXT: vzext.vf4 v12, v9
	; LMULMAX1-RV64-NEXT: vadd.vv v8, v8, v9			; LMULMAX2-RV32D-NEXT: vfcvt.f.xu.v v12, v12
	; LMULMAX1-RV64-NEXT: vand.vi v8, v8, 15			; LMULMAX2-RV32D-NEXT: vsetvli zero, zero, e16, m1, ta, mu
	; LMULMAX1-RV64-NEXT: vse8.v v8, (a0)			; LMULMAX2-RV32D-NEXT: vnsrl.wi v9, v12, 23
	; LMULMAX1-RV64-NEXT: ret			; LMULMAX2-RV32D-NEXT: vsetvli zero, zero, e8, mf2, ta, mu
				; LMULMAX2-RV32D-NEXT: vnsrl.wi v9, v9, 0
				; LMULMAX2-RV32D-NEXT: vrsub.vx v9, v9, a1
				; LMULMAX2-RV32D-NEXT: vsetivli zero, 16, e8, m1, tu, mu
				; LMULMAX2-RV32D-NEXT: vslideup.vi v10, v9, 8
				; LMULMAX2-RV32D-NEXT: vsetvli zero, zero, e8, m1, ta, mu
				; LMULMAX2-RV32D-NEXT: vmseq.vi v0, v8, 0
				; LMULMAX2-RV32D-NEXT: vmerge.vim v8, v10, 8, v0
				; LMULMAX2-RV32D-NEXT: vse8.v v8, (a0)
				; LMULMAX2-RV32D-NEXT: ret
				;
				; LMULMAX2-RV64D-LABEL: ctlz_v16i8:
				; LMULMAX2-RV64D: # %bb.0:
				; LMULMAX2-RV64D-NEXT: vsetivli zero, 16, e8, m1, ta, mu
				; LMULMAX2-RV64D-NEXT: vle8.v v8, (a0)
				; LMULMAX2-RV64D-NEXT: vsetivli zero, 8, e32, m2, ta, mu
				; LMULMAX2-RV64D-NEXT: vzext.vf4 v10, v8
				; LMULMAX2-RV64D-NEXT: vfcvt.f.xu.v v10, v10
				; LMULMAX2-RV64D-NEXT: vsetvli zero, zero, e16, m1, ta, mu
				; LMULMAX2-RV64D-NEXT: vnsrl.wi v9, v10, 23
				; LMULMAX2-RV64D-NEXT: vsetvli zero, zero, e8, mf2, ta, mu
				; LMULMAX2-RV64D-NEXT: vnsrl.wi v9, v9, 0
				; LMULMAX2-RV64D-NEXT: addi a1, zero, 134
				; LMULMAX2-RV64D-NEXT: vrsub.vx v9, v9, a1
				; LMULMAX2-RV64D-NEXT: vsetivli zero, 16, e8, m1, ta, mu
				; LMULMAX2-RV64D-NEXT: vmv.v.i v10, 0
				; LMULMAX2-RV64D-NEXT: vsetivli zero, 8, e8, m1, tu, mu
				; LMULMAX2-RV64D-NEXT: vslideup.vi v10, v9, 0
				; LMULMAX2-RV64D-NEXT: vsetvli zero, zero, e8, m1, ta, mu
				; LMULMAX2-RV64D-NEXT: vslidedown.vi v9, v8, 8
				; LMULMAX2-RV64D-NEXT: vsetivli zero, 8, e32, m2, ta, mu
				; LMULMAX2-RV64D-NEXT: vzext.vf4 v12, v9
				; LMULMAX2-RV64D-NEXT: vfcvt.f.xu.v v12, v12
				; LMULMAX2-RV64D-NEXT: vsetvli zero, zero, e16, m1, ta, mu
				; LMULMAX2-RV64D-NEXT: vnsrl.wi v9, v12, 23
				; LMULMAX2-RV64D-NEXT: vsetvli zero, zero, e8, mf2, ta, mu
				; LMULMAX2-RV64D-NEXT: vnsrl.wi v9, v9, 0
				; LMULMAX2-RV64D-NEXT: vrsub.vx v9, v9, a1
				; LMULMAX2-RV64D-NEXT: vsetivli zero, 16, e8, m1, tu, mu
				; LMULMAX2-RV64D-NEXT: vslideup.vi v10, v9, 8
				; LMULMAX2-RV64D-NEXT: vsetvli zero, zero, e8, m1, ta, mu
				; LMULMAX2-RV64D-NEXT: vmseq.vi v0, v8, 0
				; LMULMAX2-RV64D-NEXT: vmerge.vim v8, v10, 8, v0
				; LMULMAX2-RV64D-NEXT: vse8.v v8, (a0)
				; LMULMAX2-RV64D-NEXT: ret
				;
				; LMULMAX1-RV32D-LABEL: ctlz_v16i8:
				; LMULMAX1-RV32D: # %bb.0:
				; LMULMAX1-RV32D-NEXT: vsetivli zero, 16, e8, m1, ta, mu
				; LMULMAX1-RV32D-NEXT: vle8.v v8, (a0)
				; LMULMAX1-RV32D-NEXT: vsetivli zero, 4, e32, m1, ta, mu
				; LMULMAX1-RV32D-NEXT: vzext.vf4 v9, v8
				; LMULMAX1-RV32D-NEXT: vfcvt.f.xu.v v9, v9
				; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e16, mf2, ta, mu
				; LMULMAX1-RV32D-NEXT: vnsrl.wi v9, v9, 23
				; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
				; LMULMAX1-RV32D-NEXT: vnsrl.wi v9, v9, 0
				; LMULMAX1-RV32D-NEXT: addi a1, zero, 134
				; LMULMAX1-RV32D-NEXT: vrsub.vx v9, v9, a1
				; LMULMAX1-RV32D-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
				; LMULMAX1-RV32D-NEXT: vmv.v.i v10, 0
				; LMULMAX1-RV32D-NEXT: vsetivli zero, 4, e8, mf2, tu, mu
				; LMULMAX1-RV32D-NEXT: vmv1r.v v11, v10
				; LMULMAX1-RV32D-NEXT: vslideup.vi v11, v9, 0
				; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e8, mf2, ta, mu
				; LMULMAX1-RV32D-NEXT: vslidedown.vi v9, v8, 4
				; LMULMAX1-RV32D-NEXT: vsetivli zero, 4, e32, m1, ta, mu
				; LMULMAX1-RV32D-NEXT: vzext.vf4 v12, v9
				; LMULMAX1-RV32D-NEXT: vfcvt.f.xu.v v9, v12
				; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e16, mf2, ta, mu
				; LMULMAX1-RV32D-NEXT: vnsrl.wi v9, v9, 23
				; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
				; LMULMAX1-RV32D-NEXT: vnsrl.wi v9, v9, 0
				; LMULMAX1-RV32D-NEXT: vrsub.vx v9, v9, a1
				; LMULMAX1-RV32D-NEXT: vsetivli zero, 8, e8, mf2, tu, mu
				; LMULMAX1-RV32D-NEXT: vslideup.vi v11, v9, 4
				; LMULMAX1-RV32D-NEXT: vsetivli zero, 16, e8, m1, ta, mu
				; LMULMAX1-RV32D-NEXT: vmv.v.i v9, 0
				; LMULMAX1-RV32D-NEXT: vsetivli zero, 8, e8, m1, tu, mu
				; LMULMAX1-RV32D-NEXT: vslideup.vi v9, v11, 0
				; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e8, m1, ta, mu
				; LMULMAX1-RV32D-NEXT: vslidedown.vi v11, v8, 8
				; LMULMAX1-RV32D-NEXT: vsetivli zero, 4, e32, m1, ta, mu
				; LMULMAX1-RV32D-NEXT: vzext.vf4 v12, v11
				; LMULMAX1-RV32D-NEXT: vfcvt.f.xu.v v12, v12
				; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e16, mf2, ta, mu
				; LMULMAX1-RV32D-NEXT: vnsrl.wi v12, v12, 23
				; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
				; LMULMAX1-RV32D-NEXT: vnsrl.wi v12, v12, 0
				; LMULMAX1-RV32D-NEXT: vrsub.vx v12, v12, a1
				; LMULMAX1-RV32D-NEXT: vsetivli zero, 4, e8, mf2, tu, mu
				; LMULMAX1-RV32D-NEXT: vslideup.vi v10, v12, 0
				; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e8, mf2, ta, mu
				; LMULMAX1-RV32D-NEXT: vslidedown.vi v11, v11, 4
				; LMULMAX1-RV32D-NEXT: vsetivli zero, 4, e32, m1, ta, mu
				; LMULMAX1-RV32D-NEXT: vzext.vf4 v12, v11
				; LMULMAX1-RV32D-NEXT: vfcvt.f.xu.v v11, v12
				; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e16, mf2, ta, mu
				; LMULMAX1-RV32D-NEXT: vnsrl.wi v11, v11, 23
				; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
				; LMULMAX1-RV32D-NEXT: vnsrl.wi v11, v11, 0
				; LMULMAX1-RV32D-NEXT: vrsub.vx v11, v11, a1
				; LMULMAX1-RV32D-NEXT: vsetivli zero, 8, e8, mf2, tu, mu
				; LMULMAX1-RV32D-NEXT: vslideup.vi v10, v11, 4
				; LMULMAX1-RV32D-NEXT: vsetivli zero, 16, e8, m1, tu, mu
				; LMULMAX1-RV32D-NEXT: vslideup.vi v9, v10, 8
				; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e8, m1, ta, mu
				; LMULMAX1-RV32D-NEXT: vmseq.vi v0, v8, 0
				; LMULMAX1-RV32D-NEXT: vmerge.vim v8, v9, 8, v0
				; LMULMAX1-RV32D-NEXT: vse8.v v8, (a0)
				; LMULMAX1-RV32D-NEXT: ret
				;
				; LMULMAX1-RV64D-LABEL: ctlz_v16i8:
				; LMULMAX1-RV64D: # %bb.0:
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 16, e8, m1, ta, mu
				; LMULMAX1-RV64D-NEXT: vle8.v v8, (a0)
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 4, e32, m1, ta, mu
				; LMULMAX1-RV64D-NEXT: vzext.vf4 v9, v8
				; LMULMAX1-RV64D-NEXT: vfcvt.f.xu.v v9, v9
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e16, mf2, ta, mu
				; LMULMAX1-RV64D-NEXT: vnsrl.wi v9, v9, 23
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
				; LMULMAX1-RV64D-NEXT: vnsrl.wi v9, v9, 0
				; LMULMAX1-RV64D-NEXT: addi a1, zero, 134
				; LMULMAX1-RV64D-NEXT: vrsub.vx v9, v9, a1
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
				; LMULMAX1-RV64D-NEXT: vmv.v.i v10, 0
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 4, e8, mf2, tu, mu
				; LMULMAX1-RV64D-NEXT: vmv1r.v v11, v10
				; LMULMAX1-RV64D-NEXT: vslideup.vi v11, v9, 0
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e8, mf2, ta, mu
				; LMULMAX1-RV64D-NEXT: vslidedown.vi v9, v8, 4
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 4, e32, m1, ta, mu
				; LMULMAX1-RV64D-NEXT: vzext.vf4 v12, v9
				; LMULMAX1-RV64D-NEXT: vfcvt.f.xu.v v9, v12
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e16, mf2, ta, mu
				; LMULMAX1-RV64D-NEXT: vnsrl.wi v9, v9, 23
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
				; LMULMAX1-RV64D-NEXT: vnsrl.wi v9, v9, 0
				; LMULMAX1-RV64D-NEXT: vrsub.vx v9, v9, a1
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 8, e8, mf2, tu, mu
				; LMULMAX1-RV64D-NEXT: vslideup.vi v11, v9, 4
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 16, e8, m1, ta, mu
				; LMULMAX1-RV64D-NEXT: vmv.v.i v9, 0
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 8, e8, m1, tu, mu
				; LMULMAX1-RV64D-NEXT: vslideup.vi v9, v11, 0
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e8, m1, ta, mu
				; LMULMAX1-RV64D-NEXT: vslidedown.vi v11, v8, 8
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 4, e32, m1, ta, mu
				; LMULMAX1-RV64D-NEXT: vzext.vf4 v12, v11
				; LMULMAX1-RV64D-NEXT: vfcvt.f.xu.v v12, v12
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e16, mf2, ta, mu
				; LMULMAX1-RV64D-NEXT: vnsrl.wi v12, v12, 23
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
				; LMULMAX1-RV64D-NEXT: vnsrl.wi v12, v12, 0
				; LMULMAX1-RV64D-NEXT: vrsub.vx v12, v12, a1
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 4, e8, mf2, tu, mu
				; LMULMAX1-RV64D-NEXT: vslideup.vi v10, v12, 0
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e8, mf2, ta, mu
				; LMULMAX1-RV64D-NEXT: vslidedown.vi v11, v11, 4
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 4, e32, m1, ta, mu
				; LMULMAX1-RV64D-NEXT: vzext.vf4 v12, v11
				; LMULMAX1-RV64D-NEXT: vfcvt.f.xu.v v11, v12
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e16, mf2, ta, mu
				; LMULMAX1-RV64D-NEXT: vnsrl.wi v11, v11, 23
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
				; LMULMAX1-RV64D-NEXT: vnsrl.wi v11, v11, 0
				; LMULMAX1-RV64D-NEXT: vrsub.vx v11, v11, a1
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 8, e8, mf2, tu, mu
				; LMULMAX1-RV64D-NEXT: vslideup.vi v10, v11, 4
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 16, e8, m1, tu, mu
				; LMULMAX1-RV64D-NEXT: vslideup.vi v9, v10, 8
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e8, m1, ta, mu
				; LMULMAX1-RV64D-NEXT: vmseq.vi v0, v8, 0
				; LMULMAX1-RV64D-NEXT: vmerge.vim v8, v9, 8, v0
				; LMULMAX1-RV64D-NEXT: vse8.v v8, (a0)
				; LMULMAX1-RV64D-NEXT: ret
				;
				; LMULMAX8-RV32-LABEL: ctlz_v16i8:
				; LMULMAX8-RV32: # %bb.0:
				; LMULMAX8-RV32-NEXT: vsetivli zero, 16, e8, m1, ta, mu
				; LMULMAX8-RV32-NEXT: vle8.v v8, (a0)
				; LMULMAX8-RV32-NEXT: vsetvli zero, zero, e32, m4, ta, mu
				; LMULMAX8-RV32-NEXT: vzext.vf4 v12, v8
				; LMULMAX8-RV32-NEXT: vfcvt.f.xu.v v12, v12
				; LMULMAX8-RV32-NEXT: vsetvli zero, zero, e16, m2, ta, mu
				; LMULMAX8-RV32-NEXT: vnsrl.wi v10, v12, 23
				; LMULMAX8-RV32-NEXT: vsetvli zero, zero, e8, m1, ta, mu
				; LMULMAX8-RV32-NEXT: vnsrl.wi v9, v10, 0
				; LMULMAX8-RV32-NEXT: addi a1, zero, 134
				; LMULMAX8-RV32-NEXT: vmseq.vi v0, v8, 0
				; LMULMAX8-RV32-NEXT: vrsub.vx v8, v9, a1
				; LMULMAX8-RV32-NEXT: vmerge.vim v8, v8, 8, v0
				; LMULMAX8-RV32-NEXT: vse8.v v8, (a0)
				; LMULMAX8-RV32-NEXT: ret
				;
				; LMULMAX8-RV64-LABEL: ctlz_v16i8:
				; LMULMAX8-RV64: # %bb.0:
				; LMULMAX8-RV64-NEXT: vsetivli zero, 16, e8, m1, ta, mu
				; LMULMAX8-RV64-NEXT: vle8.v v8, (a0)
				; LMULMAX8-RV64-NEXT: vsetvli zero, zero, e32, m4, ta, mu
				; LMULMAX8-RV64-NEXT: vzext.vf4 v12, v8
				; LMULMAX8-RV64-NEXT: vfcvt.f.xu.v v12, v12
				; LMULMAX8-RV64-NEXT: vsetvli zero, zero, e16, m2, ta, mu
				; LMULMAX8-RV64-NEXT: vnsrl.wi v10, v12, 23
				; LMULMAX8-RV64-NEXT: vsetvli zero, zero, e8, m1, ta, mu
				; LMULMAX8-RV64-NEXT: vnsrl.wi v9, v10, 0
				; LMULMAX8-RV64-NEXT: addi a1, zero, 134
				; LMULMAX8-RV64-NEXT: vmseq.vi v0, v8, 0
				; LMULMAX8-RV64-NEXT: vrsub.vx v8, v9, a1
				; LMULMAX8-RV64-NEXT: vmerge.vim v8, v8, 8, v0
				; LMULMAX8-RV64-NEXT: vse8.v v8, (a0)
				; LMULMAX8-RV64-NEXT: ret
	%a = load <16 x i8>, <16 x i8>* %x			%a = load <16 x i8>, <16 x i8>* %x
	%b = load <16 x i8>, <16 x i8>* %y			%b = load <16 x i8>, <16 x i8>* %y
	%c = call <16 x i8> @llvm.ctlz.v16i8(<16 x i8> %a, i1 false)			%c = call <16 x i8> @llvm.ctlz.v16i8(<16 x i8> %a, i1 false)
	store <16 x i8> %c, <16 x i8>* %x			store <16 x i8> %c, <16 x i8>* %x
	ret void			ret void
	}			}
	declare <16 x i8> @llvm.ctlz.v16i8(<16 x i8>, i1)			declare <16 x i8> @llvm.ctlz.v16i8(<16 x i8>, i1)

	define void @ctlz_v8i16(<8 x i16>* %x, <8 x i16>* %y) nounwind {			define void @ctlz_v8i16(<8 x i16>* %x, <8 x i16>* %y) nounwind {
	; LMULMAX2-RV32-LABEL: ctlz_v8i16:			; LMULMAX2-RV32I-LABEL: ctlz_v8i16:
	; LMULMAX2-RV32: # %bb.0:			; LMULMAX2-RV32I: # %bb.0:
	; LMULMAX2-RV32-NEXT: vsetivli zero, 8, e16, m1, ta, mu			; LMULMAX2-RV32I-NEXT: vsetivli zero, 8, e16, m1, ta, mu
	; LMULMAX2-RV32-NEXT: vle16.v v8, (a0)			; LMULMAX2-RV32I-NEXT: vle16.v v8, (a0)
	; LMULMAX2-RV32-NEXT: vsrl.vi v9, v8, 1			; LMULMAX2-RV32I-NEXT: vsrl.vi v9, v8, 1
	; LMULMAX2-RV32-NEXT: vor.vv v8, v8, v9			; LMULMAX2-RV32I-NEXT: vor.vv v8, v8, v9
	; LMULMAX2-RV32-NEXT: vsrl.vi v9, v8, 2			; LMULMAX2-RV32I-NEXT: vsrl.vi v9, v8, 2
	; LMULMAX2-RV32-NEXT: vor.vv v8, v8, v9			; LMULMAX2-RV32I-NEXT: vor.vv v8, v8, v9
	; LMULMAX2-RV32-NEXT: vsrl.vi v9, v8, 4			; LMULMAX2-RV32I-NEXT: vsrl.vi v9, v8, 4
	; LMULMAX2-RV32-NEXT: vor.vv v8, v8, v9			; LMULMAX2-RV32I-NEXT: vor.vv v8, v8, v9
	; LMULMAX2-RV32-NEXT: vsrl.vi v9, v8, 8			; LMULMAX2-RV32I-NEXT: vsrl.vi v9, v8, 8
	; LMULMAX2-RV32-NEXT: vor.vv v8, v8, v9			; LMULMAX2-RV32I-NEXT: vor.vv v8, v8, v9
	; LMULMAX2-RV32-NEXT: vxor.vi v8, v8, -1			; LMULMAX2-RV32I-NEXT: vxor.vi v8, v8, -1
	; LMULMAX2-RV32-NEXT: vsrl.vi v9, v8, 1			; LMULMAX2-RV32I-NEXT: vsrl.vi v9, v8, 1
	; LMULMAX2-RV32-NEXT: lui a1, 5			; LMULMAX2-RV32I-NEXT: lui a1, 5
	; LMULMAX2-RV32-NEXT: addi a1, a1, 1365			; LMULMAX2-RV32I-NEXT: addi a1, a1, 1365
	; LMULMAX2-RV32-NEXT: vand.vx v9, v9, a1			; LMULMAX2-RV32I-NEXT: vand.vx v9, v9, a1
	; LMULMAX2-RV32-NEXT: vsub.vv v8, v8, v9			; LMULMAX2-RV32I-NEXT: vsub.vv v8, v8, v9
	; LMULMAX2-RV32-NEXT: lui a1, 3			; LMULMAX2-RV32I-NEXT: lui a1, 3
	; LMULMAX2-RV32-NEXT: addi a1, a1, 819			; LMULMAX2-RV32I-NEXT: addi a1, a1, 819
	; LMULMAX2-RV32-NEXT: vand.vx v9, v8, a1			; LMULMAX2-RV32I-NEXT: vand.vx v9, v8, a1
	; LMULMAX2-RV32-NEXT: vsrl.vi v8, v8, 2			; LMULMAX2-RV32I-NEXT: vsrl.vi v8, v8, 2
	; LMULMAX2-RV32-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV32I-NEXT: vand.vx v8, v8, a1
	; LMULMAX2-RV32-NEXT: vadd.vv v8, v9, v8			; LMULMAX2-RV32I-NEXT: vadd.vv v8, v9, v8
	; LMULMAX2-RV32-NEXT: vsrl.vi v9, v8, 4			; LMULMAX2-RV32I-NEXT: vsrl.vi v9, v8, 4
	; LMULMAX2-RV32-NEXT: vadd.vv v8, v8, v9			; LMULMAX2-RV32I-NEXT: vadd.vv v8, v8, v9
	; LMULMAX2-RV32-NEXT: lui a1, 1			; LMULMAX2-RV32I-NEXT: lui a1, 1
	; LMULMAX2-RV32-NEXT: addi a1, a1, -241			; LMULMAX2-RV32I-NEXT: addi a1, a1, -241
	; LMULMAX2-RV32-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV32I-NEXT: vand.vx v8, v8, a1
	; LMULMAX2-RV32-NEXT: addi a1, zero, 257			; LMULMAX2-RV32I-NEXT: addi a1, zero, 257
	; LMULMAX2-RV32-NEXT: vmul.vx v8, v8, a1			; LMULMAX2-RV32I-NEXT: vmul.vx v8, v8, a1
	; LMULMAX2-RV32-NEXT: vsrl.vi v8, v8, 8			; LMULMAX2-RV32I-NEXT: vsrl.vi v8, v8, 8
	; LMULMAX2-RV32-NEXT: vse16.v v8, (a0)			; LMULMAX2-RV32I-NEXT: vse16.v v8, (a0)
	; LMULMAX2-RV32-NEXT: ret			; LMULMAX2-RV32I-NEXT: ret
	;			;
	; LMULMAX2-RV64-LABEL: ctlz_v8i16:			; LMULMAX2-RV64I-LABEL: ctlz_v8i16:
	; LMULMAX2-RV64: # %bb.0:			; LMULMAX2-RV64I: # %bb.0:
	; LMULMAX2-RV64-NEXT: vsetivli zero, 8, e16, m1, ta, mu			; LMULMAX2-RV64I-NEXT: vsetivli zero, 8, e16, m1, ta, mu
	; LMULMAX2-RV64-NEXT: vle16.v v8, (a0)			; LMULMAX2-RV64I-NEXT: vle16.v v8, (a0)
	; LMULMAX2-RV64-NEXT: vsrl.vi v9, v8, 1			; LMULMAX2-RV64I-NEXT: vsrl.vi v9, v8, 1
	; LMULMAX2-RV64-NEXT: vor.vv v8, v8, v9			; LMULMAX2-RV64I-NEXT: vor.vv v8, v8, v9
	; LMULMAX2-RV64-NEXT: vsrl.vi v9, v8, 2			; LMULMAX2-RV64I-NEXT: vsrl.vi v9, v8, 2
	; LMULMAX2-RV64-NEXT: vor.vv v8, v8, v9			; LMULMAX2-RV64I-NEXT: vor.vv v8, v8, v9
	; LMULMAX2-RV64-NEXT: vsrl.vi v9, v8, 4			; LMULMAX2-RV64I-NEXT: vsrl.vi v9, v8, 4
	; LMULMAX2-RV64-NEXT: vor.vv v8, v8, v9			; LMULMAX2-RV64I-NEXT: vor.vv v8, v8, v9
	; LMULMAX2-RV64-NEXT: vsrl.vi v9, v8, 8			; LMULMAX2-RV64I-NEXT: vsrl.vi v9, v8, 8
	; LMULMAX2-RV64-NEXT: vor.vv v8, v8, v9			; LMULMAX2-RV64I-NEXT: vor.vv v8, v8, v9
	; LMULMAX2-RV64-NEXT: vxor.vi v8, v8, -1			; LMULMAX2-RV64I-NEXT: vxor.vi v8, v8, -1
	; LMULMAX2-RV64-NEXT: vsrl.vi v9, v8, 1			; LMULMAX2-RV64I-NEXT: vsrl.vi v9, v8, 1
	; LMULMAX2-RV64-NEXT: lui a1, 5			; LMULMAX2-RV64I-NEXT: lui a1, 5
	; LMULMAX2-RV64-NEXT: addiw a1, a1, 1365			; LMULMAX2-RV64I-NEXT: addiw a1, a1, 1365
	; LMULMAX2-RV64-NEXT: vand.vx v9, v9, a1			; LMULMAX2-RV64I-NEXT: vand.vx v9, v9, a1
	; LMULMAX2-RV64-NEXT: vsub.vv v8, v8, v9			; LMULMAX2-RV64I-NEXT: vsub.vv v8, v8, v9
	; LMULMAX2-RV64-NEXT: lui a1, 3			; LMULMAX2-RV64I-NEXT: lui a1, 3
	; LMULMAX2-RV64-NEXT: addiw a1, a1, 819			; LMULMAX2-RV64I-NEXT: addiw a1, a1, 819
	; LMULMAX2-RV64-NEXT: vand.vx v9, v8, a1			; LMULMAX2-RV64I-NEXT: vand.vx v9, v8, a1
	; LMULMAX2-RV64-NEXT: vsrl.vi v8, v8, 2			; LMULMAX2-RV64I-NEXT: vsrl.vi v8, v8, 2
	; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV64I-NEXT: vand.vx v8, v8, a1
	; LMULMAX2-RV64-NEXT: vadd.vv v8, v9, v8			; LMULMAX2-RV64I-NEXT: vadd.vv v8, v9, v8
	; LMULMAX2-RV64-NEXT: vsrl.vi v9, v8, 4			; LMULMAX2-RV64I-NEXT: vsrl.vi v9, v8, 4
	; LMULMAX2-RV64-NEXT: vadd.vv v8, v8, v9			; LMULMAX2-RV64I-NEXT: vadd.vv v8, v8, v9
	; LMULMAX2-RV64-NEXT: lui a1, 1			; LMULMAX2-RV64I-NEXT: lui a1, 1
	; LMULMAX2-RV64-NEXT: addiw a1, a1, -241			; LMULMAX2-RV64I-NEXT: addiw a1, a1, -241
	; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV64I-NEXT: vand.vx v8, v8, a1
	; LMULMAX2-RV64-NEXT: addi a1, zero, 257			; LMULMAX2-RV64I-NEXT: addi a1, zero, 257
	; LMULMAX2-RV64-NEXT: vmul.vx v8, v8, a1			; LMULMAX2-RV64I-NEXT: vmul.vx v8, v8, a1
	; LMULMAX2-RV64-NEXT: vsrl.vi v8, v8, 8			; LMULMAX2-RV64I-NEXT: vsrl.vi v8, v8, 8
	; LMULMAX2-RV64-NEXT: vse16.v v8, (a0)			; LMULMAX2-RV64I-NEXT: vse16.v v8, (a0)
	; LMULMAX2-RV64-NEXT: ret			; LMULMAX2-RV64I-NEXT: ret
	;			;
	; LMULMAX1-RV32-LABEL: ctlz_v8i16:			; LMULMAX2-RV32D-LABEL: ctlz_v8i16:
	; LMULMAX1-RV32: # %bb.0:			; LMULMAX2-RV32D: # %bb.0:
	; LMULMAX1-RV32-NEXT: vsetivli zero, 8, e16, m1, ta, mu			; LMULMAX2-RV32D-NEXT: vsetivli zero, 8, e16, m1, ta, mu
	; LMULMAX1-RV32-NEXT: vle16.v v8, (a0)			; LMULMAX2-RV32D-NEXT: vle16.v v8, (a0)
	; LMULMAX1-RV32-NEXT: vsrl.vi v9, v8, 1			; LMULMAX2-RV32D-NEXT: vfwcvt.f.xu.v v10, v8
	; LMULMAX1-RV32-NEXT: vor.vv v8, v8, v9			; LMULMAX2-RV32D-NEXT: vnsrl.wi v9, v10, 23
	; LMULMAX1-RV32-NEXT: vsrl.vi v9, v8, 2			; LMULMAX2-RV32D-NEXT: addi a1, zero, 142
	; LMULMAX1-RV32-NEXT: vor.vv v8, v8, v9			; LMULMAX2-RV32D-NEXT: vrsub.vx v9, v9, a1
	; LMULMAX1-RV32-NEXT: vsrl.vi v9, v8, 4			; LMULMAX2-RV32D-NEXT: vmseq.vi v0, v8, 0
	; LMULMAX1-RV32-NEXT: vor.vv v8, v8, v9			; LMULMAX2-RV32D-NEXT: addi a1, zero, 16
	; LMULMAX1-RV32-NEXT: vsrl.vi v9, v8, 8			; LMULMAX2-RV32D-NEXT: vmerge.vxm v8, v9, a1, v0
	; LMULMAX1-RV32-NEXT: vor.vv v8, v8, v9			; LMULMAX2-RV32D-NEXT: vse16.v v8, (a0)
	; LMULMAX1-RV32-NEXT: vxor.vi v8, v8, -1			; LMULMAX2-RV32D-NEXT: ret
	; LMULMAX1-RV32-NEXT: vsrl.vi v9, v8, 1			;
	; LMULMAX1-RV32-NEXT: lui a1, 5			; LMULMAX2-RV64D-LABEL: ctlz_v8i16:
	; LMULMAX1-RV32-NEXT: addi a1, a1, 1365			; LMULMAX2-RV64D: # %bb.0:
	; LMULMAX1-RV32-NEXT: vand.vx v9, v9, a1			; LMULMAX2-RV64D-NEXT: vsetivli zero, 8, e16, m1, ta, mu
	; LMULMAX1-RV32-NEXT: vsub.vv v8, v8, v9			; LMULMAX2-RV64D-NEXT: vle16.v v8, (a0)
	; LMULMAX1-RV32-NEXT: lui a1, 3			; LMULMAX2-RV64D-NEXT: vfwcvt.f.xu.v v10, v8
	; LMULMAX1-RV32-NEXT: addi a1, a1, 819			; LMULMAX2-RV64D-NEXT: vnsrl.wi v9, v10, 23
	; LMULMAX1-RV32-NEXT: vand.vx v9, v8, a1			; LMULMAX2-RV64D-NEXT: addi a1, zero, 142
	; LMULMAX1-RV32-NEXT: vsrl.vi v8, v8, 2			; LMULMAX2-RV64D-NEXT: vrsub.vx v9, v9, a1
	; LMULMAX1-RV32-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV64D-NEXT: vmseq.vi v0, v8, 0
	; LMULMAX1-RV32-NEXT: vadd.vv v8, v9, v8			; LMULMAX2-RV64D-NEXT: addi a1, zero, 16
	; LMULMAX1-RV32-NEXT: vsrl.vi v9, v8, 4			; LMULMAX2-RV64D-NEXT: vmerge.vxm v8, v9, a1, v0
	; LMULMAX1-RV32-NEXT: vadd.vv v8, v8, v9			; LMULMAX2-RV64D-NEXT: vse16.v v8, (a0)
	; LMULMAX1-RV32-NEXT: lui a1, 1			; LMULMAX2-RV64D-NEXT: ret
	; LMULMAX1-RV32-NEXT: addi a1, a1, -241			;
	; LMULMAX1-RV32-NEXT: vand.vx v8, v8, a1			; LMULMAX1-RV32D-LABEL: ctlz_v8i16:
	; LMULMAX1-RV32-NEXT: addi a1, zero, 257			; LMULMAX1-RV32D: # %bb.0:
	; LMULMAX1-RV32-NEXT: vmul.vx v8, v8, a1			; LMULMAX1-RV32D-NEXT: vsetivli zero, 8, e16, m1, ta, mu
	; LMULMAX1-RV32-NEXT: vsrl.vi v8, v8, 8			; LMULMAX1-RV32D-NEXT: vle16.v v8, (a0)
	; LMULMAX1-RV32-NEXT: vse16.v v8, (a0)			; LMULMAX1-RV32D-NEXT: vsetivli zero, 4, e16, mf2, ta, mu
	; LMULMAX1-RV32-NEXT: ret			; LMULMAX1-RV32D-NEXT: vfwcvt.f.xu.v v9, v8
	;			; LMULMAX1-RV32D-NEXT: vnsrl.wi v9, v9, 23
	; LMULMAX1-RV64-LABEL: ctlz_v8i16:			; LMULMAX1-RV32D-NEXT: addi a1, zero, 142
	; LMULMAX1-RV64: # %bb.0:			; LMULMAX1-RV32D-NEXT: vrsub.vx v9, v9, a1
	; LMULMAX1-RV64-NEXT: vsetivli zero, 8, e16, m1, ta, mu			; LMULMAX1-RV32D-NEXT: vsetivli zero, 8, e16, m1, ta, mu
	; LMULMAX1-RV64-NEXT: vle16.v v8, (a0)			; LMULMAX1-RV32D-NEXT: vmv.v.i v10, 0
	; LMULMAX1-RV64-NEXT: vsrl.vi v9, v8, 1			; LMULMAX1-RV32D-NEXT: vsetivli zero, 4, e16, m1, tu, mu
	; LMULMAX1-RV64-NEXT: vor.vv v8, v8, v9			; LMULMAX1-RV32D-NEXT: vslideup.vi v10, v9, 0
	; LMULMAX1-RV64-NEXT: vsrl.vi v9, v8, 2			; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e16, m1, ta, mu
	; LMULMAX1-RV64-NEXT: vor.vv v8, v8, v9			; LMULMAX1-RV32D-NEXT: vslidedown.vi v9, v8, 4
	; LMULMAX1-RV64-NEXT: vsrl.vi v9, v8, 4			; LMULMAX1-RV32D-NEXT: vsetivli zero, 4, e16, mf2, ta, mu
	; LMULMAX1-RV64-NEXT: vor.vv v8, v8, v9			; LMULMAX1-RV32D-NEXT: vfwcvt.f.xu.v v11, v9
	; LMULMAX1-RV64-NEXT: vsrl.vi v9, v8, 8			; LMULMAX1-RV32D-NEXT: vnsrl.wi v9, v11, 23
	; LMULMAX1-RV64-NEXT: vor.vv v8, v8, v9			; LMULMAX1-RV32D-NEXT: vrsub.vx v9, v9, a1
	; LMULMAX1-RV64-NEXT: vxor.vi v8, v8, -1			; LMULMAX1-RV32D-NEXT: vsetivli zero, 8, e16, m1, tu, mu
	; LMULMAX1-RV64-NEXT: vsrl.vi v9, v8, 1			; LMULMAX1-RV32D-NEXT: vslideup.vi v10, v9, 4
	; LMULMAX1-RV64-NEXT: lui a1, 5			; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e16, m1, ta, mu
	; LMULMAX1-RV64-NEXT: addiw a1, a1, 1365			; LMULMAX1-RV32D-NEXT: vmseq.vi v0, v8, 0
	; LMULMAX1-RV64-NEXT: vand.vx v9, v9, a1			; LMULMAX1-RV32D-NEXT: addi a1, zero, 16
	; LMULMAX1-RV64-NEXT: vsub.vv v8, v8, v9			; LMULMAX1-RV32D-NEXT: vmerge.vxm v8, v10, a1, v0
	; LMULMAX1-RV64-NEXT: lui a1, 3			; LMULMAX1-RV32D-NEXT: vse16.v v8, (a0)
	; LMULMAX1-RV64-NEXT: addiw a1, a1, 819			; LMULMAX1-RV32D-NEXT: ret
	; LMULMAX1-RV64-NEXT: vand.vx v9, v8, a1			;
	; LMULMAX1-RV64-NEXT: vsrl.vi v8, v8, 2			; LMULMAX1-RV64D-LABEL: ctlz_v8i16:
	; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX1-RV64D: # %bb.0:
	; LMULMAX1-RV64-NEXT: vadd.vv v8, v9, v8			; LMULMAX1-RV64D-NEXT: vsetivli zero, 8, e16, m1, ta, mu
	; LMULMAX1-RV64-NEXT: vsrl.vi v9, v8, 4			; LMULMAX1-RV64D-NEXT: vle16.v v8, (a0)
	; LMULMAX1-RV64-NEXT: vadd.vv v8, v8, v9			; LMULMAX1-RV64D-NEXT: vsetivli zero, 4, e16, mf2, ta, mu
	; LMULMAX1-RV64-NEXT: lui a1, 1			; LMULMAX1-RV64D-NEXT: vfwcvt.f.xu.v v9, v8
	; LMULMAX1-RV64-NEXT: addiw a1, a1, -241			; LMULMAX1-RV64D-NEXT: vnsrl.wi v9, v9, 23
	; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX1-RV64D-NEXT: addi a1, zero, 142
	; LMULMAX1-RV64-NEXT: addi a1, zero, 257			; LMULMAX1-RV64D-NEXT: vrsub.vx v9, v9, a1
	; LMULMAX1-RV64-NEXT: vmul.vx v8, v8, a1			; LMULMAX1-RV64D-NEXT: vsetivli zero, 8, e16, m1, ta, mu
	; LMULMAX1-RV64-NEXT: vsrl.vi v8, v8, 8			; LMULMAX1-RV64D-NEXT: vmv.v.i v10, 0
	; LMULMAX1-RV64-NEXT: vse16.v v8, (a0)			; LMULMAX1-RV64D-NEXT: vsetivli zero, 4, e16, m1, tu, mu
	; LMULMAX1-RV64-NEXT: ret			; LMULMAX1-RV64D-NEXT: vslideup.vi v10, v9, 0
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e16, m1, ta, mu
				; LMULMAX1-RV64D-NEXT: vslidedown.vi v9, v8, 4
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 4, e16, mf2, ta, mu
				; LMULMAX1-RV64D-NEXT: vfwcvt.f.xu.v v11, v9
				; LMULMAX1-RV64D-NEXT: vnsrl.wi v9, v11, 23
				; LMULMAX1-RV64D-NEXT: vrsub.vx v9, v9, a1
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 8, e16, m1, tu, mu
				; LMULMAX1-RV64D-NEXT: vslideup.vi v10, v9, 4
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e16, m1, ta, mu
				; LMULMAX1-RV64D-NEXT: vmseq.vi v0, v8, 0
				; LMULMAX1-RV64D-NEXT: addi a1, zero, 16
				; LMULMAX1-RV64D-NEXT: vmerge.vxm v8, v10, a1, v0
				; LMULMAX1-RV64D-NEXT: vse16.v v8, (a0)
				; LMULMAX1-RV64D-NEXT: ret
				;
				; LMULMAX8-RV32-LABEL: ctlz_v8i16:
				; LMULMAX8-RV32: # %bb.0:
				; LMULMAX8-RV32-NEXT: vsetivli zero, 8, e16, m1, ta, mu
				; LMULMAX8-RV32-NEXT: vle16.v v8, (a0)
				; LMULMAX8-RV32-NEXT: vfwcvt.f.xu.v v10, v8
				; LMULMAX8-RV32-NEXT: vnsrl.wi v9, v10, 23
				; LMULMAX8-RV32-NEXT: addi a1, zero, 142
				; LMULMAX8-RV32-NEXT: vrsub.vx v9, v9, a1
				; LMULMAX8-RV32-NEXT: vmseq.vi v0, v8, 0
				; LMULMAX8-RV32-NEXT: addi a1, zero, 16
				; LMULMAX8-RV32-NEXT: vmerge.vxm v8, v9, a1, v0
				; LMULMAX8-RV32-NEXT: vse16.v v8, (a0)
				; LMULMAX8-RV32-NEXT: ret
				;
				; LMULMAX8-RV64-LABEL: ctlz_v8i16:
				; LMULMAX8-RV64: # %bb.0:
				; LMULMAX8-RV64-NEXT: vsetivli zero, 8, e16, m1, ta, mu
				; LMULMAX8-RV64-NEXT: vle16.v v8, (a0)
				; LMULMAX8-RV64-NEXT: vfwcvt.f.xu.v v10, v8
				; LMULMAX8-RV64-NEXT: vnsrl.wi v9, v10, 23
				; LMULMAX8-RV64-NEXT: addi a1, zero, 142
				; LMULMAX8-RV64-NEXT: vrsub.vx v9, v9, a1
				; LMULMAX8-RV64-NEXT: vmseq.vi v0, v8, 0
				; LMULMAX8-RV64-NEXT: addi a1, zero, 16
				; LMULMAX8-RV64-NEXT: vmerge.vxm v8, v9, a1, v0
				; LMULMAX8-RV64-NEXT: vse16.v v8, (a0)
				; LMULMAX8-RV64-NEXT: ret
	%a = load <8 x i16>, <8 x i16>* %x			%a = load <8 x i16>, <8 x i16>* %x
	%b = load <8 x i16>, <8 x i16>* %y			%b = load <8 x i16>, <8 x i16>* %y
	%c = call <8 x i16> @llvm.ctlz.v8i16(<8 x i16> %a, i1 false)			%c = call <8 x i16> @llvm.ctlz.v8i16(<8 x i16> %a, i1 false)
	store <8 x i16> %c, <8 x i16>* %x			store <8 x i16> %c, <8 x i16>* %x
	ret void			ret void
	}			}
	declare <8 x i16> @llvm.ctlz.v8i16(<8 x i16>, i1)			declare <8 x i16> @llvm.ctlz.v8i16(<8 x i16>, i1)

	define void @ctlz_v4i32(<4 x i32>* %x, <4 x i32>* %y) nounwind {			define void @ctlz_v4i32(<4 x i32>* %x, <4 x i32>* %y) nounwind {
	; LMULMAX2-RV32-LABEL: ctlz_v4i32:			; LMULMAX2-RV32I-LABEL: ctlz_v4i32:
	; LMULMAX2-RV32: # %bb.0:			; LMULMAX2-RV32I: # %bb.0:
	; LMULMAX2-RV32-NEXT: vsetivli zero, 4, e32, m1, ta, mu			; LMULMAX2-RV32I-NEXT: vsetivli zero, 4, e32, m1, ta, mu
	; LMULMAX2-RV32-NEXT: vle32.v v8, (a0)			; LMULMAX2-RV32I-NEXT: vle32.v v8, (a0)
	; LMULMAX2-RV32-NEXT: vsrl.vi v9, v8, 1			; LMULMAX2-RV32I-NEXT: vsrl.vi v9, v8, 1
	; LMULMAX2-RV32-NEXT: vor.vv v8, v8, v9			; LMULMAX2-RV32I-NEXT: vor.vv v8, v8, v9
	; LMULMAX2-RV32-NEXT: vsrl.vi v9, v8, 2			; LMULMAX2-RV32I-NEXT: vsrl.vi v9, v8, 2
	; LMULMAX2-RV32-NEXT: vor.vv v8, v8, v9			; LMULMAX2-RV32I-NEXT: vor.vv v8, v8, v9
	; LMULMAX2-RV32-NEXT: vsrl.vi v9, v8, 4			; LMULMAX2-RV32I-NEXT: vsrl.vi v9, v8, 4
	; LMULMAX2-RV32-NEXT: vor.vv v8, v8, v9			; LMULMAX2-RV32I-NEXT: vor.vv v8, v8, v9
	; LMULMAX2-RV32-NEXT: vsrl.vi v9, v8, 8			; LMULMAX2-RV32I-NEXT: vsrl.vi v9, v8, 8
	; LMULMAX2-RV32-NEXT: vor.vv v8, v8, v9			; LMULMAX2-RV32I-NEXT: vor.vv v8, v8, v9
	; LMULMAX2-RV32-NEXT: vsrl.vi v9, v8, 16			; LMULMAX2-RV32I-NEXT: vsrl.vi v9, v8, 16
	; LMULMAX2-RV32-NEXT: vor.vv v8, v8, v9			; LMULMAX2-RV32I-NEXT: vor.vv v8, v8, v9
	; LMULMAX2-RV32-NEXT: vxor.vi v8, v8, -1			; LMULMAX2-RV32I-NEXT: vxor.vi v8, v8, -1
	; LMULMAX2-RV32-NEXT: vsrl.vi v9, v8, 1			; LMULMAX2-RV32I-NEXT: vsrl.vi v9, v8, 1
	; LMULMAX2-RV32-NEXT: lui a1, 349525			; LMULMAX2-RV32I-NEXT: lui a1, 349525
	; LMULMAX2-RV32-NEXT: addi a1, a1, 1365			; LMULMAX2-RV32I-NEXT: addi a1, a1, 1365
	; LMULMAX2-RV32-NEXT: vand.vx v9, v9, a1			; LMULMAX2-RV32I-NEXT: vand.vx v9, v9, a1
	; LMULMAX2-RV32-NEXT: vsub.vv v8, v8, v9			; LMULMAX2-RV32I-NEXT: vsub.vv v8, v8, v9
	; LMULMAX2-RV32-NEXT: lui a1, 209715			; LMULMAX2-RV32I-NEXT: lui a1, 209715
	; LMULMAX2-RV32-NEXT: addi a1, a1, 819			; LMULMAX2-RV32I-NEXT: addi a1, a1, 819
	; LMULMAX2-RV32-NEXT: vand.vx v9, v8, a1			; LMULMAX2-RV32I-NEXT: vand.vx v9, v8, a1
	; LMULMAX2-RV32-NEXT: vsrl.vi v8, v8, 2			; LMULMAX2-RV32I-NEXT: vsrl.vi v8, v8, 2
	; LMULMAX2-RV32-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV32I-NEXT: vand.vx v8, v8, a1
	; LMULMAX2-RV32-NEXT: vadd.vv v8, v9, v8			; LMULMAX2-RV32I-NEXT: vadd.vv v8, v9, v8
	; LMULMAX2-RV32-NEXT: vsrl.vi v9, v8, 4			; LMULMAX2-RV32I-NEXT: vsrl.vi v9, v8, 4
	; LMULMAX2-RV32-NEXT: vadd.vv v8, v8, v9			; LMULMAX2-RV32I-NEXT: vadd.vv v8, v8, v9
	; LMULMAX2-RV32-NEXT: lui a1, 61681			; LMULMAX2-RV32I-NEXT: lui a1, 61681
	; LMULMAX2-RV32-NEXT: addi a1, a1, -241			; LMULMAX2-RV32I-NEXT: addi a1, a1, -241
	; LMULMAX2-RV32-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV32I-NEXT: vand.vx v8, v8, a1
	; LMULMAX2-RV32-NEXT: lui a1, 4112			; LMULMAX2-RV32I-NEXT: lui a1, 4112
	; LMULMAX2-RV32-NEXT: addi a1, a1, 257			; LMULMAX2-RV32I-NEXT: addi a1, a1, 257
	; LMULMAX2-RV32-NEXT: vmul.vx v8, v8, a1			; LMULMAX2-RV32I-NEXT: vmul.vx v8, v8, a1
	; LMULMAX2-RV32-NEXT: vsrl.vi v8, v8, 24			; LMULMAX2-RV32I-NEXT: vsrl.vi v8, v8, 24
	; LMULMAX2-RV32-NEXT: vse32.v v8, (a0)			; LMULMAX2-RV32I-NEXT: vse32.v v8, (a0)
	; LMULMAX2-RV32-NEXT: ret			; LMULMAX2-RV32I-NEXT: ret
	;			;
	; LMULMAX2-RV64-LABEL: ctlz_v4i32:			; LMULMAX2-RV64I-LABEL: ctlz_v4i32:
	; LMULMAX2-RV64: # %bb.0:			; LMULMAX2-RV64I: # %bb.0:
	; LMULMAX2-RV64-NEXT: vsetivli zero, 4, e32, m1, ta, mu			; LMULMAX2-RV64I-NEXT: vsetivli zero, 4, e32, m1, ta, mu
	; LMULMAX2-RV64-NEXT: vle32.v v8, (a0)			; LMULMAX2-RV64I-NEXT: vle32.v v8, (a0)
	; LMULMAX2-RV64-NEXT: vsrl.vi v9, v8, 1			; LMULMAX2-RV64I-NEXT: vsrl.vi v9, v8, 1
	; LMULMAX2-RV64-NEXT: vor.vv v8, v8, v9			; LMULMAX2-RV64I-NEXT: vor.vv v8, v8, v9
	; LMULMAX2-RV64-NEXT: vsrl.vi v9, v8, 2			; LMULMAX2-RV64I-NEXT: vsrl.vi v9, v8, 2
	; LMULMAX2-RV64-NEXT: vor.vv v8, v8, v9			; LMULMAX2-RV64I-NEXT: vor.vv v8, v8, v9
	; LMULMAX2-RV64-NEXT: vsrl.vi v9, v8, 4			; LMULMAX2-RV64I-NEXT: vsrl.vi v9, v8, 4
	; LMULMAX2-RV64-NEXT: vor.vv v8, v8, v9			; LMULMAX2-RV64I-NEXT: vor.vv v8, v8, v9
	; LMULMAX2-RV64-NEXT: vsrl.vi v9, v8, 8			; LMULMAX2-RV64I-NEXT: vsrl.vi v9, v8, 8
	; LMULMAX2-RV64-NEXT: vor.vv v8, v8, v9			; LMULMAX2-RV64I-NEXT: vor.vv v8, v8, v9
	; LMULMAX2-RV64-NEXT: vsrl.vi v9, v8, 16			; LMULMAX2-RV64I-NEXT: vsrl.vi v9, v8, 16
	; LMULMAX2-RV64-NEXT: vor.vv v8, v8, v9			; LMULMAX2-RV64I-NEXT: vor.vv v8, v8, v9
	; LMULMAX2-RV64-NEXT: vxor.vi v8, v8, -1			; LMULMAX2-RV64I-NEXT: vxor.vi v8, v8, -1
	; LMULMAX2-RV64-NEXT: vsrl.vi v9, v8, 1			; LMULMAX2-RV64I-NEXT: vsrl.vi v9, v8, 1
	; LMULMAX2-RV64-NEXT: lui a1, 349525			; LMULMAX2-RV64I-NEXT: lui a1, 349525
	; LMULMAX2-RV64-NEXT: addiw a1, a1, 1365			; LMULMAX2-RV64I-NEXT: addiw a1, a1, 1365
	; LMULMAX2-RV64-NEXT: vand.vx v9, v9, a1			; LMULMAX2-RV64I-NEXT: vand.vx v9, v9, a1
	; LMULMAX2-RV64-NEXT: vsub.vv v8, v8, v9			; LMULMAX2-RV64I-NEXT: vsub.vv v8, v8, v9
	; LMULMAX2-RV64-NEXT: lui a1, 209715			; LMULMAX2-RV64I-NEXT: lui a1, 209715
	; LMULMAX2-RV64-NEXT: addiw a1, a1, 819			; LMULMAX2-RV64I-NEXT: addiw a1, a1, 819
	; LMULMAX2-RV64-NEXT: vand.vx v9, v8, a1			; LMULMAX2-RV64I-NEXT: vand.vx v9, v8, a1
	; LMULMAX2-RV64-NEXT: vsrl.vi v8, v8, 2			; LMULMAX2-RV64I-NEXT: vsrl.vi v8, v8, 2
	; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV64I-NEXT: vand.vx v8, v8, a1
	; LMULMAX2-RV64-NEXT: vadd.vv v8, v9, v8			; LMULMAX2-RV64I-NEXT: vadd.vv v8, v9, v8
	; LMULMAX2-RV64-NEXT: vsrl.vi v9, v8, 4			; LMULMAX2-RV64I-NEXT: vsrl.vi v9, v8, 4
	; LMULMAX2-RV64-NEXT: vadd.vv v8, v8, v9			; LMULMAX2-RV64I-NEXT: vadd.vv v8, v8, v9
	; LMULMAX2-RV64-NEXT: lui a1, 61681			; LMULMAX2-RV64I-NEXT: lui a1, 61681
	; LMULMAX2-RV64-NEXT: addiw a1, a1, -241			; LMULMAX2-RV64I-NEXT: addiw a1, a1, -241
	; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV64I-NEXT: vand.vx v8, v8, a1
	; LMULMAX2-RV64-NEXT: lui a1, 4112			; LMULMAX2-RV64I-NEXT: lui a1, 4112
	; LMULMAX2-RV64-NEXT: addiw a1, a1, 257			; LMULMAX2-RV64I-NEXT: addiw a1, a1, 257
	; LMULMAX2-RV64-NEXT: vmul.vx v8, v8, a1			; LMULMAX2-RV64I-NEXT: vmul.vx v8, v8, a1
	; LMULMAX2-RV64-NEXT: vsrl.vi v8, v8, 24			; LMULMAX2-RV64I-NEXT: vsrl.vi v8, v8, 24
	; LMULMAX2-RV64-NEXT: vse32.v v8, (a0)			; LMULMAX2-RV64I-NEXT: vse32.v v8, (a0)
	; LMULMAX2-RV64-NEXT: ret			; LMULMAX2-RV64I-NEXT: ret
	;			;
	; LMULMAX1-RV32-LABEL: ctlz_v4i32:			; LMULMAX2-RV32D-LABEL: ctlz_v4i32:
	; LMULMAX1-RV32: # %bb.0:			; LMULMAX2-RV32D: # %bb.0:
	; LMULMAX1-RV32-NEXT: vsetivli zero, 4, e32, m1, ta, mu			; LMULMAX2-RV32D-NEXT: vsetivli zero, 4, e32, m1, ta, mu
	; LMULMAX1-RV32-NEXT: vle32.v v8, (a0)			; LMULMAX2-RV32D-NEXT: vle32.v v8, (a0)
	; LMULMAX1-RV32-NEXT: vsrl.vi v9, v8, 1			; LMULMAX2-RV32D-NEXT: vfwcvt.f.xu.v v10, v8
	; LMULMAX1-RV32-NEXT: vor.vv v8, v8, v9			; LMULMAX2-RV32D-NEXT: addi a1, zero, 52
	; LMULMAX1-RV32-NEXT: vsrl.vi v9, v8, 2			; LMULMAX2-RV32D-NEXT: vnsrl.wx v9, v10, a1
	; LMULMAX1-RV32-NEXT: vor.vv v8, v8, v9			; LMULMAX2-RV32D-NEXT: addi a1, zero, 1054
	; LMULMAX1-RV32-NEXT: vsrl.vi v9, v8, 4			; LMULMAX2-RV32D-NEXT: vrsub.vx v9, v9, a1
	; LMULMAX1-RV32-NEXT: vor.vv v8, v8, v9			; LMULMAX2-RV32D-NEXT: vmseq.vi v0, v8, 0
	; LMULMAX1-RV32-NEXT: vsrl.vi v9, v8, 8			; LMULMAX2-RV32D-NEXT: addi a1, zero, 32
	; LMULMAX1-RV32-NEXT: vor.vv v8, v8, v9			; LMULMAX2-RV32D-NEXT: vmerge.vxm v8, v9, a1, v0
	; LMULMAX1-RV32-NEXT: vsrl.vi v9, v8, 16			; LMULMAX2-RV32D-NEXT: vse32.v v8, (a0)
	; LMULMAX1-RV32-NEXT: vor.vv v8, v8, v9			; LMULMAX2-RV32D-NEXT: ret
	; LMULMAX1-RV32-NEXT: vxor.vi v8, v8, -1			;
	; LMULMAX1-RV32-NEXT: vsrl.vi v9, v8, 1			; LMULMAX2-RV64D-LABEL: ctlz_v4i32:
	; LMULMAX1-RV32-NEXT: lui a1, 349525			; LMULMAX2-RV64D: # %bb.0:
	; LMULMAX1-RV32-NEXT: addi a1, a1, 1365			; LMULMAX2-RV64D-NEXT: vsetivli zero, 4, e32, m1, ta, mu
	; LMULMAX1-RV32-NEXT: vand.vx v9, v9, a1			; LMULMAX2-RV64D-NEXT: vle32.v v8, (a0)
	; LMULMAX1-RV32-NEXT: vsub.vv v8, v8, v9			; LMULMAX2-RV64D-NEXT: vfwcvt.f.xu.v v10, v8
	; LMULMAX1-RV32-NEXT: lui a1, 209715			; LMULMAX2-RV64D-NEXT: addi a1, zero, 52
	; LMULMAX1-RV32-NEXT: addi a1, a1, 819			; LMULMAX2-RV64D-NEXT: vnsrl.wx v9, v10, a1
	; LMULMAX1-RV32-NEXT: vand.vx v9, v8, a1			; LMULMAX2-RV64D-NEXT: addi a1, zero, 1054
	; LMULMAX1-RV32-NEXT: vsrl.vi v8, v8, 2			; LMULMAX2-RV64D-NEXT: vrsub.vx v9, v9, a1
	; LMULMAX1-RV32-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV64D-NEXT: vmseq.vi v0, v8, 0
	; LMULMAX1-RV32-NEXT: vadd.vv v8, v9, v8			; LMULMAX2-RV64D-NEXT: addi a1, zero, 32
	; LMULMAX1-RV32-NEXT: vsrl.vi v9, v8, 4			; LMULMAX2-RV64D-NEXT: vmerge.vxm v8, v9, a1, v0
	; LMULMAX1-RV32-NEXT: vadd.vv v8, v8, v9			; LMULMAX2-RV64D-NEXT: vse32.v v8, (a0)
	; LMULMAX1-RV32-NEXT: lui a1, 61681			; LMULMAX2-RV64D-NEXT: ret
	; LMULMAX1-RV32-NEXT: addi a1, a1, -241			;
	; LMULMAX1-RV32-NEXT: vand.vx v8, v8, a1			; LMULMAX1-RV32D-LABEL: ctlz_v4i32:
	; LMULMAX1-RV32-NEXT: lui a1, 4112			; LMULMAX1-RV32D: # %bb.0:
	; LMULMAX1-RV32-NEXT: addi a1, a1, 257			; LMULMAX1-RV32D-NEXT: vsetivli zero, 4, e32, m1, ta, mu
	; LMULMAX1-RV32-NEXT: vmul.vx v8, v8, a1			; LMULMAX1-RV32D-NEXT: vle32.v v8, (a0)
	; LMULMAX1-RV32-NEXT: vsrl.vi v8, v8, 24			; LMULMAX1-RV32D-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
	; LMULMAX1-RV32-NEXT: vse32.v v8, (a0)			; LMULMAX1-RV32D-NEXT: vfwcvt.f.xu.v v9, v8
	; LMULMAX1-RV32-NEXT: ret			; LMULMAX1-RV32D-NEXT: addi a1, zero, 52
	;			; LMULMAX1-RV32D-NEXT: vnsrl.wx v9, v9, a1
	; LMULMAX1-RV64-LABEL: ctlz_v4i32:			; LMULMAX1-RV32D-NEXT: addi a2, zero, 1054
	; LMULMAX1-RV64: # %bb.0:			; LMULMAX1-RV32D-NEXT: vrsub.vx v9, v9, a2
	; LMULMAX1-RV64-NEXT: vsetivli zero, 4, e32, m1, ta, mu			; LMULMAX1-RV32D-NEXT: vsetivli zero, 4, e32, m1, ta, mu
	; LMULMAX1-RV64-NEXT: vle32.v v8, (a0)			; LMULMAX1-RV32D-NEXT: vmv.v.i v10, 0
	; LMULMAX1-RV64-NEXT: vsrl.vi v9, v8, 1			; LMULMAX1-RV32D-NEXT: vsetivli zero, 2, e32, m1, tu, mu
	; LMULMAX1-RV64-NEXT: vor.vv v8, v8, v9			; LMULMAX1-RV32D-NEXT: vslideup.vi v10, v9, 0
	; LMULMAX1-RV64-NEXT: vsrl.vi v9, v8, 2			; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e32, m1, ta, mu
	; LMULMAX1-RV64-NEXT: vor.vv v8, v8, v9			; LMULMAX1-RV32D-NEXT: vslidedown.vi v9, v8, 2
	; LMULMAX1-RV64-NEXT: vsrl.vi v9, v8, 4			; LMULMAX1-RV32D-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
	; LMULMAX1-RV64-NEXT: vor.vv v8, v8, v9			; LMULMAX1-RV32D-NEXT: vfwcvt.f.xu.v v11, v9
	; LMULMAX1-RV64-NEXT: vsrl.vi v9, v8, 8			; LMULMAX1-RV32D-NEXT: vnsrl.wx v9, v11, a1
	; LMULMAX1-RV64-NEXT: vor.vv v8, v8, v9			; LMULMAX1-RV32D-NEXT: vrsub.vx v9, v9, a2
	; LMULMAX1-RV64-NEXT: vsrl.vi v9, v8, 16			; LMULMAX1-RV32D-NEXT: vsetivli zero, 4, e32, m1, tu, mu
	; LMULMAX1-RV64-NEXT: vor.vv v8, v8, v9			; LMULMAX1-RV32D-NEXT: vslideup.vi v10, v9, 2
	; LMULMAX1-RV64-NEXT: vxor.vi v8, v8, -1			; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e32, m1, ta, mu
	; LMULMAX1-RV64-NEXT: vsrl.vi v9, v8, 1			; LMULMAX1-RV32D-NEXT: vmseq.vi v0, v8, 0
	; LMULMAX1-RV64-NEXT: lui a1, 349525			; LMULMAX1-RV32D-NEXT: addi a1, zero, 32
	; LMULMAX1-RV64-NEXT: addiw a1, a1, 1365			; LMULMAX1-RV32D-NEXT: vmerge.vxm v8, v10, a1, v0
	; LMULMAX1-RV64-NEXT: vand.vx v9, v9, a1			; LMULMAX1-RV32D-NEXT: vse32.v v8, (a0)
	; LMULMAX1-RV64-NEXT: vsub.vv v8, v8, v9			; LMULMAX1-RV32D-NEXT: ret
	; LMULMAX1-RV64-NEXT: lui a1, 209715			;
	; LMULMAX1-RV64-NEXT: addiw a1, a1, 819			; LMULMAX1-RV64D-LABEL: ctlz_v4i32:
	; LMULMAX1-RV64-NEXT: vand.vx v9, v8, a1			; LMULMAX1-RV64D: # %bb.0:
	; LMULMAX1-RV64-NEXT: vsrl.vi v8, v8, 2			; LMULMAX1-RV64D-NEXT: vsetivli zero, 4, e32, m1, ta, mu
	; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX1-RV64D-NEXT: vle32.v v8, (a0)
	; LMULMAX1-RV64-NEXT: vadd.vv v8, v9, v8			; LMULMAX1-RV64D-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
	; LMULMAX1-RV64-NEXT: vsrl.vi v9, v8, 4			; LMULMAX1-RV64D-NEXT: vfwcvt.f.xu.v v9, v8
	; LMULMAX1-RV64-NEXT: vadd.vv v8, v8, v9			; LMULMAX1-RV64D-NEXT: addi a1, zero, 52
	; LMULMAX1-RV64-NEXT: lui a1, 61681			; LMULMAX1-RV64D-NEXT: vnsrl.wx v9, v9, a1
	; LMULMAX1-RV64-NEXT: addiw a1, a1, -241			; LMULMAX1-RV64D-NEXT: addi a2, zero, 1054
	; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX1-RV64D-NEXT: vrsub.vx v9, v9, a2
	; LMULMAX1-RV64-NEXT: lui a1, 4112			; LMULMAX1-RV64D-NEXT: vsetivli zero, 4, e32, m1, ta, mu
	; LMULMAX1-RV64-NEXT: addiw a1, a1, 257			; LMULMAX1-RV64D-NEXT: vmv.v.i v10, 0
	; LMULMAX1-RV64-NEXT: vmul.vx v8, v8, a1			; LMULMAX1-RV64D-NEXT: vsetivli zero, 2, e32, m1, tu, mu
	; LMULMAX1-RV64-NEXT: vsrl.vi v8, v8, 24			; LMULMAX1-RV64D-NEXT: vslideup.vi v10, v9, 0
	; LMULMAX1-RV64-NEXT: vse32.v v8, (a0)			; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e32, m1, ta, mu
	; LMULMAX1-RV64-NEXT: ret			; LMULMAX1-RV64D-NEXT: vslidedown.vi v9, v8, 2
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
				; LMULMAX1-RV64D-NEXT: vfwcvt.f.xu.v v11, v9
				; LMULMAX1-RV64D-NEXT: vnsrl.wx v9, v11, a1
				; LMULMAX1-RV64D-NEXT: vrsub.vx v9, v9, a2
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 4, e32, m1, tu, mu
				; LMULMAX1-RV64D-NEXT: vslideup.vi v10, v9, 2
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e32, m1, ta, mu
				; LMULMAX1-RV64D-NEXT: vmseq.vi v0, v8, 0
				; LMULMAX1-RV64D-NEXT: addi a1, zero, 32
				; LMULMAX1-RV64D-NEXT: vmerge.vxm v8, v10, a1, v0
				; LMULMAX1-RV64D-NEXT: vse32.v v8, (a0)
				; LMULMAX1-RV64D-NEXT: ret
				;
				; LMULMAX8-RV32-LABEL: ctlz_v4i32:
				; LMULMAX8-RV32: # %bb.0:
				; LMULMAX8-RV32-NEXT: vsetivli zero, 4, e32, m1, ta, mu
				; LMULMAX8-RV32-NEXT: vle32.v v8, (a0)
				; LMULMAX8-RV32-NEXT: vfwcvt.f.xu.v v10, v8
				; LMULMAX8-RV32-NEXT: addi a1, zero, 52
				; LMULMAX8-RV32-NEXT: vnsrl.wx v9, v10, a1
				; LMULMAX8-RV32-NEXT: addi a1, zero, 1054
				; LMULMAX8-RV32-NEXT: vrsub.vx v9, v9, a1
				; LMULMAX8-RV32-NEXT: vmseq.vi v0, v8, 0
				; LMULMAX8-RV32-NEXT: addi a1, zero, 32
				; LMULMAX8-RV32-NEXT: vmerge.vxm v8, v9, a1, v0
				; LMULMAX8-RV32-NEXT: vse32.v v8, (a0)
				; LMULMAX8-RV32-NEXT: ret
				;
				; LMULMAX8-RV64-LABEL: ctlz_v4i32:
				; LMULMAX8-RV64: # %bb.0:
				; LMULMAX8-RV64-NEXT: vsetivli zero, 4, e32, m1, ta, mu
				; LMULMAX8-RV64-NEXT: vle32.v v8, (a0)
				; LMULMAX8-RV64-NEXT: vfwcvt.f.xu.v v10, v8
				; LMULMAX8-RV64-NEXT: addi a1, zero, 52
				; LMULMAX8-RV64-NEXT: vnsrl.wx v9, v10, a1
				; LMULMAX8-RV64-NEXT: addi a1, zero, 1054
				; LMULMAX8-RV64-NEXT: vrsub.vx v9, v9, a1
				; LMULMAX8-RV64-NEXT: vmseq.vi v0, v8, 0
				; LMULMAX8-RV64-NEXT: addi a1, zero, 32
				; LMULMAX8-RV64-NEXT: vmerge.vxm v8, v9, a1, v0
				; LMULMAX8-RV64-NEXT: vse32.v v8, (a0)
				; LMULMAX8-RV64-NEXT: ret
	%a = load <4 x i32>, <4 x i32>* %x			%a = load <4 x i32>, <4 x i32>* %x
	%b = load <4 x i32>, <4 x i32>* %y			%b = load <4 x i32>, <4 x i32>* %y
	%c = call <4 x i32> @llvm.ctlz.v4i32(<4 x i32> %a, i1 false)			%c = call <4 x i32> @llvm.ctlz.v4i32(<4 x i32> %a, i1 false)
	store <4 x i32> %c, <4 x i32>* %x			store <4 x i32> %c, <4 x i32>* %x
	ret void			ret void
	}			}
	declare <4 x i32> @llvm.ctlz.v4i32(<4 x i32>, i1)			declare <4 x i32> @llvm.ctlz.v4i32(<4 x i32>, i1)

	▲ Show 20 Lines • Show All 234 Lines • ▼ Show 20 Lines
	; LMULMAX1-RV64-NEXT: addi a1, a1, 257			; LMULMAX1-RV64-NEXT: addi a1, a1, 257
	; LMULMAX1-RV64-NEXT: slli a1, a1, 16			; LMULMAX1-RV64-NEXT: slli a1, a1, 16
	; LMULMAX1-RV64-NEXT: addi a1, a1, 257			; LMULMAX1-RV64-NEXT: addi a1, a1, 257
	; LMULMAX1-RV64-NEXT: vmul.vx v8, v8, a1			; LMULMAX1-RV64-NEXT: vmul.vx v8, v8, a1
	; LMULMAX1-RV64-NEXT: addi a1, zero, 56			; LMULMAX1-RV64-NEXT: addi a1, zero, 56
	; LMULMAX1-RV64-NEXT: vsrl.vx v8, v8, a1			; LMULMAX1-RV64-NEXT: vsrl.vx v8, v8, a1
	; LMULMAX1-RV64-NEXT: vse64.v v8, (a0)			; LMULMAX1-RV64-NEXT: vse64.v v8, (a0)
	; LMULMAX1-RV64-NEXT: ret			; LMULMAX1-RV64-NEXT: ret
				;
				; LMULMAX8-RV32-LABEL: ctlz_v2i64:
				; LMULMAX8-RV32: # %bb.0:
				; LMULMAX8-RV32-NEXT: vsetivli zero, 2, e64, m1, ta, mu
				; LMULMAX8-RV32-NEXT: vle64.v v8, (a0)
				; LMULMAX8-RV32-NEXT: vsrl.vi v9, v8, 1
				; LMULMAX8-RV32-NEXT: vor.vv v8, v8, v9
				; LMULMAX8-RV32-NEXT: vsrl.vi v9, v8, 2
				; LMULMAX8-RV32-NEXT: vor.vv v8, v8, v9
				; LMULMAX8-RV32-NEXT: vsrl.vi v9, v8, 4
				; LMULMAX8-RV32-NEXT: vor.vv v8, v8, v9
				; LMULMAX8-RV32-NEXT: vsrl.vi v9, v8, 8
				; LMULMAX8-RV32-NEXT: vor.vv v8, v8, v9
				; LMULMAX8-RV32-NEXT: vsrl.vi v9, v8, 16
				; LMULMAX8-RV32-NEXT: vor.vv v8, v8, v9
				; LMULMAX8-RV32-NEXT: addi a1, zero, 32
				; LMULMAX8-RV32-NEXT: vsrl.vx v9, v8, a1
				; LMULMAX8-RV32-NEXT: vor.vv v8, v8, v9
				; LMULMAX8-RV32-NEXT: vsetivli zero, 4, e32, m1, ta, mu
				; LMULMAX8-RV32-NEXT: vmv.v.i v9, -1
				; LMULMAX8-RV32-NEXT: vsetivli zero, 2, e64, m1, ta, mu
				; LMULMAX8-RV32-NEXT: vxor.vv v8, v8, v9
				; LMULMAX8-RV32-NEXT: vsrl.vi v9, v8, 1
				; LMULMAX8-RV32-NEXT: lui a1, 349525
				; LMULMAX8-RV32-NEXT: addi a1, a1, 1365
				; LMULMAX8-RV32-NEXT: vsetivli zero, 4, e32, m1, ta, mu
				; LMULMAX8-RV32-NEXT: vmv.v.x v10, a1
				; LMULMAX8-RV32-NEXT: vsetivli zero, 2, e64, m1, ta, mu
				; LMULMAX8-RV32-NEXT: vand.vv v9, v9, v10
				; LMULMAX8-RV32-NEXT: vsub.vv v8, v8, v9
				; LMULMAX8-RV32-NEXT: lui a1, 209715
				; LMULMAX8-RV32-NEXT: addi a1, a1, 819
				; LMULMAX8-RV32-NEXT: vsetivli zero, 4, e32, m1, ta, mu
				; LMULMAX8-RV32-NEXT: vmv.v.x v9, a1
				; LMULMAX8-RV32-NEXT: vsetivli zero, 2, e64, m1, ta, mu
				; LMULMAX8-RV32-NEXT: vand.vv v10, v8, v9
				; LMULMAX8-RV32-NEXT: vsrl.vi v8, v8, 2
				; LMULMAX8-RV32-NEXT: vand.vv v8, v8, v9
				; LMULMAX8-RV32-NEXT: vadd.vv v8, v10, v8
				; LMULMAX8-RV32-NEXT: vsrl.vi v9, v8, 4
				; LMULMAX8-RV32-NEXT: vadd.vv v8, v8, v9
				; LMULMAX8-RV32-NEXT: lui a1, 61681
				; LMULMAX8-RV32-NEXT: addi a1, a1, -241
				; LMULMAX8-RV32-NEXT: vsetivli zero, 4, e32, m1, ta, mu
				; LMULMAX8-RV32-NEXT: vmv.v.x v9, a1
				; LMULMAX8-RV32-NEXT: vsetivli zero, 2, e64, m1, ta, mu
				; LMULMAX8-RV32-NEXT: vand.vv v8, v8, v9
				; LMULMAX8-RV32-NEXT: lui a1, 4112
				; LMULMAX8-RV32-NEXT: addi a1, a1, 257
				; LMULMAX8-RV32-NEXT: vsetivli zero, 4, e32, m1, ta, mu
				; LMULMAX8-RV32-NEXT: vmv.v.x v9, a1
				; LMULMAX8-RV32-NEXT: vsetivli zero, 2, e64, m1, ta, mu
				; LMULMAX8-RV32-NEXT: vmul.vv v8, v8, v9
				; LMULMAX8-RV32-NEXT: addi a1, zero, 56
				; LMULMAX8-RV32-NEXT: vsrl.vx v8, v8, a1
				; LMULMAX8-RV32-NEXT: vse64.v v8, (a0)
				; LMULMAX8-RV32-NEXT: ret
				;
				; LMULMAX8-RV64-LABEL: ctlz_v2i64:
				; LMULMAX8-RV64: # %bb.0:
				; LMULMAX8-RV64-NEXT: vsetivli zero, 2, e64, m1, ta, mu
				; LMULMAX8-RV64-NEXT: vle64.v v8, (a0)
				; LMULMAX8-RV64-NEXT: vsrl.vi v9, v8, 1
				; LMULMAX8-RV64-NEXT: vor.vv v8, v8, v9
				; LMULMAX8-RV64-NEXT: vsrl.vi v9, v8, 2
				; LMULMAX8-RV64-NEXT: vor.vv v8, v8, v9
				; LMULMAX8-RV64-NEXT: vsrl.vi v9, v8, 4
				; LMULMAX8-RV64-NEXT: vor.vv v8, v8, v9
				; LMULMAX8-RV64-NEXT: vsrl.vi v9, v8, 8
				; LMULMAX8-RV64-NEXT: vor.vv v8, v8, v9
				; LMULMAX8-RV64-NEXT: vsrl.vi v9, v8, 16
				; LMULMAX8-RV64-NEXT: vor.vv v8, v8, v9
				; LMULMAX8-RV64-NEXT: addi a1, zero, 32
				; LMULMAX8-RV64-NEXT: vsrl.vx v9, v8, a1
				; LMULMAX8-RV64-NEXT: vor.vv v8, v8, v9
				; LMULMAX8-RV64-NEXT: vxor.vi v8, v8, -1
				; LMULMAX8-RV64-NEXT: vsrl.vi v9, v8, 1
				; LMULMAX8-RV64-NEXT: lui a1, 21845
				; LMULMAX8-RV64-NEXT: addiw a1, a1, 1365
				; LMULMAX8-RV64-NEXT: slli a1, a1, 12
				; LMULMAX8-RV64-NEXT: addi a1, a1, 1365
				; LMULMAX8-RV64-NEXT: slli a1, a1, 12
				; LMULMAX8-RV64-NEXT: addi a1, a1, 1365
				; LMULMAX8-RV64-NEXT: slli a1, a1, 12
				; LMULMAX8-RV64-NEXT: addi a1, a1, 1365
				; LMULMAX8-RV64-NEXT: vand.vx v9, v9, a1
				; LMULMAX8-RV64-NEXT: vsub.vv v8, v8, v9
				; LMULMAX8-RV64-NEXT: lui a1, 13107
				; LMULMAX8-RV64-NEXT: addiw a1, a1, 819
				; LMULMAX8-RV64-NEXT: slli a1, a1, 12
				; LMULMAX8-RV64-NEXT: addi a1, a1, 819
				; LMULMAX8-RV64-NEXT: slli a1, a1, 12
				; LMULMAX8-RV64-NEXT: addi a1, a1, 819
				; LMULMAX8-RV64-NEXT: slli a1, a1, 12
				; LMULMAX8-RV64-NEXT: addi a1, a1, 819
				; LMULMAX8-RV64-NEXT: vand.vx v9, v8, a1
				; LMULMAX8-RV64-NEXT: vsrl.vi v8, v8, 2
				; LMULMAX8-RV64-NEXT: vand.vx v8, v8, a1
				; LMULMAX8-RV64-NEXT: vadd.vv v8, v9, v8
				; LMULMAX8-RV64-NEXT: vsrl.vi v9, v8, 4
				; LMULMAX8-RV64-NEXT: vadd.vv v8, v8, v9
				; LMULMAX8-RV64-NEXT: lui a1, 3855
				; LMULMAX8-RV64-NEXT: addiw a1, a1, 241
				; LMULMAX8-RV64-NEXT: slli a1, a1, 12
				; LMULMAX8-RV64-NEXT: addi a1, a1, -241
				; LMULMAX8-RV64-NEXT: slli a1, a1, 12
				; LMULMAX8-RV64-NEXT: addi a1, a1, 241
				; LMULMAX8-RV64-NEXT: slli a1, a1, 12
				; LMULMAX8-RV64-NEXT: addi a1, a1, -241
				; LMULMAX8-RV64-NEXT: vand.vx v8, v8, a1
				; LMULMAX8-RV64-NEXT: lui a1, 4112
				; LMULMAX8-RV64-NEXT: addiw a1, a1, 257
				; LMULMAX8-RV64-NEXT: slli a1, a1, 16
				; LMULMAX8-RV64-NEXT: addi a1, a1, 257
				; LMULMAX8-RV64-NEXT: slli a1, a1, 16
				; LMULMAX8-RV64-NEXT: addi a1, a1, 257
				; LMULMAX8-RV64-NEXT: vmul.vx v8, v8, a1
				; LMULMAX8-RV64-NEXT: addi a1, zero, 56
				; LMULMAX8-RV64-NEXT: vsrl.vx v8, v8, a1
				; LMULMAX8-RV64-NEXT: vse64.v v8, (a0)
				; LMULMAX8-RV64-NEXT: ret
	%a = load <2 x i64>, <2 x i64>* %x			%a = load <2 x i64>, <2 x i64>* %x
	%b = load <2 x i64>, <2 x i64>* %y			%b = load <2 x i64>, <2 x i64>* %y
	%c = call <2 x i64> @llvm.ctlz.v2i64(<2 x i64> %a, i1 false)			%c = call <2 x i64> @llvm.ctlz.v2i64(<2 x i64> %a, i1 false)
	store <2 x i64> %c, <2 x i64>* %x			store <2 x i64> %c, <2 x i64>* %x
	ret void			ret void
	}			}
	declare <2 x i64> @llvm.ctlz.v2i64(<2 x i64>, i1)			declare <2 x i64> @llvm.ctlz.v2i64(<2 x i64>, i1)

	define void @ctlz_v32i8(<32 x i8>* %x, <32 x i8>* %y) nounwind {			define void @ctlz_v32i8(<32 x i8>* %x, <32 x i8>* %y) nounwind {
	; LMULMAX2-RV32-LABEL: ctlz_v32i8:			; LMULMAX2-RV32I-LABEL: ctlz_v32i8:
	; LMULMAX2-RV32: # %bb.0:			; LMULMAX2-RV32I: # %bb.0:
	; LMULMAX2-RV32-NEXT: addi a1, zero, 32			; LMULMAX2-RV32I-NEXT: addi a1, zero, 32
	; LMULMAX2-RV32-NEXT: vsetvli zero, a1, e8, m2, ta, mu			; LMULMAX2-RV32I-NEXT: vsetvli zero, a1, e8, m2, ta, mu
	; LMULMAX2-RV32-NEXT: vle8.v v8, (a0)			; LMULMAX2-RV32I-NEXT: vle8.v v8, (a0)
	; LMULMAX2-RV32-NEXT: vsrl.vi v10, v8, 1			; LMULMAX2-RV32I-NEXT: vsrl.vi v10, v8, 1
	; LMULMAX2-RV32-NEXT: vor.vv v8, v8, v10			; LMULMAX2-RV32I-NEXT: vor.vv v8, v8, v10
	; LMULMAX2-RV32-NEXT: vsrl.vi v10, v8, 2			; LMULMAX2-RV32I-NEXT: vsrl.vi v10, v8, 2
	; LMULMAX2-RV32-NEXT: vor.vv v8, v8, v10			; LMULMAX2-RV32I-NEXT: vor.vv v8, v8, v10
	; LMULMAX2-RV32-NEXT: vsrl.vi v10, v8, 4			; LMULMAX2-RV32I-NEXT: vsrl.vi v10, v8, 4
	; LMULMAX2-RV32-NEXT: vor.vv v8, v8, v10			; LMULMAX2-RV32I-NEXT: vor.vv v8, v8, v10
	; LMULMAX2-RV32-NEXT: vxor.vi v8, v8, -1			; LMULMAX2-RV32I-NEXT: vxor.vi v8, v8, -1
	; LMULMAX2-RV32-NEXT: vsrl.vi v10, v8, 1			; LMULMAX2-RV32I-NEXT: vsrl.vi v10, v8, 1
	; LMULMAX2-RV32-NEXT: addi a1, zero, 85			; LMULMAX2-RV32I-NEXT: addi a1, zero, 85
	; LMULMAX2-RV32-NEXT: vand.vx v10, v10, a1			; LMULMAX2-RV32I-NEXT: vand.vx v10, v10, a1
	; LMULMAX2-RV32-NEXT: vsub.vv v8, v8, v10			; LMULMAX2-RV32I-NEXT: vsub.vv v8, v8, v10
	; LMULMAX2-RV32-NEXT: addi a1, zero, 51			; LMULMAX2-RV32I-NEXT: addi a1, zero, 51
	; LMULMAX2-RV32-NEXT: vand.vx v10, v8, a1			; LMULMAX2-RV32I-NEXT: vand.vx v10, v8, a1
	; LMULMAX2-RV32-NEXT: vsrl.vi v8, v8, 2			; LMULMAX2-RV32I-NEXT: vsrl.vi v8, v8, 2
	; LMULMAX2-RV32-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV32I-NEXT: vand.vx v8, v8, a1
	; LMULMAX2-RV32-NEXT: vadd.vv v8, v10, v8			; LMULMAX2-RV32I-NEXT: vadd.vv v8, v10, v8
	; LMULMAX2-RV32-NEXT: vsrl.vi v10, v8, 4			; LMULMAX2-RV32I-NEXT: vsrl.vi v10, v8, 4
	; LMULMAX2-RV32-NEXT: vadd.vv v8, v8, v10			; LMULMAX2-RV32I-NEXT: vadd.vv v8, v8, v10
	; LMULMAX2-RV32-NEXT: vand.vi v8, v8, 15			; LMULMAX2-RV32I-NEXT: vand.vi v8, v8, 15
	; LMULMAX2-RV32-NEXT: vse8.v v8, (a0)			; LMULMAX2-RV32I-NEXT: vse8.v v8, (a0)
	; LMULMAX2-RV32-NEXT: ret			; LMULMAX2-RV32I-NEXT: ret
	;			;
	; LMULMAX2-RV64-LABEL: ctlz_v32i8:			; LMULMAX2-RV64I-LABEL: ctlz_v32i8:
	; LMULMAX2-RV64: # %bb.0:			; LMULMAX2-RV64I: # %bb.0:
	; LMULMAX2-RV64-NEXT: addi a1, zero, 32			; LMULMAX2-RV64I-NEXT: addi a1, zero, 32
	; LMULMAX2-RV64-NEXT: vsetvli zero, a1, e8, m2, ta, mu			; LMULMAX2-RV64I-NEXT: vsetvli zero, a1, e8, m2, ta, mu
	; LMULMAX2-RV64-NEXT: vle8.v v8, (a0)			; LMULMAX2-RV64I-NEXT: vle8.v v8, (a0)
	; LMULMAX2-RV64-NEXT: vsrl.vi v10, v8, 1			; LMULMAX2-RV64I-NEXT: vsrl.vi v10, v8, 1
	; LMULMAX2-RV64-NEXT: vor.vv v8, v8, v10			; LMULMAX2-RV64I-NEXT: vor.vv v8, v8, v10
	; LMULMAX2-RV64-NEXT: vsrl.vi v10, v8, 2			; LMULMAX2-RV64I-NEXT: vsrl.vi v10, v8, 2
	; LMULMAX2-RV64-NEXT: vor.vv v8, v8, v10			; LMULMAX2-RV64I-NEXT: vor.vv v8, v8, v10
	; LMULMAX2-RV64-NEXT: vsrl.vi v10, v8, 4			; LMULMAX2-RV64I-NEXT: vsrl.vi v10, v8, 4
	; LMULMAX2-RV64-NEXT: vor.vv v8, v8, v10			; LMULMAX2-RV64I-NEXT: vor.vv v8, v8, v10
	; LMULMAX2-RV64-NEXT: vxor.vi v8, v8, -1			; LMULMAX2-RV64I-NEXT: vxor.vi v8, v8, -1
	; LMULMAX2-RV64-NEXT: vsrl.vi v10, v8, 1			; LMULMAX2-RV64I-NEXT: vsrl.vi v10, v8, 1
	; LMULMAX2-RV64-NEXT: addi a1, zero, 85			; LMULMAX2-RV64I-NEXT: addi a1, zero, 85
	; LMULMAX2-RV64-NEXT: vand.vx v10, v10, a1			; LMULMAX2-RV64I-NEXT: vand.vx v10, v10, a1
	; LMULMAX2-RV64-NEXT: vsub.vv v8, v8, v10			; LMULMAX2-RV64I-NEXT: vsub.vv v8, v8, v10
	; LMULMAX2-RV64-NEXT: addi a1, zero, 51			; LMULMAX2-RV64I-NEXT: addi a1, zero, 51
	; LMULMAX2-RV64-NEXT: vand.vx v10, v8, a1			; LMULMAX2-RV64I-NEXT: vand.vx v10, v8, a1
	; LMULMAX2-RV64-NEXT: vsrl.vi v8, v8, 2			; LMULMAX2-RV64I-NEXT: vsrl.vi v8, v8, 2
	; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV64I-NEXT: vand.vx v8, v8, a1
	; LMULMAX2-RV64-NEXT: vadd.vv v8, v10, v8			; LMULMAX2-RV64I-NEXT: vadd.vv v8, v10, v8
	; LMULMAX2-RV64-NEXT: vsrl.vi v10, v8, 4			; LMULMAX2-RV64I-NEXT: vsrl.vi v10, v8, 4
	; LMULMAX2-RV64-NEXT: vadd.vv v8, v8, v10			; LMULMAX2-RV64I-NEXT: vadd.vv v8, v8, v10
	; LMULMAX2-RV64-NEXT: vand.vi v8, v8, 15			; LMULMAX2-RV64I-NEXT: vand.vi v8, v8, 15
	; LMULMAX2-RV64-NEXT: vse8.v v8, (a0)			; LMULMAX2-RV64I-NEXT: vse8.v v8, (a0)
	; LMULMAX2-RV64-NEXT: ret			; LMULMAX2-RV64I-NEXT: ret
	;			;
	; LMULMAX1-RV32-LABEL: ctlz_v32i8:			; LMULMAX1-RV32I-LABEL: ctlz_v32i8:
	; LMULMAX1-RV32: # %bb.0:			; LMULMAX1-RV32I: # %bb.0:
	; LMULMAX1-RV32-NEXT: vsetivli zero, 16, e8, m1, ta, mu			; LMULMAX1-RV32I-NEXT: vsetivli zero, 16, e8, m1, ta, mu
	; LMULMAX1-RV32-NEXT: addi a1, a0, 16			; LMULMAX1-RV32I-NEXT: addi a1, a0, 16
	; LMULMAX1-RV32-NEXT: vle8.v v8, (a1)			; LMULMAX1-RV32I-NEXT: vle8.v v8, (a1)
	; LMULMAX1-RV32-NEXT: vle8.v v9, (a0)			; LMULMAX1-RV32I-NEXT: vle8.v v9, (a0)
	; LMULMAX1-RV32-NEXT: vsrl.vi v10, v8, 1			; LMULMAX1-RV32I-NEXT: vsrl.vi v10, v8, 1
	; LMULMAX1-RV32-NEXT: vor.vv v8, v8, v10			; LMULMAX1-RV32I-NEXT: vor.vv v8, v8, v10
	; LMULMAX1-RV32-NEXT: vsrl.vi v10, v8, 2			; LMULMAX1-RV32I-NEXT: vsrl.vi v10, v8, 2
	; LMULMAX1-RV32-NEXT: vor.vv v8, v8, v10			; LMULMAX1-RV32I-NEXT: vor.vv v8, v8, v10
	; LMULMAX1-RV32-NEXT: vsrl.vi v10, v8, 4			; LMULMAX1-RV32I-NEXT: vsrl.vi v10, v8, 4
	; LMULMAX1-RV32-NEXT: vor.vv v8, v8, v10			; LMULMAX1-RV32I-NEXT: vor.vv v8, v8, v10
	; LMULMAX1-RV32-NEXT: vxor.vi v8, v8, -1			; LMULMAX1-RV32I-NEXT: vxor.vi v8, v8, -1
	; LMULMAX1-RV32-NEXT: vsrl.vi v10, v8, 1			; LMULMAX1-RV32I-NEXT: vsrl.vi v10, v8, 1
	; LMULMAX1-RV32-NEXT: addi a2, zero, 85			; LMULMAX1-RV32I-NEXT: addi a2, zero, 85
	; LMULMAX1-RV32-NEXT: vand.vx v10, v10, a2			; LMULMAX1-RV32I-NEXT: vand.vx v10, v10, a2
	; LMULMAX1-RV32-NEXT: vsub.vv v8, v8, v10			; LMULMAX1-RV32I-NEXT: vsub.vv v8, v8, v10
	; LMULMAX1-RV32-NEXT: addi a3, zero, 51			; LMULMAX1-RV32I-NEXT: addi a3, zero, 51
	; LMULMAX1-RV32-NEXT: vand.vx v10, v8, a3			; LMULMAX1-RV32I-NEXT: vand.vx v10, v8, a3
	; LMULMAX1-RV32-NEXT: vsrl.vi v8, v8, 2			; LMULMAX1-RV32I-NEXT: vsrl.vi v8, v8, 2
	; LMULMAX1-RV32-NEXT: vand.vx v8, v8, a3			; LMULMAX1-RV32I-NEXT: vand.vx v8, v8, a3
	; LMULMAX1-RV32-NEXT: vadd.vv v8, v10, v8			; LMULMAX1-RV32I-NEXT: vadd.vv v8, v10, v8
	; LMULMAX1-RV32-NEXT: vsrl.vi v10, v8, 4			; LMULMAX1-RV32I-NEXT: vsrl.vi v10, v8, 4
	; LMULMAX1-RV32-NEXT: vadd.vv v8, v8, v10			; LMULMAX1-RV32I-NEXT: vadd.vv v8, v8, v10
	; LMULMAX1-RV32-NEXT: vand.vi v8, v8, 15			; LMULMAX1-RV32I-NEXT: vand.vi v8, v8, 15
	; LMULMAX1-RV32-NEXT: vsrl.vi v10, v9, 1			; LMULMAX1-RV32I-NEXT: vsrl.vi v10, v9, 1
	; LMULMAX1-RV32-NEXT: vor.vv v9, v9, v10			; LMULMAX1-RV32I-NEXT: vor.vv v9, v9, v10
	; LMULMAX1-RV32-NEXT: vsrl.vi v10, v9, 2			; LMULMAX1-RV32I-NEXT: vsrl.vi v10, v9, 2
	; LMULMAX1-RV32-NEXT: vor.vv v9, v9, v10			; LMULMAX1-RV32I-NEXT: vor.vv v9, v9, v10
	; LMULMAX1-RV32-NEXT: vsrl.vi v10, v9, 4			; LMULMAX1-RV32I-NEXT: vsrl.vi v10, v9, 4
	; LMULMAX1-RV32-NEXT: vor.vv v9, v9, v10			; LMULMAX1-RV32I-NEXT: vor.vv v9, v9, v10
	; LMULMAX1-RV32-NEXT: vxor.vi v9, v9, -1			; LMULMAX1-RV32I-NEXT: vxor.vi v9, v9, -1
	; LMULMAX1-RV32-NEXT: vsrl.vi v10, v9, 1			; LMULMAX1-RV32I-NEXT: vsrl.vi v10, v9, 1
	; LMULMAX1-RV32-NEXT: vand.vx v10, v10, a2			; LMULMAX1-RV32I-NEXT: vand.vx v10, v10, a2
	; LMULMAX1-RV32-NEXT: vsub.vv v9, v9, v10			; LMULMAX1-RV32I-NEXT: vsub.vv v9, v9, v10
	; LMULMAX1-RV32-NEXT: vand.vx v10, v9, a3			; LMULMAX1-RV32I-NEXT: vand.vx v10, v9, a3
	; LMULMAX1-RV32-NEXT: vsrl.vi v9, v9, 2			; LMULMAX1-RV32I-NEXT: vsrl.vi v9, v9, 2
	; LMULMAX1-RV32-NEXT: vand.vx v9, v9, a3			; LMULMAX1-RV32I-NEXT: vand.vx v9, v9, a3
	; LMULMAX1-RV32-NEXT: vadd.vv v9, v10, v9			; LMULMAX1-RV32I-NEXT: vadd.vv v9, v10, v9
	; LMULMAX1-RV32-NEXT: vsrl.vi v10, v9, 4			; LMULMAX1-RV32I-NEXT: vsrl.vi v10, v9, 4
	; LMULMAX1-RV32-NEXT: vadd.vv v9, v9, v10			; LMULMAX1-RV32I-NEXT: vadd.vv v9, v9, v10
	; LMULMAX1-RV32-NEXT: vand.vi v9, v9, 15			; LMULMAX1-RV32I-NEXT: vand.vi v9, v9, 15
	; LMULMAX1-RV32-NEXT: vse8.v v9, (a0)			; LMULMAX1-RV32I-NEXT: vse8.v v9, (a0)
	; LMULMAX1-RV32-NEXT: vse8.v v8, (a1)			; LMULMAX1-RV32I-NEXT: vse8.v v8, (a1)
	; LMULMAX1-RV32-NEXT: ret			; LMULMAX1-RV32I-NEXT: ret
	;			;
	; LMULMAX1-RV64-LABEL: ctlz_v32i8:			; LMULMAX2-RV32D-LABEL: ctlz_v32i8:
	; LMULMAX1-RV64: # %bb.0:			; LMULMAX2-RV32D: # %bb.0:
	; LMULMAX1-RV64-NEXT: vsetivli zero, 16, e8, m1, ta, mu			; LMULMAX2-RV32D-NEXT: addi a1, zero, 32
	; LMULMAX1-RV64-NEXT: addi a1, a0, 16			; LMULMAX2-RV32D-NEXT: vsetvli zero, a1, e8, m2, ta, mu
	; LMULMAX1-RV64-NEXT: vle8.v v8, (a1)			; LMULMAX2-RV32D-NEXT: vle8.v v8, (a0)
	; LMULMAX1-RV64-NEXT: vle8.v v9, (a0)			; LMULMAX2-RV32D-NEXT: vsetivli zero, 16, e8, m2, ta, mu
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v8, 1			; LMULMAX2-RV32D-NEXT: vslidedown.vi v14, v8, 16
	; LMULMAX1-RV64-NEXT: vor.vv v8, v8, v10			; LMULMAX2-RV32D-NEXT: vsetivli zero, 8, e32, m2, ta, mu
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v8, 2			; LMULMAX2-RV32D-NEXT: vzext.vf4 v10, v14
	; LMULMAX1-RV64-NEXT: vor.vv v8, v8, v10			; LMULMAX2-RV32D-NEXT: vfcvt.f.xu.v v10, v10
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v8, 4			; LMULMAX2-RV32D-NEXT: vsetvli zero, zero, e16, m1, ta, mu
	; LMULMAX1-RV64-NEXT: vor.vv v8, v8, v10			; LMULMAX2-RV32D-NEXT: vnsrl.wi v12, v10, 23
	; LMULMAX1-RV64-NEXT: vxor.vi v8, v8, -1			; LMULMAX2-RV32D-NEXT: vsetvli zero, zero, e8, mf2, ta, mu
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v8, 1			; LMULMAX2-RV32D-NEXT: vnsrl.wi v10, v12, 0
	; LMULMAX1-RV64-NEXT: addi a2, zero, 85			; LMULMAX2-RV32D-NEXT: addi a2, zero, 134
	; LMULMAX1-RV64-NEXT: vand.vx v10, v10, a2			; LMULMAX2-RV32D-NEXT: vrsub.vx v16, v10, a2
	; LMULMAX1-RV64-NEXT: vsub.vv v8, v8, v10			; LMULMAX2-RV32D-NEXT: vsetivli zero, 16, e8, m1, ta, mu
	; LMULMAX1-RV64-NEXT: addi a3, zero, 51			; LMULMAX2-RV32D-NEXT: vmv.v.i v12, 0
	; LMULMAX1-RV64-NEXT: vand.vx v10, v8, a3			; LMULMAX2-RV32D-NEXT: vsetivli zero, 8, e8, m1, tu, mu
	; LMULMAX1-RV64-NEXT: vsrl.vi v8, v8, 2			; LMULMAX2-RV32D-NEXT: vmv1r.v v10, v12
	; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a3			; LMULMAX2-RV32D-NEXT: vslideup.vi v10, v16, 0
	; LMULMAX1-RV64-NEXT: vadd.vv v8, v10, v8			; LMULMAX2-RV32D-NEXT: vsetvli zero, zero, e8, m1, ta, mu
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v8, 4			; LMULMAX2-RV32D-NEXT: vslidedown.vi v14, v14, 8
	; LMULMAX1-RV64-NEXT: vadd.vv v8, v8, v10			; LMULMAX2-RV32D-NEXT: vsetivli zero, 8, e32, m2, ta, mu
	; LMULMAX1-RV64-NEXT: vand.vi v8, v8, 15			; LMULMAX2-RV32D-NEXT: vzext.vf4 v16, v14
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v9, 1			; LMULMAX2-RV32D-NEXT: vfcvt.f.xu.v v14, v16
	; LMULMAX1-RV64-NEXT: vor.vv v9, v9, v10			; LMULMAX2-RV32D-NEXT: vsetvli zero, zero, e16, m1, ta, mu
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v9, 2			; LMULMAX2-RV32D-NEXT: vnsrl.wi v16, v14, 23
	; LMULMAX1-RV64-NEXT: vor.vv v9, v9, v10			; LMULMAX2-RV32D-NEXT: vsetvli zero, zero, e8, mf2, ta, mu
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v9, 4			; LMULMAX2-RV32D-NEXT: vnsrl.wi v14, v16, 0
	; LMULMAX1-RV64-NEXT: vor.vv v9, v9, v10			; LMULMAX2-RV32D-NEXT: vrsub.vx v14, v14, a2
	; LMULMAX1-RV64-NEXT: vxor.vi v9, v9, -1			; LMULMAX2-RV32D-NEXT: vsetivli zero, 16, e8, m1, tu, mu
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v9, 1			; LMULMAX2-RV32D-NEXT: vslideup.vi v10, v14, 8
	; LMULMAX1-RV64-NEXT: vand.vx v10, v10, a2			; LMULMAX2-RV32D-NEXT: vsetivli zero, 8, e32, m2, ta, mu
	; LMULMAX1-RV64-NEXT: vsub.vv v9, v9, v10			; LMULMAX2-RV32D-NEXT: vzext.vf4 v14, v8
	; LMULMAX1-RV64-NEXT: vand.vx v10, v9, a3			; LMULMAX2-RV32D-NEXT: vfcvt.f.xu.v v14, v14
	; LMULMAX1-RV64-NEXT: vsrl.vi v9, v9, 2			; LMULMAX2-RV32D-NEXT: vsetvli zero, zero, e16, m1, ta, mu
	; LMULMAX1-RV64-NEXT: vand.vx v9, v9, a3			; LMULMAX2-RV32D-NEXT: vnsrl.wi v16, v14, 23
	; LMULMAX1-RV64-NEXT: vadd.vv v9, v10, v9			; LMULMAX2-RV32D-NEXT: vsetvli zero, zero, e8, mf2, ta, mu
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v9, 4			; LMULMAX2-RV32D-NEXT: vnsrl.wi v14, v16, 0
	; LMULMAX1-RV64-NEXT: vadd.vv v9, v9, v10			; LMULMAX2-RV32D-NEXT: vrsub.vx v14, v14, a2
	; LMULMAX1-RV64-NEXT: vand.vi v9, v9, 15			; LMULMAX2-RV32D-NEXT: vsetivli zero, 8, e8, m1, tu, mu
	; LMULMAX1-RV64-NEXT: vse8.v v9, (a0)			; LMULMAX2-RV32D-NEXT: vslideup.vi v12, v14, 0
	; LMULMAX1-RV64-NEXT: vse8.v v8, (a1)			; LMULMAX2-RV32D-NEXT: vsetvli zero, zero, e8, m1, ta, mu
	; LMULMAX1-RV64-NEXT: ret			; LMULMAX2-RV32D-NEXT: vslidedown.vi v14, v8, 8
				; LMULMAX2-RV32D-NEXT: vsetivli zero, 8, e32, m2, ta, mu
				; LMULMAX2-RV32D-NEXT: vzext.vf4 v16, v14
				; LMULMAX2-RV32D-NEXT: vfcvt.f.xu.v v14, v16
				; LMULMAX2-RV32D-NEXT: vsetvli zero, zero, e16, m1, ta, mu
				; LMULMAX2-RV32D-NEXT: vnsrl.wi v16, v14, 23
				; LMULMAX2-RV32D-NEXT: vsetvli zero, zero, e8, mf2, ta, mu
				; LMULMAX2-RV32D-NEXT: vnsrl.wi v14, v16, 0
				; LMULMAX2-RV32D-NEXT: vrsub.vx v14, v14, a2
				; LMULMAX2-RV32D-NEXT: vsetivli zero, 16, e8, m1, tu, mu
				; LMULMAX2-RV32D-NEXT: vslideup.vi v12, v14, 8
				; LMULMAX2-RV32D-NEXT: vsetvli zero, a1, e8, m2, ta, mu
				; LMULMAX2-RV32D-NEXT: vmv.v.i v14, 0
				; LMULMAX2-RV32D-NEXT: vsetivli zero, 16, e8, m2, tu, mu
				; LMULMAX2-RV32D-NEXT: vslideup.vi v14, v12, 0
				; LMULMAX2-RV32D-NEXT: vsetvli zero, a1, e8, m2, tu, mu
				; LMULMAX2-RV32D-NEXT: vslideup.vi v14, v10, 16
				; LMULMAX2-RV32D-NEXT: vsetvli zero, zero, e8, m2, ta, mu
				; LMULMAX2-RV32D-NEXT: vmseq.vi v0, v8, 0
				; LMULMAX2-RV32D-NEXT: vmerge.vim v8, v14, 8, v0
				; LMULMAX2-RV32D-NEXT: vse8.v v8, (a0)
				; LMULMAX2-RV32D-NEXT: ret
				;
				; LMULMAX2-RV64D-LABEL: ctlz_v32i8:
				; LMULMAX2-RV64D: # %bb.0:
				; LMULMAX2-RV64D-NEXT: addi a1, zero, 32
				; LMULMAX2-RV64D-NEXT: vsetvli zero, a1, e8, m2, ta, mu
				; LMULMAX2-RV64D-NEXT: vle8.v v8, (a0)
				; LMULMAX2-RV64D-NEXT: vsetivli zero, 16, e8, m2, ta, mu
				; LMULMAX2-RV64D-NEXT: vslidedown.vi v14, v8, 16
				; LMULMAX2-RV64D-NEXT: vsetivli zero, 8, e32, m2, ta, mu
				; LMULMAX2-RV64D-NEXT: vzext.vf4 v10, v14
				; LMULMAX2-RV64D-NEXT: vfcvt.f.xu.v v10, v10
				; LMULMAX2-RV64D-NEXT: vsetvli zero, zero, e16, m1, ta, mu
				; LMULMAX2-RV64D-NEXT: vnsrl.wi v12, v10, 23
				; LMULMAX2-RV64D-NEXT: vsetvli zero, zero, e8, mf2, ta, mu
				; LMULMAX2-RV64D-NEXT: vnsrl.wi v10, v12, 0
				; LMULMAX2-RV64D-NEXT: addi a2, zero, 134
				; LMULMAX2-RV64D-NEXT: vrsub.vx v16, v10, a2
				; LMULMAX2-RV64D-NEXT: vsetivli zero, 16, e8, m1, ta, mu
				; LMULMAX2-RV64D-NEXT: vmv.v.i v12, 0
				; LMULMAX2-RV64D-NEXT: vsetivli zero, 8, e8, m1, tu, mu
				; LMULMAX2-RV64D-NEXT: vmv1r.v v10, v12
				; LMULMAX2-RV64D-NEXT: vslideup.vi v10, v16, 0
				; LMULMAX2-RV64D-NEXT: vsetvli zero, zero, e8, m1, ta, mu
				; LMULMAX2-RV64D-NEXT: vslidedown.vi v14, v14, 8
				; LMULMAX2-RV64D-NEXT: vsetivli zero, 8, e32, m2, ta, mu
				; LMULMAX2-RV64D-NEXT: vzext.vf4 v16, v14
				; LMULMAX2-RV64D-NEXT: vfcvt.f.xu.v v14, v16
				; LMULMAX2-RV64D-NEXT: vsetvli zero, zero, e16, m1, ta, mu
				; LMULMAX2-RV64D-NEXT: vnsrl.wi v16, v14, 23
				; LMULMAX2-RV64D-NEXT: vsetvli zero, zero, e8, mf2, ta, mu
				; LMULMAX2-RV64D-NEXT: vnsrl.wi v14, v16, 0
				; LMULMAX2-RV64D-NEXT: vrsub.vx v14, v14, a2
				; LMULMAX2-RV64D-NEXT: vsetivli zero, 16, e8, m1, tu, mu
				; LMULMAX2-RV64D-NEXT: vslideup.vi v10, v14, 8
				; LMULMAX2-RV64D-NEXT: vsetivli zero, 8, e32, m2, ta, mu
				; LMULMAX2-RV64D-NEXT: vzext.vf4 v14, v8
				; LMULMAX2-RV64D-NEXT: vfcvt.f.xu.v v14, v14
				; LMULMAX2-RV64D-NEXT: vsetvli zero, zero, e16, m1, ta, mu
				; LMULMAX2-RV64D-NEXT: vnsrl.wi v16, v14, 23
				; LMULMAX2-RV64D-NEXT: vsetvli zero, zero, e8, mf2, ta, mu
				; LMULMAX2-RV64D-NEXT: vnsrl.wi v14, v16, 0
				; LMULMAX2-RV64D-NEXT: vrsub.vx v14, v14, a2
				; LMULMAX2-RV64D-NEXT: vsetivli zero, 8, e8, m1, tu, mu
				; LMULMAX2-RV64D-NEXT: vslideup.vi v12, v14, 0
				; LMULMAX2-RV64D-NEXT: vsetvli zero, zero, e8, m1, ta, mu
				; LMULMAX2-RV64D-NEXT: vslidedown.vi v14, v8, 8
				; LMULMAX2-RV64D-NEXT: vsetivli zero, 8, e32, m2, ta, mu
				; LMULMAX2-RV64D-NEXT: vzext.vf4 v16, v14
				; LMULMAX2-RV64D-NEXT: vfcvt.f.xu.v v14, v16
				; LMULMAX2-RV64D-NEXT: vsetvli zero, zero, e16, m1, ta, mu
				; LMULMAX2-RV64D-NEXT: vnsrl.wi v16, v14, 23
				; LMULMAX2-RV64D-NEXT: vsetvli zero, zero, e8, mf2, ta, mu
				; LMULMAX2-RV64D-NEXT: vnsrl.wi v14, v16, 0
				; LMULMAX2-RV64D-NEXT: vrsub.vx v14, v14, a2
				; LMULMAX2-RV64D-NEXT: vsetivli zero, 16, e8, m1, tu, mu
				; LMULMAX2-RV64D-NEXT: vslideup.vi v12, v14, 8
				; LMULMAX2-RV64D-NEXT: vsetvli zero, a1, e8, m2, ta, mu
				; LMULMAX2-RV64D-NEXT: vmv.v.i v14, 0
				; LMULMAX2-RV64D-NEXT: vsetivli zero, 16, e8, m2, tu, mu
				; LMULMAX2-RV64D-NEXT: vslideup.vi v14, v12, 0
				; LMULMAX2-RV64D-NEXT: vsetvli zero, a1, e8, m2, tu, mu
				; LMULMAX2-RV64D-NEXT: vslideup.vi v14, v10, 16
				; LMULMAX2-RV64D-NEXT: vsetvli zero, zero, e8, m2, ta, mu
				; LMULMAX2-RV64D-NEXT: vmseq.vi v0, v8, 0
				; LMULMAX2-RV64D-NEXT: vmerge.vim v8, v14, 8, v0
				; LMULMAX2-RV64D-NEXT: vse8.v v8, (a0)
				; LMULMAX2-RV64D-NEXT: ret
				;
				; LMULMAX1-RV32D-LABEL: ctlz_v32i8:
				; LMULMAX1-RV32D: # %bb.0:
				; LMULMAX1-RV32D-NEXT: vsetivli zero, 16, e8, m1, ta, mu
				; LMULMAX1-RV32D-NEXT: addi a1, a0, 16
				; LMULMAX1-RV32D-NEXT: vle8.v v11, (a1)
				; LMULMAX1-RV32D-NEXT: vle8.v v8, (a0)
				; LMULMAX1-RV32D-NEXT: vsetivli zero, 4, e32, m1, ta, mu
				; LMULMAX1-RV32D-NEXT: vzext.vf4 v9, v11
				; LMULMAX1-RV32D-NEXT: vfcvt.f.xu.v v9, v9
				; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e16, mf2, ta, mu
				; LMULMAX1-RV32D-NEXT: vnsrl.wi v9, v9, 23
				; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
				; LMULMAX1-RV32D-NEXT: vnsrl.wi v9, v9, 0
				; LMULMAX1-RV32D-NEXT: addi a2, zero, 134
				; LMULMAX1-RV32D-NEXT: vrsub.vx v10, v9, a2
				; LMULMAX1-RV32D-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
				; LMULMAX1-RV32D-NEXT: vmv.v.i v9, 0
				; LMULMAX1-RV32D-NEXT: vsetivli zero, 4, e8, mf2, tu, mu
				; LMULMAX1-RV32D-NEXT: vmv1r.v v12, v9
				; LMULMAX1-RV32D-NEXT: vslideup.vi v12, v10, 0
				; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e8, mf2, ta, mu
				; LMULMAX1-RV32D-NEXT: vslidedown.vi v10, v11, 4
				; LMULMAX1-RV32D-NEXT: vsetivli zero, 4, e32, m1, ta, mu
				; LMULMAX1-RV32D-NEXT: vzext.vf4 v13, v10
				; LMULMAX1-RV32D-NEXT: vfcvt.f.xu.v v10, v13
				; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e16, mf2, ta, mu
				; LMULMAX1-RV32D-NEXT: vnsrl.wi v10, v10, 23
				; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
				; LMULMAX1-RV32D-NEXT: vnsrl.wi v10, v10, 0
				; LMULMAX1-RV32D-NEXT: vrsub.vx v10, v10, a2
				; LMULMAX1-RV32D-NEXT: vsetivli zero, 8, e8, mf2, tu, mu
				; LMULMAX1-RV32D-NEXT: vslideup.vi v12, v10, 4
				; LMULMAX1-RV32D-NEXT: vsetivli zero, 16, e8, m1, ta, mu
				; LMULMAX1-RV32D-NEXT: vmv.v.i v10, 0
				; LMULMAX1-RV32D-NEXT: vsetivli zero, 8, e8, m1, tu, mu
				; LMULMAX1-RV32D-NEXT: vmv1r.v v13, v10
				; LMULMAX1-RV32D-NEXT: vslideup.vi v13, v12, 0
				; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e8, m1, ta, mu
				; LMULMAX1-RV32D-NEXT: vslidedown.vi v12, v11, 8
				; LMULMAX1-RV32D-NEXT: vsetivli zero, 4, e32, m1, ta, mu
				; LMULMAX1-RV32D-NEXT: vzext.vf4 v14, v12
				; LMULMAX1-RV32D-NEXT: vfcvt.f.xu.v v14, v14
				; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e16, mf2, ta, mu
				; LMULMAX1-RV32D-NEXT: vnsrl.wi v14, v14, 23
				; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
				; LMULMAX1-RV32D-NEXT: vnsrl.wi v14, v14, 0
				; LMULMAX1-RV32D-NEXT: vrsub.vx v14, v14, a2
				; LMULMAX1-RV32D-NEXT: vsetivli zero, 4, e8, mf2, tu, mu
				; LMULMAX1-RV32D-NEXT: vmv1r.v v15, v9
				; LMULMAX1-RV32D-NEXT: vslideup.vi v15, v14, 0
				; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e8, mf2, ta, mu
				; LMULMAX1-RV32D-NEXT: vslidedown.vi v12, v12, 4
				; LMULMAX1-RV32D-NEXT: vsetivli zero, 4, e32, m1, ta, mu
				; LMULMAX1-RV32D-NEXT: vzext.vf4 v14, v12
				; LMULMAX1-RV32D-NEXT: vfcvt.f.xu.v v12, v14
				; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e16, mf2, ta, mu
				; LMULMAX1-RV32D-NEXT: vnsrl.wi v12, v12, 23
				; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
				; LMULMAX1-RV32D-NEXT: vnsrl.wi v12, v12, 0
				; LMULMAX1-RV32D-NEXT: vrsub.vx v12, v12, a2
				; LMULMAX1-RV32D-NEXT: vsetivli zero, 8, e8, mf2, tu, mu
				; LMULMAX1-RV32D-NEXT: vslideup.vi v15, v12, 4
				; LMULMAX1-RV32D-NEXT: vsetivli zero, 16, e8, m1, tu, mu
				; LMULMAX1-RV32D-NEXT: vslideup.vi v13, v15, 8
				; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e8, m1, ta, mu
				; LMULMAX1-RV32D-NEXT: vmseq.vi v0, v11, 0
				; LMULMAX1-RV32D-NEXT: vmerge.vim v11, v13, 8, v0
				; LMULMAX1-RV32D-NEXT: vsetivli zero, 4, e32, m1, ta, mu
				; LMULMAX1-RV32D-NEXT: vzext.vf4 v12, v8
				; LMULMAX1-RV32D-NEXT: vfcvt.f.xu.v v12, v12
				; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e16, mf2, ta, mu
				; LMULMAX1-RV32D-NEXT: vnsrl.wi v12, v12, 23
				; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
				; LMULMAX1-RV32D-NEXT: vnsrl.wi v12, v12, 0
				; LMULMAX1-RV32D-NEXT: vrsub.vx v12, v12, a2
				; LMULMAX1-RV32D-NEXT: vsetivli zero, 4, e8, mf2, tu, mu
				; LMULMAX1-RV32D-NEXT: vmv1r.v v13, v9
				; LMULMAX1-RV32D-NEXT: vslideup.vi v13, v12, 0
				; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e8, mf2, ta, mu
				; LMULMAX1-RV32D-NEXT: vslidedown.vi v12, v8, 4
				; LMULMAX1-RV32D-NEXT: vsetivli zero, 4, e32, m1, ta, mu
				; LMULMAX1-RV32D-NEXT: vzext.vf4 v14, v12
				; LMULMAX1-RV32D-NEXT: vfcvt.f.xu.v v12, v14
				; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e16, mf2, ta, mu
				; LMULMAX1-RV32D-NEXT: vnsrl.wi v12, v12, 23
				; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
				; LMULMAX1-RV32D-NEXT: vnsrl.wi v12, v12, 0
				; LMULMAX1-RV32D-NEXT: vrsub.vx v12, v12, a2
				; LMULMAX1-RV32D-NEXT: vsetivli zero, 8, e8, mf2, tu, mu
				; LMULMAX1-RV32D-NEXT: vslideup.vi v13, v12, 4
				; LMULMAX1-RV32D-NEXT: vsetivli zero, 8, e8, m1, tu, mu
				; LMULMAX1-RV32D-NEXT: vslideup.vi v10, v13, 0
				; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e8, m1, ta, mu
				; LMULMAX1-RV32D-NEXT: vslidedown.vi v12, v8, 8
				; LMULMAX1-RV32D-NEXT: vsetivli zero, 4, e32, m1, ta, mu
				; LMULMAX1-RV32D-NEXT: vzext.vf4 v13, v12
				; LMULMAX1-RV32D-NEXT: vfcvt.f.xu.v v13, v13
				; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e16, mf2, ta, mu
				; LMULMAX1-RV32D-NEXT: vnsrl.wi v13, v13, 23
				; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
				; LMULMAX1-RV32D-NEXT: vnsrl.wi v13, v13, 0
				; LMULMAX1-RV32D-NEXT: vrsub.vx v13, v13, a2
				; LMULMAX1-RV32D-NEXT: vsetivli zero, 4, e8, mf2, tu, mu
				; LMULMAX1-RV32D-NEXT: vslideup.vi v9, v13, 0
				; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e8, mf2, ta, mu
				; LMULMAX1-RV32D-NEXT: vslidedown.vi v12, v12, 4
				; LMULMAX1-RV32D-NEXT: vsetivli zero, 4, e32, m1, ta, mu
				; LMULMAX1-RV32D-NEXT: vzext.vf4 v13, v12
				; LMULMAX1-RV32D-NEXT: vfcvt.f.xu.v v12, v13
				; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e16, mf2, ta, mu
				; LMULMAX1-RV32D-NEXT: vnsrl.wi v12, v12, 23
				; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
				; LMULMAX1-RV32D-NEXT: vnsrl.wi v12, v12, 0
				; LMULMAX1-RV32D-NEXT: vrsub.vx v12, v12, a2
				; LMULMAX1-RV32D-NEXT: vsetivli zero, 8, e8, mf2, tu, mu
				; LMULMAX1-RV32D-NEXT: vslideup.vi v9, v12, 4
				; LMULMAX1-RV32D-NEXT: vsetivli zero, 16, e8, m1, tu, mu
				; LMULMAX1-RV32D-NEXT: vslideup.vi v10, v9, 8
				; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e8, m1, ta, mu
				; LMULMAX1-RV32D-NEXT: vmseq.vi v0, v8, 0
				; LMULMAX1-RV32D-NEXT: vmerge.vim v8, v10, 8, v0
				; LMULMAX1-RV32D-NEXT: vse8.v v8, (a0)
				; LMULMAX1-RV32D-NEXT: vse8.v v11, (a1)
				; LMULMAX1-RV32D-NEXT: ret
				;
				; LMULMAX1-RV64D-LABEL: ctlz_v32i8:
				; LMULMAX1-RV64D: # %bb.0:
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 16, e8, m1, ta, mu
				; LMULMAX1-RV64D-NEXT: addi a1, a0, 16
				; LMULMAX1-RV64D-NEXT: vle8.v v11, (a1)
				; LMULMAX1-RV64D-NEXT: vle8.v v8, (a0)
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 4, e32, m1, ta, mu
				; LMULMAX1-RV64D-NEXT: vzext.vf4 v9, v11
				; LMULMAX1-RV64D-NEXT: vfcvt.f.xu.v v9, v9
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e16, mf2, ta, mu
				; LMULMAX1-RV64D-NEXT: vnsrl.wi v9, v9, 23
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
				; LMULMAX1-RV64D-NEXT: vnsrl.wi v9, v9, 0
				; LMULMAX1-RV64D-NEXT: addi a2, zero, 134
				; LMULMAX1-RV64D-NEXT: vrsub.vx v10, v9, a2
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
				; LMULMAX1-RV64D-NEXT: vmv.v.i v9, 0
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 4, e8, mf2, tu, mu
				; LMULMAX1-RV64D-NEXT: vmv1r.v v12, v9
				; LMULMAX1-RV64D-NEXT: vslideup.vi v12, v10, 0
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e8, mf2, ta, mu
				; LMULMAX1-RV64D-NEXT: vslidedown.vi v10, v11, 4
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 4, e32, m1, ta, mu
				; LMULMAX1-RV64D-NEXT: vzext.vf4 v13, v10
				; LMULMAX1-RV64D-NEXT: vfcvt.f.xu.v v10, v13
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e16, mf2, ta, mu
				; LMULMAX1-RV64D-NEXT: vnsrl.wi v10, v10, 23
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
				; LMULMAX1-RV64D-NEXT: vnsrl.wi v10, v10, 0
				; LMULMAX1-RV64D-NEXT: vrsub.vx v10, v10, a2
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 8, e8, mf2, tu, mu
				; LMULMAX1-RV64D-NEXT: vslideup.vi v12, v10, 4
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 16, e8, m1, ta, mu
				; LMULMAX1-RV64D-NEXT: vmv.v.i v10, 0
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 8, e8, m1, tu, mu
				; LMULMAX1-RV64D-NEXT: vmv1r.v v13, v10
				; LMULMAX1-RV64D-NEXT: vslideup.vi v13, v12, 0
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e8, m1, ta, mu
				; LMULMAX1-RV64D-NEXT: vslidedown.vi v12, v11, 8
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 4, e32, m1, ta, mu
				; LMULMAX1-RV64D-NEXT: vzext.vf4 v14, v12
				; LMULMAX1-RV64D-NEXT: vfcvt.f.xu.v v14, v14
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e16, mf2, ta, mu
				; LMULMAX1-RV64D-NEXT: vnsrl.wi v14, v14, 23
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
				; LMULMAX1-RV64D-NEXT: vnsrl.wi v14, v14, 0
				; LMULMAX1-RV64D-NEXT: vrsub.vx v14, v14, a2
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 4, e8, mf2, tu, mu
				; LMULMAX1-RV64D-NEXT: vmv1r.v v15, v9
				; LMULMAX1-RV64D-NEXT: vslideup.vi v15, v14, 0
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e8, mf2, ta, mu
				; LMULMAX1-RV64D-NEXT: vslidedown.vi v12, v12, 4
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 4, e32, m1, ta, mu
				; LMULMAX1-RV64D-NEXT: vzext.vf4 v14, v12
				; LMULMAX1-RV64D-NEXT: vfcvt.f.xu.v v12, v14
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e16, mf2, ta, mu
				; LMULMAX1-RV64D-NEXT: vnsrl.wi v12, v12, 23
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
				; LMULMAX1-RV64D-NEXT: vnsrl.wi v12, v12, 0
				; LMULMAX1-RV64D-NEXT: vrsub.vx v12, v12, a2
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 8, e8, mf2, tu, mu
				; LMULMAX1-RV64D-NEXT: vslideup.vi v15, v12, 4
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 16, e8, m1, tu, mu
				; LMULMAX1-RV64D-NEXT: vslideup.vi v13, v15, 8
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e8, m1, ta, mu
				; LMULMAX1-RV64D-NEXT: vmseq.vi v0, v11, 0
				; LMULMAX1-RV64D-NEXT: vmerge.vim v11, v13, 8, v0
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 4, e32, m1, ta, mu
				; LMULMAX1-RV64D-NEXT: vzext.vf4 v12, v8
				; LMULMAX1-RV64D-NEXT: vfcvt.f.xu.v v12, v12
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e16, mf2, ta, mu
				; LMULMAX1-RV64D-NEXT: vnsrl.wi v12, v12, 23
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
				; LMULMAX1-RV64D-NEXT: vnsrl.wi v12, v12, 0
				; LMULMAX1-RV64D-NEXT: vrsub.vx v12, v12, a2
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 4, e8, mf2, tu, mu
				; LMULMAX1-RV64D-NEXT: vmv1r.v v13, v9
				; LMULMAX1-RV64D-NEXT: vslideup.vi v13, v12, 0
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e8, mf2, ta, mu
				; LMULMAX1-RV64D-NEXT: vslidedown.vi v12, v8, 4
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 4, e32, m1, ta, mu
				; LMULMAX1-RV64D-NEXT: vzext.vf4 v14, v12
				; LMULMAX1-RV64D-NEXT: vfcvt.f.xu.v v12, v14
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e16, mf2, ta, mu
				; LMULMAX1-RV64D-NEXT: vnsrl.wi v12, v12, 23
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
				; LMULMAX1-RV64D-NEXT: vnsrl.wi v12, v12, 0
				; LMULMAX1-RV64D-NEXT: vrsub.vx v12, v12, a2
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 8, e8, mf2, tu, mu
				; LMULMAX1-RV64D-NEXT: vslideup.vi v13, v12, 4
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 8, e8, m1, tu, mu
				; LMULMAX1-RV64D-NEXT: vslideup.vi v10, v13, 0
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e8, m1, ta, mu
				; LMULMAX1-RV64D-NEXT: vslidedown.vi v12, v8, 8
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 4, e32, m1, ta, mu
				; LMULMAX1-RV64D-NEXT: vzext.vf4 v13, v12
				; LMULMAX1-RV64D-NEXT: vfcvt.f.xu.v v13, v13
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e16, mf2, ta, mu
				; LMULMAX1-RV64D-NEXT: vnsrl.wi v13, v13, 23
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
				; LMULMAX1-RV64D-NEXT: vnsrl.wi v13, v13, 0
				; LMULMAX1-RV64D-NEXT: vrsub.vx v13, v13, a2
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 4, e8, mf2, tu, mu
				; LMULMAX1-RV64D-NEXT: vslideup.vi v9, v13, 0
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e8, mf2, ta, mu
				; LMULMAX1-RV64D-NEXT: vslidedown.vi v12, v12, 4
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 4, e32, m1, ta, mu
				; LMULMAX1-RV64D-NEXT: vzext.vf4 v13, v12
				; LMULMAX1-RV64D-NEXT: vfcvt.f.xu.v v12, v13
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e16, mf2, ta, mu
				; LMULMAX1-RV64D-NEXT: vnsrl.wi v12, v12, 23
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
				; LMULMAX1-RV64D-NEXT: vnsrl.wi v12, v12, 0
				; LMULMAX1-RV64D-NEXT: vrsub.vx v12, v12, a2
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 8, e8, mf2, tu, mu
				; LMULMAX1-RV64D-NEXT: vslideup.vi v9, v12, 4
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 16, e8, m1, tu, mu
				; LMULMAX1-RV64D-NEXT: vslideup.vi v10, v9, 8
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e8, m1, ta, mu
				; LMULMAX1-RV64D-NEXT: vmseq.vi v0, v8, 0
				; LMULMAX1-RV64D-NEXT: vmerge.vim v8, v10, 8, v0
				; LMULMAX1-RV64D-NEXT: vse8.v v8, (a0)
				; LMULMAX1-RV64D-NEXT: vse8.v v11, (a1)
				; LMULMAX1-RV64D-NEXT: ret
				;
				; LMULMAX8-RV32-LABEL: ctlz_v32i8:
				; LMULMAX8-RV32: # %bb.0:
				; LMULMAX8-RV32-NEXT: addi a1, zero, 32
				; LMULMAX8-RV32-NEXT: vsetvli zero, a1, e8, m2, ta, mu
				; LMULMAX8-RV32-NEXT: vle8.v v8, (a0)
				; LMULMAX8-RV32-NEXT: vsetvli zero, zero, e32, m8, ta, mu
				; LMULMAX8-RV32-NEXT: vzext.vf4 v16, v8
				; LMULMAX8-RV32-NEXT: vfcvt.f.xu.v v16, v16
				; LMULMAX8-RV32-NEXT: vsetvli zero, zero, e16, m4, ta, mu
				; LMULMAX8-RV32-NEXT: vnsrl.wi v12, v16, 23
				; LMULMAX8-RV32-NEXT: vsetvli zero, zero, e8, m2, ta, mu
				; LMULMAX8-RV32-NEXT: vnsrl.wi v10, v12, 0
				; LMULMAX8-RV32-NEXT: addi a1, zero, 134
				; LMULMAX8-RV32-NEXT: vmseq.vi v0, v8, 0
				; LMULMAX8-RV32-NEXT: vrsub.vx v8, v10, a1
				; LMULMAX8-RV32-NEXT: vmerge.vim v8, v8, 8, v0
				; LMULMAX8-RV32-NEXT: vse8.v v8, (a0)
				; LMULMAX8-RV32-NEXT: ret
				;
				; LMULMAX8-RV64-LABEL: ctlz_v32i8:
				; LMULMAX8-RV64: # %bb.0:
				; LMULMAX8-RV64-NEXT: addi a1, zero, 32
				; LMULMAX8-RV64-NEXT: vsetvli zero, a1, e8, m2, ta, mu
				; LMULMAX8-RV64-NEXT: vle8.v v8, (a0)
				; LMULMAX8-RV64-NEXT: vsetvli zero, zero, e32, m8, ta, mu
				; LMULMAX8-RV64-NEXT: vzext.vf4 v16, v8
				; LMULMAX8-RV64-NEXT: vfcvt.f.xu.v v16, v16
				; LMULMAX8-RV64-NEXT: vsetvli zero, zero, e16, m4, ta, mu
				; LMULMAX8-RV64-NEXT: vnsrl.wi v12, v16, 23
				; LMULMAX8-RV64-NEXT: vsetvli zero, zero, e8, m2, ta, mu
				; LMULMAX8-RV64-NEXT: vnsrl.wi v10, v12, 0
				; LMULMAX8-RV64-NEXT: addi a1, zero, 134
				; LMULMAX8-RV64-NEXT: vmseq.vi v0, v8, 0
				; LMULMAX8-RV64-NEXT: vrsub.vx v8, v10, a1
				; LMULMAX8-RV64-NEXT: vmerge.vim v8, v8, 8, v0
				; LMULMAX8-RV64-NEXT: vse8.v v8, (a0)
				; LMULMAX8-RV64-NEXT: ret
	%a = load <32 x i8>, <32 x i8>* %x			%a = load <32 x i8>, <32 x i8>* %x
	%b = load <32 x i8>, <32 x i8>* %y			%b = load <32 x i8>, <32 x i8>* %y
	%c = call <32 x i8> @llvm.ctlz.v32i8(<32 x i8> %a, i1 false)			%c = call <32 x i8> @llvm.ctlz.v32i8(<32 x i8> %a, i1 false)
	store <32 x i8> %c, <32 x i8>* %x			store <32 x i8> %c, <32 x i8>* %x
	ret void			ret void
	}			}
	declare <32 x i8> @llvm.ctlz.v32i8(<32 x i8>, i1)			declare <32 x i8> @llvm.ctlz.v32i8(<32 x i8>, i1)

	define void @ctlz_v16i16(<16 x i16>* %x, <16 x i16>* %y) nounwind {			define void @ctlz_v16i16(<16 x i16>* %x, <16 x i16>* %y) nounwind {
	; LMULMAX2-RV32-LABEL: ctlz_v16i16:			; LMULMAX2-RV32I-LABEL: ctlz_v16i16:
	; LMULMAX2-RV32: # %bb.0:			; LMULMAX2-RV32I: # %bb.0:
	; LMULMAX2-RV32-NEXT: vsetivli zero, 16, e16, m2, ta, mu			; LMULMAX2-RV32I-NEXT: vsetivli zero, 16, e16, m2, ta, mu
	; LMULMAX2-RV32-NEXT: vle16.v v8, (a0)			; LMULMAX2-RV32I-NEXT: vle16.v v8, (a0)
	; LMULMAX2-RV32-NEXT: vsrl.vi v10, v8, 1			; LMULMAX2-RV32I-NEXT: vsrl.vi v10, v8, 1
	; LMULMAX2-RV32-NEXT: vor.vv v8, v8, v10			; LMULMAX2-RV32I-NEXT: vor.vv v8, v8, v10
	; LMULMAX2-RV32-NEXT: vsrl.vi v10, v8, 2			; LMULMAX2-RV32I-NEXT: vsrl.vi v10, v8, 2
	; LMULMAX2-RV32-NEXT: vor.vv v8, v8, v10			; LMULMAX2-RV32I-NEXT: vor.vv v8, v8, v10
	; LMULMAX2-RV32-NEXT: vsrl.vi v10, v8, 4			; LMULMAX2-RV32I-NEXT: vsrl.vi v10, v8, 4
	; LMULMAX2-RV32-NEXT: vor.vv v8, v8, v10			; LMULMAX2-RV32I-NEXT: vor.vv v8, v8, v10
	; LMULMAX2-RV32-NEXT: vsrl.vi v10, v8, 8			; LMULMAX2-RV32I-NEXT: vsrl.vi v10, v8, 8
	; LMULMAX2-RV32-NEXT: vor.vv v8, v8, v10			; LMULMAX2-RV32I-NEXT: vor.vv v8, v8, v10
	; LMULMAX2-RV32-NEXT: vxor.vi v8, v8, -1			; LMULMAX2-RV32I-NEXT: vxor.vi v8, v8, -1
	; LMULMAX2-RV32-NEXT: vsrl.vi v10, v8, 1			; LMULMAX2-RV32I-NEXT: vsrl.vi v10, v8, 1
	; LMULMAX2-RV32-NEXT: lui a1, 5			; LMULMAX2-RV32I-NEXT: lui a1, 5
	; LMULMAX2-RV32-NEXT: addi a1, a1, 1365			; LMULMAX2-RV32I-NEXT: addi a1, a1, 1365
	; LMULMAX2-RV32-NEXT: vand.vx v10, v10, a1			; LMULMAX2-RV32I-NEXT: vand.vx v10, v10, a1
	; LMULMAX2-RV32-NEXT: vsub.vv v8, v8, v10			; LMULMAX2-RV32I-NEXT: vsub.vv v8, v8, v10
	; LMULMAX2-RV32-NEXT: lui a1, 3			; LMULMAX2-RV32I-NEXT: lui a1, 3
	; LMULMAX2-RV32-NEXT: addi a1, a1, 819			; LMULMAX2-RV32I-NEXT: addi a1, a1, 819
	; LMULMAX2-RV32-NEXT: vand.vx v10, v8, a1			; LMULMAX2-RV32I-NEXT: vand.vx v10, v8, a1
	; LMULMAX2-RV32-NEXT: vsrl.vi v8, v8, 2			; LMULMAX2-RV32I-NEXT: vsrl.vi v8, v8, 2
	; LMULMAX2-RV32-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV32I-NEXT: vand.vx v8, v8, a1
	; LMULMAX2-RV32-NEXT: vadd.vv v8, v10, v8			; LMULMAX2-RV32I-NEXT: vadd.vv v8, v10, v8
	; LMULMAX2-RV32-NEXT: vsrl.vi v10, v8, 4			; LMULMAX2-RV32I-NEXT: vsrl.vi v10, v8, 4
	; LMULMAX2-RV32-NEXT: vadd.vv v8, v8, v10			; LMULMAX2-RV32I-NEXT: vadd.vv v8, v8, v10
	; LMULMAX2-RV32-NEXT: lui a1, 1			; LMULMAX2-RV32I-NEXT: lui a1, 1
	; LMULMAX2-RV32-NEXT: addi a1, a1, -241			; LMULMAX2-RV32I-NEXT: addi a1, a1, -241
	; LMULMAX2-RV32-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV32I-NEXT: vand.vx v8, v8, a1
	; LMULMAX2-RV32-NEXT: addi a1, zero, 257			; LMULMAX2-RV32I-NEXT: addi a1, zero, 257
	; LMULMAX2-RV32-NEXT: vmul.vx v8, v8, a1			; LMULMAX2-RV32I-NEXT: vmul.vx v8, v8, a1
	; LMULMAX2-RV32-NEXT: vsrl.vi v8, v8, 8			; LMULMAX2-RV32I-NEXT: vsrl.vi v8, v8, 8
	; LMULMAX2-RV32-NEXT: vse16.v v8, (a0)			; LMULMAX2-RV32I-NEXT: vse16.v v8, (a0)
	; LMULMAX2-RV32-NEXT: ret			; LMULMAX2-RV32I-NEXT: ret
	;			;
	; LMULMAX2-RV64-LABEL: ctlz_v16i16:			; LMULMAX2-RV64I-LABEL: ctlz_v16i16:
	; LMULMAX2-RV64: # %bb.0:			; LMULMAX2-RV64I: # %bb.0:
	; LMULMAX2-RV64-NEXT: vsetivli zero, 16, e16, m2, ta, mu			; LMULMAX2-RV64I-NEXT: vsetivli zero, 16, e16, m2, ta, mu
	; LMULMAX2-RV64-NEXT: vle16.v v8, (a0)			; LMULMAX2-RV64I-NEXT: vle16.v v8, (a0)
	; LMULMAX2-RV64-NEXT: vsrl.vi v10, v8, 1			; LMULMAX2-RV64I-NEXT: vsrl.vi v10, v8, 1
	; LMULMAX2-RV64-NEXT: vor.vv v8, v8, v10			; LMULMAX2-RV64I-NEXT: vor.vv v8, v8, v10
	; LMULMAX2-RV64-NEXT: vsrl.vi v10, v8, 2			; LMULMAX2-RV64I-NEXT: vsrl.vi v10, v8, 2
	; LMULMAX2-RV64-NEXT: vor.vv v8, v8, v10			; LMULMAX2-RV64I-NEXT: vor.vv v8, v8, v10
	; LMULMAX2-RV64-NEXT: vsrl.vi v10, v8, 4			; LMULMAX2-RV64I-NEXT: vsrl.vi v10, v8, 4
	; LMULMAX2-RV64-NEXT: vor.vv v8, v8, v10			; LMULMAX2-RV64I-NEXT: vor.vv v8, v8, v10
	; LMULMAX2-RV64-NEXT: vsrl.vi v10, v8, 8			; LMULMAX2-RV64I-NEXT: vsrl.vi v10, v8, 8
	; LMULMAX2-RV64-NEXT: vor.vv v8, v8, v10			; LMULMAX2-RV64I-NEXT: vor.vv v8, v8, v10
	; LMULMAX2-RV64-NEXT: vxor.vi v8, v8, -1			; LMULMAX2-RV64I-NEXT: vxor.vi v8, v8, -1
	; LMULMAX2-RV64-NEXT: vsrl.vi v10, v8, 1			; LMULMAX2-RV64I-NEXT: vsrl.vi v10, v8, 1
	; LMULMAX2-RV64-NEXT: lui a1, 5			; LMULMAX2-RV64I-NEXT: lui a1, 5
	; LMULMAX2-RV64-NEXT: addiw a1, a1, 1365			; LMULMAX2-RV64I-NEXT: addiw a1, a1, 1365
	; LMULMAX2-RV64-NEXT: vand.vx v10, v10, a1			; LMULMAX2-RV64I-NEXT: vand.vx v10, v10, a1
	; LMULMAX2-RV64-NEXT: vsub.vv v8, v8, v10			; LMULMAX2-RV64I-NEXT: vsub.vv v8, v8, v10
	; LMULMAX2-RV64-NEXT: lui a1, 3			; LMULMAX2-RV64I-NEXT: lui a1, 3
	; LMULMAX2-RV64-NEXT: addiw a1, a1, 819			; LMULMAX2-RV64I-NEXT: addiw a1, a1, 819
	; LMULMAX2-RV64-NEXT: vand.vx v10, v8, a1			; LMULMAX2-RV64I-NEXT: vand.vx v10, v8, a1
	; LMULMAX2-RV64-NEXT: vsrl.vi v8, v8, 2			; LMULMAX2-RV64I-NEXT: vsrl.vi v8, v8, 2
	; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV64I-NEXT: vand.vx v8, v8, a1
	; LMULMAX2-RV64-NEXT: vadd.vv v8, v10, v8			; LMULMAX2-RV64I-NEXT: vadd.vv v8, v10, v8
	; LMULMAX2-RV64-NEXT: vsrl.vi v10, v8, 4			; LMULMAX2-RV64I-NEXT: vsrl.vi v10, v8, 4
	; LMULMAX2-RV64-NEXT: vadd.vv v8, v8, v10			; LMULMAX2-RV64I-NEXT: vadd.vv v8, v8, v10
	; LMULMAX2-RV64-NEXT: lui a1, 1			; LMULMAX2-RV64I-NEXT: lui a1, 1
	; LMULMAX2-RV64-NEXT: addiw a1, a1, -241			; LMULMAX2-RV64I-NEXT: addiw a1, a1, -241
	; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV64I-NEXT: vand.vx v8, v8, a1
	; LMULMAX2-RV64-NEXT: addi a1, zero, 257			; LMULMAX2-RV64I-NEXT: addi a1, zero, 257
	; LMULMAX2-RV64-NEXT: vmul.vx v8, v8, a1			; LMULMAX2-RV64I-NEXT: vmul.vx v8, v8, a1
	; LMULMAX2-RV64-NEXT: vsrl.vi v8, v8, 8			; LMULMAX2-RV64I-NEXT: vsrl.vi v8, v8, 8
	; LMULMAX2-RV64-NEXT: vse16.v v8, (a0)			; LMULMAX2-RV64I-NEXT: vse16.v v8, (a0)
	; LMULMAX2-RV64-NEXT: ret			; LMULMAX2-RV64I-NEXT: ret
	;			;
	; LMULMAX1-RV32-LABEL: ctlz_v16i16:			; LMULMAX2-RV32D-LABEL: ctlz_v16i16:
	; LMULMAX1-RV32: # %bb.0:			; LMULMAX2-RV32D: # %bb.0:
	; LMULMAX1-RV32-NEXT: vsetivli zero, 8, e16, m1, ta, mu			; LMULMAX2-RV32D-NEXT: vsetivli zero, 16, e16, m2, ta, mu
	; LMULMAX1-RV32-NEXT: addi a1, a0, 16			; LMULMAX2-RV32D-NEXT: vle16.v v8, (a0)
	; LMULMAX1-RV32-NEXT: vle16.v v8, (a1)			; LMULMAX2-RV32D-NEXT: vsetivli zero, 8, e16, m2, ta, mu
	; LMULMAX1-RV32-NEXT: vle16.v v9, (a0)			; LMULMAX2-RV32D-NEXT: vslidedown.vi v10, v8, 8
	; LMULMAX1-RV32-NEXT: vsrl.vi v10, v8, 1			; LMULMAX2-RV32D-NEXT: vsetivli zero, 8, e16, m1, ta, mu
	; LMULMAX1-RV32-NEXT: vor.vv v8, v8, v10			; LMULMAX2-RV32D-NEXT: vfwcvt.f.xu.v v12, v10
	; LMULMAX1-RV32-NEXT: vsrl.vi v10, v8, 2			; LMULMAX2-RV32D-NEXT: vnsrl.wi v10, v12, 23
	; LMULMAX1-RV32-NEXT: vor.vv v8, v8, v10			; LMULMAX2-RV32D-NEXT: addi a1, zero, 142
	; LMULMAX1-RV32-NEXT: vsrl.vi v10, v8, 4			; LMULMAX2-RV32D-NEXT: vrsub.vx v10, v10, a1
	; LMULMAX1-RV32-NEXT: vor.vv v8, v8, v10			; LMULMAX2-RV32D-NEXT: vfwcvt.f.xu.v v12, v8
	; LMULMAX1-RV32-NEXT: vsrl.vi v10, v8, 8			; LMULMAX2-RV32D-NEXT: vnsrl.wi v14, v12, 23
	; LMULMAX1-RV32-NEXT: vor.vv v8, v8, v10			; LMULMAX2-RV32D-NEXT: vrsub.vx v12, v14, a1
	; LMULMAX1-RV32-NEXT: vxor.vi v8, v8, -1			; LMULMAX2-RV32D-NEXT: vsetivli zero, 16, e16, m2, ta, mu
	; LMULMAX1-RV32-NEXT: vsrl.vi v10, v8, 1			; LMULMAX2-RV32D-NEXT: vmv.v.i v14, 0
	; LMULMAX1-RV32-NEXT: lui a2, 5			; LMULMAX2-RV32D-NEXT: vsetivli zero, 8, e16, m2, tu, mu
	; LMULMAX1-RV32-NEXT: addi a2, a2, 1365			; LMULMAX2-RV32D-NEXT: vslideup.vi v14, v12, 0
	; LMULMAX1-RV32-NEXT: vand.vx v10, v10, a2			; LMULMAX2-RV32D-NEXT: vsetivli zero, 16, e16, m2, tu, mu
	; LMULMAX1-RV32-NEXT: vsub.vv v8, v8, v10			; LMULMAX2-RV32D-NEXT: vslideup.vi v14, v10, 8
	; LMULMAX1-RV32-NEXT: lui a3, 3			; LMULMAX2-RV32D-NEXT: vsetvli zero, zero, e16, m2, ta, mu
	; LMULMAX1-RV32-NEXT: addi a3, a3, 819			; LMULMAX2-RV32D-NEXT: vmseq.vi v0, v8, 0
	; LMULMAX1-RV32-NEXT: vand.vx v10, v8, a3			; LMULMAX2-RV32D-NEXT: addi a1, zero, 16
	; LMULMAX1-RV32-NEXT: vsrl.vi v8, v8, 2			; LMULMAX2-RV32D-NEXT: vmerge.vxm v8, v14, a1, v0
	; LMULMAX1-RV32-NEXT: vand.vx v8, v8, a3			; LMULMAX2-RV32D-NEXT: vse16.v v8, (a0)
	; LMULMAX1-RV32-NEXT: vadd.vv v8, v10, v8			; LMULMAX2-RV32D-NEXT: ret
	; LMULMAX1-RV32-NEXT: vsrl.vi v10, v8, 4			;
	; LMULMAX1-RV32-NEXT: vadd.vv v8, v8, v10			; LMULMAX2-RV64D-LABEL: ctlz_v16i16:
	; LMULMAX1-RV32-NEXT: lui a4, 1			; LMULMAX2-RV64D: # %bb.0:
	; LMULMAX1-RV32-NEXT: addi a4, a4, -241			; LMULMAX2-RV64D-NEXT: vsetivli zero, 16, e16, m2, ta, mu
	; LMULMAX1-RV32-NEXT: vand.vx v8, v8, a4			; LMULMAX2-RV64D-NEXT: vle16.v v8, (a0)
	; LMULMAX1-RV32-NEXT: addi a5, zero, 257			; LMULMAX2-RV64D-NEXT: vsetivli zero, 8, e16, m2, ta, mu
	; LMULMAX1-RV32-NEXT: vmul.vx v8, v8, a5			; LMULMAX2-RV64D-NEXT: vslidedown.vi v10, v8, 8
	; LMULMAX1-RV32-NEXT: vsrl.vi v8, v8, 8			; LMULMAX2-RV64D-NEXT: vsetivli zero, 8, e16, m1, ta, mu
	; LMULMAX1-RV32-NEXT: vsrl.vi v10, v9, 1			; LMULMAX2-RV64D-NEXT: vfwcvt.f.xu.v v12, v10
	; LMULMAX1-RV32-NEXT: vor.vv v9, v9, v10			; LMULMAX2-RV64D-NEXT: vnsrl.wi v10, v12, 23
	; LMULMAX1-RV32-NEXT: vsrl.vi v10, v9, 2			; LMULMAX2-RV64D-NEXT: addi a1, zero, 142
	; LMULMAX1-RV32-NEXT: vor.vv v9, v9, v10			; LMULMAX2-RV64D-NEXT: vrsub.vx v10, v10, a1
	; LMULMAX1-RV32-NEXT: vsrl.vi v10, v9, 4			; LMULMAX2-RV64D-NEXT: vfwcvt.f.xu.v v12, v8
	; LMULMAX1-RV32-NEXT: vor.vv v9, v9, v10			; LMULMAX2-RV64D-NEXT: vnsrl.wi v14, v12, 23
	; LMULMAX1-RV32-NEXT: vsrl.vi v10, v9, 8			; LMULMAX2-RV64D-NEXT: vrsub.vx v12, v14, a1
	; LMULMAX1-RV32-NEXT: vor.vv v9, v9, v10			; LMULMAX2-RV64D-NEXT: vsetivli zero, 16, e16, m2, ta, mu
	; LMULMAX1-RV32-NEXT: vxor.vi v9, v9, -1			; LMULMAX2-RV64D-NEXT: vmv.v.i v14, 0
	; LMULMAX1-RV32-NEXT: vsrl.vi v10, v9, 1			; LMULMAX2-RV64D-NEXT: vsetivli zero, 8, e16, m2, tu, mu
	; LMULMAX1-RV32-NEXT: vand.vx v10, v10, a2			; LMULMAX2-RV64D-NEXT: vslideup.vi v14, v12, 0
	; LMULMAX1-RV32-NEXT: vsub.vv v9, v9, v10			; LMULMAX2-RV64D-NEXT: vsetivli zero, 16, e16, m2, tu, mu
	; LMULMAX1-RV32-NEXT: vand.vx v10, v9, a3			; LMULMAX2-RV64D-NEXT: vslideup.vi v14, v10, 8
	; LMULMAX1-RV32-NEXT: vsrl.vi v9, v9, 2			; LMULMAX2-RV64D-NEXT: vsetvli zero, zero, e16, m2, ta, mu
	; LMULMAX1-RV32-NEXT: vand.vx v9, v9, a3			; LMULMAX2-RV64D-NEXT: vmseq.vi v0, v8, 0
	; LMULMAX1-RV32-NEXT: vadd.vv v9, v10, v9			; LMULMAX2-RV64D-NEXT: addi a1, zero, 16
	; LMULMAX1-RV32-NEXT: vsrl.vi v10, v9, 4			; LMULMAX2-RV64D-NEXT: vmerge.vxm v8, v14, a1, v0
	; LMULMAX1-RV32-NEXT: vadd.vv v9, v9, v10			; LMULMAX2-RV64D-NEXT: vse16.v v8, (a0)
	; LMULMAX1-RV32-NEXT: vand.vx v9, v9, a4			; LMULMAX2-RV64D-NEXT: ret
	; LMULMAX1-RV32-NEXT: vmul.vx v9, v9, a5			;
	; LMULMAX1-RV32-NEXT: vsrl.vi v9, v9, 8			; LMULMAX1-RV32D-LABEL: ctlz_v16i16:
	; LMULMAX1-RV32-NEXT: vse16.v v9, (a0)			; LMULMAX1-RV32D: # %bb.0:
	; LMULMAX1-RV32-NEXT: vse16.v v8, (a1)			; LMULMAX1-RV32D-NEXT: vsetivli zero, 8, e16, m1, ta, mu
	; LMULMAX1-RV32-NEXT: ret			; LMULMAX1-RV32D-NEXT: addi a1, a0, 16
	;			; LMULMAX1-RV32D-NEXT: vle16.v v8, (a1)
	; LMULMAX1-RV64-LABEL: ctlz_v16i16:			; LMULMAX1-RV32D-NEXT: vle16.v v9, (a0)
	; LMULMAX1-RV64: # %bb.0:			; LMULMAX1-RV32D-NEXT: vsetivli zero, 4, e16, mf2, ta, mu
	; LMULMAX1-RV64-NEXT: vsetivli zero, 8, e16, m1, ta, mu			; LMULMAX1-RV32D-NEXT: vfwcvt.f.xu.v v10, v8
	; LMULMAX1-RV64-NEXT: addi a1, a0, 16			; LMULMAX1-RV32D-NEXT: vnsrl.wi v10, v10, 23
	; LMULMAX1-RV64-NEXT: vle16.v v8, (a1)			; LMULMAX1-RV32D-NEXT: addi a2, zero, 142
	; LMULMAX1-RV64-NEXT: vle16.v v9, (a0)			; LMULMAX1-RV32D-NEXT: vrsub.vx v10, v10, a2
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v8, 1			; LMULMAX1-RV32D-NEXT: vsetivli zero, 8, e16, m1, ta, mu
	; LMULMAX1-RV64-NEXT: vor.vv v8, v8, v10			; LMULMAX1-RV32D-NEXT: vmv.v.i v11, 0
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v8, 2			; LMULMAX1-RV32D-NEXT: vsetivli zero, 4, e16, m1, tu, mu
	; LMULMAX1-RV64-NEXT: vor.vv v8, v8, v10			; LMULMAX1-RV32D-NEXT: vmv1r.v v12, v11
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v8, 4			; LMULMAX1-RV32D-NEXT: vslideup.vi v12, v10, 0
	; LMULMAX1-RV64-NEXT: vor.vv v8, v8, v10			; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e16, m1, ta, mu
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v8, 8			; LMULMAX1-RV32D-NEXT: vslidedown.vi v10, v8, 4
	; LMULMAX1-RV64-NEXT: vor.vv v8, v8, v10			; LMULMAX1-RV32D-NEXT: vsetivli zero, 4, e16, mf2, ta, mu
	; LMULMAX1-RV64-NEXT: vxor.vi v8, v8, -1			; LMULMAX1-RV32D-NEXT: vfwcvt.f.xu.v v13, v10
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v8, 1			; LMULMAX1-RV32D-NEXT: vnsrl.wi v10, v13, 23
	; LMULMAX1-RV64-NEXT: lui a2, 5			; LMULMAX1-RV32D-NEXT: vrsub.vx v10, v10, a2
	; LMULMAX1-RV64-NEXT: addiw a2, a2, 1365			; LMULMAX1-RV32D-NEXT: vsetivli zero, 8, e16, m1, tu, mu
	; LMULMAX1-RV64-NEXT: vand.vx v10, v10, a2			; LMULMAX1-RV32D-NEXT: vslideup.vi v12, v10, 4
	; LMULMAX1-RV64-NEXT: vsub.vv v8, v8, v10			; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e16, m1, ta, mu
	; LMULMAX1-RV64-NEXT: lui a3, 3			; LMULMAX1-RV32D-NEXT: vmseq.vi v0, v8, 0
	; LMULMAX1-RV64-NEXT: addiw a3, a3, 819			; LMULMAX1-RV32D-NEXT: addi a3, zero, 16
	; LMULMAX1-RV64-NEXT: vand.vx v10, v8, a3			; LMULMAX1-RV32D-NEXT: vmerge.vxm v8, v12, a3, v0
	; LMULMAX1-RV64-NEXT: vsrl.vi v8, v8, 2			; LMULMAX1-RV32D-NEXT: vsetivli zero, 4, e16, mf2, ta, mu
	; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a3			; LMULMAX1-RV32D-NEXT: vfwcvt.f.xu.v v10, v9
	; LMULMAX1-RV64-NEXT: vadd.vv v8, v10, v8			; LMULMAX1-RV32D-NEXT: vnsrl.wi v10, v10, 23
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v8, 4			; LMULMAX1-RV32D-NEXT: vrsub.vx v10, v10, a2
	; LMULMAX1-RV64-NEXT: vadd.vv v8, v8, v10			; LMULMAX1-RV32D-NEXT: vsetivli zero, 4, e16, m1, tu, mu
	; LMULMAX1-RV64-NEXT: lui a4, 1			; LMULMAX1-RV32D-NEXT: vslideup.vi v11, v10, 0
	; LMULMAX1-RV64-NEXT: addiw a4, a4, -241			; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e16, m1, ta, mu
	; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a4			; LMULMAX1-RV32D-NEXT: vslidedown.vi v10, v9, 4
	; LMULMAX1-RV64-NEXT: addi a5, zero, 257			; LMULMAX1-RV32D-NEXT: vsetivli zero, 4, e16, mf2, ta, mu
	; LMULMAX1-RV64-NEXT: vmul.vx v8, v8, a5			; LMULMAX1-RV32D-NEXT: vfwcvt.f.xu.v v12, v10
	; LMULMAX1-RV64-NEXT: vsrl.vi v8, v8, 8			; LMULMAX1-RV32D-NEXT: vnsrl.wi v10, v12, 23
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v9, 1			; LMULMAX1-RV32D-NEXT: vrsub.vx v10, v10, a2
	; LMULMAX1-RV64-NEXT: vor.vv v9, v9, v10			; LMULMAX1-RV32D-NEXT: vsetivli zero, 8, e16, m1, tu, mu
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v9, 2			; LMULMAX1-RV32D-NEXT: vslideup.vi v11, v10, 4
	; LMULMAX1-RV64-NEXT: vor.vv v9, v9, v10			; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e16, m1, ta, mu
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v9, 4			; LMULMAX1-RV32D-NEXT: vmseq.vi v0, v9, 0
	; LMULMAX1-RV64-NEXT: vor.vv v9, v9, v10			; LMULMAX1-RV32D-NEXT: vmerge.vxm v9, v11, a3, v0
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v9, 8			; LMULMAX1-RV32D-NEXT: vse16.v v9, (a0)
	; LMULMAX1-RV64-NEXT: vor.vv v9, v9, v10			; LMULMAX1-RV32D-NEXT: vse16.v v8, (a1)
	; LMULMAX1-RV64-NEXT: vxor.vi v9, v9, -1			; LMULMAX1-RV32D-NEXT: ret
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v9, 1			;
	; LMULMAX1-RV64-NEXT: vand.vx v10, v10, a2			; LMULMAX1-RV64D-LABEL: ctlz_v16i16:
	; LMULMAX1-RV64-NEXT: vsub.vv v9, v9, v10			; LMULMAX1-RV64D: # %bb.0:
	; LMULMAX1-RV64-NEXT: vand.vx v10, v9, a3			; LMULMAX1-RV64D-NEXT: vsetivli zero, 8, e16, m1, ta, mu
	; LMULMAX1-RV64-NEXT: vsrl.vi v9, v9, 2			; LMULMAX1-RV64D-NEXT: addi a1, a0, 16
	; LMULMAX1-RV64-NEXT: vand.vx v9, v9, a3			; LMULMAX1-RV64D-NEXT: vle16.v v8, (a1)
	; LMULMAX1-RV64-NEXT: vadd.vv v9, v10, v9			; LMULMAX1-RV64D-NEXT: vle16.v v9, (a0)
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v9, 4			; LMULMAX1-RV64D-NEXT: vsetivli zero, 4, e16, mf2, ta, mu
	; LMULMAX1-RV64-NEXT: vadd.vv v9, v9, v10			; LMULMAX1-RV64D-NEXT: vfwcvt.f.xu.v v10, v8
	; LMULMAX1-RV64-NEXT: vand.vx v9, v9, a4			; LMULMAX1-RV64D-NEXT: vnsrl.wi v10, v10, 23
	; LMULMAX1-RV64-NEXT: vmul.vx v9, v9, a5			; LMULMAX1-RV64D-NEXT: addi a2, zero, 142
	; LMULMAX1-RV64-NEXT: vsrl.vi v9, v9, 8			; LMULMAX1-RV64D-NEXT: vrsub.vx v10, v10, a2
	; LMULMAX1-RV64-NEXT: vse16.v v9, (a0)			; LMULMAX1-RV64D-NEXT: vsetivli zero, 8, e16, m1, ta, mu
	; LMULMAX1-RV64-NEXT: vse16.v v8, (a1)			; LMULMAX1-RV64D-NEXT: vmv.v.i v11, 0
	; LMULMAX1-RV64-NEXT: ret			; LMULMAX1-RV64D-NEXT: vsetivli zero, 4, e16, m1, tu, mu
				; LMULMAX1-RV64D-NEXT: vmv1r.v v12, v11
				; LMULMAX1-RV64D-NEXT: vslideup.vi v12, v10, 0
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e16, m1, ta, mu
				; LMULMAX1-RV64D-NEXT: vslidedown.vi v10, v8, 4
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 4, e16, mf2, ta, mu
				; LMULMAX1-RV64D-NEXT: vfwcvt.f.xu.v v13, v10
				; LMULMAX1-RV64D-NEXT: vnsrl.wi v10, v13, 23
				; LMULMAX1-RV64D-NEXT: vrsub.vx v10, v10, a2
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 8, e16, m1, tu, mu
				; LMULMAX1-RV64D-NEXT: vslideup.vi v12, v10, 4
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e16, m1, ta, mu
				; LMULMAX1-RV64D-NEXT: vmseq.vi v0, v8, 0
				; LMULMAX1-RV64D-NEXT: addi a3, zero, 16
				; LMULMAX1-RV64D-NEXT: vmerge.vxm v8, v12, a3, v0
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 4, e16, mf2, ta, mu
				; LMULMAX1-RV64D-NEXT: vfwcvt.f.xu.v v10, v9
				; LMULMAX1-RV64D-NEXT: vnsrl.wi v10, v10, 23
				; LMULMAX1-RV64D-NEXT: vrsub.vx v10, v10, a2
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 4, e16, m1, tu, mu
				; LMULMAX1-RV64D-NEXT: vslideup.vi v11, v10, 0
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e16, m1, ta, mu
				; LMULMAX1-RV64D-NEXT: vslidedown.vi v10, v9, 4
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 4, e16, mf2, ta, mu
				; LMULMAX1-RV64D-NEXT: vfwcvt.f.xu.v v12, v10
				; LMULMAX1-RV64D-NEXT: vnsrl.wi v10, v12, 23
				; LMULMAX1-RV64D-NEXT: vrsub.vx v10, v10, a2
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 8, e16, m1, tu, mu
				; LMULMAX1-RV64D-NEXT: vslideup.vi v11, v10, 4
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e16, m1, ta, mu
				; LMULMAX1-RV64D-NEXT: vmseq.vi v0, v9, 0
				; LMULMAX1-RV64D-NEXT: vmerge.vxm v9, v11, a3, v0
				; LMULMAX1-RV64D-NEXT: vse16.v v9, (a0)
				; LMULMAX1-RV64D-NEXT: vse16.v v8, (a1)
				; LMULMAX1-RV64D-NEXT: ret
				;
				; LMULMAX8-RV32-LABEL: ctlz_v16i16:
				; LMULMAX8-RV32: # %bb.0:
				; LMULMAX8-RV32-NEXT: vsetivli zero, 16, e16, m2, ta, mu
				; LMULMAX8-RV32-NEXT: vle16.v v8, (a0)
				; LMULMAX8-RV32-NEXT: vfwcvt.f.xu.v v12, v8
				; LMULMAX8-RV32-NEXT: vnsrl.wi v10, v12, 23
				; LMULMAX8-RV32-NEXT: addi a1, zero, 142
				; LMULMAX8-RV32-NEXT: vrsub.vx v10, v10, a1
				; LMULMAX8-RV32-NEXT: vmseq.vi v0, v8, 0
				; LMULMAX8-RV32-NEXT: addi a1, zero, 16
				; LMULMAX8-RV32-NEXT: vmerge.vxm v8, v10, a1, v0
				; LMULMAX8-RV32-NEXT: vse16.v v8, (a0)
				; LMULMAX8-RV32-NEXT: ret
				;
				; LMULMAX8-RV64-LABEL: ctlz_v16i16:
				; LMULMAX8-RV64: # %bb.0:
				; LMULMAX8-RV64-NEXT: vsetivli zero, 16, e16, m2, ta, mu
				; LMULMAX8-RV64-NEXT: vle16.v v8, (a0)
				; LMULMAX8-RV64-NEXT: vfwcvt.f.xu.v v12, v8
				; LMULMAX8-RV64-NEXT: vnsrl.wi v10, v12, 23
				; LMULMAX8-RV64-NEXT: addi a1, zero, 142
				; LMULMAX8-RV64-NEXT: vrsub.vx v10, v10, a1
				; LMULMAX8-RV64-NEXT: vmseq.vi v0, v8, 0
				; LMULMAX8-RV64-NEXT: addi a1, zero, 16
				; LMULMAX8-RV64-NEXT: vmerge.vxm v8, v10, a1, v0
				; LMULMAX8-RV64-NEXT: vse16.v v8, (a0)
				; LMULMAX8-RV64-NEXT: ret
	%a = load <16 x i16>, <16 x i16>* %x			%a = load <16 x i16>, <16 x i16>* %x
	%b = load <16 x i16>, <16 x i16>* %y			%b = load <16 x i16>, <16 x i16>* %y
	%c = call <16 x i16> @llvm.ctlz.v16i16(<16 x i16> %a, i1 false)			%c = call <16 x i16> @llvm.ctlz.v16i16(<16 x i16> %a, i1 false)
	store <16 x i16> %c, <16 x i16>* %x			store <16 x i16> %c, <16 x i16>* %x
	ret void			ret void
	}			}
	declare <16 x i16> @llvm.ctlz.v16i16(<16 x i16>, i1)			declare <16 x i16> @llvm.ctlz.v16i16(<16 x i16>, i1)

	define void @ctlz_v8i32(<8 x i32>* %x, <8 x i32>* %y) nounwind {			define void @ctlz_v8i32(<8 x i32>* %x, <8 x i32>* %y) nounwind {
	; LMULMAX2-RV32-LABEL: ctlz_v8i32:			; LMULMAX2-RV32I-LABEL: ctlz_v8i32:
	; LMULMAX2-RV32: # %bb.0:			; LMULMAX2-RV32I: # %bb.0:
	; LMULMAX2-RV32-NEXT: vsetivli zero, 8, e32, m2, ta, mu			; LMULMAX2-RV32I-NEXT: vsetivli zero, 8, e32, m2, ta, mu
	; LMULMAX2-RV32-NEXT: vle32.v v8, (a0)			; LMULMAX2-RV32I-NEXT: vle32.v v8, (a0)
	; LMULMAX2-RV32-NEXT: vsrl.vi v10, v8, 1			; LMULMAX2-RV32I-NEXT: vsrl.vi v10, v8, 1
	; LMULMAX2-RV32-NEXT: vor.vv v8, v8, v10			; LMULMAX2-RV32I-NEXT: vor.vv v8, v8, v10
	; LMULMAX2-RV32-NEXT: vsrl.vi v10, v8, 2			; LMULMAX2-RV32I-NEXT: vsrl.vi v10, v8, 2
	; LMULMAX2-RV32-NEXT: vor.vv v8, v8, v10			; LMULMAX2-RV32I-NEXT: vor.vv v8, v8, v10
	; LMULMAX2-RV32-NEXT: vsrl.vi v10, v8, 4			; LMULMAX2-RV32I-NEXT: vsrl.vi v10, v8, 4
	; LMULMAX2-RV32-NEXT: vor.vv v8, v8, v10			; LMULMAX2-RV32I-NEXT: vor.vv v8, v8, v10
	; LMULMAX2-RV32-NEXT: vsrl.vi v10, v8, 8			; LMULMAX2-RV32I-NEXT: vsrl.vi v10, v8, 8
	; LMULMAX2-RV32-NEXT: vor.vv v8, v8, v10			; LMULMAX2-RV32I-NEXT: vor.vv v8, v8, v10
	; LMULMAX2-RV32-NEXT: vsrl.vi v10, v8, 16			; LMULMAX2-RV32I-NEXT: vsrl.vi v10, v8, 16
	; LMULMAX2-RV32-NEXT: vor.vv v8, v8, v10			; LMULMAX2-RV32I-NEXT: vor.vv v8, v8, v10
	; LMULMAX2-RV32-NEXT: vxor.vi v8, v8, -1			; LMULMAX2-RV32I-NEXT: vxor.vi v8, v8, -1
	; LMULMAX2-RV32-NEXT: vsrl.vi v10, v8, 1			; LMULMAX2-RV32I-NEXT: vsrl.vi v10, v8, 1
	; LMULMAX2-RV32-NEXT: lui a1, 349525			; LMULMAX2-RV32I-NEXT: lui a1, 349525
	; LMULMAX2-RV32-NEXT: addi a1, a1, 1365			; LMULMAX2-RV32I-NEXT: addi a1, a1, 1365
	; LMULMAX2-RV32-NEXT: vand.vx v10, v10, a1			; LMULMAX2-RV32I-NEXT: vand.vx v10, v10, a1
	; LMULMAX2-RV32-NEXT: vsub.vv v8, v8, v10			; LMULMAX2-RV32I-NEXT: vsub.vv v8, v8, v10
	; LMULMAX2-RV32-NEXT: lui a1, 209715			; LMULMAX2-RV32I-NEXT: lui a1, 209715
	; LMULMAX2-RV32-NEXT: addi a1, a1, 819			; LMULMAX2-RV32I-NEXT: addi a1, a1, 819
	; LMULMAX2-RV32-NEXT: vand.vx v10, v8, a1			; LMULMAX2-RV32I-NEXT: vand.vx v10, v8, a1
	; LMULMAX2-RV32-NEXT: vsrl.vi v8, v8, 2			; LMULMAX2-RV32I-NEXT: vsrl.vi v8, v8, 2
	; LMULMAX2-RV32-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV32I-NEXT: vand.vx v8, v8, a1
	; LMULMAX2-RV32-NEXT: vadd.vv v8, v10, v8			; LMULMAX2-RV32I-NEXT: vadd.vv v8, v10, v8
	; LMULMAX2-RV32-NEXT: vsrl.vi v10, v8, 4			; LMULMAX2-RV32I-NEXT: vsrl.vi v10, v8, 4
	; LMULMAX2-RV32-NEXT: vadd.vv v8, v8, v10			; LMULMAX2-RV32I-NEXT: vadd.vv v8, v8, v10
	; LMULMAX2-RV32-NEXT: lui a1, 61681			; LMULMAX2-RV32I-NEXT: lui a1, 61681
	; LMULMAX2-RV32-NEXT: addi a1, a1, -241			; LMULMAX2-RV32I-NEXT: addi a1, a1, -241
	; LMULMAX2-RV32-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV32I-NEXT: vand.vx v8, v8, a1
	; LMULMAX2-RV32-NEXT: lui a1, 4112			; LMULMAX2-RV32I-NEXT: lui a1, 4112
	; LMULMAX2-RV32-NEXT: addi a1, a1, 257			; LMULMAX2-RV32I-NEXT: addi a1, a1, 257
	; LMULMAX2-RV32-NEXT: vmul.vx v8, v8, a1			; LMULMAX2-RV32I-NEXT: vmul.vx v8, v8, a1
	; LMULMAX2-RV32-NEXT: vsrl.vi v8, v8, 24			; LMULMAX2-RV32I-NEXT: vsrl.vi v8, v8, 24
	; LMULMAX2-RV32-NEXT: vse32.v v8, (a0)			; LMULMAX2-RV32I-NEXT: vse32.v v8, (a0)
	; LMULMAX2-RV32-NEXT: ret			; LMULMAX2-RV32I-NEXT: ret
	;			;
	; LMULMAX2-RV64-LABEL: ctlz_v8i32:			; LMULMAX2-RV64I-LABEL: ctlz_v8i32:
	; LMULMAX2-RV64: # %bb.0:			; LMULMAX2-RV64I: # %bb.0:
	; LMULMAX2-RV64-NEXT: vsetivli zero, 8, e32, m2, ta, mu			; LMULMAX2-RV64I-NEXT: vsetivli zero, 8, e32, m2, ta, mu
	; LMULMAX2-RV64-NEXT: vle32.v v8, (a0)			; LMULMAX2-RV64I-NEXT: vle32.v v8, (a0)
	; LMULMAX2-RV64-NEXT: vsrl.vi v10, v8, 1			; LMULMAX2-RV64I-NEXT: vsrl.vi v10, v8, 1
	; LMULMAX2-RV64-NEXT: vor.vv v8, v8, v10			; LMULMAX2-RV64I-NEXT: vor.vv v8, v8, v10
	; LMULMAX2-RV64-NEXT: vsrl.vi v10, v8, 2			; LMULMAX2-RV64I-NEXT: vsrl.vi v10, v8, 2
	; LMULMAX2-RV64-NEXT: vor.vv v8, v8, v10			; LMULMAX2-RV64I-NEXT: vor.vv v8, v8, v10
	; LMULMAX2-RV64-NEXT: vsrl.vi v10, v8, 4			; LMULMAX2-RV64I-NEXT: vsrl.vi v10, v8, 4
	; LMULMAX2-RV64-NEXT: vor.vv v8, v8, v10			; LMULMAX2-RV64I-NEXT: vor.vv v8, v8, v10
	; LMULMAX2-RV64-NEXT: vsrl.vi v10, v8, 8			; LMULMAX2-RV64I-NEXT: vsrl.vi v10, v8, 8
	; LMULMAX2-RV64-NEXT: vor.vv v8, v8, v10			; LMULMAX2-RV64I-NEXT: vor.vv v8, v8, v10
	; LMULMAX2-RV64-NEXT: vsrl.vi v10, v8, 16			; LMULMAX2-RV64I-NEXT: vsrl.vi v10, v8, 16
	; LMULMAX2-RV64-NEXT: vor.vv v8, v8, v10			; LMULMAX2-RV64I-NEXT: vor.vv v8, v8, v10
	; LMULMAX2-RV64-NEXT: vxor.vi v8, v8, -1			; LMULMAX2-RV64I-NEXT: vxor.vi v8, v8, -1
	; LMULMAX2-RV64-NEXT: vsrl.vi v10, v8, 1			; LMULMAX2-RV64I-NEXT: vsrl.vi v10, v8, 1
	; LMULMAX2-RV64-NEXT: lui a1, 349525			; LMULMAX2-RV64I-NEXT: lui a1, 349525
	; LMULMAX2-RV64-NEXT: addiw a1, a1, 1365			; LMULMAX2-RV64I-NEXT: addiw a1, a1, 1365
	; LMULMAX2-RV64-NEXT: vand.vx v10, v10, a1			; LMULMAX2-RV64I-NEXT: vand.vx v10, v10, a1
	; LMULMAX2-RV64-NEXT: vsub.vv v8, v8, v10			; LMULMAX2-RV64I-NEXT: vsub.vv v8, v8, v10
	; LMULMAX2-RV64-NEXT: lui a1, 209715			; LMULMAX2-RV64I-NEXT: lui a1, 209715
	; LMULMAX2-RV64-NEXT: addiw a1, a1, 819			; LMULMAX2-RV64I-NEXT: addiw a1, a1, 819
	; LMULMAX2-RV64-NEXT: vand.vx v10, v8, a1			; LMULMAX2-RV64I-NEXT: vand.vx v10, v8, a1
	; LMULMAX2-RV64-NEXT: vsrl.vi v8, v8, 2			; LMULMAX2-RV64I-NEXT: vsrl.vi v8, v8, 2
	; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV64I-NEXT: vand.vx v8, v8, a1
	; LMULMAX2-RV64-NEXT: vadd.vv v8, v10, v8			; LMULMAX2-RV64I-NEXT: vadd.vv v8, v10, v8
	; LMULMAX2-RV64-NEXT: vsrl.vi v10, v8, 4			; LMULMAX2-RV64I-NEXT: vsrl.vi v10, v8, 4
	; LMULMAX2-RV64-NEXT: vadd.vv v8, v8, v10			; LMULMAX2-RV64I-NEXT: vadd.vv v8, v8, v10
	; LMULMAX2-RV64-NEXT: lui a1, 61681			; LMULMAX2-RV64I-NEXT: lui a1, 61681
	; LMULMAX2-RV64-NEXT: addiw a1, a1, -241			; LMULMAX2-RV64I-NEXT: addiw a1, a1, -241
	; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV64I-NEXT: vand.vx v8, v8, a1
	; LMULMAX2-RV64-NEXT: lui a1, 4112			; LMULMAX2-RV64I-NEXT: lui a1, 4112
	; LMULMAX2-RV64-NEXT: addiw a1, a1, 257			; LMULMAX2-RV64I-NEXT: addiw a1, a1, 257
	; LMULMAX2-RV64-NEXT: vmul.vx v8, v8, a1			; LMULMAX2-RV64I-NEXT: vmul.vx v8, v8, a1
	; LMULMAX2-RV64-NEXT: vsrl.vi v8, v8, 24			; LMULMAX2-RV64I-NEXT: vsrl.vi v8, v8, 24
	; LMULMAX2-RV64-NEXT: vse32.v v8, (a0)			; LMULMAX2-RV64I-NEXT: vse32.v v8, (a0)
	; LMULMAX2-RV64-NEXT: ret			; LMULMAX2-RV64I-NEXT: ret
	;			;
	; LMULMAX1-RV32-LABEL: ctlz_v8i32:			; LMULMAX2-RV32D-LABEL: ctlz_v8i32:
	; LMULMAX1-RV32: # %bb.0:			; LMULMAX2-RV32D: # %bb.0:
	; LMULMAX1-RV32-NEXT: vsetivli zero, 4, e32, m1, ta, mu			; LMULMAX2-RV32D-NEXT: vsetivli zero, 8, e32, m2, ta, mu
	; LMULMAX1-RV32-NEXT: addi a1, a0, 16			; LMULMAX2-RV32D-NEXT: vle32.v v8, (a0)
	; LMULMAX1-RV32-NEXT: vle32.v v8, (a1)			; LMULMAX2-RV32D-NEXT: vsetivli zero, 4, e32, m2, ta, mu
	; LMULMAX1-RV32-NEXT: vle32.v v9, (a0)			; LMULMAX2-RV32D-NEXT: vslidedown.vi v10, v8, 4
	; LMULMAX1-RV32-NEXT: vsrl.vi v10, v8, 1			; LMULMAX2-RV32D-NEXT: vsetivli zero, 4, e32, m1, ta, mu
	; LMULMAX1-RV32-NEXT: vor.vv v8, v8, v10			; LMULMAX2-RV32D-NEXT: vfwcvt.f.xu.v v12, v10
	; LMULMAX1-RV32-NEXT: vsrl.vi v10, v8, 2			; LMULMAX2-RV32D-NEXT: addi a1, zero, 52
	; LMULMAX1-RV32-NEXT: vor.vv v8, v8, v10			; LMULMAX2-RV32D-NEXT: vnsrl.wx v10, v12, a1
	; LMULMAX1-RV32-NEXT: vsrl.vi v10, v8, 4			; LMULMAX2-RV32D-NEXT: addi a2, zero, 1054
	; LMULMAX1-RV32-NEXT: vor.vv v8, v8, v10			; LMULMAX2-RV32D-NEXT: vrsub.vx v10, v10, a2
	; LMULMAX1-RV32-NEXT: vsrl.vi v10, v8, 8			; LMULMAX2-RV32D-NEXT: vfwcvt.f.xu.v v12, v8
	; LMULMAX1-RV32-NEXT: vor.vv v8, v8, v10			; LMULMAX2-RV32D-NEXT: vnsrl.wx v14, v12, a1
	; LMULMAX1-RV32-NEXT: vsrl.vi v10, v8, 16			; LMULMAX2-RV32D-NEXT: vrsub.vx v12, v14, a2
	; LMULMAX1-RV32-NEXT: vor.vv v8, v8, v10			; LMULMAX2-RV32D-NEXT: vsetivli zero, 8, e32, m2, ta, mu
	; LMULMAX1-RV32-NEXT: vxor.vi v8, v8, -1			; LMULMAX2-RV32D-NEXT: vmv.v.i v14, 0
	; LMULMAX1-RV32-NEXT: vsrl.vi v10, v8, 1			; LMULMAX2-RV32D-NEXT: vsetivli zero, 4, e32, m2, tu, mu
	; LMULMAX1-RV32-NEXT: lui a2, 349525			; LMULMAX2-RV32D-NEXT: vslideup.vi v14, v12, 0
	; LMULMAX1-RV32-NEXT: addi a2, a2, 1365			; LMULMAX2-RV32D-NEXT: vsetivli zero, 8, e32, m2, tu, mu
	; LMULMAX1-RV32-NEXT: vand.vx v10, v10, a2			; LMULMAX2-RV32D-NEXT: vslideup.vi v14, v10, 4
	; LMULMAX1-RV32-NEXT: vsub.vv v8, v8, v10			; LMULMAX2-RV32D-NEXT: vsetvli zero, zero, e32, m2, ta, mu
	; LMULMAX1-RV32-NEXT: lui a3, 209715			; LMULMAX2-RV32D-NEXT: vmseq.vi v0, v8, 0
	; LMULMAX1-RV32-NEXT: addi a3, a3, 819			; LMULMAX2-RV32D-NEXT: addi a1, zero, 32
	; LMULMAX1-RV32-NEXT: vand.vx v10, v8, a3			; LMULMAX2-RV32D-NEXT: vmerge.vxm v8, v14, a1, v0
	; LMULMAX1-RV32-NEXT: vsrl.vi v8, v8, 2			; LMULMAX2-RV32D-NEXT: vse32.v v8, (a0)
	; LMULMAX1-RV32-NEXT: vand.vx v8, v8, a3			; LMULMAX2-RV32D-NEXT: ret
	; LMULMAX1-RV32-NEXT: vadd.vv v8, v10, v8			;
	; LMULMAX1-RV32-NEXT: vsrl.vi v10, v8, 4			; LMULMAX2-RV64D-LABEL: ctlz_v8i32:
	; LMULMAX1-RV32-NEXT: vadd.vv v8, v8, v10			; LMULMAX2-RV64D: # %bb.0:
	; LMULMAX1-RV32-NEXT: lui a4, 61681			; LMULMAX2-RV64D-NEXT: vsetivli zero, 8, e32, m2, ta, mu
	; LMULMAX1-RV32-NEXT: addi a4, a4, -241			; LMULMAX2-RV64D-NEXT: vle32.v v8, (a0)
	; LMULMAX1-RV32-NEXT: vand.vx v8, v8, a4			; LMULMAX2-RV64D-NEXT: vsetivli zero, 4, e32, m2, ta, mu
	; LMULMAX1-RV32-NEXT: lui a5, 4112			; LMULMAX2-RV64D-NEXT: vslidedown.vi v10, v8, 4
	; LMULMAX1-RV32-NEXT: addi a5, a5, 257			; LMULMAX2-RV64D-NEXT: vsetivli zero, 4, e32, m1, ta, mu
	; LMULMAX1-RV32-NEXT: vmul.vx v8, v8, a5			; LMULMAX2-RV64D-NEXT: vfwcvt.f.xu.v v12, v10
	; LMULMAX1-RV32-NEXT: vsrl.vi v8, v8, 24			; LMULMAX2-RV64D-NEXT: addi a1, zero, 52
	; LMULMAX1-RV32-NEXT: vsrl.vi v10, v9, 1			; LMULMAX2-RV64D-NEXT: vnsrl.wx v10, v12, a1
	; LMULMAX1-RV32-NEXT: vor.vv v9, v9, v10			; LMULMAX2-RV64D-NEXT: addi a2, zero, 1054
	; LMULMAX1-RV32-NEXT: vsrl.vi v10, v9, 2			; LMULMAX2-RV64D-NEXT: vrsub.vx v10, v10, a2
	; LMULMAX1-RV32-NEXT: vor.vv v9, v9, v10			; LMULMAX2-RV64D-NEXT: vfwcvt.f.xu.v v12, v8
	; LMULMAX1-RV32-NEXT: vsrl.vi v10, v9, 4			; LMULMAX2-RV64D-NEXT: vnsrl.wx v14, v12, a1
	; LMULMAX1-RV32-NEXT: vor.vv v9, v9, v10			; LMULMAX2-RV64D-NEXT: vrsub.vx v12, v14, a2
	; LMULMAX1-RV32-NEXT: vsrl.vi v10, v9, 8			; LMULMAX2-RV64D-NEXT: vsetivli zero, 8, e32, m2, ta, mu
	; LMULMAX1-RV32-NEXT: vor.vv v9, v9, v10			; LMULMAX2-RV64D-NEXT: vmv.v.i v14, 0
	; LMULMAX1-RV32-NEXT: vsrl.vi v10, v9, 16			; LMULMAX2-RV64D-NEXT: vsetivli zero, 4, e32, m2, tu, mu
	; LMULMAX1-RV32-NEXT: vor.vv v9, v9, v10			; LMULMAX2-RV64D-NEXT: vslideup.vi v14, v12, 0
	; LMULMAX1-RV32-NEXT: vxor.vi v9, v9, -1			; LMULMAX2-RV64D-NEXT: vsetivli zero, 8, e32, m2, tu, mu
	; LMULMAX1-RV32-NEXT: vsrl.vi v10, v9, 1			; LMULMAX2-RV64D-NEXT: vslideup.vi v14, v10, 4
	; LMULMAX1-RV32-NEXT: vand.vx v10, v10, a2			; LMULMAX2-RV64D-NEXT: vsetvli zero, zero, e32, m2, ta, mu
	; LMULMAX1-RV32-NEXT: vsub.vv v9, v9, v10			; LMULMAX2-RV64D-NEXT: vmseq.vi v0, v8, 0
	; LMULMAX1-RV32-NEXT: vand.vx v10, v9, a3			; LMULMAX2-RV64D-NEXT: addi a1, zero, 32
	; LMULMAX1-RV32-NEXT: vsrl.vi v9, v9, 2			; LMULMAX2-RV64D-NEXT: vmerge.vxm v8, v14, a1, v0
	; LMULMAX1-RV32-NEXT: vand.vx v9, v9, a3			; LMULMAX2-RV64D-NEXT: vse32.v v8, (a0)
	; LMULMAX1-RV32-NEXT: vadd.vv v9, v10, v9			; LMULMAX2-RV64D-NEXT: ret
	; LMULMAX1-RV32-NEXT: vsrl.vi v10, v9, 4			;
	; LMULMAX1-RV32-NEXT: vadd.vv v9, v9, v10			; LMULMAX1-RV32D-LABEL: ctlz_v8i32:
	; LMULMAX1-RV32-NEXT: vand.vx v9, v9, a4			; LMULMAX1-RV32D: # %bb.0:
	; LMULMAX1-RV32-NEXT: vmul.vx v9, v9, a5			; LMULMAX1-RV32D-NEXT: vsetivli zero, 4, e32, m1, ta, mu
	; LMULMAX1-RV32-NEXT: vsrl.vi v9, v9, 24			; LMULMAX1-RV32D-NEXT: addi a1, a0, 16
	; LMULMAX1-RV32-NEXT: vse32.v v9, (a0)			; LMULMAX1-RV32D-NEXT: vle32.v v8, (a1)
	; LMULMAX1-RV32-NEXT: vse32.v v8, (a1)			; LMULMAX1-RV32D-NEXT: vle32.v v9, (a0)
	; LMULMAX1-RV32-NEXT: ret			; LMULMAX1-RV32D-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
	;			; LMULMAX1-RV32D-NEXT: vfwcvt.f.xu.v v10, v8
	; LMULMAX1-RV64-LABEL: ctlz_v8i32:			; LMULMAX1-RV32D-NEXT: addi a2, zero, 52
	; LMULMAX1-RV64: # %bb.0:			; LMULMAX1-RV32D-NEXT: vnsrl.wx v10, v10, a2
	; LMULMAX1-RV64-NEXT: vsetivli zero, 4, e32, m1, ta, mu			; LMULMAX1-RV32D-NEXT: addi a3, zero, 1054
	; LMULMAX1-RV64-NEXT: addi a1, a0, 16			; LMULMAX1-RV32D-NEXT: vrsub.vx v10, v10, a3
	; LMULMAX1-RV64-NEXT: vle32.v v8, (a1)			; LMULMAX1-RV32D-NEXT: vsetivli zero, 4, e32, m1, ta, mu
	; LMULMAX1-RV64-NEXT: vle32.v v9, (a0)			; LMULMAX1-RV32D-NEXT: vmv.v.i v11, 0
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v8, 1			; LMULMAX1-RV32D-NEXT: vsetivli zero, 2, e32, m1, tu, mu
	; LMULMAX1-RV64-NEXT: vor.vv v8, v8, v10			; LMULMAX1-RV32D-NEXT: vmv1r.v v12, v11
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v8, 2			; LMULMAX1-RV32D-NEXT: vslideup.vi v12, v10, 0
	; LMULMAX1-RV64-NEXT: vor.vv v8, v8, v10			; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e32, m1, ta, mu
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v8, 4			; LMULMAX1-RV32D-NEXT: vslidedown.vi v10, v8, 2
	; LMULMAX1-RV64-NEXT: vor.vv v8, v8, v10			; LMULMAX1-RV32D-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v8, 8			; LMULMAX1-RV32D-NEXT: vfwcvt.f.xu.v v13, v10
	; LMULMAX1-RV64-NEXT: vor.vv v8, v8, v10			; LMULMAX1-RV32D-NEXT: vnsrl.wx v10, v13, a2
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v8, 16			; LMULMAX1-RV32D-NEXT: vrsub.vx v10, v10, a3
	; LMULMAX1-RV64-NEXT: vor.vv v8, v8, v10			; LMULMAX1-RV32D-NEXT: vsetivli zero, 4, e32, m1, tu, mu
	; LMULMAX1-RV64-NEXT: vxor.vi v8, v8, -1			; LMULMAX1-RV32D-NEXT: vslideup.vi v12, v10, 2
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v8, 1			; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e32, m1, ta, mu
	; LMULMAX1-RV64-NEXT: lui a2, 349525			; LMULMAX1-RV32D-NEXT: vmseq.vi v0, v8, 0
	; LMULMAX1-RV64-NEXT: addiw a2, a2, 1365			; LMULMAX1-RV32D-NEXT: addi a4, zero, 32
	; LMULMAX1-RV64-NEXT: vand.vx v10, v10, a2			; LMULMAX1-RV32D-NEXT: vmerge.vxm v8, v12, a4, v0
	; LMULMAX1-RV64-NEXT: vsub.vv v8, v8, v10			; LMULMAX1-RV32D-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
	; LMULMAX1-RV64-NEXT: lui a3, 209715			; LMULMAX1-RV32D-NEXT: vfwcvt.f.xu.v v10, v9
	; LMULMAX1-RV64-NEXT: addiw a3, a3, 819			; LMULMAX1-RV32D-NEXT: vnsrl.wx v10, v10, a2
	; LMULMAX1-RV64-NEXT: vand.vx v10, v8, a3			; LMULMAX1-RV32D-NEXT: vrsub.vx v10, v10, a3
	; LMULMAX1-RV64-NEXT: vsrl.vi v8, v8, 2			; LMULMAX1-RV32D-NEXT: vsetivli zero, 2, e32, m1, tu, mu
	; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a3			; LMULMAX1-RV32D-NEXT: vslideup.vi v11, v10, 0
	; LMULMAX1-RV64-NEXT: vadd.vv v8, v10, v8			; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e32, m1, ta, mu
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v8, 4			; LMULMAX1-RV32D-NEXT: vslidedown.vi v10, v9, 2
	; LMULMAX1-RV64-NEXT: vadd.vv v8, v8, v10			; LMULMAX1-RV32D-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
	; LMULMAX1-RV64-NEXT: lui a4, 61681			; LMULMAX1-RV32D-NEXT: vfwcvt.f.xu.v v12, v10
	; LMULMAX1-RV64-NEXT: addiw a4, a4, -241			; LMULMAX1-RV32D-NEXT: vnsrl.wx v10, v12, a2
	; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a4			; LMULMAX1-RV32D-NEXT: vrsub.vx v10, v10, a3
	; LMULMAX1-RV64-NEXT: lui a5, 4112			; LMULMAX1-RV32D-NEXT: vsetivli zero, 4, e32, m1, tu, mu
	; LMULMAX1-RV64-NEXT: addiw a5, a5, 257			; LMULMAX1-RV32D-NEXT: vslideup.vi v11, v10, 2
	; LMULMAX1-RV64-NEXT: vmul.vx v8, v8, a5			; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e32, m1, ta, mu
	; LMULMAX1-RV64-NEXT: vsrl.vi v8, v8, 24			; LMULMAX1-RV32D-NEXT: vmseq.vi v0, v9, 0
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v9, 1			; LMULMAX1-RV32D-NEXT: vmerge.vxm v9, v11, a4, v0
	; LMULMAX1-RV64-NEXT: vor.vv v9, v9, v10			; LMULMAX1-RV32D-NEXT: vse32.v v9, (a0)
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v9, 2			; LMULMAX1-RV32D-NEXT: vse32.v v8, (a1)
	; LMULMAX1-RV64-NEXT: vor.vv v9, v9, v10			; LMULMAX1-RV32D-NEXT: ret
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v9, 4			;
	; LMULMAX1-RV64-NEXT: vor.vv v9, v9, v10			; LMULMAX1-RV64D-LABEL: ctlz_v8i32:
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v9, 8			; LMULMAX1-RV64D: # %bb.0:
	; LMULMAX1-RV64-NEXT: vor.vv v9, v9, v10			; LMULMAX1-RV64D-NEXT: vsetivli zero, 4, e32, m1, ta, mu
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v9, 16			; LMULMAX1-RV64D-NEXT: addi a1, a0, 16
	; LMULMAX1-RV64-NEXT: vor.vv v9, v9, v10			; LMULMAX1-RV64D-NEXT: vle32.v v8, (a1)
	; LMULMAX1-RV64-NEXT: vxor.vi v9, v9, -1			; LMULMAX1-RV64D-NEXT: vle32.v v9, (a0)
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v9, 1			; LMULMAX1-RV64D-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
	; LMULMAX1-RV64-NEXT: vand.vx v10, v10, a2			; LMULMAX1-RV64D-NEXT: vfwcvt.f.xu.v v10, v8
	; LMULMAX1-RV64-NEXT: vsub.vv v9, v9, v10			; LMULMAX1-RV64D-NEXT: addi a2, zero, 52
	; LMULMAX1-RV64-NEXT: vand.vx v10, v9, a3			; LMULMAX1-RV64D-NEXT: vnsrl.wx v10, v10, a2
	; LMULMAX1-RV64-NEXT: vsrl.vi v9, v9, 2			; LMULMAX1-RV64D-NEXT: addi a3, zero, 1054
	; LMULMAX1-RV64-NEXT: vand.vx v9, v9, a3			; LMULMAX1-RV64D-NEXT: vrsub.vx v10, v10, a3
	; LMULMAX1-RV64-NEXT: vadd.vv v9, v10, v9			; LMULMAX1-RV64D-NEXT: vsetivli zero, 4, e32, m1, ta, mu
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v9, 4			; LMULMAX1-RV64D-NEXT: vmv.v.i v11, 0
	; LMULMAX1-RV64-NEXT: vadd.vv v9, v9, v10			; LMULMAX1-RV64D-NEXT: vsetivli zero, 2, e32, m1, tu, mu
	; LMULMAX1-RV64-NEXT: vand.vx v9, v9, a4			; LMULMAX1-RV64D-NEXT: vmv1r.v v12, v11
	; LMULMAX1-RV64-NEXT: vmul.vx v9, v9, a5			; LMULMAX1-RV64D-NEXT: vslideup.vi v12, v10, 0
	; LMULMAX1-RV64-NEXT: vsrl.vi v9, v9, 24			; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e32, m1, ta, mu
	; LMULMAX1-RV64-NEXT: vse32.v v9, (a0)			; LMULMAX1-RV64D-NEXT: vslidedown.vi v10, v8, 2
	; LMULMAX1-RV64-NEXT: vse32.v v8, (a1)			; LMULMAX1-RV64D-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
	; LMULMAX1-RV64-NEXT: ret			; LMULMAX1-RV64D-NEXT: vfwcvt.f.xu.v v13, v10
				; LMULMAX1-RV64D-NEXT: vnsrl.wx v10, v13, a2
				; LMULMAX1-RV64D-NEXT: vrsub.vx v10, v10, a3
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 4, e32, m1, tu, mu
				; LMULMAX1-RV64D-NEXT: vslideup.vi v12, v10, 2
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e32, m1, ta, mu
				; LMULMAX1-RV64D-NEXT: vmseq.vi v0, v8, 0
				; LMULMAX1-RV64D-NEXT: addi a4, zero, 32
				; LMULMAX1-RV64D-NEXT: vmerge.vxm v8, v12, a4, v0
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
				; LMULMAX1-RV64D-NEXT: vfwcvt.f.xu.v v10, v9
				; LMULMAX1-RV64D-NEXT: vnsrl.wx v10, v10, a2
				; LMULMAX1-RV64D-NEXT: vrsub.vx v10, v10, a3
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 2, e32, m1, tu, mu
				; LMULMAX1-RV64D-NEXT: vslideup.vi v11, v10, 0
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e32, m1, ta, mu
				; LMULMAX1-RV64D-NEXT: vslidedown.vi v10, v9, 2
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
				; LMULMAX1-RV64D-NEXT: vfwcvt.f.xu.v v12, v10
				; LMULMAX1-RV64D-NEXT: vnsrl.wx v10, v12, a2
				; LMULMAX1-RV64D-NEXT: vrsub.vx v10, v10, a3
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 4, e32, m1, tu, mu
				; LMULMAX1-RV64D-NEXT: vslideup.vi v11, v10, 2
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e32, m1, ta, mu
				; LMULMAX1-RV64D-NEXT: vmseq.vi v0, v9, 0
				; LMULMAX1-RV64D-NEXT: vmerge.vxm v9, v11, a4, v0
				; LMULMAX1-RV64D-NEXT: vse32.v v9, (a0)
				; LMULMAX1-RV64D-NEXT: vse32.v v8, (a1)
				; LMULMAX1-RV64D-NEXT: ret
				;
				; LMULMAX8-RV32-LABEL: ctlz_v8i32:
				; LMULMAX8-RV32: # %bb.0:
				; LMULMAX8-RV32-NEXT: vsetivli zero, 8, e32, m2, ta, mu
				; LMULMAX8-RV32-NEXT: vle32.v v8, (a0)
				; LMULMAX8-RV32-NEXT: vfwcvt.f.xu.v v12, v8
				; LMULMAX8-RV32-NEXT: addi a1, zero, 52
				; LMULMAX8-RV32-NEXT: vnsrl.wx v10, v12, a1
				; LMULMAX8-RV32-NEXT: addi a1, zero, 1054
				; LMULMAX8-RV32-NEXT: vrsub.vx v10, v10, a1
				; LMULMAX8-RV32-NEXT: vmseq.vi v0, v8, 0
				; LMULMAX8-RV32-NEXT: addi a1, zero, 32
				; LMULMAX8-RV32-NEXT: vmerge.vxm v8, v10, a1, v0
				; LMULMAX8-RV32-NEXT: vse32.v v8, (a0)
				; LMULMAX8-RV32-NEXT: ret
				;
				; LMULMAX8-RV64-LABEL: ctlz_v8i32:
				; LMULMAX8-RV64: # %bb.0:
				; LMULMAX8-RV64-NEXT: vsetivli zero, 8, e32, m2, ta, mu
				; LMULMAX8-RV64-NEXT: vle32.v v8, (a0)
				; LMULMAX8-RV64-NEXT: vfwcvt.f.xu.v v12, v8
				; LMULMAX8-RV64-NEXT: addi a1, zero, 52
				; LMULMAX8-RV64-NEXT: vnsrl.wx v10, v12, a1
				; LMULMAX8-RV64-NEXT: addi a1, zero, 1054
				; LMULMAX8-RV64-NEXT: vrsub.vx v10, v10, a1
				; LMULMAX8-RV64-NEXT: vmseq.vi v0, v8, 0
				; LMULMAX8-RV64-NEXT: addi a1, zero, 32
				; LMULMAX8-RV64-NEXT: vmerge.vxm v8, v10, a1, v0
				; LMULMAX8-RV64-NEXT: vse32.v v8, (a0)
				; LMULMAX8-RV64-NEXT: ret
	%a = load <8 x i32>, <8 x i32>* %x			%a = load <8 x i32>, <8 x i32>* %x
	%b = load <8 x i32>, <8 x i32>* %y			%b = load <8 x i32>, <8 x i32>* %y
	%c = call <8 x i32> @llvm.ctlz.v8i32(<8 x i32> %a, i1 false)			%c = call <8 x i32> @llvm.ctlz.v8i32(<8 x i32> %a, i1 false)
	store <8 x i32> %c, <8 x i32>* %x			store <8 x i32> %c, <8 x i32>* %x
	ret void			ret void
	}			}
	declare <8 x i32> @llvm.ctlz.v8i32(<8 x i32>, i1)			declare <8 x i32> @llvm.ctlz.v8i32(<8 x i32>, i1)

	▲ Show 20 Lines • Show All 290 Lines • ▼ Show 20 Lines
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v9, 4			; LMULMAX1-RV64-NEXT: vsrl.vi v10, v9, 4
	; LMULMAX1-RV64-NEXT: vadd.vv v9, v9, v10			; LMULMAX1-RV64-NEXT: vadd.vv v9, v9, v10
	; LMULMAX1-RV64-NEXT: vand.vx v9, v9, a5			; LMULMAX1-RV64-NEXT: vand.vx v9, v9, a5
	; LMULMAX1-RV64-NEXT: vmul.vx v9, v9, a2			; LMULMAX1-RV64-NEXT: vmul.vx v9, v9, a2
	; LMULMAX1-RV64-NEXT: vsrl.vx v9, v9, a1			; LMULMAX1-RV64-NEXT: vsrl.vx v9, v9, a1
	; LMULMAX1-RV64-NEXT: vse64.v v9, (a0)			; LMULMAX1-RV64-NEXT: vse64.v v9, (a0)
	; LMULMAX1-RV64-NEXT: vse64.v v8, (a7)			; LMULMAX1-RV64-NEXT: vse64.v v8, (a7)
	; LMULMAX1-RV64-NEXT: ret			; LMULMAX1-RV64-NEXT: ret
				;
				; LMULMAX8-RV32-LABEL: ctlz_v4i64:
				; LMULMAX8-RV32: # %bb.0:
				; LMULMAX8-RV32-NEXT: vsetivli zero, 4, e64, m2, ta, mu
				; LMULMAX8-RV32-NEXT: vle64.v v8, (a0)
				; LMULMAX8-RV32-NEXT: vsrl.vi v10, v8, 1
				; LMULMAX8-RV32-NEXT: vor.vv v8, v8, v10
				; LMULMAX8-RV32-NEXT: vsrl.vi v10, v8, 2
				; LMULMAX8-RV32-NEXT: vor.vv v8, v8, v10
				; LMULMAX8-RV32-NEXT: vsrl.vi v10, v8, 4
				; LMULMAX8-RV32-NEXT: vor.vv v8, v8, v10
				; LMULMAX8-RV32-NEXT: vsrl.vi v10, v8, 8
				; LMULMAX8-RV32-NEXT: vor.vv v8, v8, v10
				; LMULMAX8-RV32-NEXT: vsrl.vi v10, v8, 16
				; LMULMAX8-RV32-NEXT: vor.vv v8, v8, v10
				; LMULMAX8-RV32-NEXT: addi a1, zero, 32
				; LMULMAX8-RV32-NEXT: vsrl.vx v10, v8, a1
				; LMULMAX8-RV32-NEXT: vor.vv v8, v8, v10
				; LMULMAX8-RV32-NEXT: vsetivli zero, 8, e32, m2, ta, mu
				; LMULMAX8-RV32-NEXT: vmv.v.i v10, -1
				; LMULMAX8-RV32-NEXT: vsetivli zero, 4, e64, m2, ta, mu
				; LMULMAX8-RV32-NEXT: vxor.vv v8, v8, v10
				; LMULMAX8-RV32-NEXT: vsrl.vi v10, v8, 1
				; LMULMAX8-RV32-NEXT: lui a1, 349525
				; LMULMAX8-RV32-NEXT: addi a1, a1, 1365
				; LMULMAX8-RV32-NEXT: vsetivli zero, 8, e32, m2, ta, mu
				; LMULMAX8-RV32-NEXT: vmv.v.x v12, a1
				; LMULMAX8-RV32-NEXT: vsetivli zero, 4, e64, m2, ta, mu
				; LMULMAX8-RV32-NEXT: vand.vv v10, v10, v12
				; LMULMAX8-RV32-NEXT: vsub.vv v8, v8, v10
				; LMULMAX8-RV32-NEXT: lui a1, 209715
				; LMULMAX8-RV32-NEXT: addi a1, a1, 819
				; LMULMAX8-RV32-NEXT: vsetivli zero, 8, e32, m2, ta, mu
				; LMULMAX8-RV32-NEXT: vmv.v.x v10, a1
				; LMULMAX8-RV32-NEXT: vsetivli zero, 4, e64, m2, ta, mu
				; LMULMAX8-RV32-NEXT: vand.vv v12, v8, v10
				; LMULMAX8-RV32-NEXT: vsrl.vi v8, v8, 2
				; LMULMAX8-RV32-NEXT: vand.vv v8, v8, v10
				; LMULMAX8-RV32-NEXT: vadd.vv v8, v12, v8
				; LMULMAX8-RV32-NEXT: vsrl.vi v10, v8, 4
				; LMULMAX8-RV32-NEXT: vadd.vv v8, v8, v10
				; LMULMAX8-RV32-NEXT: lui a1, 61681
				; LMULMAX8-RV32-NEXT: addi a1, a1, -241
				; LMULMAX8-RV32-NEXT: vsetivli zero, 8, e32, m2, ta, mu
				; LMULMAX8-RV32-NEXT: vmv.v.x v10, a1
				; LMULMAX8-RV32-NEXT: vsetivli zero, 4, e64, m2, ta, mu
				; LMULMAX8-RV32-NEXT: vand.vv v8, v8, v10
				; LMULMAX8-RV32-NEXT: lui a1, 4112
				; LMULMAX8-RV32-NEXT: addi a1, a1, 257
				; LMULMAX8-RV32-NEXT: vsetivli zero, 8, e32, m2, ta, mu
				; LMULMAX8-RV32-NEXT: vmv.v.x v10, a1
				; LMULMAX8-RV32-NEXT: vsetivli zero, 4, e64, m2, ta, mu
				; LMULMAX8-RV32-NEXT: vmul.vv v8, v8, v10
				; LMULMAX8-RV32-NEXT: addi a1, zero, 56
				; LMULMAX8-RV32-NEXT: vsrl.vx v8, v8, a1
				; LMULMAX8-RV32-NEXT: vse64.v v8, (a0)
				; LMULMAX8-RV32-NEXT: ret
				;
				; LMULMAX8-RV64-LABEL: ctlz_v4i64:
				; LMULMAX8-RV64: # %bb.0:
				; LMULMAX8-RV64-NEXT: vsetivli zero, 4, e64, m2, ta, mu
				; LMULMAX8-RV64-NEXT: vle64.v v8, (a0)
				; LMULMAX8-RV64-NEXT: vsrl.vi v10, v8, 1
				; LMULMAX8-RV64-NEXT: vor.vv v8, v8, v10
				; LMULMAX8-RV64-NEXT: vsrl.vi v10, v8, 2
				; LMULMAX8-RV64-NEXT: vor.vv v8, v8, v10
				; LMULMAX8-RV64-NEXT: vsrl.vi v10, v8, 4
				; LMULMAX8-RV64-NEXT: vor.vv v8, v8, v10
				; LMULMAX8-RV64-NEXT: vsrl.vi v10, v8, 8
				; LMULMAX8-RV64-NEXT: vor.vv v8, v8, v10
				; LMULMAX8-RV64-NEXT: vsrl.vi v10, v8, 16
				; LMULMAX8-RV64-NEXT: vor.vv v8, v8, v10
				; LMULMAX8-RV64-NEXT: addi a1, zero, 32
				; LMULMAX8-RV64-NEXT: vsrl.vx v10, v8, a1
				; LMULMAX8-RV64-NEXT: vor.vv v8, v8, v10
				; LMULMAX8-RV64-NEXT: vxor.vi v8, v8, -1
				; LMULMAX8-RV64-NEXT: vsrl.vi v10, v8, 1
				; LMULMAX8-RV64-NEXT: lui a1, 21845
				; LMULMAX8-RV64-NEXT: addiw a1, a1, 1365
				; LMULMAX8-RV64-NEXT: slli a1, a1, 12
				; LMULMAX8-RV64-NEXT: addi a1, a1, 1365
				; LMULMAX8-RV64-NEXT: slli a1, a1, 12
				; LMULMAX8-RV64-NEXT: addi a1, a1, 1365
				; LMULMAX8-RV64-NEXT: slli a1, a1, 12
				; LMULMAX8-RV64-NEXT: addi a1, a1, 1365
				; LMULMAX8-RV64-NEXT: vand.vx v10, v10, a1
				; LMULMAX8-RV64-NEXT: vsub.vv v8, v8, v10
				; LMULMAX8-RV64-NEXT: lui a1, 13107
				; LMULMAX8-RV64-NEXT: addiw a1, a1, 819
				; LMULMAX8-RV64-NEXT: slli a1, a1, 12
				; LMULMAX8-RV64-NEXT: addi a1, a1, 819
				; LMULMAX8-RV64-NEXT: slli a1, a1, 12
				; LMULMAX8-RV64-NEXT: addi a1, a1, 819
				; LMULMAX8-RV64-NEXT: slli a1, a1, 12
				; LMULMAX8-RV64-NEXT: addi a1, a1, 819
				; LMULMAX8-RV64-NEXT: vand.vx v10, v8, a1
				; LMULMAX8-RV64-NEXT: vsrl.vi v8, v8, 2
				; LMULMAX8-RV64-NEXT: vand.vx v8, v8, a1
				; LMULMAX8-RV64-NEXT: vadd.vv v8, v10, v8
				; LMULMAX8-RV64-NEXT: vsrl.vi v10, v8, 4
				; LMULMAX8-RV64-NEXT: vadd.vv v8, v8, v10
				; LMULMAX8-RV64-NEXT: lui a1, 3855
				; LMULMAX8-RV64-NEXT: addiw a1, a1, 241
				; LMULMAX8-RV64-NEXT: slli a1, a1, 12
				; LMULMAX8-RV64-NEXT: addi a1, a1, -241
				; LMULMAX8-RV64-NEXT: slli a1, a1, 12
				; LMULMAX8-RV64-NEXT: addi a1, a1, 241
				; LMULMAX8-RV64-NEXT: slli a1, a1, 12
				; LMULMAX8-RV64-NEXT: addi a1, a1, -241
				; LMULMAX8-RV64-NEXT: vand.vx v8, v8, a1
				; LMULMAX8-RV64-NEXT: lui a1, 4112
				; LMULMAX8-RV64-NEXT: addiw a1, a1, 257
				; LMULMAX8-RV64-NEXT: slli a1, a1, 16
				; LMULMAX8-RV64-NEXT: addi a1, a1, 257
				; LMULMAX8-RV64-NEXT: slli a1, a1, 16
				; LMULMAX8-RV64-NEXT: addi a1, a1, 257
				; LMULMAX8-RV64-NEXT: vmul.vx v8, v8, a1
				; LMULMAX8-RV64-NEXT: addi a1, zero, 56
				; LMULMAX8-RV64-NEXT: vsrl.vx v8, v8, a1
				; LMULMAX8-RV64-NEXT: vse64.v v8, (a0)
				; LMULMAX8-RV64-NEXT: ret
	%a = load <4 x i64>, <4 x i64>* %x			%a = load <4 x i64>, <4 x i64>* %x
	%b = load <4 x i64>, <4 x i64>* %y			%b = load <4 x i64>, <4 x i64>* %y
	%c = call <4 x i64> @llvm.ctlz.v4i64(<4 x i64> %a, i1 false)			%c = call <4 x i64> @llvm.ctlz.v4i64(<4 x i64> %a, i1 false)
	store <4 x i64> %c, <4 x i64>* %x			store <4 x i64> %c, <4 x i64>* %x
	ret void			ret void
	}			}
	declare <4 x i64> @llvm.ctlz.v4i64(<4 x i64>, i1)			declare <4 x i64> @llvm.ctlz.v4i64(<4 x i64>, i1)

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-cttz.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc -mtriple=riscv32 -mattr=+m,+experimental-v -riscv-v-vector-bits-min=128 -riscv-v-fixed-length-vector-lmul-max=2 -verify-machineinstrs < %s \| FileCheck %s --check-prefixes=LMULMAX2-RV32			; RUN: llc -mtriple=riscv32 -mattr=+m,+experimental-v -riscv-v-vector-bits-min=128 -riscv-v-fixed-length-vector-lmul-max=2 -verify-machineinstrs < %s \| FileCheck %s --check-prefixes=LMULMAX2-RV32,LMULMAX2-RV32I
	; RUN: llc -mtriple=riscv64 -mattr=+m,+experimental-v -riscv-v-vector-bits-min=128 -riscv-v-fixed-length-vector-lmul-max=2 -verify-machineinstrs < %s \| FileCheck %s --check-prefixes=LMULMAX2-RV64			; RUN: llc -mtriple=riscv64 -mattr=+m,+experimental-v -riscv-v-vector-bits-min=128 -riscv-v-fixed-length-vector-lmul-max=2 -verify-machineinstrs < %s \| FileCheck %s --check-prefixes=LMULMAX2-RV64,LMULMAX2-RV64I
	; RUN: llc -mtriple=riscv32 -mattr=+m,+experimental-v -riscv-v-vector-bits-min=128 -riscv-v-fixed-length-vector-lmul-max=1 -verify-machineinstrs < %s \| FileCheck %s --check-prefixes=LMULMAX1-RV32			; RUN: llc -mtriple=riscv32 -mattr=+m,+experimental-v -riscv-v-vector-bits-min=128 -riscv-v-fixed-length-vector-lmul-max=1 -verify-machineinstrs < %s \| FileCheck %s --check-prefixes=LMULMAX1-RV32,LMULMAX1-RV32I
	; RUN: llc -mtriple=riscv64 -mattr=+m,+experimental-v -riscv-v-vector-bits-min=128 -riscv-v-fixed-length-vector-lmul-max=1 -verify-machineinstrs < %s \| FileCheck %s --check-prefixes=LMULMAX1-RV64			; RUN: llc -mtriple=riscv64 -mattr=+m,+experimental-v -riscv-v-vector-bits-min=128 -riscv-v-fixed-length-vector-lmul-max=1 -verify-machineinstrs < %s \| FileCheck %s --check-prefixes=LMULMAX1-RV64,LMULMAX1-RV32I
				; RUN: llc -mtriple=riscv32 -mattr=+m,+experimental-v,+d -riscv-v-vector-bits-min=128 -riscv-v-fixed-length-vector-lmul-max=2 -verify-machineinstrs < %s \| FileCheck %s --check-prefixes=LMULMAX2-RV32,LMULMAX2-RV32D
				; RUN: llc -mtriple=riscv64 -mattr=+m,+experimental-v,+d -riscv-v-vector-bits-min=128 -riscv-v-fixed-length-vector-lmul-max=2 -verify-machineinstrs < %s \| FileCheck %s --check-prefixes=LMULMAX2-RV64,LMULMAX2-RV64D
				; RUN: llc -mtriple=riscv32 -mattr=+m,+experimental-v,+d -riscv-v-vector-bits-min=128 -riscv-v-fixed-length-vector-lmul-max=1 -verify-machineinstrs < %s \| FileCheck %s --check-prefixes=LMULMAX1-RV32,LMULMAX1-RV32D
				; RUN: llc -mtriple=riscv64 -mattr=+m,+experimental-v,+d -riscv-v-vector-bits-min=128 -riscv-v-fixed-length-vector-lmul-max=1 -verify-machineinstrs < %s \| FileCheck %s --check-prefixes=LMULMAX1-RV64,LMULMAX1-RV64D
				; RUN: llc -mtriple=riscv32 -mattr=+m,+experimental-v,+d -riscv-v-vector-bits-min=128 -riscv-v-fixed-length-vector-lmul-max=8 -verify-machineinstrs < %s \| FileCheck %s --check-prefixes=LMULMAX8-RV32
				; RUN: llc -mtriple=riscv64 -mattr=+m,+experimental-v,+d -riscv-v-vector-bits-min=128 -riscv-v-fixed-length-vector-lmul-max=8 -verify-machineinstrs < %s \| FileCheck %s --check-prefixes=LMULMAX8-RV64

	define void @cttz_v16i8(<16 x i8>* %x, <16 x i8>* %y) nounwind {			define void @cttz_v16i8(<16 x i8>* %x, <16 x i8>* %y) nounwind {
	; LMULMAX2-RV32-LABEL: cttz_v16i8:			; LMULMAX2-RV32I-LABEL: cttz_v16i8:
	; LMULMAX2-RV32: # %bb.0:			; LMULMAX2-RV32I: # %bb.0:
	; LMULMAX2-RV32-NEXT: vsetivli zero, 16, e8, m1, ta, mu			; LMULMAX2-RV32I-NEXT: vsetivli zero, 16, e8, m1, ta, mu
	; LMULMAX2-RV32-NEXT: vle8.v v8, (a0)			; LMULMAX2-RV32I-NEXT: vle8.v v8, (a0)
	; LMULMAX2-RV32-NEXT: addi a1, zero, 1			; LMULMAX2-RV32I-NEXT: addi a1, zero, 1
	; LMULMAX2-RV32-NEXT: vsub.vx v9, v8, a1			; LMULMAX2-RV32I-NEXT: vsub.vx v9, v8, a1
	; LMULMAX2-RV32-NEXT: vxor.vi v8, v8, -1			; LMULMAX2-RV32I-NEXT: vxor.vi v8, v8, -1
	; LMULMAX2-RV32-NEXT: vand.vv v8, v8, v9			; LMULMAX2-RV32I-NEXT: vand.vv v8, v8, v9
	; LMULMAX2-RV32-NEXT: vsrl.vi v9, v8, 1			; LMULMAX2-RV32I-NEXT: vsrl.vi v9, v8, 1
	; LMULMAX2-RV32-NEXT: addi a1, zero, 85			; LMULMAX2-RV32I-NEXT: addi a1, zero, 85
	; LMULMAX2-RV32-NEXT: vand.vx v9, v9, a1			; LMULMAX2-RV32I-NEXT: vand.vx v9, v9, a1
	; LMULMAX2-RV32-NEXT: vsub.vv v8, v8, v9			; LMULMAX2-RV32I-NEXT: vsub.vv v8, v8, v9
	; LMULMAX2-RV32-NEXT: addi a1, zero, 51			; LMULMAX2-RV32I-NEXT: addi a1, zero, 51
	; LMULMAX2-RV32-NEXT: vand.vx v9, v8, a1			; LMULMAX2-RV32I-NEXT: vand.vx v9, v8, a1
	; LMULMAX2-RV32-NEXT: vsrl.vi v8, v8, 2			; LMULMAX2-RV32I-NEXT: vsrl.vi v8, v8, 2
	; LMULMAX2-RV32-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV32I-NEXT: vand.vx v8, v8, a1
	; LMULMAX2-RV32-NEXT: vadd.vv v8, v9, v8			; LMULMAX2-RV32I-NEXT: vadd.vv v8, v9, v8
	; LMULMAX2-RV32-NEXT: vsrl.vi v9, v8, 4			; LMULMAX2-RV32I-NEXT: vsrl.vi v9, v8, 4
	; LMULMAX2-RV32-NEXT: vadd.vv v8, v8, v9			; LMULMAX2-RV32I-NEXT: vadd.vv v8, v8, v9
	; LMULMAX2-RV32-NEXT: vand.vi v8, v8, 15			; LMULMAX2-RV32I-NEXT: vand.vi v8, v8, 15
	; LMULMAX2-RV32-NEXT: vse8.v v8, (a0)			; LMULMAX2-RV32I-NEXT: vse8.v v8, (a0)
	; LMULMAX2-RV32-NEXT: ret			; LMULMAX2-RV32I-NEXT: ret
	;			;
	; LMULMAX2-RV64-LABEL: cttz_v16i8:			; LMULMAX2-RV64I-LABEL: cttz_v16i8:
	; LMULMAX2-RV64: # %bb.0:			; LMULMAX2-RV64I: # %bb.0:
	; LMULMAX2-RV64-NEXT: vsetivli zero, 16, e8, m1, ta, mu			; LMULMAX2-RV64I-NEXT: vsetivli zero, 16, e8, m1, ta, mu
	; LMULMAX2-RV64-NEXT: vle8.v v8, (a0)			; LMULMAX2-RV64I-NEXT: vle8.v v8, (a0)
	; LMULMAX2-RV64-NEXT: addi a1, zero, 1			; LMULMAX2-RV64I-NEXT: addi a1, zero, 1
	; LMULMAX2-RV64-NEXT: vsub.vx v9, v8, a1			; LMULMAX2-RV64I-NEXT: vsub.vx v9, v8, a1
	; LMULMAX2-RV64-NEXT: vxor.vi v8, v8, -1			; LMULMAX2-RV64I-NEXT: vxor.vi v8, v8, -1
	; LMULMAX2-RV64-NEXT: vand.vv v8, v8, v9			; LMULMAX2-RV64I-NEXT: vand.vv v8, v8, v9
	; LMULMAX2-RV64-NEXT: vsrl.vi v9, v8, 1			; LMULMAX2-RV64I-NEXT: vsrl.vi v9, v8, 1
	; LMULMAX2-RV64-NEXT: addi a1, zero, 85			; LMULMAX2-RV64I-NEXT: addi a1, zero, 85
	; LMULMAX2-RV64-NEXT: vand.vx v9, v9, a1			; LMULMAX2-RV64I-NEXT: vand.vx v9, v9, a1
	; LMULMAX2-RV64-NEXT: vsub.vv v8, v8, v9			; LMULMAX2-RV64I-NEXT: vsub.vv v8, v8, v9
	; LMULMAX2-RV64-NEXT: addi a1, zero, 51			; LMULMAX2-RV64I-NEXT: addi a1, zero, 51
	; LMULMAX2-RV64-NEXT: vand.vx v9, v8, a1			; LMULMAX2-RV64I-NEXT: vand.vx v9, v8, a1
	; LMULMAX2-RV64-NEXT: vsrl.vi v8, v8, 2			; LMULMAX2-RV64I-NEXT: vsrl.vi v8, v8, 2
	; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV64I-NEXT: vand.vx v8, v8, a1
	; LMULMAX2-RV64-NEXT: vadd.vv v8, v9, v8			; LMULMAX2-RV64I-NEXT: vadd.vv v8, v9, v8
	; LMULMAX2-RV64-NEXT: vsrl.vi v9, v8, 4			; LMULMAX2-RV64I-NEXT: vsrl.vi v9, v8, 4
	; LMULMAX2-RV64-NEXT: vadd.vv v8, v8, v9			; LMULMAX2-RV64I-NEXT: vadd.vv v8, v8, v9
	; LMULMAX2-RV64-NEXT: vand.vi v8, v8, 15			; LMULMAX2-RV64I-NEXT: vand.vi v8, v8, 15
	; LMULMAX2-RV64-NEXT: vse8.v v8, (a0)			; LMULMAX2-RV64I-NEXT: vse8.v v8, (a0)
	; LMULMAX2-RV64-NEXT: ret			; LMULMAX2-RV64I-NEXT: ret
	;			;
	; LMULMAX1-RV32-LABEL: cttz_v16i8:			; LMULMAX1-RV32I-LABEL: cttz_v16i8:
	; LMULMAX1-RV32: # %bb.0:			; LMULMAX1-RV32I: # %bb.0:
	; LMULMAX1-RV32-NEXT: vsetivli zero, 16, e8, m1, ta, mu			; LMULMAX1-RV32I-NEXT: vsetivli zero, 16, e8, m1, ta, mu
	; LMULMAX1-RV32-NEXT: vle8.v v8, (a0)			; LMULMAX1-RV32I-NEXT: vle8.v v8, (a0)
	; LMULMAX1-RV32-NEXT: addi a1, zero, 1			; LMULMAX1-RV32I-NEXT: addi a1, zero, 1
	; LMULMAX1-RV32-NEXT: vsub.vx v9, v8, a1			; LMULMAX1-RV32I-NEXT: vsub.vx v9, v8, a1
	; LMULMAX1-RV32-NEXT: vxor.vi v8, v8, -1			; LMULMAX1-RV32I-NEXT: vxor.vi v8, v8, -1
	; LMULMAX1-RV32-NEXT: vand.vv v8, v8, v9			; LMULMAX1-RV32I-NEXT: vand.vv v8, v8, v9
	; LMULMAX1-RV32-NEXT: vsrl.vi v9, v8, 1			; LMULMAX1-RV32I-NEXT: vsrl.vi v9, v8, 1
	; LMULMAX1-RV32-NEXT: addi a1, zero, 85			; LMULMAX1-RV32I-NEXT: addi a1, zero, 85
	; LMULMAX1-RV32-NEXT: vand.vx v9, v9, a1			; LMULMAX1-RV32I-NEXT: vand.vx v9, v9, a1
	; LMULMAX1-RV32-NEXT: vsub.vv v8, v8, v9			; LMULMAX1-RV32I-NEXT: vsub.vv v8, v8, v9
	; LMULMAX1-RV32-NEXT: addi a1, zero, 51			; LMULMAX1-RV32I-NEXT: addi a1, zero, 51
	; LMULMAX1-RV32-NEXT: vand.vx v9, v8, a1			; LMULMAX1-RV32I-NEXT: vand.vx v9, v8, a1
	; LMULMAX1-RV32-NEXT: vsrl.vi v8, v8, 2			; LMULMAX1-RV32I-NEXT: vsrl.vi v8, v8, 2
	; LMULMAX1-RV32-NEXT: vand.vx v8, v8, a1			; LMULMAX1-RV32I-NEXT: vand.vx v8, v8, a1
	; LMULMAX1-RV32-NEXT: vadd.vv v8, v9, v8			; LMULMAX1-RV32I-NEXT: vadd.vv v8, v9, v8
	; LMULMAX1-RV32-NEXT: vsrl.vi v9, v8, 4			; LMULMAX1-RV32I-NEXT: vsrl.vi v9, v8, 4
	; LMULMAX1-RV32-NEXT: vadd.vv v8, v8, v9			; LMULMAX1-RV32I-NEXT: vadd.vv v8, v8, v9
	; LMULMAX1-RV32-NEXT: vand.vi v8, v8, 15			; LMULMAX1-RV32I-NEXT: vand.vi v8, v8, 15
	; LMULMAX1-RV32-NEXT: vse8.v v8, (a0)			; LMULMAX1-RV32I-NEXT: vse8.v v8, (a0)
	; LMULMAX1-RV32-NEXT: ret			; LMULMAX1-RV32I-NEXT: ret
	;			;
	; LMULMAX1-RV64-LABEL: cttz_v16i8:			; LMULMAX2-RV32D-LABEL: cttz_v16i8:
	; LMULMAX1-RV64: # %bb.0:			; LMULMAX2-RV32D: # %bb.0:
	; LMULMAX1-RV64-NEXT: vsetivli zero, 16, e8, m1, ta, mu			; LMULMAX2-RV32D-NEXT: vsetivli zero, 16, e8, m1, ta, mu
	; LMULMAX1-RV64-NEXT: vle8.v v8, (a0)			; LMULMAX2-RV32D-NEXT: vle8.v v8, (a0)
	; LMULMAX1-RV64-NEXT: addi a1, zero, 1			; LMULMAX2-RV32D-NEXT: vsetivli zero, 8, e8, m1, ta, mu
	; LMULMAX1-RV64-NEXT: vsub.vx v9, v8, a1			; LMULMAX2-RV32D-NEXT: vslidedown.vi v9, v8, 8
	; LMULMAX1-RV64-NEXT: vxor.vi v8, v8, -1			; LMULMAX2-RV32D-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
	; LMULMAX1-RV64-NEXT: vand.vv v8, v8, v9			; LMULMAX2-RV32D-NEXT: vrsub.vi v10, v9, 0
	; LMULMAX1-RV64-NEXT: vsrl.vi v9, v8, 1			; LMULMAX2-RV32D-NEXT: vand.vv v9, v9, v10
	; LMULMAX1-RV64-NEXT: addi a1, zero, 85			; LMULMAX2-RV32D-NEXT: vsetvli zero, zero, e32, m2, ta, mu
	; LMULMAX1-RV64-NEXT: vand.vx v9, v9, a1			; LMULMAX2-RV32D-NEXT: vzext.vf4 v10, v9
	; LMULMAX1-RV64-NEXT: vsub.vv v8, v8, v9			; LMULMAX2-RV32D-NEXT: vfcvt.f.xu.v v10, v10
	; LMULMAX1-RV64-NEXT: addi a1, zero, 51			; LMULMAX2-RV32D-NEXT: vsetvli zero, zero, e16, m1, ta, mu
	; LMULMAX1-RV64-NEXT: vand.vx v9, v8, a1			; LMULMAX2-RV32D-NEXT: vnsrl.wi v9, v10, 23
	; LMULMAX1-RV64-NEXT: vsrl.vi v8, v8, 2			; LMULMAX2-RV32D-NEXT: vsetvli zero, zero, e8, mf2, ta, mu
	; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV32D-NEXT: vnsrl.wi v9, v9, 0
	; LMULMAX1-RV64-NEXT: vadd.vv v8, v9, v8			; LMULMAX2-RV32D-NEXT: addi a1, zero, 127
	; LMULMAX1-RV64-NEXT: vsrl.vi v9, v8, 4			; LMULMAX2-RV32D-NEXT: vsub.vx v9, v9, a1
	; LMULMAX1-RV64-NEXT: vadd.vv v8, v8, v9			; LMULMAX2-RV32D-NEXT: vrsub.vi v10, v8, 0
	; LMULMAX1-RV64-NEXT: vand.vi v8, v8, 15			; LMULMAX2-RV32D-NEXT: vand.vv v10, v8, v10
	; LMULMAX1-RV64-NEXT: vse8.v v8, (a0)			; LMULMAX2-RV32D-NEXT: vsetvli zero, zero, e32, m2, ta, mu
	; LMULMAX1-RV64-NEXT: ret			; LMULMAX2-RV32D-NEXT: vzext.vf4 v12, v10
				; LMULMAX2-RV32D-NEXT: vfcvt.f.xu.v v10, v12
				; LMULMAX2-RV32D-NEXT: vsetvli zero, zero, e16, m1, ta, mu
				; LMULMAX2-RV32D-NEXT: vnsrl.wi v12, v10, 23
				; LMULMAX2-RV32D-NEXT: vsetvli zero, zero, e8, mf2, ta, mu
				; LMULMAX2-RV32D-NEXT: vnsrl.wi v10, v12, 0
				; LMULMAX2-RV32D-NEXT: vsub.vx v10, v10, a1
				; LMULMAX2-RV32D-NEXT: vsetivli zero, 16, e8, m1, ta, mu
				; LMULMAX2-RV32D-NEXT: vmv.v.i v11, 0
				; LMULMAX2-RV32D-NEXT: vsetivli zero, 8, e8, m1, tu, mu
				; LMULMAX2-RV32D-NEXT: vslideup.vi v11, v10, 0
				; LMULMAX2-RV32D-NEXT: vsetivli zero, 16, e8, m1, tu, mu
				; LMULMAX2-RV32D-NEXT: vslideup.vi v11, v9, 8
				; LMULMAX2-RV32D-NEXT: vsetvli zero, zero, e8, m1, ta, mu
				; LMULMAX2-RV32D-NEXT: vmseq.vi v0, v8, 0
				; LMULMAX2-RV32D-NEXT: vmerge.vim v8, v11, 8, v0
				; LMULMAX2-RV32D-NEXT: vse8.v v8, (a0)
				; LMULMAX2-RV32D-NEXT: ret
				;
				; LMULMAX2-RV64D-LABEL: cttz_v16i8:
				; LMULMAX2-RV64D: # %bb.0:
				; LMULMAX2-RV64D-NEXT: vsetivli zero, 16, e8, m1, ta, mu
				; LMULMAX2-RV64D-NEXT: vle8.v v8, (a0)
				; LMULMAX2-RV64D-NEXT: vsetivli zero, 8, e8, m1, ta, mu
				; LMULMAX2-RV64D-NEXT: vslidedown.vi v9, v8, 8
				; LMULMAX2-RV64D-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
				; LMULMAX2-RV64D-NEXT: vrsub.vi v10, v9, 0
				; LMULMAX2-RV64D-NEXT: vand.vv v9, v9, v10
				; LMULMAX2-RV64D-NEXT: vsetvli zero, zero, e32, m2, ta, mu
				; LMULMAX2-RV64D-NEXT: vzext.vf4 v10, v9
				; LMULMAX2-RV64D-NEXT: vfcvt.f.xu.v v10, v10
				; LMULMAX2-RV64D-NEXT: vsetvli zero, zero, e16, m1, ta, mu
				; LMULMAX2-RV64D-NEXT: vnsrl.wi v9, v10, 23
				; LMULMAX2-RV64D-NEXT: vsetvli zero, zero, e8, mf2, ta, mu
				; LMULMAX2-RV64D-NEXT: vnsrl.wi v9, v9, 0
				; LMULMAX2-RV64D-NEXT: addi a1, zero, 127
				; LMULMAX2-RV64D-NEXT: vsub.vx v9, v9, a1
				; LMULMAX2-RV64D-NEXT: vrsub.vi v10, v8, 0
				; LMULMAX2-RV64D-NEXT: vand.vv v10, v8, v10
				; LMULMAX2-RV64D-NEXT: vsetvli zero, zero, e32, m2, ta, mu
				; LMULMAX2-RV64D-NEXT: vzext.vf4 v12, v10
				; LMULMAX2-RV64D-NEXT: vfcvt.f.xu.v v10, v12
				; LMULMAX2-RV64D-NEXT: vsetvli zero, zero, e16, m1, ta, mu
				; LMULMAX2-RV64D-NEXT: vnsrl.wi v12, v10, 23
				; LMULMAX2-RV64D-NEXT: vsetvli zero, zero, e8, mf2, ta, mu
				; LMULMAX2-RV64D-NEXT: vnsrl.wi v10, v12, 0
				; LMULMAX2-RV64D-NEXT: vsub.vx v10, v10, a1
				; LMULMAX2-RV64D-NEXT: vsetivli zero, 16, e8, m1, ta, mu
				; LMULMAX2-RV64D-NEXT: vmv.v.i v11, 0
				; LMULMAX2-RV64D-NEXT: vsetivli zero, 8, e8, m1, tu, mu
				; LMULMAX2-RV64D-NEXT: vslideup.vi v11, v10, 0
				; LMULMAX2-RV64D-NEXT: vsetivli zero, 16, e8, m1, tu, mu
				; LMULMAX2-RV64D-NEXT: vslideup.vi v11, v9, 8
				; LMULMAX2-RV64D-NEXT: vsetvli zero, zero, e8, m1, ta, mu
				; LMULMAX2-RV64D-NEXT: vmseq.vi v0, v8, 0
				; LMULMAX2-RV64D-NEXT: vmerge.vim v8, v11, 8, v0
				; LMULMAX2-RV64D-NEXT: vse8.v v8, (a0)
				; LMULMAX2-RV64D-NEXT: ret
				;
				; LMULMAX1-RV32D-LABEL: cttz_v16i8:
				; LMULMAX1-RV32D: # %bb.0:
				; LMULMAX1-RV32D-NEXT: vsetivli zero, 16, e8, m1, ta, mu
				; LMULMAX1-RV32D-NEXT: vle8.v v8, (a0)
				; LMULMAX1-RV32D-NEXT: vsetivli zero, 8, e8, m1, ta, mu
				; LMULMAX1-RV32D-NEXT: vslidedown.vi v9, v8, 8
				; LMULMAX1-RV32D-NEXT: vsetivli zero, 4, e8, mf4, ta, mu
				; LMULMAX1-RV32D-NEXT: vrsub.vi v10, v9, 0
				; LMULMAX1-RV32D-NEXT: vand.vv v10, v9, v10
				; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e32, m1, ta, mu
				; LMULMAX1-RV32D-NEXT: vzext.vf4 v11, v10
				; LMULMAX1-RV32D-NEXT: vfcvt.f.xu.v v10, v11
				; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e16, mf2, ta, mu
				; LMULMAX1-RV32D-NEXT: vnsrl.wi v10, v10, 23
				; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
				; LMULMAX1-RV32D-NEXT: vnsrl.wi v10, v10, 0
				; LMULMAX1-RV32D-NEXT: addi a1, zero, 127
				; LMULMAX1-RV32D-NEXT: vsub.vx v10, v10, a1
				; LMULMAX1-RV32D-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
				; LMULMAX1-RV32D-NEXT: vmv.v.i v11, 0
				; LMULMAX1-RV32D-NEXT: vsetivli zero, 4, e8, mf2, tu, mu
				; LMULMAX1-RV32D-NEXT: vmv1r.v v12, v11
				; LMULMAX1-RV32D-NEXT: vslideup.vi v12, v10, 0
				; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e8, mf2, ta, mu
				; LMULMAX1-RV32D-NEXT: vslidedown.vi v9, v9, 4
				; LMULMAX1-RV32D-NEXT: vsetivli zero, 4, e8, mf4, ta, mu
				; LMULMAX1-RV32D-NEXT: vrsub.vi v10, v9, 0
				; LMULMAX1-RV32D-NEXT: vand.vv v9, v9, v10
				; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e32, m1, ta, mu
				; LMULMAX1-RV32D-NEXT: vzext.vf4 v10, v9
				; LMULMAX1-RV32D-NEXT: vfcvt.f.xu.v v9, v10
				; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e16, mf2, ta, mu
				; LMULMAX1-RV32D-NEXT: vnsrl.wi v9, v9, 23
				; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
				; LMULMAX1-RV32D-NEXT: vnsrl.wi v9, v9, 0
				; LMULMAX1-RV32D-NEXT: vsub.vx v9, v9, a1
				; LMULMAX1-RV32D-NEXT: vsetivli zero, 8, e8, mf2, tu, mu
				; LMULMAX1-RV32D-NEXT: vslideup.vi v12, v9, 4
				; LMULMAX1-RV32D-NEXT: vsetivli zero, 4, e8, mf2, ta, mu
				; LMULMAX1-RV32D-NEXT: vslidedown.vi v9, v8, 4
				; LMULMAX1-RV32D-NEXT: vsetivli zero, 4, e8, mf4, ta, mu
				; LMULMAX1-RV32D-NEXT: vrsub.vi v10, v9, 0
				; LMULMAX1-RV32D-NEXT: vand.vv v9, v9, v10
				; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e32, m1, ta, mu
				; LMULMAX1-RV32D-NEXT: vzext.vf4 v10, v9
				; LMULMAX1-RV32D-NEXT: vfcvt.f.xu.v v9, v10
				; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e16, mf2, ta, mu
				; LMULMAX1-RV32D-NEXT: vnsrl.wi v9, v9, 23
				; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
				; LMULMAX1-RV32D-NEXT: vnsrl.wi v9, v9, 0
				; LMULMAX1-RV32D-NEXT: vsub.vx v9, v9, a1
				; LMULMAX1-RV32D-NEXT: vrsub.vi v10, v8, 0
				; LMULMAX1-RV32D-NEXT: vand.vv v10, v8, v10
				; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e32, m1, ta, mu
				; LMULMAX1-RV32D-NEXT: vzext.vf4 v13, v10
				; LMULMAX1-RV32D-NEXT: vfcvt.f.xu.v v10, v13
				; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e16, mf2, ta, mu
				; LMULMAX1-RV32D-NEXT: vnsrl.wi v10, v10, 23
				; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
				; LMULMAX1-RV32D-NEXT: vnsrl.wi v10, v10, 0
				; LMULMAX1-RV32D-NEXT: vsub.vx v10, v10, a1
				; LMULMAX1-RV32D-NEXT: vsetivli zero, 4, e8, mf2, tu, mu
				; LMULMAX1-RV32D-NEXT: vslideup.vi v11, v10, 0
				; LMULMAX1-RV32D-NEXT: vsetivli zero, 8, e8, mf2, tu, mu
				; LMULMAX1-RV32D-NEXT: vslideup.vi v11, v9, 4
				; LMULMAX1-RV32D-NEXT: vsetivli zero, 16, e8, m1, ta, mu
				; LMULMAX1-RV32D-NEXT: vmv.v.i v9, 0
				; LMULMAX1-RV32D-NEXT: vsetivli zero, 8, e8, m1, tu, mu
				; LMULMAX1-RV32D-NEXT: vslideup.vi v9, v11, 0
				; LMULMAX1-RV32D-NEXT: vsetivli zero, 16, e8, m1, tu, mu
				; LMULMAX1-RV32D-NEXT: vslideup.vi v9, v12, 8
				; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e8, m1, ta, mu
				; LMULMAX1-RV32D-NEXT: vmseq.vi v0, v8, 0
				; LMULMAX1-RV32D-NEXT: vmerge.vim v8, v9, 8, v0
				; LMULMAX1-RV32D-NEXT: vse8.v v8, (a0)
				; LMULMAX1-RV32D-NEXT: ret
				;
				; LMULMAX1-RV64D-LABEL: cttz_v16i8:
				; LMULMAX1-RV64D: # %bb.0:
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 16, e8, m1, ta, mu
				; LMULMAX1-RV64D-NEXT: vle8.v v8, (a0)
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 8, e8, m1, ta, mu
				; LMULMAX1-RV64D-NEXT: vslidedown.vi v9, v8, 8
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 4, e8, mf4, ta, mu
				; LMULMAX1-RV64D-NEXT: vrsub.vi v10, v9, 0
				; LMULMAX1-RV64D-NEXT: vand.vv v10, v9, v10
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e32, m1, ta, mu
				; LMULMAX1-RV64D-NEXT: vzext.vf4 v11, v10
				; LMULMAX1-RV64D-NEXT: vfcvt.f.xu.v v10, v11
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e16, mf2, ta, mu
				; LMULMAX1-RV64D-NEXT: vnsrl.wi v10, v10, 23
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
				; LMULMAX1-RV64D-NEXT: vnsrl.wi v10, v10, 0
				; LMULMAX1-RV64D-NEXT: addi a1, zero, 127
				; LMULMAX1-RV64D-NEXT: vsub.vx v10, v10, a1
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
				; LMULMAX1-RV64D-NEXT: vmv.v.i v11, 0
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 4, e8, mf2, tu, mu
				; LMULMAX1-RV64D-NEXT: vmv1r.v v12, v11
				; LMULMAX1-RV64D-NEXT: vslideup.vi v12, v10, 0
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e8, mf2, ta, mu
				; LMULMAX1-RV64D-NEXT: vslidedown.vi v9, v9, 4
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 4, e8, mf4, ta, mu
				; LMULMAX1-RV64D-NEXT: vrsub.vi v10, v9, 0
				; LMULMAX1-RV64D-NEXT: vand.vv v9, v9, v10
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e32, m1, ta, mu
				; LMULMAX1-RV64D-NEXT: vzext.vf4 v10, v9
				; LMULMAX1-RV64D-NEXT: vfcvt.f.xu.v v9, v10
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e16, mf2, ta, mu
				; LMULMAX1-RV64D-NEXT: vnsrl.wi v9, v9, 23
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
				; LMULMAX1-RV64D-NEXT: vnsrl.wi v9, v9, 0
				; LMULMAX1-RV64D-NEXT: vsub.vx v9, v9, a1
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 8, e8, mf2, tu, mu
				; LMULMAX1-RV64D-NEXT: vslideup.vi v12, v9, 4
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 4, e8, mf2, ta, mu
				; LMULMAX1-RV64D-NEXT: vslidedown.vi v9, v8, 4
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 4, e8, mf4, ta, mu
				; LMULMAX1-RV64D-NEXT: vrsub.vi v10, v9, 0
				; LMULMAX1-RV64D-NEXT: vand.vv v9, v9, v10
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e32, m1, ta, mu
				; LMULMAX1-RV64D-NEXT: vzext.vf4 v10, v9
				; LMULMAX1-RV64D-NEXT: vfcvt.f.xu.v v9, v10
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e16, mf2, ta, mu
				; LMULMAX1-RV64D-NEXT: vnsrl.wi v9, v9, 23
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
				; LMULMAX1-RV64D-NEXT: vnsrl.wi v9, v9, 0
				; LMULMAX1-RV64D-NEXT: vsub.vx v9, v9, a1
				; LMULMAX1-RV64D-NEXT: vrsub.vi v10, v8, 0
				; LMULMAX1-RV64D-NEXT: vand.vv v10, v8, v10
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e32, m1, ta, mu
				; LMULMAX1-RV64D-NEXT: vzext.vf4 v13, v10
				; LMULMAX1-RV64D-NEXT: vfcvt.f.xu.v v10, v13
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e16, mf2, ta, mu
				; LMULMAX1-RV64D-NEXT: vnsrl.wi v10, v10, 23
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
				; LMULMAX1-RV64D-NEXT: vnsrl.wi v10, v10, 0
				; LMULMAX1-RV64D-NEXT: vsub.vx v10, v10, a1
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 4, e8, mf2, tu, mu
				; LMULMAX1-RV64D-NEXT: vslideup.vi v11, v10, 0
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 8, e8, mf2, tu, mu
				; LMULMAX1-RV64D-NEXT: vslideup.vi v11, v9, 4
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 16, e8, m1, ta, mu
				; LMULMAX1-RV64D-NEXT: vmv.v.i v9, 0
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 8, e8, m1, tu, mu
				; LMULMAX1-RV64D-NEXT: vslideup.vi v9, v11, 0
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 16, e8, m1, tu, mu
				; LMULMAX1-RV64D-NEXT: vslideup.vi v9, v12, 8
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e8, m1, ta, mu
				; LMULMAX1-RV64D-NEXT: vmseq.vi v0, v8, 0
				; LMULMAX1-RV64D-NEXT: vmerge.vim v8, v9, 8, v0
				; LMULMAX1-RV64D-NEXT: vse8.v v8, (a0)
				; LMULMAX1-RV64D-NEXT: ret
				;
				; LMULMAX8-RV32-LABEL: cttz_v16i8:
				; LMULMAX8-RV32: # %bb.0:
				; LMULMAX8-RV32-NEXT: vsetivli zero, 16, e8, m1, ta, mu
				; LMULMAX8-RV32-NEXT: vle8.v v8, (a0)
				; LMULMAX8-RV32-NEXT: vrsub.vi v9, v8, 0
				; LMULMAX8-RV32-NEXT: vand.vv v9, v8, v9
				; LMULMAX8-RV32-NEXT: vsetvli zero, zero, e32, m4, ta, mu
				; LMULMAX8-RV32-NEXT: vzext.vf4 v12, v9
				; LMULMAX8-RV32-NEXT: vfcvt.f.xu.v v12, v12
				; LMULMAX8-RV32-NEXT: vsetvli zero, zero, e16, m2, ta, mu
				; LMULMAX8-RV32-NEXT: vnsrl.wi v10, v12, 23
				; LMULMAX8-RV32-NEXT: vsetvli zero, zero, e8, m1, ta, mu
				; LMULMAX8-RV32-NEXT: vnsrl.wi v9, v10, 0
				; LMULMAX8-RV32-NEXT: addi a1, zero, 127
				; LMULMAX8-RV32-NEXT: vmseq.vi v0, v8, 0
				; LMULMAX8-RV32-NEXT: vsub.vx v8, v9, a1
				; LMULMAX8-RV32-NEXT: vmerge.vim v8, v8, 8, v0
				; LMULMAX8-RV32-NEXT: vse8.v v8, (a0)
				; LMULMAX8-RV32-NEXT: ret
				;
				; LMULMAX8-RV64-LABEL: cttz_v16i8:
				; LMULMAX8-RV64: # %bb.0:
				; LMULMAX8-RV64-NEXT: vsetivli zero, 16, e8, m1, ta, mu
				; LMULMAX8-RV64-NEXT: vle8.v v8, (a0)
				; LMULMAX8-RV64-NEXT: vrsub.vi v9, v8, 0
				; LMULMAX8-RV64-NEXT: vand.vv v9, v8, v9
				; LMULMAX8-RV64-NEXT: vsetvli zero, zero, e32, m4, ta, mu
				; LMULMAX8-RV64-NEXT: vzext.vf4 v12, v9
				; LMULMAX8-RV64-NEXT: vfcvt.f.xu.v v12, v12
				; LMULMAX8-RV64-NEXT: vsetvli zero, zero, e16, m2, ta, mu
				; LMULMAX8-RV64-NEXT: vnsrl.wi v10, v12, 23
				; LMULMAX8-RV64-NEXT: vsetvli zero, zero, e8, m1, ta, mu
				; LMULMAX8-RV64-NEXT: vnsrl.wi v9, v10, 0
				; LMULMAX8-RV64-NEXT: addi a1, zero, 127
				; LMULMAX8-RV64-NEXT: vmseq.vi v0, v8, 0
				; LMULMAX8-RV64-NEXT: vsub.vx v8, v9, a1
				; LMULMAX8-RV64-NEXT: vmerge.vim v8, v8, 8, v0
				; LMULMAX8-RV64-NEXT: vse8.v v8, (a0)
				; LMULMAX8-RV64-NEXT: ret
	%a = load <16 x i8>, <16 x i8>* %x			%a = load <16 x i8>, <16 x i8>* %x
	%b = load <16 x i8>, <16 x i8>* %y			%b = load <16 x i8>, <16 x i8>* %y
	%c = call <16 x i8> @llvm.cttz.v16i8(<16 x i8> %a, i1 false)			%c = call <16 x i8> @llvm.cttz.v16i8(<16 x i8> %a, i1 false)
	store <16 x i8> %c, <16 x i8>* %x			store <16 x i8> %c, <16 x i8>* %x
	ret void			ret void
	}			}
	declare <16 x i8> @llvm.cttz.v16i8(<16 x i8>, i1)			declare <16 x i8> @llvm.cttz.v16i8(<16 x i8>, i1)

	define void @cttz_v8i16(<8 x i16>* %x, <8 x i16>* %y) nounwind {			define void @cttz_v8i16(<8 x i16>* %x, <8 x i16>* %y) nounwind {
	; LMULMAX2-RV32-LABEL: cttz_v8i16:			; LMULMAX2-RV32I-LABEL: cttz_v8i16:
	; LMULMAX2-RV32: # %bb.0:			; LMULMAX2-RV32I: # %bb.0:
	; LMULMAX2-RV32-NEXT: vsetivli zero, 8, e16, m1, ta, mu			; LMULMAX2-RV32I-NEXT: vsetivli zero, 8, e16, m1, ta, mu
	; LMULMAX2-RV32-NEXT: vle16.v v8, (a0)			; LMULMAX2-RV32I-NEXT: vle16.v v8, (a0)
	; LMULMAX2-RV32-NEXT: addi a1, zero, 1			; LMULMAX2-RV32I-NEXT: addi a1, zero, 1
	; LMULMAX2-RV32-NEXT: vsub.vx v9, v8, a1			; LMULMAX2-RV32I-NEXT: vsub.vx v9, v8, a1
	; LMULMAX2-RV32-NEXT: vxor.vi v8, v8, -1			; LMULMAX2-RV32I-NEXT: vxor.vi v8, v8, -1
	; LMULMAX2-RV32-NEXT: vand.vv v8, v8, v9			; LMULMAX2-RV32I-NEXT: vand.vv v8, v8, v9
	; LMULMAX2-RV32-NEXT: vsrl.vi v9, v8, 1			; LMULMAX2-RV32I-NEXT: vsrl.vi v9, v8, 1
	; LMULMAX2-RV32-NEXT: lui a1, 5			; LMULMAX2-RV32I-NEXT: lui a1, 5
	; LMULMAX2-RV32-NEXT: addi a1, a1, 1365			; LMULMAX2-RV32I-NEXT: addi a1, a1, 1365
	; LMULMAX2-RV32-NEXT: vand.vx v9, v9, a1			; LMULMAX2-RV32I-NEXT: vand.vx v9, v9, a1
	; LMULMAX2-RV32-NEXT: vsub.vv v8, v8, v9			; LMULMAX2-RV32I-NEXT: vsub.vv v8, v8, v9
	; LMULMAX2-RV32-NEXT: lui a1, 3			; LMULMAX2-RV32I-NEXT: lui a1, 3
	; LMULMAX2-RV32-NEXT: addi a1, a1, 819			; LMULMAX2-RV32I-NEXT: addi a1, a1, 819
	; LMULMAX2-RV32-NEXT: vand.vx v9, v8, a1			; LMULMAX2-RV32I-NEXT: vand.vx v9, v8, a1
	; LMULMAX2-RV32-NEXT: vsrl.vi v8, v8, 2			; LMULMAX2-RV32I-NEXT: vsrl.vi v8, v8, 2
	; LMULMAX2-RV32-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV32I-NEXT: vand.vx v8, v8, a1
	; LMULMAX2-RV32-NEXT: vadd.vv v8, v9, v8			; LMULMAX2-RV32I-NEXT: vadd.vv v8, v9, v8
	; LMULMAX2-RV32-NEXT: vsrl.vi v9, v8, 4			; LMULMAX2-RV32I-NEXT: vsrl.vi v9, v8, 4
	; LMULMAX2-RV32-NEXT: vadd.vv v8, v8, v9			; LMULMAX2-RV32I-NEXT: vadd.vv v8, v8, v9
	; LMULMAX2-RV32-NEXT: lui a1, 1			; LMULMAX2-RV32I-NEXT: lui a1, 1
	; LMULMAX2-RV32-NEXT: addi a1, a1, -241			; LMULMAX2-RV32I-NEXT: addi a1, a1, -241
	; LMULMAX2-RV32-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV32I-NEXT: vand.vx v8, v8, a1
	; LMULMAX2-RV32-NEXT: addi a1, zero, 257			; LMULMAX2-RV32I-NEXT: addi a1, zero, 257
	; LMULMAX2-RV32-NEXT: vmul.vx v8, v8, a1			; LMULMAX2-RV32I-NEXT: vmul.vx v8, v8, a1
	; LMULMAX2-RV32-NEXT: vsrl.vi v8, v8, 8			; LMULMAX2-RV32I-NEXT: vsrl.vi v8, v8, 8
	; LMULMAX2-RV32-NEXT: vse16.v v8, (a0)			; LMULMAX2-RV32I-NEXT: vse16.v v8, (a0)
	; LMULMAX2-RV32-NEXT: ret			; LMULMAX2-RV32I-NEXT: ret
	;			;
	; LMULMAX2-RV64-LABEL: cttz_v8i16:			; LMULMAX2-RV64I-LABEL: cttz_v8i16:
	; LMULMAX2-RV64: # %bb.0:			; LMULMAX2-RV64I: # %bb.0:
	; LMULMAX2-RV64-NEXT: vsetivli zero, 8, e16, m1, ta, mu			; LMULMAX2-RV64I-NEXT: vsetivli zero, 8, e16, m1, ta, mu
	; LMULMAX2-RV64-NEXT: vle16.v v8, (a0)			; LMULMAX2-RV64I-NEXT: vle16.v v8, (a0)
	; LMULMAX2-RV64-NEXT: addi a1, zero, 1			; LMULMAX2-RV64I-NEXT: addi a1, zero, 1
	; LMULMAX2-RV64-NEXT: vsub.vx v9, v8, a1			; LMULMAX2-RV64I-NEXT: vsub.vx v9, v8, a1
	; LMULMAX2-RV64-NEXT: vxor.vi v8, v8, -1			; LMULMAX2-RV64I-NEXT: vxor.vi v8, v8, -1
	; LMULMAX2-RV64-NEXT: vand.vv v8, v8, v9			; LMULMAX2-RV64I-NEXT: vand.vv v8, v8, v9
	; LMULMAX2-RV64-NEXT: vsrl.vi v9, v8, 1			; LMULMAX2-RV64I-NEXT: vsrl.vi v9, v8, 1
	; LMULMAX2-RV64-NEXT: lui a1, 5			; LMULMAX2-RV64I-NEXT: lui a1, 5
	; LMULMAX2-RV64-NEXT: addiw a1, a1, 1365			; LMULMAX2-RV64I-NEXT: addiw a1, a1, 1365
	; LMULMAX2-RV64-NEXT: vand.vx v9, v9, a1			; LMULMAX2-RV64I-NEXT: vand.vx v9, v9, a1
	; LMULMAX2-RV64-NEXT: vsub.vv v8, v8, v9			; LMULMAX2-RV64I-NEXT: vsub.vv v8, v8, v9
	; LMULMAX2-RV64-NEXT: lui a1, 3			; LMULMAX2-RV64I-NEXT: lui a1, 3
	; LMULMAX2-RV64-NEXT: addiw a1, a1, 819			; LMULMAX2-RV64I-NEXT: addiw a1, a1, 819
	; LMULMAX2-RV64-NEXT: vand.vx v9, v8, a1			; LMULMAX2-RV64I-NEXT: vand.vx v9, v8, a1
	; LMULMAX2-RV64-NEXT: vsrl.vi v8, v8, 2			; LMULMAX2-RV64I-NEXT: vsrl.vi v8, v8, 2
	; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV64I-NEXT: vand.vx v8, v8, a1
	; LMULMAX2-RV64-NEXT: vadd.vv v8, v9, v8			; LMULMAX2-RV64I-NEXT: vadd.vv v8, v9, v8
	; LMULMAX2-RV64-NEXT: vsrl.vi v9, v8, 4			; LMULMAX2-RV64I-NEXT: vsrl.vi v9, v8, 4
	; LMULMAX2-RV64-NEXT: vadd.vv v8, v8, v9			; LMULMAX2-RV64I-NEXT: vadd.vv v8, v8, v9
	; LMULMAX2-RV64-NEXT: lui a1, 1			; LMULMAX2-RV64I-NEXT: lui a1, 1
	; LMULMAX2-RV64-NEXT: addiw a1, a1, -241			; LMULMAX2-RV64I-NEXT: addiw a1, a1, -241
	; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV64I-NEXT: vand.vx v8, v8, a1
	; LMULMAX2-RV64-NEXT: addi a1, zero, 257			; LMULMAX2-RV64I-NEXT: addi a1, zero, 257
	; LMULMAX2-RV64-NEXT: vmul.vx v8, v8, a1			; LMULMAX2-RV64I-NEXT: vmul.vx v8, v8, a1
	; LMULMAX2-RV64-NEXT: vsrl.vi v8, v8, 8			; LMULMAX2-RV64I-NEXT: vsrl.vi v8, v8, 8
	; LMULMAX2-RV64-NEXT: vse16.v v8, (a0)			; LMULMAX2-RV64I-NEXT: vse16.v v8, (a0)
	; LMULMAX2-RV64-NEXT: ret			; LMULMAX2-RV64I-NEXT: ret
	;			;
	; LMULMAX1-RV32-LABEL: cttz_v8i16:			; LMULMAX2-RV32D-LABEL: cttz_v8i16:
	; LMULMAX1-RV32: # %bb.0:			; LMULMAX2-RV32D: # %bb.0:
	; LMULMAX1-RV32-NEXT: vsetivli zero, 8, e16, m1, ta, mu			; LMULMAX2-RV32D-NEXT: vsetivli zero, 8, e16, m1, ta, mu
	; LMULMAX1-RV32-NEXT: vle16.v v8, (a0)			; LMULMAX2-RV32D-NEXT: vle16.v v8, (a0)
	; LMULMAX1-RV32-NEXT: addi a1, zero, 1			; LMULMAX2-RV32D-NEXT: vrsub.vi v9, v8, 0
	; LMULMAX1-RV32-NEXT: vsub.vx v9, v8, a1			; LMULMAX2-RV32D-NEXT: vand.vv v9, v8, v9
	; LMULMAX1-RV32-NEXT: vxor.vi v8, v8, -1			; LMULMAX2-RV32D-NEXT: vfwcvt.f.xu.v v10, v9
	; LMULMAX1-RV32-NEXT: vand.vv v8, v8, v9			; LMULMAX2-RV32D-NEXT: vnsrl.wi v9, v10, 23
	; LMULMAX1-RV32-NEXT: vsrl.vi v9, v8, 1			; LMULMAX2-RV32D-NEXT: addi a1, zero, 127
	; LMULMAX1-RV32-NEXT: lui a1, 5			; LMULMAX2-RV32D-NEXT: vsub.vx v9, v9, a1
	; LMULMAX1-RV32-NEXT: addi a1, a1, 1365			; LMULMAX2-RV32D-NEXT: vmseq.vi v0, v8, 0
	; LMULMAX1-RV32-NEXT: vand.vx v9, v9, a1			; LMULMAX2-RV32D-NEXT: addi a1, zero, 16
	; LMULMAX1-RV32-NEXT: vsub.vv v8, v8, v9			; LMULMAX2-RV32D-NEXT: vmerge.vxm v8, v9, a1, v0
	; LMULMAX1-RV32-NEXT: lui a1, 3			; LMULMAX2-RV32D-NEXT: vse16.v v8, (a0)
	; LMULMAX1-RV32-NEXT: addi a1, a1, 819			; LMULMAX2-RV32D-NEXT: ret
	; LMULMAX1-RV32-NEXT: vand.vx v9, v8, a1			;
	; LMULMAX1-RV32-NEXT: vsrl.vi v8, v8, 2			; LMULMAX2-RV64D-LABEL: cttz_v8i16:
	; LMULMAX1-RV32-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV64D: # %bb.0:
	; LMULMAX1-RV32-NEXT: vadd.vv v8, v9, v8			; LMULMAX2-RV64D-NEXT: vsetivli zero, 8, e16, m1, ta, mu
	; LMULMAX1-RV32-NEXT: vsrl.vi v9, v8, 4			; LMULMAX2-RV64D-NEXT: vle16.v v8, (a0)
	; LMULMAX1-RV32-NEXT: vadd.vv v8, v8, v9			; LMULMAX2-RV64D-NEXT: vrsub.vi v9, v8, 0
	; LMULMAX1-RV32-NEXT: lui a1, 1			; LMULMAX2-RV64D-NEXT: vand.vv v9, v8, v9
	; LMULMAX1-RV32-NEXT: addi a1, a1, -241			; LMULMAX2-RV64D-NEXT: vfwcvt.f.xu.v v10, v9
	; LMULMAX1-RV32-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV64D-NEXT: vnsrl.wi v9, v10, 23
	; LMULMAX1-RV32-NEXT: addi a1, zero, 257			; LMULMAX2-RV64D-NEXT: addi a1, zero, 127
	; LMULMAX1-RV32-NEXT: vmul.vx v8, v8, a1			; LMULMAX2-RV64D-NEXT: vsub.vx v9, v9, a1
	; LMULMAX1-RV32-NEXT: vsrl.vi v8, v8, 8			; LMULMAX2-RV64D-NEXT: vmseq.vi v0, v8, 0
	; LMULMAX1-RV32-NEXT: vse16.v v8, (a0)			; LMULMAX2-RV64D-NEXT: addi a1, zero, 16
	; LMULMAX1-RV32-NEXT: ret			; LMULMAX2-RV64D-NEXT: vmerge.vxm v8, v9, a1, v0
	;			; LMULMAX2-RV64D-NEXT: vse16.v v8, (a0)
	; LMULMAX1-RV64-LABEL: cttz_v8i16:			; LMULMAX2-RV64D-NEXT: ret
	; LMULMAX1-RV64: # %bb.0:			;
	; LMULMAX1-RV64-NEXT: vsetivli zero, 8, e16, m1, ta, mu			; LMULMAX1-RV32D-LABEL: cttz_v8i16:
	; LMULMAX1-RV64-NEXT: vle16.v v8, (a0)			; LMULMAX1-RV32D: # %bb.0:
	; LMULMAX1-RV64-NEXT: addi a1, zero, 1			; LMULMAX1-RV32D-NEXT: vsetivli zero, 8, e16, m1, ta, mu
	; LMULMAX1-RV64-NEXT: vsub.vx v9, v8, a1			; LMULMAX1-RV32D-NEXT: vle16.v v8, (a0)
	; LMULMAX1-RV64-NEXT: vxor.vi v8, v8, -1			; LMULMAX1-RV32D-NEXT: vsetivli zero, 4, e16, m1, ta, mu
	; LMULMAX1-RV64-NEXT: vand.vv v8, v8, v9			; LMULMAX1-RV32D-NEXT: vslidedown.vi v9, v8, 4
	; LMULMAX1-RV64-NEXT: vsrl.vi v9, v8, 1			; LMULMAX1-RV32D-NEXT: vsetivli zero, 4, e16, mf2, ta, mu
	; LMULMAX1-RV64-NEXT: lui a1, 5			; LMULMAX1-RV32D-NEXT: vrsub.vi v10, v9, 0
	; LMULMAX1-RV64-NEXT: addiw a1, a1, 1365			; LMULMAX1-RV32D-NEXT: vand.vv v9, v9, v10
	; LMULMAX1-RV64-NEXT: vand.vx v9, v9, a1			; LMULMAX1-RV32D-NEXT: vfwcvt.f.xu.v v10, v9
	; LMULMAX1-RV64-NEXT: vsub.vv v8, v8, v9			; LMULMAX1-RV32D-NEXT: vnsrl.wi v9, v10, 23
	; LMULMAX1-RV64-NEXT: lui a1, 3			; LMULMAX1-RV32D-NEXT: addi a1, zero, 127
	; LMULMAX1-RV64-NEXT: addiw a1, a1, 819			; LMULMAX1-RV32D-NEXT: vsub.vx v9, v9, a1
	; LMULMAX1-RV64-NEXT: vand.vx v9, v8, a1			; LMULMAX1-RV32D-NEXT: vrsub.vi v10, v8, 0
	; LMULMAX1-RV64-NEXT: vsrl.vi v8, v8, 2			; LMULMAX1-RV32D-NEXT: vand.vv v10, v8, v10
	; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX1-RV32D-NEXT: vfwcvt.f.xu.v v11, v10
	; LMULMAX1-RV64-NEXT: vadd.vv v8, v9, v8			; LMULMAX1-RV32D-NEXT: vnsrl.wi v10, v11, 23
	; LMULMAX1-RV64-NEXT: vsrl.vi v9, v8, 4			; LMULMAX1-RV32D-NEXT: vsub.vx v10, v10, a1
	; LMULMAX1-RV64-NEXT: vadd.vv v8, v8, v9			; LMULMAX1-RV32D-NEXT: vsetivli zero, 8, e16, m1, ta, mu
	; LMULMAX1-RV64-NEXT: lui a1, 1			; LMULMAX1-RV32D-NEXT: vmv.v.i v11, 0
	; LMULMAX1-RV64-NEXT: addiw a1, a1, -241			; LMULMAX1-RV32D-NEXT: vsetivli zero, 4, e16, m1, tu, mu
	; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX1-RV32D-NEXT: vslideup.vi v11, v10, 0
	; LMULMAX1-RV64-NEXT: addi a1, zero, 257			; LMULMAX1-RV32D-NEXT: vsetivli zero, 8, e16, m1, tu, mu
	; LMULMAX1-RV64-NEXT: vmul.vx v8, v8, a1			; LMULMAX1-RV32D-NEXT: vslideup.vi v11, v9, 4
	; LMULMAX1-RV64-NEXT: vsrl.vi v8, v8, 8			; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e16, m1, ta, mu
	; LMULMAX1-RV64-NEXT: vse16.v v8, (a0)			; LMULMAX1-RV32D-NEXT: vmseq.vi v0, v8, 0
	; LMULMAX1-RV64-NEXT: ret			; LMULMAX1-RV32D-NEXT: addi a1, zero, 16
				; LMULMAX1-RV32D-NEXT: vmerge.vxm v8, v11, a1, v0
				; LMULMAX1-RV32D-NEXT: vse16.v v8, (a0)
				; LMULMAX1-RV32D-NEXT: ret
				;
				; LMULMAX1-RV64D-LABEL: cttz_v8i16:
				; LMULMAX1-RV64D: # %bb.0:
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 8, e16, m1, ta, mu
				; LMULMAX1-RV64D-NEXT: vle16.v v8, (a0)
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 4, e16, m1, ta, mu
				; LMULMAX1-RV64D-NEXT: vslidedown.vi v9, v8, 4
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 4, e16, mf2, ta, mu
				; LMULMAX1-RV64D-NEXT: vrsub.vi v10, v9, 0
				; LMULMAX1-RV64D-NEXT: vand.vv v9, v9, v10
				; LMULMAX1-RV64D-NEXT: vfwcvt.f.xu.v v10, v9
				; LMULMAX1-RV64D-NEXT: vnsrl.wi v9, v10, 23
				; LMULMAX1-RV64D-NEXT: addi a1, zero, 127
				; LMULMAX1-RV64D-NEXT: vsub.vx v9, v9, a1
				; LMULMAX1-RV64D-NEXT: vrsub.vi v10, v8, 0
				; LMULMAX1-RV64D-NEXT: vand.vv v10, v8, v10
				; LMULMAX1-RV64D-NEXT: vfwcvt.f.xu.v v11, v10
				; LMULMAX1-RV64D-NEXT: vnsrl.wi v10, v11, 23
				; LMULMAX1-RV64D-NEXT: vsub.vx v10, v10, a1
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 8, e16, m1, ta, mu
				; LMULMAX1-RV64D-NEXT: vmv.v.i v11, 0
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 4, e16, m1, tu, mu
				; LMULMAX1-RV64D-NEXT: vslideup.vi v11, v10, 0
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 8, e16, m1, tu, mu
				; LMULMAX1-RV64D-NEXT: vslideup.vi v11, v9, 4
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e16, m1, ta, mu
				; LMULMAX1-RV64D-NEXT: vmseq.vi v0, v8, 0
				; LMULMAX1-RV64D-NEXT: addi a1, zero, 16
				; LMULMAX1-RV64D-NEXT: vmerge.vxm v8, v11, a1, v0
				; LMULMAX1-RV64D-NEXT: vse16.v v8, (a0)
				; LMULMAX1-RV64D-NEXT: ret
				;
				; LMULMAX8-RV32-LABEL: cttz_v8i16:
				; LMULMAX8-RV32: # %bb.0:
				; LMULMAX8-RV32-NEXT: vsetivli zero, 8, e16, m1, ta, mu
				; LMULMAX8-RV32-NEXT: vle16.v v8, (a0)
				; LMULMAX8-RV32-NEXT: vrsub.vi v9, v8, 0
				; LMULMAX8-RV32-NEXT: vand.vv v9, v8, v9
				; LMULMAX8-RV32-NEXT: vfwcvt.f.xu.v v10, v9
				; LMULMAX8-RV32-NEXT: vnsrl.wi v9, v10, 23
				; LMULMAX8-RV32-NEXT: addi a1, zero, 127
				; LMULMAX8-RV32-NEXT: vsub.vx v9, v9, a1
				; LMULMAX8-RV32-NEXT: vmseq.vi v0, v8, 0
				; LMULMAX8-RV32-NEXT: addi a1, zero, 16
				; LMULMAX8-RV32-NEXT: vmerge.vxm v8, v9, a1, v0
				; LMULMAX8-RV32-NEXT: vse16.v v8, (a0)
				; LMULMAX8-RV32-NEXT: ret
				;
				; LMULMAX8-RV64-LABEL: cttz_v8i16:
				; LMULMAX8-RV64: # %bb.0:
				; LMULMAX8-RV64-NEXT: vsetivli zero, 8, e16, m1, ta, mu
				; LMULMAX8-RV64-NEXT: vle16.v v8, (a0)
				; LMULMAX8-RV64-NEXT: vrsub.vi v9, v8, 0
				; LMULMAX8-RV64-NEXT: vand.vv v9, v8, v9
				; LMULMAX8-RV64-NEXT: vfwcvt.f.xu.v v10, v9
				; LMULMAX8-RV64-NEXT: vnsrl.wi v9, v10, 23
				; LMULMAX8-RV64-NEXT: addi a1, zero, 127
				; LMULMAX8-RV64-NEXT: vsub.vx v9, v9, a1
				; LMULMAX8-RV64-NEXT: vmseq.vi v0, v8, 0
				; LMULMAX8-RV64-NEXT: addi a1, zero, 16
				; LMULMAX8-RV64-NEXT: vmerge.vxm v8, v9, a1, v0
				; LMULMAX8-RV64-NEXT: vse16.v v8, (a0)
				; LMULMAX8-RV64-NEXT: ret
	%a = load <8 x i16>, <8 x i16>* %x			%a = load <8 x i16>, <8 x i16>* %x
	%b = load <8 x i16>, <8 x i16>* %y			%b = load <8 x i16>, <8 x i16>* %y
	%c = call <8 x i16> @llvm.cttz.v8i16(<8 x i16> %a, i1 false)			%c = call <8 x i16> @llvm.cttz.v8i16(<8 x i16> %a, i1 false)
	store <8 x i16> %c, <8 x i16>* %x			store <8 x i16> %c, <8 x i16>* %x
	ret void			ret void
	}			}
	declare <8 x i16> @llvm.cttz.v8i16(<8 x i16>, i1)			declare <8 x i16> @llvm.cttz.v8i16(<8 x i16>, i1)

	define void @cttz_v4i32(<4 x i32>* %x, <4 x i32>* %y) nounwind {			define void @cttz_v4i32(<4 x i32>* %x, <4 x i32>* %y) nounwind {
	; LMULMAX2-RV32-LABEL: cttz_v4i32:			; LMULMAX2-RV32I-LABEL: cttz_v4i32:
	; LMULMAX2-RV32: # %bb.0:			; LMULMAX2-RV32I: # %bb.0:
	; LMULMAX2-RV32-NEXT: vsetivli zero, 4, e32, m1, ta, mu			; LMULMAX2-RV32I-NEXT: vsetivli zero, 4, e32, m1, ta, mu
	; LMULMAX2-RV32-NEXT: vle32.v v8, (a0)			; LMULMAX2-RV32I-NEXT: vle32.v v8, (a0)
	; LMULMAX2-RV32-NEXT: addi a1, zero, 1			; LMULMAX2-RV32I-NEXT: addi a1, zero, 1
	; LMULMAX2-RV32-NEXT: vsub.vx v9, v8, a1			; LMULMAX2-RV32I-NEXT: vsub.vx v9, v8, a1
	; LMULMAX2-RV32-NEXT: vxor.vi v8, v8, -1			; LMULMAX2-RV32I-NEXT: vxor.vi v8, v8, -1
	; LMULMAX2-RV32-NEXT: vand.vv v8, v8, v9			; LMULMAX2-RV32I-NEXT: vand.vv v8, v8, v9
	; LMULMAX2-RV32-NEXT: vsrl.vi v9, v8, 1			; LMULMAX2-RV32I-NEXT: vsrl.vi v9, v8, 1
	; LMULMAX2-RV32-NEXT: lui a1, 349525			; LMULMAX2-RV32I-NEXT: lui a1, 349525
	; LMULMAX2-RV32-NEXT: addi a1, a1, 1365			; LMULMAX2-RV32I-NEXT: addi a1, a1, 1365
	; LMULMAX2-RV32-NEXT: vand.vx v9, v9, a1			; LMULMAX2-RV32I-NEXT: vand.vx v9, v9, a1
	; LMULMAX2-RV32-NEXT: vsub.vv v8, v8, v9			; LMULMAX2-RV32I-NEXT: vsub.vv v8, v8, v9
	; LMULMAX2-RV32-NEXT: lui a1, 209715			; LMULMAX2-RV32I-NEXT: lui a1, 209715
	; LMULMAX2-RV32-NEXT: addi a1, a1, 819			; LMULMAX2-RV32I-NEXT: addi a1, a1, 819
	; LMULMAX2-RV32-NEXT: vand.vx v9, v8, a1			; LMULMAX2-RV32I-NEXT: vand.vx v9, v8, a1
	; LMULMAX2-RV32-NEXT: vsrl.vi v8, v8, 2			; LMULMAX2-RV32I-NEXT: vsrl.vi v8, v8, 2
	; LMULMAX2-RV32-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV32I-NEXT: vand.vx v8, v8, a1
	; LMULMAX2-RV32-NEXT: vadd.vv v8, v9, v8			; LMULMAX2-RV32I-NEXT: vadd.vv v8, v9, v8
	; LMULMAX2-RV32-NEXT: vsrl.vi v9, v8, 4			; LMULMAX2-RV32I-NEXT: vsrl.vi v9, v8, 4
	; LMULMAX2-RV32-NEXT: vadd.vv v8, v8, v9			; LMULMAX2-RV32I-NEXT: vadd.vv v8, v8, v9
	; LMULMAX2-RV32-NEXT: lui a1, 61681			; LMULMAX2-RV32I-NEXT: lui a1, 61681
	; LMULMAX2-RV32-NEXT: addi a1, a1, -241			; LMULMAX2-RV32I-NEXT: addi a1, a1, -241
	; LMULMAX2-RV32-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV32I-NEXT: vand.vx v8, v8, a1
	; LMULMAX2-RV32-NEXT: lui a1, 4112			; LMULMAX2-RV32I-NEXT: lui a1, 4112
	; LMULMAX2-RV32-NEXT: addi a1, a1, 257			; LMULMAX2-RV32I-NEXT: addi a1, a1, 257
	; LMULMAX2-RV32-NEXT: vmul.vx v8, v8, a1			; LMULMAX2-RV32I-NEXT: vmul.vx v8, v8, a1
	; LMULMAX2-RV32-NEXT: vsrl.vi v8, v8, 24			; LMULMAX2-RV32I-NEXT: vsrl.vi v8, v8, 24
	; LMULMAX2-RV32-NEXT: vse32.v v8, (a0)			; LMULMAX2-RV32I-NEXT: vse32.v v8, (a0)
	; LMULMAX2-RV32-NEXT: ret			; LMULMAX2-RV32I-NEXT: ret
	;			;
	; LMULMAX2-RV64-LABEL: cttz_v4i32:			; LMULMAX2-RV64I-LABEL: cttz_v4i32:
	; LMULMAX2-RV64: # %bb.0:			; LMULMAX2-RV64I: # %bb.0:
	; LMULMAX2-RV64-NEXT: vsetivli zero, 4, e32, m1, ta, mu			; LMULMAX2-RV64I-NEXT: vsetivli zero, 4, e32, m1, ta, mu
	; LMULMAX2-RV64-NEXT: vle32.v v8, (a0)			; LMULMAX2-RV64I-NEXT: vle32.v v8, (a0)
	; LMULMAX2-RV64-NEXT: addi a1, zero, 1			; LMULMAX2-RV64I-NEXT: addi a1, zero, 1
	; LMULMAX2-RV64-NEXT: vsub.vx v9, v8, a1			; LMULMAX2-RV64I-NEXT: vsub.vx v9, v8, a1
	; LMULMAX2-RV64-NEXT: vxor.vi v8, v8, -1			; LMULMAX2-RV64I-NEXT: vxor.vi v8, v8, -1
	; LMULMAX2-RV64-NEXT: vand.vv v8, v8, v9			; LMULMAX2-RV64I-NEXT: vand.vv v8, v8, v9
	; LMULMAX2-RV64-NEXT: vsrl.vi v9, v8, 1			; LMULMAX2-RV64I-NEXT: vsrl.vi v9, v8, 1
	; LMULMAX2-RV64-NEXT: lui a1, 349525			; LMULMAX2-RV64I-NEXT: lui a1, 349525
	; LMULMAX2-RV64-NEXT: addiw a1, a1, 1365			; LMULMAX2-RV64I-NEXT: addiw a1, a1, 1365
	; LMULMAX2-RV64-NEXT: vand.vx v9, v9, a1			; LMULMAX2-RV64I-NEXT: vand.vx v9, v9, a1
	; LMULMAX2-RV64-NEXT: vsub.vv v8, v8, v9			; LMULMAX2-RV64I-NEXT: vsub.vv v8, v8, v9
	; LMULMAX2-RV64-NEXT: lui a1, 209715			; LMULMAX2-RV64I-NEXT: lui a1, 209715
	; LMULMAX2-RV64-NEXT: addiw a1, a1, 819			; LMULMAX2-RV64I-NEXT: addiw a1, a1, 819
	; LMULMAX2-RV64-NEXT: vand.vx v9, v8, a1			; LMULMAX2-RV64I-NEXT: vand.vx v9, v8, a1
	; LMULMAX2-RV64-NEXT: vsrl.vi v8, v8, 2			; LMULMAX2-RV64I-NEXT: vsrl.vi v8, v8, 2
	; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV64I-NEXT: vand.vx v8, v8, a1
	; LMULMAX2-RV64-NEXT: vadd.vv v8, v9, v8			; LMULMAX2-RV64I-NEXT: vadd.vv v8, v9, v8
	; LMULMAX2-RV64-NEXT: vsrl.vi v9, v8, 4			; LMULMAX2-RV64I-NEXT: vsrl.vi v9, v8, 4
	; LMULMAX2-RV64-NEXT: vadd.vv v8, v8, v9			; LMULMAX2-RV64I-NEXT: vadd.vv v8, v8, v9
	; LMULMAX2-RV64-NEXT: lui a1, 61681			; LMULMAX2-RV64I-NEXT: lui a1, 61681
	; LMULMAX2-RV64-NEXT: addiw a1, a1, -241			; LMULMAX2-RV64I-NEXT: addiw a1, a1, -241
	; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV64I-NEXT: vand.vx v8, v8, a1
	; LMULMAX2-RV64-NEXT: lui a1, 4112			; LMULMAX2-RV64I-NEXT: lui a1, 4112
	; LMULMAX2-RV64-NEXT: addiw a1, a1, 257			; LMULMAX2-RV64I-NEXT: addiw a1, a1, 257
	; LMULMAX2-RV64-NEXT: vmul.vx v8, v8, a1			; LMULMAX2-RV64I-NEXT: vmul.vx v8, v8, a1
	; LMULMAX2-RV64-NEXT: vsrl.vi v8, v8, 24			; LMULMAX2-RV64I-NEXT: vsrl.vi v8, v8, 24
	; LMULMAX2-RV64-NEXT: vse32.v v8, (a0)			; LMULMAX2-RV64I-NEXT: vse32.v v8, (a0)
	; LMULMAX2-RV64-NEXT: ret			; LMULMAX2-RV64I-NEXT: ret
	;			;
	; LMULMAX1-RV32-LABEL: cttz_v4i32:			; LMULMAX2-RV32D-LABEL: cttz_v4i32:
	; LMULMAX1-RV32: # %bb.0:			; LMULMAX2-RV32D: # %bb.0:
	; LMULMAX1-RV32-NEXT: vsetivli zero, 4, e32, m1, ta, mu			; LMULMAX2-RV32D-NEXT: vsetivli zero, 4, e32, m1, ta, mu
	; LMULMAX1-RV32-NEXT: vle32.v v8, (a0)			; LMULMAX2-RV32D-NEXT: vle32.v v8, (a0)
	; LMULMAX1-RV32-NEXT: addi a1, zero, 1			; LMULMAX2-RV32D-NEXT: vrsub.vi v9, v8, 0
	; LMULMAX1-RV32-NEXT: vsub.vx v9, v8, a1			; LMULMAX2-RV32D-NEXT: vand.vv v9, v8, v9
	; LMULMAX1-RV32-NEXT: vxor.vi v8, v8, -1			; LMULMAX2-RV32D-NEXT: vfwcvt.f.xu.v v10, v9
	; LMULMAX1-RV32-NEXT: vand.vv v8, v8, v9			; LMULMAX2-RV32D-NEXT: addi a1, zero, 52
	; LMULMAX1-RV32-NEXT: vsrl.vi v9, v8, 1			; LMULMAX2-RV32D-NEXT: vnsrl.wx v9, v10, a1
	; LMULMAX1-RV32-NEXT: lui a1, 349525			; LMULMAX2-RV32D-NEXT: addi a1, zero, 1023
	; LMULMAX1-RV32-NEXT: addi a1, a1, 1365			; LMULMAX2-RV32D-NEXT: vsub.vx v9, v9, a1
	; LMULMAX1-RV32-NEXT: vand.vx v9, v9, a1			; LMULMAX2-RV32D-NEXT: vmseq.vi v0, v8, 0
	; LMULMAX1-RV32-NEXT: vsub.vv v8, v8, v9			; LMULMAX2-RV32D-NEXT: addi a1, zero, 32
	; LMULMAX1-RV32-NEXT: lui a1, 209715			; LMULMAX2-RV32D-NEXT: vmerge.vxm v8, v9, a1, v0
	; LMULMAX1-RV32-NEXT: addi a1, a1, 819			; LMULMAX2-RV32D-NEXT: vse32.v v8, (a0)
	; LMULMAX1-RV32-NEXT: vand.vx v9, v8, a1			; LMULMAX2-RV32D-NEXT: ret
	; LMULMAX1-RV32-NEXT: vsrl.vi v8, v8, 2			;
	; LMULMAX1-RV32-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV64D-LABEL: cttz_v4i32:
	; LMULMAX1-RV32-NEXT: vadd.vv v8, v9, v8			; LMULMAX2-RV64D: # %bb.0:
	; LMULMAX1-RV32-NEXT: vsrl.vi v9, v8, 4			; LMULMAX2-RV64D-NEXT: vsetivli zero, 4, e32, m1, ta, mu
	; LMULMAX1-RV32-NEXT: vadd.vv v8, v8, v9			; LMULMAX2-RV64D-NEXT: vle32.v v8, (a0)
	; LMULMAX1-RV32-NEXT: lui a1, 61681			; LMULMAX2-RV64D-NEXT: vrsub.vi v9, v8, 0
	; LMULMAX1-RV32-NEXT: addi a1, a1, -241			; LMULMAX2-RV64D-NEXT: vand.vv v9, v8, v9
	; LMULMAX1-RV32-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV64D-NEXT: vfwcvt.f.xu.v v10, v9
	; LMULMAX1-RV32-NEXT: lui a1, 4112			; LMULMAX2-RV64D-NEXT: addi a1, zero, 52
	; LMULMAX1-RV32-NEXT: addi a1, a1, 257			; LMULMAX2-RV64D-NEXT: vnsrl.wx v9, v10, a1
	; LMULMAX1-RV32-NEXT: vmul.vx v8, v8, a1			; LMULMAX2-RV64D-NEXT: addi a1, zero, 1023
	; LMULMAX1-RV32-NEXT: vsrl.vi v8, v8, 24			; LMULMAX2-RV64D-NEXT: vsub.vx v9, v9, a1
	; LMULMAX1-RV32-NEXT: vse32.v v8, (a0)			; LMULMAX2-RV64D-NEXT: vmseq.vi v0, v8, 0
	; LMULMAX1-RV32-NEXT: ret			; LMULMAX2-RV64D-NEXT: addi a1, zero, 32
	;			; LMULMAX2-RV64D-NEXT: vmerge.vxm v8, v9, a1, v0
	; LMULMAX1-RV64-LABEL: cttz_v4i32:			; LMULMAX2-RV64D-NEXT: vse32.v v8, (a0)
	; LMULMAX1-RV64: # %bb.0:			; LMULMAX2-RV64D-NEXT: ret
	; LMULMAX1-RV64-NEXT: vsetivli zero, 4, e32, m1, ta, mu			;
	; LMULMAX1-RV64-NEXT: vle32.v v8, (a0)			; LMULMAX1-RV32D-LABEL: cttz_v4i32:
	; LMULMAX1-RV64-NEXT: addi a1, zero, 1			; LMULMAX1-RV32D: # %bb.0:
	; LMULMAX1-RV64-NEXT: vsub.vx v9, v8, a1			; LMULMAX1-RV32D-NEXT: vsetivli zero, 4, e32, m1, ta, mu
	; LMULMAX1-RV64-NEXT: vxor.vi v8, v8, -1			; LMULMAX1-RV32D-NEXT: vle32.v v8, (a0)
	; LMULMAX1-RV64-NEXT: vand.vv v8, v8, v9			; LMULMAX1-RV32D-NEXT: vsetivli zero, 2, e32, m1, ta, mu
	; LMULMAX1-RV64-NEXT: vsrl.vi v9, v8, 1			; LMULMAX1-RV32D-NEXT: vslidedown.vi v9, v8, 2
	; LMULMAX1-RV64-NEXT: lui a1, 349525			; LMULMAX1-RV32D-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
	; LMULMAX1-RV64-NEXT: addiw a1, a1, 1365			; LMULMAX1-RV32D-NEXT: vrsub.vi v10, v9, 0
	; LMULMAX1-RV64-NEXT: vand.vx v9, v9, a1			; LMULMAX1-RV32D-NEXT: vand.vv v9, v9, v10
	; LMULMAX1-RV64-NEXT: vsub.vv v8, v8, v9			; LMULMAX1-RV32D-NEXT: vfwcvt.f.xu.v v10, v9
	; LMULMAX1-RV64-NEXT: lui a1, 209715			; LMULMAX1-RV32D-NEXT: addi a1, zero, 52
	; LMULMAX1-RV64-NEXT: addiw a1, a1, 819			; LMULMAX1-RV32D-NEXT: vnsrl.wx v9, v10, a1
	; LMULMAX1-RV64-NEXT: vand.vx v9, v8, a1			; LMULMAX1-RV32D-NEXT: addi a2, zero, 1023
	; LMULMAX1-RV64-NEXT: vsrl.vi v8, v8, 2			; LMULMAX1-RV32D-NEXT: vsub.vx v9, v9, a2
	; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX1-RV32D-NEXT: vrsub.vi v10, v8, 0
	; LMULMAX1-RV64-NEXT: vadd.vv v8, v9, v8			; LMULMAX1-RV32D-NEXT: vand.vv v10, v8, v10
	; LMULMAX1-RV64-NEXT: vsrl.vi v9, v8, 4			; LMULMAX1-RV32D-NEXT: vfwcvt.f.xu.v v11, v10
	; LMULMAX1-RV64-NEXT: vadd.vv v8, v8, v9			; LMULMAX1-RV32D-NEXT: vnsrl.wx v10, v11, a1
	; LMULMAX1-RV64-NEXT: lui a1, 61681			; LMULMAX1-RV32D-NEXT: vsub.vx v10, v10, a2
	; LMULMAX1-RV64-NEXT: addiw a1, a1, -241			; LMULMAX1-RV32D-NEXT: vsetivli zero, 4, e32, m1, ta, mu
	; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX1-RV32D-NEXT: vmv.v.i v11, 0
	; LMULMAX1-RV64-NEXT: lui a1, 4112			; LMULMAX1-RV32D-NEXT: vsetivli zero, 2, e32, m1, tu, mu
	; LMULMAX1-RV64-NEXT: addiw a1, a1, 257			; LMULMAX1-RV32D-NEXT: vslideup.vi v11, v10, 0
	; LMULMAX1-RV64-NEXT: vmul.vx v8, v8, a1			; LMULMAX1-RV32D-NEXT: vsetivli zero, 4, e32, m1, tu, mu
	; LMULMAX1-RV64-NEXT: vsrl.vi v8, v8, 24			; LMULMAX1-RV32D-NEXT: vslideup.vi v11, v9, 2
	; LMULMAX1-RV64-NEXT: vse32.v v8, (a0)			; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e32, m1, ta, mu
	; LMULMAX1-RV64-NEXT: ret			; LMULMAX1-RV32D-NEXT: vmseq.vi v0, v8, 0
				; LMULMAX1-RV32D-NEXT: addi a1, zero, 32
				; LMULMAX1-RV32D-NEXT: vmerge.vxm v8, v11, a1, v0
				; LMULMAX1-RV32D-NEXT: vse32.v v8, (a0)
				; LMULMAX1-RV32D-NEXT: ret
				;
				; LMULMAX1-RV64D-LABEL: cttz_v4i32:
				; LMULMAX1-RV64D: # %bb.0:
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 4, e32, m1, ta, mu
				; LMULMAX1-RV64D-NEXT: vle32.v v8, (a0)
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 2, e32, m1, ta, mu
				; LMULMAX1-RV64D-NEXT: vslidedown.vi v9, v8, 2
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
				; LMULMAX1-RV64D-NEXT: vrsub.vi v10, v9, 0
				; LMULMAX1-RV64D-NEXT: vand.vv v9, v9, v10
				; LMULMAX1-RV64D-NEXT: vfwcvt.f.xu.v v10, v9
				; LMULMAX1-RV64D-NEXT: addi a1, zero, 52
				; LMULMAX1-RV64D-NEXT: vnsrl.wx v9, v10, a1
				; LMULMAX1-RV64D-NEXT: addi a2, zero, 1023
				; LMULMAX1-RV64D-NEXT: vsub.vx v9, v9, a2
				; LMULMAX1-RV64D-NEXT: vrsub.vi v10, v8, 0
				; LMULMAX1-RV64D-NEXT: vand.vv v10, v8, v10
				; LMULMAX1-RV64D-NEXT: vfwcvt.f.xu.v v11, v10
				; LMULMAX1-RV64D-NEXT: vnsrl.wx v10, v11, a1
				; LMULMAX1-RV64D-NEXT: vsub.vx v10, v10, a2
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 4, e32, m1, ta, mu
				; LMULMAX1-RV64D-NEXT: vmv.v.i v11, 0
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 2, e32, m1, tu, mu
				; LMULMAX1-RV64D-NEXT: vslideup.vi v11, v10, 0
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 4, e32, m1, tu, mu
				; LMULMAX1-RV64D-NEXT: vslideup.vi v11, v9, 2
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e32, m1, ta, mu
				; LMULMAX1-RV64D-NEXT: vmseq.vi v0, v8, 0
				; LMULMAX1-RV64D-NEXT: addi a1, zero, 32
				; LMULMAX1-RV64D-NEXT: vmerge.vxm v8, v11, a1, v0
				; LMULMAX1-RV64D-NEXT: vse32.v v8, (a0)
				; LMULMAX1-RV64D-NEXT: ret
				;
				; LMULMAX8-RV32-LABEL: cttz_v4i32:
				; LMULMAX8-RV32: # %bb.0:
				; LMULMAX8-RV32-NEXT: vsetivli zero, 4, e32, m1, ta, mu
				; LMULMAX8-RV32-NEXT: vle32.v v8, (a0)
				; LMULMAX8-RV32-NEXT: vrsub.vi v9, v8, 0
				; LMULMAX8-RV32-NEXT: vand.vv v9, v8, v9
				; LMULMAX8-RV32-NEXT: vfwcvt.f.xu.v v10, v9
				; LMULMAX8-RV32-NEXT: addi a1, zero, 52
				; LMULMAX8-RV32-NEXT: vnsrl.wx v9, v10, a1
				; LMULMAX8-RV32-NEXT: addi a1, zero, 1023
				; LMULMAX8-RV32-NEXT: vsub.vx v9, v9, a1
				; LMULMAX8-RV32-NEXT: vmseq.vi v0, v8, 0
				; LMULMAX8-RV32-NEXT: addi a1, zero, 32
				; LMULMAX8-RV32-NEXT: vmerge.vxm v8, v9, a1, v0
				; LMULMAX8-RV32-NEXT: vse32.v v8, (a0)
				; LMULMAX8-RV32-NEXT: ret
				;
				; LMULMAX8-RV64-LABEL: cttz_v4i32:
				; LMULMAX8-RV64: # %bb.0:
				; LMULMAX8-RV64-NEXT: vsetivli zero, 4, e32, m1, ta, mu
				; LMULMAX8-RV64-NEXT: vle32.v v8, (a0)
				; LMULMAX8-RV64-NEXT: vrsub.vi v9, v8, 0
				; LMULMAX8-RV64-NEXT: vand.vv v9, v8, v9
				; LMULMAX8-RV64-NEXT: vfwcvt.f.xu.v v10, v9
				; LMULMAX8-RV64-NEXT: addi a1, zero, 52
				; LMULMAX8-RV64-NEXT: vnsrl.wx v9, v10, a1
				; LMULMAX8-RV64-NEXT: addi a1, zero, 1023
				; LMULMAX8-RV64-NEXT: vsub.vx v9, v9, a1
				; LMULMAX8-RV64-NEXT: vmseq.vi v0, v8, 0
				; LMULMAX8-RV64-NEXT: addi a1, zero, 32
				; LMULMAX8-RV64-NEXT: vmerge.vxm v8, v9, a1, v0
				; LMULMAX8-RV64-NEXT: vse32.v v8, (a0)
				; LMULMAX8-RV64-NEXT: ret
	%a = load <4 x i32>, <4 x i32>* %x			%a = load <4 x i32>, <4 x i32>* %x
	%b = load <4 x i32>, <4 x i32>* %y			%b = load <4 x i32>, <4 x i32>* %y
	%c = call <4 x i32> @llvm.cttz.v4i32(<4 x i32> %a, i1 false)			%c = call <4 x i32> @llvm.cttz.v4i32(<4 x i32> %a, i1 false)
	store <4 x i32> %c, <4 x i32>* %x			store <4 x i32> %c, <4 x i32>* %x
	ret void			ret void
	}			}
	declare <4 x i32> @llvm.cttz.v4i32(<4 x i32>, i1)			declare <4 x i32> @llvm.cttz.v4i32(<4 x i32>, i1)

	▲ Show 20 Lines • Show All 194 Lines • ▼ Show 20 Lines
	; LMULMAX1-RV64-NEXT: addi a1, a1, 257			; LMULMAX1-RV64-NEXT: addi a1, a1, 257
	; LMULMAX1-RV64-NEXT: slli a1, a1, 16			; LMULMAX1-RV64-NEXT: slli a1, a1, 16
	; LMULMAX1-RV64-NEXT: addi a1, a1, 257			; LMULMAX1-RV64-NEXT: addi a1, a1, 257
	; LMULMAX1-RV64-NEXT: vmul.vx v8, v8, a1			; LMULMAX1-RV64-NEXT: vmul.vx v8, v8, a1
	; LMULMAX1-RV64-NEXT: addi a1, zero, 56			; LMULMAX1-RV64-NEXT: addi a1, zero, 56
	; LMULMAX1-RV64-NEXT: vsrl.vx v8, v8, a1			; LMULMAX1-RV64-NEXT: vsrl.vx v8, v8, a1
	; LMULMAX1-RV64-NEXT: vse64.v v8, (a0)			; LMULMAX1-RV64-NEXT: vse64.v v8, (a0)
	; LMULMAX1-RV64-NEXT: ret			; LMULMAX1-RV64-NEXT: ret
				;
				; LMULMAX8-RV32-LABEL: cttz_v2i64:
				; LMULMAX8-RV32: # %bb.0:
				; LMULMAX8-RV32-NEXT: vsetivli zero, 2, e64, m1, ta, mu
				; LMULMAX8-RV32-NEXT: vle64.v v8, (a0)
				; LMULMAX8-RV32-NEXT: addi a1, zero, 1
				; LMULMAX8-RV32-NEXT: vsub.vx v9, v8, a1
				; LMULMAX8-RV32-NEXT: vsetivli zero, 4, e32, m1, ta, mu
				; LMULMAX8-RV32-NEXT: vmv.v.i v10, -1
				; LMULMAX8-RV32-NEXT: vsetivli zero, 2, e64, m1, ta, mu
				; LMULMAX8-RV32-NEXT: vxor.vv v8, v8, v10
				; LMULMAX8-RV32-NEXT: vand.vv v8, v8, v9
				; LMULMAX8-RV32-NEXT: vsrl.vi v9, v8, 1
				; LMULMAX8-RV32-NEXT: lui a1, 349525
				; LMULMAX8-RV32-NEXT: addi a1, a1, 1365
				; LMULMAX8-RV32-NEXT: vsetivli zero, 4, e32, m1, ta, mu
				; LMULMAX8-RV32-NEXT: vmv.v.x v10, a1
				; LMULMAX8-RV32-NEXT: vsetivli zero, 2, e64, m1, ta, mu
				; LMULMAX8-RV32-NEXT: vand.vv v9, v9, v10
				; LMULMAX8-RV32-NEXT: vsub.vv v8, v8, v9
				; LMULMAX8-RV32-NEXT: lui a1, 209715
				; LMULMAX8-RV32-NEXT: addi a1, a1, 819
				; LMULMAX8-RV32-NEXT: vsetivli zero, 4, e32, m1, ta, mu
				; LMULMAX8-RV32-NEXT: vmv.v.x v9, a1
				; LMULMAX8-RV32-NEXT: vsetivli zero, 2, e64, m1, ta, mu
				; LMULMAX8-RV32-NEXT: vand.vv v10, v8, v9
				; LMULMAX8-RV32-NEXT: vsrl.vi v8, v8, 2
				; LMULMAX8-RV32-NEXT: vand.vv v8, v8, v9
				; LMULMAX8-RV32-NEXT: vadd.vv v8, v10, v8
				; LMULMAX8-RV32-NEXT: vsrl.vi v9, v8, 4
				; LMULMAX8-RV32-NEXT: vadd.vv v8, v8, v9
				; LMULMAX8-RV32-NEXT: lui a1, 61681
				; LMULMAX8-RV32-NEXT: addi a1, a1, -241
				; LMULMAX8-RV32-NEXT: vsetivli zero, 4, e32, m1, ta, mu
				; LMULMAX8-RV32-NEXT: vmv.v.x v9, a1
				; LMULMAX8-RV32-NEXT: vsetivli zero, 2, e64, m1, ta, mu
				; LMULMAX8-RV32-NEXT: vand.vv v8, v8, v9
				; LMULMAX8-RV32-NEXT: lui a1, 4112
				; LMULMAX8-RV32-NEXT: addi a1, a1, 257
				; LMULMAX8-RV32-NEXT: vsetivli zero, 4, e32, m1, ta, mu
				; LMULMAX8-RV32-NEXT: vmv.v.x v9, a1
				; LMULMAX8-RV32-NEXT: vsetivli zero, 2, e64, m1, ta, mu
				; LMULMAX8-RV32-NEXT: vmul.vv v8, v8, v9
				; LMULMAX8-RV32-NEXT: addi a1, zero, 56
				; LMULMAX8-RV32-NEXT: vsrl.vx v8, v8, a1
				; LMULMAX8-RV32-NEXT: vse64.v v8, (a0)
				; LMULMAX8-RV32-NEXT: ret
				;
				; LMULMAX8-RV64-LABEL: cttz_v2i64:
				; LMULMAX8-RV64: # %bb.0:
				; LMULMAX8-RV64-NEXT: vsetivli zero, 2, e64, m1, ta, mu
				; LMULMAX8-RV64-NEXT: vle64.v v8, (a0)
				; LMULMAX8-RV64-NEXT: addi a1, zero, 1
				; LMULMAX8-RV64-NEXT: vsub.vx v9, v8, a1
				; LMULMAX8-RV64-NEXT: vxor.vi v8, v8, -1
				; LMULMAX8-RV64-NEXT: vand.vv v8, v8, v9
				; LMULMAX8-RV64-NEXT: vsrl.vi v9, v8, 1
				; LMULMAX8-RV64-NEXT: lui a1, 21845
				; LMULMAX8-RV64-NEXT: addiw a1, a1, 1365
				; LMULMAX8-RV64-NEXT: slli a1, a1, 12
				; LMULMAX8-RV64-NEXT: addi a1, a1, 1365
				; LMULMAX8-RV64-NEXT: slli a1, a1, 12
				; LMULMAX8-RV64-NEXT: addi a1, a1, 1365
				; LMULMAX8-RV64-NEXT: slli a1, a1, 12
				; LMULMAX8-RV64-NEXT: addi a1, a1, 1365
				; LMULMAX8-RV64-NEXT: vand.vx v9, v9, a1
				; LMULMAX8-RV64-NEXT: vsub.vv v8, v8, v9
				; LMULMAX8-RV64-NEXT: lui a1, 13107
				; LMULMAX8-RV64-NEXT: addiw a1, a1, 819
				; LMULMAX8-RV64-NEXT: slli a1, a1, 12
				; LMULMAX8-RV64-NEXT: addi a1, a1, 819
				; LMULMAX8-RV64-NEXT: slli a1, a1, 12
				; LMULMAX8-RV64-NEXT: addi a1, a1, 819
				; LMULMAX8-RV64-NEXT: slli a1, a1, 12
				; LMULMAX8-RV64-NEXT: addi a1, a1, 819
				; LMULMAX8-RV64-NEXT: vand.vx v9, v8, a1
				; LMULMAX8-RV64-NEXT: vsrl.vi v8, v8, 2
				; LMULMAX8-RV64-NEXT: vand.vx v8, v8, a1
				; LMULMAX8-RV64-NEXT: vadd.vv v8, v9, v8
				; LMULMAX8-RV64-NEXT: vsrl.vi v9, v8, 4
				; LMULMAX8-RV64-NEXT: vadd.vv v8, v8, v9
				; LMULMAX8-RV64-NEXT: lui a1, 3855
				; LMULMAX8-RV64-NEXT: addiw a1, a1, 241
				; LMULMAX8-RV64-NEXT: slli a1, a1, 12
				; LMULMAX8-RV64-NEXT: addi a1, a1, -241
				; LMULMAX8-RV64-NEXT: slli a1, a1, 12
				; LMULMAX8-RV64-NEXT: addi a1, a1, 241
				; LMULMAX8-RV64-NEXT: slli a1, a1, 12
				; LMULMAX8-RV64-NEXT: addi a1, a1, -241
				; LMULMAX8-RV64-NEXT: vand.vx v8, v8, a1
				; LMULMAX8-RV64-NEXT: lui a1, 4112
				; LMULMAX8-RV64-NEXT: addiw a1, a1, 257
				; LMULMAX8-RV64-NEXT: slli a1, a1, 16
				; LMULMAX8-RV64-NEXT: addi a1, a1, 257
				; LMULMAX8-RV64-NEXT: slli a1, a1, 16
				; LMULMAX8-RV64-NEXT: addi a1, a1, 257
				; LMULMAX8-RV64-NEXT: vmul.vx v8, v8, a1
				; LMULMAX8-RV64-NEXT: addi a1, zero, 56
				; LMULMAX8-RV64-NEXT: vsrl.vx v8, v8, a1
				; LMULMAX8-RV64-NEXT: vse64.v v8, (a0)
				; LMULMAX8-RV64-NEXT: ret
	%a = load <2 x i64>, <2 x i64>* %x			%a = load <2 x i64>, <2 x i64>* %x
	%b = load <2 x i64>, <2 x i64>* %y			%b = load <2 x i64>, <2 x i64>* %y
	%c = call <2 x i64> @llvm.cttz.v2i64(<2 x i64> %a, i1 false)			%c = call <2 x i64> @llvm.cttz.v2i64(<2 x i64> %a, i1 false)
	store <2 x i64> %c, <2 x i64>* %x			store <2 x i64> %c, <2 x i64>* %x
	ret void			ret void
	}			}
	declare <2 x i64> @llvm.cttz.v2i64(<2 x i64>, i1)			declare <2 x i64> @llvm.cttz.v2i64(<2 x i64>, i1)

	define void @cttz_v32i8(<32 x i8>* %x, <32 x i8>* %y) nounwind {			define void @cttz_v32i8(<32 x i8>* %x, <32 x i8>* %y) nounwind {
	; LMULMAX2-RV32-LABEL: cttz_v32i8:			; LMULMAX2-RV32I-LABEL: cttz_v32i8:
	; LMULMAX2-RV32: # %bb.0:			; LMULMAX2-RV32I: # %bb.0:
	; LMULMAX2-RV32-NEXT: addi a1, zero, 32			; LMULMAX2-RV32I-NEXT: addi a1, zero, 32
	; LMULMAX2-RV32-NEXT: vsetvli zero, a1, e8, m2, ta, mu			; LMULMAX2-RV32I-NEXT: vsetvli zero, a1, e8, m2, ta, mu
	; LMULMAX2-RV32-NEXT: vle8.v v8, (a0)			; LMULMAX2-RV32I-NEXT: vle8.v v8, (a0)
	; LMULMAX2-RV32-NEXT: addi a1, zero, 1			; LMULMAX2-RV32I-NEXT: addi a1, zero, 1
	; LMULMAX2-RV32-NEXT: vsub.vx v10, v8, a1			; LMULMAX2-RV32I-NEXT: vsub.vx v10, v8, a1
	; LMULMAX2-RV32-NEXT: vxor.vi v8, v8, -1			; LMULMAX2-RV32I-NEXT: vxor.vi v8, v8, -1
	; LMULMAX2-RV32-NEXT: vand.vv v8, v8, v10			; LMULMAX2-RV32I-NEXT: vand.vv v8, v8, v10
	; LMULMAX2-RV32-NEXT: vsrl.vi v10, v8, 1			; LMULMAX2-RV32I-NEXT: vsrl.vi v10, v8, 1
	; LMULMAX2-RV32-NEXT: addi a1, zero, 85			; LMULMAX2-RV32I-NEXT: addi a1, zero, 85
	; LMULMAX2-RV32-NEXT: vand.vx v10, v10, a1			; LMULMAX2-RV32I-NEXT: vand.vx v10, v10, a1
	; LMULMAX2-RV32-NEXT: vsub.vv v8, v8, v10			; LMULMAX2-RV32I-NEXT: vsub.vv v8, v8, v10
	; LMULMAX2-RV32-NEXT: addi a1, zero, 51			; LMULMAX2-RV32I-NEXT: addi a1, zero, 51
	; LMULMAX2-RV32-NEXT: vand.vx v10, v8, a1			; LMULMAX2-RV32I-NEXT: vand.vx v10, v8, a1
	; LMULMAX2-RV32-NEXT: vsrl.vi v8, v8, 2			; LMULMAX2-RV32I-NEXT: vsrl.vi v8, v8, 2
	; LMULMAX2-RV32-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV32I-NEXT: vand.vx v8, v8, a1
	; LMULMAX2-RV32-NEXT: vadd.vv v8, v10, v8			; LMULMAX2-RV32I-NEXT: vadd.vv v8, v10, v8
	; LMULMAX2-RV32-NEXT: vsrl.vi v10, v8, 4			; LMULMAX2-RV32I-NEXT: vsrl.vi v10, v8, 4
	; LMULMAX2-RV32-NEXT: vadd.vv v8, v8, v10			; LMULMAX2-RV32I-NEXT: vadd.vv v8, v8, v10
	; LMULMAX2-RV32-NEXT: vand.vi v8, v8, 15			; LMULMAX2-RV32I-NEXT: vand.vi v8, v8, 15
	; LMULMAX2-RV32-NEXT: vse8.v v8, (a0)			; LMULMAX2-RV32I-NEXT: vse8.v v8, (a0)
	; LMULMAX2-RV32-NEXT: ret			; LMULMAX2-RV32I-NEXT: ret
	;			;
	; LMULMAX2-RV64-LABEL: cttz_v32i8:			; LMULMAX2-RV64I-LABEL: cttz_v32i8:
	; LMULMAX2-RV64: # %bb.0:			; LMULMAX2-RV64I: # %bb.0:
	; LMULMAX2-RV64-NEXT: addi a1, zero, 32			; LMULMAX2-RV64I-NEXT: addi a1, zero, 32
	; LMULMAX2-RV64-NEXT: vsetvli zero, a1, e8, m2, ta, mu			; LMULMAX2-RV64I-NEXT: vsetvli zero, a1, e8, m2, ta, mu
	; LMULMAX2-RV64-NEXT: vle8.v v8, (a0)			; LMULMAX2-RV64I-NEXT: vle8.v v8, (a0)
	; LMULMAX2-RV64-NEXT: addi a1, zero, 1			; LMULMAX2-RV64I-NEXT: addi a1, zero, 1
	; LMULMAX2-RV64-NEXT: vsub.vx v10, v8, a1			; LMULMAX2-RV64I-NEXT: vsub.vx v10, v8, a1
	; LMULMAX2-RV64-NEXT: vxor.vi v8, v8, -1			; LMULMAX2-RV64I-NEXT: vxor.vi v8, v8, -1
	; LMULMAX2-RV64-NEXT: vand.vv v8, v8, v10			; LMULMAX2-RV64I-NEXT: vand.vv v8, v8, v10
	; LMULMAX2-RV64-NEXT: vsrl.vi v10, v8, 1			; LMULMAX2-RV64I-NEXT: vsrl.vi v10, v8, 1
	; LMULMAX2-RV64-NEXT: addi a1, zero, 85			; LMULMAX2-RV64I-NEXT: addi a1, zero, 85
	; LMULMAX2-RV64-NEXT: vand.vx v10, v10, a1			; LMULMAX2-RV64I-NEXT: vand.vx v10, v10, a1
	; LMULMAX2-RV64-NEXT: vsub.vv v8, v8, v10			; LMULMAX2-RV64I-NEXT: vsub.vv v8, v8, v10
	; LMULMAX2-RV64-NEXT: addi a1, zero, 51			; LMULMAX2-RV64I-NEXT: addi a1, zero, 51
	; LMULMAX2-RV64-NEXT: vand.vx v10, v8, a1			; LMULMAX2-RV64I-NEXT: vand.vx v10, v8, a1
	; LMULMAX2-RV64-NEXT: vsrl.vi v8, v8, 2			; LMULMAX2-RV64I-NEXT: vsrl.vi v8, v8, 2
	; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV64I-NEXT: vand.vx v8, v8, a1
	; LMULMAX2-RV64-NEXT: vadd.vv v8, v10, v8			; LMULMAX2-RV64I-NEXT: vadd.vv v8, v10, v8
	; LMULMAX2-RV64-NEXT: vsrl.vi v10, v8, 4			; LMULMAX2-RV64I-NEXT: vsrl.vi v10, v8, 4
	; LMULMAX2-RV64-NEXT: vadd.vv v8, v8, v10			; LMULMAX2-RV64I-NEXT: vadd.vv v8, v8, v10
	; LMULMAX2-RV64-NEXT: vand.vi v8, v8, 15			; LMULMAX2-RV64I-NEXT: vand.vi v8, v8, 15
	; LMULMAX2-RV64-NEXT: vse8.v v8, (a0)			; LMULMAX2-RV64I-NEXT: vse8.v v8, (a0)
	; LMULMAX2-RV64-NEXT: ret			; LMULMAX2-RV64I-NEXT: ret
	;			;
	; LMULMAX1-RV32-LABEL: cttz_v32i8:			; LMULMAX1-RV32I-LABEL: cttz_v32i8:
	; LMULMAX1-RV32: # %bb.0:			; LMULMAX1-RV32I: # %bb.0:
	; LMULMAX1-RV32-NEXT: vsetivli zero, 16, e8, m1, ta, mu			; LMULMAX1-RV32I-NEXT: vsetivli zero, 16, e8, m1, ta, mu
	; LMULMAX1-RV32-NEXT: addi a1, a0, 16			; LMULMAX1-RV32I-NEXT: addi a1, a0, 16
	; LMULMAX1-RV32-NEXT: vle8.v v8, (a1)			; LMULMAX1-RV32I-NEXT: vle8.v v8, (a1)
	; LMULMAX1-RV32-NEXT: vle8.v v9, (a0)			; LMULMAX1-RV32I-NEXT: vle8.v v9, (a0)
	; LMULMAX1-RV32-NEXT: addi a2, zero, 1			; LMULMAX1-RV32I-NEXT: addi a2, zero, 1
	; LMULMAX1-RV32-NEXT: vsub.vx v10, v8, a2			; LMULMAX1-RV32I-NEXT: vsub.vx v10, v8, a2
	; LMULMAX1-RV32-NEXT: vxor.vi v8, v8, -1			; LMULMAX1-RV32I-NEXT: vxor.vi v8, v8, -1
	; LMULMAX1-RV32-NEXT: vand.vv v8, v8, v10			; LMULMAX1-RV32I-NEXT: vand.vv v8, v8, v10
	; LMULMAX1-RV32-NEXT: vsrl.vi v10, v8, 1			; LMULMAX1-RV32I-NEXT: vsrl.vi v10, v8, 1
	; LMULMAX1-RV32-NEXT: addi a3, zero, 85			; LMULMAX1-RV32I-NEXT: addi a3, zero, 85
	; LMULMAX1-RV32-NEXT: vand.vx v10, v10, a3			; LMULMAX1-RV32I-NEXT: vand.vx v10, v10, a3
	; LMULMAX1-RV32-NEXT: vsub.vv v8, v8, v10			; LMULMAX1-RV32I-NEXT: vsub.vv v8, v8, v10
	; LMULMAX1-RV32-NEXT: addi a4, zero, 51			; LMULMAX1-RV32I-NEXT: addi a4, zero, 51
	; LMULMAX1-RV32-NEXT: vand.vx v10, v8, a4			; LMULMAX1-RV32I-NEXT: vand.vx v10, v8, a4
	; LMULMAX1-RV32-NEXT: vsrl.vi v8, v8, 2			; LMULMAX1-RV32I-NEXT: vsrl.vi v8, v8, 2
	; LMULMAX1-RV32-NEXT: vand.vx v8, v8, a4			; LMULMAX1-RV32I-NEXT: vand.vx v8, v8, a4
	; LMULMAX1-RV32-NEXT: vadd.vv v8, v10, v8			; LMULMAX1-RV32I-NEXT: vadd.vv v8, v10, v8
	; LMULMAX1-RV32-NEXT: vsrl.vi v10, v8, 4			; LMULMAX1-RV32I-NEXT: vsrl.vi v10, v8, 4
	; LMULMAX1-RV32-NEXT: vadd.vv v8, v8, v10			; LMULMAX1-RV32I-NEXT: vadd.vv v8, v8, v10
	; LMULMAX1-RV32-NEXT: vand.vi v8, v8, 15			; LMULMAX1-RV32I-NEXT: vand.vi v8, v8, 15
	; LMULMAX1-RV32-NEXT: vsub.vx v10, v9, a2			; LMULMAX1-RV32I-NEXT: vsub.vx v10, v9, a2
	; LMULMAX1-RV32-NEXT: vxor.vi v9, v9, -1			; LMULMAX1-RV32I-NEXT: vxor.vi v9, v9, -1
	; LMULMAX1-RV32-NEXT: vand.vv v9, v9, v10			; LMULMAX1-RV32I-NEXT: vand.vv v9, v9, v10
	; LMULMAX1-RV32-NEXT: vsrl.vi v10, v9, 1			; LMULMAX1-RV32I-NEXT: vsrl.vi v10, v9, 1
	; LMULMAX1-RV32-NEXT: vand.vx v10, v10, a3			; LMULMAX1-RV32I-NEXT: vand.vx v10, v10, a3
	; LMULMAX1-RV32-NEXT: vsub.vv v9, v9, v10			; LMULMAX1-RV32I-NEXT: vsub.vv v9, v9, v10
	; LMULMAX1-RV32-NEXT: vand.vx v10, v9, a4			; LMULMAX1-RV32I-NEXT: vand.vx v10, v9, a4
	; LMULMAX1-RV32-NEXT: vsrl.vi v9, v9, 2			; LMULMAX1-RV32I-NEXT: vsrl.vi v9, v9, 2
	; LMULMAX1-RV32-NEXT: vand.vx v9, v9, a4			; LMULMAX1-RV32I-NEXT: vand.vx v9, v9, a4
	; LMULMAX1-RV32-NEXT: vadd.vv v9, v10, v9			; LMULMAX1-RV32I-NEXT: vadd.vv v9, v10, v9
	; LMULMAX1-RV32-NEXT: vsrl.vi v10, v9, 4			; LMULMAX1-RV32I-NEXT: vsrl.vi v10, v9, 4
	; LMULMAX1-RV32-NEXT: vadd.vv v9, v9, v10			; LMULMAX1-RV32I-NEXT: vadd.vv v9, v9, v10
	; LMULMAX1-RV32-NEXT: vand.vi v9, v9, 15			; LMULMAX1-RV32I-NEXT: vand.vi v9, v9, 15
	; LMULMAX1-RV32-NEXT: vse8.v v9, (a0)			; LMULMAX1-RV32I-NEXT: vse8.v v9, (a0)
	; LMULMAX1-RV32-NEXT: vse8.v v8, (a1)			; LMULMAX1-RV32I-NEXT: vse8.v v8, (a1)
	; LMULMAX1-RV32-NEXT: ret			; LMULMAX1-RV32I-NEXT: ret
	;			;
	; LMULMAX1-RV64-LABEL: cttz_v32i8:			; LMULMAX2-RV32D-LABEL: cttz_v32i8:
	; LMULMAX1-RV64: # %bb.0:			; LMULMAX2-RV32D: # %bb.0:
	; LMULMAX1-RV64-NEXT: vsetivli zero, 16, e8, m1, ta, mu			; LMULMAX2-RV32D-NEXT: addi a1, zero, 32
	; LMULMAX1-RV64-NEXT: addi a1, a0, 16			; LMULMAX2-RV32D-NEXT: vsetvli zero, a1, e8, m2, ta, mu
	; LMULMAX1-RV64-NEXT: vle8.v v8, (a1)			; LMULMAX2-RV32D-NEXT: vle8.v v8, (a0)
	; LMULMAX1-RV64-NEXT: vle8.v v9, (a0)			; LMULMAX2-RV32D-NEXT: vsetivli zero, 16, e8, m2, ta, mu
	; LMULMAX1-RV64-NEXT: addi a2, zero, 1			; LMULMAX2-RV32D-NEXT: vslidedown.vi v14, v8, 16
	; LMULMAX1-RV64-NEXT: vsub.vx v10, v8, a2			; LMULMAX2-RV32D-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
	; LMULMAX1-RV64-NEXT: vxor.vi v8, v8, -1			; LMULMAX2-RV32D-NEXT: vrsub.vi v10, v14, 0
	; LMULMAX1-RV64-NEXT: vand.vv v8, v8, v10			; LMULMAX2-RV32D-NEXT: vand.vv v10, v14, v10
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v8, 1			; LMULMAX2-RV32D-NEXT: vsetvli zero, zero, e32, m2, ta, mu
	; LMULMAX1-RV64-NEXT: addi a3, zero, 85			; LMULMAX2-RV32D-NEXT: vzext.vf4 v12, v10
	; LMULMAX1-RV64-NEXT: vand.vx v10, v10, a3			; LMULMAX2-RV32D-NEXT: vfcvt.f.xu.v v10, v12
	; LMULMAX1-RV64-NEXT: vsub.vv v8, v8, v10			; LMULMAX2-RV32D-NEXT: vsetvli zero, zero, e16, m1, ta, mu
	; LMULMAX1-RV64-NEXT: addi a4, zero, 51			; LMULMAX2-RV32D-NEXT: vnsrl.wi v12, v10, 23
	; LMULMAX1-RV64-NEXT: vand.vx v10, v8, a4			; LMULMAX2-RV32D-NEXT: vsetvli zero, zero, e8, mf2, ta, mu
	; LMULMAX1-RV64-NEXT: vsrl.vi v8, v8, 2			; LMULMAX2-RV32D-NEXT: vnsrl.wi v10, v12, 0
	; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a4			; LMULMAX2-RV32D-NEXT: addi a2, zero, 127
	; LMULMAX1-RV64-NEXT: vadd.vv v8, v10, v8			; LMULMAX2-RV32D-NEXT: vsub.vx v16, v10, a2
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v8, 4			; LMULMAX2-RV32D-NEXT: vsetivli zero, 16, e8, m1, ta, mu
	; LMULMAX1-RV64-NEXT: vadd.vv v8, v8, v10			; LMULMAX2-RV32D-NEXT: vmv.v.i v12, 0
	; LMULMAX1-RV64-NEXT: vand.vi v8, v8, 15			; LMULMAX2-RV32D-NEXT: vsetivli zero, 8, e8, m1, tu, mu
	; LMULMAX1-RV64-NEXT: vsub.vx v10, v9, a2			; LMULMAX2-RV32D-NEXT: vmv1r.v v10, v12
	; LMULMAX1-RV64-NEXT: vxor.vi v9, v9, -1			; LMULMAX2-RV32D-NEXT: vslideup.vi v10, v16, 0
	; LMULMAX1-RV64-NEXT: vand.vv v9, v9, v10			; LMULMAX2-RV32D-NEXT: vsetvli zero, zero, e8, m1, ta, mu
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v9, 1			; LMULMAX2-RV32D-NEXT: vslidedown.vi v14, v14, 8
	; LMULMAX1-RV64-NEXT: vand.vx v10, v10, a3			; LMULMAX2-RV32D-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
	; LMULMAX1-RV64-NEXT: vsub.vv v9, v9, v10			; LMULMAX2-RV32D-NEXT: vrsub.vi v15, v14, 0
	; LMULMAX1-RV64-NEXT: vand.vx v10, v9, a4			; LMULMAX2-RV32D-NEXT: vand.vv v14, v14, v15
	; LMULMAX1-RV64-NEXT: vsrl.vi v9, v9, 2			; LMULMAX2-RV32D-NEXT: vsetvli zero, zero, e32, m2, ta, mu
	; LMULMAX1-RV64-NEXT: vand.vx v9, v9, a4			; LMULMAX2-RV32D-NEXT: vzext.vf4 v16, v14
	; LMULMAX1-RV64-NEXT: vadd.vv v9, v10, v9			; LMULMAX2-RV32D-NEXT: vfcvt.f.xu.v v14, v16
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v9, 4			; LMULMAX2-RV32D-NEXT: vsetvli zero, zero, e16, m1, ta, mu
	; LMULMAX1-RV64-NEXT: vadd.vv v9, v9, v10			; LMULMAX2-RV32D-NEXT: vnsrl.wi v16, v14, 23
	; LMULMAX1-RV64-NEXT: vand.vi v9, v9, 15			; LMULMAX2-RV32D-NEXT: vsetvli zero, zero, e8, mf2, ta, mu
	; LMULMAX1-RV64-NEXT: vse8.v v9, (a0)			; LMULMAX2-RV32D-NEXT: vnsrl.wi v14, v16, 0
	; LMULMAX1-RV64-NEXT: vse8.v v8, (a1)			; LMULMAX2-RV32D-NEXT: vsub.vx v14, v14, a2
	; LMULMAX1-RV64-NEXT: ret			; LMULMAX2-RV32D-NEXT: vsetivli zero, 16, e8, m1, tu, mu
				; LMULMAX2-RV32D-NEXT: vslideup.vi v10, v14, 8
				; LMULMAX2-RV32D-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
				; LMULMAX2-RV32D-NEXT: vrsub.vi v14, v8, 0
				; LMULMAX2-RV32D-NEXT: vand.vv v14, v8, v14
				; LMULMAX2-RV32D-NEXT: vsetvli zero, zero, e32, m2, ta, mu
				; LMULMAX2-RV32D-NEXT: vzext.vf4 v16, v14
				; LMULMAX2-RV32D-NEXT: vfcvt.f.xu.v v14, v16
				; LMULMAX2-RV32D-NEXT: vsetvli zero, zero, e16, m1, ta, mu
				; LMULMAX2-RV32D-NEXT: vnsrl.wi v16, v14, 23
				; LMULMAX2-RV32D-NEXT: vsetvli zero, zero, e8, mf2, ta, mu
				; LMULMAX2-RV32D-NEXT: vnsrl.wi v14, v16, 0
				; LMULMAX2-RV32D-NEXT: vsub.vx v14, v14, a2
				; LMULMAX2-RV32D-NEXT: vsetivli zero, 8, e8, m1, tu, mu
				; LMULMAX2-RV32D-NEXT: vslideup.vi v12, v14, 0
				; LMULMAX2-RV32D-NEXT: vsetvli zero, zero, e8, m1, ta, mu
				; LMULMAX2-RV32D-NEXT: vslidedown.vi v14, v8, 8
				; LMULMAX2-RV32D-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
				; LMULMAX2-RV32D-NEXT: vrsub.vi v15, v14, 0
				; LMULMAX2-RV32D-NEXT: vand.vv v14, v14, v15
				; LMULMAX2-RV32D-NEXT: vsetvli zero, zero, e32, m2, ta, mu
				; LMULMAX2-RV32D-NEXT: vzext.vf4 v16, v14
				; LMULMAX2-RV32D-NEXT: vfcvt.f.xu.v v14, v16
				; LMULMAX2-RV32D-NEXT: vsetvli zero, zero, e16, m1, ta, mu
				; LMULMAX2-RV32D-NEXT: vnsrl.wi v16, v14, 23
				; LMULMAX2-RV32D-NEXT: vsetvli zero, zero, e8, mf2, ta, mu
				; LMULMAX2-RV32D-NEXT: vnsrl.wi v14, v16, 0
				; LMULMAX2-RV32D-NEXT: vsub.vx v14, v14, a2
				; LMULMAX2-RV32D-NEXT: vsetivli zero, 16, e8, m1, tu, mu
				; LMULMAX2-RV32D-NEXT: vslideup.vi v12, v14, 8
				; LMULMAX2-RV32D-NEXT: vsetvli zero, a1, e8, m2, ta, mu
				; LMULMAX2-RV32D-NEXT: vmv.v.i v14, 0
				; LMULMAX2-RV32D-NEXT: vsetivli zero, 16, e8, m2, tu, mu
				; LMULMAX2-RV32D-NEXT: vslideup.vi v14, v12, 0
				; LMULMAX2-RV32D-NEXT: vsetvli zero, a1, e8, m2, tu, mu
				; LMULMAX2-RV32D-NEXT: vslideup.vi v14, v10, 16
				; LMULMAX2-RV32D-NEXT: vsetvli zero, zero, e8, m2, ta, mu
				; LMULMAX2-RV32D-NEXT: vmseq.vi v0, v8, 0
				; LMULMAX2-RV32D-NEXT: vmerge.vim v8, v14, 8, v0
				; LMULMAX2-RV32D-NEXT: vse8.v v8, (a0)
				; LMULMAX2-RV32D-NEXT: ret
				;
				; LMULMAX2-RV64D-LABEL: cttz_v32i8:
				; LMULMAX2-RV64D: # %bb.0:
				; LMULMAX2-RV64D-NEXT: addi a1, zero, 32
				; LMULMAX2-RV64D-NEXT: vsetvli zero, a1, e8, m2, ta, mu
				; LMULMAX2-RV64D-NEXT: vle8.v v8, (a0)
				; LMULMAX2-RV64D-NEXT: vsetivli zero, 16, e8, m2, ta, mu
				; LMULMAX2-RV64D-NEXT: vslidedown.vi v14, v8, 16
				; LMULMAX2-RV64D-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
				; LMULMAX2-RV64D-NEXT: vrsub.vi v10, v14, 0
				; LMULMAX2-RV64D-NEXT: vand.vv v10, v14, v10
				; LMULMAX2-RV64D-NEXT: vsetvli zero, zero, e32, m2, ta, mu
				; LMULMAX2-RV64D-NEXT: vzext.vf4 v12, v10
				; LMULMAX2-RV64D-NEXT: vfcvt.f.xu.v v10, v12
				; LMULMAX2-RV64D-NEXT: vsetvli zero, zero, e16, m1, ta, mu
				; LMULMAX2-RV64D-NEXT: vnsrl.wi v12, v10, 23
				; LMULMAX2-RV64D-NEXT: vsetvli zero, zero, e8, mf2, ta, mu
				; LMULMAX2-RV64D-NEXT: vnsrl.wi v10, v12, 0
				; LMULMAX2-RV64D-NEXT: addi a2, zero, 127
				; LMULMAX2-RV64D-NEXT: vsub.vx v16, v10, a2
				; LMULMAX2-RV64D-NEXT: vsetivli zero, 16, e8, m1, ta, mu
				; LMULMAX2-RV64D-NEXT: vmv.v.i v12, 0
				; LMULMAX2-RV64D-NEXT: vsetivli zero, 8, e8, m1, tu, mu
				; LMULMAX2-RV64D-NEXT: vmv1r.v v10, v12
				; LMULMAX2-RV64D-NEXT: vslideup.vi v10, v16, 0
				; LMULMAX2-RV64D-NEXT: vsetvli zero, zero, e8, m1, ta, mu
				; LMULMAX2-RV64D-NEXT: vslidedown.vi v14, v14, 8
				; LMULMAX2-RV64D-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
				; LMULMAX2-RV64D-NEXT: vrsub.vi v15, v14, 0
				; LMULMAX2-RV64D-NEXT: vand.vv v14, v14, v15
				; LMULMAX2-RV64D-NEXT: vsetvli zero, zero, e32, m2, ta, mu
				; LMULMAX2-RV64D-NEXT: vzext.vf4 v16, v14
				; LMULMAX2-RV64D-NEXT: vfcvt.f.xu.v v14, v16
				; LMULMAX2-RV64D-NEXT: vsetvli zero, zero, e16, m1, ta, mu
				; LMULMAX2-RV64D-NEXT: vnsrl.wi v16, v14, 23
				; LMULMAX2-RV64D-NEXT: vsetvli zero, zero, e8, mf2, ta, mu
				; LMULMAX2-RV64D-NEXT: vnsrl.wi v14, v16, 0
				; LMULMAX2-RV64D-NEXT: vsub.vx v14, v14, a2
				; LMULMAX2-RV64D-NEXT: vsetivli zero, 16, e8, m1, tu, mu
				; LMULMAX2-RV64D-NEXT: vslideup.vi v10, v14, 8
				; LMULMAX2-RV64D-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
				; LMULMAX2-RV64D-NEXT: vrsub.vi v14, v8, 0
				; LMULMAX2-RV64D-NEXT: vand.vv v14, v8, v14
				; LMULMAX2-RV64D-NEXT: vsetvli zero, zero, e32, m2, ta, mu
				; LMULMAX2-RV64D-NEXT: vzext.vf4 v16, v14
				; LMULMAX2-RV64D-NEXT: vfcvt.f.xu.v v14, v16
				; LMULMAX2-RV64D-NEXT: vsetvli zero, zero, e16, m1, ta, mu
				; LMULMAX2-RV64D-NEXT: vnsrl.wi v16, v14, 23
				; LMULMAX2-RV64D-NEXT: vsetvli zero, zero, e8, mf2, ta, mu
				; LMULMAX2-RV64D-NEXT: vnsrl.wi v14, v16, 0
				; LMULMAX2-RV64D-NEXT: vsub.vx v14, v14, a2
				; LMULMAX2-RV64D-NEXT: vsetivli zero, 8, e8, m1, tu, mu
				; LMULMAX2-RV64D-NEXT: vslideup.vi v12, v14, 0
				; LMULMAX2-RV64D-NEXT: vsetvli zero, zero, e8, m1, ta, mu
				; LMULMAX2-RV64D-NEXT: vslidedown.vi v14, v8, 8
				; LMULMAX2-RV64D-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
				; LMULMAX2-RV64D-NEXT: vrsub.vi v15, v14, 0
				; LMULMAX2-RV64D-NEXT: vand.vv v14, v14, v15
				; LMULMAX2-RV64D-NEXT: vsetvli zero, zero, e32, m2, ta, mu
				; LMULMAX2-RV64D-NEXT: vzext.vf4 v16, v14
				; LMULMAX2-RV64D-NEXT: vfcvt.f.xu.v v14, v16
				; LMULMAX2-RV64D-NEXT: vsetvli zero, zero, e16, m1, ta, mu
				; LMULMAX2-RV64D-NEXT: vnsrl.wi v16, v14, 23
				; LMULMAX2-RV64D-NEXT: vsetvli zero, zero, e8, mf2, ta, mu
				; LMULMAX2-RV64D-NEXT: vnsrl.wi v14, v16, 0
				; LMULMAX2-RV64D-NEXT: vsub.vx v14, v14, a2
				; LMULMAX2-RV64D-NEXT: vsetivli zero, 16, e8, m1, tu, mu
				; LMULMAX2-RV64D-NEXT: vslideup.vi v12, v14, 8
				; LMULMAX2-RV64D-NEXT: vsetvli zero, a1, e8, m2, ta, mu
				; LMULMAX2-RV64D-NEXT: vmv.v.i v14, 0
				; LMULMAX2-RV64D-NEXT: vsetivli zero, 16, e8, m2, tu, mu
				; LMULMAX2-RV64D-NEXT: vslideup.vi v14, v12, 0
				; LMULMAX2-RV64D-NEXT: vsetvli zero, a1, e8, m2, tu, mu
				; LMULMAX2-RV64D-NEXT: vslideup.vi v14, v10, 16
				; LMULMAX2-RV64D-NEXT: vsetvli zero, zero, e8, m2, ta, mu
				; LMULMAX2-RV64D-NEXT: vmseq.vi v0, v8, 0
				; LMULMAX2-RV64D-NEXT: vmerge.vim v8, v14, 8, v0
				; LMULMAX2-RV64D-NEXT: vse8.v v8, (a0)
				; LMULMAX2-RV64D-NEXT: ret
				;
				; LMULMAX1-RV32D-LABEL: cttz_v32i8:
				; LMULMAX1-RV32D: # %bb.0:
				; LMULMAX1-RV32D-NEXT: vsetivli zero, 16, e8, m1, ta, mu
				; LMULMAX1-RV32D-NEXT: addi a1, a0, 16
				; LMULMAX1-RV32D-NEXT: vle8.v v11, (a1)
				; LMULMAX1-RV32D-NEXT: vle8.v v8, (a0)
				; LMULMAX1-RV32D-NEXT: vsetivli zero, 8, e8, m1, ta, mu
				; LMULMAX1-RV32D-NEXT: vslidedown.vi v10, v11, 8
				; LMULMAX1-RV32D-NEXT: vsetivli zero, 4, e8, mf4, ta, mu
				; LMULMAX1-RV32D-NEXT: vrsub.vi v9, v10, 0
				; LMULMAX1-RV32D-NEXT: vand.vv v9, v10, v9
				; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e32, m1, ta, mu
				; LMULMAX1-RV32D-NEXT: vzext.vf4 v12, v9
				; LMULMAX1-RV32D-NEXT: vfcvt.f.xu.v v9, v12
				; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e16, mf2, ta, mu
				; LMULMAX1-RV32D-NEXT: vnsrl.wi v9, v9, 23
				; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
				; LMULMAX1-RV32D-NEXT: vnsrl.wi v9, v9, 0
				; LMULMAX1-RV32D-NEXT: addi a2, zero, 127
				; LMULMAX1-RV32D-NEXT: vsub.vx v12, v9, a2
				; LMULMAX1-RV32D-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
				; LMULMAX1-RV32D-NEXT: vmv.v.i v9, 0
				; LMULMAX1-RV32D-NEXT: vsetivli zero, 4, e8, mf2, tu, mu
				; LMULMAX1-RV32D-NEXT: vmv1r.v v13, v9
				; LMULMAX1-RV32D-NEXT: vslideup.vi v13, v12, 0
				; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e8, mf2, ta, mu
				; LMULMAX1-RV32D-NEXT: vslidedown.vi v10, v10, 4
				; LMULMAX1-RV32D-NEXT: vsetivli zero, 4, e8, mf4, ta, mu
				; LMULMAX1-RV32D-NEXT: vrsub.vi v12, v10, 0
				; LMULMAX1-RV32D-NEXT: vand.vv v10, v10, v12
				; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e32, m1, ta, mu
				; LMULMAX1-RV32D-NEXT: vzext.vf4 v12, v10
				; LMULMAX1-RV32D-NEXT: vfcvt.f.xu.v v10, v12
				; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e16, mf2, ta, mu
				; LMULMAX1-RV32D-NEXT: vnsrl.wi v10, v10, 23
				; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
				; LMULMAX1-RV32D-NEXT: vnsrl.wi v10, v10, 0
				; LMULMAX1-RV32D-NEXT: vsub.vx v10, v10, a2
				; LMULMAX1-RV32D-NEXT: vsetivli zero, 8, e8, mf2, tu, mu
				; LMULMAX1-RV32D-NEXT: vslideup.vi v13, v10, 4
				; LMULMAX1-RV32D-NEXT: vsetivli zero, 4, e8, mf2, ta, mu
				; LMULMAX1-RV32D-NEXT: vslidedown.vi v10, v11, 4
				; LMULMAX1-RV32D-NEXT: vsetivli zero, 4, e8, mf4, ta, mu
				; LMULMAX1-RV32D-NEXT: vrsub.vi v12, v10, 0
				; LMULMAX1-RV32D-NEXT: vand.vv v10, v10, v12
				; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e32, m1, ta, mu
				; LMULMAX1-RV32D-NEXT: vzext.vf4 v12, v10
				; LMULMAX1-RV32D-NEXT: vfcvt.f.xu.v v10, v12
				; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e16, mf2, ta, mu
				; LMULMAX1-RV32D-NEXT: vnsrl.wi v10, v10, 23
				; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
				; LMULMAX1-RV32D-NEXT: vnsrl.wi v10, v10, 0
				; LMULMAX1-RV32D-NEXT: vsub.vx v10, v10, a2
				; LMULMAX1-RV32D-NEXT: vrsub.vi v12, v11, 0
				; LMULMAX1-RV32D-NEXT: vand.vv v12, v11, v12
				; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e32, m1, ta, mu
				; LMULMAX1-RV32D-NEXT: vzext.vf4 v14, v12
				; LMULMAX1-RV32D-NEXT: vfcvt.f.xu.v v12, v14
				; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e16, mf2, ta, mu
				; LMULMAX1-RV32D-NEXT: vnsrl.wi v12, v12, 23
				; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
				; LMULMAX1-RV32D-NEXT: vnsrl.wi v12, v12, 0
				; LMULMAX1-RV32D-NEXT: vsub.vx v12, v12, a2
				; LMULMAX1-RV32D-NEXT: vsetivli zero, 4, e8, mf2, tu, mu
				; LMULMAX1-RV32D-NEXT: vmv1r.v v14, v9
				; LMULMAX1-RV32D-NEXT: vslideup.vi v14, v12, 0
				; LMULMAX1-RV32D-NEXT: vsetivli zero, 8, e8, mf2, tu, mu
				; LMULMAX1-RV32D-NEXT: vslideup.vi v14, v10, 4
				; LMULMAX1-RV32D-NEXT: vsetivli zero, 16, e8, m1, ta, mu
				; LMULMAX1-RV32D-NEXT: vmv.v.i v10, 0
				; LMULMAX1-RV32D-NEXT: vsetivli zero, 8, e8, m1, tu, mu
				; LMULMAX1-RV32D-NEXT: vmv1r.v v12, v10
				; LMULMAX1-RV32D-NEXT: vslideup.vi v12, v14, 0
				; LMULMAX1-RV32D-NEXT: vsetivli zero, 16, e8, m1, tu, mu
				; LMULMAX1-RV32D-NEXT: vslideup.vi v12, v13, 8
				; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e8, m1, ta, mu
				; LMULMAX1-RV32D-NEXT: vmseq.vi v0, v11, 0
				; LMULMAX1-RV32D-NEXT: vmerge.vim v11, v12, 8, v0
				; LMULMAX1-RV32D-NEXT: vsetivli zero, 8, e8, m1, ta, mu
				; LMULMAX1-RV32D-NEXT: vslidedown.vi v12, v8, 8
				; LMULMAX1-RV32D-NEXT: vsetivli zero, 4, e8, mf4, ta, mu
				; LMULMAX1-RV32D-NEXT: vrsub.vi v13, v12, 0
				; LMULMAX1-RV32D-NEXT: vand.vv v13, v12, v13
				; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e32, m1, ta, mu
				; LMULMAX1-RV32D-NEXT: vzext.vf4 v14, v13
				; LMULMAX1-RV32D-NEXT: vfcvt.f.xu.v v13, v14
				; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e16, mf2, ta, mu
				; LMULMAX1-RV32D-NEXT: vnsrl.wi v13, v13, 23
				; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
				; LMULMAX1-RV32D-NEXT: vnsrl.wi v13, v13, 0
				; LMULMAX1-RV32D-NEXT: vsub.vx v13, v13, a2
				; LMULMAX1-RV32D-NEXT: vsetivli zero, 4, e8, mf2, tu, mu
				; LMULMAX1-RV32D-NEXT: vmv1r.v v14, v9
				; LMULMAX1-RV32D-NEXT: vslideup.vi v14, v13, 0
				; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e8, mf2, ta, mu
				; LMULMAX1-RV32D-NEXT: vslidedown.vi v12, v12, 4
				; LMULMAX1-RV32D-NEXT: vsetivli zero, 4, e8, mf4, ta, mu
				; LMULMAX1-RV32D-NEXT: vrsub.vi v13, v12, 0
				; LMULMAX1-RV32D-NEXT: vand.vv v12, v12, v13
				; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e32, m1, ta, mu
				; LMULMAX1-RV32D-NEXT: vzext.vf4 v13, v12
				; LMULMAX1-RV32D-NEXT: vfcvt.f.xu.v v12, v13
				; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e16, mf2, ta, mu
				; LMULMAX1-RV32D-NEXT: vnsrl.wi v12, v12, 23
				; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
				; LMULMAX1-RV32D-NEXT: vnsrl.wi v12, v12, 0
				; LMULMAX1-RV32D-NEXT: vsub.vx v12, v12, a2
				; LMULMAX1-RV32D-NEXT: vsetivli zero, 8, e8, mf2, tu, mu
				; LMULMAX1-RV32D-NEXT: vslideup.vi v14, v12, 4
				; LMULMAX1-RV32D-NEXT: vsetivli zero, 4, e8, mf2, ta, mu
				; LMULMAX1-RV32D-NEXT: vslidedown.vi v12, v8, 4
				; LMULMAX1-RV32D-NEXT: vsetivli zero, 4, e8, mf4, ta, mu
				; LMULMAX1-RV32D-NEXT: vrsub.vi v13, v12, 0
				; LMULMAX1-RV32D-NEXT: vand.vv v12, v12, v13
				; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e32, m1, ta, mu
				; LMULMAX1-RV32D-NEXT: vzext.vf4 v13, v12
				; LMULMAX1-RV32D-NEXT: vfcvt.f.xu.v v12, v13
				; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e16, mf2, ta, mu
				; LMULMAX1-RV32D-NEXT: vnsrl.wi v12, v12, 23
				; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
				; LMULMAX1-RV32D-NEXT: vnsrl.wi v12, v12, 0
				; LMULMAX1-RV32D-NEXT: vsub.vx v12, v12, a2
				; LMULMAX1-RV32D-NEXT: vrsub.vi v13, v8, 0
				; LMULMAX1-RV32D-NEXT: vand.vv v13, v8, v13
				; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e32, m1, ta, mu
				; LMULMAX1-RV32D-NEXT: vzext.vf4 v15, v13
				; LMULMAX1-RV32D-NEXT: vfcvt.f.xu.v v13, v15
				; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e16, mf2, ta, mu
				; LMULMAX1-RV32D-NEXT: vnsrl.wi v13, v13, 23
				; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
				; LMULMAX1-RV32D-NEXT: vnsrl.wi v13, v13, 0
				; LMULMAX1-RV32D-NEXT: vsub.vx v13, v13, a2
				; LMULMAX1-RV32D-NEXT: vsetivli zero, 4, e8, mf2, tu, mu
				; LMULMAX1-RV32D-NEXT: vslideup.vi v9, v13, 0
				; LMULMAX1-RV32D-NEXT: vsetivli zero, 8, e8, mf2, tu, mu
				; LMULMAX1-RV32D-NEXT: vslideup.vi v9, v12, 4
				; LMULMAX1-RV32D-NEXT: vsetivli zero, 8, e8, m1, tu, mu
				; LMULMAX1-RV32D-NEXT: vslideup.vi v10, v9, 0
				; LMULMAX1-RV32D-NEXT: vsetivli zero, 16, e8, m1, tu, mu
				; LMULMAX1-RV32D-NEXT: vslideup.vi v10, v14, 8
				; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e8, m1, ta, mu
				; LMULMAX1-RV32D-NEXT: vmseq.vi v0, v8, 0
				; LMULMAX1-RV32D-NEXT: vmerge.vim v8, v10, 8, v0
				; LMULMAX1-RV32D-NEXT: vse8.v v8, (a0)
				; LMULMAX1-RV32D-NEXT: vse8.v v11, (a1)
				; LMULMAX1-RV32D-NEXT: ret
				;
				; LMULMAX1-RV64D-LABEL: cttz_v32i8:
				; LMULMAX1-RV64D: # %bb.0:
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 16, e8, m1, ta, mu
				; LMULMAX1-RV64D-NEXT: addi a1, a0, 16
				; LMULMAX1-RV64D-NEXT: vle8.v v11, (a1)
				; LMULMAX1-RV64D-NEXT: vle8.v v8, (a0)
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 8, e8, m1, ta, mu
				; LMULMAX1-RV64D-NEXT: vslidedown.vi v10, v11, 8
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 4, e8, mf4, ta, mu
				; LMULMAX1-RV64D-NEXT: vrsub.vi v9, v10, 0
				; LMULMAX1-RV64D-NEXT: vand.vv v9, v10, v9
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e32, m1, ta, mu
				; LMULMAX1-RV64D-NEXT: vzext.vf4 v12, v9
				; LMULMAX1-RV64D-NEXT: vfcvt.f.xu.v v9, v12
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e16, mf2, ta, mu
				; LMULMAX1-RV64D-NEXT: vnsrl.wi v9, v9, 23
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
				; LMULMAX1-RV64D-NEXT: vnsrl.wi v9, v9, 0
				; LMULMAX1-RV64D-NEXT: addi a2, zero, 127
				; LMULMAX1-RV64D-NEXT: vsub.vx v12, v9, a2
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
				; LMULMAX1-RV64D-NEXT: vmv.v.i v9, 0
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 4, e8, mf2, tu, mu
				; LMULMAX1-RV64D-NEXT: vmv1r.v v13, v9
				; LMULMAX1-RV64D-NEXT: vslideup.vi v13, v12, 0
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e8, mf2, ta, mu
				; LMULMAX1-RV64D-NEXT: vslidedown.vi v10, v10, 4
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 4, e8, mf4, ta, mu
				; LMULMAX1-RV64D-NEXT: vrsub.vi v12, v10, 0
				; LMULMAX1-RV64D-NEXT: vand.vv v10, v10, v12
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e32, m1, ta, mu
				; LMULMAX1-RV64D-NEXT: vzext.vf4 v12, v10
				; LMULMAX1-RV64D-NEXT: vfcvt.f.xu.v v10, v12
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e16, mf2, ta, mu
				; LMULMAX1-RV64D-NEXT: vnsrl.wi v10, v10, 23
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
				; LMULMAX1-RV64D-NEXT: vnsrl.wi v10, v10, 0
				; LMULMAX1-RV64D-NEXT: vsub.vx v10, v10, a2
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 8, e8, mf2, tu, mu
				; LMULMAX1-RV64D-NEXT: vslideup.vi v13, v10, 4
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 4, e8, mf2, ta, mu
				; LMULMAX1-RV64D-NEXT: vslidedown.vi v10, v11, 4
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 4, e8, mf4, ta, mu
				; LMULMAX1-RV64D-NEXT: vrsub.vi v12, v10, 0
				; LMULMAX1-RV64D-NEXT: vand.vv v10, v10, v12
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e32, m1, ta, mu
				; LMULMAX1-RV64D-NEXT: vzext.vf4 v12, v10
				; LMULMAX1-RV64D-NEXT: vfcvt.f.xu.v v10, v12
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e16, mf2, ta, mu
				; LMULMAX1-RV64D-NEXT: vnsrl.wi v10, v10, 23
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
				; LMULMAX1-RV64D-NEXT: vnsrl.wi v10, v10, 0
				; LMULMAX1-RV64D-NEXT: vsub.vx v10, v10, a2
				; LMULMAX1-RV64D-NEXT: vrsub.vi v12, v11, 0
				; LMULMAX1-RV64D-NEXT: vand.vv v12, v11, v12
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e32, m1, ta, mu
				; LMULMAX1-RV64D-NEXT: vzext.vf4 v14, v12
				; LMULMAX1-RV64D-NEXT: vfcvt.f.xu.v v12, v14
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e16, mf2, ta, mu
				; LMULMAX1-RV64D-NEXT: vnsrl.wi v12, v12, 23
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
				; LMULMAX1-RV64D-NEXT: vnsrl.wi v12, v12, 0
				; LMULMAX1-RV64D-NEXT: vsub.vx v12, v12, a2
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 4, e8, mf2, tu, mu
				; LMULMAX1-RV64D-NEXT: vmv1r.v v14, v9
				; LMULMAX1-RV64D-NEXT: vslideup.vi v14, v12, 0
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 8, e8, mf2, tu, mu
				; LMULMAX1-RV64D-NEXT: vslideup.vi v14, v10, 4
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 16, e8, m1, ta, mu
				; LMULMAX1-RV64D-NEXT: vmv.v.i v10, 0
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 8, e8, m1, tu, mu
				; LMULMAX1-RV64D-NEXT: vmv1r.v v12, v10
				; LMULMAX1-RV64D-NEXT: vslideup.vi v12, v14, 0
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 16, e8, m1, tu, mu
				; LMULMAX1-RV64D-NEXT: vslideup.vi v12, v13, 8
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e8, m1, ta, mu
				; LMULMAX1-RV64D-NEXT: vmseq.vi v0, v11, 0
				; LMULMAX1-RV64D-NEXT: vmerge.vim v11, v12, 8, v0
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 8, e8, m1, ta, mu
				; LMULMAX1-RV64D-NEXT: vslidedown.vi v12, v8, 8
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 4, e8, mf4, ta, mu
				; LMULMAX1-RV64D-NEXT: vrsub.vi v13, v12, 0
				; LMULMAX1-RV64D-NEXT: vand.vv v13, v12, v13
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e32, m1, ta, mu
				; LMULMAX1-RV64D-NEXT: vzext.vf4 v14, v13
				; LMULMAX1-RV64D-NEXT: vfcvt.f.xu.v v13, v14
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e16, mf2, ta, mu
				; LMULMAX1-RV64D-NEXT: vnsrl.wi v13, v13, 23
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
				; LMULMAX1-RV64D-NEXT: vnsrl.wi v13, v13, 0
				; LMULMAX1-RV64D-NEXT: vsub.vx v13, v13, a2
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 4, e8, mf2, tu, mu
				; LMULMAX1-RV64D-NEXT: vmv1r.v v14, v9
				; LMULMAX1-RV64D-NEXT: vslideup.vi v14, v13, 0
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e8, mf2, ta, mu
				; LMULMAX1-RV64D-NEXT: vslidedown.vi v12, v12, 4
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 4, e8, mf4, ta, mu
				; LMULMAX1-RV64D-NEXT: vrsub.vi v13, v12, 0
				; LMULMAX1-RV64D-NEXT: vand.vv v12, v12, v13
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e32, m1, ta, mu
				; LMULMAX1-RV64D-NEXT: vzext.vf4 v13, v12
				; LMULMAX1-RV64D-NEXT: vfcvt.f.xu.v v12, v13
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e16, mf2, ta, mu
				; LMULMAX1-RV64D-NEXT: vnsrl.wi v12, v12, 23
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
				; LMULMAX1-RV64D-NEXT: vnsrl.wi v12, v12, 0
				; LMULMAX1-RV64D-NEXT: vsub.vx v12, v12, a2
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 8, e8, mf2, tu, mu
				; LMULMAX1-RV64D-NEXT: vslideup.vi v14, v12, 4
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 4, e8, mf2, ta, mu
				; LMULMAX1-RV64D-NEXT: vslidedown.vi v12, v8, 4
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 4, e8, mf4, ta, mu
				; LMULMAX1-RV64D-NEXT: vrsub.vi v13, v12, 0
				; LMULMAX1-RV64D-NEXT: vand.vv v12, v12, v13
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e32, m1, ta, mu
				; LMULMAX1-RV64D-NEXT: vzext.vf4 v13, v12
				; LMULMAX1-RV64D-NEXT: vfcvt.f.xu.v v12, v13
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e16, mf2, ta, mu
				; LMULMAX1-RV64D-NEXT: vnsrl.wi v12, v12, 23
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
				; LMULMAX1-RV64D-NEXT: vnsrl.wi v12, v12, 0
				; LMULMAX1-RV64D-NEXT: vsub.vx v12, v12, a2
				; LMULMAX1-RV64D-NEXT: vrsub.vi v13, v8, 0
				; LMULMAX1-RV64D-NEXT: vand.vv v13, v8, v13
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e32, m1, ta, mu
				; LMULMAX1-RV64D-NEXT: vzext.vf4 v15, v13
				; LMULMAX1-RV64D-NEXT: vfcvt.f.xu.v v13, v15
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e16, mf2, ta, mu
				; LMULMAX1-RV64D-NEXT: vnsrl.wi v13, v13, 23
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e8, mf4, ta, mu
				; LMULMAX1-RV64D-NEXT: vnsrl.wi v13, v13, 0
				; LMULMAX1-RV64D-NEXT: vsub.vx v13, v13, a2
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 4, e8, mf2, tu, mu
				; LMULMAX1-RV64D-NEXT: vslideup.vi v9, v13, 0
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 8, e8, mf2, tu, mu
				; LMULMAX1-RV64D-NEXT: vslideup.vi v9, v12, 4
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 8, e8, m1, tu, mu
				; LMULMAX1-RV64D-NEXT: vslideup.vi v10, v9, 0
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 16, e8, m1, tu, mu
				; LMULMAX1-RV64D-NEXT: vslideup.vi v10, v14, 8
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e8, m1, ta, mu
				; LMULMAX1-RV64D-NEXT: vmseq.vi v0, v8, 0
				; LMULMAX1-RV64D-NEXT: vmerge.vim v8, v10, 8, v0
				; LMULMAX1-RV64D-NEXT: vse8.v v8, (a0)
				; LMULMAX1-RV64D-NEXT: vse8.v v11, (a1)
				; LMULMAX1-RV64D-NEXT: ret
				;
				; LMULMAX8-RV32-LABEL: cttz_v32i8:
				; LMULMAX8-RV32: # %bb.0:
				; LMULMAX8-RV32-NEXT: addi a1, zero, 32
				; LMULMAX8-RV32-NEXT: vsetvli zero, a1, e8, m2, ta, mu
				; LMULMAX8-RV32-NEXT: vle8.v v8, (a0)
				; LMULMAX8-RV32-NEXT: vrsub.vi v10, v8, 0
				; LMULMAX8-RV32-NEXT: vand.vv v10, v8, v10
				; LMULMAX8-RV32-NEXT: vsetvli zero, zero, e32, m8, ta, mu
				; LMULMAX8-RV32-NEXT: vzext.vf4 v16, v10
				; LMULMAX8-RV32-NEXT: vfcvt.f.xu.v v16, v16
				; LMULMAX8-RV32-NEXT: vsetvli zero, zero, e16, m4, ta, mu
				; LMULMAX8-RV32-NEXT: vnsrl.wi v12, v16, 23
				; LMULMAX8-RV32-NEXT: vsetvli zero, zero, e8, m2, ta, mu
				; LMULMAX8-RV32-NEXT: vnsrl.wi v10, v12, 0
				; LMULMAX8-RV32-NEXT: addi a1, zero, 127
				; LMULMAX8-RV32-NEXT: vmseq.vi v0, v8, 0
				; LMULMAX8-RV32-NEXT: vsub.vx v8, v10, a1
				; LMULMAX8-RV32-NEXT: vmerge.vim v8, v8, 8, v0
				; LMULMAX8-RV32-NEXT: vse8.v v8, (a0)
				; LMULMAX8-RV32-NEXT: ret
				;
				; LMULMAX8-RV64-LABEL: cttz_v32i8:
				; LMULMAX8-RV64: # %bb.0:
				; LMULMAX8-RV64-NEXT: addi a1, zero, 32
				; LMULMAX8-RV64-NEXT: vsetvli zero, a1, e8, m2, ta, mu
				; LMULMAX8-RV64-NEXT: vle8.v v8, (a0)
				; LMULMAX8-RV64-NEXT: vrsub.vi v10, v8, 0
				; LMULMAX8-RV64-NEXT: vand.vv v10, v8, v10
				; LMULMAX8-RV64-NEXT: vsetvli zero, zero, e32, m8, ta, mu
				; LMULMAX8-RV64-NEXT: vzext.vf4 v16, v10
				; LMULMAX8-RV64-NEXT: vfcvt.f.xu.v v16, v16
				; LMULMAX8-RV64-NEXT: vsetvli zero, zero, e16, m4, ta, mu
				; LMULMAX8-RV64-NEXT: vnsrl.wi v12, v16, 23
				; LMULMAX8-RV64-NEXT: vsetvli zero, zero, e8, m2, ta, mu
				; LMULMAX8-RV64-NEXT: vnsrl.wi v10, v12, 0
				; LMULMAX8-RV64-NEXT: addi a1, zero, 127
				; LMULMAX8-RV64-NEXT: vmseq.vi v0, v8, 0
				; LMULMAX8-RV64-NEXT: vsub.vx v8, v10, a1
				; LMULMAX8-RV64-NEXT: vmerge.vim v8, v8, 8, v0
				; LMULMAX8-RV64-NEXT: vse8.v v8, (a0)
				; LMULMAX8-RV64-NEXT: ret
	%a = load <32 x i8>, <32 x i8>* %x			%a = load <32 x i8>, <32 x i8>* %x
	%b = load <32 x i8>, <32 x i8>* %y			%b = load <32 x i8>, <32 x i8>* %y
	%c = call <32 x i8> @llvm.cttz.v32i8(<32 x i8> %a, i1 false)			%c = call <32 x i8> @llvm.cttz.v32i8(<32 x i8> %a, i1 false)
	store <32 x i8> %c, <32 x i8>* %x			store <32 x i8> %c, <32 x i8>* %x
	ret void			ret void
	}			}
	declare <32 x i8> @llvm.cttz.v32i8(<32 x i8>, i1)			declare <32 x i8> @llvm.cttz.v32i8(<32 x i8>, i1)

	define void @cttz_v16i16(<16 x i16>* %x, <16 x i16>* %y) nounwind {			define void @cttz_v16i16(<16 x i16>* %x, <16 x i16>* %y) nounwind {
	; LMULMAX2-RV32-LABEL: cttz_v16i16:			; LMULMAX2-RV32I-LABEL: cttz_v16i16:
	; LMULMAX2-RV32: # %bb.0:			; LMULMAX2-RV32I: # %bb.0:
	; LMULMAX2-RV32-NEXT: vsetivli zero, 16, e16, m2, ta, mu			; LMULMAX2-RV32I-NEXT: vsetivli zero, 16, e16, m2, ta, mu
	; LMULMAX2-RV32-NEXT: vle16.v v8, (a0)			; LMULMAX2-RV32I-NEXT: vle16.v v8, (a0)
	; LMULMAX2-RV32-NEXT: addi a1, zero, 1			; LMULMAX2-RV32I-NEXT: addi a1, zero, 1
	; LMULMAX2-RV32-NEXT: vsub.vx v10, v8, a1			; LMULMAX2-RV32I-NEXT: vsub.vx v10, v8, a1
	; LMULMAX2-RV32-NEXT: vxor.vi v8, v8, -1			; LMULMAX2-RV32I-NEXT: vxor.vi v8, v8, -1
	; LMULMAX2-RV32-NEXT: vand.vv v8, v8, v10			; LMULMAX2-RV32I-NEXT: vand.vv v8, v8, v10
	; LMULMAX2-RV32-NEXT: vsrl.vi v10, v8, 1			; LMULMAX2-RV32I-NEXT: vsrl.vi v10, v8, 1
	; LMULMAX2-RV32-NEXT: lui a1, 5			; LMULMAX2-RV32I-NEXT: lui a1, 5
	; LMULMAX2-RV32-NEXT: addi a1, a1, 1365			; LMULMAX2-RV32I-NEXT: addi a1, a1, 1365
	; LMULMAX2-RV32-NEXT: vand.vx v10, v10, a1			; LMULMAX2-RV32I-NEXT: vand.vx v10, v10, a1
	; LMULMAX2-RV32-NEXT: vsub.vv v8, v8, v10			; LMULMAX2-RV32I-NEXT: vsub.vv v8, v8, v10
	; LMULMAX2-RV32-NEXT: lui a1, 3			; LMULMAX2-RV32I-NEXT: lui a1, 3
	; LMULMAX2-RV32-NEXT: addi a1, a1, 819			; LMULMAX2-RV32I-NEXT: addi a1, a1, 819
	; LMULMAX2-RV32-NEXT: vand.vx v10, v8, a1			; LMULMAX2-RV32I-NEXT: vand.vx v10, v8, a1
	; LMULMAX2-RV32-NEXT: vsrl.vi v8, v8, 2			; LMULMAX2-RV32I-NEXT: vsrl.vi v8, v8, 2
	; LMULMAX2-RV32-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV32I-NEXT: vand.vx v8, v8, a1
	; LMULMAX2-RV32-NEXT: vadd.vv v8, v10, v8			; LMULMAX2-RV32I-NEXT: vadd.vv v8, v10, v8
	; LMULMAX2-RV32-NEXT: vsrl.vi v10, v8, 4			; LMULMAX2-RV32I-NEXT: vsrl.vi v10, v8, 4
	; LMULMAX2-RV32-NEXT: vadd.vv v8, v8, v10			; LMULMAX2-RV32I-NEXT: vadd.vv v8, v8, v10
	; LMULMAX2-RV32-NEXT: lui a1, 1			; LMULMAX2-RV32I-NEXT: lui a1, 1
	; LMULMAX2-RV32-NEXT: addi a1, a1, -241			; LMULMAX2-RV32I-NEXT: addi a1, a1, -241
	; LMULMAX2-RV32-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV32I-NEXT: vand.vx v8, v8, a1
	; LMULMAX2-RV32-NEXT: addi a1, zero, 257			; LMULMAX2-RV32I-NEXT: addi a1, zero, 257
	; LMULMAX2-RV32-NEXT: vmul.vx v8, v8, a1			; LMULMAX2-RV32I-NEXT: vmul.vx v8, v8, a1
	; LMULMAX2-RV32-NEXT: vsrl.vi v8, v8, 8			; LMULMAX2-RV32I-NEXT: vsrl.vi v8, v8, 8
	; LMULMAX2-RV32-NEXT: vse16.v v8, (a0)			; LMULMAX2-RV32I-NEXT: vse16.v v8, (a0)
	; LMULMAX2-RV32-NEXT: ret			; LMULMAX2-RV32I-NEXT: ret
	;			;
	; LMULMAX2-RV64-LABEL: cttz_v16i16:			; LMULMAX2-RV64I-LABEL: cttz_v16i16:
	; LMULMAX2-RV64: # %bb.0:			; LMULMAX2-RV64I: # %bb.0:
	; LMULMAX2-RV64-NEXT: vsetivli zero, 16, e16, m2, ta, mu			; LMULMAX2-RV64I-NEXT: vsetivli zero, 16, e16, m2, ta, mu
	; LMULMAX2-RV64-NEXT: vle16.v v8, (a0)			; LMULMAX2-RV64I-NEXT: vle16.v v8, (a0)
	; LMULMAX2-RV64-NEXT: addi a1, zero, 1			; LMULMAX2-RV64I-NEXT: addi a1, zero, 1
	; LMULMAX2-RV64-NEXT: vsub.vx v10, v8, a1			; LMULMAX2-RV64I-NEXT: vsub.vx v10, v8, a1
	; LMULMAX2-RV64-NEXT: vxor.vi v8, v8, -1			; LMULMAX2-RV64I-NEXT: vxor.vi v8, v8, -1
	; LMULMAX2-RV64-NEXT: vand.vv v8, v8, v10			; LMULMAX2-RV64I-NEXT: vand.vv v8, v8, v10
	; LMULMAX2-RV64-NEXT: vsrl.vi v10, v8, 1			; LMULMAX2-RV64I-NEXT: vsrl.vi v10, v8, 1
	; LMULMAX2-RV64-NEXT: lui a1, 5			; LMULMAX2-RV64I-NEXT: lui a1, 5
	; LMULMAX2-RV64-NEXT: addiw a1, a1, 1365			; LMULMAX2-RV64I-NEXT: addiw a1, a1, 1365
	; LMULMAX2-RV64-NEXT: vand.vx v10, v10, a1			; LMULMAX2-RV64I-NEXT: vand.vx v10, v10, a1
	; LMULMAX2-RV64-NEXT: vsub.vv v8, v8, v10			; LMULMAX2-RV64I-NEXT: vsub.vv v8, v8, v10
	; LMULMAX2-RV64-NEXT: lui a1, 3			; LMULMAX2-RV64I-NEXT: lui a1, 3
	; LMULMAX2-RV64-NEXT: addiw a1, a1, 819			; LMULMAX2-RV64I-NEXT: addiw a1, a1, 819
	; LMULMAX2-RV64-NEXT: vand.vx v10, v8, a1			; LMULMAX2-RV64I-NEXT: vand.vx v10, v8, a1
	; LMULMAX2-RV64-NEXT: vsrl.vi v8, v8, 2			; LMULMAX2-RV64I-NEXT: vsrl.vi v8, v8, 2
	; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV64I-NEXT: vand.vx v8, v8, a1
	; LMULMAX2-RV64-NEXT: vadd.vv v8, v10, v8			; LMULMAX2-RV64I-NEXT: vadd.vv v8, v10, v8
	; LMULMAX2-RV64-NEXT: vsrl.vi v10, v8, 4			; LMULMAX2-RV64I-NEXT: vsrl.vi v10, v8, 4
	; LMULMAX2-RV64-NEXT: vadd.vv v8, v8, v10			; LMULMAX2-RV64I-NEXT: vadd.vv v8, v8, v10
	; LMULMAX2-RV64-NEXT: lui a1, 1			; LMULMAX2-RV64I-NEXT: lui a1, 1
	; LMULMAX2-RV64-NEXT: addiw a1, a1, -241			; LMULMAX2-RV64I-NEXT: addiw a1, a1, -241
	; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV64I-NEXT: vand.vx v8, v8, a1
	; LMULMAX2-RV64-NEXT: addi a1, zero, 257			; LMULMAX2-RV64I-NEXT: addi a1, zero, 257
	; LMULMAX2-RV64-NEXT: vmul.vx v8, v8, a1			; LMULMAX2-RV64I-NEXT: vmul.vx v8, v8, a1
	; LMULMAX2-RV64-NEXT: vsrl.vi v8, v8, 8			; LMULMAX2-RV64I-NEXT: vsrl.vi v8, v8, 8
	; LMULMAX2-RV64-NEXT: vse16.v v8, (a0)			; LMULMAX2-RV64I-NEXT: vse16.v v8, (a0)
	; LMULMAX2-RV64-NEXT: ret			; LMULMAX2-RV64I-NEXT: ret
	;			;
	; LMULMAX1-RV32-LABEL: cttz_v16i16:			; LMULMAX2-RV32D-LABEL: cttz_v16i16:
	; LMULMAX1-RV32: # %bb.0:			; LMULMAX2-RV32D: # %bb.0:
	; LMULMAX1-RV32-NEXT: vsetivli zero, 8, e16, m1, ta, mu			; LMULMAX2-RV32D-NEXT: vsetivli zero, 16, e16, m2, ta, mu
	; LMULMAX1-RV32-NEXT: addi a1, a0, 16			; LMULMAX2-RV32D-NEXT: vle16.v v8, (a0)
	; LMULMAX1-RV32-NEXT: vle16.v v8, (a1)			; LMULMAX2-RV32D-NEXT: vsetivli zero, 8, e16, m2, ta, mu
	; LMULMAX1-RV32-NEXT: vle16.v v9, (a0)			; LMULMAX2-RV32D-NEXT: vslidedown.vi v10, v8, 8
	; LMULMAX1-RV32-NEXT: addi a6, zero, 1			; LMULMAX2-RV32D-NEXT: vsetivli zero, 8, e16, m1, ta, mu
	; LMULMAX1-RV32-NEXT: vsub.vx v10, v8, a6			; LMULMAX2-RV32D-NEXT: vrsub.vi v12, v10, 0
	; LMULMAX1-RV32-NEXT: vxor.vi v8, v8, -1			; LMULMAX2-RV32D-NEXT: vand.vv v10, v10, v12
	; LMULMAX1-RV32-NEXT: vand.vv v8, v8, v10			; LMULMAX2-RV32D-NEXT: vfwcvt.f.xu.v v12, v10
	; LMULMAX1-RV32-NEXT: vsrl.vi v10, v8, 1			; LMULMAX2-RV32D-NEXT: vnsrl.wi v10, v12, 23
	; LMULMAX1-RV32-NEXT: lui a3, 5			; LMULMAX2-RV32D-NEXT: addi a1, zero, 127
	; LMULMAX1-RV32-NEXT: addi a3, a3, 1365			; LMULMAX2-RV32D-NEXT: vsub.vx v10, v10, a1
	; LMULMAX1-RV32-NEXT: vand.vx v10, v10, a3			; LMULMAX2-RV32D-NEXT: vrsub.vi v12, v8, 0
	; LMULMAX1-RV32-NEXT: vsub.vv v8, v8, v10			; LMULMAX2-RV32D-NEXT: vand.vv v12, v8, v12
	; LMULMAX1-RV32-NEXT: lui a4, 3			; LMULMAX2-RV32D-NEXT: vfwcvt.f.xu.v v14, v12
	; LMULMAX1-RV32-NEXT: addi a4, a4, 819			; LMULMAX2-RV32D-NEXT: vnsrl.wi v12, v14, 23
	; LMULMAX1-RV32-NEXT: vand.vx v10, v8, a4			; LMULMAX2-RV32D-NEXT: vsub.vx v12, v12, a1
	; LMULMAX1-RV32-NEXT: vsrl.vi v8, v8, 2			; LMULMAX2-RV32D-NEXT: vsetivli zero, 16, e16, m2, ta, mu
	; LMULMAX1-RV32-NEXT: vand.vx v8, v8, a4			; LMULMAX2-RV32D-NEXT: vmv.v.i v14, 0
	; LMULMAX1-RV32-NEXT: vadd.vv v8, v10, v8			; LMULMAX2-RV32D-NEXT: vsetivli zero, 8, e16, m2, tu, mu
	; LMULMAX1-RV32-NEXT: vsrl.vi v10, v8, 4			; LMULMAX2-RV32D-NEXT: vslideup.vi v14, v12, 0
	; LMULMAX1-RV32-NEXT: vadd.vv v8, v8, v10			; LMULMAX2-RV32D-NEXT: vsetivli zero, 16, e16, m2, tu, mu
	; LMULMAX1-RV32-NEXT: lui a5, 1			; LMULMAX2-RV32D-NEXT: vslideup.vi v14, v10, 8
	; LMULMAX1-RV32-NEXT: addi a5, a5, -241			; LMULMAX2-RV32D-NEXT: vsetvli zero, zero, e16, m2, ta, mu
	; LMULMAX1-RV32-NEXT: vand.vx v8, v8, a5			; LMULMAX2-RV32D-NEXT: vmseq.vi v0, v8, 0
	; LMULMAX1-RV32-NEXT: addi a2, zero, 257			; LMULMAX2-RV32D-NEXT: addi a1, zero, 16
	; LMULMAX1-RV32-NEXT: vmul.vx v8, v8, a2			; LMULMAX2-RV32D-NEXT: vmerge.vxm v8, v14, a1, v0
	; LMULMAX1-RV32-NEXT: vsrl.vi v8, v8, 8			; LMULMAX2-RV32D-NEXT: vse16.v v8, (a0)
	; LMULMAX1-RV32-NEXT: vsub.vx v10, v9, a6			; LMULMAX2-RV32D-NEXT: ret
	; LMULMAX1-RV32-NEXT: vxor.vi v9, v9, -1			;
	; LMULMAX1-RV32-NEXT: vand.vv v9, v9, v10			; LMULMAX2-RV64D-LABEL: cttz_v16i16:
	; LMULMAX1-RV32-NEXT: vsrl.vi v10, v9, 1			; LMULMAX2-RV64D: # %bb.0:
	; LMULMAX1-RV32-NEXT: vand.vx v10, v10, a3			; LMULMAX2-RV64D-NEXT: vsetivli zero, 16, e16, m2, ta, mu
	; LMULMAX1-RV32-NEXT: vsub.vv v9, v9, v10			; LMULMAX2-RV64D-NEXT: vle16.v v8, (a0)
	; LMULMAX1-RV32-NEXT: vand.vx v10, v9, a4			; LMULMAX2-RV64D-NEXT: vsetivli zero, 8, e16, m2, ta, mu
	; LMULMAX1-RV32-NEXT: vsrl.vi v9, v9, 2			; LMULMAX2-RV64D-NEXT: vslidedown.vi v10, v8, 8
	; LMULMAX1-RV32-NEXT: vand.vx v9, v9, a4			; LMULMAX2-RV64D-NEXT: vsetivli zero, 8, e16, m1, ta, mu
	; LMULMAX1-RV32-NEXT: vadd.vv v9, v10, v9			; LMULMAX2-RV64D-NEXT: vrsub.vi v12, v10, 0
	; LMULMAX1-RV32-NEXT: vsrl.vi v10, v9, 4			; LMULMAX2-RV64D-NEXT: vand.vv v10, v10, v12
	; LMULMAX1-RV32-NEXT: vadd.vv v9, v9, v10			; LMULMAX2-RV64D-NEXT: vfwcvt.f.xu.v v12, v10
	; LMULMAX1-RV32-NEXT: vand.vx v9, v9, a5			; LMULMAX2-RV64D-NEXT: vnsrl.wi v10, v12, 23
	; LMULMAX1-RV32-NEXT: vmul.vx v9, v9, a2			; LMULMAX2-RV64D-NEXT: addi a1, zero, 127
	; LMULMAX1-RV32-NEXT: vsrl.vi v9, v9, 8			; LMULMAX2-RV64D-NEXT: vsub.vx v10, v10, a1
	; LMULMAX1-RV32-NEXT: vse16.v v9, (a0)			; LMULMAX2-RV64D-NEXT: vrsub.vi v12, v8, 0
	; LMULMAX1-RV32-NEXT: vse16.v v8, (a1)			; LMULMAX2-RV64D-NEXT: vand.vv v12, v8, v12
	; LMULMAX1-RV32-NEXT: ret			; LMULMAX2-RV64D-NEXT: vfwcvt.f.xu.v v14, v12
	;			; LMULMAX2-RV64D-NEXT: vnsrl.wi v12, v14, 23
	; LMULMAX1-RV64-LABEL: cttz_v16i16:			; LMULMAX2-RV64D-NEXT: vsub.vx v12, v12, a1
	; LMULMAX1-RV64: # %bb.0:			; LMULMAX2-RV64D-NEXT: vsetivli zero, 16, e16, m2, ta, mu
	; LMULMAX1-RV64-NEXT: vsetivli zero, 8, e16, m1, ta, mu			; LMULMAX2-RV64D-NEXT: vmv.v.i v14, 0
	; LMULMAX1-RV64-NEXT: addi a1, a0, 16			; LMULMAX2-RV64D-NEXT: vsetivli zero, 8, e16, m2, tu, mu
	; LMULMAX1-RV64-NEXT: vle16.v v8, (a1)			; LMULMAX2-RV64D-NEXT: vslideup.vi v14, v12, 0
	; LMULMAX1-RV64-NEXT: vle16.v v9, (a0)			; LMULMAX2-RV64D-NEXT: vsetivli zero, 16, e16, m2, tu, mu
	; LMULMAX1-RV64-NEXT: addi a6, zero, 1			; LMULMAX2-RV64D-NEXT: vslideup.vi v14, v10, 8
	; LMULMAX1-RV64-NEXT: vsub.vx v10, v8, a6			; LMULMAX2-RV64D-NEXT: vsetvli zero, zero, e16, m2, ta, mu
	; LMULMAX1-RV64-NEXT: vxor.vi v8, v8, -1			; LMULMAX2-RV64D-NEXT: vmseq.vi v0, v8, 0
	; LMULMAX1-RV64-NEXT: vand.vv v8, v8, v10			; LMULMAX2-RV64D-NEXT: addi a1, zero, 16
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v8, 1			; LMULMAX2-RV64D-NEXT: vmerge.vxm v8, v14, a1, v0
	; LMULMAX1-RV64-NEXT: lui a3, 5			; LMULMAX2-RV64D-NEXT: vse16.v v8, (a0)
	; LMULMAX1-RV64-NEXT: addiw a3, a3, 1365			; LMULMAX2-RV64D-NEXT: ret
	; LMULMAX1-RV64-NEXT: vand.vx v10, v10, a3			;
	; LMULMAX1-RV64-NEXT: vsub.vv v8, v8, v10			; LMULMAX1-RV32D-LABEL: cttz_v16i16:
	; LMULMAX1-RV64-NEXT: lui a4, 3			; LMULMAX1-RV32D: # %bb.0:
	; LMULMAX1-RV64-NEXT: addiw a4, a4, 819			; LMULMAX1-RV32D-NEXT: vsetivli zero, 8, e16, m1, ta, mu
	; LMULMAX1-RV64-NEXT: vand.vx v10, v8, a4			; LMULMAX1-RV32D-NEXT: addi a1, a0, 16
	; LMULMAX1-RV64-NEXT: vsrl.vi v8, v8, 2			; LMULMAX1-RV32D-NEXT: vle16.v v8, (a1)
	; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a4			; LMULMAX1-RV32D-NEXT: vle16.v v9, (a0)
	; LMULMAX1-RV64-NEXT: vadd.vv v8, v10, v8			; LMULMAX1-RV32D-NEXT: vsetivli zero, 4, e16, m1, ta, mu
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v8, 4			; LMULMAX1-RV32D-NEXT: vslidedown.vi v10, v8, 4
	; LMULMAX1-RV64-NEXT: vadd.vv v8, v8, v10			; LMULMAX1-RV32D-NEXT: vsetivli zero, 4, e16, mf2, ta, mu
	; LMULMAX1-RV64-NEXT: lui a5, 1			; LMULMAX1-RV32D-NEXT: vrsub.vi v11, v10, 0
	; LMULMAX1-RV64-NEXT: addiw a5, a5, -241			; LMULMAX1-RV32D-NEXT: vand.vv v10, v10, v11
	; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a5			; LMULMAX1-RV32D-NEXT: vfwcvt.f.xu.v v11, v10
	; LMULMAX1-RV64-NEXT: addi a2, zero, 257			; LMULMAX1-RV32D-NEXT: vnsrl.wi v10, v11, 23
	; LMULMAX1-RV64-NEXT: vmul.vx v8, v8, a2			; LMULMAX1-RV32D-NEXT: addi a2, zero, 127
	; LMULMAX1-RV64-NEXT: vsrl.vi v8, v8, 8			; LMULMAX1-RV32D-NEXT: vsub.vx v10, v10, a2
	; LMULMAX1-RV64-NEXT: vsub.vx v10, v9, a6			; LMULMAX1-RV32D-NEXT: vrsub.vi v11, v8, 0
	; LMULMAX1-RV64-NEXT: vxor.vi v9, v9, -1			; LMULMAX1-RV32D-NEXT: vand.vv v11, v8, v11
	; LMULMAX1-RV64-NEXT: vand.vv v9, v9, v10			; LMULMAX1-RV32D-NEXT: vfwcvt.f.xu.v v12, v11
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v9, 1			; LMULMAX1-RV32D-NEXT: vnsrl.wi v11, v12, 23
	; LMULMAX1-RV64-NEXT: vand.vx v10, v10, a3			; LMULMAX1-RV32D-NEXT: vsub.vx v11, v11, a2
	; LMULMAX1-RV64-NEXT: vsub.vv v9, v9, v10			; LMULMAX1-RV32D-NEXT: vsetivli zero, 8, e16, m1, ta, mu
	; LMULMAX1-RV64-NEXT: vand.vx v10, v9, a4			; LMULMAX1-RV32D-NEXT: vmv.v.i v12, 0
	; LMULMAX1-RV64-NEXT: vsrl.vi v9, v9, 2			; LMULMAX1-RV32D-NEXT: vsetivli zero, 4, e16, m1, tu, mu
	; LMULMAX1-RV64-NEXT: vand.vx v9, v9, a4			; LMULMAX1-RV32D-NEXT: vmv1r.v v13, v12
	; LMULMAX1-RV64-NEXT: vadd.vv v9, v10, v9			; LMULMAX1-RV32D-NEXT: vslideup.vi v13, v11, 0
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v9, 4			; LMULMAX1-RV32D-NEXT: vsetivli zero, 8, e16, m1, tu, mu
	; LMULMAX1-RV64-NEXT: vadd.vv v9, v9, v10			; LMULMAX1-RV32D-NEXT: vslideup.vi v13, v10, 4
	; LMULMAX1-RV64-NEXT: vand.vx v9, v9, a5			; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e16, m1, ta, mu
	; LMULMAX1-RV64-NEXT: vmul.vx v9, v9, a2			; LMULMAX1-RV32D-NEXT: vmseq.vi v0, v8, 0
	; LMULMAX1-RV64-NEXT: vsrl.vi v9, v9, 8			; LMULMAX1-RV32D-NEXT: addi a3, zero, 16
	; LMULMAX1-RV64-NEXT: vse16.v v9, (a0)			; LMULMAX1-RV32D-NEXT: vmerge.vxm v8, v13, a3, v0
	; LMULMAX1-RV64-NEXT: vse16.v v8, (a1)			; LMULMAX1-RV32D-NEXT: vsetivli zero, 4, e16, m1, ta, mu
	; LMULMAX1-RV64-NEXT: ret			; LMULMAX1-RV32D-NEXT: vslidedown.vi v10, v9, 4
				; LMULMAX1-RV32D-NEXT: vsetivli zero, 4, e16, mf2, ta, mu
				; LMULMAX1-RV32D-NEXT: vrsub.vi v11, v10, 0
				; LMULMAX1-RV32D-NEXT: vand.vv v10, v10, v11
				; LMULMAX1-RV32D-NEXT: vfwcvt.f.xu.v v11, v10
				; LMULMAX1-RV32D-NEXT: vnsrl.wi v10, v11, 23
				; LMULMAX1-RV32D-NEXT: vsub.vx v10, v10, a2
				; LMULMAX1-RV32D-NEXT: vrsub.vi v11, v9, 0
				; LMULMAX1-RV32D-NEXT: vand.vv v11, v9, v11
				; LMULMAX1-RV32D-NEXT: vfwcvt.f.xu.v v13, v11
				; LMULMAX1-RV32D-NEXT: vnsrl.wi v11, v13, 23
				; LMULMAX1-RV32D-NEXT: vsub.vx v11, v11, a2
				; LMULMAX1-RV32D-NEXT: vsetivli zero, 4, e16, m1, tu, mu
				; LMULMAX1-RV32D-NEXT: vslideup.vi v12, v11, 0
				; LMULMAX1-RV32D-NEXT: vsetivli zero, 8, e16, m1, tu, mu
				; LMULMAX1-RV32D-NEXT: vslideup.vi v12, v10, 4
				; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e16, m1, ta, mu
				; LMULMAX1-RV32D-NEXT: vmseq.vi v0, v9, 0
				; LMULMAX1-RV32D-NEXT: vmerge.vxm v9, v12, a3, v0
				; LMULMAX1-RV32D-NEXT: vse16.v v9, (a0)
				; LMULMAX1-RV32D-NEXT: vse16.v v8, (a1)
				; LMULMAX1-RV32D-NEXT: ret
				;
				; LMULMAX1-RV64D-LABEL: cttz_v16i16:
				; LMULMAX1-RV64D: # %bb.0:
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 8, e16, m1, ta, mu
				; LMULMAX1-RV64D-NEXT: addi a1, a0, 16
				; LMULMAX1-RV64D-NEXT: vle16.v v8, (a1)
				; LMULMAX1-RV64D-NEXT: vle16.v v9, (a0)
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 4, e16, m1, ta, mu
				; LMULMAX1-RV64D-NEXT: vslidedown.vi v10, v8, 4
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 4, e16, mf2, ta, mu
				; LMULMAX1-RV64D-NEXT: vrsub.vi v11, v10, 0
				; LMULMAX1-RV64D-NEXT: vand.vv v10, v10, v11
				; LMULMAX1-RV64D-NEXT: vfwcvt.f.xu.v v11, v10
				; LMULMAX1-RV64D-NEXT: vnsrl.wi v10, v11, 23
				; LMULMAX1-RV64D-NEXT: addi a2, zero, 127
				; LMULMAX1-RV64D-NEXT: vsub.vx v10, v10, a2
				; LMULMAX1-RV64D-NEXT: vrsub.vi v11, v8, 0
				; LMULMAX1-RV64D-NEXT: vand.vv v11, v8, v11
				; LMULMAX1-RV64D-NEXT: vfwcvt.f.xu.v v12, v11
				; LMULMAX1-RV64D-NEXT: vnsrl.wi v11, v12, 23
				; LMULMAX1-RV64D-NEXT: vsub.vx v11, v11, a2
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 8, e16, m1, ta, mu
				; LMULMAX1-RV64D-NEXT: vmv.v.i v12, 0
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 4, e16, m1, tu, mu
				; LMULMAX1-RV64D-NEXT: vmv1r.v v13, v12
				; LMULMAX1-RV64D-NEXT: vslideup.vi v13, v11, 0
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 8, e16, m1, tu, mu
				; LMULMAX1-RV64D-NEXT: vslideup.vi v13, v10, 4
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e16, m1, ta, mu
				; LMULMAX1-RV64D-NEXT: vmseq.vi v0, v8, 0
				; LMULMAX1-RV64D-NEXT: addi a3, zero, 16
				; LMULMAX1-RV64D-NEXT: vmerge.vxm v8, v13, a3, v0
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 4, e16, m1, ta, mu
				; LMULMAX1-RV64D-NEXT: vslidedown.vi v10, v9, 4
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 4, e16, mf2, ta, mu
				; LMULMAX1-RV64D-NEXT: vrsub.vi v11, v10, 0
				; LMULMAX1-RV64D-NEXT: vand.vv v10, v10, v11
				; LMULMAX1-RV64D-NEXT: vfwcvt.f.xu.v v11, v10
				; LMULMAX1-RV64D-NEXT: vnsrl.wi v10, v11, 23
				; LMULMAX1-RV64D-NEXT: vsub.vx v10, v10, a2
				; LMULMAX1-RV64D-NEXT: vrsub.vi v11, v9, 0
				; LMULMAX1-RV64D-NEXT: vand.vv v11, v9, v11
				; LMULMAX1-RV64D-NEXT: vfwcvt.f.xu.v v13, v11
				; LMULMAX1-RV64D-NEXT: vnsrl.wi v11, v13, 23
				; LMULMAX1-RV64D-NEXT: vsub.vx v11, v11, a2
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 4, e16, m1, tu, mu
				; LMULMAX1-RV64D-NEXT: vslideup.vi v12, v11, 0
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 8, e16, m1, tu, mu
				; LMULMAX1-RV64D-NEXT: vslideup.vi v12, v10, 4
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e16, m1, ta, mu
				; LMULMAX1-RV64D-NEXT: vmseq.vi v0, v9, 0
				; LMULMAX1-RV64D-NEXT: vmerge.vxm v9, v12, a3, v0
				; LMULMAX1-RV64D-NEXT: vse16.v v9, (a0)
				; LMULMAX1-RV64D-NEXT: vse16.v v8, (a1)
				; LMULMAX1-RV64D-NEXT: ret
				;
				; LMULMAX8-RV32-LABEL: cttz_v16i16:
				; LMULMAX8-RV32: # %bb.0:
				; LMULMAX8-RV32-NEXT: vsetivli zero, 16, e16, m2, ta, mu
				; LMULMAX8-RV32-NEXT: vle16.v v8, (a0)
				; LMULMAX8-RV32-NEXT: vrsub.vi v10, v8, 0
				; LMULMAX8-RV32-NEXT: vand.vv v10, v8, v10
				; LMULMAX8-RV32-NEXT: vfwcvt.f.xu.v v12, v10
				; LMULMAX8-RV32-NEXT: vnsrl.wi v10, v12, 23
				; LMULMAX8-RV32-NEXT: addi a1, zero, 127
				; LMULMAX8-RV32-NEXT: vsub.vx v10, v10, a1
				; LMULMAX8-RV32-NEXT: vmseq.vi v0, v8, 0
				; LMULMAX8-RV32-NEXT: addi a1, zero, 16
				; LMULMAX8-RV32-NEXT: vmerge.vxm v8, v10, a1, v0
				; LMULMAX8-RV32-NEXT: vse16.v v8, (a0)
				; LMULMAX8-RV32-NEXT: ret
				;
				; LMULMAX8-RV64-LABEL: cttz_v16i16:
				; LMULMAX8-RV64: # %bb.0:
				; LMULMAX8-RV64-NEXT: vsetivli zero, 16, e16, m2, ta, mu
				; LMULMAX8-RV64-NEXT: vle16.v v8, (a0)
				; LMULMAX8-RV64-NEXT: vrsub.vi v10, v8, 0
				; LMULMAX8-RV64-NEXT: vand.vv v10, v8, v10
				; LMULMAX8-RV64-NEXT: vfwcvt.f.xu.v v12, v10
				; LMULMAX8-RV64-NEXT: vnsrl.wi v10, v12, 23
				; LMULMAX8-RV64-NEXT: addi a1, zero, 127
				; LMULMAX8-RV64-NEXT: vsub.vx v10, v10, a1
				; LMULMAX8-RV64-NEXT: vmseq.vi v0, v8, 0
				; LMULMAX8-RV64-NEXT: addi a1, zero, 16
				; LMULMAX8-RV64-NEXT: vmerge.vxm v8, v10, a1, v0
				; LMULMAX8-RV64-NEXT: vse16.v v8, (a0)
				; LMULMAX8-RV64-NEXT: ret
	%a = load <16 x i16>, <16 x i16>* %x			%a = load <16 x i16>, <16 x i16>* %x
	%b = load <16 x i16>, <16 x i16>* %y			%b = load <16 x i16>, <16 x i16>* %y
	%c = call <16 x i16> @llvm.cttz.v16i16(<16 x i16> %a, i1 false)			%c = call <16 x i16> @llvm.cttz.v16i16(<16 x i16> %a, i1 false)
	store <16 x i16> %c, <16 x i16>* %x			store <16 x i16> %c, <16 x i16>* %x
	ret void			ret void
	}			}
	declare <16 x i16> @llvm.cttz.v16i16(<16 x i16>, i1)			declare <16 x i16> @llvm.cttz.v16i16(<16 x i16>, i1)

	define void @cttz_v8i32(<8 x i32>* %x, <8 x i32>* %y) nounwind {			define void @cttz_v8i32(<8 x i32>* %x, <8 x i32>* %y) nounwind {
	; LMULMAX2-RV32-LABEL: cttz_v8i32:			; LMULMAX2-RV32I-LABEL: cttz_v8i32:
	; LMULMAX2-RV32: # %bb.0:			; LMULMAX2-RV32I: # %bb.0:
	; LMULMAX2-RV32-NEXT: vsetivli zero, 8, e32, m2, ta, mu			; LMULMAX2-RV32I-NEXT: vsetivli zero, 8, e32, m2, ta, mu
	; LMULMAX2-RV32-NEXT: vle32.v v8, (a0)			; LMULMAX2-RV32I-NEXT: vle32.v v8, (a0)
	; LMULMAX2-RV32-NEXT: addi a1, zero, 1			; LMULMAX2-RV32I-NEXT: addi a1, zero, 1
	; LMULMAX2-RV32-NEXT: vsub.vx v10, v8, a1			; LMULMAX2-RV32I-NEXT: vsub.vx v10, v8, a1
	; LMULMAX2-RV32-NEXT: vxor.vi v8, v8, -1			; LMULMAX2-RV32I-NEXT: vxor.vi v8, v8, -1
	; LMULMAX2-RV32-NEXT: vand.vv v8, v8, v10			; LMULMAX2-RV32I-NEXT: vand.vv v8, v8, v10
	; LMULMAX2-RV32-NEXT: vsrl.vi v10, v8, 1			; LMULMAX2-RV32I-NEXT: vsrl.vi v10, v8, 1
	; LMULMAX2-RV32-NEXT: lui a1, 349525			; LMULMAX2-RV32I-NEXT: lui a1, 349525
	; LMULMAX2-RV32-NEXT: addi a1, a1, 1365			; LMULMAX2-RV32I-NEXT: addi a1, a1, 1365
	; LMULMAX2-RV32-NEXT: vand.vx v10, v10, a1			; LMULMAX2-RV32I-NEXT: vand.vx v10, v10, a1
	; LMULMAX2-RV32-NEXT: vsub.vv v8, v8, v10			; LMULMAX2-RV32I-NEXT: vsub.vv v8, v8, v10
	; LMULMAX2-RV32-NEXT: lui a1, 209715			; LMULMAX2-RV32I-NEXT: lui a1, 209715
	; LMULMAX2-RV32-NEXT: addi a1, a1, 819			; LMULMAX2-RV32I-NEXT: addi a1, a1, 819
	; LMULMAX2-RV32-NEXT: vand.vx v10, v8, a1			; LMULMAX2-RV32I-NEXT: vand.vx v10, v8, a1
	; LMULMAX2-RV32-NEXT: vsrl.vi v8, v8, 2			; LMULMAX2-RV32I-NEXT: vsrl.vi v8, v8, 2
	; LMULMAX2-RV32-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV32I-NEXT: vand.vx v8, v8, a1
	; LMULMAX2-RV32-NEXT: vadd.vv v8, v10, v8			; LMULMAX2-RV32I-NEXT: vadd.vv v8, v10, v8
	; LMULMAX2-RV32-NEXT: vsrl.vi v10, v8, 4			; LMULMAX2-RV32I-NEXT: vsrl.vi v10, v8, 4
	; LMULMAX2-RV32-NEXT: vadd.vv v8, v8, v10			; LMULMAX2-RV32I-NEXT: vadd.vv v8, v8, v10
	; LMULMAX2-RV32-NEXT: lui a1, 61681			; LMULMAX2-RV32I-NEXT: lui a1, 61681
	; LMULMAX2-RV32-NEXT: addi a1, a1, -241			; LMULMAX2-RV32I-NEXT: addi a1, a1, -241
	; LMULMAX2-RV32-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV32I-NEXT: vand.vx v8, v8, a1
	; LMULMAX2-RV32-NEXT: lui a1, 4112			; LMULMAX2-RV32I-NEXT: lui a1, 4112
	; LMULMAX2-RV32-NEXT: addi a1, a1, 257			; LMULMAX2-RV32I-NEXT: addi a1, a1, 257
	; LMULMAX2-RV32-NEXT: vmul.vx v8, v8, a1			; LMULMAX2-RV32I-NEXT: vmul.vx v8, v8, a1
	; LMULMAX2-RV32-NEXT: vsrl.vi v8, v8, 24			; LMULMAX2-RV32I-NEXT: vsrl.vi v8, v8, 24
	; LMULMAX2-RV32-NEXT: vse32.v v8, (a0)			; LMULMAX2-RV32I-NEXT: vse32.v v8, (a0)
	; LMULMAX2-RV32-NEXT: ret			; LMULMAX2-RV32I-NEXT: ret
	;			;
	; LMULMAX2-RV64-LABEL: cttz_v8i32:			; LMULMAX2-RV64I-LABEL: cttz_v8i32:
	; LMULMAX2-RV64: # %bb.0:			; LMULMAX2-RV64I: # %bb.0:
	; LMULMAX2-RV64-NEXT: vsetivli zero, 8, e32, m2, ta, mu			; LMULMAX2-RV64I-NEXT: vsetivli zero, 8, e32, m2, ta, mu
	; LMULMAX2-RV64-NEXT: vle32.v v8, (a0)			; LMULMAX2-RV64I-NEXT: vle32.v v8, (a0)
	; LMULMAX2-RV64-NEXT: addi a1, zero, 1			; LMULMAX2-RV64I-NEXT: addi a1, zero, 1
	; LMULMAX2-RV64-NEXT: vsub.vx v10, v8, a1			; LMULMAX2-RV64I-NEXT: vsub.vx v10, v8, a1
	; LMULMAX2-RV64-NEXT: vxor.vi v8, v8, -1			; LMULMAX2-RV64I-NEXT: vxor.vi v8, v8, -1
	; LMULMAX2-RV64-NEXT: vand.vv v8, v8, v10			; LMULMAX2-RV64I-NEXT: vand.vv v8, v8, v10
	; LMULMAX2-RV64-NEXT: vsrl.vi v10, v8, 1			; LMULMAX2-RV64I-NEXT: vsrl.vi v10, v8, 1
	; LMULMAX2-RV64-NEXT: lui a1, 349525			; LMULMAX2-RV64I-NEXT: lui a1, 349525
	; LMULMAX2-RV64-NEXT: addiw a1, a1, 1365			; LMULMAX2-RV64I-NEXT: addiw a1, a1, 1365
	; LMULMAX2-RV64-NEXT: vand.vx v10, v10, a1			; LMULMAX2-RV64I-NEXT: vand.vx v10, v10, a1
	; LMULMAX2-RV64-NEXT: vsub.vv v8, v8, v10			; LMULMAX2-RV64I-NEXT: vsub.vv v8, v8, v10
	; LMULMAX2-RV64-NEXT: lui a1, 209715			; LMULMAX2-RV64I-NEXT: lui a1, 209715
	; LMULMAX2-RV64-NEXT: addiw a1, a1, 819			; LMULMAX2-RV64I-NEXT: addiw a1, a1, 819
	; LMULMAX2-RV64-NEXT: vand.vx v10, v8, a1			; LMULMAX2-RV64I-NEXT: vand.vx v10, v8, a1
	; LMULMAX2-RV64-NEXT: vsrl.vi v8, v8, 2			; LMULMAX2-RV64I-NEXT: vsrl.vi v8, v8, 2
	; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV64I-NEXT: vand.vx v8, v8, a1
	; LMULMAX2-RV64-NEXT: vadd.vv v8, v10, v8			; LMULMAX2-RV64I-NEXT: vadd.vv v8, v10, v8
	; LMULMAX2-RV64-NEXT: vsrl.vi v10, v8, 4			; LMULMAX2-RV64I-NEXT: vsrl.vi v10, v8, 4
	; LMULMAX2-RV64-NEXT: vadd.vv v8, v8, v10			; LMULMAX2-RV64I-NEXT: vadd.vv v8, v8, v10
	; LMULMAX2-RV64-NEXT: lui a1, 61681			; LMULMAX2-RV64I-NEXT: lui a1, 61681
	; LMULMAX2-RV64-NEXT: addiw a1, a1, -241			; LMULMAX2-RV64I-NEXT: addiw a1, a1, -241
	; LMULMAX2-RV64-NEXT: vand.vx v8, v8, a1			; LMULMAX2-RV64I-NEXT: vand.vx v8, v8, a1
	; LMULMAX2-RV64-NEXT: lui a1, 4112			; LMULMAX2-RV64I-NEXT: lui a1, 4112
	; LMULMAX2-RV64-NEXT: addiw a1, a1, 257			; LMULMAX2-RV64I-NEXT: addiw a1, a1, 257
	; LMULMAX2-RV64-NEXT: vmul.vx v8, v8, a1			; LMULMAX2-RV64I-NEXT: vmul.vx v8, v8, a1
	; LMULMAX2-RV64-NEXT: vsrl.vi v8, v8, 24			; LMULMAX2-RV64I-NEXT: vsrl.vi v8, v8, 24
	; LMULMAX2-RV64-NEXT: vse32.v v8, (a0)			; LMULMAX2-RV64I-NEXT: vse32.v v8, (a0)
	; LMULMAX2-RV64-NEXT: ret			; LMULMAX2-RV64I-NEXT: ret
	;			;
	; LMULMAX1-RV32-LABEL: cttz_v8i32:			; LMULMAX2-RV32D-LABEL: cttz_v8i32:
	; LMULMAX1-RV32: # %bb.0:			; LMULMAX2-RV32D: # %bb.0:
	; LMULMAX1-RV32-NEXT: vsetivli zero, 4, e32, m1, ta, mu			; LMULMAX2-RV32D-NEXT: vsetivli zero, 8, e32, m2, ta, mu
	; LMULMAX1-RV32-NEXT: addi a1, a0, 16			; LMULMAX2-RV32D-NEXT: vle32.v v8, (a0)
	; LMULMAX1-RV32-NEXT: vle32.v v8, (a1)			; LMULMAX2-RV32D-NEXT: vsetivli zero, 4, e32, m2, ta, mu
	; LMULMAX1-RV32-NEXT: vle32.v v9, (a0)			; LMULMAX2-RV32D-NEXT: vslidedown.vi v10, v8, 4
	; LMULMAX1-RV32-NEXT: addi a6, zero, 1			; LMULMAX2-RV32D-NEXT: vsetivli zero, 4, e32, m1, ta, mu
	; LMULMAX1-RV32-NEXT: vsub.vx v10, v8, a6			; LMULMAX2-RV32D-NEXT: vrsub.vi v12, v10, 0
	; LMULMAX1-RV32-NEXT: vxor.vi v8, v8, -1			; LMULMAX2-RV32D-NEXT: vand.vv v10, v10, v12
	; LMULMAX1-RV32-NEXT: vand.vv v8, v8, v10			; LMULMAX2-RV32D-NEXT: vfwcvt.f.xu.v v12, v10
	; LMULMAX1-RV32-NEXT: vsrl.vi v10, v8, 1			; LMULMAX2-RV32D-NEXT: addi a1, zero, 52
	; LMULMAX1-RV32-NEXT: lui a3, 349525			; LMULMAX2-RV32D-NEXT: vnsrl.wx v10, v12, a1
	; LMULMAX1-RV32-NEXT: addi a3, a3, 1365			; LMULMAX2-RV32D-NEXT: addi a2, zero, 1023
	; LMULMAX1-RV32-NEXT: vand.vx v10, v10, a3			; LMULMAX2-RV32D-NEXT: vsub.vx v10, v10, a2
	; LMULMAX1-RV32-NEXT: vsub.vv v8, v8, v10			; LMULMAX2-RV32D-NEXT: vrsub.vi v12, v8, 0
	; LMULMAX1-RV32-NEXT: lui a4, 209715			; LMULMAX2-RV32D-NEXT: vand.vv v12, v8, v12
	; LMULMAX1-RV32-NEXT: addi a4, a4, 819			; LMULMAX2-RV32D-NEXT: vfwcvt.f.xu.v v14, v12
	; LMULMAX1-RV32-NEXT: vand.vx v10, v8, a4			; LMULMAX2-RV32D-NEXT: vnsrl.wx v12, v14, a1
	; LMULMAX1-RV32-NEXT: vsrl.vi v8, v8, 2			; LMULMAX2-RV32D-NEXT: vsub.vx v12, v12, a2
	; LMULMAX1-RV32-NEXT: vand.vx v8, v8, a4			; LMULMAX2-RV32D-NEXT: vsetivli zero, 8, e32, m2, ta, mu
	; LMULMAX1-RV32-NEXT: vadd.vv v8, v10, v8			; LMULMAX2-RV32D-NEXT: vmv.v.i v14, 0
	; LMULMAX1-RV32-NEXT: vsrl.vi v10, v8, 4			; LMULMAX2-RV32D-NEXT: vsetivli zero, 4, e32, m2, tu, mu
	; LMULMAX1-RV32-NEXT: vadd.vv v8, v8, v10			; LMULMAX2-RV32D-NEXT: vslideup.vi v14, v12, 0
	; LMULMAX1-RV32-NEXT: lui a5, 61681			; LMULMAX2-RV32D-NEXT: vsetivli zero, 8, e32, m2, tu, mu
	; LMULMAX1-RV32-NEXT: addi a5, a5, -241			; LMULMAX2-RV32D-NEXT: vslideup.vi v14, v10, 4
	; LMULMAX1-RV32-NEXT: vand.vx v8, v8, a5			; LMULMAX2-RV32D-NEXT: vsetvli zero, zero, e32, m2, ta, mu
	; LMULMAX1-RV32-NEXT: lui a2, 4112			; LMULMAX2-RV32D-NEXT: vmseq.vi v0, v8, 0
	; LMULMAX1-RV32-NEXT: addi a2, a2, 257			; LMULMAX2-RV32D-NEXT: addi a1, zero, 32
	; LMULMAX1-RV32-NEXT: vmul.vx v8, v8, a2			; LMULMAX2-RV32D-NEXT: vmerge.vxm v8, v14, a1, v0
	; LMULMAX1-RV32-NEXT: vsrl.vi v8, v8, 24			; LMULMAX2-RV32D-NEXT: vse32.v v8, (a0)
	; LMULMAX1-RV32-NEXT: vsub.vx v10, v9, a6			; LMULMAX2-RV32D-NEXT: ret
	; LMULMAX1-RV32-NEXT: vxor.vi v9, v9, -1			;
	; LMULMAX1-RV32-NEXT: vand.vv v9, v9, v10			; LMULMAX2-RV64D-LABEL: cttz_v8i32:
	; LMULMAX1-RV32-NEXT: vsrl.vi v10, v9, 1			; LMULMAX2-RV64D: # %bb.0:
	; LMULMAX1-RV32-NEXT: vand.vx v10, v10, a3			; LMULMAX2-RV64D-NEXT: vsetivli zero, 8, e32, m2, ta, mu
	; LMULMAX1-RV32-NEXT: vsub.vv v9, v9, v10			; LMULMAX2-RV64D-NEXT: vle32.v v8, (a0)
	; LMULMAX1-RV32-NEXT: vand.vx v10, v9, a4			; LMULMAX2-RV64D-NEXT: vsetivli zero, 4, e32, m2, ta, mu
	; LMULMAX1-RV32-NEXT: vsrl.vi v9, v9, 2			; LMULMAX2-RV64D-NEXT: vslidedown.vi v10, v8, 4
	; LMULMAX1-RV32-NEXT: vand.vx v9, v9, a4			; LMULMAX2-RV64D-NEXT: vsetivli zero, 4, e32, m1, ta, mu
	; LMULMAX1-RV32-NEXT: vadd.vv v9, v10, v9			; LMULMAX2-RV64D-NEXT: vrsub.vi v12, v10, 0
	; LMULMAX1-RV32-NEXT: vsrl.vi v10, v9, 4			; LMULMAX2-RV64D-NEXT: vand.vv v10, v10, v12
	; LMULMAX1-RV32-NEXT: vadd.vv v9, v9, v10			; LMULMAX2-RV64D-NEXT: vfwcvt.f.xu.v v12, v10
	; LMULMAX1-RV32-NEXT: vand.vx v9, v9, a5			; LMULMAX2-RV64D-NEXT: addi a1, zero, 52
	; LMULMAX1-RV32-NEXT: vmul.vx v9, v9, a2			; LMULMAX2-RV64D-NEXT: vnsrl.wx v10, v12, a1
	; LMULMAX1-RV32-NEXT: vsrl.vi v9, v9, 24			; LMULMAX2-RV64D-NEXT: addi a2, zero, 1023
	; LMULMAX1-RV32-NEXT: vse32.v v9, (a0)			; LMULMAX2-RV64D-NEXT: vsub.vx v10, v10, a2
	; LMULMAX1-RV32-NEXT: vse32.v v8, (a1)			; LMULMAX2-RV64D-NEXT: vrsub.vi v12, v8, 0
	; LMULMAX1-RV32-NEXT: ret			; LMULMAX2-RV64D-NEXT: vand.vv v12, v8, v12
	;			; LMULMAX2-RV64D-NEXT: vfwcvt.f.xu.v v14, v12
	; LMULMAX1-RV64-LABEL: cttz_v8i32:			; LMULMAX2-RV64D-NEXT: vnsrl.wx v12, v14, a1
	; LMULMAX1-RV64: # %bb.0:			; LMULMAX2-RV64D-NEXT: vsub.vx v12, v12, a2
	; LMULMAX1-RV64-NEXT: vsetivli zero, 4, e32, m1, ta, mu			; LMULMAX2-RV64D-NEXT: vsetivli zero, 8, e32, m2, ta, mu
	; LMULMAX1-RV64-NEXT: addi a1, a0, 16			; LMULMAX2-RV64D-NEXT: vmv.v.i v14, 0
	; LMULMAX1-RV64-NEXT: vle32.v v8, (a1)			; LMULMAX2-RV64D-NEXT: vsetivli zero, 4, e32, m2, tu, mu
	; LMULMAX1-RV64-NEXT: vle32.v v9, (a0)			; LMULMAX2-RV64D-NEXT: vslideup.vi v14, v12, 0
	; LMULMAX1-RV64-NEXT: addi a6, zero, 1			; LMULMAX2-RV64D-NEXT: vsetivli zero, 8, e32, m2, tu, mu
	; LMULMAX1-RV64-NEXT: vsub.vx v10, v8, a6			; LMULMAX2-RV64D-NEXT: vslideup.vi v14, v10, 4
	; LMULMAX1-RV64-NEXT: vxor.vi v8, v8, -1			; LMULMAX2-RV64D-NEXT: vsetvli zero, zero, e32, m2, ta, mu
	; LMULMAX1-RV64-NEXT: vand.vv v8, v8, v10			; LMULMAX2-RV64D-NEXT: vmseq.vi v0, v8, 0
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v8, 1			; LMULMAX2-RV64D-NEXT: addi a1, zero, 32
	; LMULMAX1-RV64-NEXT: lui a3, 349525			; LMULMAX2-RV64D-NEXT: vmerge.vxm v8, v14, a1, v0
	; LMULMAX1-RV64-NEXT: addiw a3, a3, 1365			; LMULMAX2-RV64D-NEXT: vse32.v v8, (a0)
	; LMULMAX1-RV64-NEXT: vand.vx v10, v10, a3			; LMULMAX2-RV64D-NEXT: ret
	; LMULMAX1-RV64-NEXT: vsub.vv v8, v8, v10			;
	; LMULMAX1-RV64-NEXT: lui a4, 209715			; LMULMAX1-RV32D-LABEL: cttz_v8i32:
	; LMULMAX1-RV64-NEXT: addiw a4, a4, 819			; LMULMAX1-RV32D: # %bb.0:
	; LMULMAX1-RV64-NEXT: vand.vx v10, v8, a4			; LMULMAX1-RV32D-NEXT: vsetivli zero, 4, e32, m1, ta, mu
	; LMULMAX1-RV64-NEXT: vsrl.vi v8, v8, 2			; LMULMAX1-RV32D-NEXT: addi a1, a0, 16
	; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a4			; LMULMAX1-RV32D-NEXT: vle32.v v8, (a1)
	; LMULMAX1-RV64-NEXT: vadd.vv v8, v10, v8			; LMULMAX1-RV32D-NEXT: vle32.v v9, (a0)
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v8, 4			; LMULMAX1-RV32D-NEXT: vsetivli zero, 2, e32, m1, ta, mu
	; LMULMAX1-RV64-NEXT: vadd.vv v8, v8, v10			; LMULMAX1-RV32D-NEXT: vslidedown.vi v10, v8, 2
	; LMULMAX1-RV64-NEXT: lui a5, 61681			; LMULMAX1-RV32D-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
	; LMULMAX1-RV64-NEXT: addiw a5, a5, -241			; LMULMAX1-RV32D-NEXT: vrsub.vi v11, v10, 0
	; LMULMAX1-RV64-NEXT: vand.vx v8, v8, a5			; LMULMAX1-RV32D-NEXT: vand.vv v10, v10, v11
	; LMULMAX1-RV64-NEXT: lui a2, 4112			; LMULMAX1-RV32D-NEXT: vfwcvt.f.xu.v v11, v10
	; LMULMAX1-RV64-NEXT: addiw a2, a2, 257			; LMULMAX1-RV32D-NEXT: addi a2, zero, 52
	; LMULMAX1-RV64-NEXT: vmul.vx v8, v8, a2			; LMULMAX1-RV32D-NEXT: vnsrl.wx v10, v11, a2
	; LMULMAX1-RV64-NEXT: vsrl.vi v8, v8, 24			; LMULMAX1-RV32D-NEXT: addi a3, zero, 1023
	; LMULMAX1-RV64-NEXT: vsub.vx v10, v9, a6			; LMULMAX1-RV32D-NEXT: vsub.vx v10, v10, a3
	; LMULMAX1-RV64-NEXT: vxor.vi v9, v9, -1			; LMULMAX1-RV32D-NEXT: vrsub.vi v11, v8, 0
	; LMULMAX1-RV64-NEXT: vand.vv v9, v9, v10			; LMULMAX1-RV32D-NEXT: vand.vv v11, v8, v11
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v9, 1			; LMULMAX1-RV32D-NEXT: vfwcvt.f.xu.v v12, v11
	; LMULMAX1-RV64-NEXT: vand.vx v10, v10, a3			; LMULMAX1-RV32D-NEXT: vnsrl.wx v11, v12, a2
	; LMULMAX1-RV64-NEXT: vsub.vv v9, v9, v10			; LMULMAX1-RV32D-NEXT: vsub.vx v11, v11, a3
	; LMULMAX1-RV64-NEXT: vand.vx v10, v9, a4			; LMULMAX1-RV32D-NEXT: vsetivli zero, 4, e32, m1, ta, mu
	; LMULMAX1-RV64-NEXT: vsrl.vi v9, v9, 2			; LMULMAX1-RV32D-NEXT: vmv.v.i v12, 0
	; LMULMAX1-RV64-NEXT: vand.vx v9, v9, a4			; LMULMAX1-RV32D-NEXT: vsetivli zero, 2, e32, m1, tu, mu
	; LMULMAX1-RV64-NEXT: vadd.vv v9, v10, v9			; LMULMAX1-RV32D-NEXT: vmv1r.v v13, v12
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v9, 4			; LMULMAX1-RV32D-NEXT: vslideup.vi v13, v11, 0
	; LMULMAX1-RV64-NEXT: vadd.vv v9, v9, v10			; LMULMAX1-RV32D-NEXT: vsetivli zero, 4, e32, m1, tu, mu
	; LMULMAX1-RV64-NEXT: vand.vx v9, v9, a5			; LMULMAX1-RV32D-NEXT: vslideup.vi v13, v10, 2
	; LMULMAX1-RV64-NEXT: vmul.vx v9, v9, a2			; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e32, m1, ta, mu
	; LMULMAX1-RV64-NEXT: vsrl.vi v9, v9, 24			; LMULMAX1-RV32D-NEXT: vmseq.vi v0, v8, 0
	; LMULMAX1-RV64-NEXT: vse32.v v9, (a0)			; LMULMAX1-RV32D-NEXT: addi a4, zero, 32
	; LMULMAX1-RV64-NEXT: vse32.v v8, (a1)			; LMULMAX1-RV32D-NEXT: vmerge.vxm v8, v13, a4, v0
	; LMULMAX1-RV64-NEXT: ret			; LMULMAX1-RV32D-NEXT: vsetivli zero, 2, e32, m1, ta, mu
				; LMULMAX1-RV32D-NEXT: vslidedown.vi v10, v9, 2
				; LMULMAX1-RV32D-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
				; LMULMAX1-RV32D-NEXT: vrsub.vi v11, v10, 0
				; LMULMAX1-RV32D-NEXT: vand.vv v10, v10, v11
				; LMULMAX1-RV32D-NEXT: vfwcvt.f.xu.v v11, v10
				; LMULMAX1-RV32D-NEXT: vnsrl.wx v10, v11, a2
				; LMULMAX1-RV32D-NEXT: vsub.vx v10, v10, a3
				; LMULMAX1-RV32D-NEXT: vrsub.vi v11, v9, 0
				; LMULMAX1-RV32D-NEXT: vand.vv v11, v9, v11
				; LMULMAX1-RV32D-NEXT: vfwcvt.f.xu.v v13, v11
				; LMULMAX1-RV32D-NEXT: vnsrl.wx v11, v13, a2
				; LMULMAX1-RV32D-NEXT: vsub.vx v11, v11, a3
				; LMULMAX1-RV32D-NEXT: vsetivli zero, 2, e32, m1, tu, mu
				; LMULMAX1-RV32D-NEXT: vslideup.vi v12, v11, 0
				; LMULMAX1-RV32D-NEXT: vsetivli zero, 4, e32, m1, tu, mu
				; LMULMAX1-RV32D-NEXT: vslideup.vi v12, v10, 2
				; LMULMAX1-RV32D-NEXT: vsetvli zero, zero, e32, m1, ta, mu
				; LMULMAX1-RV32D-NEXT: vmseq.vi v0, v9, 0
				; LMULMAX1-RV32D-NEXT: vmerge.vxm v9, v12, a4, v0
				; LMULMAX1-RV32D-NEXT: vse32.v v9, (a0)
				; LMULMAX1-RV32D-NEXT: vse32.v v8, (a1)
				; LMULMAX1-RV32D-NEXT: ret
				;
				; LMULMAX1-RV64D-LABEL: cttz_v8i32:
				; LMULMAX1-RV64D: # %bb.0:
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 4, e32, m1, ta, mu
				; LMULMAX1-RV64D-NEXT: addi a1, a0, 16
				; LMULMAX1-RV64D-NEXT: vle32.v v8, (a1)
				; LMULMAX1-RV64D-NEXT: vle32.v v9, (a0)
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 2, e32, m1, ta, mu
				; LMULMAX1-RV64D-NEXT: vslidedown.vi v10, v8, 2
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
				; LMULMAX1-RV64D-NEXT: vrsub.vi v11, v10, 0
				; LMULMAX1-RV64D-NEXT: vand.vv v10, v10, v11
				; LMULMAX1-RV64D-NEXT: vfwcvt.f.xu.v v11, v10
				; LMULMAX1-RV64D-NEXT: addi a2, zero, 52
				; LMULMAX1-RV64D-NEXT: vnsrl.wx v10, v11, a2
				; LMULMAX1-RV64D-NEXT: addi a3, zero, 1023
				; LMULMAX1-RV64D-NEXT: vsub.vx v10, v10, a3
				; LMULMAX1-RV64D-NEXT: vrsub.vi v11, v8, 0
				; LMULMAX1-RV64D-NEXT: vand.vv v11, v8, v11
				; LMULMAX1-RV64D-NEXT: vfwcvt.f.xu.v v12, v11
				; LMULMAX1-RV64D-NEXT: vnsrl.wx v11, v12, a2
				; LMULMAX1-RV64D-NEXT: vsub.vx v11, v11, a3
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 4, e32, m1, ta, mu
				; LMULMAX1-RV64D-NEXT: vmv.v.i v12, 0
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 2, e32, m1, tu, mu
				; LMULMAX1-RV64D-NEXT: vmv1r.v v13, v12
				; LMULMAX1-RV64D-NEXT: vslideup.vi v13, v11, 0
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 4, e32, m1, tu, mu
				; LMULMAX1-RV64D-NEXT: vslideup.vi v13, v10, 2
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e32, m1, ta, mu
				; LMULMAX1-RV64D-NEXT: vmseq.vi v0, v8, 0
				; LMULMAX1-RV64D-NEXT: addi a4, zero, 32
				; LMULMAX1-RV64D-NEXT: vmerge.vxm v8, v13, a4, v0
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 2, e32, m1, ta, mu
				; LMULMAX1-RV64D-NEXT: vslidedown.vi v10, v9, 2
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 2, e32, mf2, ta, mu
				; LMULMAX1-RV64D-NEXT: vrsub.vi v11, v10, 0
				; LMULMAX1-RV64D-NEXT: vand.vv v10, v10, v11
				; LMULMAX1-RV64D-NEXT: vfwcvt.f.xu.v v11, v10
				; LMULMAX1-RV64D-NEXT: vnsrl.wx v10, v11, a2
				; LMULMAX1-RV64D-NEXT: vsub.vx v10, v10, a3
				; LMULMAX1-RV64D-NEXT: vrsub.vi v11, v9, 0
				; LMULMAX1-RV64D-NEXT: vand.vv v11, v9, v11
				; LMULMAX1-RV64D-NEXT: vfwcvt.f.xu.v v13, v11
				; LMULMAX1-RV64D-NEXT: vnsrl.wx v11, v13, a2
				; LMULMAX1-RV64D-NEXT: vsub.vx v11, v11, a3
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 2, e32, m1, tu, mu
				; LMULMAX1-RV64D-NEXT: vslideup.vi v12, v11, 0
				; LMULMAX1-RV64D-NEXT: vsetivli zero, 4, e32, m1, tu, mu
				; LMULMAX1-RV64D-NEXT: vslideup.vi v12, v10, 2
				; LMULMAX1-RV64D-NEXT: vsetvli zero, zero, e32, m1, ta, mu
				; LMULMAX1-RV64D-NEXT: vmseq.vi v0, v9, 0
				; LMULMAX1-RV64D-NEXT: vmerge.vxm v9, v12, a4, v0
				; LMULMAX1-RV64D-NEXT: vse32.v v9, (a0)
				; LMULMAX1-RV64D-NEXT: vse32.v v8, (a1)
				; LMULMAX1-RV64D-NEXT: ret
				;
				; LMULMAX8-RV32-LABEL: cttz_v8i32:
				; LMULMAX8-RV32: # %bb.0:
				; LMULMAX8-RV32-NEXT: vsetivli zero, 8, e32, m2, ta, mu
				; LMULMAX8-RV32-NEXT: vle32.v v8, (a0)
				; LMULMAX8-RV32-NEXT: vrsub.vi v10, v8, 0
				; LMULMAX8-RV32-NEXT: vand.vv v10, v8, v10
				; LMULMAX8-RV32-NEXT: vfwcvt.f.xu.v v12, v10
				; LMULMAX8-RV32-NEXT: addi a1, zero, 52
				; LMULMAX8-RV32-NEXT: vnsrl.wx v10, v12, a1
				; LMULMAX8-RV32-NEXT: addi a1, zero, 1023
				; LMULMAX8-RV32-NEXT: vsub.vx v10, v10, a1
				; LMULMAX8-RV32-NEXT: vmseq.vi v0, v8, 0
				; LMULMAX8-RV32-NEXT: addi a1, zero, 32
				; LMULMAX8-RV32-NEXT: vmerge.vxm v8, v10, a1, v0
				; LMULMAX8-RV32-NEXT: vse32.v v8, (a0)
				; LMULMAX8-RV32-NEXT: ret
				;
				; LMULMAX8-RV64-LABEL: cttz_v8i32:
				; LMULMAX8-RV64: # %bb.0:
				; LMULMAX8-RV64-NEXT: vsetivli zero, 8, e32, m2, ta, mu
				; LMULMAX8-RV64-NEXT: vle32.v v8, (a0)
				; LMULMAX8-RV64-NEXT: vrsub.vi v10, v8, 0
				; LMULMAX8-RV64-NEXT: vand.vv v10, v8, v10
				; LMULMAX8-RV64-NEXT: vfwcvt.f.xu.v v12, v10
				; LMULMAX8-RV64-NEXT: addi a1, zero, 52
				; LMULMAX8-RV64-NEXT: vnsrl.wx v10, v12, a1
				; LMULMAX8-RV64-NEXT: addi a1, zero, 1023
				; LMULMAX8-RV64-NEXT: vsub.vx v10, v10, a1
				; LMULMAX8-RV64-NEXT: vmseq.vi v0, v8, 0
				; LMULMAX8-RV64-NEXT: addi a1, zero, 32
				; LMULMAX8-RV64-NEXT: vmerge.vxm v8, v10, a1, v0
				; LMULMAX8-RV64-NEXT: vse32.v v8, (a0)
				; LMULMAX8-RV64-NEXT: ret
	%a = load <8 x i32>, <8 x i32>* %x			%a = load <8 x i32>, <8 x i32>* %x
	%b = load <8 x i32>, <8 x i32>* %y			%b = load <8 x i32>, <8 x i32>* %y
	%c = call <8 x i32> @llvm.cttz.v8i32(<8 x i32> %a, i1 false)			%c = call <8 x i32> @llvm.cttz.v8i32(<8 x i32> %a, i1 false)
	store <8 x i32> %c, <8 x i32>* %x			store <8 x i32> %c, <8 x i32>* %x
	ret void			ret void
	}			}
	declare <8 x i32> @llvm.cttz.v8i32(<8 x i32>, i1)			declare <8 x i32> @llvm.cttz.v8i32(<8 x i32>, i1)

	▲ Show 20 Lines • Show All 230 Lines • ▼ Show 20 Lines
	; LMULMAX1-RV64-NEXT: vsrl.vi v10, v9, 4			; LMULMAX1-RV64-NEXT: vsrl.vi v10, v9, 4
	; LMULMAX1-RV64-NEXT: vadd.vv v9, v9, v10			; LMULMAX1-RV64-NEXT: vadd.vv v9, v9, v10
	; LMULMAX1-RV64-NEXT: vand.vx v9, v9, a5			; LMULMAX1-RV64-NEXT: vand.vx v9, v9, a5
	; LMULMAX1-RV64-NEXT: vmul.vx v9, v9, a2			; LMULMAX1-RV64-NEXT: vmul.vx v9, v9, a2
	; LMULMAX1-RV64-NEXT: vsrl.vx v9, v9, a1			; LMULMAX1-RV64-NEXT: vsrl.vx v9, v9, a1
	; LMULMAX1-RV64-NEXT: vse64.v v9, (a0)			; LMULMAX1-RV64-NEXT: vse64.v v9, (a0)
	; LMULMAX1-RV64-NEXT: vse64.v v8, (a7)			; LMULMAX1-RV64-NEXT: vse64.v v8, (a7)
	; LMULMAX1-RV64-NEXT: ret			; LMULMAX1-RV64-NEXT: ret
				;
				; LMULMAX8-RV32-LABEL: cttz_v4i64:
				; LMULMAX8-RV32: # %bb.0:
				; LMULMAX8-RV32-NEXT: vsetivli zero, 4, e64, m2, ta, mu
				; LMULMAX8-RV32-NEXT: vle64.v v8, (a0)
				; LMULMAX8-RV32-NEXT: addi a1, zero, 1
				; LMULMAX8-RV32-NEXT: vsub.vx v10, v8, a1
				; LMULMAX8-RV32-NEXT: vsetivli zero, 8, e32, m2, ta, mu
				; LMULMAX8-RV32-NEXT: vmv.v.i v12, -1
				; LMULMAX8-RV32-NEXT: vsetivli zero, 4, e64, m2, ta, mu
				; LMULMAX8-RV32-NEXT: vxor.vv v8, v8, v12
				; LMULMAX8-RV32-NEXT: vand.vv v8, v8, v10
				; LMULMAX8-RV32-NEXT: vsrl.vi v10, v8, 1
				; LMULMAX8-RV32-NEXT: lui a1, 349525
				; LMULMAX8-RV32-NEXT: addi a1, a1, 1365
				; LMULMAX8-RV32-NEXT: vsetivli zero, 8, e32, m2, ta, mu
				; LMULMAX8-RV32-NEXT: vmv.v.x v12, a1
				; LMULMAX8-RV32-NEXT: vsetivli zero, 4, e64, m2, ta, mu
				; LMULMAX8-RV32-NEXT: vand.vv v10, v10, v12
				; LMULMAX8-RV32-NEXT: vsub.vv v8, v8, v10
				; LMULMAX8-RV32-NEXT: lui a1, 209715
				; LMULMAX8-RV32-NEXT: addi a1, a1, 819
				; LMULMAX8-RV32-NEXT: vsetivli zero, 8, e32, m2, ta, mu
				; LMULMAX8-RV32-NEXT: vmv.v.x v10, a1
				; LMULMAX8-RV32-NEXT: vsetivli zero, 4, e64, m2, ta, mu
				; LMULMAX8-RV32-NEXT: vand.vv v12, v8, v10
				; LMULMAX8-RV32-NEXT: vsrl.vi v8, v8, 2
				; LMULMAX8-RV32-NEXT: vand.vv v8, v8, v10
				; LMULMAX8-RV32-NEXT: vadd.vv v8, v12, v8
				; LMULMAX8-RV32-NEXT: vsrl.vi v10, v8, 4
				; LMULMAX8-RV32-NEXT: vadd.vv v8, v8, v10
				; LMULMAX8-RV32-NEXT: lui a1, 61681
				; LMULMAX8-RV32-NEXT: addi a1, a1, -241
				; LMULMAX8-RV32-NEXT: vsetivli zero, 8, e32, m2, ta, mu
				; LMULMAX8-RV32-NEXT: vmv.v.x v10, a1
				; LMULMAX8-RV32-NEXT: vsetivli zero, 4, e64, m2, ta, mu
				; LMULMAX8-RV32-NEXT: vand.vv v8, v8, v10
				; LMULMAX8-RV32-NEXT: lui a1, 4112
				; LMULMAX8-RV32-NEXT: addi a1, a1, 257
				; LMULMAX8-RV32-NEXT: vsetivli zero, 8, e32, m2, ta, mu
				; LMULMAX8-RV32-NEXT: vmv.v.x v10, a1
				; LMULMAX8-RV32-NEXT: vsetivli zero, 4, e64, m2, ta, mu
				; LMULMAX8-RV32-NEXT: vmul.vv v8, v8, v10
				; LMULMAX8-RV32-NEXT: addi a1, zero, 56
				; LMULMAX8-RV32-NEXT: vsrl.vx v8, v8, a1
				; LMULMAX8-RV32-NEXT: vse64.v v8, (a0)
				; LMULMAX8-RV32-NEXT: ret
				;
				; LMULMAX8-RV64-LABEL: cttz_v4i64:
				; LMULMAX8-RV64: # %bb.0:
				; LMULMAX8-RV64-NEXT: vsetivli zero, 4, e64, m2, ta, mu
				; LMULMAX8-RV64-NEXT: vle64.v v8, (a0)
				; LMULMAX8-RV64-NEXT: addi a1, zero, 1
				; LMULMAX8-RV64-NEXT: vsub.vx v10, v8, a1
				; LMULMAX8-RV64-NEXT: vxor.vi v8, v8, -1
				; LMULMAX8-RV64-NEXT: vand.vv v8, v8, v10
				; LMULMAX8-RV64-NEXT: vsrl.vi v10, v8, 1
				; LMULMAX8-RV64-NEXT: lui a1, 21845
				; LMULMAX8-RV64-NEXT: addiw a1, a1, 1365
				; LMULMAX8-RV64-NEXT: slli a1, a1, 12
				; LMULMAX8-RV64-NEXT: addi a1, a1, 1365
				; LMULMAX8-RV64-NEXT: slli a1, a1, 12
				; LMULMAX8-RV64-NEXT: addi a1, a1, 1365
				; LMULMAX8-RV64-NEXT: slli a1, a1, 12
				; LMULMAX8-RV64-NEXT: addi a1, a1, 1365
				; LMULMAX8-RV64-NEXT: vand.vx v10, v10, a1
				; LMULMAX8-RV64-NEXT: vsub.vv v8, v8, v10
				; LMULMAX8-RV64-NEXT: lui a1, 13107
				; LMULMAX8-RV64-NEXT: addiw a1, a1, 819
				; LMULMAX8-RV64-NEXT: slli a1, a1, 12
				; LMULMAX8-RV64-NEXT: addi a1, a1, 819
				; LMULMAX8-RV64-NEXT: slli a1, a1, 12
				; LMULMAX8-RV64-NEXT: addi a1, a1, 819
				; LMULMAX8-RV64-NEXT: slli a1, a1, 12
				; LMULMAX8-RV64-NEXT: addi a1, a1, 819
				; LMULMAX8-RV64-NEXT: vand.vx v10, v8, a1
				; LMULMAX8-RV64-NEXT: vsrl.vi v8, v8, 2
				; LMULMAX8-RV64-NEXT: vand.vx v8, v8, a1
				; LMULMAX8-RV64-NEXT: vadd.vv v8, v10, v8
				; LMULMAX8-RV64-NEXT: vsrl.vi v10, v8, 4
				; LMULMAX8-RV64-NEXT: vadd.vv v8, v8, v10
				; LMULMAX8-RV64-NEXT: lui a1, 3855
				; LMULMAX8-RV64-NEXT: addiw a1, a1, 241
				; LMULMAX8-RV64-NEXT: slli a1, a1, 12
				; LMULMAX8-RV64-NEXT: addi a1, a1, -241
				; LMULMAX8-RV64-NEXT: slli a1, a1, 12
				; LMULMAX8-RV64-NEXT: addi a1, a1, 241
				; LMULMAX8-RV64-NEXT: slli a1, a1, 12
				; LMULMAX8-RV64-NEXT: addi a1, a1, -241
				; LMULMAX8-RV64-NEXT: vand.vx v8, v8, a1
				; LMULMAX8-RV64-NEXT: lui a1, 4112
				; LMULMAX8-RV64-NEXT: addiw a1, a1, 257
				; LMULMAX8-RV64-NEXT: slli a1, a1, 16
				; LMULMAX8-RV64-NEXT: addi a1, a1, 257
				; LMULMAX8-RV64-NEXT: slli a1, a1, 16
				; LMULMAX8-RV64-NEXT: addi a1, a1, 257
				; LMULMAX8-RV64-NEXT: vmul.vx v8, v8, a1
				; LMULMAX8-RV64-NEXT: addi a1, zero, 56
				; LMULMAX8-RV64-NEXT: vsrl.vx v8, v8, a1
				; LMULMAX8-RV64-NEXT: vse64.v v8, (a0)
				; LMULMAX8-RV64-NEXT: ret
	%a = load <4 x i64>, <4 x i64>* %x			%a = load <4 x i64>, <4 x i64>* %x
	%b = load <4 x i64>, <4 x i64>* %y			%b = load <4 x i64>, <4 x i64>* %y
	%c = call <4 x i64> @llvm.cttz.v4i64(<4 x i64> %a, i1 false)			%c = call <4 x i64> @llvm.cttz.v4i64(<4 x i64> %a, i1 false)
	store <4 x i64> %c, <4 x i64>* %x			store <4 x i64> %c, <4 x i64>* %x
	ret void			ret void
	}			}
	declare <4 x i64> @llvm.cttz.v4i64(<4 x i64>, i1)			declare <4 x i64> @llvm.cttz.v4i64(<4 x i64>, i1)

This is an archive of the discontinued LLVM Phabricator instance.

[RISCV] Lower vector CTLZ_ZERO_UNDEF/CTTZ_ZERO_UNDEF by converting to FP and extracting the exponent.
ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 380991

llvm/lib/CodeGen/SelectionDAG/TargetLowering.cpp

llvm/lib/Target/RISCV/RISCVISelLowering.cpp

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-ctlz.ll

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-cttz.ll

This is an archive of the discontinued LLVM Phabricator instance.

[RISCV] Lower vector CTLZ_ZERO_UNDEF/CTTZ_ZERO_UNDEF by converting to FP and extracting the exponent.ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 380991

llvm/lib/CodeGen/SelectionDAG/TargetLowering.cpp

llvm/lib/Target/RISCV/RISCVISelLowering.cpp

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-ctlz.ll

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-cttz.ll

[RISCV] Lower vector CTLZ_ZERO_UNDEF/CTTZ_ZERO_UNDEF by converting to FP and extracting the exponent.
ClosedPublic