This is an archive of the discontinued LLVM Phabricator instance.

[RISCV] Lower build_vector of VID sequence with one inconsistent element to vid and insert_vector_elt.
Needs ReviewPublic

Authored by jacquesguan on Jun 8 2022, 2:23 AM.

Download Raw Diff

Details

Reviewers

craig.topper
asb
luismarques
frasercrmck
benshi001

Summary

This patch supports to identify build_vector of the VID sequence with just one inconsistent element, and will lower it to vid and insert_vector_elt.

Diff Detail

Repository: rG LLVM Github Monorepo

Unit TestsFailed

	Time	Test
	60,140 ms	x64 debian > AddressSanitizer-x86_64-linux-dynamic.TestCases::scariness_score_test.cpp
	60,100 ms	x64 debian > AddressSanitizer-x86_64-linux.TestCases::scariness_score_test.cpp

Event Timeline

jacquesguan created this revision.Jun 8 2022, 2:23 AM

Herald added a project: Restricted Project. · View Herald TranscriptJun 8 2022, 2:23 AM

Herald added subscribers: sunshaoce, VincentWu, luke957 and 27 others. · View Herald Transcript

jacquesguan requested review of this revision.Jun 8 2022, 2:23 AM

Herald added a project: Restricted Project. · View Herald TranscriptJun 8 2022, 2:23 AM

Herald added subscribers: llvm-commits, • pcwang-thead, eopXD, MaskRay. · View Herald Transcript

jacquesguan mentioned this in D115226: [RISCV] Use vmv.s.x to lower VID sequences that only the first element is inconsistent..Jun 8 2022, 2:25 AM

Harbormaster completed remote builds in B168500: Diff 435078.Jun 8 2022, 3:11 AM

reames added a subscriber: reames.Jun 8 2022, 7:52 AM

reames added inline comments.

llvm/lib/Target/RISCV/RISCVISelLowering.cpp
1914	This is algorithmically slow. You can achieve the same effect with a direct change to the matching code which allows it to fuzzy match exactly one element. Doing so is non trivial, but once you find the first three non-undefs in the sequence it should be easy to distinguish.
llvm/test/CodeGen/RISCV/rvv/fixed-vectors-fp-shuffles.ll
142	Its not clear to me that a six instruction sequence is worthwhile to remove a constant pool entry. Can you make an argument as to why this change is worthwhile?

frasercrmck added inline comments.Jun 8 2022, 7:55 AM

llvm/lib/Target/RISCV/RISCVISelLowering.cpp
1914	I agree. It seems unfortunate to pessimise almost all BUILD_VECTOR compile times just for this case. Does this really show up in real-world code often enough to warrant this optimization? Do we really want to match a v256 build vector where only element 148 is out of sequence, for example?

Revision Contents

Path

Size

llvm/

lib/

Target/

RISCV/

RISCVISelLowering.cpp

30 lines

test/

CodeGen/

RISCV/

rvv/

fixed-vectors-fp-shuffles.ll

19 lines

fixed-vectors-int-buildvec.ll

175 lines

fixed-vectors-int-shuffles.ll

20 lines

fixed-vectors-int.ll

74 lines

srem-seteq-illegal-types.ll

10 lines

urem-seteq-illegal-types.ll

80 lines

Diff 435078

llvm/lib/Target/RISCV/RISCVISelLowering.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 1,797 Lines • ▼ Show 20 Lines	static SDValue lowerFROUND(SDValue Op, SelectionDAG &DAG) {
SDValue Setcc = DAG.getSetCC(DL, SetccVT, Abs, MaxValNode, ISD::SETOLT);		SDValue Setcc = DAG.getSetCC(DL, SetccVT, Abs, MaxValNode, ISD::SETOLT);
return DAG.getSelect(DL, VT, Setcc, Truncated, Src);		return DAG.getSelect(DL, VT, Setcc, Truncated, Src);
}		}

struct VIDSequence {		struct VIDSequence {
int64_t StepNumerator;		int64_t StepNumerator;
unsigned StepDenominator;		unsigned StepDenominator;
int64_t Addend;		int64_t Addend;
		int InconsistentIdx; // The inconsistent element index, -1 means none.
};		};

// Try to match an arithmetic-sequence BUILD_VECTOR [X,X+S,X+2S,...,X+(N-1)S]		// Try to match an arithmetic-sequence BUILD_VECTOR [X,X+S,X+2S,...,X+(N-1)S]
// to the (non-zero) step S and start value X. This can be then lowered as the		// to the (non-zero) step S and start value X. This can be then lowered as the
// RVV sequence (VID * S) + X, for example.		// RVV sequence (VID * S) + X, for example.
// The step S is represented as an integer numerator divided by a positive		// The step S is represented as an integer numerator divided by a positive
// denominator. Note that the implementation currently only identifies		// denominator. Note that the implementation currently only identifies
// sequences in which either the numerator is +/- 1 or the denominator is 1. It		// sequences in which either the numerator is +/- 1 or the denominator is 1. It
// cannot detect 2/3, for example.		// cannot detect 2/3, for example.
// Note that this method will also match potentially unappealing index		// Note that this method will also match potentially unappealing index
// sequences, like <i32 0, i32 50939494>, however it is left to the caller to		// sequences, like <i32 0, i32 50939494>, however it is left to the caller to
// determine whether this is worth generating code for.		// determine whether this is worth generating code for.
static Optional<VIDSequence> isSimpleVIDSequence(SDValue Op) {		// With the given IgnoredIdx >= 0, this function will ignore this index during
		// the check.It will allow us to Identify some sequences like <i32 0, i32 1,
		// i32 2, i32 2, i32 4, i32 5, i32 6, i32 7>.
		static Optional<VIDSequence> isSimpleVIDSequenceImpl(SDValue Op,
		int IgnoredIdx = -1) {
unsigned NumElts = Op.getNumOperands();		unsigned NumElts = Op.getNumOperands();
assert(Op.getOpcode() == ISD::BUILD_VECTOR && "Unexpected BUILD_VECTOR");		assert(Op.getOpcode() == ISD::BUILD_VECTOR && "Unexpected BUILD_VECTOR");
if (!Op.getValueType().isInteger())		if (!Op.getValueType().isInteger())
return None;		return None;

Optional<unsigned> SeqStepDenom;		Optional<unsigned> SeqStepDenom;
Optional<int64_t> SeqStepNum, SeqAddend;		Optional<int64_t> SeqStepNum, SeqAddend;
Optional<std::pair<uint64_t, unsigned>> PrevElt;		Optional<std::pair<uint64_t, unsigned>> PrevElt;
unsigned EltSizeInBits = Op.getValueType().getScalarSizeInBits();		unsigned EltSizeInBits = Op.getValueType().getScalarSizeInBits();
for (unsigned Idx = 0; Idx < NumElts; Idx++) {		for (unsigned Idx = 0; Idx < NumElts; Idx++) {
// Assume undef elements match the sequence; we just have to be careful		// Assume undef elements match the sequence; we just have to be careful
// when interpolating across them.		// when interpolating across them.
if (Op.getOperand(Idx).isUndef())		if (Op.getOperand(Idx).isUndef() \|\|
		(IgnoredIdx >= 0 && Idx == unsigned(IgnoredIdx)))
continue;		continue;
// The BUILD_VECTOR must be all constants.		// The BUILD_VECTOR must be all constants.
if (!isa<ConstantSDNode>(Op.getOperand(Idx)))		if (!isa<ConstantSDNode>(Op.getOperand(Idx)))
return None;		return None;

uint64_t Val = Op.getConstantOperandVal(Idx) &		uint64_t Val = Op.getConstantOperandVal(Idx) &
maskTrailingOnes<uint64_t>(EltSizeInBits);		maskTrailingOnes<uint64_t>(EltSizeInBits);

Show All 37 Lines	static Optional<VIDSequence> isSimpleVIDSequenceImpl(SDValue Op,

// We need to have logged a step for this to count as a legal index sequence.		// We need to have logged a step for this to count as a legal index sequence.
if (!SeqStepNum \|\| !SeqStepDenom)		if (!SeqStepNum \|\| !SeqStepDenom)
return None;		return None;

// Loop back through the sequence and validate elements we might have skipped		// Loop back through the sequence and validate elements we might have skipped
// while waiting for a valid step. While doing this, log any sequence addend.		// while waiting for a valid step. While doing this, log any sequence addend.
for (unsigned Idx = 0; Idx < NumElts; Idx++) {		for (unsigned Idx = 0; Idx < NumElts; Idx++) {
if (Op.getOperand(Idx).isUndef())		if (Op.getOperand(Idx).isUndef() \|\|
		(IgnoredIdx >= 0 && Idx == unsigned(IgnoredIdx)))
continue;		continue;
uint64_t Val = Op.getConstantOperandVal(Idx) &		uint64_t Val = Op.getConstantOperandVal(Idx) &
maskTrailingOnes<uint64_t>(EltSizeInBits);		maskTrailingOnes<uint64_t>(EltSizeInBits);
uint64_t ExpectedVal =		uint64_t ExpectedVal =
(int64_t)(Idx * (uint64_t)SeqStepNum) / SeqStepDenom;		(int64_t)(Idx * (uint64_t)SeqStepNum) / SeqStepDenom;
int64_t Addend = SignExtend64(Val - ExpectedVal, EltSizeInBits);		int64_t Addend = SignExtend64(Val - ExpectedVal, EltSizeInBits);
if (!SeqAddend)		if (!SeqAddend)
SeqAddend = Addend;		SeqAddend = Addend;
else if (Addend != SeqAddend)		else if (Addend != SeqAddend)
return None;		return None;
}		}

assert(SeqAddend && "Must have an addend if we have a step");		assert(SeqAddend && "Must have an addend if we have a step");

return VIDSequence{SeqStepNum, SeqStepDenom, *SeqAddend};		return VIDSequence{SeqStepNum, SeqStepDenom, *SeqAddend, IgnoredIdx};
		}

		static Optional<VIDSequence> isSimpleVIDSequence(SDValue Op) {
		if (auto VS = isSimpleVIDSequenceImpl(Op))
		return VS;
		for (size_t i = 0; i < Op.getNumOperands(); i++)
		if (auto VS = isSimpleVIDSequenceImpl(Op, i))
		reamesUnsubmitted Not Done Reply Inline Actions This is algorithmically slow. You can achieve the same effect with a direct change to the matching code which allows it to fuzzy match exactly one element. Doing so is non trivial, but once you find the first three non-undefs in the sequence it should be easy to distinguish. reames: This is algorithmically slow. You can achieve the same effect with a direct change to the…
		frasercrmckUnsubmitted Not Done Reply Inline Actions I agree. It seems unfortunate to pessimise almost all BUILD_VECTOR compile times just for this case. Does this really show up in real-world code often enough to warrant this optimization? Do we really want to match a v256 build vector where only element 148 is out of sequence, for example? frasercrmck: I agree. It seems unfortunate to pessimise almost all BUILD_VECTOR compile times just for this…
		return VS;
		return None;
}		}

// Match a splatted value (SPLAT_VECTOR/BUILD_VECTOR) of an EXTRACT_VECTOR_ELT		// Match a splatted value (SPLAT_VECTOR/BUILD_VECTOR) of an EXTRACT_VECTOR_ELT
// and lower it as a VRGATHER_VX_VL from the source vector.		// and lower it as a VRGATHER_VX_VL from the source vector.
static SDValue matchSplatAsGather(SDValue SplatVal, MVT VT, const SDLoc &DL,		static SDValue matchSplatAsGather(SDValue SplatVal, MVT VT, const SDLoc &DL,
SelectionDAG &DAG,		SelectionDAG &DAG,
const RISCVSubtarget &Subtarget) {		const RISCVSubtarget &Subtarget) {
if (SplatVal.getOpcode() != ISD::EXTRACT_VECTOR_ELT)		if (SplatVal.getOpcode() != ISD::EXTRACT_VECTOR_ELT)
▲ Show 20 Lines • Show All 158 Lines • ▼ Show 20 Lines	static SDValue lowerBUILD_VECTOR(SDValue Op, SelectionDAG &DAG,

// Try and match index sequences, which we can lower to the vid instruction		// Try and match index sequences, which we can lower to the vid instruction
// with optional modifications. An all-undef vector is matched by		// with optional modifications. An all-undef vector is matched by
// getSplatValue, above.		// getSplatValue, above.
if (auto SimpleVID = isSimpleVIDSequence(Op)) {		if (auto SimpleVID = isSimpleVIDSequence(Op)) {
int64_t StepNumerator = SimpleVID->StepNumerator;		int64_t StepNumerator = SimpleVID->StepNumerator;
unsigned StepDenominator = SimpleVID->StepDenominator;		unsigned StepDenominator = SimpleVID->StepDenominator;
int64_t Addend = SimpleVID->Addend;		int64_t Addend = SimpleVID->Addend;
		int InconsistentIdx = SimpleVID->InconsistentIdx;

assert(StepNumerator != 0 && "Invalid step");		assert(StepNumerator != 0 && "Invalid step");
bool Negate = false;		bool Negate = false;
int64_t SplatStepVal = StepNumerator;		int64_t SplatStepVal = StepNumerator;
unsigned StepOpcode = ISD::MUL;		unsigned StepOpcode = ISD::MUL;
if (StepNumerator != 1) {		if (StepNumerator != 1) {
if (isPowerOf2_64(std::abs(StepNumerator))) {		if (isPowerOf2_64(std::abs(StepNumerator))) {
Negate = StepNumerator < 0;		Negate = StepNumerator < 0;
Show All 27 Lines	if (((StepOpcode == ISD::MUL && isInt<12>(SplatStepVal)) \|\|
VT, DL, DAG.getConstant(Log2_64(StepDenominator), DL, XLenVT));		VT, DL, DAG.getConstant(Log2_64(StepDenominator), DL, XLenVT));
VID = DAG.getNode(ISD::SRL, DL, VT, VID, SplatStep);		VID = DAG.getNode(ISD::SRL, DL, VT, VID, SplatStep);
}		}
if (Addend != 0 \|\| Negate) {		if (Addend != 0 \|\| Negate) {
SDValue SplatAddend = DAG.getSplatBuildVector(		SDValue SplatAddend = DAG.getSplatBuildVector(
VT, DL, DAG.getConstant(Addend, DL, XLenVT));		VT, DL, DAG.getConstant(Addend, DL, XLenVT));
VID = DAG.getNode(Negate ? ISD::SUB : ISD::ADD, DL, VT, SplatAddend, VID);		VID = DAG.getNode(Negate ? ISD::SUB : ISD::ADD, DL, VT, SplatAddend, VID);
}		}
		if (InconsistentIdx >= 0) {
		VID = DAG.getNode(ISD::INSERT_VECTOR_ELT, DL, VT, VID,
		Op.getOperand(InconsistentIdx),
		DAG.getConstant(InconsistentIdx, DL, XLenVT));
		}
return VID;		return VID;
}		}
}		}

// Attempt to detect "hidden" splats, which only reveal themselves as splats		// Attempt to detect "hidden" splats, which only reveal themselves as splats
// when re-interpreted as a vector with a larger element type. For example,		// when re-interpreted as a vector with a larger element type. For example,
// v4i16 = build_vector i16 0, i16 1, i16 0, i16 1		// v4i16 = build_vector i16 0, i16 1, i16 0, i16 1
// could be instead splat as		// could be instead splat as
▲ Show 20 Lines • Show All 9,863 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-fp-shuffles.ll

	Show First 20 Lines • Show All 127 Lines • ▼ Show 20 Lines
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%s = shufflevector <4 x double> poison, <4 x double> %x, <4 x i32> <i32 5, i32 6, i32 4, i32 5>			%s = shufflevector <4 x double> poison, <4 x double> %x, <4 x i32> <i32 5, i32 6, i32 4, i32 5>
	ret <4 x double> %s			ret <4 x double> %s
	}			}

	define <4 x double> @vrgather_shuffle_vv_v4f64(<4 x double> %x, <4 x double> %y) {			define <4 x double> @vrgather_shuffle_vv_v4f64(<4 x double> %x, <4 x double> %y) {
	; RV32-LABEL: vrgather_shuffle_vv_v4f64:			; RV32-LABEL: vrgather_shuffle_vv_v4f64:
	; RV32: # %bb.0:			; RV32: # %bb.0:
	; RV32-NEXT: lui a0, %hi(.LCPI6_0)
	; RV32-NEXT: addi a0, a0, %lo(.LCPI6_0)
	; RV32-NEXT: vsetivli zero, 4, e16, mf2, ta, mu			; RV32-NEXT: vsetivli zero, 4, e16, mf2, ta, mu
	; RV32-NEXT: vle16.v v14, (a0)			; RV32-NEXT: vid.v v12
				; RV32-NEXT: vadd.vv v12, v12, v12
				; RV32-NEXT: vrsub.vi v14, v12, 4
				; RV32-NEXT: li a0, 1
				; RV32-NEXT: vsetvli zero, zero, e16, mf2, tu, mu
				; RV32-NEXT: vmv.s.x v14, a0
				reamesUnsubmitted Not Done Reply Inline Actions Its not clear to me that a six instruction sequence is worthwhile to remove a constant pool entry. Can you make an argument as to why this change is worthwhile? reames: Its not clear to me that a six instruction sequence is worthwhile to remove a constant pool…
	; RV32-NEXT: vsetvli zero, zero, e64, m2, ta, mu			; RV32-NEXT: vsetvli zero, zero, e64, m2, ta, mu
	; RV32-NEXT: vrgatherei16.vv v12, v8, v14			; RV32-NEXT: vrgatherei16.vv v12, v8, v14
	; RV32-NEXT: li a0, 8			; RV32-NEXT: li a0, 8
	; RV32-NEXT: vsetivli zero, 1, e8, mf8, ta, mu			; RV32-NEXT: vsetivli zero, 1, e8, mf8, ta, mu
	; RV32-NEXT: vmv.s.x v0, a0			; RV32-NEXT: vmv.s.x v0, a0
	; RV32-NEXT: vsetivli zero, 4, e64, m2, ta, mu			; RV32-NEXT: vsetivli zero, 4, e64, m2, ta, mu
	; RV32-NEXT: vrgather.vi v12, v10, 1, v0.t			; RV32-NEXT: vrgather.vi v12, v10, 1, v0.t
	; RV32-NEXT: vmv.v.v v8, v12			; RV32-NEXT: vmv.v.v v8, v12
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: vrgather_shuffle_vv_v4f64:			; RV64-LABEL: vrgather_shuffle_vv_v4f64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: lui a0, %hi(.LCPI6_0)
	; RV64-NEXT: addi a0, a0, %lo(.LCPI6_0)
	; RV64-NEXT: vsetivli zero, 4, e64, m2, ta, mu			; RV64-NEXT: vsetivli zero, 4, e64, m2, ta, mu
	; RV64-NEXT: vle64.v v14, (a0)			; RV64-NEXT: vid.v v12
				; RV64-NEXT: vadd.vv v12, v12, v12
				; RV64-NEXT: vrsub.vi v14, v12, 4
				; RV64-NEXT: li a0, 1
				; RV64-NEXT: vsetvli zero, zero, e64, m2, tu, mu
				; RV64-NEXT: vmv.s.x v14, a0
				; RV64-NEXT: vsetvli zero, zero, e64, m2, ta, mu
	; RV64-NEXT: vrgather.vv v12, v8, v14			; RV64-NEXT: vrgather.vv v12, v8, v14
	; RV64-NEXT: li a0, 8			; RV64-NEXT: li a0, 8
	; RV64-NEXT: vsetivli zero, 1, e8, mf8, ta, mu			; RV64-NEXT: vsetivli zero, 1, e8, mf8, ta, mu
	; RV64-NEXT: vmv.s.x v0, a0			; RV64-NEXT: vmv.s.x v0, a0
	; RV64-NEXT: vsetivli zero, 4, e64, m2, ta, mu			; RV64-NEXT: vsetivli zero, 4, e64, m2, ta, mu
	; RV64-NEXT: vrgather.vi v12, v10, 1, v0.t			; RV64-NEXT: vrgather.vi v12, v10, 1, v0.t
	; RV64-NEXT: vmv.v.v v8, v12			; RV64-NEXT: vmv.v.v v8, v12
	; RV64-NEXT: ret			; RV64-NEXT: ret
	▲ Show 20 Lines • Show All 167 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-int-buildvec.ll

Show All 18 Lines
; CHECK-NEXT: vsetivli zero, 16, e8, m1, ta, mu		; CHECK-NEXT: vsetivli zero, 16, e8, m1, ta, mu
; CHECK-NEXT: vid.v v8		; CHECK-NEXT: vid.v v8
; CHECK-NEXT: vse8.v v8, (a0)		; CHECK-NEXT: vse8.v v8, (a0)
; CHECK-NEXT: ret		; CHECK-NEXT: ret
store <16 x i8> <i8 0, i8 1, i8 2, i8 undef, i8 4, i8 undef, i8 6, i8 7, i8 8, i8 9, i8 10, i8 11, i8 12, i8 13, i8 14, i8 15>, <16 x i8>* %x		store <16 x i8> <i8 0, i8 1, i8 2, i8 undef, i8 4, i8 undef, i8 6, i8 7, i8 8, i8 9, i8 10, i8 11, i8 12, i8 13, i8 14, i8 15>, <16 x i8>* %x
ret void		ret void
}		}

; TODO: Could do VID then insertelement on missing elements
define void @buildvec_notquite_vid_v16i8(<16 x i8>* %x) {		define void @buildvec_notquite_vid_v16i8(<16 x i8>* %x) {
; CHECK-LABEL: buildvec_notquite_vid_v16i8:		; CHECK-LABEL: buildvec_notquite_vid_v16i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: lui a1, %hi(.LCPI2_0)		; CHECK-NEXT: li a1, 3
; CHECK-NEXT: addi a1, a1, %lo(.LCPI2_0)
; CHECK-NEXT: vsetivli zero, 16, e8, m1, ta, mu		; CHECK-NEXT: vsetivli zero, 16, e8, m1, ta, mu
; CHECK-NEXT: vle8.v v8, (a1)		; CHECK-NEXT: vmv.s.x v8, a1
; CHECK-NEXT: vse8.v v8, (a0)		; CHECK-NEXT: vid.v v9
		; CHECK-NEXT: vsetivli zero, 3, e8, m1, tu, mu
		; CHECK-NEXT: vslideup.vi v9, v8, 2
		; CHECK-NEXT: vsetivli zero, 16, e8, m1, ta, mu
		; CHECK-NEXT: vse8.v v9, (a0)
; CHECK-NEXT: ret		; CHECK-NEXT: ret
store <16 x i8> <i8 0, i8 1, i8 3, i8 3, i8 4, i8 5, i8 6, i8 7, i8 8, i8 9, i8 10, i8 11, i8 12, i8 13, i8 14, i8 15>, <16 x i8>* %x		store <16 x i8> <i8 0, i8 1, i8 3, i8 3, i8 4, i8 5, i8 6, i8 7, i8 8, i8 9, i8 10, i8 11, i8 12, i8 13, i8 14, i8 15>, <16 x i8>* %x
ret void		ret void
}		}

define void @buildvec_vid_plus_imm_v16i8(<16 x i8>* %x) {		define void @buildvec_vid_plus_imm_v16i8(<16 x i8>* %x) {
; CHECK-LABEL: buildvec_vid_plus_imm_v16i8:		; CHECK-LABEL: buildvec_vid_plus_imm_v16i8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
▲ Show 20 Lines • Show All 142 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
store <4 x i32> <i32 -3, i32 undef, i32 undef, i32 -12>, <4 x i32>* %z3		store <4 x i32> <i32 -3, i32 undef, i32 undef, i32 -12>, <4 x i32>* %z3
ret void		ret void
}		}

; FIXME: RV32 doesn't catch this pattern due to BUILD_VECTOR legalization.		; FIXME: RV32 doesn't catch this pattern due to BUILD_VECTOR legalization.
define <4 x i64> @buildvec_vid_step1_add0_v4i64() {		define <4 x i64> @buildvec_vid_step1_add0_v4i64() {
; RV32-LABEL: buildvec_vid_step1_add0_v4i64:		; RV32-LABEL: buildvec_vid_step1_add0_v4i64:
; RV32: # %bb.0:		; RV32: # %bb.0:
; RV32-NEXT: li a0, 1
; RV32-NEXT: vsetivli zero, 4, e32, m1, ta, mu		; RV32-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; RV32-NEXT: vmv.s.x v9, a0		; RV32-NEXT: vmv.s.x v9, zero
; RV32-NEXT: vmv.v.i v8, 0		; RV32-NEXT: vid.v v8
; RV32-NEXT: vsetivli zero, 3, e32, m1, tu, mu		; RV32-NEXT: vsrl.vi v8, v8, 1
; RV32-NEXT: vslideup.vi v8, v9, 2		; RV32-NEXT: vsetvli zero, zero, e32, m1, tu, mu
		; RV32-NEXT: vslideup.vi v8, v9, 3
; RV32-NEXT: lui a0, %hi(.LCPI12_0)		; RV32-NEXT: lui a0, %hi(.LCPI12_0)
; RV32-NEXT: addi a0, a0, %lo(.LCPI12_0)		; RV32-NEXT: addi a0, a0, %lo(.LCPI12_0)
; RV32-NEXT: vsetivli zero, 4, e32, m1, ta, mu		; RV32-NEXT: vsetvli zero, zero, e32, m1, ta, mu
; RV32-NEXT: vle32.v v9, (a0)		; RV32-NEXT: vle32.v v9, (a0)
; RV32-NEXT: ret		; RV32-NEXT: ret
;		;
; RV64-LABEL: buildvec_vid_step1_add0_v4i64:		; RV64-LABEL: buildvec_vid_step1_add0_v4i64:
; RV64: # %bb.0:		; RV64: # %bb.0:
; RV64-NEXT: vsetivli zero, 2, e64, m1, ta, mu		; RV64-NEXT: vsetivli zero, 2, e64, m1, ta, mu
; RV64-NEXT: vid.v v8		; RV64-NEXT: vid.v v8
; RV64-NEXT: vadd.vi v9, v8, 2		; RV64-NEXT: vadd.vi v9, v8, 2
Show All 24 Lines
; RV64-NEXT: vadd.vi v9, v8, 4		; RV64-NEXT: vadd.vi v9, v8, 4
; RV64-NEXT: ret		; RV64-NEXT: ret
ret <4 x i64> <i64 0, i64 2, i64 4, i64 6>		ret <4 x i64> <i64 0, i64 2, i64 4, i64 6>
}		}

define void @buildvec_no_vid_v4i8(<4 x i8>* %z0, <4 x i8>* %z1, <4 x i8>* %z2, <4 x i8>* %z3, <4 x i8>* %z4, <4 x i8>* %z5) {		define void @buildvec_no_vid_v4i8(<4 x i8>* %z0, <4 x i8>* %z1, <4 x i8>* %z2, <4 x i8>* %z3, <4 x i8>* %z4, <4 x i8>* %z5) {
; RV32-LABEL: buildvec_no_vid_v4i8:		; RV32-LABEL: buildvec_no_vid_v4i8:
; RV32: # %bb.0:		; RV32: # %bb.0:
; RV32-NEXT: lui a6, %hi(.LCPI14_0)		; RV32-NEXT: li a6, 6
; RV32-NEXT: addi a6, a6, %lo(.LCPI14_0)		; RV32-NEXT: vsetivli zero, 4, e8, mf4, ta, mu
		; RV32-NEXT: vmv.s.x v8, a6
		; RV32-NEXT: vid.v v9
		; RV32-NEXT: vadd.vv v9, v9, v9
		; RV32-NEXT: vadd.vi v9, v9, 1
		; RV32-NEXT: vsetivli zero, 3, e8, mf4, tu, mu
		; RV32-NEXT: vmv1r.v v10, v9
		; RV32-NEXT: vslideup.vi v10, v8, 2
		; RV32-NEXT: vsetivli zero, 4, e8, mf4, ta, mu
		; RV32-NEXT: vse8.v v10, (a0)
		; RV32-NEXT: li a0, 2
		; RV32-NEXT: vmv.s.x v8, a0
		; RV32-NEXT: vsetivli zero, 2, e8, mf4, tu, mu
		; RV32-NEXT: vslideup.vi v9, v8, 1
; RV32-NEXT: vsetivli zero, 4, e8, mf4, ta, mu		; RV32-NEXT: vsetivli zero, 4, e8, mf4, ta, mu
; RV32-NEXT: vle8.v v8, (a6)
; RV32-NEXT: lui a6, %hi(.LCPI14_1)
; RV32-NEXT: addi a6, a6, %lo(.LCPI14_1)
; RV32-NEXT: vle8.v v9, (a6)
; RV32-NEXT: vse8.v v8, (a0)
; RV32-NEXT: vse8.v v9, (a1)		; RV32-NEXT: vse8.v v9, (a1)
; RV32-NEXT: lui a0, 1		; RV32-NEXT: lui a0, 1
; RV32-NEXT: addi a0, a0, -2048		; RV32-NEXT: addi a0, a0, -2048
; RV32-NEXT: vsetivli zero, 2, e16, mf4, ta, mu		; RV32-NEXT: vsetivli zero, 2, e16, mf4, ta, mu
; RV32-NEXT: vmv.v.x v8, a0		; RV32-NEXT: vmv.v.x v8, a0
; RV32-NEXT: vsetivli zero, 4, e8, mf4, ta, mu		; RV32-NEXT: vsetivli zero, 4, e8, mf4, ta, mu
; RV32-NEXT: vse8.v v8, (a2)		; RV32-NEXT: vse8.v v8, (a2)
; RV32-NEXT: li a0, 2047		; RV32-NEXT: li a0, 2047
; RV32-NEXT: vsetivli zero, 2, e16, mf4, ta, mu		; RV32-NEXT: vsetivli zero, 2, e16, mf4, ta, mu
; RV32-NEXT: vmv.v.x v8, a0		; RV32-NEXT: vmv.v.x v8, a0
; RV32-NEXT: vsetivli zero, 4, e8, mf4, ta, mu		; RV32-NEXT: vsetivli zero, 4, e8, mf4, ta, mu
; RV32-NEXT: lui a0, %hi(.LCPI14_2)		; RV32-NEXT: lui a0, %hi(.LCPI14_0)
; RV32-NEXT: addi a0, a0, %lo(.LCPI14_2)		; RV32-NEXT: addi a0, a0, %lo(.LCPI14_0)
; RV32-NEXT: vle8.v v9, (a0)		; RV32-NEXT: vle8.v v9, (a0)
; RV32-NEXT: vse8.v v8, (a3)		; RV32-NEXT: vse8.v v8, (a3)
; RV32-NEXT: vmv.v.i v8, -2		; RV32-NEXT: vmv.v.i v8, -2
; RV32-NEXT: vse8.v v8, (a4)		; RV32-NEXT: vse8.v v8, (a4)
; RV32-NEXT: vse8.v v9, (a5)		; RV32-NEXT: vse8.v v9, (a5)
; RV32-NEXT: ret		; RV32-NEXT: ret
;		;
; RV64-LABEL: buildvec_no_vid_v4i8:		; RV64-LABEL: buildvec_no_vid_v4i8:
; RV64: # %bb.0:		; RV64: # %bb.0:
; RV64-NEXT: lui a6, %hi(.LCPI14_0)		; RV64-NEXT: li a6, 6
; RV64-NEXT: addi a6, a6, %lo(.LCPI14_0)		; RV64-NEXT: vsetivli zero, 4, e8, mf4, ta, mu
		; RV64-NEXT: vmv.s.x v8, a6
		; RV64-NEXT: vid.v v9
		; RV64-NEXT: vadd.vv v9, v9, v9
		; RV64-NEXT: vadd.vi v9, v9, 1
		; RV64-NEXT: vsetivli zero, 3, e8, mf4, tu, mu
		; RV64-NEXT: vmv1r.v v10, v9
		; RV64-NEXT: vslideup.vi v10, v8, 2
		; RV64-NEXT: vsetivli zero, 4, e8, mf4, ta, mu
		; RV64-NEXT: vse8.v v10, (a0)
		; RV64-NEXT: li a0, 2
		; RV64-NEXT: vmv.s.x v8, a0
		; RV64-NEXT: vsetivli zero, 2, e8, mf4, tu, mu
		; RV64-NEXT: vslideup.vi v9, v8, 1
; RV64-NEXT: vsetivli zero, 4, e8, mf4, ta, mu		; RV64-NEXT: vsetivli zero, 4, e8, mf4, ta, mu
; RV64-NEXT: vle8.v v8, (a6)
; RV64-NEXT: lui a6, %hi(.LCPI14_1)
; RV64-NEXT: addi a6, a6, %lo(.LCPI14_1)
; RV64-NEXT: vle8.v v9, (a6)
; RV64-NEXT: vse8.v v8, (a0)
; RV64-NEXT: vse8.v v9, (a1)		; RV64-NEXT: vse8.v v9, (a1)
; RV64-NEXT: lui a0, 1		; RV64-NEXT: lui a0, 1
; RV64-NEXT: addiw a0, a0, -2048		; RV64-NEXT: addiw a0, a0, -2048
; RV64-NEXT: vsetivli zero, 2, e16, mf4, ta, mu		; RV64-NEXT: vsetivli zero, 2, e16, mf4, ta, mu
; RV64-NEXT: vmv.v.x v8, a0		; RV64-NEXT: vmv.v.x v8, a0
; RV64-NEXT: vsetivli zero, 4, e8, mf4, ta, mu		; RV64-NEXT: vsetivli zero, 4, e8, mf4, ta, mu
; RV64-NEXT: vse8.v v8, (a2)		; RV64-NEXT: vse8.v v8, (a2)
; RV64-NEXT: li a0, 2047		; RV64-NEXT: li a0, 2047
; RV64-NEXT: vsetivli zero, 2, e16, mf4, ta, mu		; RV64-NEXT: vsetivli zero, 2, e16, mf4, ta, mu
; RV64-NEXT: vmv.v.x v8, a0		; RV64-NEXT: vmv.v.x v8, a0
; RV64-NEXT: vsetivli zero, 4, e8, mf4, ta, mu		; RV64-NEXT: vsetivli zero, 4, e8, mf4, ta, mu
; RV64-NEXT: lui a0, %hi(.LCPI14_2)		; RV64-NEXT: lui a0, %hi(.LCPI14_0)
; RV64-NEXT: addi a0, a0, %lo(.LCPI14_2)		; RV64-NEXT: addi a0, a0, %lo(.LCPI14_0)
; RV64-NEXT: vle8.v v9, (a0)		; RV64-NEXT: vle8.v v9, (a0)
; RV64-NEXT: vse8.v v8, (a3)		; RV64-NEXT: vse8.v v8, (a3)
; RV64-NEXT: vmv.v.i v8, -2		; RV64-NEXT: vmv.v.i v8, -2
; RV64-NEXT: vse8.v v8, (a4)		; RV64-NEXT: vse8.v v8, (a4)
; RV64-NEXT: vse8.v v9, (a5)		; RV64-NEXT: vse8.v v9, (a5)
; RV64-NEXT: ret		; RV64-NEXT: ret
store <4 x i8> <i8 1, i8 3, i8 6, i8 7>, <4 x i8>* %z0		store <4 x i8> <i8 1, i8 3, i8 6, i8 7>, <4 x i8>* %z0
store <4 x i8> <i8 undef, i8 2, i8 5, i8 7>, <4 x i8>* %z1		store <4 x i8> <i8 undef, i8 2, i8 5, i8 7>, <4 x i8>* %z1
▲ Show 20 Lines • Show All 230 Lines • ▼ Show 20 Lines
; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, mu		; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, mu
; CHECK-NEXT: vse16.v v8, (a0)		; CHECK-NEXT: vse16.v v8, (a0)
; CHECK-NEXT: ret		; CHECK-NEXT: ret
store <4 x i16> <i16 -127, i16 -1, i16 -127, i16 -1>, <4 x i16>* %x		store <4 x i16> <i16 -127, i16 -1, i16 -127, i16 -1>, <4 x i16>* %x
ret void		ret void
}		}

define void @buildvec_vid_step1o2_v4i32(<4 x i32>* %z0, <4 x i32>* %z1, <4 x i32>* %z2, <4 x i32>* %z3, <4 x i32>* %z4, <4 x i32>* %z5, <4 x i32>* %z6) {		define void @buildvec_vid_step1o2_v4i32(<4 x i32>* %z0, <4 x i32>* %z1, <4 x i32>* %z2, <4 x i32>* %z3, <4 x i32>* %z4, <4 x i32>* %z5, <4 x i32>* %z6) {
; RV32-LABEL: buildvec_vid_step1o2_v4i32:		; CHECK-LABEL: buildvec_vid_step1o2_v4i32:
; RV32: # %bb.0:		; CHECK: # %bb.0:
; RV32-NEXT: vsetivli zero, 4, e32, m1, ta, mu		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; RV32-NEXT: vid.v v8		; CHECK-NEXT: vid.v v8
; RV32-NEXT: vsrl.vi v8, v8, 1		; CHECK-NEXT: vsrl.vi v8, v8, 1
; RV32-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; RV32-NEXT: vse32.v v8, (a1)		; CHECK-NEXT: vse32.v v8, (a1)
; RV32-NEXT: vmv.v.i v9, 1		; CHECK-NEXT: vse32.v v8, (a2)
; RV32-NEXT: vse32.v v8, (a2)		; CHECK-NEXT: vse32.v v8, (a3)
; RV32-NEXT: vse32.v v8, (a3)		; CHECK-NEXT: vse32.v v8, (a4)
; RV32-NEXT: vse32.v v8, (a4)		; CHECK-NEXT: li a0, 1
; RV32-NEXT: vmv.s.x v8, zero		; CHECK-NEXT: vmv.s.x v9, a0
; RV32-NEXT: vsetivli zero, 2, e32, m1, tu, mu		; CHECK-NEXT: vsetivli zero, 3, e32, m1, tu, mu
; RV32-NEXT: vslideup.vi v9, v8, 1		; CHECK-NEXT: vslideup.vi v8, v9, 2
; RV32-NEXT: vsetivli zero, 4, e32, m1, ta, mu		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; RV32-NEXT: vse32.v v9, (a5)		; CHECK-NEXT: vse32.v v8, (a5)
; RV32-NEXT: li a0, 1		; CHECK-NEXT: vmv.v.i v8, 0
; RV32-NEXT: vmv.s.x v8, a0		; CHECK-NEXT: vsetvli zero, zero, e32, m1, tu, mu
; RV32-NEXT: vmv.v.i v9, 0		; CHECK-NEXT: vslideup.vi v8, v9, 3
; RV32-NEXT: vsetvli zero, zero, e32, m1, tu, mu		; CHECK-NEXT: vse32.v v8, (a6)
; RV32-NEXT: vslideup.vi v9, v8, 3		; CHECK-NEXT: ret
; RV32-NEXT: vse32.v v9, (a6)
; RV32-NEXT: ret
;
; RV64-LABEL: buildvec_vid_step1o2_v4i32:
; RV64: # %bb.0:
; RV64-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; RV64-NEXT: vid.v v8
; RV64-NEXT: vsrl.vi v8, v8, 1
; RV64-NEXT: vse32.v v8, (a0)
; RV64-NEXT: vmv.v.i v9, 1
; RV64-NEXT: vse32.v v8, (a1)
; RV64-NEXT: vse32.v v8, (a2)
; RV64-NEXT: vse32.v v8, (a3)
; RV64-NEXT: vse32.v v8, (a4)
; RV64-NEXT: vmv.s.x v8, zero
; RV64-NEXT: vsetivli zero, 2, e32, m1, tu, mu
; RV64-NEXT: vslideup.vi v9, v8, 1
; RV64-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; RV64-NEXT: vse32.v v9, (a5)
; RV64-NEXT: li a0, 1
; RV64-NEXT: vmv.s.x v8, a0
; RV64-NEXT: vmv.v.i v9, 0
; RV64-NEXT: vsetvli zero, zero, e32, m1, tu, mu
; RV64-NEXT: vslideup.vi v9, v8, 3
; RV64-NEXT: vse32.v v9, (a6)
; RV64-NEXT: ret
store <4 x i32> <i32 0, i32 0, i32 1, i32 1>, <4 x i32>* %z0		store <4 x i32> <i32 0, i32 0, i32 1, i32 1>, <4 x i32>* %z0
store <4 x i32> <i32 0, i32 0, i32 1, i32 undef>, <4 x i32>* %z1		store <4 x i32> <i32 0, i32 0, i32 1, i32 undef>, <4 x i32>* %z1
store <4 x i32> <i32 0, i32 undef, i32 1, i32 1>, <4 x i32>* %z2		store <4 x i32> <i32 0, i32 undef, i32 1, i32 1>, <4 x i32>* %z2
store <4 x i32> <i32 undef, i32 0, i32 undef, i32 1>, <4 x i32>* %z3		store <4 x i32> <i32 undef, i32 0, i32 undef, i32 1>, <4 x i32>* %z3
store <4 x i32> <i32 0, i32 undef, i32 1, i32 undef>, <4 x i32>* %z4		store <4 x i32> <i32 0, i32 undef, i32 1, i32 undef>, <4 x i32>* %z4
; We don't catch this one		; We don't catch this one
store <4 x i32> <i32 undef, i32 0, i32 1, i32 1>, <4 x i32>* %z5		store <4 x i32> <i32 undef, i32 0, i32 1, i32 1>, <4 x i32>* %z5
; We catch this one but as VID/3 rather than VID/2		; We catch this one but as VID/3 rather than VID/2
Show All 9 Lines
; CHECK-NEXT: vsrl.vi v8, v8, 1		; CHECK-NEXT: vsrl.vi v8, v8, 1
; CHECK-NEXT: vadd.vi v8, v8, 3		; CHECK-NEXT: vadd.vi v8, v8, 3
; CHECK-NEXT: vse16.v v8, (a0)		; CHECK-NEXT: vse16.v v8, (a0)
; CHECK-NEXT: vmv.v.i v9, 3		; CHECK-NEXT: vmv.v.i v9, 3
; CHECK-NEXT: vse16.v v8, (a1)		; CHECK-NEXT: vse16.v v8, (a1)
; CHECK-NEXT: vse16.v v8, (a2)		; CHECK-NEXT: vse16.v v8, (a2)
; CHECK-NEXT: vse16.v v8, (a3)		; CHECK-NEXT: vse16.v v8, (a3)
; CHECK-NEXT: vse16.v v8, (a4)		; CHECK-NEXT: vse16.v v8, (a4)
; CHECK-NEXT: li a0, 3
; CHECK-NEXT: vmv.s.x v8, a0
; CHECK-NEXT: vmv.v.i v10, 4
; CHECK-NEXT: vsetivli zero, 2, e16, mf2, tu, mu
; CHECK-NEXT: vslideup.vi v10, v8, 1
; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, mu
; CHECK-NEXT: vse16.v v10, (a5)
; CHECK-NEXT: li a0, 4		; CHECK-NEXT: li a0, 4
; CHECK-NEXT: vmv.s.x v8, a0		; CHECK-NEXT: vmv.s.x v10, a0
		; CHECK-NEXT: vsetivli zero, 3, e16, mf2, tu, mu
		; CHECK-NEXT: vslideup.vi v8, v10, 2
		; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, mu
		; CHECK-NEXT: vse16.v v8, (a5)
; CHECK-NEXT: vsetvli zero, zero, e16, mf2, tu, mu		; CHECK-NEXT: vsetvli zero, zero, e16, mf2, tu, mu
; CHECK-NEXT: vslideup.vi v9, v8, 3		; CHECK-NEXT: vslideup.vi v9, v10, 3
; CHECK-NEXT: vse16.v v9, (a6)		; CHECK-NEXT: vse16.v v9, (a6)
; CHECK-NEXT: ret		; CHECK-NEXT: ret
store <4 x i16> <i16 3, i16 3, i16 4, i16 4>, <4 x i16>* %z0		store <4 x i16> <i16 3, i16 3, i16 4, i16 4>, <4 x i16>* %z0
store <4 x i16> <i16 3, i16 3, i16 4, i16 undef>, <4 x i16>* %z1		store <4 x i16> <i16 3, i16 3, i16 4, i16 undef>, <4 x i16>* %z1
store <4 x i16> <i16 3, i16 undef, i16 4, i16 4>, <4 x i16>* %z2		store <4 x i16> <i16 3, i16 undef, i16 4, i16 4>, <4 x i16>* %z2
store <4 x i16> <i16 undef, i16 3, i16 undef, i16 4>, <4 x i16>* %z3		store <4 x i16> <i16 undef, i16 3, i16 undef, i16 4>, <4 x i16>* %z3
store <4 x i16> <i16 3, i16 undef, i16 4, i16 undef>, <4 x i16>* %z4		store <4 x i16> <i16 3, i16 undef, i16 4, i16 undef>, <4 x i16>* %z4
; We don't catch this one		; We don't catch this one
▲ Show 20 Lines • Show All 91 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%ins = insertelement <8 x i16> poison, i16 %x, i32 0		%ins = insertelement <8 x i16> poison, i16 %x, i32 0
%splat = shufflevector <8 x i16> %ins, <8 x i16> poison, <8 x i32> zeroinitializer		%splat = shufflevector <8 x i16> %ins, <8 x i16> poison, <8 x i32> zeroinitializer
ret <8 x i16> %splat		ret <8 x i16> %splat
}		}

define <4 x i8> @buildvec_not_vid_v4i8_1() {		define <4 x i8> @buildvec_not_vid_v4i8_1() {
; CHECK-LABEL: buildvec_not_vid_v4i8_1:		; CHECK-LABEL: buildvec_not_vid_v4i8_1:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: lui a0, %hi(.LCPI37_0)
; CHECK-NEXT: addi a0, a0, %lo(.LCPI37_0)
; CHECK-NEXT: vsetivli zero, 4, e8, mf4, ta, mu		; CHECK-NEXT: vsetivli zero, 4, e8, mf4, ta, mu
; CHECK-NEXT: vle8.v v8, (a0)		; CHECK-NEXT: vmv.s.x v9, zero
		; CHECK-NEXT: vid.v v8
		; CHECK-NEXT: vsetivli zero, 2, e8, mf4, tu, mu
		; CHECK-NEXT: vslideup.vi v8, v9, 1
; CHECK-NEXT: ret		; CHECK-NEXT: ret
ret <4 x i8> <i8 0, i8 0, i8 2, i8 3>		ret <4 x i8> <i8 0, i8 0, i8 2, i8 3>
}		}

define <4 x i8> @buildvec_not_vid_v4i8_2() {		define <4 x i8> @buildvec_not_vid_v4i8_2() {
; CHECK-LABEL: buildvec_not_vid_v4i8_2:		; CHECK-LABEL: buildvec_not_vid_v4i8_2:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: lui a0, %hi(.LCPI38_0)		; CHECK-NEXT: li a0, 3
; CHECK-NEXT: addi a0, a0, %lo(.LCPI38_0)
; CHECK-NEXT: vsetivli zero, 4, e8, mf4, ta, mu		; CHECK-NEXT: vsetivli zero, 4, e8, mf4, ta, mu
; CHECK-NEXT: vle8.v v8, (a0)		; CHECK-NEXT: vmv.s.x v9, a0
		; CHECK-NEXT: vid.v v8
		; CHECK-NEXT: vrsub.vi v8, v8, 3
		; CHECK-NEXT: vsetivli zero, 2, e8, mf4, tu, mu
		; CHECK-NEXT: vslideup.vi v8, v9, 1
; CHECK-NEXT: ret		; CHECK-NEXT: ret
ret <4 x i8> <i8 3, i8 3, i8 1, i8 0>		ret <4 x i8> <i8 3, i8 3, i8 1, i8 0>
}		}

; We match this as a VID sequence (-3 / 8) + 5 but choose not to introduce		; We match this as a VID sequence (-3 / 8) + 5 but choose not to introduce
; division to compute it.		; division to compute it.
define <16 x i8> @buildvec_not_vid_v16i8() {		define <16 x i8> @buildvec_not_vid_v16i8() {
; CHECK-LABEL: buildvec_not_vid_v16i8:		; CHECK-LABEL: buildvec_not_vid_v16i8:
Show All 10 Lines

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-int-shuffles.ll

	Show First 20 Lines • Show All 79 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%s = shufflevector <4 x i16> poison, <4 x i16> %x, <4 x i32> <i32 5, i32 6, i32 4, i32 5>			%s = shufflevector <4 x i16> poison, <4 x i16> %x, <4 x i32> <i32 5, i32 6, i32 4, i32 5>
	ret <4 x i16> %s			ret <4 x i16> %s
	}			}

	define <4 x i16> @vrgather_shuffle_vv_v4i16(<4 x i16> %x, <4 x i16> %y) {			define <4 x i16> @vrgather_shuffle_vv_v4i16(<4 x i16> %x, <4 x i16> %y) {
	; CHECK-LABEL: vrgather_shuffle_vv_v4i16:			; CHECK-LABEL: vrgather_shuffle_vv_v4i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: lui a0, %hi(.LCPI6_0)
	; CHECK-NEXT: addi a0, a0, %lo(.LCPI6_0)
	; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, mu			; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, mu
	; CHECK-NEXT: vle16.v v11, (a0)			; CHECK-NEXT: vid.v v10
				; CHECK-NEXT: vadd.vv v10, v10, v10
				; CHECK-NEXT: vrsub.vi v11, v10, 4
				; CHECK-NEXT: li a0, 1
				; CHECK-NEXT: vsetvli zero, zero, e16, mf2, tu, mu
				; CHECK-NEXT: vmv.s.x v11, a0
				; CHECK-NEXT: vsetvli zero, zero, e16, mf2, ta, mu
	; CHECK-NEXT: vrgather.vv v10, v8, v11			; CHECK-NEXT: vrgather.vv v10, v8, v11
	; CHECK-NEXT: li a0, 8			; CHECK-NEXT: li a0, 8
	; CHECK-NEXT: vsetivli zero, 1, e8, mf8, ta, mu			; CHECK-NEXT: vsetivli zero, 1, e8, mf8, ta, mu
	; CHECK-NEXT: vmv.s.x v0, a0			; CHECK-NEXT: vmv.s.x v0, a0
	; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, mu			; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, mu
	; CHECK-NEXT: vrgather.vi v10, v9, 1, v0.t			; CHECK-NEXT: vrgather.vi v10, v9, 1, v0.t
	; CHECK-NEXT: vmv1r.v v8, v10			; CHECK-NEXT: vmv1r.v v8, v10
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	▲ Show 20 Lines • Show All 354 Lines • ▼ Show 20 Lines
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%shuff = shufflevector <8 x i8> %v, <8 x i8> %w, <8 x i32> <i32 2, i32 8, i32 4, i32 2, i32 2, i32 2, i32 8, i32 2>			%shuff = shufflevector <8 x i8> %v, <8 x i8> %w, <8 x i32> <i32 2, i32 8, i32 4, i32 2, i32 2, i32 2, i32 8, i32 2>
	ret <8 x i8> %shuff			ret <8 x i8> %shuff
	}			}

	define <8 x i8> @splat_ve2_we0_ins_i2we4(<8 x i8> %v, <8 x i8> %w) {			define <8 x i8> @splat_ve2_we0_ins_i2we4(<8 x i8> %v, <8 x i8> %w) {
	; CHECK-LABEL: splat_ve2_we0_ins_i2we4:			; CHECK-LABEL: splat_ve2_we0_ins_i2we4:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: li a0, 4
	; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu			; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
	; CHECK-NEXT: vmv.s.x v10, a0			; CHECK-NEXT: vmv.s.x v10, zero
	; CHECK-NEXT: vmv.v.i v11, 0			; CHECK-NEXT: vid.v v11
	; CHECK-NEXT: vsetivli zero, 3, e8, mf2, tu, mu			; CHECK-NEXT: vrsub.vi v11, v11, 6
	; CHECK-NEXT: vslideup.vi v11, v10, 2			; CHECK-NEXT: vsetivli zero, 2, e8, mf2, tu, mu
				; CHECK-NEXT: vslideup.vi v11, v10, 1
	; CHECK-NEXT: li a0, 70			; CHECK-NEXT: li a0, 70
	; CHECK-NEXT: vsetivli zero, 1, e8, mf8, ta, mu			; CHECK-NEXT: vsetivli zero, 1, e8, mf8, ta, mu
	; CHECK-NEXT: vmv.s.x v0, a0			; CHECK-NEXT: vmv.s.x v0, a0
	; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu			; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
	; CHECK-NEXT: vrgather.vi v10, v8, 2			; CHECK-NEXT: vrgather.vi v10, v8, 2
	; CHECK-NEXT: vrgather.vv v10, v9, v11, v0.t			; CHECK-NEXT: vrgather.vv v10, v9, v11, v0.t
	; CHECK-NEXT: vmv1r.v v8, v10			; CHECK-NEXT: vmv1r.v v8, v10
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	▲ Show 20 Lines • Show All 153 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-int.ll

	Show First 20 Lines • Show All 1,204 Lines • ▼ Show 20 Lines
	; RV32-NEXT: addi a1, a1, 1366			; RV32-NEXT: addi a1, a1, 1366
	; RV32-NEXT: vsetvli zero, zero, e32, m1, tu, mu			; RV32-NEXT: vsetvli zero, zero, e32, m1, tu, mu
	; RV32-NEXT: vmv.s.x v9, a1			; RV32-NEXT: vmv.s.x v9, a1
	; RV32-NEXT: vsetivli zero, 2, e64, m1, ta, mu			; RV32-NEXT: vsetivli zero, 2, e64, m1, ta, mu
	; RV32-NEXT: vmulh.vv v9, v8, v9			; RV32-NEXT: vmulh.vv v9, v8, v9
	; RV32-NEXT: vsetivli zero, 4, e32, m1, ta, mu			; RV32-NEXT: vsetivli zero, 4, e32, m1, ta, mu
	; RV32-NEXT: vid.v v10			; RV32-NEXT: vid.v v10
	; RV32-NEXT: vsrl.vi v10, v10, 1			; RV32-NEXT: vsrl.vi v10, v10, 1
	; RV32-NEXT: vrsub.vi v10, v10, 0			; RV32-NEXT: vrsub.vi v11, v10, 0
	; RV32-NEXT: vsetivli zero, 2, e64, m1, ta, mu			; RV32-NEXT: vsetivli zero, 2, e64, m1, ta, mu
	; RV32-NEXT: vmadd.vv v10, v8, v9			; RV32-NEXT: vmadd.vv v11, v8, v9
	; RV32-NEXT: li a1, 1
	; RV32-NEXT: vsetivli zero, 4, e32, m1, ta, mu			; RV32-NEXT: vsetivli zero, 4, e32, m1, ta, mu
	; RV32-NEXT: vmv.s.x v8, a1			; RV32-NEXT: vmv.s.x v8, zero
	; RV32-NEXT: vmv.v.i v9, 0			; RV32-NEXT: vsetvli zero, zero, e32, m1, tu, mu
	; RV32-NEXT: vsetivli zero, 3, e32, m1, tu, mu			; RV32-NEXT: vslideup.vi v10, v8, 3
	; RV32-NEXT: vslideup.vi v9, v8, 2
	; RV32-NEXT: vsetivli zero, 2, e64, m1, ta, mu			; RV32-NEXT: vsetivli zero, 2, e64, m1, ta, mu
	; RV32-NEXT: vsra.vv v8, v10, v9			; RV32-NEXT: vsra.vv v8, v11, v10
	; RV32-NEXT: li a1, 63			; RV32-NEXT: li a1, 63
	; RV32-NEXT: vsrl.vx v9, v10, a1			; RV32-NEXT: vsrl.vx v9, v11, a1
	; RV32-NEXT: vadd.vv v8, v8, v9			; RV32-NEXT: vadd.vv v8, v8, v9
	; RV32-NEXT: vse64.v v8, (a0)			; RV32-NEXT: vse64.v v8, (a0)
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: mulhs_v2i64:			; RV64-LABEL: mulhs_v2i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
	; RV64-NEXT: lui a1, %hi(.LCPI59_0)			; RV64-NEXT: lui a1, %hi(.LCPI59_0)
	; RV64-NEXT: ld a1, %lo(.LCPI59_0)(a1)			; RV64-NEXT: ld a1, %lo(.LCPI59_0)(a1)
	▲ Show 20 Lines • Show All 2,917 Lines • ▼ Show 20 Lines
	; LMULMAX2-RV64-NEXT: vadd.vv v8, v10, v8			; LMULMAX2-RV64-NEXT: vadd.vv v8, v10, v8
	; LMULMAX2-RV64-NEXT: vsrl.vv v8, v8, v12			; LMULMAX2-RV64-NEXT: vsrl.vv v8, v8, v12
	; LMULMAX2-RV64-NEXT: vse16.v v8, (a0)			; LMULMAX2-RV64-NEXT: vse16.v v8, (a0)
	; LMULMAX2-RV64-NEXT: ret			; LMULMAX2-RV64-NEXT: ret
	;			;
	; LMULMAX1-LABEL: mulhu_v16i16:			; LMULMAX1-LABEL: mulhu_v16i16:
	; LMULMAX1: # %bb.0:			; LMULMAX1: # %bb.0:
	; LMULMAX1-NEXT: vsetivli zero, 8, e16, m1, ta, mu			; LMULMAX1-NEXT: vsetivli zero, 8, e16, m1, ta, mu
				; LMULMAX1-NEXT: vle16.v v8, (a0)
	; LMULMAX1-NEXT: addi a1, a0, 16			; LMULMAX1-NEXT: addi a1, a0, 16
	; LMULMAX1-NEXT: vle16.v v8, (a1)			; LMULMAX1-NEXT: vle16.v v9, (a1)
	; LMULMAX1-NEXT: lui a2, %hi(.LCPI130_0)			; LMULMAX1-NEXT: vid.v v10
	; LMULMAX1-NEXT: addi a2, a2, %lo(.LCPI130_0)			; LMULMAX1-NEXT: vadd.vi v10, v10, 8
	; LMULMAX1-NEXT: vle16.v v9, (a2)			; LMULMAX1-NEXT: li a2, 7
	; LMULMAX1-NEXT: vle16.v v10, (a0)			; LMULMAX1-NEXT: vsetvli zero, zero, e16, m1, tu, mu
	; LMULMAX1-NEXT: vdivu.vv v8, v8, v9			; LMULMAX1-NEXT: vmv.s.x v10, a2
	; LMULMAX1-NEXT: vdivu.vv v9, v10, v9			; LMULMAX1-NEXT: vsetvli zero, zero, e16, m1, ta, mu
	; LMULMAX1-NEXT: vse16.v v9, (a0)			; LMULMAX1-NEXT: vdivu.vv v9, v9, v10
	; LMULMAX1-NEXT: vse16.v v8, (a1)			; LMULMAX1-NEXT: vdivu.vv v8, v8, v10
				; LMULMAX1-NEXT: vse16.v v8, (a0)
				; LMULMAX1-NEXT: vse16.v v9, (a1)
	; LMULMAX1-NEXT: ret			; LMULMAX1-NEXT: ret
	%a = load <16 x i16>, <16 x i16>* %x			%a = load <16 x i16>, <16 x i16>* %x
	%b = udiv <16 x i16> %a, <i16 7, i16 9, i16 10, i16 11, i16 12, i16 13, i16 14, i16 15, i16 7, i16 9, i16 10, i16 11, i16 12, i16 13, i16 14, i16 15>			%b = udiv <16 x i16> %a, <i16 7, i16 9, i16 10, i16 11, i16 12, i16 13, i16 14, i16 15, i16 7, i16 9, i16 10, i16 11, i16 12, i16 13, i16 14, i16 15>
	store <16 x i16> %b, <16 x i16>* %x			store <16 x i16> %b, <16 x i16>* %x
	ret void			ret void
	}			}

	define void @mulhu_v8i32(<8 x i32>* %x) {			define void @mulhu_v8i32(<8 x i32>* %x) {
	▲ Show 20 Lines • Show All 58 Lines • ▼ Show 20 Lines
	; LMULMAX1-RV32-NEXT: vsrl.vv v8, v8, v13			; LMULMAX1-RV32-NEXT: vsrl.vv v8, v8, v13
	; LMULMAX1-RV32-NEXT: vse32.v v8, (a0)			; LMULMAX1-RV32-NEXT: vse32.v v8, (a0)
	; LMULMAX1-RV32-NEXT: vse32.v v9, (a1)			; LMULMAX1-RV32-NEXT: vse32.v v9, (a1)
	; LMULMAX1-RV32-NEXT: ret			; LMULMAX1-RV32-NEXT: ret
	;			;
	; LMULMAX1-RV64-LABEL: mulhu_v8i32:			; LMULMAX1-RV64-LABEL: mulhu_v8i32:
	; LMULMAX1-RV64: # %bb.0:			; LMULMAX1-RV64: # %bb.0:
	; LMULMAX1-RV64-NEXT: vsetivli zero, 4, e32, m1, ta, mu			; LMULMAX1-RV64-NEXT: vsetivli zero, 4, e32, m1, ta, mu
				; LMULMAX1-RV64-NEXT: vle32.v v8, (a0)
	; LMULMAX1-RV64-NEXT: addi a1, a0, 16			; LMULMAX1-RV64-NEXT: addi a1, a0, 16
	; LMULMAX1-RV64-NEXT: vle32.v v8, (a1)			; LMULMAX1-RV64-NEXT: vle32.v v9, (a1)
	; LMULMAX1-RV64-NEXT: lui a2, %hi(.LCPI131_0)			; LMULMAX1-RV64-NEXT: li a2, 9
	; LMULMAX1-RV64-NEXT: addi a2, a2, %lo(.LCPI131_0)			; LMULMAX1-RV64-NEXT: vmv.s.x v10, a2
	; LMULMAX1-RV64-NEXT: vle32.v v9, (a2)			; LMULMAX1-RV64-NEXT: vid.v v11
	; LMULMAX1-RV64-NEXT: vle32.v v10, (a0)			; LMULMAX1-RV64-NEXT: vadd.vi v11, v11, 5
	; LMULMAX1-RV64-NEXT: vdivu.vv v8, v8, v9			; LMULMAX1-RV64-NEXT: vsetvli zero, zero, e32, m1, tu, mu
	; LMULMAX1-RV64-NEXT: vdivu.vv v9, v10, v9			; LMULMAX1-RV64-NEXT: vslideup.vi v11, v10, 3
	; LMULMAX1-RV64-NEXT: vse32.v v9, (a0)			; LMULMAX1-RV64-NEXT: vsetvli zero, zero, e32, m1, ta, mu
	; LMULMAX1-RV64-NEXT: vse32.v v8, (a1)			; LMULMAX1-RV64-NEXT: vdivu.vv v9, v9, v11
				; LMULMAX1-RV64-NEXT: vdivu.vv v8, v8, v11
				; LMULMAX1-RV64-NEXT: vse32.v v8, (a0)
				; LMULMAX1-RV64-NEXT: vse32.v v9, (a1)
	; LMULMAX1-RV64-NEXT: ret			; LMULMAX1-RV64-NEXT: ret
	%a = load <8 x i32>, <8 x i32>* %x			%a = load <8 x i32>, <8 x i32>* %x
	%b = udiv <8 x i32> %a, <i32 5, i32 6, i32 7, i32 9, i32 5, i32 6, i32 7, i32 9>			%b = udiv <8 x i32> %a, <i32 5, i32 6, i32 7, i32 9, i32 5, i32 6, i32 7, i32 9>
	store <8 x i32> %b, <8 x i32>* %x			store <8 x i32> %b, <8 x i32>* %x
	ret void			ret void
	}			}

	define void @mulhu_v4i64(<4 x i64>* %x) {			define void @mulhu_v4i64(<4 x i64>* %x) {
	▲ Show 20 Lines • Show All 425 Lines • ▼ Show 20 Lines
	; LMULMAX2-RV64-NEXT: ret			; LMULMAX2-RV64-NEXT: ret
	;			;
	; LMULMAX1-RV32-LABEL: mulhs_v4i64:			; LMULMAX1-RV32-LABEL: mulhs_v4i64:
	; LMULMAX1-RV32: # %bb.0:			; LMULMAX1-RV32: # %bb.0:
	; LMULMAX1-RV32-NEXT: vsetivli zero, 2, e64, m1, ta, mu			; LMULMAX1-RV32-NEXT: vsetivli zero, 2, e64, m1, ta, mu
	; LMULMAX1-RV32-NEXT: vle64.v v8, (a0)			; LMULMAX1-RV32-NEXT: vle64.v v8, (a0)
	; LMULMAX1-RV32-NEXT: addi a1, a0, 16			; LMULMAX1-RV32-NEXT: addi a1, a0, 16
	; LMULMAX1-RV32-NEXT: vle64.v v9, (a1)			; LMULMAX1-RV32-NEXT: vle64.v v9, (a1)
	; LMULMAX1-RV32-NEXT: lui a2, %hi(.LCPI136_0)
	; LMULMAX1-RV32-NEXT: addi a2, a2, %lo(.LCPI136_0)
	; LMULMAX1-RV32-NEXT: vsetivli zero, 4, e32, m1, ta, mu			; LMULMAX1-RV32-NEXT: vsetivli zero, 4, e32, m1, ta, mu
	; LMULMAX1-RV32-NEXT: vle32.v v10, (a2)			; LMULMAX1-RV32-NEXT: vmv.v.i v10, 3
				; LMULMAX1-RV32-NEXT: vid.v v11
				; LMULMAX1-RV32-NEXT: li a2, -3
				; LMULMAX1-RV32-NEXT: vmadd.vx v11, a2, v10
				; LMULMAX1-RV32-NEXT: li a2, -1
				; LMULMAX1-RV32-NEXT: vmv.s.x v10, a2
				; LMULMAX1-RV32-NEXT: vsetvli zero, zero, e32, m1, tu, mu
				; LMULMAX1-RV32-NEXT: vslideup.vi v11, v10, 3
	; LMULMAX1-RV32-NEXT: vsetivli zero, 2, e64, m1, ta, mu			; LMULMAX1-RV32-NEXT: vsetivli zero, 2, e64, m1, ta, mu
	; LMULMAX1-RV32-NEXT: vdiv.vv v9, v9, v10			; LMULMAX1-RV32-NEXT: vdiv.vv v9, v9, v11
	; LMULMAX1-RV32-NEXT: vdiv.vv v8, v8, v10			; LMULMAX1-RV32-NEXT: vdiv.vv v8, v8, v11
	; LMULMAX1-RV32-NEXT: vse64.v v8, (a0)			; LMULMAX1-RV32-NEXT: vse64.v v8, (a0)
	; LMULMAX1-RV32-NEXT: vse64.v v9, (a1)			; LMULMAX1-RV32-NEXT: vse64.v v9, (a1)
	; LMULMAX1-RV32-NEXT: ret			; LMULMAX1-RV32-NEXT: ret
	;			;
	; LMULMAX1-RV64-LABEL: mulhs_v4i64:			; LMULMAX1-RV64-LABEL: mulhs_v4i64:
	; LMULMAX1-RV64: # %bb.0:			; LMULMAX1-RV64: # %bb.0:
	; LMULMAX1-RV64-NEXT: lui a1, %hi(.LCPI136_0)			; LMULMAX1-RV64-NEXT: lui a1, %hi(.LCPI136_0)
	; LMULMAX1-RV64-NEXT: ld a1, %lo(.LCPI136_0)(a1)			; LMULMAX1-RV64-NEXT: ld a1, %lo(.LCPI136_0)(a1)
	▲ Show 20 Lines • Show All 2,769 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/srem-seteq-illegal-types.ll

	Show First 20 Lines • Show All 748 Lines • ▼ Show 20 Lines
	; RV64MV-NEXT: add a1, a1, a2			; RV64MV-NEXT: add a1, a1, a2
	; RV64MV-NEXT: slli a2, a1, 3			; RV64MV-NEXT: slli a2, a1, 3
	; RV64MV-NEXT: sub a1, a1, a2			; RV64MV-NEXT: sub a1, a1, a2
	; RV64MV-NEXT: add a1, a3, a1			; RV64MV-NEXT: add a1, a3, a1
	; RV64MV-NEXT: sd a1, 40(sp)			; RV64MV-NEXT: sd a1, 40(sp)
	; RV64MV-NEXT: vsetivli zero, 4, e64, m2, ta, mu			; RV64MV-NEXT: vsetivli zero, 4, e64, m2, ta, mu
	; RV64MV-NEXT: addi a1, sp, 32			; RV64MV-NEXT: addi a1, sp, 32
	; RV64MV-NEXT: vle64.v v8, (a1)			; RV64MV-NEXT: vle64.v v8, (a1)
	; RV64MV-NEXT: lui a1, %hi(.LCPI3_3)
	; RV64MV-NEXT: addi a1, a1, %lo(.LCPI3_3)
	; RV64MV-NEXT: vle64.v v10, (a1)
	; RV64MV-NEXT: li a1, -1			; RV64MV-NEXT: li a1, -1
	; RV64MV-NEXT: srli a1, a1, 31			; RV64MV-NEXT: srli a1, a1, 31
	; RV64MV-NEXT: vand.vx v8, v8, a1			; RV64MV-NEXT: vand.vx v8, v8, a1
	; RV64MV-NEXT: vmsne.vv v0, v8, v10			; RV64MV-NEXT: vmv.s.x v10, zero
				; RV64MV-NEXT: vid.v v12
				; RV64MV-NEXT: vsetvli zero, zero, e64, m2, tu, mu
				; RV64MV-NEXT: vslideup.vi v12, v10, 3
				; RV64MV-NEXT: vsetvli zero, zero, e64, m2, ta, mu
				; RV64MV-NEXT: vmsne.vv v0, v8, v12
	; RV64MV-NEXT: vmv.v.i v8, 0			; RV64MV-NEXT: vmv.v.i v8, 0
	; RV64MV-NEXT: vmerge.vim v8, v8, -1, v0			; RV64MV-NEXT: vmerge.vim v8, v8, -1, v0
	; RV64MV-NEXT: vsetivli zero, 1, e64, m2, ta, mu			; RV64MV-NEXT: vsetivli zero, 1, e64, m2, ta, mu
	; RV64MV-NEXT: vslidedown.vi v10, v8, 2			; RV64MV-NEXT: vslidedown.vi v10, v8, 2
	; RV64MV-NEXT: vmv.x.s a2, v10			; RV64MV-NEXT: vmv.x.s a2, v10
	; RV64MV-NEXT: slli a3, a2, 31			; RV64MV-NEXT: slli a3, a2, 31
	; RV64MV-NEXT: srli a3, a3, 61			; RV64MV-NEXT: srli a3, a3, 61
	; RV64MV-NEXT: sb a3, 12(a0)			; RV64MV-NEXT: sb a3, 12(a0)
	Show All 24 Lines

llvm/test/CodeGen/RISCV/urem-seteq-illegal-types.ll

	Show First 20 Lines • Show All 541 Lines • ▼ Show 20 Lines
	; RV32MV-NEXT: slli a2, a2, 10			; RV32MV-NEXT: slli a2, a2, 10
	; RV32MV-NEXT: srli a1, a1, 22			; RV32MV-NEXT: srli a1, a1, 22
	; RV32MV-NEXT: or a1, a1, a2			; RV32MV-NEXT: or a1, a1, a2
	; RV32MV-NEXT: andi a1, a1, 2047			; RV32MV-NEXT: andi a1, a1, 2047
	; RV32MV-NEXT: sh a1, 12(sp)			; RV32MV-NEXT: sh a1, 12(sp)
	; RV32MV-NEXT: vsetivli zero, 4, e16, mf2, ta, mu			; RV32MV-NEXT: vsetivli zero, 4, e16, mf2, ta, mu
	; RV32MV-NEXT: addi a1, sp, 8			; RV32MV-NEXT: addi a1, sp, 8
	; RV32MV-NEXT: vle16.v v8, (a1)			; RV32MV-NEXT: vle16.v v8, (a1)
	; RV32MV-NEXT: vmv.v.i v9, 10			; RV32MV-NEXT: li a1, 10
	; RV32MV-NEXT: li a1, 9
	; RV32MV-NEXT: vsetvli zero, zero, e16, mf2, tu, mu
	; RV32MV-NEXT: vmv.s.x v9, a1			; RV32MV-NEXT: vmv.s.x v9, a1
	; RV32MV-NEXT: vsetvli zero, zero, e16, mf2, ta, mu			; RV32MV-NEXT: vid.v v10
				; RV32MV-NEXT: vsrl.vi v11, v10, 1
				; RV32MV-NEXT: vadd.vi v12, v11, 9
				; RV32MV-NEXT: vsetivli zero, 2, e16, mf2, tu, mu
				; RV32MV-NEXT: vslideup.vi v12, v9, 1
				; RV32MV-NEXT: vsetivli zero, 4, e16, mf2, ta, mu
	; RV32MV-NEXT: lui a1, %hi(.LCPI4_0)			; RV32MV-NEXT: lui a1, %hi(.LCPI4_0)
	; RV32MV-NEXT: addi a1, a1, %lo(.LCPI4_0)			; RV32MV-NEXT: addi a1, a1, %lo(.LCPI4_0)
	; RV32MV-NEXT: vle16.v v10, (a1)			; RV32MV-NEXT: vle16.v v9, (a1)
	; RV32MV-NEXT: vid.v v11			; RV32MV-NEXT: vsub.vv v8, v8, v10
	; RV32MV-NEXT: vsub.vv v8, v8, v11			; RV32MV-NEXT: vmul.vv v8, v8, v9
	; RV32MV-NEXT: vmul.vv v8, v8, v10			; RV32MV-NEXT: vadd.vv v9, v8, v8
	; RV32MV-NEXT: vadd.vv v10, v8, v8			; RV32MV-NEXT: vsll.vv v9, v9, v12
	; RV32MV-NEXT: vsll.vv v9, v10, v9			; RV32MV-NEXT: vmv.s.x v10, zero
	; RV32MV-NEXT: vmv.v.i v10, 0			; RV32MV-NEXT: vrsub.vi v11, v11, 1
	; RV32MV-NEXT: li a1, 1			; RV32MV-NEXT: vsetivli zero, 2, e16, mf2, tu, mu
	; RV32MV-NEXT: vsetvli zero, zero, e16, mf2, tu, mu			; RV32MV-NEXT: vslideup.vi v11, v10, 1
	; RV32MV-NEXT: vmv1r.v v11, v10
	; RV32MV-NEXT: vmv.s.x v11, a1
	; RV32MV-NEXT: li a1, 2047			; RV32MV-NEXT: li a1, 2047
	; RV32MV-NEXT: vsetvli zero, zero, e16, mf2, ta, mu			; RV32MV-NEXT: vsetivli zero, 4, e16, mf2, ta, mu
	; RV32MV-NEXT: vand.vx v8, v8, a1			; RV32MV-NEXT: vand.vx v8, v8, a1
	; RV32MV-NEXT: lui a2, %hi(.LCPI4_1)			; RV32MV-NEXT: lui a2, %hi(.LCPI4_1)
	; RV32MV-NEXT: addi a2, a2, %lo(.LCPI4_1)			; RV32MV-NEXT: addi a2, a2, %lo(.LCPI4_1)
	; RV32MV-NEXT: vle16.v v12, (a2)			; RV32MV-NEXT: vle16.v v10, (a2)
	; RV32MV-NEXT: vsrl.vv v8, v8, v11			; RV32MV-NEXT: vsrl.vv v8, v8, v11
	; RV32MV-NEXT: vor.vv v8, v8, v9			; RV32MV-NEXT: vor.vv v8, v8, v9
	; RV32MV-NEXT: vand.vx v8, v8, a1			; RV32MV-NEXT: vand.vx v8, v8, a1
	; RV32MV-NEXT: vmsltu.vv v0, v12, v8			; RV32MV-NEXT: vmsltu.vv v0, v10, v8
	; RV32MV-NEXT: vmerge.vim v8, v10, -1, v0			; RV32MV-NEXT: vmv.v.i v8, 0
				; RV32MV-NEXT: vmerge.vim v8, v8, -1, v0
	; RV32MV-NEXT: vsetivli zero, 1, e16, mf2, ta, mu			; RV32MV-NEXT: vsetivli zero, 1, e16, mf2, ta, mu
	; RV32MV-NEXT: vslidedown.vi v9, v8, 2			; RV32MV-NEXT: vslidedown.vi v9, v8, 2
	; RV32MV-NEXT: vmv.x.s a1, v9			; RV32MV-NEXT: vmv.x.s a1, v9
	; RV32MV-NEXT: slli a2, a1, 21			; RV32MV-NEXT: slli a2, a1, 21
	; RV32MV-NEXT: srli a2, a2, 31			; RV32MV-NEXT: srli a2, a2, 31
	; RV32MV-NEXT: sb a2, 4(a0)			; RV32MV-NEXT: sb a2, 4(a0)
	; RV32MV-NEXT: vmv.x.s a2, v8			; RV32MV-NEXT: vmv.x.s a2, v8
	; RV32MV-NEXT: andi a2, a2, 2047			; RV32MV-NEXT: andi a2, a2, 2047
	Show All 20 Lines
	; RV64MV-NEXT: andi a2, a1, 2047			; RV64MV-NEXT: andi a2, a1, 2047
	; RV64MV-NEXT: sh a2, 8(sp)			; RV64MV-NEXT: sh a2, 8(sp)
	; RV64MV-NEXT: slli a1, a1, 42			; RV64MV-NEXT: slli a1, a1, 42
	; RV64MV-NEXT: srli a1, a1, 53			; RV64MV-NEXT: srli a1, a1, 53
	; RV64MV-NEXT: sh a1, 10(sp)			; RV64MV-NEXT: sh a1, 10(sp)
	; RV64MV-NEXT: vsetivli zero, 4, e16, mf2, ta, mu			; RV64MV-NEXT: vsetivli zero, 4, e16, mf2, ta, mu
	; RV64MV-NEXT: addi a1, sp, 8			; RV64MV-NEXT: addi a1, sp, 8
	; RV64MV-NEXT: vle16.v v8, (a1)			; RV64MV-NEXT: vle16.v v8, (a1)
	; RV64MV-NEXT: vmv.v.i v9, 10			; RV64MV-NEXT: li a1, 10
	; RV64MV-NEXT: li a1, 9
	; RV64MV-NEXT: vsetvli zero, zero, e16, mf2, tu, mu
	; RV64MV-NEXT: vmv.s.x v9, a1			; RV64MV-NEXT: vmv.s.x v9, a1
	; RV64MV-NEXT: vsetvli zero, zero, e16, mf2, ta, mu			; RV64MV-NEXT: vid.v v10
				; RV64MV-NEXT: vsrl.vi v11, v10, 1
				; RV64MV-NEXT: vadd.vi v12, v11, 9
				; RV64MV-NEXT: vsetivli zero, 2, e16, mf2, tu, mu
				; RV64MV-NEXT: vslideup.vi v12, v9, 1
				; RV64MV-NEXT: vsetivli zero, 4, e16, mf2, ta, mu
	; RV64MV-NEXT: lui a1, %hi(.LCPI4_0)			; RV64MV-NEXT: lui a1, %hi(.LCPI4_0)
	; RV64MV-NEXT: addi a1, a1, %lo(.LCPI4_0)			; RV64MV-NEXT: addi a1, a1, %lo(.LCPI4_0)
	; RV64MV-NEXT: vle16.v v10, (a1)			; RV64MV-NEXT: vle16.v v9, (a1)
	; RV64MV-NEXT: vid.v v11			; RV64MV-NEXT: vsub.vv v8, v8, v10
	; RV64MV-NEXT: vsub.vv v8, v8, v11			; RV64MV-NEXT: vmul.vv v8, v8, v9
	; RV64MV-NEXT: vmul.vv v8, v8, v10			; RV64MV-NEXT: vadd.vv v9, v8, v8
	; RV64MV-NEXT: vadd.vv v10, v8, v8			; RV64MV-NEXT: vsll.vv v9, v9, v12
	; RV64MV-NEXT: vsll.vv v9, v10, v9			; RV64MV-NEXT: vmv.s.x v10, zero
	; RV64MV-NEXT: vmv.v.i v10, 0			; RV64MV-NEXT: vrsub.vi v11, v11, 1
	; RV64MV-NEXT: li a1, 1			; RV64MV-NEXT: vsetivli zero, 2, e16, mf2, tu, mu
	; RV64MV-NEXT: vsetvli zero, zero, e16, mf2, tu, mu			; RV64MV-NEXT: vslideup.vi v11, v10, 1
	; RV64MV-NEXT: vmv1r.v v11, v10
	; RV64MV-NEXT: vmv.s.x v11, a1
	; RV64MV-NEXT: li a1, 2047			; RV64MV-NEXT: li a1, 2047
	; RV64MV-NEXT: vsetvli zero, zero, e16, mf2, ta, mu			; RV64MV-NEXT: vsetivli zero, 4, e16, mf2, ta, mu
	; RV64MV-NEXT: vand.vx v8, v8, a1			; RV64MV-NEXT: vand.vx v8, v8, a1
	; RV64MV-NEXT: lui a2, %hi(.LCPI4_1)			; RV64MV-NEXT: lui a2, %hi(.LCPI4_1)
	; RV64MV-NEXT: addi a2, a2, %lo(.LCPI4_1)			; RV64MV-NEXT: addi a2, a2, %lo(.LCPI4_1)
	; RV64MV-NEXT: vle16.v v12, (a2)			; RV64MV-NEXT: vle16.v v10, (a2)
	; RV64MV-NEXT: vsrl.vv v8, v8, v11			; RV64MV-NEXT: vsrl.vv v8, v8, v11
	; RV64MV-NEXT: vor.vv v8, v8, v9			; RV64MV-NEXT: vor.vv v8, v8, v9
	; RV64MV-NEXT: vand.vx v8, v8, a1			; RV64MV-NEXT: vand.vx v8, v8, a1
	; RV64MV-NEXT: vmsltu.vv v0, v12, v8			; RV64MV-NEXT: vmsltu.vv v0, v10, v8
	; RV64MV-NEXT: vmerge.vim v8, v10, -1, v0			; RV64MV-NEXT: vmv.v.i v8, 0
				; RV64MV-NEXT: vmerge.vim v8, v8, -1, v0
	; RV64MV-NEXT: vmv.x.s a1, v8			; RV64MV-NEXT: vmv.x.s a1, v8
	; RV64MV-NEXT: andi a1, a1, 2047			; RV64MV-NEXT: andi a1, a1, 2047
	; RV64MV-NEXT: vsetivli zero, 1, e16, mf2, ta, mu			; RV64MV-NEXT: vsetivli zero, 1, e16, mf2, ta, mu
	; RV64MV-NEXT: vslidedown.vi v9, v8, 1			; RV64MV-NEXT: vslidedown.vi v9, v8, 1
	; RV64MV-NEXT: vmv.x.s a2, v9			; RV64MV-NEXT: vmv.x.s a2, v9
	; RV64MV-NEXT: andi a2, a2, 2047			; RV64MV-NEXT: andi a2, a2, 2047
	; RV64MV-NEXT: slli a2, a2, 11			; RV64MV-NEXT: slli a2, a2, 11
	; RV64MV-NEXT: or a1, a1, a2			; RV64MV-NEXT: or a1, a1, a2
	Show All 17 Lines