This is an archive of the discontinued LLVM Phabricator instance.

[RISCV] Use vmerge for INSERT_VECTOR_ELT w/small constant indices
Needs ReviewPublic

Authored by reames on Aug 4 2023, 9:44 AM.

Download Raw Diff

Details

Reviewers

craig.topper
asb
luke
frasercrmck
kito-cheng

Summary

Currently, we default to using a vmv.s.x and vslide1up sequence for inserting elements into a vector. This lowering has a couple of downsides. First, it requires a temporary register to hold the scalar-as-vector. Second, for inserts into the middle of a vector, the VL chosen needs to be Idx + 1. This causes VL toggles since these odd VLs are unlikely to be sharable.

Instead, we can use a vmerge.vx to perform the insert. This avoids the need for the temporary register and odd VLs, but requires the population of a mask register. For the moment, restrict usage to when we can use a single vmv.v.i to populate the mask - i.e. indices less than 5. If we like the direction of this patch, this restriction can be lifted by using a vmseq(vid, index) sequence, but I'll defer that to later work.

Diff Detail

Event Timeline

reames created this revision.Aug 4 2023, 9:44 AM

Herald added a project: Restricted Project. · View Herald TranscriptAug 4 2023, 9:44 AM

Herald added subscribers: jobnoorman, VincentWu, vkmr and 26 others. · View Herald Transcript

reames requested review of this revision.Aug 4 2023, 9:44 AM

Herald added a project: Restricted Project. · View Herald TranscriptAug 4 2023, 9:44 AM

Herald added subscribers: wangpc, eopXD, MaskRay. · View Herald Transcript

reames added a child revision: D157120: [RISCV] Use v(f)slide1down for build_vector with dominant values.Aug 4 2023, 10:12 AM

Harbormaster completed remote builds in B250363: Diff 547262.Aug 4 2023, 12:15 PM

reames removed a child revision: D157120: [RISCV] Use v(f)slide1down for build_vector with dominant values.Aug 7 2023, 7:55 AM

reames added a parent revision: D157120: [RISCV] Use v(f)slide1down for build_vector with dominant values.

Rebase over inverted dependency.

Harbormaster completed remote builds in B250796: Diff 547800.Aug 7 2023, 10:38 AM

luke added inline comments.Aug 9 2023, 3:44 AM

llvm/lib/Target/RISCV/RISCVISelLowering.cpp
6939	Could we still use vmv.v.i on scalable vectors in theory? Since Idx isn't scaled by vscale for insert_vector_elt.

reames added inline comments.Aug 22 2023, 7:46 AM

llvm/lib/Target/RISCV/RISCVISelLowering.cpp
6939	Not without having a bound on the size of the scalable vector, we need all the other lanes to be zero. (Hm, maybe we could use a zero splat followed by an insert if the lane was less than XLEN even for a scalable vector.) However, we can use a vmseq(vid, index) sequence for the scalable case. This is probably better.

Herald added a subscriber: sunshaoce. · View Herald TranscriptAug 22 2023, 7:46 AM

Revision Contents

Path

Size

llvm/

lib/

Target/

RISCV/

RISCVISelLowering.cpp

18 lines

test/

CodeGen/

RISCV/

rvv/

fixed-vectors-fp-buildvec.ll

24 lines

fixed-vectors-insert-i1.ll

67 lines

fixed-vectors-insert.ll

5 lines

fixed-vectors-int-buildvec.ll

101 lines

fixed-vectors-int-shuffles.ll

20 lines

fixed-vectors-int.ll

99 lines

fixed-vectors-masked-gather.ll

1126 lines

fixed-vectors-shuffle-vslide1down.ll

11 lines

fixed-vectors-shuffle-vslide1up.ll

18 lines

fixed-vectors-stepvector.ll

34 lines

fixed-vectors-unaligned.ll

22 lines

srem-seteq-illegal-types.ll

21 lines

Diff 547800

llvm/lib/Target/RISCV/RISCVISelLowering.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 6,922 Lines • ▼ Show 20 Lines	if (IsLegalInsert) {
unsigned Opc =		unsigned Opc =
VecVT.isFloatingPoint() ? RISCVISD::VFMV_S_F_VL : RISCVISD::VMV_S_X_VL;		VecVT.isFloatingPoint() ? RISCVISD::VFMV_S_F_VL : RISCVISD::VMV_S_X_VL;
if (isNullConstant(Idx)) {		if (isNullConstant(Idx)) {
Vec = DAG.getNode(Opc, DL, ContainerVT, Vec, Val, VL);		Vec = DAG.getNode(Opc, DL, ContainerVT, Vec, Val, VL);
if (!VecVT.isFixedLengthVector())		if (!VecVT.isFixedLengthVector())
return Vec;		return Vec;
return convertFromScalableVector(VecVT, Vec, DAG, Subtarget);		return convertFromScalableVector(VecVT, Vec, DAG, Subtarget);
}		}
		// IF our index is small enough that the mask for the vmerge would require
		// only the vmv.v.i form, then we can perform the insert in two instructions:
		// vmv.v.i v0, <mask-constant>
		// vmerge vd, <vec>, <val>, v0
		// This avoids the need for the vector temporary, and may let us fold the
		// inserted value if it's a constant. TODO: This could be extended to larger
		// indices, non-constant indices, or scalable vectors by using vmseq (vid, idx).
		if (isa<ConstantSDNode>(Idx) && cast<ConstantSDNode>(Idx)->getZExtValue() <= 4 &&
		VecVT.isFixedLengthVector()) {
		lukeUnsubmitted Not Done Reply Inline Actions Could we still use vmv.v.i on scalable vectors in theory? Since Idx isn't scaled by vscale for insert_vector_elt. luke: Could we still use vmv.v.i on scalable vectors in theory? Since Idx isn't scaled by vscale for…
		reamesAuthorUnsubmitted Done Reply Inline Actions Not without having a bound on the size of the scalable vector, we need all the other lanes to be zero. (Hm, maybe we could use a zero splat followed by an insert if the lane was less than XLEN even for a scalable vector.) However, we can use a vmseq(vid, index) sequence for the scalable case. This is probably better. reames: Not without having a bound on the size of the scalable vector, we need all the other lanes to…
		SmallVector<SDValue> Ops;
		for (uint64_t i = 0; i < VecVT.getVectorNumElements(); i++)
		Ops.push_back(DAG.getConstant(i == cast<ConstantSDNode>(Idx)->getZExtValue(), DL, XLenVT));
		MVT SelMaskTy = VecVT.changeVectorElementType(MVT::i1);
		return DAG.getNode(ISD::VSELECT, DL, VecVT,
		DAG.getBuildVector(SelMaskTy, DL, Ops),
		DAG.getSplatBuildVector(VecVT, DL, Val),
		convertFromScalableVector(VecVT, Vec, DAG, Subtarget));
		}
ValInVec = lowerScalarInsert(Val, VL, ContainerVT, DL, DAG, Subtarget);		ValInVec = lowerScalarInsert(Val, VL, ContainerVT, DL, DAG, Subtarget);
} else {		} else {
// On RV32, i64-element vectors must be specially handled to place the		// On RV32, i64-element vectors must be specially handled to place the
// value at element 0, by using two vslide1down instructions in sequence on		// value at element 0, by using two vslide1down instructions in sequence on
// the i32 split lo/hi value. Use an equivalently-sized i32 vector for		// the i32 split lo/hi value. Use an equivalently-sized i32 vector for
// this.		// this.
SDValue ValLo, ValHi;		SDValue ValLo, ValHi;
std::tie(ValLo, ValHi) = DAG.SplitScalar(Val, DL, MVT::i32, MVT::i32);		std::tie(ValLo, ValHi) = DAG.SplitScalar(Val, DL, MVT::i32, MVT::i32);
▲ Show 20 Lines • Show All 10,883 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-fp-buildvec.ll

Show First 20 Lines • Show All 91 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
ret void		ret void
}		}

define void @buildvec_dominant0_v4f32(<4 x float>* %x) {		define void @buildvec_dominant0_v4f32(<4 x float>* %x) {
; CHECK-LABEL: buildvec_dominant0_v4f32:		; CHECK-LABEL: buildvec_dominant0_v4f32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: lui a1, 262144		; CHECK-NEXT: lui a1, 262144
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
		; CHECK-NEXT: vmv.v.i v0, 4
; CHECK-NEXT: vmv.v.x v8, a1		; CHECK-NEXT: vmv.v.x v8, a1
; CHECK-NEXT: vmv.s.x v9, zero		; CHECK-NEXT: vmerge.vim v8, v8, 0, v0
; CHECK-NEXT: vsetivli zero, 3, e32, m1, tu, ma
; CHECK-NEXT: vslideup.vi v8, v9, 2
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: ret		; CHECK-NEXT: ret
store <4 x float> <float 2.0, float 2.0, float 0.0, float 2.0>, <4 x float>* %x		store <4 x float> <float 2.0, float 2.0, float 0.0, float 2.0>, <4 x float>* %x
ret void		ret void
}		}

define void @buildvec_dominant1_v4f32(<4 x float>* %x, float %f) {		define void @buildvec_dominant1_v4f32(<4 x float>* %x, float %f) {
; CHECK-LABEL: buildvec_dominant1_v4f32:		; CHECK-LABEL: buildvec_dominant1_v4f32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
		; CHECK-NEXT: vmv.v.i v0, 2
; CHECK-NEXT: vfmv.v.f v8, fa0		; CHECK-NEXT: vfmv.v.f v8, fa0
; CHECK-NEXT: vmv.s.x v9, zero		; CHECK-NEXT: vmerge.vim v8, v8, 0, v0
; CHECK-NEXT: vsetivli zero, 2, e32, m1, tu, ma
; CHECK-NEXT: vslideup.vi v8, v9, 1
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v0 = insertelement <4 x float> poison, float %f, i32 0		%v0 = insertelement <4 x float> poison, float %f, i32 0
%v1 = insertelement <4 x float> %v0, float 0.0, i32 1		%v1 = insertelement <4 x float> %v0, float 0.0, i32 1
%v2 = insertelement <4 x float> %v1, float %f, i32 2		%v2 = insertelement <4 x float> %v1, float %f, i32 2
%v3 = insertelement <4 x float> %v2, float %f, i32 3		%v3 = insertelement <4 x float> %v2, float %f, i32 3
store <4 x float> %v3, <4 x float>* %x		store <4 x float> %v3, <4 x float>* %x
ret void		ret void
}		}

define void @buildvec_dominant2_v4f32(<4 x float>* %x, float %f) {		define void @buildvec_dominant2_v4f32(<4 x float>* %x, float %f) {
; CHECK-LABEL: buildvec_dominant2_v4f32:		; CHECK-LABEL: buildvec_dominant2_v4f32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: lui a1, 262144
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: vmv.s.x v8, a1
; CHECK-NEXT: vfmv.v.f v9, fa0
; CHECK-NEXT: vsetivli zero, 2, e32, m1, tu, ma
; CHECK-NEXT: vslideup.vi v9, v8, 1
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: vse32.v v9, (a0)		; CHECK-NEXT: vfmv.v.f v8, fa0
		; CHECK-NEXT: vmv.v.i v0, 2
		; CHECK-NEXT: lui a1, 262144
		; CHECK-NEXT: vmerge.vxm v8, v8, a1, v0
		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v0 = insertelement <4 x float> poison, float %f, i32 0		%v0 = insertelement <4 x float> poison, float %f, i32 0
%v1 = insertelement <4 x float> %v0, float 2.0, i32 1		%v1 = insertelement <4 x float> %v0, float 2.0, i32 1
%v2 = insertelement <4 x float> %v1, float %f, i32 2		%v2 = insertelement <4 x float> %v1, float %f, i32 2
%v3 = insertelement <4 x float> %v2, float %f, i32 3		%v3 = insertelement <4 x float> %v2, float %f, i32 3
store <4 x float> %v3, <4 x float>* %x		store <4 x float> %v3, <4 x float>* %x
ret void		ret void
}		}
▲ Show 20 Lines • Show All 202 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-insert-i1.ll

; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py		; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
; RUN: llc -mtriple=riscv32 -mattr=+v -riscv-v-vector-bits-min=128 -verify-machineinstrs < %s \		; RUN: llc -mtriple=riscv32 -mattr=+v -riscv-v-vector-bits-min=128 -verify-machineinstrs < %s \
; RUN: \| FileCheck %s		; RUN: \| FileCheck --check-prefixes=CHECK,RV32 %s
; RUN: llc -mtriple=riscv64 -mattr=+v -riscv-v-vector-bits-min=128 -verify-machineinstrs < %s \		; RUN: llc -mtriple=riscv64 -mattr=+v -riscv-v-vector-bits-min=128 -verify-machineinstrs < %s \
; RUN: \| FileCheck %s		; RUN: \| FileCheck --check-prefixes=CHECK,RV64 %s

define <1 x i1> @insertelt_v1i1(<1 x i1> %x, i1 %elt) nounwind {		define <1 x i1> @insertelt_v1i1(<1 x i1> %x, i1 %elt) nounwind {
; CHECK-LABEL: insertelt_v1i1:		; CHECK-LABEL: insertelt_v1i1:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: andi a0, a0, 1		; CHECK-NEXT: andi a0, a0, 1
; CHECK-NEXT: vsetivli zero, 1, e8, mf8, ta, ma		; CHECK-NEXT: vsetivli zero, 1, e8, mf8, ta, ma
; CHECK-NEXT: vmv.v.x v8, a0		; CHECK-NEXT: vmv.v.x v8, a0
; CHECK-NEXT: vmsne.vi v0, v8, 0		; CHECK-NEXT: vmsne.vi v0, v8, 0
Show All 19 Lines	; CHECK-NEXT: ret
%y = insertelement <1 x i1> %x, i1 %elt, i32 %idx		%y = insertelement <1 x i1> %x, i1 %elt, i32 %idx
ret <1 x i1> %y		ret <1 x i1> %y
}		}

define <2 x i1> @insertelt_v2i1(<2 x i1> %x, i1 %elt) nounwind {		define <2 x i1> @insertelt_v2i1(<2 x i1> %x, i1 %elt) nounwind {
; CHECK-LABEL: insertelt_v2i1:		; CHECK-LABEL: insertelt_v2i1:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 2, e8, mf8, ta, ma		; CHECK-NEXT: vsetivli zero, 2, e8, mf8, ta, ma
; CHECK-NEXT: vmv.v.i v8, 0		; CHECK-NEXT: vmv.v.i v9, 0
; CHECK-NEXT: vmerge.vim v8, v8, 1, v0		; CHECK-NEXT: vmv.v.i v8, 2
; CHECK-NEXT: vmv.s.x v9, a0		; CHECK-NEXT: vmerge.vim v9, v9, 1, v0
; CHECK-NEXT: vslideup.vi v8, v9, 1		; CHECK-NEXT: vmv1r.v v0, v8
		; CHECK-NEXT: vmerge.vxm v8, v9, a0, v0
; CHECK-NEXT: vand.vi v8, v8, 1		; CHECK-NEXT: vand.vi v8, v8, 1
; CHECK-NEXT: vmsne.vi v0, v8, 0		; CHECK-NEXT: vmsne.vi v0, v8, 0
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%y = insertelement <2 x i1> %x, i1 %elt, i64 1		%y = insertelement <2 x i1> %x, i1 %elt, i64 1
ret <2 x i1> %y		ret <2 x i1> %y
}		}

define <2 x i1> @insertelt_idx_v2i1(<2 x i1> %x, i1 %elt, i32 zeroext %idx) nounwind {		define <2 x i1> @insertelt_idx_v2i1(<2 x i1> %x, i1 %elt, i32 zeroext %idx) nounwind {
Show All 13 Lines	; CHECK-NEXT: ret
%y = insertelement <2 x i1> %x, i1 %elt, i32 %idx		%y = insertelement <2 x i1> %x, i1 %elt, i32 %idx
ret <2 x i1> %y		ret <2 x i1> %y
}		}

define <8 x i1> @insertelt_v8i1(<8 x i1> %x, i1 %elt) nounwind {		define <8 x i1> @insertelt_v8i1(<8 x i1> %x, i1 %elt) nounwind {
; CHECK-LABEL: insertelt_v8i1:		; CHECK-LABEL: insertelt_v8i1:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, ma		; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, ma
; CHECK-NEXT: vmv.v.i v8, 0		; CHECK-NEXT: vmv.v.i v9, 0
; CHECK-NEXT: vmerge.vim v8, v8, 1, v0		; CHECK-NEXT: vmv.v.i v8, 2
; CHECK-NEXT: vmv.s.x v9, a0		; CHECK-NEXT: vmerge.vim v9, v9, 1, v0
; CHECK-NEXT: vsetivli zero, 2, e8, mf2, tu, ma		; CHECK-NEXT: vmv1r.v v0, v8
; CHECK-NEXT: vslideup.vi v8, v9, 1		; CHECK-NEXT: vmerge.vxm v8, v9, a0, v0
; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, ma
; CHECK-NEXT: vand.vi v8, v8, 1		; CHECK-NEXT: vand.vi v8, v8, 1
; CHECK-NEXT: vmsne.vi v0, v8, 0		; CHECK-NEXT: vmsne.vi v0, v8, 0
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%y = insertelement <8 x i1> %x, i1 %elt, i64 1		%y = insertelement <8 x i1> %x, i1 %elt, i64 1
ret <8 x i1> %y		ret <8 x i1> %y
}		}

define <8 x i1> @insertelt_idx_v8i1(<8 x i1> %x, i1 %elt, i32 zeroext %idx) nounwind {		define <8 x i1> @insertelt_idx_v8i1(<8 x i1> %x, i1 %elt, i32 zeroext %idx) nounwind {
Show All 10 Lines
; CHECK-NEXT: vand.vi v8, v8, 1		; CHECK-NEXT: vand.vi v8, v8, 1
; CHECK-NEXT: vmsne.vi v0, v8, 0		; CHECK-NEXT: vmsne.vi v0, v8, 0
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%y = insertelement <8 x i1> %x, i1 %elt, i32 %idx		%y = insertelement <8 x i1> %x, i1 %elt, i32 %idx
ret <8 x i1> %y		ret <8 x i1> %y
}		}

define <64 x i1> @insertelt_v64i1(<64 x i1> %x, i1 %elt) nounwind {		define <64 x i1> @insertelt_v64i1(<64 x i1> %x, i1 %elt) nounwind {
; CHECK-LABEL: insertelt_v64i1:		; RV32-LABEL: insertelt_v64i1:
; CHECK: # %bb.0:		; RV32: # %bb.0:
; CHECK-NEXT: li a1, 64		; RV32-NEXT: li a1, 64
; CHECK-NEXT: vsetvli zero, a1, e8, m1, ta, ma		; RV32-NEXT: vsetvli zero, a1, e8, m4, ta, ma
; CHECK-NEXT: vmv.s.x v8, a0		; RV32-NEXT: vmv.v.i v8, 0
; CHECK-NEXT: vsetvli zero, a1, e8, m4, ta, ma		; RV32-NEXT: vmerge.vim v8, v8, 1, v0
; CHECK-NEXT: vmv.v.i v12, 0		; RV32-NEXT: vsetivli zero, 2, e32, mf2, ta, ma
; CHECK-NEXT: vmerge.vim v12, v12, 1, v0		; RV32-NEXT: vid.v v12
; CHECK-NEXT: vsetivli zero, 2, e8, m4, tu, ma		; RV32-NEXT: vadd.vv v12, v12, v12
; CHECK-NEXT: vslideup.vi v12, v8, 1		; RV32-NEXT: vrsub.vi v0, v12, 2
; CHECK-NEXT: vsetvli zero, a1, e8, m4, ta, ma		; RV32-NEXT: vsetvli zero, a1, e8, m4, ta, ma
; CHECK-NEXT: vand.vi v8, v12, 1		; RV32-NEXT: vmerge.vxm v8, v8, a0, v0
; CHECK-NEXT: vmsne.vi v0, v8, 0		; RV32-NEXT: vand.vi v8, v8, 1
; CHECK-NEXT: ret		; RV32-NEXT: vmsne.vi v0, v8, 0
		; RV32-NEXT: ret
		;
		; RV64-LABEL: insertelt_v64i1:
		; RV64: # %bb.0:
		; RV64-NEXT: li a1, 64
		; RV64-NEXT: vsetvli zero, a1, e8, m4, ta, ma
		; RV64-NEXT: vmv.v.i v8, 0
		; RV64-NEXT: vmerge.vim v8, v8, 1, v0
		; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
		; RV64-NEXT: vmv.v.i v0, 2
		; RV64-NEXT: vsetvli zero, a1, e8, m4, ta, ma
		; RV64-NEXT: vmerge.vxm v8, v8, a0, v0
		; RV64-NEXT: vand.vi v8, v8, 1
		; RV64-NEXT: vmsne.vi v0, v8, 0
		; RV64-NEXT: ret
%y = insertelement <64 x i1> %x, i1 %elt, i64 1		%y = insertelement <64 x i1> %x, i1 %elt, i64 1
ret <64 x i1> %y		ret <64 x i1> %y
}		}

define <64 x i1> @insertelt_idx_v64i1(<64 x i1> %x, i1 %elt, i32 zeroext %idx) nounwind {		define <64 x i1> @insertelt_idx_v64i1(<64 x i1> %x, i1 %elt, i32 zeroext %idx) nounwind {
; CHECK-LABEL: insertelt_idx_v64i1:		; CHECK-LABEL: insertelt_idx_v64i1:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: li a2, 64		; CHECK-NEXT: li a2, 64
Show All 15 Lines

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-insert.ll

	Show All 11 Lines
	; RV32-NEXT: vslide1down.vx v10, v8, a0			; RV32-NEXT: vslide1down.vx v10, v8, a0
	; RV32-NEXT: vslide1down.vx v10, v10, a1			; RV32-NEXT: vslide1down.vx v10, v10, a1
	; RV32-NEXT: vsetivli zero, 4, e64, m2, ta, ma			; RV32-NEXT: vsetivli zero, 4, e64, m2, ta, ma
	; RV32-NEXT: vslideup.vi v8, v10, 3			; RV32-NEXT: vslideup.vi v8, v10, 3
	; RV32-NEXT: ret			; RV32-NEXT: ret
	;			;
	; RV64-LABEL: insertelt_v4i64:			; RV64-LABEL: insertelt_v4i64:
	; RV64: # %bb.0:			; RV64: # %bb.0:
				; RV64-NEXT: vsetivli zero, 1, e8, mf8, ta, ma
				; RV64-NEXT: vmv.v.i v0, 8
	; RV64-NEXT: vsetivli zero, 4, e64, m2, ta, ma			; RV64-NEXT: vsetivli zero, 4, e64, m2, ta, ma
	; RV64-NEXT: vmv.s.x v10, a0			; RV64-NEXT: vmerge.vxm v8, v8, a0, v0
	; RV64-NEXT: vslideup.vi v8, v10, 3
	; RV64-NEXT: ret			; RV64-NEXT: ret
	%b = insertelement <4 x i64> %a, i64 %y, i32 3			%b = insertelement <4 x i64> %a, i64 %y, i32 3
	ret <4 x i64> %b			ret <4 x i64> %b
	}			}

	define void @insertelt_v4i64_store(ptr %x, i64 %y) {			define void @insertelt_v4i64_store(ptr %x, i64 %y) {
	; RV32-LABEL: insertelt_v4i64_store:			; RV32-LABEL: insertelt_v4i64_store:
	; RV32: # %bb.0:			; RV32: # %bb.0:
	▲ Show 20 Lines • Show All 368 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-int-buildvec.ll

Show First 20 Lines • Show All 181 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
ret void		ret void
}		}

; FIXME: RV32 doesn't catch this pattern due to BUILD_VECTOR legalization.		; FIXME: RV32 doesn't catch this pattern due to BUILD_VECTOR legalization.
define <4 x i64> @buildvec_vid_step1_add0_v4i64() {		define <4 x i64> @buildvec_vid_step1_add0_v4i64() {
; RV32-LABEL: buildvec_vid_step1_add0_v4i64:		; RV32-LABEL: buildvec_vid_step1_add0_v4i64:
; RV32: # %bb.0:		; RV32: # %bb.0:
; RV32-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; RV32-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; RV32-NEXT: vmv.v.i v9, 1
; RV32-NEXT: vmv.v.i v8, 0
; RV32-NEXT: vsetivli zero, 3, e32, m1, tu, ma
; RV32-NEXT: vslideup.vi v8, v9, 2
; RV32-NEXT: lui a0, %hi(.LCPI12_0)		; RV32-NEXT: lui a0, %hi(.LCPI12_0)
; RV32-NEXT: addi a0, a0, %lo(.LCPI12_0)		; RV32-NEXT: addi a0, a0, %lo(.LCPI12_0)
; RV32-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; RV32-NEXT: vle32.v v9, (a0)		; RV32-NEXT: vle32.v v9, (a0)
		; RV32-NEXT: vmv.v.i v0, 4
		; RV32-NEXT: vmv.v.i v8, 0
		; RV32-NEXT: vmerge.vim v8, v8, 1, v0
; RV32-NEXT: ret		; RV32-NEXT: ret
;		;
; RV64-LABEL: buildvec_vid_step1_add0_v4i64:		; RV64-LABEL: buildvec_vid_step1_add0_v4i64:
; RV64: # %bb.0:		; RV64: # %bb.0:
; RV64-NEXT: vsetivli zero, 2, e64, m1, ta, ma		; RV64-NEXT: vsetivli zero, 2, e64, m1, ta, ma
; RV64-NEXT: vid.v v8		; RV64-NEXT: vid.v v8
; RV64-NEXT: vadd.vi v9, v8, 2		; RV64-NEXT: vadd.vi v9, v8, 2
; RV64-NEXT: ret		; RV64-NEXT: ret
ret <4 x i64> <i64 0, i64 1, i64 2, i64 3>		ret <4 x i64> <i64 0, i64 1, i64 2, i64 3>
}		}

define <4 x i64> @buildvec_vid_step2_add0_v4i64() {		define <4 x i64> @buildvec_vid_step2_add0_v4i64() {
; RV32-LABEL: buildvec_vid_step2_add0_v4i64:		; RV32-LABEL: buildvec_vid_step2_add0_v4i64:
; RV32: # %bb.0:		; RV32: # %bb.0:
; RV32-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; RV32-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; RV32-NEXT: vmv.v.i v9, 2
; RV32-NEXT: vmv.v.i v8, 0
; RV32-NEXT: vsetivli zero, 3, e32, m1, tu, ma
; RV32-NEXT: vslideup.vi v8, v9, 2
; RV32-NEXT: lui a0, %hi(.LCPI13_0)		; RV32-NEXT: lui a0, %hi(.LCPI13_0)
; RV32-NEXT: addi a0, a0, %lo(.LCPI13_0)		; RV32-NEXT: addi a0, a0, %lo(.LCPI13_0)
; RV32-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; RV32-NEXT: vle32.v v9, (a0)		; RV32-NEXT: vle32.v v9, (a0)
		; RV32-NEXT: vmv.v.i v0, 4
		; RV32-NEXT: vmv.v.i v8, 0
		; RV32-NEXT: vmerge.vim v8, v8, 2, v0
; RV32-NEXT: ret		; RV32-NEXT: ret
;		;
; RV64-LABEL: buildvec_vid_step2_add0_v4i64:		; RV64-LABEL: buildvec_vid_step2_add0_v4i64:
; RV64: # %bb.0:		; RV64: # %bb.0:
; RV64-NEXT: vsetivli zero, 2, e64, m1, ta, ma		; RV64-NEXT: vsetivli zero, 2, e64, m1, ta, ma
; RV64-NEXT: vid.v v8		; RV64-NEXT: vid.v v8
; RV64-NEXT: vadd.vv v8, v8, v8		; RV64-NEXT: vadd.vv v8, v8, v8
; RV64-NEXT: vadd.vi v9, v8, 4		; RV64-NEXT: vadd.vi v9, v8, 4
Show All 33 Lines	; CHECK-NEXT: ret
%6 = insertvalue %x6v4i8 %5, <4 x i8> <i8 -1, i8 -2, i8 -4, i8 -5>, 5		%6 = insertvalue %x6v4i8 %5, <4 x i8> <i8 -1, i8 -2, i8 -4, i8 -5>, 5
ret %x6v4i8 %6		ret %x6v4i8 %6
}		}

define void @buildvec_dominant0_v8i16(ptr %x) {		define void @buildvec_dominant0_v8i16(ptr %x) {
; CHECK-LABEL: buildvec_dominant0_v8i16:		; CHECK-LABEL: buildvec_dominant0_v8i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 8, e16, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 8, e16, m1, ta, ma
; CHECK-NEXT: vmv.s.x v8, zero		; CHECK-NEXT: vmv.v.i v0, 8
; CHECK-NEXT: vmv.v.i v9, 8		; CHECK-NEXT: vmv.v.i v8, 8
; CHECK-NEXT: vsetivli zero, 4, e16, m1, tu, ma		; CHECK-NEXT: vmerge.vim v8, v8, 0, v0
; CHECK-NEXT: vslideup.vi v9, v8, 3		; CHECK-NEXT: vse16.v v8, (a0)
; CHECK-NEXT: vsetivli zero, 8, e16, m1, ta, ma
; CHECK-NEXT: vse16.v v9, (a0)
; CHECK-NEXT: ret		; CHECK-NEXT: ret
store <8 x i16> <i16 8, i16 8, i16 undef, i16 0, i16 8, i16 undef, i16 8, i16 8>, ptr %x		store <8 x i16> <i16 8, i16 8, i16 undef, i16 0, i16 8, i16 undef, i16 8, i16 8>, ptr %x
ret void		ret void
}		}

define void @buildvec_dominant1_v8i16(ptr %x) {		define void @buildvec_dominant1_v8i16(ptr %x) {
; CHECK-LABEL: buildvec_dominant1_v8i16:		; CHECK-LABEL: buildvec_dominant1_v8i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
▲ Show 20 Lines • Show All 191 Lines • ▼ Show 20 Lines
; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; CHECK-NEXT: vse16.v v8, (a0)		; CHECK-NEXT: vse16.v v8, (a0)
; CHECK-NEXT: ret		; CHECK-NEXT: ret
store <4 x i16> <i16 -127, i16 -1, i16 -127, i16 -1>, ptr %x		store <4 x i16> <i16 -127, i16 -1, i16 -127, i16 -1>, ptr %x
ret void		ret void
}		}

define void @buildvec_vid_step1o2_v4i32(ptr %z0, ptr %z1, ptr %z2, ptr %z3, ptr %z4, ptr %z5, ptr %z6) {		define void @buildvec_vid_step1o2_v4i32(ptr %z0, ptr %z1, ptr %z2, ptr %z3, ptr %z4, ptr %z5, ptr %z6) {
; RV32-LABEL: buildvec_vid_step1o2_v4i32:		; CHECK-LABEL: buildvec_vid_step1o2_v4i32:
; RV32: # %bb.0:		; CHECK: # %bb.0:
; RV32-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; RV32-NEXT: vid.v v8		; CHECK-NEXT: vid.v v8
; RV32-NEXT: vsrl.vi v8, v8, 1		; CHECK-NEXT: vsrl.vi v8, v8, 1
; RV32-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; RV32-NEXT: vse32.v v8, (a1)		; CHECK-NEXT: vse32.v v8, (a1)
; RV32-NEXT: vmv.v.i v9, 1		; CHECK-NEXT: vse32.v v8, (a2)
; RV32-NEXT: vse32.v v8, (a2)		; CHECK-NEXT: vse32.v v8, (a3)
; RV32-NEXT: vse32.v v8, (a3)		; CHECK-NEXT: vse32.v v8, (a4)
; RV32-NEXT: vse32.v v8, (a4)		; CHECK-NEXT: vmv.v.i v0, 2
; RV32-NEXT: vmv.s.x v8, zero		; CHECK-NEXT: vmv.v.i v8, 1
; RV32-NEXT: vsetivli zero, 2, e32, m1, tu, ma		; CHECK-NEXT: vmerge.vim v8, v8, 0, v0
; RV32-NEXT: vslideup.vi v9, v8, 1		; CHECK-NEXT: vse32.v v8, (a5)
; RV32-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vmv.v.i v8, 0
; RV32-NEXT: vse32.v v9, (a5)		; CHECK-NEXT: li a0, 1
; RV32-NEXT: vmv.v.i v8, 0		; CHECK-NEXT: vslide1down.vx v8, v8, a0
; RV32-NEXT: li a0, 1		; CHECK-NEXT: vse32.v v8, (a6)
; RV32-NEXT: vslide1down.vx v8, v8, a0		; CHECK-NEXT: ret
; RV32-NEXT: vse32.v v8, (a6)
; RV32-NEXT: ret
;
; RV64-LABEL: buildvec_vid_step1o2_v4i32:
; RV64: # %bb.0:
; RV64-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; RV64-NEXT: vid.v v8
; RV64-NEXT: vsrl.vi v8, v8, 1
; RV64-NEXT: vse32.v v8, (a0)
; RV64-NEXT: vmv.v.i v9, 1
; RV64-NEXT: vse32.v v8, (a1)
; RV64-NEXT: vse32.v v8, (a2)
; RV64-NEXT: vse32.v v8, (a3)
; RV64-NEXT: vse32.v v8, (a4)
; RV64-NEXT: vmv.s.x v8, zero
; RV64-NEXT: vsetivli zero, 2, e32, m1, tu, ma
; RV64-NEXT: vslideup.vi v9, v8, 1
; RV64-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; RV64-NEXT: vse32.v v9, (a5)
; RV64-NEXT: vmv.v.i v8, 0
; RV64-NEXT: li a0, 1
; RV64-NEXT: vslide1down.vx v8, v8, a0
; RV64-NEXT: vse32.v v8, (a6)
; RV64-NEXT: ret
store <4 x i32> <i32 0, i32 0, i32 1, i32 1>, ptr %z0		store <4 x i32> <i32 0, i32 0, i32 1, i32 1>, ptr %z0
store <4 x i32> <i32 0, i32 0, i32 1, i32 undef>, ptr %z1		store <4 x i32> <i32 0, i32 0, i32 1, i32 undef>, ptr %z1
store <4 x i32> <i32 0, i32 undef, i32 1, i32 1>, ptr %z2		store <4 x i32> <i32 0, i32 undef, i32 1, i32 1>, ptr %z2
store <4 x i32> <i32 undef, i32 0, i32 undef, i32 1>, ptr %z3		store <4 x i32> <i32 undef, i32 0, i32 undef, i32 1>, ptr %z3
store <4 x i32> <i32 0, i32 undef, i32 1, i32 undef>, ptr %z4		store <4 x i32> <i32 0, i32 undef, i32 1, i32 undef>, ptr %z4
; We don't catch this one		; We don't catch this one
store <4 x i32> <i32 undef, i32 0, i32 1, i32 1>, ptr %z5		store <4 x i32> <i32 undef, i32 0, i32 1, i32 1>, ptr %z5
; We catch this one but as VID/3 rather than VID/2		; We catch this one but as VID/3 rather than VID/2
store <4 x i32> <i32 0, i32 0, i32 undef, i32 1>, ptr %z6		store <4 x i32> <i32 0, i32 0, i32 undef, i32 1>, ptr %z6
ret void		ret void
}		}

define void @buildvec_vid_step1o2_add3_v4i16(ptr %z0, ptr %z1, ptr %z2, ptr %z3, ptr %z4, ptr %z5, ptr %z6) {		define void @buildvec_vid_step1o2_add3_v4i16(ptr %z0, ptr %z1, ptr %z2, ptr %z3, ptr %z4, ptr %z5, ptr %z6) {
; CHECK-LABEL: buildvec_vid_step1o2_add3_v4i16:		; CHECK-LABEL: buildvec_vid_step1o2_add3_v4i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; CHECK-NEXT: vid.v v8		; CHECK-NEXT: vid.v v8
; CHECK-NEXT: vsrl.vi v8, v8, 1		; CHECK-NEXT: vsrl.vi v8, v8, 1
; CHECK-NEXT: vadd.vi v8, v8, 3		; CHECK-NEXT: vadd.vi v8, v8, 3
; CHECK-NEXT: vse16.v v8, (a0)		; CHECK-NEXT: vse16.v v8, (a0)
		; CHECK-NEXT: vmv.v.i v9, 3
; CHECK-NEXT: vse16.v v8, (a1)		; CHECK-NEXT: vse16.v v8, (a1)
; CHECK-NEXT: vse16.v v8, (a2)		; CHECK-NEXT: vse16.v v8, (a2)
; CHECK-NEXT: vse16.v v8, (a3)		; CHECK-NEXT: vse16.v v8, (a3)
; CHECK-NEXT: vse16.v v8, (a4)		; CHECK-NEXT: vse16.v v8, (a4)
; CHECK-NEXT: vmv.v.i v8, 3		; CHECK-NEXT: vmv.v.i v0, 2
; CHECK-NEXT: vmv.v.i v9, 4		; CHECK-NEXT: vmv.v.i v8, 4
; CHECK-NEXT: vsetivli zero, 2, e16, mf2, tu, ma		; CHECK-NEXT: vmerge.vim v8, v8, 3, v0
; CHECK-NEXT: vslideup.vi v9, v8, 1		; CHECK-NEXT: vse16.v v8, (a5)
; CHECK-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
; CHECK-NEXT: vse16.v v9, (a5)
; CHECK-NEXT: li a0, 4		; CHECK-NEXT: li a0, 4
; CHECK-NEXT: vslide1down.vx v8, v8, a0		; CHECK-NEXT: vslide1down.vx v8, v9, a0
; CHECK-NEXT: vse16.v v8, (a6)		; CHECK-NEXT: vse16.v v8, (a6)
; CHECK-NEXT: ret		; CHECK-NEXT: ret
store <4 x i16> <i16 3, i16 3, i16 4, i16 4>, ptr %z0		store <4 x i16> <i16 3, i16 3, i16 4, i16 4>, ptr %z0
store <4 x i16> <i16 3, i16 3, i16 4, i16 undef>, ptr %z1		store <4 x i16> <i16 3, i16 3, i16 4, i16 undef>, ptr %z1
store <4 x i16> <i16 3, i16 undef, i16 4, i16 4>, ptr %z2		store <4 x i16> <i16 3, i16 undef, i16 4, i16 4>, ptr %z2
store <4 x i16> <i16 undef, i16 3, i16 undef, i16 4>, ptr %z3		store <4 x i16> <i16 undef, i16 3, i16 undef, i16 4>, ptr %z3
store <4 x i16> <i16 3, i16 undef, i16 4, i16 undef>, ptr %z4		store <4 x i16> <i16 3, i16 undef, i16 4, i16 undef>, ptr %z4
; We don't catch this one		; We don't catch this one
▲ Show 20 Lines • Show All 131 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-int-shuffles.ll

Show First 20 Lines • Show All 366 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%shuff = shufflevector <8 x i8> %v, <8 x i8> poison, <8 x i32> <i32 2, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4>		%shuff = shufflevector <8 x i8> %v, <8 x i8> poison, <8 x i32> <i32 2, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4>
ret <8 x i8> %shuff		ret <8 x i8> %shuff
}		}

define <8 x i8> @splat_ve4_ins_i1ve3(<8 x i8> %v) {		define <8 x i8> @splat_ve4_ins_i1ve3(<8 x i8> %v) {
; CHECK-LABEL: splat_ve4_ins_i1ve3:		; CHECK-LABEL: splat_ve4_ins_i1ve3:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, ma		; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, ma
; CHECK-NEXT: vmv.v.i v9, 3		; CHECK-NEXT: vmv.v.i v0, 2
; CHECK-NEXT: vmv.v.i v10, 4		; CHECK-NEXT: vmv.v.i v9, 4
; CHECK-NEXT: vsetivli zero, 2, e8, mf2, tu, ma		; CHECK-NEXT: vmerge.vim v10, v9, 3, v0
; CHECK-NEXT: vslideup.vi v10, v9, 1
; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, ma
; CHECK-NEXT: vrgather.vv v9, v8, v10		; CHECK-NEXT: vrgather.vv v9, v8, v10
; CHECK-NEXT: vmv1r.v v8, v9		; CHECK-NEXT: vmv1r.v v8, v9
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%shuff = shufflevector <8 x i8> %v, <8 x i8> poison, <8 x i32> <i32 4, i32 3, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4>		%shuff = shufflevector <8 x i8> %v, <8 x i8> poison, <8 x i32> <i32 4, i32 3, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4>
ret <8 x i8> %shuff		ret <8 x i8> %shuff
}		}

define <8 x i8> @splat_ve2_we0(<8 x i8> %v, <8 x i8> %w) {		define <8 x i8> @splat_ve2_we0(<8 x i8> %v, <8 x i8> %w) {
▲ Show 20 Lines • Show All 76 Lines • ▼ Show 20 Lines
; RV64-NEXT: ret		; RV64-NEXT: ret
%shuff = shufflevector <8 x i8> %v, <8 x i8> %w, <8 x i32> <i32 2, i32 8, i32 4, i32 2, i32 2, i32 2, i32 8, i32 2>		%shuff = shufflevector <8 x i8> %v, <8 x i8> %w, <8 x i32> <i32 2, i32 8, i32 4, i32 2, i32 2, i32 2, i32 8, i32 2>
ret <8 x i8> %shuff		ret <8 x i8> %shuff
}		}

define <8 x i8> @splat_ve2_we0_ins_i2we4(<8 x i8> %v, <8 x i8> %w) {		define <8 x i8> @splat_ve2_we0_ins_i2we4(<8 x i8> %v, <8 x i8> %w) {
; CHECK-LABEL: splat_ve2_we0_ins_i2we4:		; CHECK-LABEL: splat_ve2_we0_ins_i2we4:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, ma		; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu
; CHECK-NEXT: vrgather.vi v10, v8, 2		; CHECK-NEXT: vmv.v.i v0, 4
; CHECK-NEXT: vmv.v.i v8, 4		; CHECK-NEXT: vmv.v.i v10, 0
; CHECK-NEXT: vmv.v.i v11, 0		; CHECK-NEXT: vmerge.vim v11, v10, 4, v0
; CHECK-NEXT: vsetivli zero, 3, e8, mf2, tu, ma
; CHECK-NEXT: vslideup.vi v11, v8, 2
; CHECK-NEXT: li a0, 70		; CHECK-NEXT: li a0, 70
; CHECK-NEXT: vmv.v.x v0, a0		; CHECK-NEXT: vmv.v.x v0, a0
; CHECK-NEXT: vsetivli zero, 8, e8, mf2, ta, mu		; CHECK-NEXT: vrgather.vi v10, v8, 2
; CHECK-NEXT: vrgather.vv v10, v9, v11, v0.t		; CHECK-NEXT: vrgather.vv v10, v9, v11, v0.t
; CHECK-NEXT: vmv1r.v v8, v10		; CHECK-NEXT: vmv1r.v v8, v10
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%shuff = shufflevector <8 x i8> %v, <8 x i8> %w, <8 x i32> <i32 2, i32 8, i32 12, i32 2, i32 2, i32 2, i32 8, i32 2>		%shuff = shufflevector <8 x i8> %v, <8 x i8> %w, <8 x i32> <i32 2, i32 8, i32 12, i32 2, i32 2, i32 2, i32 8, i32 2>
ret <8 x i8> %shuff		ret <8 x i8> %shuff
}		}

define <8 x i8> @splat_ve2_we0_ins_i2ve4_i5we6(<8 x i8> %v, <8 x i8> %w) {		define <8 x i8> @splat_ve2_we0_ins_i2ve4_i5we6(<8 x i8> %v, <8 x i8> %w) {
▲ Show 20 Lines • Show All 291 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-int.ll

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 1,266 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
ret void		ret void
}		}

define void @mulhu_v4i32(ptr %x) {		define void @mulhu_v4i32(ptr %x) {
; CHECK-LABEL: mulhu_v4i32:		; CHECK-LABEL: mulhu_v4i32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
		; CHECK-NEXT: vmv.v.i v9, 0
; CHECK-NEXT: lui a1, %hi(.LCPI68_0)		; CHECK-NEXT: lui a1, %hi(.LCPI68_0)
; CHECK-NEXT: addi a1, a1, %lo(.LCPI68_0)		; CHECK-NEXT: addi a1, a1, %lo(.LCPI68_0)
; CHECK-NEXT: vle32.v v9, (a1)		; CHECK-NEXT: vle32.v v10, (a1)
; CHECK-NEXT: vmulhu.vv v9, v8, v9		; CHECK-NEXT: vmv.v.i v0, 4
; CHECK-NEXT: vsub.vv v8, v8, v9
; CHECK-NEXT: lui a1, 524288		; CHECK-NEXT: lui a1, 524288
; CHECK-NEXT: vmv.s.x v10, a1		; CHECK-NEXT: vmerge.vxm v9, v9, a1, v0
; CHECK-NEXT: vmv.v.i v11, 0		; CHECK-NEXT: vmulhu.vv v10, v8, v10
; CHECK-NEXT: vsetivli zero, 3, e32, m1, tu, ma		; CHECK-NEXT: vsub.vv v8, v8, v10
; CHECK-NEXT: vslideup.vi v11, v10, 2		; CHECK-NEXT: vmulhu.vv v8, v8, v9
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vadd.vv v8, v8, v10
; CHECK-NEXT: vmulhu.vv v8, v8, v11
; CHECK-NEXT: vadd.vv v8, v8, v9
; CHECK-NEXT: vmv.v.i v9, 2		; CHECK-NEXT: vmv.v.i v9, 2
; CHECK-NEXT: li a1, 1		; CHECK-NEXT: li a1, 1
; CHECK-NEXT: vslide1down.vx v9, v9, a1		; CHECK-NEXT: vslide1down.vx v9, v9, a1
; CHECK-NEXT: vsrl.vv v8, v8, v9		; CHECK-NEXT: vsrl.vv v8, v8, v9
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%a = load <4 x i32>, ptr %x		%a = load <4 x i32>, ptr %x
%b = udiv <4 x i32> %a, <i32 5, i32 6, i32 7, i32 9>		%b = udiv <4 x i32> %a, <i32 5, i32 6, i32 7, i32 9>
▲ Show 20 Lines • Show All 224 Lines • ▼ Show 20 Lines
; RV32-NEXT: vsetivli zero, 2, e64, m1, ta, ma		; RV32-NEXT: vsetivli zero, 2, e64, m1, ta, ma
; RV32-NEXT: vmulh.vv v9, v8, v9		; RV32-NEXT: vmulh.vv v9, v8, v9
; RV32-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; RV32-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; RV32-NEXT: vid.v v10		; RV32-NEXT: vid.v v10
; RV32-NEXT: vsrl.vi v10, v10, 1		; RV32-NEXT: vsrl.vi v10, v10, 1
; RV32-NEXT: vrsub.vi v10, v10, 0		; RV32-NEXT: vrsub.vi v10, v10, 0
; RV32-NEXT: vsetivli zero, 2, e64, m1, ta, ma		; RV32-NEXT: vsetivli zero, 2, e64, m1, ta, ma
; RV32-NEXT: vmadd.vv v10, v8, v9		; RV32-NEXT: vmadd.vv v10, v8, v9
; RV32-NEXT: li a1, 63
; RV32-NEXT: vsrl.vx v8, v10, a1
; RV32-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; RV32-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; RV32-NEXT: vmv.v.i v9, 1		; RV32-NEXT: vmv.v.i v0, 4
; RV32-NEXT: vmv.v.i v11, 0		; RV32-NEXT: vmv.v.i v8, 0
; RV32-NEXT: vsetivli zero, 3, e32, m1, tu, ma		; RV32-NEXT: vmerge.vim v8, v8, 1, v0
; RV32-NEXT: vslideup.vi v11, v9, 2
; RV32-NEXT: vsetivli zero, 2, e64, m1, ta, ma		; RV32-NEXT: vsetivli zero, 2, e64, m1, ta, ma
; RV32-NEXT: vsra.vv v9, v10, v11		; RV32-NEXT: vsra.vv v8, v10, v8
; RV32-NEXT: vadd.vv v8, v9, v8		; RV32-NEXT: li a1, 63
		; RV32-NEXT: vsrl.vx v9, v10, a1
		; RV32-NEXT: vadd.vv v8, v8, v9
; RV32-NEXT: vse64.v v8, (a0)		; RV32-NEXT: vse64.v v8, (a0)
; RV32-NEXT: ret		; RV32-NEXT: ret
;		;
; RV64-LABEL: mulhs_v2i64:		; RV64-LABEL: mulhs_v2i64:
; RV64: # %bb.0:		; RV64: # %bb.0:
; RV64-NEXT: vsetivli zero, 2, e64, m1, ta, ma		; RV64-NEXT: vsetivli zero, 2, e64, m1, ta, ma
; RV64-NEXT: lui a1, 349525		; RV64-NEXT: lui a1, 349525
; RV64-NEXT: addiw a1, a1, 1365		; RV64-NEXT: addiw a1, a1, 1365
▲ Show 20 Lines • Show All 3,649 Lines • ▼ Show 20 Lines
; LMULMAX2-NEXT: vmerge.vim v10, v10, 1, v0		; LMULMAX2-NEXT: vmerge.vim v10, v10, 1, v0
; LMULMAX2-NEXT: vsrl.vv v8, v8, v10		; LMULMAX2-NEXT: vsrl.vv v8, v8, v10
; LMULMAX2-NEXT: vse32.v v8, (a0)		; LMULMAX2-NEXT: vse32.v v8, (a0)
; LMULMAX2-NEXT: ret		; LMULMAX2-NEXT: ret
;		;
; LMULMAX1-RV32-LABEL: mulhu_v8i32:		; LMULMAX1-RV32-LABEL: mulhu_v8i32:
; LMULMAX1-RV32: # %bb.0:		; LMULMAX1-RV32: # %bb.0:
; LMULMAX1-RV32-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; LMULMAX1-RV32-NEXT: vsetivli zero, 4, e32, m1, ta, ma
		; LMULMAX1-RV32-NEXT: vle32.v v8, (a0)
; LMULMAX1-RV32-NEXT: addi a1, a0, 16		; LMULMAX1-RV32-NEXT: addi a1, a0, 16
; LMULMAX1-RV32-NEXT: vle32.v v8, (a1)		; LMULMAX1-RV32-NEXT: vle32.v v9, (a1)
		; LMULMAX1-RV32-NEXT: vmv.v.i v10, 0
; LMULMAX1-RV32-NEXT: lui a2, %hi(.LCPI183_0)		; LMULMAX1-RV32-NEXT: lui a2, %hi(.LCPI183_0)
; LMULMAX1-RV32-NEXT: addi a2, a2, %lo(.LCPI183_0)		; LMULMAX1-RV32-NEXT: addi a2, a2, %lo(.LCPI183_0)
; LMULMAX1-RV32-NEXT: vle32.v v9, (a2)		; LMULMAX1-RV32-NEXT: vle32.v v11, (a2)
; LMULMAX1-RV32-NEXT: vle32.v v10, (a0)		; LMULMAX1-RV32-NEXT: vmv.v.i v0, 4
; LMULMAX1-RV32-NEXT: vmulhu.vv v11, v8, v9
; LMULMAX1-RV32-NEXT: vsub.vv v8, v8, v11
; LMULMAX1-RV32-NEXT: lui a2, 524288		; LMULMAX1-RV32-NEXT: lui a2, 524288
; LMULMAX1-RV32-NEXT: vmv.s.x v12, a2		; LMULMAX1-RV32-NEXT: vmerge.vxm v10, v10, a2, v0
; LMULMAX1-RV32-NEXT: vmv.v.i v13, 0		; LMULMAX1-RV32-NEXT: vmulhu.vv v12, v9, v11
; LMULMAX1-RV32-NEXT: vsetivli zero, 3, e32, m1, tu, ma		; LMULMAX1-RV32-NEXT: vsub.vv v9, v9, v12
; LMULMAX1-RV32-NEXT: vslideup.vi v13, v12, 2		; LMULMAX1-RV32-NEXT: vmulhu.vv v9, v9, v10
; LMULMAX1-RV32-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; LMULMAX1-RV32-NEXT: vadd.vv v9, v9, v12
; LMULMAX1-RV32-NEXT: vmulhu.vv v8, v8, v13		; LMULMAX1-RV32-NEXT: vmv.v.i v12, 2
; LMULMAX1-RV32-NEXT: vadd.vv v8, v8, v11
; LMULMAX1-RV32-NEXT: vmv.v.i v11, 2
; LMULMAX1-RV32-NEXT: li a2, 1		; LMULMAX1-RV32-NEXT: li a2, 1
; LMULMAX1-RV32-NEXT: vslide1down.vx v11, v11, a2		; LMULMAX1-RV32-NEXT: vslide1down.vx v12, v12, a2
; LMULMAX1-RV32-NEXT: vsrl.vv v8, v8, v11		; LMULMAX1-RV32-NEXT: vsrl.vv v9, v9, v12
; LMULMAX1-RV32-NEXT: vmulhu.vv v9, v10, v9		; LMULMAX1-RV32-NEXT: vmulhu.vv v11, v8, v11
; LMULMAX1-RV32-NEXT: vsub.vv v10, v10, v9		; LMULMAX1-RV32-NEXT: vsub.vv v8, v8, v11
; LMULMAX1-RV32-NEXT: vmulhu.vv v10, v10, v13		; LMULMAX1-RV32-NEXT: vmulhu.vv v8, v8, v10
; LMULMAX1-RV32-NEXT: vadd.vv v9, v10, v9		; LMULMAX1-RV32-NEXT: vadd.vv v8, v8, v11
; LMULMAX1-RV32-NEXT: vsrl.vv v9, v9, v11		; LMULMAX1-RV32-NEXT: vsrl.vv v8, v8, v12
; LMULMAX1-RV32-NEXT: vse32.v v9, (a0)		; LMULMAX1-RV32-NEXT: vse32.v v8, (a0)
; LMULMAX1-RV32-NEXT: vse32.v v8, (a1)		; LMULMAX1-RV32-NEXT: vse32.v v9, (a1)
; LMULMAX1-RV32-NEXT: ret		; LMULMAX1-RV32-NEXT: ret
;		;
; LMULMAX1-RV64-LABEL: mulhu_v8i32:		; LMULMAX1-RV64-LABEL: mulhu_v8i32:
; LMULMAX1-RV64: # %bb.0:		; LMULMAX1-RV64: # %bb.0:
; LMULMAX1-RV64-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; LMULMAX1-RV64-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; LMULMAX1-RV64-NEXT: addi a1, a0, 16		; LMULMAX1-RV64-NEXT: addi a1, a0, 16
; LMULMAX1-RV64-NEXT: vle32.v v8, (a1)		; LMULMAX1-RV64-NEXT: vle32.v v8, (a1)
; LMULMAX1-RV64-NEXT: lui a2, %hi(.LCPI183_0)		; LMULMAX1-RV64-NEXT: lui a2, %hi(.LCPI183_0)
Show All 40 Lines
; LMULMAX2-RV32-NEXT: vsrl.vv v8, v8, v10		; LMULMAX2-RV32-NEXT: vsrl.vv v8, v8, v10
; LMULMAX2-RV32-NEXT: vse64.v v8, (a0)		; LMULMAX2-RV32-NEXT: vse64.v v8, (a0)
; LMULMAX2-RV32-NEXT: ret		; LMULMAX2-RV32-NEXT: ret
;		;
; LMULMAX2-RV64-LABEL: mulhu_v4i64:		; LMULMAX2-RV64-LABEL: mulhu_v4i64:
; LMULMAX2-RV64: # %bb.0:		; LMULMAX2-RV64: # %bb.0:
; LMULMAX2-RV64-NEXT: vsetivli zero, 4, e64, m2, ta, ma		; LMULMAX2-RV64-NEXT: vsetivli zero, 4, e64, m2, ta, ma
; LMULMAX2-RV64-NEXT: vle64.v v8, (a0)		; LMULMAX2-RV64-NEXT: vle64.v v8, (a0)
		; LMULMAX2-RV64-NEXT: vmv.v.i v10, 0
		; LMULMAX2-RV64-NEXT: vsetivli zero, 1, e8, mf8, ta, ma
		; LMULMAX2-RV64-NEXT: vmv.v.i v0, 4
		; LMULMAX2-RV64-NEXT: vsetivli zero, 4, e64, m2, ta, ma
; LMULMAX2-RV64-NEXT: lui a1, %hi(.LCPI184_0)		; LMULMAX2-RV64-NEXT: lui a1, %hi(.LCPI184_0)
; LMULMAX2-RV64-NEXT: addi a1, a1, %lo(.LCPI184_0)		; LMULMAX2-RV64-NEXT: addi a1, a1, %lo(.LCPI184_0)
; LMULMAX2-RV64-NEXT: vle64.v v10, (a1)		; LMULMAX2-RV64-NEXT: vle64.v v12, (a1)
; LMULMAX2-RV64-NEXT: vmulhu.vv v10, v8, v10
; LMULMAX2-RV64-NEXT: vsub.vv v8, v8, v10
; LMULMAX2-RV64-NEXT: li a1, -1		; LMULMAX2-RV64-NEXT: li a1, -1
; LMULMAX2-RV64-NEXT: slli a1, a1, 63		; LMULMAX2-RV64-NEXT: slli a1, a1, 63
; LMULMAX2-RV64-NEXT: vmv.s.x v12, a1		; LMULMAX2-RV64-NEXT: vmerge.vxm v10, v10, a1, v0
; LMULMAX2-RV64-NEXT: vmv.v.i v14, 0		; LMULMAX2-RV64-NEXT: vmulhu.vv v12, v8, v12
; LMULMAX2-RV64-NEXT: vsetivli zero, 3, e64, m2, tu, ma
; LMULMAX2-RV64-NEXT: vslideup.vi v14, v12, 2
; LMULMAX2-RV64-NEXT: vsetivli zero, 4, e64, m2, ta, ma
; LMULMAX2-RV64-NEXT: lui a1, %hi(.LCPI184_1)		; LMULMAX2-RV64-NEXT: lui a1, %hi(.LCPI184_1)
; LMULMAX2-RV64-NEXT: addi a1, a1, %lo(.LCPI184_1)		; LMULMAX2-RV64-NEXT: addi a1, a1, %lo(.LCPI184_1)
; LMULMAX2-RV64-NEXT: vle64.v v12, (a1)		; LMULMAX2-RV64-NEXT: vle64.v v14, (a1)
; LMULMAX2-RV64-NEXT: vmulhu.vv v8, v8, v14		; LMULMAX2-RV64-NEXT: vsub.vv v8, v8, v12
; LMULMAX2-RV64-NEXT: vadd.vv v8, v8, v10		; LMULMAX2-RV64-NEXT: vmulhu.vv v8, v8, v10
; LMULMAX2-RV64-NEXT: vsrl.vv v8, v8, v12		; LMULMAX2-RV64-NEXT: vadd.vv v8, v8, v12
		; LMULMAX2-RV64-NEXT: vsrl.vv v8, v8, v14
; LMULMAX2-RV64-NEXT: vse64.v v8, (a0)		; LMULMAX2-RV64-NEXT: vse64.v v8, (a0)
; LMULMAX2-RV64-NEXT: ret		; LMULMAX2-RV64-NEXT: ret
;		;
; LMULMAX1-RV32-LABEL: mulhu_v4i64:		; LMULMAX1-RV32-LABEL: mulhu_v4i64:
; LMULMAX1-RV32: # %bb.0:		; LMULMAX1-RV32: # %bb.0:
; LMULMAX1-RV32-NEXT: vsetivli zero, 2, e64, m1, ta, ma		; LMULMAX1-RV32-NEXT: vsetivli zero, 2, e64, m1, ta, ma
; LMULMAX1-RV32-NEXT: vle64.v v8, (a0)		; LMULMAX1-RV32-NEXT: vle64.v v8, (a0)
; LMULMAX1-RV32-NEXT: addi a1, a0, 16		; LMULMAX1-RV32-NEXT: addi a1, a0, 16
▲ Show 20 Lines • Show All 3,167 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-masked-gather.ll

This file is larger than 256 KB, so syntax highlighting is disabled by default.

	Show First 20 Lines • Show All 83 Lines • ▼ Show 20 Lines
	; RV64ZVE32F-NEXT: .LBB1_3: # %cond.load			; RV64ZVE32F-NEXT: .LBB1_3: # %cond.load
	; RV64ZVE32F-NEXT: lbu a0, 0(a0)			; RV64ZVE32F-NEXT: lbu a0, 0(a0)
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e8, mf4, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 2, e8, mf4, tu, ma
	; RV64ZVE32F-NEXT: vmv.s.x v8, a0			; RV64ZVE32F-NEXT: vmv.s.x v8, a0
	; RV64ZVE32F-NEXT: andi a2, a2, 2			; RV64ZVE32F-NEXT: andi a2, a2, 2
	; RV64ZVE32F-NEXT: beqz a2, .LBB1_2			; RV64ZVE32F-NEXT: beqz a2, .LBB1_2
	; RV64ZVE32F-NEXT: .LBB1_4: # %cond.load1			; RV64ZVE32F-NEXT: .LBB1_4: # %cond.load1
	; RV64ZVE32F-NEXT: lbu a0, 0(a1)			; RV64ZVE32F-NEXT: lbu a0, 0(a1)
				; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
				; RV64ZVE32F-NEXT: vmv.v.i v0, 2
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e8, mf4, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 2, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vmv.s.x v9, a0			; RV64ZVE32F-NEXT: vmerge.vxm v8, v8, a0, v0
	; RV64ZVE32F-NEXT: vslideup.vi v8, v9, 1
	; RV64ZVE32F-NEXT: ret			; RV64ZVE32F-NEXT: ret
	%v = call <2 x i8> @llvm.masked.gather.v2i8.v2p0(<2 x ptr> %ptrs, i32 1, <2 x i1> %m, <2 x i8> %passthru)			%v = call <2 x i8> @llvm.masked.gather.v2i8.v2p0(<2 x ptr> %ptrs, i32 1, <2 x i1> %m, <2 x i8> %passthru)
	ret <2 x i8> %v			ret <2 x i8> %v
	}			}

	define <2 x i16> @mgather_v2i8_sextload_v2i16(<2 x ptr> %ptrs, <2 x i1> %m, <2 x i8> %passthru) {			define <2 x i16> @mgather_v2i8_sextload_v2i16(<2 x ptr> %ptrs, <2 x i1> %m, <2 x i8> %passthru) {
	; RV32V-LABEL: mgather_v2i8_sextload_v2i16:			; RV32V-LABEL: mgather_v2i8_sextload_v2i16:
	; RV32V: # %bb.0:			; RV32V: # %bb.0:
	Show All 29 Lines
	; RV64ZVE32F-NEXT: lbu a0, 0(a0)			; RV64ZVE32F-NEXT: lbu a0, 0(a0)
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e8, mf4, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 2, e8, mf4, tu, ma
	; RV64ZVE32F-NEXT: vmv.s.x v8, a0			; RV64ZVE32F-NEXT: vmv.s.x v8, a0
	; RV64ZVE32F-NEXT: .LBB2_2: # %else			; RV64ZVE32F-NEXT: .LBB2_2: # %else
	; RV64ZVE32F-NEXT: andi a2, a2, 2			; RV64ZVE32F-NEXT: andi a2, a2, 2
	; RV64ZVE32F-NEXT: beqz a2, .LBB2_4			; RV64ZVE32F-NEXT: beqz a2, .LBB2_4
	; RV64ZVE32F-NEXT: # %bb.3: # %cond.load1			; RV64ZVE32F-NEXT: # %bb.3: # %cond.load1
	; RV64ZVE32F-NEXT: lbu a0, 0(a1)			; RV64ZVE32F-NEXT: lbu a0, 0(a1)
				; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
				; RV64ZVE32F-NEXT: vmv.v.i v0, 2
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e8, mf4, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 2, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vmv.s.x v9, a0			; RV64ZVE32F-NEXT: vmerge.vxm v8, v8, a0, v0
	; RV64ZVE32F-NEXT: vslideup.vi v8, v9, 1
	; RV64ZVE32F-NEXT: .LBB2_4: # %else2			; RV64ZVE32F-NEXT: .LBB2_4: # %else2
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e16, mf2, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 2, e16, mf2, ta, ma
	; RV64ZVE32F-NEXT: vsext.vf2 v9, v8			; RV64ZVE32F-NEXT: vsext.vf2 v9, v8
	; RV64ZVE32F-NEXT: vmv1r.v v8, v9			; RV64ZVE32F-NEXT: vmv1r.v v8, v9
	; RV64ZVE32F-NEXT: ret			; RV64ZVE32F-NEXT: ret
	%v = call <2 x i8> @llvm.masked.gather.v2i8.v2p0(<2 x ptr> %ptrs, i32 1, <2 x i1> %m, <2 x i8> %passthru)			%v = call <2 x i8> @llvm.masked.gather.v2i8.v2p0(<2 x ptr> %ptrs, i32 1, <2 x i1> %m, <2 x i8> %passthru)
	%ev = sext <2 x i8> %v to <2 x i16>			%ev = sext <2 x i8> %v to <2 x i16>
	ret <2 x i16> %ev			ret <2 x i16> %ev
	Show All 34 Lines
	; RV64ZVE32F-NEXT: lbu a0, 0(a0)			; RV64ZVE32F-NEXT: lbu a0, 0(a0)
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e8, mf4, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 2, e8, mf4, tu, ma
	; RV64ZVE32F-NEXT: vmv.s.x v8, a0			; RV64ZVE32F-NEXT: vmv.s.x v8, a0
	; RV64ZVE32F-NEXT: .LBB3_2: # %else			; RV64ZVE32F-NEXT: .LBB3_2: # %else
	; RV64ZVE32F-NEXT: andi a2, a2, 2			; RV64ZVE32F-NEXT: andi a2, a2, 2
	; RV64ZVE32F-NEXT: beqz a2, .LBB3_4			; RV64ZVE32F-NEXT: beqz a2, .LBB3_4
	; RV64ZVE32F-NEXT: # %bb.3: # %cond.load1			; RV64ZVE32F-NEXT: # %bb.3: # %cond.load1
	; RV64ZVE32F-NEXT: lbu a0, 0(a1)			; RV64ZVE32F-NEXT: lbu a0, 0(a1)
				; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
				; RV64ZVE32F-NEXT: vmv.v.i v0, 2
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e8, mf4, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 2, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vmv.s.x v9, a0			; RV64ZVE32F-NEXT: vmerge.vxm v8, v8, a0, v0
	; RV64ZVE32F-NEXT: vslideup.vi v8, v9, 1
	; RV64ZVE32F-NEXT: .LBB3_4: # %else2			; RV64ZVE32F-NEXT: .LBB3_4: # %else2
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e16, mf2, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 2, e16, mf2, ta, ma
	; RV64ZVE32F-NEXT: vzext.vf2 v9, v8			; RV64ZVE32F-NEXT: vzext.vf2 v9, v8
	; RV64ZVE32F-NEXT: vmv1r.v v8, v9			; RV64ZVE32F-NEXT: vmv1r.v v8, v9
	; RV64ZVE32F-NEXT: ret			; RV64ZVE32F-NEXT: ret
	%v = call <2 x i8> @llvm.masked.gather.v2i8.v2p0(<2 x ptr> %ptrs, i32 1, <2 x i1> %m, <2 x i8> %passthru)			%v = call <2 x i8> @llvm.masked.gather.v2i8.v2p0(<2 x ptr> %ptrs, i32 1, <2 x i1> %m, <2 x i8> %passthru)
	%ev = zext <2 x i8> %v to <2 x i16>			%ev = zext <2 x i8> %v to <2 x i16>
	ret <2 x i16> %ev			ret <2 x i16> %ev
	Show All 34 Lines
	; RV64ZVE32F-NEXT: lbu a0, 0(a0)			; RV64ZVE32F-NEXT: lbu a0, 0(a0)
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e8, mf4, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 2, e8, mf4, tu, ma
	; RV64ZVE32F-NEXT: vmv.s.x v8, a0			; RV64ZVE32F-NEXT: vmv.s.x v8, a0
	; RV64ZVE32F-NEXT: .LBB4_2: # %else			; RV64ZVE32F-NEXT: .LBB4_2: # %else
	; RV64ZVE32F-NEXT: andi a2, a2, 2			; RV64ZVE32F-NEXT: andi a2, a2, 2
	; RV64ZVE32F-NEXT: beqz a2, .LBB4_4			; RV64ZVE32F-NEXT: beqz a2, .LBB4_4
	; RV64ZVE32F-NEXT: # %bb.3: # %cond.load1			; RV64ZVE32F-NEXT: # %bb.3: # %cond.load1
	; RV64ZVE32F-NEXT: lbu a0, 0(a1)			; RV64ZVE32F-NEXT: lbu a0, 0(a1)
				; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
				; RV64ZVE32F-NEXT: vmv.v.i v0, 2
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e8, mf4, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 2, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vmv.s.x v9, a0			; RV64ZVE32F-NEXT: vmerge.vxm v8, v8, a0, v0
	; RV64ZVE32F-NEXT: vslideup.vi v8, v9, 1
	; RV64ZVE32F-NEXT: .LBB4_4: # %else2			; RV64ZVE32F-NEXT: .LBB4_4: # %else2
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e32, m1, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 2, e32, m1, ta, ma
	; RV64ZVE32F-NEXT: vsext.vf4 v9, v8			; RV64ZVE32F-NEXT: vsext.vf4 v9, v8
	; RV64ZVE32F-NEXT: vmv.v.v v8, v9			; RV64ZVE32F-NEXT: vmv.v.v v8, v9
	; RV64ZVE32F-NEXT: ret			; RV64ZVE32F-NEXT: ret
	%v = call <2 x i8> @llvm.masked.gather.v2i8.v2p0(<2 x ptr> %ptrs, i32 1, <2 x i1> %m, <2 x i8> %passthru)			%v = call <2 x i8> @llvm.masked.gather.v2i8.v2p0(<2 x ptr> %ptrs, i32 1, <2 x i1> %m, <2 x i8> %passthru)
	%ev = sext <2 x i8> %v to <2 x i32>			%ev = sext <2 x i8> %v to <2 x i32>
	ret <2 x i32> %ev			ret <2 x i32> %ev
	Show All 34 Lines
	; RV64ZVE32F-NEXT: lbu a0, 0(a0)			; RV64ZVE32F-NEXT: lbu a0, 0(a0)
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e8, mf4, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 2, e8, mf4, tu, ma
	; RV64ZVE32F-NEXT: vmv.s.x v8, a0			; RV64ZVE32F-NEXT: vmv.s.x v8, a0
	; RV64ZVE32F-NEXT: .LBB5_2: # %else			; RV64ZVE32F-NEXT: .LBB5_2: # %else
	; RV64ZVE32F-NEXT: andi a2, a2, 2			; RV64ZVE32F-NEXT: andi a2, a2, 2
	; RV64ZVE32F-NEXT: beqz a2, .LBB5_4			; RV64ZVE32F-NEXT: beqz a2, .LBB5_4
	; RV64ZVE32F-NEXT: # %bb.3: # %cond.load1			; RV64ZVE32F-NEXT: # %bb.3: # %cond.load1
	; RV64ZVE32F-NEXT: lbu a0, 0(a1)			; RV64ZVE32F-NEXT: lbu a0, 0(a1)
				; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
				; RV64ZVE32F-NEXT: vmv.v.i v0, 2
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e8, mf4, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 2, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vmv.s.x v9, a0			; RV64ZVE32F-NEXT: vmerge.vxm v8, v8, a0, v0
	; RV64ZVE32F-NEXT: vslideup.vi v8, v9, 1
	; RV64ZVE32F-NEXT: .LBB5_4: # %else2			; RV64ZVE32F-NEXT: .LBB5_4: # %else2
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e32, m1, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 2, e32, m1, ta, ma
	; RV64ZVE32F-NEXT: vzext.vf4 v9, v8			; RV64ZVE32F-NEXT: vzext.vf4 v9, v8
	; RV64ZVE32F-NEXT: vmv.v.v v8, v9			; RV64ZVE32F-NEXT: vmv.v.v v8, v9
	; RV64ZVE32F-NEXT: ret			; RV64ZVE32F-NEXT: ret
	%v = call <2 x i8> @llvm.masked.gather.v2i8.v2p0(<2 x ptr> %ptrs, i32 1, <2 x i1> %m, <2 x i8> %passthru)			%v = call <2 x i8> @llvm.masked.gather.v2i8.v2p0(<2 x ptr> %ptrs, i32 1, <2 x i1> %m, <2 x i8> %passthru)
	%ev = zext <2 x i8> %v to <2 x i32>			%ev = zext <2 x i8> %v to <2 x i32>
	ret <2 x i32> %ev			ret <2 x i32> %ev
	▲ Show 20 Lines • Show All 41 Lines • ▼ Show 20 Lines
	; RV64ZVE32F-NEXT: lbu a0, 0(a0)			; RV64ZVE32F-NEXT: lbu a0, 0(a0)
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e8, mf4, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 2, e8, mf4, tu, ma
	; RV64ZVE32F-NEXT: vmv.s.x v8, a0			; RV64ZVE32F-NEXT: vmv.s.x v8, a0
	; RV64ZVE32F-NEXT: .LBB6_2: # %else			; RV64ZVE32F-NEXT: .LBB6_2: # %else
	; RV64ZVE32F-NEXT: andi a2, a2, 2			; RV64ZVE32F-NEXT: andi a2, a2, 2
	; RV64ZVE32F-NEXT: beqz a2, .LBB6_4			; RV64ZVE32F-NEXT: beqz a2, .LBB6_4
	; RV64ZVE32F-NEXT: # %bb.3: # %cond.load1			; RV64ZVE32F-NEXT: # %bb.3: # %cond.load1
	; RV64ZVE32F-NEXT: lbu a0, 0(a1)			; RV64ZVE32F-NEXT: lbu a0, 0(a1)
				; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
				; RV64ZVE32F-NEXT: vmv.v.i v0, 2
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e8, mf4, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 2, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vmv.s.x v9, a0			; RV64ZVE32F-NEXT: vmerge.vxm v8, v8, a0, v0
	; RV64ZVE32F-NEXT: vslideup.vi v8, v9, 1
	; RV64ZVE32F-NEXT: .LBB6_4: # %else2			; RV64ZVE32F-NEXT: .LBB6_4: # %else2
	; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vslidedown.vi v9, v8, 1			; RV64ZVE32F-NEXT: vslidedown.vi v9, v8, 1
	; RV64ZVE32F-NEXT: vmv.x.s a1, v9			; RV64ZVE32F-NEXT: vmv.x.s a1, v9
	; RV64ZVE32F-NEXT: vmv.x.s a0, v8			; RV64ZVE32F-NEXT: vmv.x.s a0, v8
	; RV64ZVE32F-NEXT: ret			; RV64ZVE32F-NEXT: ret
	%v = call <2 x i8> @llvm.masked.gather.v2i8.v2p0(<2 x ptr> %ptrs, i32 1, <2 x i1> %m, <2 x i8> %passthru)			%v = call <2 x i8> @llvm.masked.gather.v2i8.v2p0(<2 x ptr> %ptrs, i32 1, <2 x i1> %m, <2 x i8> %passthru)
	%ev = sext <2 x i8> %v to <2 x i64>			%ev = sext <2 x i8> %v to <2 x i64>
	▲ Show 20 Lines • Show All 42 Lines • ▼ Show 20 Lines
	; RV64ZVE32F-NEXT: lbu a0, 0(a0)			; RV64ZVE32F-NEXT: lbu a0, 0(a0)
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e8, mf4, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 2, e8, mf4, tu, ma
	; RV64ZVE32F-NEXT: vmv.s.x v8, a0			; RV64ZVE32F-NEXT: vmv.s.x v8, a0
	; RV64ZVE32F-NEXT: .LBB7_2: # %else			; RV64ZVE32F-NEXT: .LBB7_2: # %else
	; RV64ZVE32F-NEXT: andi a2, a2, 2			; RV64ZVE32F-NEXT: andi a2, a2, 2
	; RV64ZVE32F-NEXT: beqz a2, .LBB7_4			; RV64ZVE32F-NEXT: beqz a2, .LBB7_4
	; RV64ZVE32F-NEXT: # %bb.3: # %cond.load1			; RV64ZVE32F-NEXT: # %bb.3: # %cond.load1
	; RV64ZVE32F-NEXT: lbu a0, 0(a1)			; RV64ZVE32F-NEXT: lbu a0, 0(a1)
				; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
				; RV64ZVE32F-NEXT: vmv.v.i v0, 2
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e8, mf4, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 2, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vmv.s.x v9, a0			; RV64ZVE32F-NEXT: vmerge.vxm v8, v8, a0, v0
	; RV64ZVE32F-NEXT: vslideup.vi v8, v9, 1
	; RV64ZVE32F-NEXT: .LBB7_4: # %else2			; RV64ZVE32F-NEXT: .LBB7_4: # %else2
	; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vslidedown.vi v9, v8, 1			; RV64ZVE32F-NEXT: vslidedown.vi v9, v8, 1
	; RV64ZVE32F-NEXT: vmv.x.s a0, v9			; RV64ZVE32F-NEXT: vmv.x.s a0, v9
	; RV64ZVE32F-NEXT: andi a1, a0, 255			; RV64ZVE32F-NEXT: andi a1, a0, 255
	; RV64ZVE32F-NEXT: vmv.x.s a0, v8			; RV64ZVE32F-NEXT: vmv.x.s a0, v8
	; RV64ZVE32F-NEXT: andi a0, a0, 255			; RV64ZVE32F-NEXT: andi a0, a0, 255
	; RV64ZVE32F-NEXT: ret			; RV64ZVE32F-NEXT: ret
	▲ Show 20 Lines • Show All 41 Lines • ▼ Show 20 Lines
	; RV64ZVE32F-NEXT: lbu a2, 0(a2)			; RV64ZVE32F-NEXT: lbu a2, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 4, e8, mf4, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 4, e8, mf4, tu, ma
	; RV64ZVE32F-NEXT: vmv.s.x v8, a2			; RV64ZVE32F-NEXT: vmv.s.x v8, a2
	; RV64ZVE32F-NEXT: andi a2, a1, 2			; RV64ZVE32F-NEXT: andi a2, a1, 2
	; RV64ZVE32F-NEXT: beqz a2, .LBB8_2			; RV64ZVE32F-NEXT: beqz a2, .LBB8_2
	; RV64ZVE32F-NEXT: .LBB8_6: # %cond.load1			; RV64ZVE32F-NEXT: .LBB8_6: # %cond.load1
	; RV64ZVE32F-NEXT: ld a2, 8(a0)			; RV64ZVE32F-NEXT: ld a2, 8(a0)
	; RV64ZVE32F-NEXT: lbu a2, 0(a2)			; RV64ZVE32F-NEXT: lbu a2, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e8, mf4, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vmv.s.x v9, a2			; RV64ZVE32F-NEXT: vmv.v.i v0, 2
	; RV64ZVE32F-NEXT: vslideup.vi v8, v9, 1			; RV64ZVE32F-NEXT: vsetivli zero, 4, e8, mf4, ta, ma
				; RV64ZVE32F-NEXT: vmerge.vxm v8, v8, a2, v0
	; RV64ZVE32F-NEXT: andi a2, a1, 4			; RV64ZVE32F-NEXT: andi a2, a1, 4
	; RV64ZVE32F-NEXT: beqz a2, .LBB8_3			; RV64ZVE32F-NEXT: beqz a2, .LBB8_3
	; RV64ZVE32F-NEXT: .LBB8_7: # %cond.load4			; RV64ZVE32F-NEXT: .LBB8_7: # %cond.load4
	; RV64ZVE32F-NEXT: ld a2, 16(a0)			; RV64ZVE32F-NEXT: ld a2, 16(a0)
	; RV64ZVE32F-NEXT: lbu a2, 0(a2)			; RV64ZVE32F-NEXT: lbu a2, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 3, e8, mf4, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vmv.s.x v9, a2			; RV64ZVE32F-NEXT: vmv.v.i v0, 4
	; RV64ZVE32F-NEXT: vslideup.vi v8, v9, 2			; RV64ZVE32F-NEXT: vsetivli zero, 4, e8, mf4, ta, ma
				; RV64ZVE32F-NEXT: vmerge.vxm v8, v8, a2, v0
	; RV64ZVE32F-NEXT: andi a1, a1, 8			; RV64ZVE32F-NEXT: andi a1, a1, 8
	; RV64ZVE32F-NEXT: beqz a1, .LBB8_4			; RV64ZVE32F-NEXT: beqz a1, .LBB8_4
	; RV64ZVE32F-NEXT: .LBB8_8: # %cond.load7			; RV64ZVE32F-NEXT: .LBB8_8: # %cond.load7
	; RV64ZVE32F-NEXT: ld a0, 24(a0)			; RV64ZVE32F-NEXT: ld a0, 24(a0)
	; RV64ZVE32F-NEXT: lbu a0, 0(a0)			; RV64ZVE32F-NEXT: lbu a0, 0(a0)
				; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
				; RV64ZVE32F-NEXT: vmv.v.i v0, 8
	; RV64ZVE32F-NEXT: vsetivli zero, 4, e8, mf4, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 4, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vmv.s.x v9, a0			; RV64ZVE32F-NEXT: vmerge.vxm v8, v8, a0, v0
	; RV64ZVE32F-NEXT: vslideup.vi v8, v9, 3
	; RV64ZVE32F-NEXT: ret			; RV64ZVE32F-NEXT: ret
	%v = call <4 x i8> @llvm.masked.gather.v4i8.v4p0(<4 x ptr> %ptrs, i32 1, <4 x i1> %m, <4 x i8> %passthru)			%v = call <4 x i8> @llvm.masked.gather.v4i8.v4p0(<4 x ptr> %ptrs, i32 1, <4 x i1> %m, <4 x i8> %passthru)
	ret <4 x i8> %v			ret <4 x i8> %v
	}			}

	define <4 x i8> @mgather_truemask_v4i8(<4 x ptr> %ptrs, <4 x i8> %passthru) {			define <4 x i8> @mgather_truemask_v4i8(<4 x ptr> %ptrs, <4 x i8> %passthru) {
	; RV32-LABEL: mgather_truemask_v4i8:			; RV32-LABEL: mgather_truemask_v4i8:
	; RV32: # %bb.0:			; RV32: # %bb.0:
	Show All 31 Lines
	; RV64ZVE32F-NEXT: lbu a2, 0(a2)			; RV64ZVE32F-NEXT: lbu a2, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 4, e8, mf4, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 4, e8, mf4, tu, ma
	; RV64ZVE32F-NEXT: vmv.s.x v8, a2			; RV64ZVE32F-NEXT: vmv.s.x v8, a2
	; RV64ZVE32F-NEXT: andi a2, a1, 2			; RV64ZVE32F-NEXT: andi a2, a1, 2
	; RV64ZVE32F-NEXT: beqz a2, .LBB9_2			; RV64ZVE32F-NEXT: beqz a2, .LBB9_2
	; RV64ZVE32F-NEXT: .LBB9_6: # %cond.load1			; RV64ZVE32F-NEXT: .LBB9_6: # %cond.load1
	; RV64ZVE32F-NEXT: ld a2, 8(a0)			; RV64ZVE32F-NEXT: ld a2, 8(a0)
	; RV64ZVE32F-NEXT: lbu a2, 0(a2)			; RV64ZVE32F-NEXT: lbu a2, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e8, mf4, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vmv.s.x v9, a2			; RV64ZVE32F-NEXT: vmv.v.i v0, 2
	; RV64ZVE32F-NEXT: vslideup.vi v8, v9, 1			; RV64ZVE32F-NEXT: vsetivli zero, 4, e8, mf4, ta, ma
				; RV64ZVE32F-NEXT: vmerge.vxm v8, v8, a2, v0
	; RV64ZVE32F-NEXT: andi a2, a1, 4			; RV64ZVE32F-NEXT: andi a2, a1, 4
	; RV64ZVE32F-NEXT: beqz a2, .LBB9_3			; RV64ZVE32F-NEXT: beqz a2, .LBB9_3
	; RV64ZVE32F-NEXT: .LBB9_7: # %cond.load4			; RV64ZVE32F-NEXT: .LBB9_7: # %cond.load4
	; RV64ZVE32F-NEXT: ld a2, 16(a0)			; RV64ZVE32F-NEXT: ld a2, 16(a0)
	; RV64ZVE32F-NEXT: lbu a2, 0(a2)			; RV64ZVE32F-NEXT: lbu a2, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 3, e8, mf4, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vmv.s.x v9, a2			; RV64ZVE32F-NEXT: vmv.v.i v0, 4
	; RV64ZVE32F-NEXT: vslideup.vi v8, v9, 2			; RV64ZVE32F-NEXT: vsetivli zero, 4, e8, mf4, ta, ma
				; RV64ZVE32F-NEXT: vmerge.vxm v8, v8, a2, v0
	; RV64ZVE32F-NEXT: andi a1, a1, 8			; RV64ZVE32F-NEXT: andi a1, a1, 8
	; RV64ZVE32F-NEXT: beqz a1, .LBB9_4			; RV64ZVE32F-NEXT: beqz a1, .LBB9_4
	; RV64ZVE32F-NEXT: .LBB9_8: # %cond.load7			; RV64ZVE32F-NEXT: .LBB9_8: # %cond.load7
	; RV64ZVE32F-NEXT: ld a0, 24(a0)			; RV64ZVE32F-NEXT: ld a0, 24(a0)
	; RV64ZVE32F-NEXT: lbu a0, 0(a0)			; RV64ZVE32F-NEXT: lbu a0, 0(a0)
				; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
				; RV64ZVE32F-NEXT: vmv.v.i v0, 8
	; RV64ZVE32F-NEXT: vsetivli zero, 4, e8, mf4, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 4, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vmv.s.x v9, a0			; RV64ZVE32F-NEXT: vmerge.vxm v8, v8, a0, v0
	; RV64ZVE32F-NEXT: vslideup.vi v8, v9, 3
	; RV64ZVE32F-NEXT: ret			; RV64ZVE32F-NEXT: ret
	%mhead = insertelement <4 x i1> poison, i1 1, i32 0			%mhead = insertelement <4 x i1> poison, i1 1, i32 0
	%mtrue = shufflevector <4 x i1> %mhead, <4 x i1> poison, <4 x i32> zeroinitializer			%mtrue = shufflevector <4 x i1> %mhead, <4 x i1> poison, <4 x i32> zeroinitializer
	%v = call <4 x i8> @llvm.masked.gather.v4i8.v4p0(<4 x ptr> %ptrs, i32 1, <4 x i1> %mtrue, <4 x i8> %passthru)			%v = call <4 x i8> @llvm.masked.gather.v4i8.v4p0(<4 x ptr> %ptrs, i32 1, <4 x i1> %mtrue, <4 x i8> %passthru)
	ret <4 x i8> %v			ret <4 x i8> %v
	}			}

	define <4 x i8> @mgather_falsemask_v4i8(<4 x ptr> %ptrs, <4 x i8> %passthru) {			define <4 x i8> @mgather_falsemask_v4i8(<4 x ptr> %ptrs, <4 x i8> %passthru) {
	▲ Show 20 Lines • Show All 65 Lines • ▼ Show 20 Lines
	; RV64ZVE32F-NEXT: lbu a2, 0(a2)			; RV64ZVE32F-NEXT: lbu a2, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 8, e8, mf2, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 8, e8, mf2, tu, ma
	; RV64ZVE32F-NEXT: vmv.s.x v8, a2			; RV64ZVE32F-NEXT: vmv.s.x v8, a2
	; RV64ZVE32F-NEXT: andi a2, a1, 2			; RV64ZVE32F-NEXT: andi a2, a1, 2
	; RV64ZVE32F-NEXT: beqz a2, .LBB11_2			; RV64ZVE32F-NEXT: beqz a2, .LBB11_2
	; RV64ZVE32F-NEXT: .LBB11_10: # %cond.load1			; RV64ZVE32F-NEXT: .LBB11_10: # %cond.load1
	; RV64ZVE32F-NEXT: ld a2, 8(a0)			; RV64ZVE32F-NEXT: ld a2, 8(a0)
	; RV64ZVE32F-NEXT: lbu a2, 0(a2)			; RV64ZVE32F-NEXT: lbu a2, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e8, mf2, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vmv.s.x v9, a2			; RV64ZVE32F-NEXT: vmv.v.i v0, 2
	; RV64ZVE32F-NEXT: vslideup.vi v8, v9, 1			; RV64ZVE32F-NEXT: vsetivli zero, 8, e8, mf2, ta, ma
				; RV64ZVE32F-NEXT: vmerge.vxm v8, v8, a2, v0
	; RV64ZVE32F-NEXT: andi a2, a1, 4			; RV64ZVE32F-NEXT: andi a2, a1, 4
	; RV64ZVE32F-NEXT: beqz a2, .LBB11_3			; RV64ZVE32F-NEXT: beqz a2, .LBB11_3
	; RV64ZVE32F-NEXT: .LBB11_11: # %cond.load4			; RV64ZVE32F-NEXT: .LBB11_11: # %cond.load4
	; RV64ZVE32F-NEXT: ld a2, 16(a0)			; RV64ZVE32F-NEXT: ld a2, 16(a0)
	; RV64ZVE32F-NEXT: lbu a2, 0(a2)			; RV64ZVE32F-NEXT: lbu a2, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 3, e8, mf2, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vmv.s.x v9, a2			; RV64ZVE32F-NEXT: vmv.v.i v0, 4
	; RV64ZVE32F-NEXT: vslideup.vi v8, v9, 2			; RV64ZVE32F-NEXT: vsetivli zero, 8, e8, mf2, ta, ma
				; RV64ZVE32F-NEXT: vmerge.vxm v8, v8, a2, v0
	; RV64ZVE32F-NEXT: andi a2, a1, 8			; RV64ZVE32F-NEXT: andi a2, a1, 8
	; RV64ZVE32F-NEXT: beqz a2, .LBB11_4			; RV64ZVE32F-NEXT: beqz a2, .LBB11_4
	; RV64ZVE32F-NEXT: .LBB11_12: # %cond.load7			; RV64ZVE32F-NEXT: .LBB11_12: # %cond.load7
	; RV64ZVE32F-NEXT: ld a2, 24(a0)			; RV64ZVE32F-NEXT: ld a2, 24(a0)
	; RV64ZVE32F-NEXT: lbu a2, 0(a2)			; RV64ZVE32F-NEXT: lbu a2, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 4, e8, mf2, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vmv.s.x v9, a2			; RV64ZVE32F-NEXT: vmv.v.i v0, 8
	; RV64ZVE32F-NEXT: vslideup.vi v8, v9, 3			; RV64ZVE32F-NEXT: vsetivli zero, 8, e8, mf2, ta, ma
				; RV64ZVE32F-NEXT: vmerge.vxm v8, v8, a2, v0
	; RV64ZVE32F-NEXT: andi a2, a1, 16			; RV64ZVE32F-NEXT: andi a2, a1, 16
	; RV64ZVE32F-NEXT: beqz a2, .LBB11_5			; RV64ZVE32F-NEXT: beqz a2, .LBB11_5
	; RV64ZVE32F-NEXT: .LBB11_13: # %cond.load10			; RV64ZVE32F-NEXT: .LBB11_13: # %cond.load10
	; RV64ZVE32F-NEXT: ld a2, 32(a0)			; RV64ZVE32F-NEXT: ld a2, 32(a0)
	; RV64ZVE32F-NEXT: lbu a2, 0(a2)			; RV64ZVE32F-NEXT: lbu a2, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 5, e8, mf2, tu, ma			; RV64ZVE32F-NEXT: li a3, 16
	; RV64ZVE32F-NEXT: vmv.s.x v9, a2			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vslideup.vi v8, v9, 4			; RV64ZVE32F-NEXT: vmv.v.x v0, a3
				; RV64ZVE32F-NEXT: vsetivli zero, 8, e8, mf2, ta, ma
				; RV64ZVE32F-NEXT: vmerge.vxm v8, v8, a2, v0
	; RV64ZVE32F-NEXT: andi a2, a1, 32			; RV64ZVE32F-NEXT: andi a2, a1, 32
	; RV64ZVE32F-NEXT: beqz a2, .LBB11_6			; RV64ZVE32F-NEXT: beqz a2, .LBB11_6
	; RV64ZVE32F-NEXT: .LBB11_14: # %cond.load13			; RV64ZVE32F-NEXT: .LBB11_14: # %cond.load13
	; RV64ZVE32F-NEXT: ld a2, 40(a0)			; RV64ZVE32F-NEXT: ld a2, 40(a0)
	; RV64ZVE32F-NEXT: lbu a2, 0(a2)			; RV64ZVE32F-NEXT: lbu a2, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 6, e8, mf2, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 6, e8, mf2, tu, ma
	; RV64ZVE32F-NEXT: vmv.s.x v9, a2			; RV64ZVE32F-NEXT: vmv.s.x v9, a2
	; RV64ZVE32F-NEXT: vslideup.vi v8, v9, 5			; RV64ZVE32F-NEXT: vslideup.vi v8, v9, 5
	▲ Show 20 Lines • Show All 53 Lines • ▼ Show 20 Lines
	; RV64ZVE32F-NEXT: andi a2, a1, 2			; RV64ZVE32F-NEXT: andi a2, a1, 2
	; RV64ZVE32F-NEXT: beqz a2, .LBB12_4			; RV64ZVE32F-NEXT: beqz a2, .LBB12_4
	; RV64ZVE32F-NEXT: # %bb.3: # %cond.load1			; RV64ZVE32F-NEXT: # %bb.3: # %cond.load1
	; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vslidedown.vi v10, v8, 1			; RV64ZVE32F-NEXT: vslidedown.vi v10, v8, 1
	; RV64ZVE32F-NEXT: vmv.x.s a2, v10			; RV64ZVE32F-NEXT: vmv.x.s a2, v10
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: lbu a2, 0(a2)			; RV64ZVE32F-NEXT: lbu a2, 0(a2)
	; RV64ZVE32F-NEXT: vmv.s.x v10, a2			; RV64ZVE32F-NEXT: vmv.v.i v0, 2
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e8, mf2, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 8, e8, mf2, ta, ma
	; RV64ZVE32F-NEXT: vslideup.vi v9, v10, 1			; RV64ZVE32F-NEXT: vmerge.vxm v9, v9, a2, v0
	; RV64ZVE32F-NEXT: .LBB12_4: # %else2			; RV64ZVE32F-NEXT: .LBB12_4: # %else2
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e8, mf4, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 2, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: andi a2, a1, 4			; RV64ZVE32F-NEXT: andi a2, a1, 4
	; RV64ZVE32F-NEXT: vslidedown.vi v10, v8, 2			; RV64ZVE32F-NEXT: vslidedown.vi v10, v8, 2
	; RV64ZVE32F-NEXT: beqz a2, .LBB12_6			; RV64ZVE32F-NEXT: beqz a2, .LBB12_6
	; RV64ZVE32F-NEXT: # %bb.5: # %cond.load4			; RV64ZVE32F-NEXT: # %bb.5: # %cond.load4
	; RV64ZVE32F-NEXT: vmv.x.s a2, v10			; RV64ZVE32F-NEXT: vmv.x.s a2, v10
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: lbu a2, 0(a2)			; RV64ZVE32F-NEXT: lbu a2, 0(a2)
	; RV64ZVE32F-NEXT: vmv.s.x v11, a2			; RV64ZVE32F-NEXT: vmv.v.i v0, 4
	; RV64ZVE32F-NEXT: vsetivli zero, 3, e8, mf2, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 8, e8, mf2, ta, ma
	; RV64ZVE32F-NEXT: vslideup.vi v9, v11, 2			; RV64ZVE32F-NEXT: vmerge.vxm v9, v9, a2, v0
	; RV64ZVE32F-NEXT: .LBB12_6: # %else5			; RV64ZVE32F-NEXT: .LBB12_6: # %else5
	; RV64ZVE32F-NEXT: vsetivli zero, 4, e8, mf2, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 4, e8, mf2, ta, ma
	; RV64ZVE32F-NEXT: andi a2, a1, 8			; RV64ZVE32F-NEXT: andi a2, a1, 8
	; RV64ZVE32F-NEXT: vslidedown.vi v8, v8, 4			; RV64ZVE32F-NEXT: vslidedown.vi v8, v8, 4
	; RV64ZVE32F-NEXT: bnez a2, .LBB12_13			; RV64ZVE32F-NEXT: bnez a2, .LBB12_13
	; RV64ZVE32F-NEXT: # %bb.7: # %else8			; RV64ZVE32F-NEXT: # %bb.7: # %else8
	; RV64ZVE32F-NEXT: andi a2, a1, 16			; RV64ZVE32F-NEXT: andi a2, a1, 16
	; RV64ZVE32F-NEXT: bnez a2, .LBB12_14			; RV64ZVE32F-NEXT: bnez a2, .LBB12_14
	Show All 21 Lines
	; RV64ZVE32F-NEXT: vmv1r.v v8, v9			; RV64ZVE32F-NEXT: vmv1r.v v8, v9
	; RV64ZVE32F-NEXT: ret			; RV64ZVE32F-NEXT: ret
	; RV64ZVE32F-NEXT: .LBB12_13: # %cond.load7			; RV64ZVE32F-NEXT: .LBB12_13: # %cond.load7
	; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vslidedown.vi v10, v10, 1			; RV64ZVE32F-NEXT: vslidedown.vi v10, v10, 1
	; RV64ZVE32F-NEXT: vmv.x.s a2, v10			; RV64ZVE32F-NEXT: vmv.x.s a2, v10
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: lbu a2, 0(a2)			; RV64ZVE32F-NEXT: lbu a2, 0(a2)
	; RV64ZVE32F-NEXT: vmv.s.x v10, a2			; RV64ZVE32F-NEXT: vmv.v.i v0, 8
	; RV64ZVE32F-NEXT: vsetivli zero, 4, e8, mf2, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 8, e8, mf2, ta, ma
	; RV64ZVE32F-NEXT: vslideup.vi v9, v10, 3			; RV64ZVE32F-NEXT: vmerge.vxm v9, v9, a2, v0
	; RV64ZVE32F-NEXT: andi a2, a1, 16			; RV64ZVE32F-NEXT: andi a2, a1, 16
	; RV64ZVE32F-NEXT: beqz a2, .LBB12_8			; RV64ZVE32F-NEXT: beqz a2, .LBB12_8
	; RV64ZVE32F-NEXT: .LBB12_14: # %cond.load10			; RV64ZVE32F-NEXT: .LBB12_14: # %cond.load10
	; RV64ZVE32F-NEXT: vsetivli zero, 0, e8, mf4, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vmv.x.s a2, v8			; RV64ZVE32F-NEXT: vmv.x.s a2, v8
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: lbu a2, 0(a2)			; RV64ZVE32F-NEXT: lbu a2, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 5, e8, mf2, tu, ma			; RV64ZVE32F-NEXT: li a3, 16
	; RV64ZVE32F-NEXT: vmv.s.x v10, a2			; RV64ZVE32F-NEXT: vmv.v.x v0, a3
	; RV64ZVE32F-NEXT: vslideup.vi v9, v10, 4			; RV64ZVE32F-NEXT: vsetivli zero, 8, e8, mf2, ta, ma
				; RV64ZVE32F-NEXT: vmerge.vxm v9, v9, a2, v0
	; RV64ZVE32F-NEXT: andi a2, a1, 32			; RV64ZVE32F-NEXT: andi a2, a1, 32
	; RV64ZVE32F-NEXT: bnez a2, .LBB12_9			; RV64ZVE32F-NEXT: bnez a2, .LBB12_9
	; RV64ZVE32F-NEXT: j .LBB12_10			; RV64ZVE32F-NEXT: j .LBB12_10
	; RV64ZVE32F-NEXT: .LBB12_15: # %cond.load16			; RV64ZVE32F-NEXT: .LBB12_15: # %cond.load16
	; RV64ZVE32F-NEXT: vmv.x.s a2, v8			; RV64ZVE32F-NEXT: vmv.x.s a2, v8
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: lbu a2, 0(a2)			; RV64ZVE32F-NEXT: lbu a2, 0(a2)
	; RV64ZVE32F-NEXT: vmv.s.x v10, a2			; RV64ZVE32F-NEXT: vmv.s.x v10, a2
	▲ Show 20 Lines • Show All 93 Lines • ▼ Show 20 Lines
	; RV64ZVE32F-NEXT: .LBB14_3: # %cond.load			; RV64ZVE32F-NEXT: .LBB14_3: # %cond.load
	; RV64ZVE32F-NEXT: lh a0, 0(a0)			; RV64ZVE32F-NEXT: lh a0, 0(a0)
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e16, mf2, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 2, e16, mf2, tu, ma
	; RV64ZVE32F-NEXT: vmv.s.x v8, a0			; RV64ZVE32F-NEXT: vmv.s.x v8, a0
	; RV64ZVE32F-NEXT: andi a2, a2, 2			; RV64ZVE32F-NEXT: andi a2, a2, 2
	; RV64ZVE32F-NEXT: beqz a2, .LBB14_2			; RV64ZVE32F-NEXT: beqz a2, .LBB14_2
	; RV64ZVE32F-NEXT: .LBB14_4: # %cond.load1			; RV64ZVE32F-NEXT: .LBB14_4: # %cond.load1
	; RV64ZVE32F-NEXT: lh a0, 0(a1)			; RV64ZVE32F-NEXT: lh a0, 0(a1)
				; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
				; RV64ZVE32F-NEXT: vmv.v.i v0, 2
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e16, mf2, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 2, e16, mf2, ta, ma
	; RV64ZVE32F-NEXT: vmv.s.x v9, a0			; RV64ZVE32F-NEXT: vmerge.vxm v8, v8, a0, v0
	; RV64ZVE32F-NEXT: vslideup.vi v8, v9, 1
	; RV64ZVE32F-NEXT: ret			; RV64ZVE32F-NEXT: ret
	%v = call <2 x i16> @llvm.masked.gather.v2i16.v2p0(<2 x ptr> %ptrs, i32 2, <2 x i1> %m, <2 x i16> %passthru)			%v = call <2 x i16> @llvm.masked.gather.v2i16.v2p0(<2 x ptr> %ptrs, i32 2, <2 x i1> %m, <2 x i16> %passthru)
	ret <2 x i16> %v			ret <2 x i16> %v
	}			}

	define <2 x i32> @mgather_v2i16_sextload_v2i32(<2 x ptr> %ptrs, <2 x i1> %m, <2 x i16> %passthru) {			define <2 x i32> @mgather_v2i16_sextload_v2i32(<2 x ptr> %ptrs, <2 x i1> %m, <2 x i16> %passthru) {
	; RV32V-LABEL: mgather_v2i16_sextload_v2i32:			; RV32V-LABEL: mgather_v2i16_sextload_v2i32:
	; RV32V: # %bb.0:			; RV32V: # %bb.0:
	Show All 29 Lines
	; RV64ZVE32F-NEXT: lh a0, 0(a0)			; RV64ZVE32F-NEXT: lh a0, 0(a0)
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e16, mf2, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 2, e16, mf2, tu, ma
	; RV64ZVE32F-NEXT: vmv.s.x v8, a0			; RV64ZVE32F-NEXT: vmv.s.x v8, a0
	; RV64ZVE32F-NEXT: .LBB15_2: # %else			; RV64ZVE32F-NEXT: .LBB15_2: # %else
	; RV64ZVE32F-NEXT: andi a2, a2, 2			; RV64ZVE32F-NEXT: andi a2, a2, 2
	; RV64ZVE32F-NEXT: beqz a2, .LBB15_4			; RV64ZVE32F-NEXT: beqz a2, .LBB15_4
	; RV64ZVE32F-NEXT: # %bb.3: # %cond.load1			; RV64ZVE32F-NEXT: # %bb.3: # %cond.load1
	; RV64ZVE32F-NEXT: lh a0, 0(a1)			; RV64ZVE32F-NEXT: lh a0, 0(a1)
				; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
				; RV64ZVE32F-NEXT: vmv.v.i v0, 2
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e16, mf2, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 2, e16, mf2, ta, ma
	; RV64ZVE32F-NEXT: vmv.s.x v9, a0			; RV64ZVE32F-NEXT: vmerge.vxm v8, v8, a0, v0
	; RV64ZVE32F-NEXT: vslideup.vi v8, v9, 1
	; RV64ZVE32F-NEXT: .LBB15_4: # %else2			; RV64ZVE32F-NEXT: .LBB15_4: # %else2
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e32, m1, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 2, e32, m1, ta, ma
	; RV64ZVE32F-NEXT: vsext.vf2 v9, v8			; RV64ZVE32F-NEXT: vsext.vf2 v9, v8
	; RV64ZVE32F-NEXT: vmv.v.v v8, v9			; RV64ZVE32F-NEXT: vmv.v.v v8, v9
	; RV64ZVE32F-NEXT: ret			; RV64ZVE32F-NEXT: ret
	%v = call <2 x i16> @llvm.masked.gather.v2i16.v2p0(<2 x ptr> %ptrs, i32 2, <2 x i1> %m, <2 x i16> %passthru)			%v = call <2 x i16> @llvm.masked.gather.v2i16.v2p0(<2 x ptr> %ptrs, i32 2, <2 x i1> %m, <2 x i16> %passthru)
	%ev = sext <2 x i16> %v to <2 x i32>			%ev = sext <2 x i16> %v to <2 x i32>
	ret <2 x i32> %ev			ret <2 x i32> %ev
	Show All 34 Lines
	; RV64ZVE32F-NEXT: lh a0, 0(a0)			; RV64ZVE32F-NEXT: lh a0, 0(a0)
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e16, mf2, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 2, e16, mf2, tu, ma
	; RV64ZVE32F-NEXT: vmv.s.x v8, a0			; RV64ZVE32F-NEXT: vmv.s.x v8, a0
	; RV64ZVE32F-NEXT: .LBB16_2: # %else			; RV64ZVE32F-NEXT: .LBB16_2: # %else
	; RV64ZVE32F-NEXT: andi a2, a2, 2			; RV64ZVE32F-NEXT: andi a2, a2, 2
	; RV64ZVE32F-NEXT: beqz a2, .LBB16_4			; RV64ZVE32F-NEXT: beqz a2, .LBB16_4
	; RV64ZVE32F-NEXT: # %bb.3: # %cond.load1			; RV64ZVE32F-NEXT: # %bb.3: # %cond.load1
	; RV64ZVE32F-NEXT: lh a0, 0(a1)			; RV64ZVE32F-NEXT: lh a0, 0(a1)
				; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
				; RV64ZVE32F-NEXT: vmv.v.i v0, 2
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e16, mf2, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 2, e16, mf2, ta, ma
	; RV64ZVE32F-NEXT: vmv.s.x v9, a0			; RV64ZVE32F-NEXT: vmerge.vxm v8, v8, a0, v0
	; RV64ZVE32F-NEXT: vslideup.vi v8, v9, 1
	; RV64ZVE32F-NEXT: .LBB16_4: # %else2			; RV64ZVE32F-NEXT: .LBB16_4: # %else2
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e32, m1, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 2, e32, m1, ta, ma
	; RV64ZVE32F-NEXT: vzext.vf2 v9, v8			; RV64ZVE32F-NEXT: vzext.vf2 v9, v8
	; RV64ZVE32F-NEXT: vmv.v.v v8, v9			; RV64ZVE32F-NEXT: vmv.v.v v8, v9
	; RV64ZVE32F-NEXT: ret			; RV64ZVE32F-NEXT: ret
	%v = call <2 x i16> @llvm.masked.gather.v2i16.v2p0(<2 x ptr> %ptrs, i32 2, <2 x i1> %m, <2 x i16> %passthru)			%v = call <2 x i16> @llvm.masked.gather.v2i16.v2p0(<2 x ptr> %ptrs, i32 2, <2 x i1> %m, <2 x i16> %passthru)
	%ev = zext <2 x i16> %v to <2 x i32>			%ev = zext <2 x i16> %v to <2 x i32>
	ret <2 x i32> %ev			ret <2 x i32> %ev
	▲ Show 20 Lines • Show All 41 Lines • ▼ Show 20 Lines
	; RV64ZVE32F-NEXT: lh a0, 0(a0)			; RV64ZVE32F-NEXT: lh a0, 0(a0)
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e16, mf2, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 2, e16, mf2, tu, ma
	; RV64ZVE32F-NEXT: vmv.s.x v8, a0			; RV64ZVE32F-NEXT: vmv.s.x v8, a0
	; RV64ZVE32F-NEXT: .LBB17_2: # %else			; RV64ZVE32F-NEXT: .LBB17_2: # %else
	; RV64ZVE32F-NEXT: andi a2, a2, 2			; RV64ZVE32F-NEXT: andi a2, a2, 2
	; RV64ZVE32F-NEXT: beqz a2, .LBB17_4			; RV64ZVE32F-NEXT: beqz a2, .LBB17_4
	; RV64ZVE32F-NEXT: # %bb.3: # %cond.load1			; RV64ZVE32F-NEXT: # %bb.3: # %cond.load1
	; RV64ZVE32F-NEXT: lh a0, 0(a1)			; RV64ZVE32F-NEXT: lh a0, 0(a1)
				; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
				; RV64ZVE32F-NEXT: vmv.v.i v0, 2
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e16, mf2, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 2, e16, mf2, ta, ma
	; RV64ZVE32F-NEXT: vmv.s.x v9, a0			; RV64ZVE32F-NEXT: vmerge.vxm v8, v8, a0, v0
	; RV64ZVE32F-NEXT: vslideup.vi v8, v9, 1
	; RV64ZVE32F-NEXT: .LBB17_4: # %else2			; RV64ZVE32F-NEXT: .LBB17_4: # %else2
	; RV64ZVE32F-NEXT: vsetivli zero, 1, e16, mf2, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e16, mf2, ta, ma
	; RV64ZVE32F-NEXT: vslidedown.vi v9, v8, 1			; RV64ZVE32F-NEXT: vslidedown.vi v9, v8, 1
	; RV64ZVE32F-NEXT: vmv.x.s a1, v9			; RV64ZVE32F-NEXT: vmv.x.s a1, v9
	; RV64ZVE32F-NEXT: vmv.x.s a0, v8			; RV64ZVE32F-NEXT: vmv.x.s a0, v8
	; RV64ZVE32F-NEXT: ret			; RV64ZVE32F-NEXT: ret
	%v = call <2 x i16> @llvm.masked.gather.v2i16.v2p0(<2 x ptr> %ptrs, i32 2, <2 x i1> %m, <2 x i16> %passthru)			%v = call <2 x i16> @llvm.masked.gather.v2i16.v2p0(<2 x ptr> %ptrs, i32 2, <2 x i1> %m, <2 x i16> %passthru)
	%ev = sext <2 x i16> %v to <2 x i64>			%ev = sext <2 x i16> %v to <2 x i64>
	▲ Show 20 Lines • Show All 44 Lines • ▼ Show 20 Lines
	; RV64ZVE32F-NEXT: lh a0, 0(a0)			; RV64ZVE32F-NEXT: lh a0, 0(a0)
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e16, mf2, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 2, e16, mf2, tu, ma
	; RV64ZVE32F-NEXT: vmv.s.x v8, a0			; RV64ZVE32F-NEXT: vmv.s.x v8, a0
	; RV64ZVE32F-NEXT: .LBB18_2: # %else			; RV64ZVE32F-NEXT: .LBB18_2: # %else
	; RV64ZVE32F-NEXT: andi a2, a2, 2			; RV64ZVE32F-NEXT: andi a2, a2, 2
	; RV64ZVE32F-NEXT: beqz a2, .LBB18_4			; RV64ZVE32F-NEXT: beqz a2, .LBB18_4
	; RV64ZVE32F-NEXT: # %bb.3: # %cond.load1			; RV64ZVE32F-NEXT: # %bb.3: # %cond.load1
	; RV64ZVE32F-NEXT: lh a0, 0(a1)			; RV64ZVE32F-NEXT: lh a0, 0(a1)
				; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
				; RV64ZVE32F-NEXT: vmv.v.i v0, 2
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e16, mf2, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 2, e16, mf2, ta, ma
	; RV64ZVE32F-NEXT: vmv.s.x v9, a0			; RV64ZVE32F-NEXT: vmerge.vxm v8, v8, a0, v0
	; RV64ZVE32F-NEXT: vslideup.vi v8, v9, 1
	; RV64ZVE32F-NEXT: .LBB18_4: # %else2			; RV64ZVE32F-NEXT: .LBB18_4: # %else2
	; RV64ZVE32F-NEXT: vsetivli zero, 1, e16, mf2, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e16, mf2, ta, ma
	; RV64ZVE32F-NEXT: vmv.x.s a0, v8			; RV64ZVE32F-NEXT: vmv.x.s a0, v8
	; RV64ZVE32F-NEXT: lui a1, 16			; RV64ZVE32F-NEXT: lui a1, 16
	; RV64ZVE32F-NEXT: addiw a1, a1, -1			; RV64ZVE32F-NEXT: addiw a1, a1, -1
	; RV64ZVE32F-NEXT: and a0, a0, a1			; RV64ZVE32F-NEXT: and a0, a0, a1
	; RV64ZVE32F-NEXT: vslidedown.vi v8, v8, 1			; RV64ZVE32F-NEXT: vslidedown.vi v8, v8, 1
	; RV64ZVE32F-NEXT: vmv.x.s a2, v8			; RV64ZVE32F-NEXT: vmv.x.s a2, v8
	▲ Show 20 Lines • Show All 43 Lines • ▼ Show 20 Lines
	; RV64ZVE32F-NEXT: lh a2, 0(a2)			; RV64ZVE32F-NEXT: lh a2, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 4, e16, mf2, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 4, e16, mf2, tu, ma
	; RV64ZVE32F-NEXT: vmv.s.x v8, a2			; RV64ZVE32F-NEXT: vmv.s.x v8, a2
	; RV64ZVE32F-NEXT: andi a2, a1, 2			; RV64ZVE32F-NEXT: andi a2, a1, 2
	; RV64ZVE32F-NEXT: beqz a2, .LBB19_2			; RV64ZVE32F-NEXT: beqz a2, .LBB19_2
	; RV64ZVE32F-NEXT: .LBB19_6: # %cond.load1			; RV64ZVE32F-NEXT: .LBB19_6: # %cond.load1
	; RV64ZVE32F-NEXT: ld a2, 8(a0)			; RV64ZVE32F-NEXT: ld a2, 8(a0)
	; RV64ZVE32F-NEXT: lh a2, 0(a2)			; RV64ZVE32F-NEXT: lh a2, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e16, mf2, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vmv.s.x v9, a2			; RV64ZVE32F-NEXT: vmv.v.i v0, 2
	; RV64ZVE32F-NEXT: vslideup.vi v8, v9, 1			; RV64ZVE32F-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
				; RV64ZVE32F-NEXT: vmerge.vxm v8, v8, a2, v0
	; RV64ZVE32F-NEXT: andi a2, a1, 4			; RV64ZVE32F-NEXT: andi a2, a1, 4
	; RV64ZVE32F-NEXT: beqz a2, .LBB19_3			; RV64ZVE32F-NEXT: beqz a2, .LBB19_3
	; RV64ZVE32F-NEXT: .LBB19_7: # %cond.load4			; RV64ZVE32F-NEXT: .LBB19_7: # %cond.load4
	; RV64ZVE32F-NEXT: ld a2, 16(a0)			; RV64ZVE32F-NEXT: ld a2, 16(a0)
	; RV64ZVE32F-NEXT: lh a2, 0(a2)			; RV64ZVE32F-NEXT: lh a2, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 3, e16, mf2, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vmv.s.x v9, a2			; RV64ZVE32F-NEXT: vmv.v.i v0, 4
	; RV64ZVE32F-NEXT: vslideup.vi v8, v9, 2			; RV64ZVE32F-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
				; RV64ZVE32F-NEXT: vmerge.vxm v8, v8, a2, v0
	; RV64ZVE32F-NEXT: andi a1, a1, 8			; RV64ZVE32F-NEXT: andi a1, a1, 8
	; RV64ZVE32F-NEXT: beqz a1, .LBB19_4			; RV64ZVE32F-NEXT: beqz a1, .LBB19_4
	; RV64ZVE32F-NEXT: .LBB19_8: # %cond.load7			; RV64ZVE32F-NEXT: .LBB19_8: # %cond.load7
	; RV64ZVE32F-NEXT: ld a0, 24(a0)			; RV64ZVE32F-NEXT: ld a0, 24(a0)
	; RV64ZVE32F-NEXT: lh a0, 0(a0)			; RV64ZVE32F-NEXT: lh a0, 0(a0)
				; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
				; RV64ZVE32F-NEXT: vmv.v.i v0, 8
	; RV64ZVE32F-NEXT: vsetivli zero, 4, e16, mf2, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
	; RV64ZVE32F-NEXT: vmv.s.x v9, a0			; RV64ZVE32F-NEXT: vmerge.vxm v8, v8, a0, v0
	; RV64ZVE32F-NEXT: vslideup.vi v8, v9, 3
	; RV64ZVE32F-NEXT: ret			; RV64ZVE32F-NEXT: ret
	%v = call <4 x i16> @llvm.masked.gather.v4i16.v4p0(<4 x ptr> %ptrs, i32 2, <4 x i1> %m, <4 x i16> %passthru)			%v = call <4 x i16> @llvm.masked.gather.v4i16.v4p0(<4 x ptr> %ptrs, i32 2, <4 x i1> %m, <4 x i16> %passthru)
	ret <4 x i16> %v			ret <4 x i16> %v
	}			}

	define <4 x i16> @mgather_truemask_v4i16(<4 x ptr> %ptrs, <4 x i16> %passthru) {			define <4 x i16> @mgather_truemask_v4i16(<4 x ptr> %ptrs, <4 x i16> %passthru) {
	; RV32-LABEL: mgather_truemask_v4i16:			; RV32-LABEL: mgather_truemask_v4i16:
	; RV32: # %bb.0:			; RV32: # %bb.0:
	Show All 31 Lines
	; RV64ZVE32F-NEXT: lh a2, 0(a2)			; RV64ZVE32F-NEXT: lh a2, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 4, e16, mf2, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 4, e16, mf2, tu, ma
	; RV64ZVE32F-NEXT: vmv.s.x v8, a2			; RV64ZVE32F-NEXT: vmv.s.x v8, a2
	; RV64ZVE32F-NEXT: andi a2, a1, 2			; RV64ZVE32F-NEXT: andi a2, a1, 2
	; RV64ZVE32F-NEXT: beqz a2, .LBB20_2			; RV64ZVE32F-NEXT: beqz a2, .LBB20_2
	; RV64ZVE32F-NEXT: .LBB20_6: # %cond.load1			; RV64ZVE32F-NEXT: .LBB20_6: # %cond.load1
	; RV64ZVE32F-NEXT: ld a2, 8(a0)			; RV64ZVE32F-NEXT: ld a2, 8(a0)
	; RV64ZVE32F-NEXT: lh a2, 0(a2)			; RV64ZVE32F-NEXT: lh a2, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e16, mf2, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vmv.s.x v9, a2			; RV64ZVE32F-NEXT: vmv.v.i v0, 2
	; RV64ZVE32F-NEXT: vslideup.vi v8, v9, 1			; RV64ZVE32F-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
				; RV64ZVE32F-NEXT: vmerge.vxm v8, v8, a2, v0
	; RV64ZVE32F-NEXT: andi a2, a1, 4			; RV64ZVE32F-NEXT: andi a2, a1, 4
	; RV64ZVE32F-NEXT: beqz a2, .LBB20_3			; RV64ZVE32F-NEXT: beqz a2, .LBB20_3
	; RV64ZVE32F-NEXT: .LBB20_7: # %cond.load4			; RV64ZVE32F-NEXT: .LBB20_7: # %cond.load4
	; RV64ZVE32F-NEXT: ld a2, 16(a0)			; RV64ZVE32F-NEXT: ld a2, 16(a0)
	; RV64ZVE32F-NEXT: lh a2, 0(a2)			; RV64ZVE32F-NEXT: lh a2, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 3, e16, mf2, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vmv.s.x v9, a2			; RV64ZVE32F-NEXT: vmv.v.i v0, 4
	; RV64ZVE32F-NEXT: vslideup.vi v8, v9, 2			; RV64ZVE32F-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
				; RV64ZVE32F-NEXT: vmerge.vxm v8, v8, a2, v0
	; RV64ZVE32F-NEXT: andi a1, a1, 8			; RV64ZVE32F-NEXT: andi a1, a1, 8
	; RV64ZVE32F-NEXT: beqz a1, .LBB20_4			; RV64ZVE32F-NEXT: beqz a1, .LBB20_4
	; RV64ZVE32F-NEXT: .LBB20_8: # %cond.load7			; RV64ZVE32F-NEXT: .LBB20_8: # %cond.load7
	; RV64ZVE32F-NEXT: ld a0, 24(a0)			; RV64ZVE32F-NEXT: ld a0, 24(a0)
	; RV64ZVE32F-NEXT: lh a0, 0(a0)			; RV64ZVE32F-NEXT: lh a0, 0(a0)
				; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
				; RV64ZVE32F-NEXT: vmv.v.i v0, 8
	; RV64ZVE32F-NEXT: vsetivli zero, 4, e16, mf2, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
	; RV64ZVE32F-NEXT: vmv.s.x v9, a0			; RV64ZVE32F-NEXT: vmerge.vxm v8, v8, a0, v0
	; RV64ZVE32F-NEXT: vslideup.vi v8, v9, 3
	; RV64ZVE32F-NEXT: ret			; RV64ZVE32F-NEXT: ret
	%mhead = insertelement <4 x i1> poison, i1 1, i32 0			%mhead = insertelement <4 x i1> poison, i1 1, i32 0
	%mtrue = shufflevector <4 x i1> %mhead, <4 x i1> poison, <4 x i32> zeroinitializer			%mtrue = shufflevector <4 x i1> %mhead, <4 x i1> poison, <4 x i32> zeroinitializer
	%v = call <4 x i16> @llvm.masked.gather.v4i16.v4p0(<4 x ptr> %ptrs, i32 2, <4 x i1> %mtrue, <4 x i16> %passthru)			%v = call <4 x i16> @llvm.masked.gather.v4i16.v4p0(<4 x ptr> %ptrs, i32 2, <4 x i1> %mtrue, <4 x i16> %passthru)
	ret <4 x i16> %v			ret <4 x i16> %v
	}			}

	define <4 x i16> @mgather_falsemask_v4i16(<4 x ptr> %ptrs, <4 x i16> %passthru) {			define <4 x i16> @mgather_falsemask_v4i16(<4 x ptr> %ptrs, <4 x i16> %passthru) {
	▲ Show 20 Lines • Show All 65 Lines • ▼ Show 20 Lines
	; RV64ZVE32F-NEXT: lh a2, 0(a2)			; RV64ZVE32F-NEXT: lh a2, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 8, e16, m1, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 8, e16, m1, tu, ma
	; RV64ZVE32F-NEXT: vmv.s.x v8, a2			; RV64ZVE32F-NEXT: vmv.s.x v8, a2
	; RV64ZVE32F-NEXT: andi a2, a1, 2			; RV64ZVE32F-NEXT: andi a2, a1, 2
	; RV64ZVE32F-NEXT: beqz a2, .LBB22_2			; RV64ZVE32F-NEXT: beqz a2, .LBB22_2
	; RV64ZVE32F-NEXT: .LBB22_10: # %cond.load1			; RV64ZVE32F-NEXT: .LBB22_10: # %cond.load1
	; RV64ZVE32F-NEXT: ld a2, 8(a0)			; RV64ZVE32F-NEXT: ld a2, 8(a0)
	; RV64ZVE32F-NEXT: lh a2, 0(a2)			; RV64ZVE32F-NEXT: lh a2, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e16, m1, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vmv.s.x v9, a2			; RV64ZVE32F-NEXT: vmv.v.i v0, 2
	; RV64ZVE32F-NEXT: vslideup.vi v8, v9, 1			; RV64ZVE32F-NEXT: vsetivli zero, 8, e16, m1, ta, ma
				; RV64ZVE32F-NEXT: vmerge.vxm v8, v8, a2, v0
	; RV64ZVE32F-NEXT: andi a2, a1, 4			; RV64ZVE32F-NEXT: andi a2, a1, 4
	; RV64ZVE32F-NEXT: beqz a2, .LBB22_3			; RV64ZVE32F-NEXT: beqz a2, .LBB22_3
	; RV64ZVE32F-NEXT: .LBB22_11: # %cond.load4			; RV64ZVE32F-NEXT: .LBB22_11: # %cond.load4
	; RV64ZVE32F-NEXT: ld a2, 16(a0)			; RV64ZVE32F-NEXT: ld a2, 16(a0)
	; RV64ZVE32F-NEXT: lh a2, 0(a2)			; RV64ZVE32F-NEXT: lh a2, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 3, e16, m1, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vmv.s.x v9, a2			; RV64ZVE32F-NEXT: vmv.v.i v0, 4
	; RV64ZVE32F-NEXT: vslideup.vi v8, v9, 2			; RV64ZVE32F-NEXT: vsetivli zero, 8, e16, m1, ta, ma
				; RV64ZVE32F-NEXT: vmerge.vxm v8, v8, a2, v0
	; RV64ZVE32F-NEXT: andi a2, a1, 8			; RV64ZVE32F-NEXT: andi a2, a1, 8
	; RV64ZVE32F-NEXT: beqz a2, .LBB22_4			; RV64ZVE32F-NEXT: beqz a2, .LBB22_4
	; RV64ZVE32F-NEXT: .LBB22_12: # %cond.load7			; RV64ZVE32F-NEXT: .LBB22_12: # %cond.load7
	; RV64ZVE32F-NEXT: ld a2, 24(a0)			; RV64ZVE32F-NEXT: ld a2, 24(a0)
	; RV64ZVE32F-NEXT: lh a2, 0(a2)			; RV64ZVE32F-NEXT: lh a2, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 4, e16, m1, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vmv.s.x v9, a2			; RV64ZVE32F-NEXT: vmv.v.i v0, 8
	; RV64ZVE32F-NEXT: vslideup.vi v8, v9, 3			; RV64ZVE32F-NEXT: vsetivli zero, 8, e16, m1, ta, ma
				; RV64ZVE32F-NEXT: vmerge.vxm v8, v8, a2, v0
	; RV64ZVE32F-NEXT: andi a2, a1, 16			; RV64ZVE32F-NEXT: andi a2, a1, 16
	; RV64ZVE32F-NEXT: beqz a2, .LBB22_5			; RV64ZVE32F-NEXT: beqz a2, .LBB22_5
	; RV64ZVE32F-NEXT: .LBB22_13: # %cond.load10			; RV64ZVE32F-NEXT: .LBB22_13: # %cond.load10
	; RV64ZVE32F-NEXT: ld a2, 32(a0)			; RV64ZVE32F-NEXT: ld a2, 32(a0)
	; RV64ZVE32F-NEXT: lh a2, 0(a2)			; RV64ZVE32F-NEXT: lh a2, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 5, e16, m1, tu, ma			; RV64ZVE32F-NEXT: li a3, 16
	; RV64ZVE32F-NEXT: vmv.s.x v9, a2			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vslideup.vi v8, v9, 4			; RV64ZVE32F-NEXT: vmv.v.x v0, a3
				; RV64ZVE32F-NEXT: vsetivli zero, 8, e16, m1, ta, ma
				; RV64ZVE32F-NEXT: vmerge.vxm v8, v8, a2, v0
	; RV64ZVE32F-NEXT: andi a2, a1, 32			; RV64ZVE32F-NEXT: andi a2, a1, 32
	; RV64ZVE32F-NEXT: beqz a2, .LBB22_6			; RV64ZVE32F-NEXT: beqz a2, .LBB22_6
	; RV64ZVE32F-NEXT: .LBB22_14: # %cond.load13			; RV64ZVE32F-NEXT: .LBB22_14: # %cond.load13
	; RV64ZVE32F-NEXT: ld a2, 40(a0)			; RV64ZVE32F-NEXT: ld a2, 40(a0)
	; RV64ZVE32F-NEXT: lh a2, 0(a2)			; RV64ZVE32F-NEXT: lh a2, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 6, e16, m1, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 6, e16, m1, tu, ma
	; RV64ZVE32F-NEXT: vmv.s.x v9, a2			; RV64ZVE32F-NEXT: vmv.s.x v9, a2
	; RV64ZVE32F-NEXT: vslideup.vi v8, v9, 5			; RV64ZVE32F-NEXT: vslideup.vi v8, v9, 5
	▲ Show 20 Lines • Show All 57 Lines • ▼ Show 20 Lines
	; RV64ZVE32F-NEXT: beqz a2, .LBB23_4			; RV64ZVE32F-NEXT: beqz a2, .LBB23_4
	; RV64ZVE32F-NEXT: # %bb.3: # %cond.load1			; RV64ZVE32F-NEXT: # %bb.3: # %cond.load1
	; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vslidedown.vi v10, v8, 1			; RV64ZVE32F-NEXT: vslidedown.vi v10, v8, 1
	; RV64ZVE32F-NEXT: vmv.x.s a2, v10			; RV64ZVE32F-NEXT: vmv.x.s a2, v10
	; RV64ZVE32F-NEXT: slli a2, a2, 1			; RV64ZVE32F-NEXT: slli a2, a2, 1
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: lh a2, 0(a2)			; RV64ZVE32F-NEXT: lh a2, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e16, m1, tu, ma			; RV64ZVE32F-NEXT: vmv.v.i v0, 2
	; RV64ZVE32F-NEXT: vmv.s.x v10, a2			; RV64ZVE32F-NEXT: vsetivli zero, 8, e16, m1, ta, ma
	; RV64ZVE32F-NEXT: vslideup.vi v9, v10, 1			; RV64ZVE32F-NEXT: vmerge.vxm v9, v9, a2, v0
	; RV64ZVE32F-NEXT: .LBB23_4: # %else2			; RV64ZVE32F-NEXT: .LBB23_4: # %else2
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e8, mf4, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 2, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: andi a2, a1, 4			; RV64ZVE32F-NEXT: andi a2, a1, 4
	; RV64ZVE32F-NEXT: vslidedown.vi v10, v8, 2			; RV64ZVE32F-NEXT: vslidedown.vi v10, v8, 2
	; RV64ZVE32F-NEXT: beqz a2, .LBB23_6			; RV64ZVE32F-NEXT: beqz a2, .LBB23_6
	; RV64ZVE32F-NEXT: # %bb.5: # %cond.load4			; RV64ZVE32F-NEXT: # %bb.5: # %cond.load4
	; RV64ZVE32F-NEXT: vmv.x.s a2, v10			; RV64ZVE32F-NEXT: vmv.x.s a2, v10
	; RV64ZVE32F-NEXT: slli a2, a2, 1			; RV64ZVE32F-NEXT: slli a2, a2, 1
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: lh a2, 0(a2)			; RV64ZVE32F-NEXT: lh a2, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 3, e16, m1, tu, ma			; RV64ZVE32F-NEXT: vmv.v.i v0, 4
	; RV64ZVE32F-NEXT: vmv.s.x v11, a2			; RV64ZVE32F-NEXT: vsetivli zero, 8, e16, m1, ta, ma
	; RV64ZVE32F-NEXT: vslideup.vi v9, v11, 2			; RV64ZVE32F-NEXT: vmerge.vxm v9, v9, a2, v0
	; RV64ZVE32F-NEXT: .LBB23_6: # %else5			; RV64ZVE32F-NEXT: .LBB23_6: # %else5
	; RV64ZVE32F-NEXT: vsetivli zero, 4, e8, mf2, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 4, e8, mf2, ta, ma
	; RV64ZVE32F-NEXT: andi a2, a1, 8			; RV64ZVE32F-NEXT: andi a2, a1, 8
	; RV64ZVE32F-NEXT: vslidedown.vi v8, v8, 4			; RV64ZVE32F-NEXT: vslidedown.vi v8, v8, 4
	; RV64ZVE32F-NEXT: bnez a2, .LBB23_13			; RV64ZVE32F-NEXT: bnez a2, .LBB23_13
	; RV64ZVE32F-NEXT: # %bb.7: # %else8			; RV64ZVE32F-NEXT: # %bb.7: # %else8
	; RV64ZVE32F-NEXT: andi a2, a1, 16			; RV64ZVE32F-NEXT: andi a2, a1, 16
	; RV64ZVE32F-NEXT: bnez a2, .LBB23_14			; RV64ZVE32F-NEXT: bnez a2, .LBB23_14
	Show All 23 Lines
	; RV64ZVE32F-NEXT: ret			; RV64ZVE32F-NEXT: ret
	; RV64ZVE32F-NEXT: .LBB23_13: # %cond.load7			; RV64ZVE32F-NEXT: .LBB23_13: # %cond.load7
	; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vslidedown.vi v10, v10, 1			; RV64ZVE32F-NEXT: vslidedown.vi v10, v10, 1
	; RV64ZVE32F-NEXT: vmv.x.s a2, v10			; RV64ZVE32F-NEXT: vmv.x.s a2, v10
	; RV64ZVE32F-NEXT: slli a2, a2, 1			; RV64ZVE32F-NEXT: slli a2, a2, 1
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: lh a2, 0(a2)			; RV64ZVE32F-NEXT: lh a2, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 4, e16, m1, tu, ma			; RV64ZVE32F-NEXT: vmv.v.i v0, 8
	; RV64ZVE32F-NEXT: vmv.s.x v10, a2			; RV64ZVE32F-NEXT: vsetivli zero, 8, e16, m1, ta, ma
	; RV64ZVE32F-NEXT: vslideup.vi v9, v10, 3			; RV64ZVE32F-NEXT: vmerge.vxm v9, v9, a2, v0
	; RV64ZVE32F-NEXT: andi a2, a1, 16			; RV64ZVE32F-NEXT: andi a2, a1, 16
	; RV64ZVE32F-NEXT: beqz a2, .LBB23_8			; RV64ZVE32F-NEXT: beqz a2, .LBB23_8
	; RV64ZVE32F-NEXT: .LBB23_14: # %cond.load10			; RV64ZVE32F-NEXT: .LBB23_14: # %cond.load10
	; RV64ZVE32F-NEXT: vsetivli zero, 0, e8, mf4, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vmv.x.s a2, v8			; RV64ZVE32F-NEXT: vmv.x.s a2, v8
	; RV64ZVE32F-NEXT: slli a2, a2, 1			; RV64ZVE32F-NEXT: slli a2, a2, 1
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: lh a2, 0(a2)			; RV64ZVE32F-NEXT: lh a2, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 5, e16, m1, tu, ma			; RV64ZVE32F-NEXT: li a3, 16
	; RV64ZVE32F-NEXT: vmv.s.x v10, a2			; RV64ZVE32F-NEXT: vmv.v.x v0, a3
	; RV64ZVE32F-NEXT: vslideup.vi v9, v10, 4			; RV64ZVE32F-NEXT: vsetivli zero, 8, e16, m1, ta, ma
				; RV64ZVE32F-NEXT: vmerge.vxm v9, v9, a2, v0
	; RV64ZVE32F-NEXT: andi a2, a1, 32			; RV64ZVE32F-NEXT: andi a2, a1, 32
	; RV64ZVE32F-NEXT: bnez a2, .LBB23_9			; RV64ZVE32F-NEXT: bnez a2, .LBB23_9
	; RV64ZVE32F-NEXT: j .LBB23_10			; RV64ZVE32F-NEXT: j .LBB23_10
	; RV64ZVE32F-NEXT: .LBB23_15: # %cond.load16			; RV64ZVE32F-NEXT: .LBB23_15: # %cond.load16
	; RV64ZVE32F-NEXT: vmv.x.s a2, v8			; RV64ZVE32F-NEXT: vmv.x.s a2, v8
	; RV64ZVE32F-NEXT: slli a2, a2, 1			; RV64ZVE32F-NEXT: slli a2, a2, 1
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: lh a2, 0(a2)			; RV64ZVE32F-NEXT: lh a2, 0(a2)
	▲ Show 20 Lines • Show All 58 Lines • ▼ Show 20 Lines
	; RV64ZVE32F-NEXT: beqz a2, .LBB24_4			; RV64ZVE32F-NEXT: beqz a2, .LBB24_4
	; RV64ZVE32F-NEXT: # %bb.3: # %cond.load1			; RV64ZVE32F-NEXT: # %bb.3: # %cond.load1
	; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vslidedown.vi v10, v8, 1			; RV64ZVE32F-NEXT: vslidedown.vi v10, v8, 1
	; RV64ZVE32F-NEXT: vmv.x.s a2, v10			; RV64ZVE32F-NEXT: vmv.x.s a2, v10
	; RV64ZVE32F-NEXT: slli a2, a2, 1			; RV64ZVE32F-NEXT: slli a2, a2, 1
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: lh a2, 0(a2)			; RV64ZVE32F-NEXT: lh a2, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e16, m1, tu, ma			; RV64ZVE32F-NEXT: vmv.v.i v0, 2
	; RV64ZVE32F-NEXT: vmv.s.x v10, a2			; RV64ZVE32F-NEXT: vsetivli zero, 8, e16, m1, ta, ma
	; RV64ZVE32F-NEXT: vslideup.vi v9, v10, 1			; RV64ZVE32F-NEXT: vmerge.vxm v9, v9, a2, v0
	; RV64ZVE32F-NEXT: .LBB24_4: # %else2			; RV64ZVE32F-NEXT: .LBB24_4: # %else2
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e8, mf4, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 2, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: andi a2, a1, 4			; RV64ZVE32F-NEXT: andi a2, a1, 4
	; RV64ZVE32F-NEXT: vslidedown.vi v10, v8, 2			; RV64ZVE32F-NEXT: vslidedown.vi v10, v8, 2
	; RV64ZVE32F-NEXT: beqz a2, .LBB24_6			; RV64ZVE32F-NEXT: beqz a2, .LBB24_6
	; RV64ZVE32F-NEXT: # %bb.5: # %cond.load4			; RV64ZVE32F-NEXT: # %bb.5: # %cond.load4
	; RV64ZVE32F-NEXT: vmv.x.s a2, v10			; RV64ZVE32F-NEXT: vmv.x.s a2, v10
	; RV64ZVE32F-NEXT: slli a2, a2, 1			; RV64ZVE32F-NEXT: slli a2, a2, 1
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: lh a2, 0(a2)			; RV64ZVE32F-NEXT: lh a2, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 3, e16, m1, tu, ma			; RV64ZVE32F-NEXT: vmv.v.i v0, 4
	; RV64ZVE32F-NEXT: vmv.s.x v11, a2			; RV64ZVE32F-NEXT: vsetivli zero, 8, e16, m1, ta, ma
	; RV64ZVE32F-NEXT: vslideup.vi v9, v11, 2			; RV64ZVE32F-NEXT: vmerge.vxm v9, v9, a2, v0
	; RV64ZVE32F-NEXT: .LBB24_6: # %else5			; RV64ZVE32F-NEXT: .LBB24_6: # %else5
	; RV64ZVE32F-NEXT: vsetivli zero, 4, e8, mf2, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 4, e8, mf2, ta, ma
	; RV64ZVE32F-NEXT: andi a2, a1, 8			; RV64ZVE32F-NEXT: andi a2, a1, 8
	; RV64ZVE32F-NEXT: vslidedown.vi v8, v8, 4			; RV64ZVE32F-NEXT: vslidedown.vi v8, v8, 4
	; RV64ZVE32F-NEXT: bnez a2, .LBB24_13			; RV64ZVE32F-NEXT: bnez a2, .LBB24_13
	; RV64ZVE32F-NEXT: # %bb.7: # %else8			; RV64ZVE32F-NEXT: # %bb.7: # %else8
	; RV64ZVE32F-NEXT: andi a2, a1, 16			; RV64ZVE32F-NEXT: andi a2, a1, 16
	; RV64ZVE32F-NEXT: bnez a2, .LBB24_14			; RV64ZVE32F-NEXT: bnez a2, .LBB24_14
	Show All 23 Lines
	; RV64ZVE32F-NEXT: ret			; RV64ZVE32F-NEXT: ret
	; RV64ZVE32F-NEXT: .LBB24_13: # %cond.load7			; RV64ZVE32F-NEXT: .LBB24_13: # %cond.load7
	; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vslidedown.vi v10, v10, 1			; RV64ZVE32F-NEXT: vslidedown.vi v10, v10, 1
	; RV64ZVE32F-NEXT: vmv.x.s a2, v10			; RV64ZVE32F-NEXT: vmv.x.s a2, v10
	; RV64ZVE32F-NEXT: slli a2, a2, 1			; RV64ZVE32F-NEXT: slli a2, a2, 1
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: lh a2, 0(a2)			; RV64ZVE32F-NEXT: lh a2, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 4, e16, m1, tu, ma			; RV64ZVE32F-NEXT: vmv.v.i v0, 8
	; RV64ZVE32F-NEXT: vmv.s.x v10, a2			; RV64ZVE32F-NEXT: vsetivli zero, 8, e16, m1, ta, ma
	; RV64ZVE32F-NEXT: vslideup.vi v9, v10, 3			; RV64ZVE32F-NEXT: vmerge.vxm v9, v9, a2, v0
	; RV64ZVE32F-NEXT: andi a2, a1, 16			; RV64ZVE32F-NEXT: andi a2, a1, 16
	; RV64ZVE32F-NEXT: beqz a2, .LBB24_8			; RV64ZVE32F-NEXT: beqz a2, .LBB24_8
	; RV64ZVE32F-NEXT: .LBB24_14: # %cond.load10			; RV64ZVE32F-NEXT: .LBB24_14: # %cond.load10
	; RV64ZVE32F-NEXT: vsetivli zero, 0, e8, mf4, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vmv.x.s a2, v8			; RV64ZVE32F-NEXT: vmv.x.s a2, v8
	; RV64ZVE32F-NEXT: slli a2, a2, 1			; RV64ZVE32F-NEXT: slli a2, a2, 1
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: lh a2, 0(a2)			; RV64ZVE32F-NEXT: lh a2, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 5, e16, m1, tu, ma			; RV64ZVE32F-NEXT: li a3, 16
	; RV64ZVE32F-NEXT: vmv.s.x v10, a2			; RV64ZVE32F-NEXT: vmv.v.x v0, a3
	; RV64ZVE32F-NEXT: vslideup.vi v9, v10, 4			; RV64ZVE32F-NEXT: vsetivli zero, 8, e16, m1, ta, ma
				; RV64ZVE32F-NEXT: vmerge.vxm v9, v9, a2, v0
	; RV64ZVE32F-NEXT: andi a2, a1, 32			; RV64ZVE32F-NEXT: andi a2, a1, 32
	; RV64ZVE32F-NEXT: bnez a2, .LBB24_9			; RV64ZVE32F-NEXT: bnez a2, .LBB24_9
	; RV64ZVE32F-NEXT: j .LBB24_10			; RV64ZVE32F-NEXT: j .LBB24_10
	; RV64ZVE32F-NEXT: .LBB24_15: # %cond.load16			; RV64ZVE32F-NEXT: .LBB24_15: # %cond.load16
	; RV64ZVE32F-NEXT: vmv.x.s a2, v8			; RV64ZVE32F-NEXT: vmv.x.s a2, v8
	; RV64ZVE32F-NEXT: slli a2, a2, 1			; RV64ZVE32F-NEXT: slli a2, a2, 1
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: lh a2, 0(a2)			; RV64ZVE32F-NEXT: lh a2, 0(a2)
	▲ Show 20 Lines • Show All 61 Lines • ▼ Show 20 Lines
	; RV64ZVE32F-NEXT: # %bb.3: # %cond.load1			; RV64ZVE32F-NEXT: # %bb.3: # %cond.load1
	; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vslidedown.vi v10, v8, 1			; RV64ZVE32F-NEXT: vslidedown.vi v10, v8, 1
	; RV64ZVE32F-NEXT: vmv.x.s a2, v10			; RV64ZVE32F-NEXT: vmv.x.s a2, v10
	; RV64ZVE32F-NEXT: andi a2, a2, 255			; RV64ZVE32F-NEXT: andi a2, a2, 255
	; RV64ZVE32F-NEXT: slli a2, a2, 1			; RV64ZVE32F-NEXT: slli a2, a2, 1
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: lh a2, 0(a2)			; RV64ZVE32F-NEXT: lh a2, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e16, m1, tu, ma			; RV64ZVE32F-NEXT: vmv.v.i v0, 2
	; RV64ZVE32F-NEXT: vmv.s.x v10, a2			; RV64ZVE32F-NEXT: vsetivli zero, 8, e16, m1, ta, ma
	; RV64ZVE32F-NEXT: vslideup.vi v9, v10, 1			; RV64ZVE32F-NEXT: vmerge.vxm v9, v9, a2, v0
	; RV64ZVE32F-NEXT: .LBB25_4: # %else2			; RV64ZVE32F-NEXT: .LBB25_4: # %else2
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e8, mf4, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 2, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: andi a2, a1, 4			; RV64ZVE32F-NEXT: andi a2, a1, 4
	; RV64ZVE32F-NEXT: vslidedown.vi v10, v8, 2			; RV64ZVE32F-NEXT: vslidedown.vi v10, v8, 2
	; RV64ZVE32F-NEXT: beqz a2, .LBB25_6			; RV64ZVE32F-NEXT: beqz a2, .LBB25_6
	; RV64ZVE32F-NEXT: # %bb.5: # %cond.load4			; RV64ZVE32F-NEXT: # %bb.5: # %cond.load4
	; RV64ZVE32F-NEXT: vmv.x.s a2, v10			; RV64ZVE32F-NEXT: vmv.x.s a2, v10
	; RV64ZVE32F-NEXT: andi a2, a2, 255			; RV64ZVE32F-NEXT: andi a2, a2, 255
	; RV64ZVE32F-NEXT: slli a2, a2, 1			; RV64ZVE32F-NEXT: slli a2, a2, 1
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: lh a2, 0(a2)			; RV64ZVE32F-NEXT: lh a2, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 3, e16, m1, tu, ma			; RV64ZVE32F-NEXT: vmv.v.i v0, 4
	; RV64ZVE32F-NEXT: vmv.s.x v11, a2			; RV64ZVE32F-NEXT: vsetivli zero, 8, e16, m1, ta, ma
	; RV64ZVE32F-NEXT: vslideup.vi v9, v11, 2			; RV64ZVE32F-NEXT: vmerge.vxm v9, v9, a2, v0
	; RV64ZVE32F-NEXT: .LBB25_6: # %else5			; RV64ZVE32F-NEXT: .LBB25_6: # %else5
	; RV64ZVE32F-NEXT: vsetivli zero, 4, e8, mf2, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 4, e8, mf2, ta, ma
	; RV64ZVE32F-NEXT: andi a2, a1, 8			; RV64ZVE32F-NEXT: andi a2, a1, 8
	; RV64ZVE32F-NEXT: vslidedown.vi v8, v8, 4			; RV64ZVE32F-NEXT: vslidedown.vi v8, v8, 4
	; RV64ZVE32F-NEXT: bnez a2, .LBB25_13			; RV64ZVE32F-NEXT: bnez a2, .LBB25_13
	; RV64ZVE32F-NEXT: # %bb.7: # %else8			; RV64ZVE32F-NEXT: # %bb.7: # %else8
	; RV64ZVE32F-NEXT: andi a2, a1, 16			; RV64ZVE32F-NEXT: andi a2, a1, 16
	; RV64ZVE32F-NEXT: bnez a2, .LBB25_14			; RV64ZVE32F-NEXT: bnez a2, .LBB25_14
	Show All 25 Lines
	; RV64ZVE32F-NEXT: .LBB25_13: # %cond.load7			; RV64ZVE32F-NEXT: .LBB25_13: # %cond.load7
	; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vslidedown.vi v10, v10, 1			; RV64ZVE32F-NEXT: vslidedown.vi v10, v10, 1
	; RV64ZVE32F-NEXT: vmv.x.s a2, v10			; RV64ZVE32F-NEXT: vmv.x.s a2, v10
	; RV64ZVE32F-NEXT: andi a2, a2, 255			; RV64ZVE32F-NEXT: andi a2, a2, 255
	; RV64ZVE32F-NEXT: slli a2, a2, 1			; RV64ZVE32F-NEXT: slli a2, a2, 1
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: lh a2, 0(a2)			; RV64ZVE32F-NEXT: lh a2, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 4, e16, m1, tu, ma			; RV64ZVE32F-NEXT: vmv.v.i v0, 8
	; RV64ZVE32F-NEXT: vmv.s.x v10, a2			; RV64ZVE32F-NEXT: vsetivli zero, 8, e16, m1, ta, ma
	; RV64ZVE32F-NEXT: vslideup.vi v9, v10, 3			; RV64ZVE32F-NEXT: vmerge.vxm v9, v9, a2, v0
	; RV64ZVE32F-NEXT: andi a2, a1, 16			; RV64ZVE32F-NEXT: andi a2, a1, 16
	; RV64ZVE32F-NEXT: beqz a2, .LBB25_8			; RV64ZVE32F-NEXT: beqz a2, .LBB25_8
	; RV64ZVE32F-NEXT: .LBB25_14: # %cond.load10			; RV64ZVE32F-NEXT: .LBB25_14: # %cond.load10
	; RV64ZVE32F-NEXT: vsetivli zero, 0, e8, mf4, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vmv.x.s a2, v8			; RV64ZVE32F-NEXT: vmv.x.s a2, v8
	; RV64ZVE32F-NEXT: andi a2, a2, 255			; RV64ZVE32F-NEXT: andi a2, a2, 255
	; RV64ZVE32F-NEXT: slli a2, a2, 1			; RV64ZVE32F-NEXT: slli a2, a2, 1
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: lh a2, 0(a2)			; RV64ZVE32F-NEXT: lh a2, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 5, e16, m1, tu, ma			; RV64ZVE32F-NEXT: li a3, 16
	; RV64ZVE32F-NEXT: vmv.s.x v10, a2			; RV64ZVE32F-NEXT: vmv.v.x v0, a3
	; RV64ZVE32F-NEXT: vslideup.vi v9, v10, 4			; RV64ZVE32F-NEXT: vsetivli zero, 8, e16, m1, ta, ma
				; RV64ZVE32F-NEXT: vmerge.vxm v9, v9, a2, v0
	; RV64ZVE32F-NEXT: andi a2, a1, 32			; RV64ZVE32F-NEXT: andi a2, a1, 32
	; RV64ZVE32F-NEXT: bnez a2, .LBB25_9			; RV64ZVE32F-NEXT: bnez a2, .LBB25_9
	; RV64ZVE32F-NEXT: j .LBB25_10			; RV64ZVE32F-NEXT: j .LBB25_10
	; RV64ZVE32F-NEXT: .LBB25_15: # %cond.load16			; RV64ZVE32F-NEXT: .LBB25_15: # %cond.load16
	; RV64ZVE32F-NEXT: vmv.x.s a2, v8			; RV64ZVE32F-NEXT: vmv.x.s a2, v8
	; RV64ZVE32F-NEXT: andi a2, a2, 255			; RV64ZVE32F-NEXT: andi a2, a2, 255
	; RV64ZVE32F-NEXT: slli a2, a2, 1			; RV64ZVE32F-NEXT: slli a2, a2, 1
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	▲ Show 20 Lines • Show All 60 Lines • ▼ Show 20 Lines
	; RV64ZVE32F-NEXT: beqz a2, .LBB26_4			; RV64ZVE32F-NEXT: beqz a2, .LBB26_4
	; RV64ZVE32F-NEXT: # %bb.3: # %cond.load1			; RV64ZVE32F-NEXT: # %bb.3: # %cond.load1
	; RV64ZVE32F-NEXT: vsetivli zero, 1, e16, mf2, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e16, mf2, ta, ma
	; RV64ZVE32F-NEXT: vslidedown.vi v10, v8, 1			; RV64ZVE32F-NEXT: vslidedown.vi v10, v8, 1
	; RV64ZVE32F-NEXT: vmv.x.s a2, v10			; RV64ZVE32F-NEXT: vmv.x.s a2, v10
	; RV64ZVE32F-NEXT: slli a2, a2, 1			; RV64ZVE32F-NEXT: slli a2, a2, 1
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: lh a2, 0(a2)			; RV64ZVE32F-NEXT: lh a2, 0(a2)
	; RV64ZVE32F-NEXT: vmv.s.x v10, a2			; RV64ZVE32F-NEXT: vmv.v.i v0, 2
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e16, m1, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 8, e16, m1, ta, ma
	; RV64ZVE32F-NEXT: vslideup.vi v9, v10, 1			; RV64ZVE32F-NEXT: vmerge.vxm v9, v9, a2, v0
	; RV64ZVE32F-NEXT: .LBB26_4: # %else2			; RV64ZVE32F-NEXT: .LBB26_4: # %else2
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e16, mf2, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 2, e16, mf2, ta, ma
	; RV64ZVE32F-NEXT: andi a2, a1, 4			; RV64ZVE32F-NEXT: andi a2, a1, 4
	; RV64ZVE32F-NEXT: vslidedown.vi v10, v8, 2			; RV64ZVE32F-NEXT: vslidedown.vi v10, v8, 2
	; RV64ZVE32F-NEXT: beqz a2, .LBB26_6			; RV64ZVE32F-NEXT: beqz a2, .LBB26_6
	; RV64ZVE32F-NEXT: # %bb.5: # %cond.load4			; RV64ZVE32F-NEXT: # %bb.5: # %cond.load4
	; RV64ZVE32F-NEXT: vmv.x.s a2, v10			; RV64ZVE32F-NEXT: vmv.x.s a2, v10
	; RV64ZVE32F-NEXT: slli a2, a2, 1			; RV64ZVE32F-NEXT: slli a2, a2, 1
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: lh a2, 0(a2)			; RV64ZVE32F-NEXT: lh a2, 0(a2)
	; RV64ZVE32F-NEXT: vmv.s.x v11, a2			; RV64ZVE32F-NEXT: vmv.v.i v0, 4
	; RV64ZVE32F-NEXT: vsetivli zero, 3, e16, m1, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 8, e16, m1, ta, ma
	; RV64ZVE32F-NEXT: vslideup.vi v9, v11, 2			; RV64ZVE32F-NEXT: vmerge.vxm v9, v9, a2, v0
	; RV64ZVE32F-NEXT: .LBB26_6: # %else5			; RV64ZVE32F-NEXT: .LBB26_6: # %else5
	; RV64ZVE32F-NEXT: vsetivli zero, 4, e16, m1, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 4, e16, m1, ta, ma
	; RV64ZVE32F-NEXT: andi a2, a1, 8			; RV64ZVE32F-NEXT: andi a2, a1, 8
	; RV64ZVE32F-NEXT: vslidedown.vi v8, v8, 4			; RV64ZVE32F-NEXT: vslidedown.vi v8, v8, 4
	; RV64ZVE32F-NEXT: bnez a2, .LBB26_13			; RV64ZVE32F-NEXT: bnez a2, .LBB26_13
	; RV64ZVE32F-NEXT: # %bb.7: # %else8			; RV64ZVE32F-NEXT: # %bb.7: # %else8
	; RV64ZVE32F-NEXT: andi a2, a1, 16			; RV64ZVE32F-NEXT: andi a2, a1, 16
	; RV64ZVE32F-NEXT: bnez a2, .LBB26_14			; RV64ZVE32F-NEXT: bnez a2, .LBB26_14
	Show All 23 Lines
	; RV64ZVE32F-NEXT: ret			; RV64ZVE32F-NEXT: ret
	; RV64ZVE32F-NEXT: .LBB26_13: # %cond.load7			; RV64ZVE32F-NEXT: .LBB26_13: # %cond.load7
	; RV64ZVE32F-NEXT: vsetivli zero, 1, e16, mf2, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e16, mf2, ta, ma
	; RV64ZVE32F-NEXT: vslidedown.vi v10, v10, 1			; RV64ZVE32F-NEXT: vslidedown.vi v10, v10, 1
	; RV64ZVE32F-NEXT: vmv.x.s a2, v10			; RV64ZVE32F-NEXT: vmv.x.s a2, v10
	; RV64ZVE32F-NEXT: slli a2, a2, 1			; RV64ZVE32F-NEXT: slli a2, a2, 1
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: lh a2, 0(a2)			; RV64ZVE32F-NEXT: lh a2, 0(a2)
	; RV64ZVE32F-NEXT: vmv.s.x v10, a2			; RV64ZVE32F-NEXT: vmv.v.i v0, 8
	; RV64ZVE32F-NEXT: vsetivli zero, 4, e16, m1, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 8, e16, m1, ta, ma
	; RV64ZVE32F-NEXT: vslideup.vi v9, v10, 3			; RV64ZVE32F-NEXT: vmerge.vxm v9, v9, a2, v0
	; RV64ZVE32F-NEXT: andi a2, a1, 16			; RV64ZVE32F-NEXT: andi a2, a1, 16
	; RV64ZVE32F-NEXT: beqz a2, .LBB26_8			; RV64ZVE32F-NEXT: beqz a2, .LBB26_8
	; RV64ZVE32F-NEXT: .LBB26_14: # %cond.load10			; RV64ZVE32F-NEXT: .LBB26_14: # %cond.load10
	; RV64ZVE32F-NEXT: vsetivli zero, 0, e16, mf2, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 0, e16, mf2, ta, ma
	; RV64ZVE32F-NEXT: vmv.x.s a2, v8			; RV64ZVE32F-NEXT: vmv.x.s a2, v8
	; RV64ZVE32F-NEXT: slli a2, a2, 1			; RV64ZVE32F-NEXT: slli a2, a2, 1
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: lh a2, 0(a2)			; RV64ZVE32F-NEXT: lh a2, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 5, e16, m1, tu, ma			; RV64ZVE32F-NEXT: li a3, 16
	; RV64ZVE32F-NEXT: vmv.s.x v10, a2			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vslideup.vi v9, v10, 4			; RV64ZVE32F-NEXT: vmv.v.x v0, a3
				; RV64ZVE32F-NEXT: vsetivli zero, 8, e16, m1, ta, ma
				; RV64ZVE32F-NEXT: vmerge.vxm v9, v9, a2, v0
	; RV64ZVE32F-NEXT: andi a2, a1, 32			; RV64ZVE32F-NEXT: andi a2, a1, 32
	; RV64ZVE32F-NEXT: bnez a2, .LBB26_9			; RV64ZVE32F-NEXT: bnez a2, .LBB26_9
	; RV64ZVE32F-NEXT: j .LBB26_10			; RV64ZVE32F-NEXT: j .LBB26_10
	; RV64ZVE32F-NEXT: .LBB26_15: # %cond.load16			; RV64ZVE32F-NEXT: .LBB26_15: # %cond.load16
	; RV64ZVE32F-NEXT: vmv.x.s a2, v8			; RV64ZVE32F-NEXT: vmv.x.s a2, v8
	; RV64ZVE32F-NEXT: slli a2, a2, 1			; RV64ZVE32F-NEXT: slli a2, a2, 1
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: lh a2, 0(a2)			; RV64ZVE32F-NEXT: lh a2, 0(a2)
	▲ Show 20 Lines • Show All 95 Lines • ▼ Show 20 Lines
	; RV64ZVE32F-NEXT: .LBB28_3: # %cond.load			; RV64ZVE32F-NEXT: .LBB28_3: # %cond.load
	; RV64ZVE32F-NEXT: lw a0, 0(a0)			; RV64ZVE32F-NEXT: lw a0, 0(a0)
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e32, m1, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 2, e32, m1, tu, ma
	; RV64ZVE32F-NEXT: vmv.s.x v8, a0			; RV64ZVE32F-NEXT: vmv.s.x v8, a0
	; RV64ZVE32F-NEXT: andi a2, a2, 2			; RV64ZVE32F-NEXT: andi a2, a2, 2
	; RV64ZVE32F-NEXT: beqz a2, .LBB28_2			; RV64ZVE32F-NEXT: beqz a2, .LBB28_2
	; RV64ZVE32F-NEXT: .LBB28_4: # %cond.load1			; RV64ZVE32F-NEXT: .LBB28_4: # %cond.load1
	; RV64ZVE32F-NEXT: lw a0, 0(a1)			; RV64ZVE32F-NEXT: lw a0, 0(a1)
				; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
				; RV64ZVE32F-NEXT: vmv.v.i v0, 2
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e32, m1, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 2, e32, m1, ta, ma
	; RV64ZVE32F-NEXT: vmv.s.x v9, a0			; RV64ZVE32F-NEXT: vmerge.vxm v8, v8, a0, v0
	; RV64ZVE32F-NEXT: vslideup.vi v8, v9, 1
	; RV64ZVE32F-NEXT: ret			; RV64ZVE32F-NEXT: ret
	%v = call <2 x i32> @llvm.masked.gather.v2i32.v2p0(<2 x ptr> %ptrs, i32 4, <2 x i1> %m, <2 x i32> %passthru)			%v = call <2 x i32> @llvm.masked.gather.v2i32.v2p0(<2 x ptr> %ptrs, i32 4, <2 x i1> %m, <2 x i32> %passthru)
	ret <2 x i32> %v			ret <2 x i32> %v
	}			}

	define <2 x i64> @mgather_v2i32_sextload_v2i64(<2 x ptr> %ptrs, <2 x i1> %m, <2 x i32> %passthru) {			define <2 x i64> @mgather_v2i32_sextload_v2i64(<2 x ptr> %ptrs, <2 x i1> %m, <2 x i32> %passthru) {
	; RV32V-LABEL: mgather_v2i32_sextload_v2i64:			; RV32V-LABEL: mgather_v2i32_sextload_v2i64:
	; RV32V: # %bb.0:			; RV32V: # %bb.0:
	Show All 38 Lines
	; RV64ZVE32F-NEXT: lw a0, 0(a0)			; RV64ZVE32F-NEXT: lw a0, 0(a0)
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e32, m1, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 2, e32, m1, tu, ma
	; RV64ZVE32F-NEXT: vmv.s.x v8, a0			; RV64ZVE32F-NEXT: vmv.s.x v8, a0
	; RV64ZVE32F-NEXT: .LBB29_2: # %else			; RV64ZVE32F-NEXT: .LBB29_2: # %else
	; RV64ZVE32F-NEXT: andi a2, a2, 2			; RV64ZVE32F-NEXT: andi a2, a2, 2
	; RV64ZVE32F-NEXT: beqz a2, .LBB29_4			; RV64ZVE32F-NEXT: beqz a2, .LBB29_4
	; RV64ZVE32F-NEXT: # %bb.3: # %cond.load1			; RV64ZVE32F-NEXT: # %bb.3: # %cond.load1
	; RV64ZVE32F-NEXT: lw a0, 0(a1)			; RV64ZVE32F-NEXT: lw a0, 0(a1)
				; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
				; RV64ZVE32F-NEXT: vmv.v.i v0, 2
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e32, m1, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 2, e32, m1, ta, ma
	; RV64ZVE32F-NEXT: vmv.s.x v9, a0			; RV64ZVE32F-NEXT: vmerge.vxm v8, v8, a0, v0
	; RV64ZVE32F-NEXT: vslideup.vi v8, v9, 1
	; RV64ZVE32F-NEXT: .LBB29_4: # %else2			; RV64ZVE32F-NEXT: .LBB29_4: # %else2
	; RV64ZVE32F-NEXT: vsetivli zero, 1, e32, m1, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e32, m1, ta, ma
	; RV64ZVE32F-NEXT: vslidedown.vi v9, v8, 1			; RV64ZVE32F-NEXT: vslidedown.vi v9, v8, 1
	; RV64ZVE32F-NEXT: vmv.x.s a1, v9			; RV64ZVE32F-NEXT: vmv.x.s a1, v9
	; RV64ZVE32F-NEXT: vmv.x.s a0, v8			; RV64ZVE32F-NEXT: vmv.x.s a0, v8
	; RV64ZVE32F-NEXT: ret			; RV64ZVE32F-NEXT: ret
	%v = call <2 x i32> @llvm.masked.gather.v2i32.v2p0(<2 x ptr> %ptrs, i32 4, <2 x i1> %m, <2 x i32> %passthru)			%v = call <2 x i32> @llvm.masked.gather.v2i32.v2p0(<2 x ptr> %ptrs, i32 4, <2 x i1> %m, <2 x i32> %passthru)
	%ev = sext <2 x i32> %v to <2 x i64>			%ev = sext <2 x i32> %v to <2 x i64>
	Show All 40 Lines
	; RV64ZVE32F-NEXT: lw a0, 0(a0)			; RV64ZVE32F-NEXT: lw a0, 0(a0)
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e32, m1, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 2, e32, m1, tu, ma
	; RV64ZVE32F-NEXT: vmv.s.x v8, a0			; RV64ZVE32F-NEXT: vmv.s.x v8, a0
	; RV64ZVE32F-NEXT: .LBB30_2: # %else			; RV64ZVE32F-NEXT: .LBB30_2: # %else
	; RV64ZVE32F-NEXT: andi a2, a2, 2			; RV64ZVE32F-NEXT: andi a2, a2, 2
	; RV64ZVE32F-NEXT: beqz a2, .LBB30_4			; RV64ZVE32F-NEXT: beqz a2, .LBB30_4
	; RV64ZVE32F-NEXT: # %bb.3: # %cond.load1			; RV64ZVE32F-NEXT: # %bb.3: # %cond.load1
	; RV64ZVE32F-NEXT: lw a0, 0(a1)			; RV64ZVE32F-NEXT: lw a0, 0(a1)
				; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
				; RV64ZVE32F-NEXT: vmv.v.i v0, 2
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e32, m1, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 2, e32, m1, ta, ma
	; RV64ZVE32F-NEXT: vmv.s.x v9, a0			; RV64ZVE32F-NEXT: vmerge.vxm v8, v8, a0, v0
	; RV64ZVE32F-NEXT: vslideup.vi v8, v9, 1
	; RV64ZVE32F-NEXT: .LBB30_4: # %else2			; RV64ZVE32F-NEXT: .LBB30_4: # %else2
	; RV64ZVE32F-NEXT: vsetivli zero, 1, e32, m1, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e32, m1, ta, ma
	; RV64ZVE32F-NEXT: vslidedown.vi v9, v8, 1			; RV64ZVE32F-NEXT: vslidedown.vi v9, v8, 1
	; RV64ZVE32F-NEXT: vmv.x.s a0, v9			; RV64ZVE32F-NEXT: vmv.x.s a0, v9
	; RV64ZVE32F-NEXT: slli a0, a0, 32			; RV64ZVE32F-NEXT: slli a0, a0, 32
	; RV64ZVE32F-NEXT: srli a1, a0, 32			; RV64ZVE32F-NEXT: srli a1, a0, 32
	; RV64ZVE32F-NEXT: vmv.x.s a0, v8			; RV64ZVE32F-NEXT: vmv.x.s a0, v8
	; RV64ZVE32F-NEXT: slli a0, a0, 32			; RV64ZVE32F-NEXT: slli a0, a0, 32
	▲ Show 20 Lines • Show All 43 Lines • ▼ Show 20 Lines
	; RV64ZVE32F-NEXT: lw a2, 0(a2)			; RV64ZVE32F-NEXT: lw a2, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 4, e32, m1, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 4, e32, m1, tu, ma
	; RV64ZVE32F-NEXT: vmv.s.x v8, a2			; RV64ZVE32F-NEXT: vmv.s.x v8, a2
	; RV64ZVE32F-NEXT: andi a2, a1, 2			; RV64ZVE32F-NEXT: andi a2, a1, 2
	; RV64ZVE32F-NEXT: beqz a2, .LBB31_2			; RV64ZVE32F-NEXT: beqz a2, .LBB31_2
	; RV64ZVE32F-NEXT: .LBB31_6: # %cond.load1			; RV64ZVE32F-NEXT: .LBB31_6: # %cond.load1
	; RV64ZVE32F-NEXT: ld a2, 8(a0)			; RV64ZVE32F-NEXT: ld a2, 8(a0)
	; RV64ZVE32F-NEXT: lw a2, 0(a2)			; RV64ZVE32F-NEXT: lw a2, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e32, m1, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vmv.s.x v9, a2			; RV64ZVE32F-NEXT: vmv.v.i v0, 2
	; RV64ZVE32F-NEXT: vslideup.vi v8, v9, 1			; RV64ZVE32F-NEXT: vsetivli zero, 4, e32, m1, ta, ma
				; RV64ZVE32F-NEXT: vmerge.vxm v8, v8, a2, v0
	; RV64ZVE32F-NEXT: andi a2, a1, 4			; RV64ZVE32F-NEXT: andi a2, a1, 4
	; RV64ZVE32F-NEXT: beqz a2, .LBB31_3			; RV64ZVE32F-NEXT: beqz a2, .LBB31_3
	; RV64ZVE32F-NEXT: .LBB31_7: # %cond.load4			; RV64ZVE32F-NEXT: .LBB31_7: # %cond.load4
	; RV64ZVE32F-NEXT: ld a2, 16(a0)			; RV64ZVE32F-NEXT: ld a2, 16(a0)
	; RV64ZVE32F-NEXT: lw a2, 0(a2)			; RV64ZVE32F-NEXT: lw a2, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 3, e32, m1, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vmv.s.x v9, a2			; RV64ZVE32F-NEXT: vmv.v.i v0, 4
	; RV64ZVE32F-NEXT: vslideup.vi v8, v9, 2			; RV64ZVE32F-NEXT: vsetivli zero, 4, e32, m1, ta, ma
				; RV64ZVE32F-NEXT: vmerge.vxm v8, v8, a2, v0
	; RV64ZVE32F-NEXT: andi a1, a1, 8			; RV64ZVE32F-NEXT: andi a1, a1, 8
	; RV64ZVE32F-NEXT: beqz a1, .LBB31_4			; RV64ZVE32F-NEXT: beqz a1, .LBB31_4
	; RV64ZVE32F-NEXT: .LBB31_8: # %cond.load7			; RV64ZVE32F-NEXT: .LBB31_8: # %cond.load7
	; RV64ZVE32F-NEXT: ld a0, 24(a0)			; RV64ZVE32F-NEXT: ld a0, 24(a0)
	; RV64ZVE32F-NEXT: lw a0, 0(a0)			; RV64ZVE32F-NEXT: lw a0, 0(a0)
				; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
				; RV64ZVE32F-NEXT: vmv.v.i v0, 8
	; RV64ZVE32F-NEXT: vsetivli zero, 4, e32, m1, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 4, e32, m1, ta, ma
	; RV64ZVE32F-NEXT: vmv.s.x v9, a0			; RV64ZVE32F-NEXT: vmerge.vxm v8, v8, a0, v0
	; RV64ZVE32F-NEXT: vslideup.vi v8, v9, 3
	; RV64ZVE32F-NEXT: ret			; RV64ZVE32F-NEXT: ret
	%v = call <4 x i32> @llvm.masked.gather.v4i32.v4p0(<4 x ptr> %ptrs, i32 4, <4 x i1> %m, <4 x i32> %passthru)			%v = call <4 x i32> @llvm.masked.gather.v4i32.v4p0(<4 x ptr> %ptrs, i32 4, <4 x i1> %m, <4 x i32> %passthru)
	ret <4 x i32> %v			ret <4 x i32> %v
	}			}

	define <4 x i32> @mgather_truemask_v4i32(<4 x ptr> %ptrs, <4 x i32> %passthru) {			define <4 x i32> @mgather_truemask_v4i32(<4 x ptr> %ptrs, <4 x i32> %passthru) {
	; RV32-LABEL: mgather_truemask_v4i32:			; RV32-LABEL: mgather_truemask_v4i32:
	; RV32: # %bb.0:			; RV32: # %bb.0:
	Show All 30 Lines
	; RV64ZVE32F-NEXT: lw a2, 0(a2)			; RV64ZVE32F-NEXT: lw a2, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 4, e32, m1, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 4, e32, m1, tu, ma
	; RV64ZVE32F-NEXT: vmv.s.x v8, a2			; RV64ZVE32F-NEXT: vmv.s.x v8, a2
	; RV64ZVE32F-NEXT: andi a2, a1, 2			; RV64ZVE32F-NEXT: andi a2, a1, 2
	; RV64ZVE32F-NEXT: beqz a2, .LBB32_2			; RV64ZVE32F-NEXT: beqz a2, .LBB32_2
	; RV64ZVE32F-NEXT: .LBB32_6: # %cond.load1			; RV64ZVE32F-NEXT: .LBB32_6: # %cond.load1
	; RV64ZVE32F-NEXT: ld a2, 8(a0)			; RV64ZVE32F-NEXT: ld a2, 8(a0)
	; RV64ZVE32F-NEXT: lw a2, 0(a2)			; RV64ZVE32F-NEXT: lw a2, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e32, m1, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vmv.s.x v9, a2			; RV64ZVE32F-NEXT: vmv.v.i v0, 2
	; RV64ZVE32F-NEXT: vslideup.vi v8, v9, 1			; RV64ZVE32F-NEXT: vsetivli zero, 4, e32, m1, ta, ma
				; RV64ZVE32F-NEXT: vmerge.vxm v8, v8, a2, v0
	; RV64ZVE32F-NEXT: andi a2, a1, 4			; RV64ZVE32F-NEXT: andi a2, a1, 4
	; RV64ZVE32F-NEXT: beqz a2, .LBB32_3			; RV64ZVE32F-NEXT: beqz a2, .LBB32_3
	; RV64ZVE32F-NEXT: .LBB32_7: # %cond.load4			; RV64ZVE32F-NEXT: .LBB32_7: # %cond.load4
	; RV64ZVE32F-NEXT: ld a2, 16(a0)			; RV64ZVE32F-NEXT: ld a2, 16(a0)
	; RV64ZVE32F-NEXT: lw a2, 0(a2)			; RV64ZVE32F-NEXT: lw a2, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 3, e32, m1, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vmv.s.x v9, a2			; RV64ZVE32F-NEXT: vmv.v.i v0, 4
	; RV64ZVE32F-NEXT: vslideup.vi v8, v9, 2			; RV64ZVE32F-NEXT: vsetivli zero, 4, e32, m1, ta, ma
				; RV64ZVE32F-NEXT: vmerge.vxm v8, v8, a2, v0
	; RV64ZVE32F-NEXT: andi a1, a1, 8			; RV64ZVE32F-NEXT: andi a1, a1, 8
	; RV64ZVE32F-NEXT: beqz a1, .LBB32_4			; RV64ZVE32F-NEXT: beqz a1, .LBB32_4
	; RV64ZVE32F-NEXT: .LBB32_8: # %cond.load7			; RV64ZVE32F-NEXT: .LBB32_8: # %cond.load7
	; RV64ZVE32F-NEXT: ld a0, 24(a0)			; RV64ZVE32F-NEXT: ld a0, 24(a0)
	; RV64ZVE32F-NEXT: lw a0, 0(a0)			; RV64ZVE32F-NEXT: lw a0, 0(a0)
				; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
				; RV64ZVE32F-NEXT: vmv.v.i v0, 8
	; RV64ZVE32F-NEXT: vsetivli zero, 4, e32, m1, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 4, e32, m1, ta, ma
	; RV64ZVE32F-NEXT: vmv.s.x v9, a0			; RV64ZVE32F-NEXT: vmerge.vxm v8, v8, a0, v0
	; RV64ZVE32F-NEXT: vslideup.vi v8, v9, 3
	; RV64ZVE32F-NEXT: ret			; RV64ZVE32F-NEXT: ret
	%mhead = insertelement <4 x i1> poison, i1 1, i32 0			%mhead = insertelement <4 x i1> poison, i1 1, i32 0
	%mtrue = shufflevector <4 x i1> %mhead, <4 x i1> poison, <4 x i32> zeroinitializer			%mtrue = shufflevector <4 x i1> %mhead, <4 x i1> poison, <4 x i32> zeroinitializer
	%v = call <4 x i32> @llvm.masked.gather.v4i32.v4p0(<4 x ptr> %ptrs, i32 4, <4 x i1> %mtrue, <4 x i32> %passthru)			%v = call <4 x i32> @llvm.masked.gather.v4i32.v4p0(<4 x ptr> %ptrs, i32 4, <4 x i1> %mtrue, <4 x i32> %passthru)
	ret <4 x i32> %v			ret <4 x i32> %v
	}			}

	define <4 x i32> @mgather_falsemask_v4i32(<4 x ptr> %ptrs, <4 x i32> %passthru) {			define <4 x i32> @mgather_falsemask_v4i32(<4 x ptr> %ptrs, <4 x i32> %passthru) {
	▲ Show 20 Lines • Show All 65 Lines • ▼ Show 20 Lines
	; RV64ZVE32F-NEXT: lw a2, 0(a2)			; RV64ZVE32F-NEXT: lw a2, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 8, e32, m2, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 8, e32, m2, tu, ma
	; RV64ZVE32F-NEXT: vmv.s.x v8, a2			; RV64ZVE32F-NEXT: vmv.s.x v8, a2
	; RV64ZVE32F-NEXT: andi a2, a1, 2			; RV64ZVE32F-NEXT: andi a2, a1, 2
	; RV64ZVE32F-NEXT: beqz a2, .LBB34_2			; RV64ZVE32F-NEXT: beqz a2, .LBB34_2
	; RV64ZVE32F-NEXT: .LBB34_10: # %cond.load1			; RV64ZVE32F-NEXT: .LBB34_10: # %cond.load1
	; RV64ZVE32F-NEXT: ld a2, 8(a0)			; RV64ZVE32F-NEXT: ld a2, 8(a0)
	; RV64ZVE32F-NEXT: lw a2, 0(a2)			; RV64ZVE32F-NEXT: lw a2, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e32, m2, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vmv.s.x v10, a2			; RV64ZVE32F-NEXT: vmv.v.i v0, 2
	; RV64ZVE32F-NEXT: vslideup.vi v8, v10, 1			; RV64ZVE32F-NEXT: vsetivli zero, 8, e32, m2, ta, ma
				; RV64ZVE32F-NEXT: vmerge.vxm v8, v8, a2, v0
	; RV64ZVE32F-NEXT: andi a2, a1, 4			; RV64ZVE32F-NEXT: andi a2, a1, 4
	; RV64ZVE32F-NEXT: beqz a2, .LBB34_3			; RV64ZVE32F-NEXT: beqz a2, .LBB34_3
	; RV64ZVE32F-NEXT: .LBB34_11: # %cond.load4			; RV64ZVE32F-NEXT: .LBB34_11: # %cond.load4
	; RV64ZVE32F-NEXT: ld a2, 16(a0)			; RV64ZVE32F-NEXT: ld a2, 16(a0)
	; RV64ZVE32F-NEXT: lw a2, 0(a2)			; RV64ZVE32F-NEXT: lw a2, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 3, e32, m2, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vmv.s.x v10, a2			; RV64ZVE32F-NEXT: vmv.v.i v0, 4
	; RV64ZVE32F-NEXT: vslideup.vi v8, v10, 2			; RV64ZVE32F-NEXT: vsetivli zero, 8, e32, m2, ta, ma
				; RV64ZVE32F-NEXT: vmerge.vxm v8, v8, a2, v0
	; RV64ZVE32F-NEXT: andi a2, a1, 8			; RV64ZVE32F-NEXT: andi a2, a1, 8
	; RV64ZVE32F-NEXT: beqz a2, .LBB34_4			; RV64ZVE32F-NEXT: beqz a2, .LBB34_4
	; RV64ZVE32F-NEXT: .LBB34_12: # %cond.load7			; RV64ZVE32F-NEXT: .LBB34_12: # %cond.load7
	; RV64ZVE32F-NEXT: ld a2, 24(a0)			; RV64ZVE32F-NEXT: ld a2, 24(a0)
	; RV64ZVE32F-NEXT: lw a2, 0(a2)			; RV64ZVE32F-NEXT: lw a2, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 4, e32, m2, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vmv.s.x v10, a2			; RV64ZVE32F-NEXT: vmv.v.i v0, 8
	; RV64ZVE32F-NEXT: vslideup.vi v8, v10, 3			; RV64ZVE32F-NEXT: vsetivli zero, 8, e32, m2, ta, ma
				; RV64ZVE32F-NEXT: vmerge.vxm v8, v8, a2, v0
	; RV64ZVE32F-NEXT: andi a2, a1, 16			; RV64ZVE32F-NEXT: andi a2, a1, 16
	; RV64ZVE32F-NEXT: beqz a2, .LBB34_5			; RV64ZVE32F-NEXT: beqz a2, .LBB34_5
	; RV64ZVE32F-NEXT: .LBB34_13: # %cond.load10			; RV64ZVE32F-NEXT: .LBB34_13: # %cond.load10
	; RV64ZVE32F-NEXT: ld a2, 32(a0)			; RV64ZVE32F-NEXT: ld a2, 32(a0)
	; RV64ZVE32F-NEXT: lw a2, 0(a2)			; RV64ZVE32F-NEXT: lw a2, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 5, e32, m2, tu, ma			; RV64ZVE32F-NEXT: li a3, 16
	; RV64ZVE32F-NEXT: vmv.s.x v10, a2			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vslideup.vi v8, v10, 4			; RV64ZVE32F-NEXT: vmv.v.x v0, a3
				; RV64ZVE32F-NEXT: vsetivli zero, 8, e32, m2, ta, ma
				; RV64ZVE32F-NEXT: vmerge.vxm v8, v8, a2, v0
	; RV64ZVE32F-NEXT: andi a2, a1, 32			; RV64ZVE32F-NEXT: andi a2, a1, 32
	; RV64ZVE32F-NEXT: beqz a2, .LBB34_6			; RV64ZVE32F-NEXT: beqz a2, .LBB34_6
	; RV64ZVE32F-NEXT: .LBB34_14: # %cond.load13			; RV64ZVE32F-NEXT: .LBB34_14: # %cond.load13
	; RV64ZVE32F-NEXT: ld a2, 40(a0)			; RV64ZVE32F-NEXT: ld a2, 40(a0)
	; RV64ZVE32F-NEXT: lw a2, 0(a2)			; RV64ZVE32F-NEXT: lw a2, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 6, e32, m2, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 6, e32, m2, tu, ma
	; RV64ZVE32F-NEXT: vmv.s.x v10, a2			; RV64ZVE32F-NEXT: vmv.s.x v10, a2
	; RV64ZVE32F-NEXT: vslideup.vi v8, v10, 5			; RV64ZVE32F-NEXT: vslideup.vi v8, v10, 5
	▲ Show 20 Lines • Show All 56 Lines • ▼ Show 20 Lines
	; RV64ZVE32F-NEXT: beqz a2, .LBB35_4			; RV64ZVE32F-NEXT: beqz a2, .LBB35_4
	; RV64ZVE32F-NEXT: # %bb.3: # %cond.load1			; RV64ZVE32F-NEXT: # %bb.3: # %cond.load1
	; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vslidedown.vi v9, v8, 1			; RV64ZVE32F-NEXT: vslidedown.vi v9, v8, 1
	; RV64ZVE32F-NEXT: vmv.x.s a2, v9			; RV64ZVE32F-NEXT: vmv.x.s a2, v9
	; RV64ZVE32F-NEXT: slli a2, a2, 2			; RV64ZVE32F-NEXT: slli a2, a2, 2
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: lw a2, 0(a2)			; RV64ZVE32F-NEXT: lw a2, 0(a2)
	; RV64ZVE32F-NEXT: vsetvli zero, zero, e32, m1, ta, ma			; RV64ZVE32F-NEXT: vmv.v.i v0, 2
	; RV64ZVE32F-NEXT: vmv.s.x v12, a2			; RV64ZVE32F-NEXT: vsetivli zero, 8, e32, m2, ta, ma
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e32, m2, tu, ma			; RV64ZVE32F-NEXT: vmerge.vxm v10, v10, a2, v0
	; RV64ZVE32F-NEXT: vslideup.vi v10, v12, 1
	; RV64ZVE32F-NEXT: .LBB35_4: # %else2			; RV64ZVE32F-NEXT: .LBB35_4: # %else2
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e8, mf4, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 2, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: andi a2, a1, 4			; RV64ZVE32F-NEXT: andi a2, a1, 4
	; RV64ZVE32F-NEXT: vslidedown.vi v9, v8, 2			; RV64ZVE32F-NEXT: vslidedown.vi v9, v8, 2
	; RV64ZVE32F-NEXT: beqz a2, .LBB35_6			; RV64ZVE32F-NEXT: beqz a2, .LBB35_6
	; RV64ZVE32F-NEXT: # %bb.5: # %cond.load4			; RV64ZVE32F-NEXT: # %bb.5: # %cond.load4
	; RV64ZVE32F-NEXT: vmv.x.s a2, v9			; RV64ZVE32F-NEXT: vmv.x.s a2, v9
	; RV64ZVE32F-NEXT: slli a2, a2, 2			; RV64ZVE32F-NEXT: slli a2, a2, 2
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: lw a2, 0(a2)			; RV64ZVE32F-NEXT: lw a2, 0(a2)
	; RV64ZVE32F-NEXT: vsetvli zero, zero, e32, m1, ta, ma			; RV64ZVE32F-NEXT: vmv.v.i v0, 4
	; RV64ZVE32F-NEXT: vmv.s.x v12, a2			; RV64ZVE32F-NEXT: vsetivli zero, 8, e32, m2, ta, ma
	; RV64ZVE32F-NEXT: vsetivli zero, 3, e32, m2, tu, ma			; RV64ZVE32F-NEXT: vmerge.vxm v10, v10, a2, v0
	; RV64ZVE32F-NEXT: vslideup.vi v10, v12, 2
	; RV64ZVE32F-NEXT: .LBB35_6: # %else5			; RV64ZVE32F-NEXT: .LBB35_6: # %else5
	; RV64ZVE32F-NEXT: vsetivli zero, 4, e8, mf2, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 4, e8, mf2, ta, ma
	; RV64ZVE32F-NEXT: andi a2, a1, 8			; RV64ZVE32F-NEXT: andi a2, a1, 8
	; RV64ZVE32F-NEXT: vslidedown.vi v8, v8, 4			; RV64ZVE32F-NEXT: vslidedown.vi v8, v8, 4
	; RV64ZVE32F-NEXT: bnez a2, .LBB35_13			; RV64ZVE32F-NEXT: bnez a2, .LBB35_13
	; RV64ZVE32F-NEXT: # %bb.7: # %else8			; RV64ZVE32F-NEXT: # %bb.7: # %else8
	; RV64ZVE32F-NEXT: andi a2, a1, 16			; RV64ZVE32F-NEXT: andi a2, a1, 16
	; RV64ZVE32F-NEXT: bnez a2, .LBB35_14			; RV64ZVE32F-NEXT: bnez a2, .LBB35_14
	Show All 24 Lines
	; RV64ZVE32F-NEXT: ret			; RV64ZVE32F-NEXT: ret
	; RV64ZVE32F-NEXT: .LBB35_13: # %cond.load7			; RV64ZVE32F-NEXT: .LBB35_13: # %cond.load7
	; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vslidedown.vi v9, v9, 1			; RV64ZVE32F-NEXT: vslidedown.vi v9, v9, 1
	; RV64ZVE32F-NEXT: vmv.x.s a2, v9			; RV64ZVE32F-NEXT: vmv.x.s a2, v9
	; RV64ZVE32F-NEXT: slli a2, a2, 2			; RV64ZVE32F-NEXT: slli a2, a2, 2
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: lw a2, 0(a2)			; RV64ZVE32F-NEXT: lw a2, 0(a2)
	; RV64ZVE32F-NEXT: vsetvli zero, zero, e32, m1, ta, ma			; RV64ZVE32F-NEXT: vmv.v.i v0, 8
	; RV64ZVE32F-NEXT: vmv.s.x v12, a2			; RV64ZVE32F-NEXT: vsetivli zero, 8, e32, m2, ta, ma
	; RV64ZVE32F-NEXT: vsetivli zero, 4, e32, m2, tu, ma			; RV64ZVE32F-NEXT: vmerge.vxm v10, v10, a2, v0
	; RV64ZVE32F-NEXT: vslideup.vi v10, v12, 3
	; RV64ZVE32F-NEXT: andi a2, a1, 16			; RV64ZVE32F-NEXT: andi a2, a1, 16
	; RV64ZVE32F-NEXT: beqz a2, .LBB35_8			; RV64ZVE32F-NEXT: beqz a2, .LBB35_8
	; RV64ZVE32F-NEXT: .LBB35_14: # %cond.load10			; RV64ZVE32F-NEXT: .LBB35_14: # %cond.load10
	; RV64ZVE32F-NEXT: vsetivli zero, 0, e8, mf4, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vmv.x.s a2, v8			; RV64ZVE32F-NEXT: vmv.x.s a2, v8
	; RV64ZVE32F-NEXT: slli a2, a2, 2			; RV64ZVE32F-NEXT: slli a2, a2, 2
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: lw a2, 0(a2)			; RV64ZVE32F-NEXT: lw a2, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 5, e32, m2, tu, ma			; RV64ZVE32F-NEXT: li a3, 16
	; RV64ZVE32F-NEXT: vmv.s.x v12, a2			; RV64ZVE32F-NEXT: vmv.v.x v0, a3
	; RV64ZVE32F-NEXT: vslideup.vi v10, v12, 4			; RV64ZVE32F-NEXT: vsetivli zero, 8, e32, m2, ta, ma
				; RV64ZVE32F-NEXT: vmerge.vxm v10, v10, a2, v0
	; RV64ZVE32F-NEXT: andi a2, a1, 32			; RV64ZVE32F-NEXT: andi a2, a1, 32
	; RV64ZVE32F-NEXT: bnez a2, .LBB35_9			; RV64ZVE32F-NEXT: bnez a2, .LBB35_9
	; RV64ZVE32F-NEXT: j .LBB35_10			; RV64ZVE32F-NEXT: j .LBB35_10
	; RV64ZVE32F-NEXT: .LBB35_15: # %cond.load16			; RV64ZVE32F-NEXT: .LBB35_15: # %cond.load16
	; RV64ZVE32F-NEXT: vmv.x.s a2, v8			; RV64ZVE32F-NEXT: vmv.x.s a2, v8
	; RV64ZVE32F-NEXT: slli a2, a2, 2			; RV64ZVE32F-NEXT: slli a2, a2, 2
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: lw a2, 0(a2)			; RV64ZVE32F-NEXT: lw a2, 0(a2)
	▲ Show 20 Lines • Show All 59 Lines • ▼ Show 20 Lines
	; RV64ZVE32F-NEXT: beqz a2, .LBB36_4			; RV64ZVE32F-NEXT: beqz a2, .LBB36_4
	; RV64ZVE32F-NEXT: # %bb.3: # %cond.load1			; RV64ZVE32F-NEXT: # %bb.3: # %cond.load1
	; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vslidedown.vi v9, v8, 1			; RV64ZVE32F-NEXT: vslidedown.vi v9, v8, 1
	; RV64ZVE32F-NEXT: vmv.x.s a2, v9			; RV64ZVE32F-NEXT: vmv.x.s a2, v9
	; RV64ZVE32F-NEXT: slli a2, a2, 2			; RV64ZVE32F-NEXT: slli a2, a2, 2
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: lw a2, 0(a2)			; RV64ZVE32F-NEXT: lw a2, 0(a2)
	; RV64ZVE32F-NEXT: vsetvli zero, zero, e32, m1, ta, ma			; RV64ZVE32F-NEXT: vmv.v.i v0, 2
	; RV64ZVE32F-NEXT: vmv.s.x v12, a2			; RV64ZVE32F-NEXT: vsetivli zero, 8, e32, m2, ta, ma
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e32, m2, tu, ma			; RV64ZVE32F-NEXT: vmerge.vxm v10, v10, a2, v0
	; RV64ZVE32F-NEXT: vslideup.vi v10, v12, 1
	; RV64ZVE32F-NEXT: .LBB36_4: # %else2			; RV64ZVE32F-NEXT: .LBB36_4: # %else2
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e8, mf4, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 2, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: andi a2, a1, 4			; RV64ZVE32F-NEXT: andi a2, a1, 4
	; RV64ZVE32F-NEXT: vslidedown.vi v9, v8, 2			; RV64ZVE32F-NEXT: vslidedown.vi v9, v8, 2
	; RV64ZVE32F-NEXT: beqz a2, .LBB36_6			; RV64ZVE32F-NEXT: beqz a2, .LBB36_6
	; RV64ZVE32F-NEXT: # %bb.5: # %cond.load4			; RV64ZVE32F-NEXT: # %bb.5: # %cond.load4
	; RV64ZVE32F-NEXT: vmv.x.s a2, v9			; RV64ZVE32F-NEXT: vmv.x.s a2, v9
	; RV64ZVE32F-NEXT: slli a2, a2, 2			; RV64ZVE32F-NEXT: slli a2, a2, 2
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: lw a2, 0(a2)			; RV64ZVE32F-NEXT: lw a2, 0(a2)
	; RV64ZVE32F-NEXT: vsetvli zero, zero, e32, m1, ta, ma			; RV64ZVE32F-NEXT: vmv.v.i v0, 4
	; RV64ZVE32F-NEXT: vmv.s.x v12, a2			; RV64ZVE32F-NEXT: vsetivli zero, 8, e32, m2, ta, ma
	; RV64ZVE32F-NEXT: vsetivli zero, 3, e32, m2, tu, ma			; RV64ZVE32F-NEXT: vmerge.vxm v10, v10, a2, v0
	; RV64ZVE32F-NEXT: vslideup.vi v10, v12, 2
	; RV64ZVE32F-NEXT: .LBB36_6: # %else5			; RV64ZVE32F-NEXT: .LBB36_6: # %else5
	; RV64ZVE32F-NEXT: vsetivli zero, 4, e8, mf2, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 4, e8, mf2, ta, ma
	; RV64ZVE32F-NEXT: andi a2, a1, 8			; RV64ZVE32F-NEXT: andi a2, a1, 8
	; RV64ZVE32F-NEXT: vslidedown.vi v8, v8, 4			; RV64ZVE32F-NEXT: vslidedown.vi v8, v8, 4
	; RV64ZVE32F-NEXT: bnez a2, .LBB36_13			; RV64ZVE32F-NEXT: bnez a2, .LBB36_13
	; RV64ZVE32F-NEXT: # %bb.7: # %else8			; RV64ZVE32F-NEXT: # %bb.7: # %else8
	; RV64ZVE32F-NEXT: andi a2, a1, 16			; RV64ZVE32F-NEXT: andi a2, a1, 16
	; RV64ZVE32F-NEXT: bnez a2, .LBB36_14			; RV64ZVE32F-NEXT: bnez a2, .LBB36_14
	Show All 24 Lines
	; RV64ZVE32F-NEXT: ret			; RV64ZVE32F-NEXT: ret
	; RV64ZVE32F-NEXT: .LBB36_13: # %cond.load7			; RV64ZVE32F-NEXT: .LBB36_13: # %cond.load7
	; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vslidedown.vi v9, v9, 1			; RV64ZVE32F-NEXT: vslidedown.vi v9, v9, 1
	; RV64ZVE32F-NEXT: vmv.x.s a2, v9			; RV64ZVE32F-NEXT: vmv.x.s a2, v9
	; RV64ZVE32F-NEXT: slli a2, a2, 2			; RV64ZVE32F-NEXT: slli a2, a2, 2
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: lw a2, 0(a2)			; RV64ZVE32F-NEXT: lw a2, 0(a2)
	; RV64ZVE32F-NEXT: vsetvli zero, zero, e32, m1, ta, ma			; RV64ZVE32F-NEXT: vmv.v.i v0, 8
	; RV64ZVE32F-NEXT: vmv.s.x v12, a2			; RV64ZVE32F-NEXT: vsetivli zero, 8, e32, m2, ta, ma
	; RV64ZVE32F-NEXT: vsetivli zero, 4, e32, m2, tu, ma			; RV64ZVE32F-NEXT: vmerge.vxm v10, v10, a2, v0
	; RV64ZVE32F-NEXT: vslideup.vi v10, v12, 3
	; RV64ZVE32F-NEXT: andi a2, a1, 16			; RV64ZVE32F-NEXT: andi a2, a1, 16
	; RV64ZVE32F-NEXT: beqz a2, .LBB36_8			; RV64ZVE32F-NEXT: beqz a2, .LBB36_8
	; RV64ZVE32F-NEXT: .LBB36_14: # %cond.load10			; RV64ZVE32F-NEXT: .LBB36_14: # %cond.load10
	; RV64ZVE32F-NEXT: vsetivli zero, 0, e8, mf4, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vmv.x.s a2, v8			; RV64ZVE32F-NEXT: vmv.x.s a2, v8
	; RV64ZVE32F-NEXT: slli a2, a2, 2			; RV64ZVE32F-NEXT: slli a2, a2, 2
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: lw a2, 0(a2)			; RV64ZVE32F-NEXT: lw a2, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 5, e32, m2, tu, ma			; RV64ZVE32F-NEXT: li a3, 16
	; RV64ZVE32F-NEXT: vmv.s.x v12, a2			; RV64ZVE32F-NEXT: vmv.v.x v0, a3
	; RV64ZVE32F-NEXT: vslideup.vi v10, v12, 4			; RV64ZVE32F-NEXT: vsetivli zero, 8, e32, m2, ta, ma
				; RV64ZVE32F-NEXT: vmerge.vxm v10, v10, a2, v0
	; RV64ZVE32F-NEXT: andi a2, a1, 32			; RV64ZVE32F-NEXT: andi a2, a1, 32
	; RV64ZVE32F-NEXT: bnez a2, .LBB36_9			; RV64ZVE32F-NEXT: bnez a2, .LBB36_9
	; RV64ZVE32F-NEXT: j .LBB36_10			; RV64ZVE32F-NEXT: j .LBB36_10
	; RV64ZVE32F-NEXT: .LBB36_15: # %cond.load16			; RV64ZVE32F-NEXT: .LBB36_15: # %cond.load16
	; RV64ZVE32F-NEXT: vmv.x.s a2, v8			; RV64ZVE32F-NEXT: vmv.x.s a2, v8
	; RV64ZVE32F-NEXT: slli a2, a2, 2			; RV64ZVE32F-NEXT: slli a2, a2, 2
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: lw a2, 0(a2)			; RV64ZVE32F-NEXT: lw a2, 0(a2)
	▲ Show 20 Lines • Show All 62 Lines • ▼ Show 20 Lines
	; RV64ZVE32F-NEXT: # %bb.3: # %cond.load1			; RV64ZVE32F-NEXT: # %bb.3: # %cond.load1
	; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vslidedown.vi v9, v8, 1			; RV64ZVE32F-NEXT: vslidedown.vi v9, v8, 1
	; RV64ZVE32F-NEXT: vmv.x.s a2, v9			; RV64ZVE32F-NEXT: vmv.x.s a2, v9
	; RV64ZVE32F-NEXT: andi a2, a2, 255			; RV64ZVE32F-NEXT: andi a2, a2, 255
	; RV64ZVE32F-NEXT: slli a2, a2, 2			; RV64ZVE32F-NEXT: slli a2, a2, 2
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: lw a2, 0(a2)			; RV64ZVE32F-NEXT: lw a2, 0(a2)
	; RV64ZVE32F-NEXT: vsetvli zero, zero, e32, m1, ta, ma			; RV64ZVE32F-NEXT: vmv.v.i v0, 2
	; RV64ZVE32F-NEXT: vmv.s.x v12, a2			; RV64ZVE32F-NEXT: vsetivli zero, 8, e32, m2, ta, ma
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e32, m2, tu, ma			; RV64ZVE32F-NEXT: vmerge.vxm v10, v10, a2, v0
	; RV64ZVE32F-NEXT: vslideup.vi v10, v12, 1
	; RV64ZVE32F-NEXT: .LBB37_4: # %else2			; RV64ZVE32F-NEXT: .LBB37_4: # %else2
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e8, mf4, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 2, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: andi a2, a1, 4			; RV64ZVE32F-NEXT: andi a2, a1, 4
	; RV64ZVE32F-NEXT: vslidedown.vi v9, v8, 2			; RV64ZVE32F-NEXT: vslidedown.vi v9, v8, 2
	; RV64ZVE32F-NEXT: beqz a2, .LBB37_6			; RV64ZVE32F-NEXT: beqz a2, .LBB37_6
	; RV64ZVE32F-NEXT: # %bb.5: # %cond.load4			; RV64ZVE32F-NEXT: # %bb.5: # %cond.load4
	; RV64ZVE32F-NEXT: vmv.x.s a2, v9			; RV64ZVE32F-NEXT: vmv.x.s a2, v9
	; RV64ZVE32F-NEXT: andi a2, a2, 255			; RV64ZVE32F-NEXT: andi a2, a2, 255
	; RV64ZVE32F-NEXT: slli a2, a2, 2			; RV64ZVE32F-NEXT: slli a2, a2, 2
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: lw a2, 0(a2)			; RV64ZVE32F-NEXT: lw a2, 0(a2)
	; RV64ZVE32F-NEXT: vsetvli zero, zero, e32, m1, ta, ma			; RV64ZVE32F-NEXT: vmv.v.i v0, 4
	; RV64ZVE32F-NEXT: vmv.s.x v12, a2			; RV64ZVE32F-NEXT: vsetivli zero, 8, e32, m2, ta, ma
	; RV64ZVE32F-NEXT: vsetivli zero, 3, e32, m2, tu, ma			; RV64ZVE32F-NEXT: vmerge.vxm v10, v10, a2, v0
	; RV64ZVE32F-NEXT: vslideup.vi v10, v12, 2
	; RV64ZVE32F-NEXT: .LBB37_6: # %else5			; RV64ZVE32F-NEXT: .LBB37_6: # %else5
	; RV64ZVE32F-NEXT: vsetivli zero, 4, e8, mf2, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 4, e8, mf2, ta, ma
	; RV64ZVE32F-NEXT: andi a2, a1, 8			; RV64ZVE32F-NEXT: andi a2, a1, 8
	; RV64ZVE32F-NEXT: vslidedown.vi v8, v8, 4			; RV64ZVE32F-NEXT: vslidedown.vi v8, v8, 4
	; RV64ZVE32F-NEXT: bnez a2, .LBB37_13			; RV64ZVE32F-NEXT: bnez a2, .LBB37_13
	; RV64ZVE32F-NEXT: # %bb.7: # %else8			; RV64ZVE32F-NEXT: # %bb.7: # %else8
	; RV64ZVE32F-NEXT: andi a2, a1, 16			; RV64ZVE32F-NEXT: andi a2, a1, 16
	; RV64ZVE32F-NEXT: bnez a2, .LBB37_14			; RV64ZVE32F-NEXT: bnez a2, .LBB37_14
	Show All 26 Lines
	; RV64ZVE32F-NEXT: .LBB37_13: # %cond.load7			; RV64ZVE32F-NEXT: .LBB37_13: # %cond.load7
	; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vslidedown.vi v9, v9, 1			; RV64ZVE32F-NEXT: vslidedown.vi v9, v9, 1
	; RV64ZVE32F-NEXT: vmv.x.s a2, v9			; RV64ZVE32F-NEXT: vmv.x.s a2, v9
	; RV64ZVE32F-NEXT: andi a2, a2, 255			; RV64ZVE32F-NEXT: andi a2, a2, 255
	; RV64ZVE32F-NEXT: slli a2, a2, 2			; RV64ZVE32F-NEXT: slli a2, a2, 2
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: lw a2, 0(a2)			; RV64ZVE32F-NEXT: lw a2, 0(a2)
	; RV64ZVE32F-NEXT: vsetvli zero, zero, e32, m1, ta, ma			; RV64ZVE32F-NEXT: vmv.v.i v0, 8
	; RV64ZVE32F-NEXT: vmv.s.x v12, a2			; RV64ZVE32F-NEXT: vsetivli zero, 8, e32, m2, ta, ma
	; RV64ZVE32F-NEXT: vsetivli zero, 4, e32, m2, tu, ma			; RV64ZVE32F-NEXT: vmerge.vxm v10, v10, a2, v0
	; RV64ZVE32F-NEXT: vslideup.vi v10, v12, 3
	; RV64ZVE32F-NEXT: andi a2, a1, 16			; RV64ZVE32F-NEXT: andi a2, a1, 16
	; RV64ZVE32F-NEXT: beqz a2, .LBB37_8			; RV64ZVE32F-NEXT: beqz a2, .LBB37_8
	; RV64ZVE32F-NEXT: .LBB37_14: # %cond.load10			; RV64ZVE32F-NEXT: .LBB37_14: # %cond.load10
	; RV64ZVE32F-NEXT: vsetivli zero, 0, e8, mf4, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vmv.x.s a2, v8			; RV64ZVE32F-NEXT: vmv.x.s a2, v8
	; RV64ZVE32F-NEXT: andi a2, a2, 255			; RV64ZVE32F-NEXT: andi a2, a2, 255
	; RV64ZVE32F-NEXT: slli a2, a2, 2			; RV64ZVE32F-NEXT: slli a2, a2, 2
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: lw a2, 0(a2)			; RV64ZVE32F-NEXT: lw a2, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 5, e32, m2, tu, ma			; RV64ZVE32F-NEXT: li a3, 16
	; RV64ZVE32F-NEXT: vmv.s.x v12, a2			; RV64ZVE32F-NEXT: vmv.v.x v0, a3
	; RV64ZVE32F-NEXT: vslideup.vi v10, v12, 4			; RV64ZVE32F-NEXT: vsetivli zero, 8, e32, m2, ta, ma
				; RV64ZVE32F-NEXT: vmerge.vxm v10, v10, a2, v0
	; RV64ZVE32F-NEXT: andi a2, a1, 32			; RV64ZVE32F-NEXT: andi a2, a1, 32
	; RV64ZVE32F-NEXT: bnez a2, .LBB37_9			; RV64ZVE32F-NEXT: bnez a2, .LBB37_9
	; RV64ZVE32F-NEXT: j .LBB37_10			; RV64ZVE32F-NEXT: j .LBB37_10
	; RV64ZVE32F-NEXT: .LBB37_15: # %cond.load16			; RV64ZVE32F-NEXT: .LBB37_15: # %cond.load16
	; RV64ZVE32F-NEXT: vmv.x.s a2, v8			; RV64ZVE32F-NEXT: vmv.x.s a2, v8
	; RV64ZVE32F-NEXT: andi a2, a2, 255			; RV64ZVE32F-NEXT: andi a2, a2, 255
	; RV64ZVE32F-NEXT: slli a2, a2, 2			; RV64ZVE32F-NEXT: slli a2, a2, 2
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	▲ Show 20 Lines • Show All 63 Lines • ▼ Show 20 Lines
	; RV64ZVE32F-NEXT: beqz a2, .LBB38_4			; RV64ZVE32F-NEXT: beqz a2, .LBB38_4
	; RV64ZVE32F-NEXT: # %bb.3: # %cond.load1			; RV64ZVE32F-NEXT: # %bb.3: # %cond.load1
	; RV64ZVE32F-NEXT: vsetivli zero, 1, e16, mf2, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e16, mf2, ta, ma
	; RV64ZVE32F-NEXT: vslidedown.vi v9, v8, 1			; RV64ZVE32F-NEXT: vslidedown.vi v9, v8, 1
	; RV64ZVE32F-NEXT: vmv.x.s a2, v9			; RV64ZVE32F-NEXT: vmv.x.s a2, v9
	; RV64ZVE32F-NEXT: slli a2, a2, 2			; RV64ZVE32F-NEXT: slli a2, a2, 2
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: lw a2, 0(a2)			; RV64ZVE32F-NEXT: lw a2, 0(a2)
	; RV64ZVE32F-NEXT: vsetvli zero, zero, e32, m1, ta, ma			; RV64ZVE32F-NEXT: vmv.v.i v0, 2
	; RV64ZVE32F-NEXT: vmv.s.x v12, a2			; RV64ZVE32F-NEXT: vsetivli zero, 8, e32, m2, ta, ma
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e32, m2, tu, ma			; RV64ZVE32F-NEXT: vmerge.vxm v10, v10, a2, v0
	; RV64ZVE32F-NEXT: vslideup.vi v10, v12, 1
	; RV64ZVE32F-NEXT: .LBB38_4: # %else2			; RV64ZVE32F-NEXT: .LBB38_4: # %else2
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e16, mf2, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 2, e16, mf2, ta, ma
	; RV64ZVE32F-NEXT: andi a2, a1, 4			; RV64ZVE32F-NEXT: andi a2, a1, 4
	; RV64ZVE32F-NEXT: vslidedown.vi v9, v8, 2			; RV64ZVE32F-NEXT: vslidedown.vi v9, v8, 2
	; RV64ZVE32F-NEXT: beqz a2, .LBB38_6			; RV64ZVE32F-NEXT: beqz a2, .LBB38_6
	; RV64ZVE32F-NEXT: # %bb.5: # %cond.load4			; RV64ZVE32F-NEXT: # %bb.5: # %cond.load4
	; RV64ZVE32F-NEXT: vmv.x.s a2, v9			; RV64ZVE32F-NEXT: vmv.x.s a2, v9
	; RV64ZVE32F-NEXT: slli a2, a2, 2			; RV64ZVE32F-NEXT: slli a2, a2, 2
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: lw a2, 0(a2)			; RV64ZVE32F-NEXT: lw a2, 0(a2)
	; RV64ZVE32F-NEXT: vsetvli zero, zero, e32, m1, ta, ma			; RV64ZVE32F-NEXT: vmv.v.i v0, 4
	; RV64ZVE32F-NEXT: vmv.s.x v12, a2			; RV64ZVE32F-NEXT: vsetivli zero, 8, e32, m2, ta, ma
	; RV64ZVE32F-NEXT: vsetivli zero, 3, e32, m2, tu, ma			; RV64ZVE32F-NEXT: vmerge.vxm v10, v10, a2, v0
	; RV64ZVE32F-NEXT: vslideup.vi v10, v12, 2
	; RV64ZVE32F-NEXT: .LBB38_6: # %else5			; RV64ZVE32F-NEXT: .LBB38_6: # %else5
	; RV64ZVE32F-NEXT: vsetivli zero, 4, e16, m1, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 4, e16, m1, ta, ma
	; RV64ZVE32F-NEXT: andi a2, a1, 8			; RV64ZVE32F-NEXT: andi a2, a1, 8
	; RV64ZVE32F-NEXT: vslidedown.vi v8, v8, 4			; RV64ZVE32F-NEXT: vslidedown.vi v8, v8, 4
	; RV64ZVE32F-NEXT: bnez a2, .LBB38_13			; RV64ZVE32F-NEXT: bnez a2, .LBB38_13
	; RV64ZVE32F-NEXT: # %bb.7: # %else8			; RV64ZVE32F-NEXT: # %bb.7: # %else8
	; RV64ZVE32F-NEXT: andi a2, a1, 16			; RV64ZVE32F-NEXT: andi a2, a1, 16
	; RV64ZVE32F-NEXT: bnez a2, .LBB38_14			; RV64ZVE32F-NEXT: bnez a2, .LBB38_14
	Show All 24 Lines
	; RV64ZVE32F-NEXT: ret			; RV64ZVE32F-NEXT: ret
	; RV64ZVE32F-NEXT: .LBB38_13: # %cond.load7			; RV64ZVE32F-NEXT: .LBB38_13: # %cond.load7
	; RV64ZVE32F-NEXT: vsetivli zero, 1, e16, mf2, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e16, mf2, ta, ma
	; RV64ZVE32F-NEXT: vslidedown.vi v9, v9, 1			; RV64ZVE32F-NEXT: vslidedown.vi v9, v9, 1
	; RV64ZVE32F-NEXT: vmv.x.s a2, v9			; RV64ZVE32F-NEXT: vmv.x.s a2, v9
	; RV64ZVE32F-NEXT: slli a2, a2, 2			; RV64ZVE32F-NEXT: slli a2, a2, 2
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: lw a2, 0(a2)			; RV64ZVE32F-NEXT: lw a2, 0(a2)
	; RV64ZVE32F-NEXT: vsetvli zero, zero, e32, m1, ta, ma			; RV64ZVE32F-NEXT: vmv.v.i v0, 8
	; RV64ZVE32F-NEXT: vmv.s.x v12, a2			; RV64ZVE32F-NEXT: vsetivli zero, 8, e32, m2, ta, ma
	; RV64ZVE32F-NEXT: vsetivli zero, 4, e32, m2, tu, ma			; RV64ZVE32F-NEXT: vmerge.vxm v10, v10, a2, v0
	; RV64ZVE32F-NEXT: vslideup.vi v10, v12, 3
	; RV64ZVE32F-NEXT: andi a2, a1, 16			; RV64ZVE32F-NEXT: andi a2, a1, 16
	; RV64ZVE32F-NEXT: beqz a2, .LBB38_8			; RV64ZVE32F-NEXT: beqz a2, .LBB38_8
	; RV64ZVE32F-NEXT: .LBB38_14: # %cond.load10			; RV64ZVE32F-NEXT: .LBB38_14: # %cond.load10
	; RV64ZVE32F-NEXT: vsetivli zero, 0, e16, mf2, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 0, e16, mf2, ta, ma
	; RV64ZVE32F-NEXT: vmv.x.s a2, v8			; RV64ZVE32F-NEXT: vmv.x.s a2, v8
	; RV64ZVE32F-NEXT: slli a2, a2, 2			; RV64ZVE32F-NEXT: slli a2, a2, 2
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: lw a2, 0(a2)			; RV64ZVE32F-NEXT: lw a2, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 5, e32, m2, tu, ma			; RV64ZVE32F-NEXT: li a3, 16
	; RV64ZVE32F-NEXT: vmv.s.x v12, a2			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vslideup.vi v10, v12, 4			; RV64ZVE32F-NEXT: vmv.v.x v0, a3
				; RV64ZVE32F-NEXT: vsetivli zero, 8, e32, m2, ta, ma
				; RV64ZVE32F-NEXT: vmerge.vxm v10, v10, a2, v0
	; RV64ZVE32F-NEXT: andi a2, a1, 32			; RV64ZVE32F-NEXT: andi a2, a1, 32
	; RV64ZVE32F-NEXT: bnez a2, .LBB38_9			; RV64ZVE32F-NEXT: bnez a2, .LBB38_9
	; RV64ZVE32F-NEXT: j .LBB38_10			; RV64ZVE32F-NEXT: j .LBB38_10
	; RV64ZVE32F-NEXT: .LBB38_15: # %cond.load16			; RV64ZVE32F-NEXT: .LBB38_15: # %cond.load16
	; RV64ZVE32F-NEXT: vmv.x.s a2, v8			; RV64ZVE32F-NEXT: vmv.x.s a2, v8
	; RV64ZVE32F-NEXT: slli a2, a2, 2			; RV64ZVE32F-NEXT: slli a2, a2, 2
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: lw a2, 0(a2)			; RV64ZVE32F-NEXT: lw a2, 0(a2)
	▲ Show 20 Lines • Show All 60 Lines • ▼ Show 20 Lines
	; RV64ZVE32F-NEXT: beqz a2, .LBB39_4			; RV64ZVE32F-NEXT: beqz a2, .LBB39_4
	; RV64ZVE32F-NEXT: # %bb.3: # %cond.load1			; RV64ZVE32F-NEXT: # %bb.3: # %cond.load1
	; RV64ZVE32F-NEXT: vsetivli zero, 1, e16, mf2, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e16, mf2, ta, ma
	; RV64ZVE32F-NEXT: vslidedown.vi v9, v8, 1			; RV64ZVE32F-NEXT: vslidedown.vi v9, v8, 1
	; RV64ZVE32F-NEXT: vmv.x.s a2, v9			; RV64ZVE32F-NEXT: vmv.x.s a2, v9
	; RV64ZVE32F-NEXT: slli a2, a2, 2			; RV64ZVE32F-NEXT: slli a2, a2, 2
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: lw a2, 0(a2)			; RV64ZVE32F-NEXT: lw a2, 0(a2)
	; RV64ZVE32F-NEXT: vsetvli zero, zero, e32, m1, ta, ma			; RV64ZVE32F-NEXT: vmv.v.i v0, 2
	; RV64ZVE32F-NEXT: vmv.s.x v12, a2			; RV64ZVE32F-NEXT: vsetivli zero, 8, e32, m2, ta, ma
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e32, m2, tu, ma			; RV64ZVE32F-NEXT: vmerge.vxm v10, v10, a2, v0
	; RV64ZVE32F-NEXT: vslideup.vi v10, v12, 1
	; RV64ZVE32F-NEXT: .LBB39_4: # %else2			; RV64ZVE32F-NEXT: .LBB39_4: # %else2
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e16, mf2, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 2, e16, mf2, ta, ma
	; RV64ZVE32F-NEXT: andi a2, a1, 4			; RV64ZVE32F-NEXT: andi a2, a1, 4
	; RV64ZVE32F-NEXT: vslidedown.vi v9, v8, 2			; RV64ZVE32F-NEXT: vslidedown.vi v9, v8, 2
	; RV64ZVE32F-NEXT: beqz a2, .LBB39_6			; RV64ZVE32F-NEXT: beqz a2, .LBB39_6
	; RV64ZVE32F-NEXT: # %bb.5: # %cond.load4			; RV64ZVE32F-NEXT: # %bb.5: # %cond.load4
	; RV64ZVE32F-NEXT: vmv.x.s a2, v9			; RV64ZVE32F-NEXT: vmv.x.s a2, v9
	; RV64ZVE32F-NEXT: slli a2, a2, 2			; RV64ZVE32F-NEXT: slli a2, a2, 2
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: lw a2, 0(a2)			; RV64ZVE32F-NEXT: lw a2, 0(a2)
	; RV64ZVE32F-NEXT: vsetvli zero, zero, e32, m1, ta, ma			; RV64ZVE32F-NEXT: vmv.v.i v0, 4
	; RV64ZVE32F-NEXT: vmv.s.x v12, a2			; RV64ZVE32F-NEXT: vsetivli zero, 8, e32, m2, ta, ma
	; RV64ZVE32F-NEXT: vsetivli zero, 3, e32, m2, tu, ma			; RV64ZVE32F-NEXT: vmerge.vxm v10, v10, a2, v0
	; RV64ZVE32F-NEXT: vslideup.vi v10, v12, 2
	; RV64ZVE32F-NEXT: .LBB39_6: # %else5			; RV64ZVE32F-NEXT: .LBB39_6: # %else5
	; RV64ZVE32F-NEXT: vsetivli zero, 4, e16, m1, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 4, e16, m1, ta, ma
	; RV64ZVE32F-NEXT: andi a2, a1, 8			; RV64ZVE32F-NEXT: andi a2, a1, 8
	; RV64ZVE32F-NEXT: vslidedown.vi v8, v8, 4			; RV64ZVE32F-NEXT: vslidedown.vi v8, v8, 4
	; RV64ZVE32F-NEXT: bnez a2, .LBB39_13			; RV64ZVE32F-NEXT: bnez a2, .LBB39_13
	; RV64ZVE32F-NEXT: # %bb.7: # %else8			; RV64ZVE32F-NEXT: # %bb.7: # %else8
	; RV64ZVE32F-NEXT: andi a2, a1, 16			; RV64ZVE32F-NEXT: andi a2, a1, 16
	; RV64ZVE32F-NEXT: bnez a2, .LBB39_14			; RV64ZVE32F-NEXT: bnez a2, .LBB39_14
	Show All 24 Lines
	; RV64ZVE32F-NEXT: ret			; RV64ZVE32F-NEXT: ret
	; RV64ZVE32F-NEXT: .LBB39_13: # %cond.load7			; RV64ZVE32F-NEXT: .LBB39_13: # %cond.load7
	; RV64ZVE32F-NEXT: vsetivli zero, 1, e16, mf2, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e16, mf2, ta, ma
	; RV64ZVE32F-NEXT: vslidedown.vi v9, v9, 1			; RV64ZVE32F-NEXT: vslidedown.vi v9, v9, 1
	; RV64ZVE32F-NEXT: vmv.x.s a2, v9			; RV64ZVE32F-NEXT: vmv.x.s a2, v9
	; RV64ZVE32F-NEXT: slli a2, a2, 2			; RV64ZVE32F-NEXT: slli a2, a2, 2
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: lw a2, 0(a2)			; RV64ZVE32F-NEXT: lw a2, 0(a2)
	; RV64ZVE32F-NEXT: vsetvli zero, zero, e32, m1, ta, ma			; RV64ZVE32F-NEXT: vmv.v.i v0, 8
	; RV64ZVE32F-NEXT: vmv.s.x v12, a2			; RV64ZVE32F-NEXT: vsetivli zero, 8, e32, m2, ta, ma
	; RV64ZVE32F-NEXT: vsetivli zero, 4, e32, m2, tu, ma			; RV64ZVE32F-NEXT: vmerge.vxm v10, v10, a2, v0
	; RV64ZVE32F-NEXT: vslideup.vi v10, v12, 3
	; RV64ZVE32F-NEXT: andi a2, a1, 16			; RV64ZVE32F-NEXT: andi a2, a1, 16
	; RV64ZVE32F-NEXT: beqz a2, .LBB39_8			; RV64ZVE32F-NEXT: beqz a2, .LBB39_8
	; RV64ZVE32F-NEXT: .LBB39_14: # %cond.load10			; RV64ZVE32F-NEXT: .LBB39_14: # %cond.load10
	; RV64ZVE32F-NEXT: vsetivli zero, 0, e16, mf2, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 0, e16, mf2, ta, ma
	; RV64ZVE32F-NEXT: vmv.x.s a2, v8			; RV64ZVE32F-NEXT: vmv.x.s a2, v8
	; RV64ZVE32F-NEXT: slli a2, a2, 2			; RV64ZVE32F-NEXT: slli a2, a2, 2
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: lw a2, 0(a2)			; RV64ZVE32F-NEXT: lw a2, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 5, e32, m2, tu, ma			; RV64ZVE32F-NEXT: li a3, 16
	; RV64ZVE32F-NEXT: vmv.s.x v12, a2			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vslideup.vi v10, v12, 4			; RV64ZVE32F-NEXT: vmv.v.x v0, a3
				; RV64ZVE32F-NEXT: vsetivli zero, 8, e32, m2, ta, ma
				; RV64ZVE32F-NEXT: vmerge.vxm v10, v10, a2, v0
	; RV64ZVE32F-NEXT: andi a2, a1, 32			; RV64ZVE32F-NEXT: andi a2, a1, 32
	; RV64ZVE32F-NEXT: bnez a2, .LBB39_9			; RV64ZVE32F-NEXT: bnez a2, .LBB39_9
	; RV64ZVE32F-NEXT: j .LBB39_10			; RV64ZVE32F-NEXT: j .LBB39_10
	; RV64ZVE32F-NEXT: .LBB39_15: # %cond.load16			; RV64ZVE32F-NEXT: .LBB39_15: # %cond.load16
	; RV64ZVE32F-NEXT: vmv.x.s a2, v8			; RV64ZVE32F-NEXT: vmv.x.s a2, v8
	; RV64ZVE32F-NEXT: slli a2, a2, 2			; RV64ZVE32F-NEXT: slli a2, a2, 2
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: lw a2, 0(a2)			; RV64ZVE32F-NEXT: lw a2, 0(a2)
	▲ Show 20 Lines • Show All 65 Lines • ▼ Show 20 Lines
	; RV64ZVE32F-NEXT: # %bb.3: # %cond.load1			; RV64ZVE32F-NEXT: # %bb.3: # %cond.load1
	; RV64ZVE32F-NEXT: vsetivli zero, 1, e16, mf2, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e16, mf2, ta, ma
	; RV64ZVE32F-NEXT: vslidedown.vi v9, v8, 1			; RV64ZVE32F-NEXT: vslidedown.vi v9, v8, 1
	; RV64ZVE32F-NEXT: vmv.x.s a3, v9			; RV64ZVE32F-NEXT: vmv.x.s a3, v9
	; RV64ZVE32F-NEXT: and a3, a3, a1			; RV64ZVE32F-NEXT: and a3, a3, a1
	; RV64ZVE32F-NEXT: slli a3, a3, 2			; RV64ZVE32F-NEXT: slli a3, a3, 2
	; RV64ZVE32F-NEXT: add a3, a0, a3			; RV64ZVE32F-NEXT: add a3, a0, a3
	; RV64ZVE32F-NEXT: lw a3, 0(a3)			; RV64ZVE32F-NEXT: lw a3, 0(a3)
	; RV64ZVE32F-NEXT: vsetvli zero, zero, e32, m1, ta, ma			; RV64ZVE32F-NEXT: vmv.v.i v0, 2
	; RV64ZVE32F-NEXT: vmv.s.x v12, a3			; RV64ZVE32F-NEXT: vsetivli zero, 8, e32, m2, ta, ma
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e32, m2, tu, ma			; RV64ZVE32F-NEXT: vmerge.vxm v10, v10, a3, v0
	; RV64ZVE32F-NEXT: vslideup.vi v10, v12, 1
	; RV64ZVE32F-NEXT: .LBB40_4: # %else2			; RV64ZVE32F-NEXT: .LBB40_4: # %else2
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e16, mf2, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 2, e16, mf2, ta, ma
	; RV64ZVE32F-NEXT: andi a3, a2, 4			; RV64ZVE32F-NEXT: andi a3, a2, 4
	; RV64ZVE32F-NEXT: vslidedown.vi v9, v8, 2			; RV64ZVE32F-NEXT: vslidedown.vi v9, v8, 2
	; RV64ZVE32F-NEXT: beqz a3, .LBB40_6			; RV64ZVE32F-NEXT: beqz a3, .LBB40_6
	; RV64ZVE32F-NEXT: # %bb.5: # %cond.load4			; RV64ZVE32F-NEXT: # %bb.5: # %cond.load4
	; RV64ZVE32F-NEXT: vmv.x.s a3, v9			; RV64ZVE32F-NEXT: vmv.x.s a3, v9
	; RV64ZVE32F-NEXT: and a3, a3, a1			; RV64ZVE32F-NEXT: and a3, a3, a1
	; RV64ZVE32F-NEXT: slli a3, a3, 2			; RV64ZVE32F-NEXT: slli a3, a3, 2
	; RV64ZVE32F-NEXT: add a3, a0, a3			; RV64ZVE32F-NEXT: add a3, a0, a3
	; RV64ZVE32F-NEXT: lw a3, 0(a3)			; RV64ZVE32F-NEXT: lw a3, 0(a3)
	; RV64ZVE32F-NEXT: vsetvli zero, zero, e32, m1, ta, ma			; RV64ZVE32F-NEXT: vmv.v.i v0, 4
	; RV64ZVE32F-NEXT: vmv.s.x v12, a3			; RV64ZVE32F-NEXT: vsetivli zero, 8, e32, m2, ta, ma
	; RV64ZVE32F-NEXT: vsetivli zero, 3, e32, m2, tu, ma			; RV64ZVE32F-NEXT: vmerge.vxm v10, v10, a3, v0
	; RV64ZVE32F-NEXT: vslideup.vi v10, v12, 2
	; RV64ZVE32F-NEXT: .LBB40_6: # %else5			; RV64ZVE32F-NEXT: .LBB40_6: # %else5
	; RV64ZVE32F-NEXT: vsetivli zero, 4, e16, m1, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 4, e16, m1, ta, ma
	; RV64ZVE32F-NEXT: andi a3, a2, 8			; RV64ZVE32F-NEXT: andi a3, a2, 8
	; RV64ZVE32F-NEXT: vslidedown.vi v8, v8, 4			; RV64ZVE32F-NEXT: vslidedown.vi v8, v8, 4
	; RV64ZVE32F-NEXT: bnez a3, .LBB40_13			; RV64ZVE32F-NEXT: bnez a3, .LBB40_13
	; RV64ZVE32F-NEXT: # %bb.7: # %else8			; RV64ZVE32F-NEXT: # %bb.7: # %else8
	; RV64ZVE32F-NEXT: andi a3, a2, 16			; RV64ZVE32F-NEXT: andi a3, a2, 16
	; RV64ZVE32F-NEXT: bnez a3, .LBB40_14			; RV64ZVE32F-NEXT: bnez a3, .LBB40_14
	Show All 26 Lines
	; RV64ZVE32F-NEXT: .LBB40_13: # %cond.load7			; RV64ZVE32F-NEXT: .LBB40_13: # %cond.load7
	; RV64ZVE32F-NEXT: vsetivli zero, 1, e16, mf2, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e16, mf2, ta, ma
	; RV64ZVE32F-NEXT: vslidedown.vi v9, v9, 1			; RV64ZVE32F-NEXT: vslidedown.vi v9, v9, 1
	; RV64ZVE32F-NEXT: vmv.x.s a3, v9			; RV64ZVE32F-NEXT: vmv.x.s a3, v9
	; RV64ZVE32F-NEXT: and a3, a3, a1			; RV64ZVE32F-NEXT: and a3, a3, a1
	; RV64ZVE32F-NEXT: slli a3, a3, 2			; RV64ZVE32F-NEXT: slli a3, a3, 2
	; RV64ZVE32F-NEXT: add a3, a0, a3			; RV64ZVE32F-NEXT: add a3, a0, a3
	; RV64ZVE32F-NEXT: lw a3, 0(a3)			; RV64ZVE32F-NEXT: lw a3, 0(a3)
	; RV64ZVE32F-NEXT: vsetvli zero, zero, e32, m1, ta, ma			; RV64ZVE32F-NEXT: vmv.v.i v0, 8
	; RV64ZVE32F-NEXT: vmv.s.x v12, a3			; RV64ZVE32F-NEXT: vsetivli zero, 8, e32, m2, ta, ma
	; RV64ZVE32F-NEXT: vsetivli zero, 4, e32, m2, tu, ma			; RV64ZVE32F-NEXT: vmerge.vxm v10, v10, a3, v0
	; RV64ZVE32F-NEXT: vslideup.vi v10, v12, 3
	; RV64ZVE32F-NEXT: andi a3, a2, 16			; RV64ZVE32F-NEXT: andi a3, a2, 16
	; RV64ZVE32F-NEXT: beqz a3, .LBB40_8			; RV64ZVE32F-NEXT: beqz a3, .LBB40_8
	; RV64ZVE32F-NEXT: .LBB40_14: # %cond.load10			; RV64ZVE32F-NEXT: .LBB40_14: # %cond.load10
	; RV64ZVE32F-NEXT: vsetivli zero, 0, e16, mf2, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 0, e16, mf2, ta, ma
	; RV64ZVE32F-NEXT: vmv.x.s a3, v8			; RV64ZVE32F-NEXT: vmv.x.s a3, v8
	; RV64ZVE32F-NEXT: and a3, a3, a1			; RV64ZVE32F-NEXT: and a3, a3, a1
	; RV64ZVE32F-NEXT: slli a3, a3, 2			; RV64ZVE32F-NEXT: slli a3, a3, 2
	; RV64ZVE32F-NEXT: add a3, a0, a3			; RV64ZVE32F-NEXT: add a3, a0, a3
	; RV64ZVE32F-NEXT: lw a3, 0(a3)			; RV64ZVE32F-NEXT: lw a3, 0(a3)
	; RV64ZVE32F-NEXT: vsetivli zero, 5, e32, m2, tu, ma			; RV64ZVE32F-NEXT: li a4, 16
	; RV64ZVE32F-NEXT: vmv.s.x v12, a3			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vslideup.vi v10, v12, 4			; RV64ZVE32F-NEXT: vmv.v.x v0, a4
				; RV64ZVE32F-NEXT: vsetivli zero, 8, e32, m2, ta, ma
				; RV64ZVE32F-NEXT: vmerge.vxm v10, v10, a3, v0
	; RV64ZVE32F-NEXT: andi a3, a2, 32			; RV64ZVE32F-NEXT: andi a3, a2, 32
	; RV64ZVE32F-NEXT: bnez a3, .LBB40_9			; RV64ZVE32F-NEXT: bnez a3, .LBB40_9
	; RV64ZVE32F-NEXT: j .LBB40_10			; RV64ZVE32F-NEXT: j .LBB40_10
	; RV64ZVE32F-NEXT: .LBB40_15: # %cond.load16			; RV64ZVE32F-NEXT: .LBB40_15: # %cond.load16
	; RV64ZVE32F-NEXT: vmv.x.s a3, v8			; RV64ZVE32F-NEXT: vmv.x.s a3, v8
	; RV64ZVE32F-NEXT: and a3, a3, a1			; RV64ZVE32F-NEXT: and a3, a3, a1
	; RV64ZVE32F-NEXT: slli a3, a3, 2			; RV64ZVE32F-NEXT: slli a3, a3, 2
	; RV64ZVE32F-NEXT: add a3, a0, a3			; RV64ZVE32F-NEXT: add a3, a0, a3
	▲ Show 20 Lines • Show All 62 Lines • ▼ Show 20 Lines
	; RV64ZVE32F-NEXT: beqz a2, .LBB41_4			; RV64ZVE32F-NEXT: beqz a2, .LBB41_4
	; RV64ZVE32F-NEXT: # %bb.3: # %cond.load1			; RV64ZVE32F-NEXT: # %bb.3: # %cond.load1
	; RV64ZVE32F-NEXT: vsetivli zero, 1, e32, m1, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e32, m1, ta, ma
	; RV64ZVE32F-NEXT: vslidedown.vi v12, v8, 1			; RV64ZVE32F-NEXT: vslidedown.vi v12, v8, 1
	; RV64ZVE32F-NEXT: vmv.x.s a2, v12			; RV64ZVE32F-NEXT: vmv.x.s a2, v12
	; RV64ZVE32F-NEXT: slli a2, a2, 2			; RV64ZVE32F-NEXT: slli a2, a2, 2
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: lw a2, 0(a2)			; RV64ZVE32F-NEXT: lw a2, 0(a2)
	; RV64ZVE32F-NEXT: vmv.s.x v12, a2			; RV64ZVE32F-NEXT: vmv.v.i v0, 2
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e32, m2, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 8, e32, m2, ta, ma
	; RV64ZVE32F-NEXT: vslideup.vi v10, v12, 1			; RV64ZVE32F-NEXT: vmerge.vxm v10, v10, a2, v0
	; RV64ZVE32F-NEXT: .LBB41_4: # %else2			; RV64ZVE32F-NEXT: .LBB41_4: # %else2
	; RV64ZVE32F-NEXT: vsetivli zero, 4, e32, m2, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 4, e32, m2, ta, ma
	; RV64ZVE32F-NEXT: vslidedown.vi v12, v8, 4			; RV64ZVE32F-NEXT: vslidedown.vi v12, v8, 4
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e32, m1, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 2, e32, m1, ta, ma
	; RV64ZVE32F-NEXT: andi a2, a1, 4			; RV64ZVE32F-NEXT: andi a2, a1, 4
	; RV64ZVE32F-NEXT: vslidedown.vi v8, v8, 2			; RV64ZVE32F-NEXT: vslidedown.vi v8, v8, 2
	; RV64ZVE32F-NEXT: bnez a2, .LBB41_12			; RV64ZVE32F-NEXT: bnez a2, .LBB41_12
	; RV64ZVE32F-NEXT: # %bb.5: # %else5			; RV64ZVE32F-NEXT: # %bb.5: # %else5
	Show All 26 Lines
	; RV64ZVE32F-NEXT: .LBB41_11: # %else20			; RV64ZVE32F-NEXT: .LBB41_11: # %else20
	; RV64ZVE32F-NEXT: vmv2r.v v8, v10			; RV64ZVE32F-NEXT: vmv2r.v v8, v10
	; RV64ZVE32F-NEXT: ret			; RV64ZVE32F-NEXT: ret
	; RV64ZVE32F-NEXT: .LBB41_12: # %cond.load4			; RV64ZVE32F-NEXT: .LBB41_12: # %cond.load4
	; RV64ZVE32F-NEXT: vmv.x.s a2, v8			; RV64ZVE32F-NEXT: vmv.x.s a2, v8
	; RV64ZVE32F-NEXT: slli a2, a2, 2			; RV64ZVE32F-NEXT: slli a2, a2, 2
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: lw a2, 0(a2)			; RV64ZVE32F-NEXT: lw a2, 0(a2)
	; RV64ZVE32F-NEXT: vmv.s.x v14, a2			; RV64ZVE32F-NEXT: vmv.v.i v0, 4
	; RV64ZVE32F-NEXT: vsetivli zero, 3, e32, m2, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 8, e32, m2, ta, ma
	; RV64ZVE32F-NEXT: vslideup.vi v10, v14, 2			; RV64ZVE32F-NEXT: vmerge.vxm v10, v10, a2, v0
	; RV64ZVE32F-NEXT: andi a2, a1, 8			; RV64ZVE32F-NEXT: andi a2, a1, 8
	; RV64ZVE32F-NEXT: beqz a2, .LBB41_6			; RV64ZVE32F-NEXT: beqz a2, .LBB41_6
	; RV64ZVE32F-NEXT: .LBB41_13: # %cond.load7			; RV64ZVE32F-NEXT: .LBB41_13: # %cond.load7
	; RV64ZVE32F-NEXT: vsetivli zero, 1, e32, m1, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e32, m1, ta, ma
	; RV64ZVE32F-NEXT: vslidedown.vi v8, v8, 1			; RV64ZVE32F-NEXT: vslidedown.vi v8, v8, 1
	; RV64ZVE32F-NEXT: vmv.x.s a2, v8			; RV64ZVE32F-NEXT: vmv.x.s a2, v8
	; RV64ZVE32F-NEXT: slli a2, a2, 2			; RV64ZVE32F-NEXT: slli a2, a2, 2
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: lw a2, 0(a2)			; RV64ZVE32F-NEXT: lw a2, 0(a2)
	; RV64ZVE32F-NEXT: vmv.s.x v8, a2			; RV64ZVE32F-NEXT: vmv.v.i v0, 8
	; RV64ZVE32F-NEXT: vsetivli zero, 4, e32, m2, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 8, e32, m2, ta, ma
	; RV64ZVE32F-NEXT: vslideup.vi v10, v8, 3			; RV64ZVE32F-NEXT: vmerge.vxm v10, v10, a2, v0
	; RV64ZVE32F-NEXT: andi a2, a1, 16			; RV64ZVE32F-NEXT: andi a2, a1, 16
	; RV64ZVE32F-NEXT: beqz a2, .LBB41_7			; RV64ZVE32F-NEXT: beqz a2, .LBB41_7
	; RV64ZVE32F-NEXT: .LBB41_14: # %cond.load10			; RV64ZVE32F-NEXT: .LBB41_14: # %cond.load10
	; RV64ZVE32F-NEXT: vsetivli zero, 0, e32, m1, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 0, e32, m1, ta, ma
	; RV64ZVE32F-NEXT: vmv.x.s a2, v12			; RV64ZVE32F-NEXT: vmv.x.s a2, v12
	; RV64ZVE32F-NEXT: slli a2, a2, 2			; RV64ZVE32F-NEXT: slli a2, a2, 2
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: lw a2, 0(a2)			; RV64ZVE32F-NEXT: lw a2, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 5, e32, m2, tu, ma			; RV64ZVE32F-NEXT: li a3, 16
	; RV64ZVE32F-NEXT: vmv.s.x v8, a2			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vslideup.vi v10, v8, 4			; RV64ZVE32F-NEXT: vmv.v.x v0, a3
				; RV64ZVE32F-NEXT: vsetivli zero, 8, e32, m2, ta, ma
				; RV64ZVE32F-NEXT: vmerge.vxm v10, v10, a2, v0
	; RV64ZVE32F-NEXT: andi a2, a1, 32			; RV64ZVE32F-NEXT: andi a2, a1, 32
	; RV64ZVE32F-NEXT: bnez a2, .LBB41_8			; RV64ZVE32F-NEXT: bnez a2, .LBB41_8
	; RV64ZVE32F-NEXT: j .LBB41_9			; RV64ZVE32F-NEXT: j .LBB41_9
	; RV64ZVE32F-NEXT: .LBB41_15: # %cond.load16			; RV64ZVE32F-NEXT: .LBB41_15: # %cond.load16
	; RV64ZVE32F-NEXT: vmv.x.s a2, v8			; RV64ZVE32F-NEXT: vmv.x.s a2, v8
	; RV64ZVE32F-NEXT: slli a2, a2, 2			; RV64ZVE32F-NEXT: slli a2, a2, 2
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: lw a2, 0(a2)			; RV64ZVE32F-NEXT: lw a2, 0(a2)
	▲ Show 20 Lines • Show All 3,559 Lines • ▼ Show 20 Lines
	; RV64ZVE32F-NEXT: .LBB59_3: # %cond.load			; RV64ZVE32F-NEXT: .LBB59_3: # %cond.load
	; RV64ZVE32F-NEXT: flh fa5, 0(a0)			; RV64ZVE32F-NEXT: flh fa5, 0(a0)
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e16, mf2, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 2, e16, mf2, tu, ma
	; RV64ZVE32F-NEXT: vfmv.s.f v8, fa5			; RV64ZVE32F-NEXT: vfmv.s.f v8, fa5
	; RV64ZVE32F-NEXT: andi a2, a2, 2			; RV64ZVE32F-NEXT: andi a2, a2, 2
	; RV64ZVE32F-NEXT: beqz a2, .LBB59_2			; RV64ZVE32F-NEXT: beqz a2, .LBB59_2
	; RV64ZVE32F-NEXT: .LBB59_4: # %cond.load1			; RV64ZVE32F-NEXT: .LBB59_4: # %cond.load1
	; RV64ZVE32F-NEXT: flh fa5, 0(a1)			; RV64ZVE32F-NEXT: flh fa5, 0(a1)
				; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
				; RV64ZVE32F-NEXT: vmv.v.i v0, 2
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e16, mf2, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 2, e16, mf2, ta, ma
	; RV64ZVE32F-NEXT: vfmv.s.f v9, fa5			; RV64ZVE32F-NEXT: vfmerge.vfm v8, v8, fa5, v0
	; RV64ZVE32F-NEXT: vslideup.vi v8, v9, 1
	; RV64ZVE32F-NEXT: ret			; RV64ZVE32F-NEXT: ret
	%v = call <2 x half> @llvm.masked.gather.v2f16.v2p0(<2 x ptr> %ptrs, i32 2, <2 x i1> %m, <2 x half> %passthru)			%v = call <2 x half> @llvm.masked.gather.v2f16.v2p0(<2 x ptr> %ptrs, i32 2, <2 x i1> %m, <2 x half> %passthru)
	ret <2 x half> %v			ret <2 x half> %v
	}			}

	declare <4 x half> @llvm.masked.gather.v4f16.v4p0(<4 x ptr>, i32, <4 x i1>, <4 x half>)			declare <4 x half> @llvm.masked.gather.v4f16.v4p0(<4 x ptr>, i32, <4 x i1>, <4 x half>)

	define <4 x half> @mgather_v4f16(<4 x ptr> %ptrs, <4 x i1> %m, <4 x half> %passthru) {			define <4 x half> @mgather_v4f16(<4 x ptr> %ptrs, <4 x i1> %m, <4 x half> %passthru) {
	Show All 33 Lines
	; RV64ZVE32F-NEXT: flh fa5, 0(a2)			; RV64ZVE32F-NEXT: flh fa5, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 4, e16, mf2, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 4, e16, mf2, tu, ma
	; RV64ZVE32F-NEXT: vfmv.s.f v8, fa5			; RV64ZVE32F-NEXT: vfmv.s.f v8, fa5
	; RV64ZVE32F-NEXT: andi a2, a1, 2			; RV64ZVE32F-NEXT: andi a2, a1, 2
	; RV64ZVE32F-NEXT: beqz a2, .LBB60_2			; RV64ZVE32F-NEXT: beqz a2, .LBB60_2
	; RV64ZVE32F-NEXT: .LBB60_6: # %cond.load1			; RV64ZVE32F-NEXT: .LBB60_6: # %cond.load1
	; RV64ZVE32F-NEXT: ld a2, 8(a0)			; RV64ZVE32F-NEXT: ld a2, 8(a0)
	; RV64ZVE32F-NEXT: flh fa5, 0(a2)			; RV64ZVE32F-NEXT: flh fa5, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e16, mf2, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vfmv.s.f v9, fa5			; RV64ZVE32F-NEXT: vmv.v.i v0, 2
	; RV64ZVE32F-NEXT: vslideup.vi v8, v9, 1			; RV64ZVE32F-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
				; RV64ZVE32F-NEXT: vfmerge.vfm v8, v8, fa5, v0
	; RV64ZVE32F-NEXT: andi a2, a1, 4			; RV64ZVE32F-NEXT: andi a2, a1, 4
	; RV64ZVE32F-NEXT: beqz a2, .LBB60_3			; RV64ZVE32F-NEXT: beqz a2, .LBB60_3
	; RV64ZVE32F-NEXT: .LBB60_7: # %cond.load4			; RV64ZVE32F-NEXT: .LBB60_7: # %cond.load4
	; RV64ZVE32F-NEXT: ld a2, 16(a0)			; RV64ZVE32F-NEXT: ld a2, 16(a0)
	; RV64ZVE32F-NEXT: flh fa5, 0(a2)			; RV64ZVE32F-NEXT: flh fa5, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 3, e16, mf2, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vfmv.s.f v9, fa5			; RV64ZVE32F-NEXT: vmv.v.i v0, 4
	; RV64ZVE32F-NEXT: vslideup.vi v8, v9, 2			; RV64ZVE32F-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
				; RV64ZVE32F-NEXT: vfmerge.vfm v8, v8, fa5, v0
	; RV64ZVE32F-NEXT: andi a1, a1, 8			; RV64ZVE32F-NEXT: andi a1, a1, 8
	; RV64ZVE32F-NEXT: beqz a1, .LBB60_4			; RV64ZVE32F-NEXT: beqz a1, .LBB60_4
	; RV64ZVE32F-NEXT: .LBB60_8: # %cond.load7			; RV64ZVE32F-NEXT: .LBB60_8: # %cond.load7
	; RV64ZVE32F-NEXT: ld a0, 24(a0)			; RV64ZVE32F-NEXT: ld a0, 24(a0)
	; RV64ZVE32F-NEXT: flh fa5, 0(a0)			; RV64ZVE32F-NEXT: flh fa5, 0(a0)
				; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
				; RV64ZVE32F-NEXT: vmv.v.i v0, 8
	; RV64ZVE32F-NEXT: vsetivli zero, 4, e16, mf2, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
	; RV64ZVE32F-NEXT: vfmv.s.f v9, fa5			; RV64ZVE32F-NEXT: vfmerge.vfm v8, v8, fa5, v0
	; RV64ZVE32F-NEXT: vslideup.vi v8, v9, 3
	; RV64ZVE32F-NEXT: ret			; RV64ZVE32F-NEXT: ret
	%v = call <4 x half> @llvm.masked.gather.v4f16.v4p0(<4 x ptr> %ptrs, i32 2, <4 x i1> %m, <4 x half> %passthru)			%v = call <4 x half> @llvm.masked.gather.v4f16.v4p0(<4 x ptr> %ptrs, i32 2, <4 x i1> %m, <4 x half> %passthru)
	ret <4 x half> %v			ret <4 x half> %v
	}			}

	define <4 x half> @mgather_truemask_v4f16(<4 x ptr> %ptrs, <4 x half> %passthru) {			define <4 x half> @mgather_truemask_v4f16(<4 x ptr> %ptrs, <4 x half> %passthru) {
	; RV32-LABEL: mgather_truemask_v4f16:			; RV32-LABEL: mgather_truemask_v4f16:
	; RV32: # %bb.0:			; RV32: # %bb.0:
	Show All 31 Lines
	; RV64ZVE32F-NEXT: flh fa5, 0(a2)			; RV64ZVE32F-NEXT: flh fa5, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 4, e16, mf2, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 4, e16, mf2, tu, ma
	; RV64ZVE32F-NEXT: vfmv.s.f v8, fa5			; RV64ZVE32F-NEXT: vfmv.s.f v8, fa5
	; RV64ZVE32F-NEXT: andi a2, a1, 2			; RV64ZVE32F-NEXT: andi a2, a1, 2
	; RV64ZVE32F-NEXT: beqz a2, .LBB61_2			; RV64ZVE32F-NEXT: beqz a2, .LBB61_2
	; RV64ZVE32F-NEXT: .LBB61_6: # %cond.load1			; RV64ZVE32F-NEXT: .LBB61_6: # %cond.load1
	; RV64ZVE32F-NEXT: ld a2, 8(a0)			; RV64ZVE32F-NEXT: ld a2, 8(a0)
	; RV64ZVE32F-NEXT: flh fa5, 0(a2)			; RV64ZVE32F-NEXT: flh fa5, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e16, mf2, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vfmv.s.f v9, fa5			; RV64ZVE32F-NEXT: vmv.v.i v0, 2
	; RV64ZVE32F-NEXT: vslideup.vi v8, v9, 1			; RV64ZVE32F-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
				; RV64ZVE32F-NEXT: vfmerge.vfm v8, v8, fa5, v0
	; RV64ZVE32F-NEXT: andi a2, a1, 4			; RV64ZVE32F-NEXT: andi a2, a1, 4
	; RV64ZVE32F-NEXT: beqz a2, .LBB61_3			; RV64ZVE32F-NEXT: beqz a2, .LBB61_3
	; RV64ZVE32F-NEXT: .LBB61_7: # %cond.load4			; RV64ZVE32F-NEXT: .LBB61_7: # %cond.load4
	; RV64ZVE32F-NEXT: ld a2, 16(a0)			; RV64ZVE32F-NEXT: ld a2, 16(a0)
	; RV64ZVE32F-NEXT: flh fa5, 0(a2)			; RV64ZVE32F-NEXT: flh fa5, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 3, e16, mf2, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vfmv.s.f v9, fa5			; RV64ZVE32F-NEXT: vmv.v.i v0, 4
	; RV64ZVE32F-NEXT: vslideup.vi v8, v9, 2			; RV64ZVE32F-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
				; RV64ZVE32F-NEXT: vfmerge.vfm v8, v8, fa5, v0
	; RV64ZVE32F-NEXT: andi a1, a1, 8			; RV64ZVE32F-NEXT: andi a1, a1, 8
	; RV64ZVE32F-NEXT: beqz a1, .LBB61_4			; RV64ZVE32F-NEXT: beqz a1, .LBB61_4
	; RV64ZVE32F-NEXT: .LBB61_8: # %cond.load7			; RV64ZVE32F-NEXT: .LBB61_8: # %cond.load7
	; RV64ZVE32F-NEXT: ld a0, 24(a0)			; RV64ZVE32F-NEXT: ld a0, 24(a0)
	; RV64ZVE32F-NEXT: flh fa5, 0(a0)			; RV64ZVE32F-NEXT: flh fa5, 0(a0)
				; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
				; RV64ZVE32F-NEXT: vmv.v.i v0, 8
	; RV64ZVE32F-NEXT: vsetivli zero, 4, e16, mf2, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 4, e16, mf2, ta, ma
	; RV64ZVE32F-NEXT: vfmv.s.f v9, fa5			; RV64ZVE32F-NEXT: vfmerge.vfm v8, v8, fa5, v0
	; RV64ZVE32F-NEXT: vslideup.vi v8, v9, 3
	; RV64ZVE32F-NEXT: ret			; RV64ZVE32F-NEXT: ret
	%mhead = insertelement <4 x i1> poison, i1 1, i32 0			%mhead = insertelement <4 x i1> poison, i1 1, i32 0
	%mtrue = shufflevector <4 x i1> %mhead, <4 x i1> poison, <4 x i32> zeroinitializer			%mtrue = shufflevector <4 x i1> %mhead, <4 x i1> poison, <4 x i32> zeroinitializer
	%v = call <4 x half> @llvm.masked.gather.v4f16.v4p0(<4 x ptr> %ptrs, i32 2, <4 x i1> %mtrue, <4 x half> %passthru)			%v = call <4 x half> @llvm.masked.gather.v4f16.v4p0(<4 x ptr> %ptrs, i32 2, <4 x i1> %mtrue, <4 x half> %passthru)
	ret <4 x half> %v			ret <4 x half> %v
	}			}

	define <4 x half> @mgather_falsemask_v4f16(<4 x ptr> %ptrs, <4 x half> %passthru) {			define <4 x half> @mgather_falsemask_v4f16(<4 x ptr> %ptrs, <4 x half> %passthru) {
	▲ Show 20 Lines • Show All 65 Lines • ▼ Show 20 Lines
	; RV64ZVE32F-NEXT: flh fa5, 0(a2)			; RV64ZVE32F-NEXT: flh fa5, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 8, e16, m1, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 8, e16, m1, tu, ma
	; RV64ZVE32F-NEXT: vfmv.s.f v8, fa5			; RV64ZVE32F-NEXT: vfmv.s.f v8, fa5
	; RV64ZVE32F-NEXT: andi a2, a1, 2			; RV64ZVE32F-NEXT: andi a2, a1, 2
	; RV64ZVE32F-NEXT: beqz a2, .LBB63_2			; RV64ZVE32F-NEXT: beqz a2, .LBB63_2
	; RV64ZVE32F-NEXT: .LBB63_10: # %cond.load1			; RV64ZVE32F-NEXT: .LBB63_10: # %cond.load1
	; RV64ZVE32F-NEXT: ld a2, 8(a0)			; RV64ZVE32F-NEXT: ld a2, 8(a0)
	; RV64ZVE32F-NEXT: flh fa5, 0(a2)			; RV64ZVE32F-NEXT: flh fa5, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e16, m1, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vfmv.s.f v9, fa5			; RV64ZVE32F-NEXT: vmv.v.i v0, 2
	; RV64ZVE32F-NEXT: vslideup.vi v8, v9, 1			; RV64ZVE32F-NEXT: vsetivli zero, 8, e16, m1, ta, ma
				; RV64ZVE32F-NEXT: vfmerge.vfm v8, v8, fa5, v0
	; RV64ZVE32F-NEXT: andi a2, a1, 4			; RV64ZVE32F-NEXT: andi a2, a1, 4
	; RV64ZVE32F-NEXT: beqz a2, .LBB63_3			; RV64ZVE32F-NEXT: beqz a2, .LBB63_3
	; RV64ZVE32F-NEXT: .LBB63_11: # %cond.load4			; RV64ZVE32F-NEXT: .LBB63_11: # %cond.load4
	; RV64ZVE32F-NEXT: ld a2, 16(a0)			; RV64ZVE32F-NEXT: ld a2, 16(a0)
	; RV64ZVE32F-NEXT: flh fa5, 0(a2)			; RV64ZVE32F-NEXT: flh fa5, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 3, e16, m1, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vfmv.s.f v9, fa5			; RV64ZVE32F-NEXT: vmv.v.i v0, 4
	; RV64ZVE32F-NEXT: vslideup.vi v8, v9, 2			; RV64ZVE32F-NEXT: vsetivli zero, 8, e16, m1, ta, ma
				; RV64ZVE32F-NEXT: vfmerge.vfm v8, v8, fa5, v0
	; RV64ZVE32F-NEXT: andi a2, a1, 8			; RV64ZVE32F-NEXT: andi a2, a1, 8
	; RV64ZVE32F-NEXT: beqz a2, .LBB63_4			; RV64ZVE32F-NEXT: beqz a2, .LBB63_4
	; RV64ZVE32F-NEXT: .LBB63_12: # %cond.load7			; RV64ZVE32F-NEXT: .LBB63_12: # %cond.load7
	; RV64ZVE32F-NEXT: ld a2, 24(a0)			; RV64ZVE32F-NEXT: ld a2, 24(a0)
	; RV64ZVE32F-NEXT: flh fa5, 0(a2)			; RV64ZVE32F-NEXT: flh fa5, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 4, e16, m1, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vfmv.s.f v9, fa5			; RV64ZVE32F-NEXT: vmv.v.i v0, 8
	; RV64ZVE32F-NEXT: vslideup.vi v8, v9, 3			; RV64ZVE32F-NEXT: vsetivli zero, 8, e16, m1, ta, ma
				; RV64ZVE32F-NEXT: vfmerge.vfm v8, v8, fa5, v0
	; RV64ZVE32F-NEXT: andi a2, a1, 16			; RV64ZVE32F-NEXT: andi a2, a1, 16
	; RV64ZVE32F-NEXT: beqz a2, .LBB63_5			; RV64ZVE32F-NEXT: beqz a2, .LBB63_5
	; RV64ZVE32F-NEXT: .LBB63_13: # %cond.load10			; RV64ZVE32F-NEXT: .LBB63_13: # %cond.load10
	; RV64ZVE32F-NEXT: ld a2, 32(a0)			; RV64ZVE32F-NEXT: ld a2, 32(a0)
	; RV64ZVE32F-NEXT: flh fa5, 0(a2)			; RV64ZVE32F-NEXT: flh fa5, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 5, e16, m1, tu, ma			; RV64ZVE32F-NEXT: li a2, 16
	; RV64ZVE32F-NEXT: vfmv.s.f v9, fa5			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vslideup.vi v8, v9, 4			; RV64ZVE32F-NEXT: vmv.v.x v0, a2
				; RV64ZVE32F-NEXT: vsetivli zero, 8, e16, m1, ta, ma
				; RV64ZVE32F-NEXT: vfmerge.vfm v8, v8, fa5, v0
	; RV64ZVE32F-NEXT: andi a2, a1, 32			; RV64ZVE32F-NEXT: andi a2, a1, 32
	; RV64ZVE32F-NEXT: beqz a2, .LBB63_6			; RV64ZVE32F-NEXT: beqz a2, .LBB63_6
	; RV64ZVE32F-NEXT: .LBB63_14: # %cond.load13			; RV64ZVE32F-NEXT: .LBB63_14: # %cond.load13
	; RV64ZVE32F-NEXT: ld a2, 40(a0)			; RV64ZVE32F-NEXT: ld a2, 40(a0)
	; RV64ZVE32F-NEXT: flh fa5, 0(a2)			; RV64ZVE32F-NEXT: flh fa5, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 6, e16, m1, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 6, e16, m1, tu, ma
	; RV64ZVE32F-NEXT: vfmv.s.f v9, fa5			; RV64ZVE32F-NEXT: vfmv.s.f v9, fa5
	; RV64ZVE32F-NEXT: vslideup.vi v8, v9, 5			; RV64ZVE32F-NEXT: vslideup.vi v8, v9, 5
	▲ Show 20 Lines • Show All 57 Lines • ▼ Show 20 Lines
	; RV64ZVE32F-NEXT: beqz a2, .LBB64_4			; RV64ZVE32F-NEXT: beqz a2, .LBB64_4
	; RV64ZVE32F-NEXT: # %bb.3: # %cond.load1			; RV64ZVE32F-NEXT: # %bb.3: # %cond.load1
	; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vslidedown.vi v10, v8, 1			; RV64ZVE32F-NEXT: vslidedown.vi v10, v8, 1
	; RV64ZVE32F-NEXT: vmv.x.s a2, v10			; RV64ZVE32F-NEXT: vmv.x.s a2, v10
	; RV64ZVE32F-NEXT: slli a2, a2, 1			; RV64ZVE32F-NEXT: slli a2, a2, 1
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: flh fa5, 0(a2)			; RV64ZVE32F-NEXT: flh fa5, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e16, m1, tu, ma			; RV64ZVE32F-NEXT: vmv.v.i v0, 2
	; RV64ZVE32F-NEXT: vfmv.s.f v10, fa5			; RV64ZVE32F-NEXT: vsetivli zero, 8, e16, m1, ta, ma
	; RV64ZVE32F-NEXT: vslideup.vi v9, v10, 1			; RV64ZVE32F-NEXT: vfmerge.vfm v9, v9, fa5, v0
	; RV64ZVE32F-NEXT: .LBB64_4: # %else2			; RV64ZVE32F-NEXT: .LBB64_4: # %else2
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e8, mf4, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 2, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: andi a2, a1, 4			; RV64ZVE32F-NEXT: andi a2, a1, 4
	; RV64ZVE32F-NEXT: vslidedown.vi v10, v8, 2			; RV64ZVE32F-NEXT: vslidedown.vi v10, v8, 2
	; RV64ZVE32F-NEXT: beqz a2, .LBB64_6			; RV64ZVE32F-NEXT: beqz a2, .LBB64_6
	; RV64ZVE32F-NEXT: # %bb.5: # %cond.load4			; RV64ZVE32F-NEXT: # %bb.5: # %cond.load4
	; RV64ZVE32F-NEXT: vmv.x.s a2, v10			; RV64ZVE32F-NEXT: vmv.x.s a2, v10
	; RV64ZVE32F-NEXT: slli a2, a2, 1			; RV64ZVE32F-NEXT: slli a2, a2, 1
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: flh fa5, 0(a2)			; RV64ZVE32F-NEXT: flh fa5, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 3, e16, m1, tu, ma			; RV64ZVE32F-NEXT: vmv.v.i v0, 4
	; RV64ZVE32F-NEXT: vfmv.s.f v11, fa5			; RV64ZVE32F-NEXT: vsetivli zero, 8, e16, m1, ta, ma
	; RV64ZVE32F-NEXT: vslideup.vi v9, v11, 2			; RV64ZVE32F-NEXT: vfmerge.vfm v9, v9, fa5, v0
	; RV64ZVE32F-NEXT: .LBB64_6: # %else5			; RV64ZVE32F-NEXT: .LBB64_6: # %else5
	; RV64ZVE32F-NEXT: vsetivli zero, 4, e8, mf2, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 4, e8, mf2, ta, ma
	; RV64ZVE32F-NEXT: andi a2, a1, 8			; RV64ZVE32F-NEXT: andi a2, a1, 8
	; RV64ZVE32F-NEXT: vslidedown.vi v8, v8, 4			; RV64ZVE32F-NEXT: vslidedown.vi v8, v8, 4
	; RV64ZVE32F-NEXT: bnez a2, .LBB64_13			; RV64ZVE32F-NEXT: bnez a2, .LBB64_13
	; RV64ZVE32F-NEXT: # %bb.7: # %else8			; RV64ZVE32F-NEXT: # %bb.7: # %else8
	; RV64ZVE32F-NEXT: andi a2, a1, 16			; RV64ZVE32F-NEXT: andi a2, a1, 16
	; RV64ZVE32F-NEXT: bnez a2, .LBB64_14			; RV64ZVE32F-NEXT: bnez a2, .LBB64_14
	Show All 23 Lines
	; RV64ZVE32F-NEXT: ret			; RV64ZVE32F-NEXT: ret
	; RV64ZVE32F-NEXT: .LBB64_13: # %cond.load7			; RV64ZVE32F-NEXT: .LBB64_13: # %cond.load7
	; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vslidedown.vi v10, v10, 1			; RV64ZVE32F-NEXT: vslidedown.vi v10, v10, 1
	; RV64ZVE32F-NEXT: vmv.x.s a2, v10			; RV64ZVE32F-NEXT: vmv.x.s a2, v10
	; RV64ZVE32F-NEXT: slli a2, a2, 1			; RV64ZVE32F-NEXT: slli a2, a2, 1
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: flh fa5, 0(a2)			; RV64ZVE32F-NEXT: flh fa5, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 4, e16, m1, tu, ma			; RV64ZVE32F-NEXT: vmv.v.i v0, 8
	; RV64ZVE32F-NEXT: vfmv.s.f v10, fa5			; RV64ZVE32F-NEXT: vsetivli zero, 8, e16, m1, ta, ma
	; RV64ZVE32F-NEXT: vslideup.vi v9, v10, 3			; RV64ZVE32F-NEXT: vfmerge.vfm v9, v9, fa5, v0
	; RV64ZVE32F-NEXT: andi a2, a1, 16			; RV64ZVE32F-NEXT: andi a2, a1, 16
	; RV64ZVE32F-NEXT: beqz a2, .LBB64_8			; RV64ZVE32F-NEXT: beqz a2, .LBB64_8
	; RV64ZVE32F-NEXT: .LBB64_14: # %cond.load10			; RV64ZVE32F-NEXT: .LBB64_14: # %cond.load10
	; RV64ZVE32F-NEXT: vsetivli zero, 0, e8, mf4, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vmv.x.s a2, v8			; RV64ZVE32F-NEXT: vmv.x.s a2, v8
	; RV64ZVE32F-NEXT: slli a2, a2, 1			; RV64ZVE32F-NEXT: slli a2, a2, 1
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: flh fa5, 0(a2)			; RV64ZVE32F-NEXT: flh fa5, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 5, e16, m1, tu, ma			; RV64ZVE32F-NEXT: li a2, 16
	; RV64ZVE32F-NEXT: vfmv.s.f v10, fa5			; RV64ZVE32F-NEXT: vmv.v.x v0, a2
	; RV64ZVE32F-NEXT: vslideup.vi v9, v10, 4			; RV64ZVE32F-NEXT: vsetivli zero, 8, e16, m1, ta, ma
				; RV64ZVE32F-NEXT: vfmerge.vfm v9, v9, fa5, v0
	; RV64ZVE32F-NEXT: andi a2, a1, 32			; RV64ZVE32F-NEXT: andi a2, a1, 32
	; RV64ZVE32F-NEXT: bnez a2, .LBB64_9			; RV64ZVE32F-NEXT: bnez a2, .LBB64_9
	; RV64ZVE32F-NEXT: j .LBB64_10			; RV64ZVE32F-NEXT: j .LBB64_10
	; RV64ZVE32F-NEXT: .LBB64_15: # %cond.load16			; RV64ZVE32F-NEXT: .LBB64_15: # %cond.load16
	; RV64ZVE32F-NEXT: vmv.x.s a2, v8			; RV64ZVE32F-NEXT: vmv.x.s a2, v8
	; RV64ZVE32F-NEXT: slli a2, a2, 1			; RV64ZVE32F-NEXT: slli a2, a2, 1
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: flh fa5, 0(a2)			; RV64ZVE32F-NEXT: flh fa5, 0(a2)
	▲ Show 20 Lines • Show All 58 Lines • ▼ Show 20 Lines
	; RV64ZVE32F-NEXT: beqz a2, .LBB65_4			; RV64ZVE32F-NEXT: beqz a2, .LBB65_4
	; RV64ZVE32F-NEXT: # %bb.3: # %cond.load1			; RV64ZVE32F-NEXT: # %bb.3: # %cond.load1
	; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vslidedown.vi v10, v8, 1			; RV64ZVE32F-NEXT: vslidedown.vi v10, v8, 1
	; RV64ZVE32F-NEXT: vmv.x.s a2, v10			; RV64ZVE32F-NEXT: vmv.x.s a2, v10
	; RV64ZVE32F-NEXT: slli a2, a2, 1			; RV64ZVE32F-NEXT: slli a2, a2, 1
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: flh fa5, 0(a2)			; RV64ZVE32F-NEXT: flh fa5, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e16, m1, tu, ma			; RV64ZVE32F-NEXT: vmv.v.i v0, 2
	; RV64ZVE32F-NEXT: vfmv.s.f v10, fa5			; RV64ZVE32F-NEXT: vsetivli zero, 8, e16, m1, ta, ma
	; RV64ZVE32F-NEXT: vslideup.vi v9, v10, 1			; RV64ZVE32F-NEXT: vfmerge.vfm v9, v9, fa5, v0
	; RV64ZVE32F-NEXT: .LBB65_4: # %else2			; RV64ZVE32F-NEXT: .LBB65_4: # %else2
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e8, mf4, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 2, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: andi a2, a1, 4			; RV64ZVE32F-NEXT: andi a2, a1, 4
	; RV64ZVE32F-NEXT: vslidedown.vi v10, v8, 2			; RV64ZVE32F-NEXT: vslidedown.vi v10, v8, 2
	; RV64ZVE32F-NEXT: beqz a2, .LBB65_6			; RV64ZVE32F-NEXT: beqz a2, .LBB65_6
	; RV64ZVE32F-NEXT: # %bb.5: # %cond.load4			; RV64ZVE32F-NEXT: # %bb.5: # %cond.load4
	; RV64ZVE32F-NEXT: vmv.x.s a2, v10			; RV64ZVE32F-NEXT: vmv.x.s a2, v10
	; RV64ZVE32F-NEXT: slli a2, a2, 1			; RV64ZVE32F-NEXT: slli a2, a2, 1
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: flh fa5, 0(a2)			; RV64ZVE32F-NEXT: flh fa5, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 3, e16, m1, tu, ma			; RV64ZVE32F-NEXT: vmv.v.i v0, 4
	; RV64ZVE32F-NEXT: vfmv.s.f v11, fa5			; RV64ZVE32F-NEXT: vsetivli zero, 8, e16, m1, ta, ma
	; RV64ZVE32F-NEXT: vslideup.vi v9, v11, 2			; RV64ZVE32F-NEXT: vfmerge.vfm v9, v9, fa5, v0
	; RV64ZVE32F-NEXT: .LBB65_6: # %else5			; RV64ZVE32F-NEXT: .LBB65_6: # %else5
	; RV64ZVE32F-NEXT: vsetivli zero, 4, e8, mf2, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 4, e8, mf2, ta, ma
	; RV64ZVE32F-NEXT: andi a2, a1, 8			; RV64ZVE32F-NEXT: andi a2, a1, 8
	; RV64ZVE32F-NEXT: vslidedown.vi v8, v8, 4			; RV64ZVE32F-NEXT: vslidedown.vi v8, v8, 4
	; RV64ZVE32F-NEXT: bnez a2, .LBB65_13			; RV64ZVE32F-NEXT: bnez a2, .LBB65_13
	; RV64ZVE32F-NEXT: # %bb.7: # %else8			; RV64ZVE32F-NEXT: # %bb.7: # %else8
	; RV64ZVE32F-NEXT: andi a2, a1, 16			; RV64ZVE32F-NEXT: andi a2, a1, 16
	; RV64ZVE32F-NEXT: bnez a2, .LBB65_14			; RV64ZVE32F-NEXT: bnez a2, .LBB65_14
	Show All 23 Lines
	; RV64ZVE32F-NEXT: ret			; RV64ZVE32F-NEXT: ret
	; RV64ZVE32F-NEXT: .LBB65_13: # %cond.load7			; RV64ZVE32F-NEXT: .LBB65_13: # %cond.load7
	; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vslidedown.vi v10, v10, 1			; RV64ZVE32F-NEXT: vslidedown.vi v10, v10, 1
	; RV64ZVE32F-NEXT: vmv.x.s a2, v10			; RV64ZVE32F-NEXT: vmv.x.s a2, v10
	; RV64ZVE32F-NEXT: slli a2, a2, 1			; RV64ZVE32F-NEXT: slli a2, a2, 1
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: flh fa5, 0(a2)			; RV64ZVE32F-NEXT: flh fa5, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 4, e16, m1, tu, ma			; RV64ZVE32F-NEXT: vmv.v.i v0, 8
	; RV64ZVE32F-NEXT: vfmv.s.f v10, fa5			; RV64ZVE32F-NEXT: vsetivli zero, 8, e16, m1, ta, ma
	; RV64ZVE32F-NEXT: vslideup.vi v9, v10, 3			; RV64ZVE32F-NEXT: vfmerge.vfm v9, v9, fa5, v0
	; RV64ZVE32F-NEXT: andi a2, a1, 16			; RV64ZVE32F-NEXT: andi a2, a1, 16
	; RV64ZVE32F-NEXT: beqz a2, .LBB65_8			; RV64ZVE32F-NEXT: beqz a2, .LBB65_8
	; RV64ZVE32F-NEXT: .LBB65_14: # %cond.load10			; RV64ZVE32F-NEXT: .LBB65_14: # %cond.load10
	; RV64ZVE32F-NEXT: vsetivli zero, 0, e8, mf4, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vmv.x.s a2, v8			; RV64ZVE32F-NEXT: vmv.x.s a2, v8
	; RV64ZVE32F-NEXT: slli a2, a2, 1			; RV64ZVE32F-NEXT: slli a2, a2, 1
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: flh fa5, 0(a2)			; RV64ZVE32F-NEXT: flh fa5, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 5, e16, m1, tu, ma			; RV64ZVE32F-NEXT: li a2, 16
	; RV64ZVE32F-NEXT: vfmv.s.f v10, fa5			; RV64ZVE32F-NEXT: vmv.v.x v0, a2
	; RV64ZVE32F-NEXT: vslideup.vi v9, v10, 4			; RV64ZVE32F-NEXT: vsetivli zero, 8, e16, m1, ta, ma
				; RV64ZVE32F-NEXT: vfmerge.vfm v9, v9, fa5, v0
	; RV64ZVE32F-NEXT: andi a2, a1, 32			; RV64ZVE32F-NEXT: andi a2, a1, 32
	; RV64ZVE32F-NEXT: bnez a2, .LBB65_9			; RV64ZVE32F-NEXT: bnez a2, .LBB65_9
	; RV64ZVE32F-NEXT: j .LBB65_10			; RV64ZVE32F-NEXT: j .LBB65_10
	; RV64ZVE32F-NEXT: .LBB65_15: # %cond.load16			; RV64ZVE32F-NEXT: .LBB65_15: # %cond.load16
	; RV64ZVE32F-NEXT: vmv.x.s a2, v8			; RV64ZVE32F-NEXT: vmv.x.s a2, v8
	; RV64ZVE32F-NEXT: slli a2, a2, 1			; RV64ZVE32F-NEXT: slli a2, a2, 1
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: flh fa5, 0(a2)			; RV64ZVE32F-NEXT: flh fa5, 0(a2)
	▲ Show 20 Lines • Show All 61 Lines • ▼ Show 20 Lines
	; RV64ZVE32F-NEXT: # %bb.3: # %cond.load1			; RV64ZVE32F-NEXT: # %bb.3: # %cond.load1
	; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vslidedown.vi v10, v8, 1			; RV64ZVE32F-NEXT: vslidedown.vi v10, v8, 1
	; RV64ZVE32F-NEXT: vmv.x.s a2, v10			; RV64ZVE32F-NEXT: vmv.x.s a2, v10
	; RV64ZVE32F-NEXT: andi a2, a2, 255			; RV64ZVE32F-NEXT: andi a2, a2, 255
	; RV64ZVE32F-NEXT: slli a2, a2, 1			; RV64ZVE32F-NEXT: slli a2, a2, 1
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: flh fa5, 0(a2)			; RV64ZVE32F-NEXT: flh fa5, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e16, m1, tu, ma			; RV64ZVE32F-NEXT: vmv.v.i v0, 2
	; RV64ZVE32F-NEXT: vfmv.s.f v10, fa5			; RV64ZVE32F-NEXT: vsetivli zero, 8, e16, m1, ta, ma
	; RV64ZVE32F-NEXT: vslideup.vi v9, v10, 1			; RV64ZVE32F-NEXT: vfmerge.vfm v9, v9, fa5, v0
	; RV64ZVE32F-NEXT: .LBB66_4: # %else2			; RV64ZVE32F-NEXT: .LBB66_4: # %else2
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e8, mf4, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 2, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: andi a2, a1, 4			; RV64ZVE32F-NEXT: andi a2, a1, 4
	; RV64ZVE32F-NEXT: vslidedown.vi v10, v8, 2			; RV64ZVE32F-NEXT: vslidedown.vi v10, v8, 2
	; RV64ZVE32F-NEXT: beqz a2, .LBB66_6			; RV64ZVE32F-NEXT: beqz a2, .LBB66_6
	; RV64ZVE32F-NEXT: # %bb.5: # %cond.load4			; RV64ZVE32F-NEXT: # %bb.5: # %cond.load4
	; RV64ZVE32F-NEXT: vmv.x.s a2, v10			; RV64ZVE32F-NEXT: vmv.x.s a2, v10
	; RV64ZVE32F-NEXT: andi a2, a2, 255			; RV64ZVE32F-NEXT: andi a2, a2, 255
	; RV64ZVE32F-NEXT: slli a2, a2, 1			; RV64ZVE32F-NEXT: slli a2, a2, 1
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: flh fa5, 0(a2)			; RV64ZVE32F-NEXT: flh fa5, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 3, e16, m1, tu, ma			; RV64ZVE32F-NEXT: vmv.v.i v0, 4
	; RV64ZVE32F-NEXT: vfmv.s.f v11, fa5			; RV64ZVE32F-NEXT: vsetivli zero, 8, e16, m1, ta, ma
	; RV64ZVE32F-NEXT: vslideup.vi v9, v11, 2			; RV64ZVE32F-NEXT: vfmerge.vfm v9, v9, fa5, v0
	; RV64ZVE32F-NEXT: .LBB66_6: # %else5			; RV64ZVE32F-NEXT: .LBB66_6: # %else5
	; RV64ZVE32F-NEXT: vsetivli zero, 4, e8, mf2, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 4, e8, mf2, ta, ma
	; RV64ZVE32F-NEXT: andi a2, a1, 8			; RV64ZVE32F-NEXT: andi a2, a1, 8
	; RV64ZVE32F-NEXT: vslidedown.vi v8, v8, 4			; RV64ZVE32F-NEXT: vslidedown.vi v8, v8, 4
	; RV64ZVE32F-NEXT: bnez a2, .LBB66_13			; RV64ZVE32F-NEXT: bnez a2, .LBB66_13
	; RV64ZVE32F-NEXT: # %bb.7: # %else8			; RV64ZVE32F-NEXT: # %bb.7: # %else8
	; RV64ZVE32F-NEXT: andi a2, a1, 16			; RV64ZVE32F-NEXT: andi a2, a1, 16
	; RV64ZVE32F-NEXT: bnez a2, .LBB66_14			; RV64ZVE32F-NEXT: bnez a2, .LBB66_14
	Show All 25 Lines
	; RV64ZVE32F-NEXT: .LBB66_13: # %cond.load7			; RV64ZVE32F-NEXT: .LBB66_13: # %cond.load7
	; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vslidedown.vi v10, v10, 1			; RV64ZVE32F-NEXT: vslidedown.vi v10, v10, 1
	; RV64ZVE32F-NEXT: vmv.x.s a2, v10			; RV64ZVE32F-NEXT: vmv.x.s a2, v10
	; RV64ZVE32F-NEXT: andi a2, a2, 255			; RV64ZVE32F-NEXT: andi a2, a2, 255
	; RV64ZVE32F-NEXT: slli a2, a2, 1			; RV64ZVE32F-NEXT: slli a2, a2, 1
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: flh fa5, 0(a2)			; RV64ZVE32F-NEXT: flh fa5, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 4, e16, m1, tu, ma			; RV64ZVE32F-NEXT: vmv.v.i v0, 8
	; RV64ZVE32F-NEXT: vfmv.s.f v10, fa5			; RV64ZVE32F-NEXT: vsetivli zero, 8, e16, m1, ta, ma
	; RV64ZVE32F-NEXT: vslideup.vi v9, v10, 3			; RV64ZVE32F-NEXT: vfmerge.vfm v9, v9, fa5, v0
	; RV64ZVE32F-NEXT: andi a2, a1, 16			; RV64ZVE32F-NEXT: andi a2, a1, 16
	; RV64ZVE32F-NEXT: beqz a2, .LBB66_8			; RV64ZVE32F-NEXT: beqz a2, .LBB66_8
	; RV64ZVE32F-NEXT: .LBB66_14: # %cond.load10			; RV64ZVE32F-NEXT: .LBB66_14: # %cond.load10
	; RV64ZVE32F-NEXT: vsetivli zero, 0, e8, mf4, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vmv.x.s a2, v8			; RV64ZVE32F-NEXT: vmv.x.s a2, v8
	; RV64ZVE32F-NEXT: andi a2, a2, 255			; RV64ZVE32F-NEXT: andi a2, a2, 255
	; RV64ZVE32F-NEXT: slli a2, a2, 1			; RV64ZVE32F-NEXT: slli a2, a2, 1
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: flh fa5, 0(a2)			; RV64ZVE32F-NEXT: flh fa5, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 5, e16, m1, tu, ma			; RV64ZVE32F-NEXT: li a2, 16
	; RV64ZVE32F-NEXT: vfmv.s.f v10, fa5			; RV64ZVE32F-NEXT: vmv.v.x v0, a2
	; RV64ZVE32F-NEXT: vslideup.vi v9, v10, 4			; RV64ZVE32F-NEXT: vsetivli zero, 8, e16, m1, ta, ma
				; RV64ZVE32F-NEXT: vfmerge.vfm v9, v9, fa5, v0
	; RV64ZVE32F-NEXT: andi a2, a1, 32			; RV64ZVE32F-NEXT: andi a2, a1, 32
	; RV64ZVE32F-NEXT: bnez a2, .LBB66_9			; RV64ZVE32F-NEXT: bnez a2, .LBB66_9
	; RV64ZVE32F-NEXT: j .LBB66_10			; RV64ZVE32F-NEXT: j .LBB66_10
	; RV64ZVE32F-NEXT: .LBB66_15: # %cond.load16			; RV64ZVE32F-NEXT: .LBB66_15: # %cond.load16
	; RV64ZVE32F-NEXT: vmv.x.s a2, v8			; RV64ZVE32F-NEXT: vmv.x.s a2, v8
	; RV64ZVE32F-NEXT: andi a2, a2, 255			; RV64ZVE32F-NEXT: andi a2, a2, 255
	; RV64ZVE32F-NEXT: slli a2, a2, 1			; RV64ZVE32F-NEXT: slli a2, a2, 1
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	▲ Show 20 Lines • Show All 60 Lines • ▼ Show 20 Lines
	; RV64ZVE32F-NEXT: beqz a2, .LBB67_4			; RV64ZVE32F-NEXT: beqz a2, .LBB67_4
	; RV64ZVE32F-NEXT: # %bb.3: # %cond.load1			; RV64ZVE32F-NEXT: # %bb.3: # %cond.load1
	; RV64ZVE32F-NEXT: vsetivli zero, 1, e16, mf2, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e16, mf2, ta, ma
	; RV64ZVE32F-NEXT: vslidedown.vi v10, v8, 1			; RV64ZVE32F-NEXT: vslidedown.vi v10, v8, 1
	; RV64ZVE32F-NEXT: vmv.x.s a2, v10			; RV64ZVE32F-NEXT: vmv.x.s a2, v10
	; RV64ZVE32F-NEXT: slli a2, a2, 1			; RV64ZVE32F-NEXT: slli a2, a2, 1
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: flh fa5, 0(a2)			; RV64ZVE32F-NEXT: flh fa5, 0(a2)
	; RV64ZVE32F-NEXT: vfmv.s.f v10, fa5			; RV64ZVE32F-NEXT: vmv.v.i v0, 2
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e16, m1, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 8, e16, m1, ta, ma
	; RV64ZVE32F-NEXT: vslideup.vi v9, v10, 1			; RV64ZVE32F-NEXT: vfmerge.vfm v9, v9, fa5, v0
	; RV64ZVE32F-NEXT: .LBB67_4: # %else2			; RV64ZVE32F-NEXT: .LBB67_4: # %else2
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e16, mf2, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 2, e16, mf2, ta, ma
	; RV64ZVE32F-NEXT: andi a2, a1, 4			; RV64ZVE32F-NEXT: andi a2, a1, 4
	; RV64ZVE32F-NEXT: vslidedown.vi v10, v8, 2			; RV64ZVE32F-NEXT: vslidedown.vi v10, v8, 2
	; RV64ZVE32F-NEXT: beqz a2, .LBB67_6			; RV64ZVE32F-NEXT: beqz a2, .LBB67_6
	; RV64ZVE32F-NEXT: # %bb.5: # %cond.load4			; RV64ZVE32F-NEXT: # %bb.5: # %cond.load4
	; RV64ZVE32F-NEXT: vmv.x.s a2, v10			; RV64ZVE32F-NEXT: vmv.x.s a2, v10
	; RV64ZVE32F-NEXT: slli a2, a2, 1			; RV64ZVE32F-NEXT: slli a2, a2, 1
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: flh fa5, 0(a2)			; RV64ZVE32F-NEXT: flh fa5, 0(a2)
	; RV64ZVE32F-NEXT: vfmv.s.f v11, fa5			; RV64ZVE32F-NEXT: vmv.v.i v0, 4
	; RV64ZVE32F-NEXT: vsetivli zero, 3, e16, m1, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 8, e16, m1, ta, ma
	; RV64ZVE32F-NEXT: vslideup.vi v9, v11, 2			; RV64ZVE32F-NEXT: vfmerge.vfm v9, v9, fa5, v0
	; RV64ZVE32F-NEXT: .LBB67_6: # %else5			; RV64ZVE32F-NEXT: .LBB67_6: # %else5
	; RV64ZVE32F-NEXT: vsetivli zero, 4, e16, m1, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 4, e16, m1, ta, ma
	; RV64ZVE32F-NEXT: andi a2, a1, 8			; RV64ZVE32F-NEXT: andi a2, a1, 8
	; RV64ZVE32F-NEXT: vslidedown.vi v8, v8, 4			; RV64ZVE32F-NEXT: vslidedown.vi v8, v8, 4
	; RV64ZVE32F-NEXT: bnez a2, .LBB67_13			; RV64ZVE32F-NEXT: bnez a2, .LBB67_13
	; RV64ZVE32F-NEXT: # %bb.7: # %else8			; RV64ZVE32F-NEXT: # %bb.7: # %else8
	; RV64ZVE32F-NEXT: andi a2, a1, 16			; RV64ZVE32F-NEXT: andi a2, a1, 16
	; RV64ZVE32F-NEXT: bnez a2, .LBB67_14			; RV64ZVE32F-NEXT: bnez a2, .LBB67_14
	Show All 23 Lines
	; RV64ZVE32F-NEXT: ret			; RV64ZVE32F-NEXT: ret
	; RV64ZVE32F-NEXT: .LBB67_13: # %cond.load7			; RV64ZVE32F-NEXT: .LBB67_13: # %cond.load7
	; RV64ZVE32F-NEXT: vsetivli zero, 1, e16, mf2, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e16, mf2, ta, ma
	; RV64ZVE32F-NEXT: vslidedown.vi v10, v10, 1			; RV64ZVE32F-NEXT: vslidedown.vi v10, v10, 1
	; RV64ZVE32F-NEXT: vmv.x.s a2, v10			; RV64ZVE32F-NEXT: vmv.x.s a2, v10
	; RV64ZVE32F-NEXT: slli a2, a2, 1			; RV64ZVE32F-NEXT: slli a2, a2, 1
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: flh fa5, 0(a2)			; RV64ZVE32F-NEXT: flh fa5, 0(a2)
	; RV64ZVE32F-NEXT: vfmv.s.f v10, fa5			; RV64ZVE32F-NEXT: vmv.v.i v0, 8
	; RV64ZVE32F-NEXT: vsetivli zero, 4, e16, m1, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 8, e16, m1, ta, ma
	; RV64ZVE32F-NEXT: vslideup.vi v9, v10, 3			; RV64ZVE32F-NEXT: vfmerge.vfm v9, v9, fa5, v0
	; RV64ZVE32F-NEXT: andi a2, a1, 16			; RV64ZVE32F-NEXT: andi a2, a1, 16
	; RV64ZVE32F-NEXT: beqz a2, .LBB67_8			; RV64ZVE32F-NEXT: beqz a2, .LBB67_8
	; RV64ZVE32F-NEXT: .LBB67_14: # %cond.load10			; RV64ZVE32F-NEXT: .LBB67_14: # %cond.load10
	; RV64ZVE32F-NEXT: vsetivli zero, 0, e16, mf2, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 0, e16, mf2, ta, ma
	; RV64ZVE32F-NEXT: vmv.x.s a2, v8			; RV64ZVE32F-NEXT: vmv.x.s a2, v8
	; RV64ZVE32F-NEXT: slli a2, a2, 1			; RV64ZVE32F-NEXT: slli a2, a2, 1
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: flh fa5, 0(a2)			; RV64ZVE32F-NEXT: flh fa5, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 5, e16, m1, tu, ma			; RV64ZVE32F-NEXT: li a2, 16
	; RV64ZVE32F-NEXT: vfmv.s.f v10, fa5			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vslideup.vi v9, v10, 4			; RV64ZVE32F-NEXT: vmv.v.x v0, a2
				; RV64ZVE32F-NEXT: vsetivli zero, 8, e16, m1, ta, ma
				; RV64ZVE32F-NEXT: vfmerge.vfm v9, v9, fa5, v0
	; RV64ZVE32F-NEXT: andi a2, a1, 32			; RV64ZVE32F-NEXT: andi a2, a1, 32
	; RV64ZVE32F-NEXT: bnez a2, .LBB67_9			; RV64ZVE32F-NEXT: bnez a2, .LBB67_9
	; RV64ZVE32F-NEXT: j .LBB67_10			; RV64ZVE32F-NEXT: j .LBB67_10
	; RV64ZVE32F-NEXT: .LBB67_15: # %cond.load16			; RV64ZVE32F-NEXT: .LBB67_15: # %cond.load16
	; RV64ZVE32F-NEXT: vmv.x.s a2, v8			; RV64ZVE32F-NEXT: vmv.x.s a2, v8
	; RV64ZVE32F-NEXT: slli a2, a2, 1			; RV64ZVE32F-NEXT: slli a2, a2, 1
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: flh fa5, 0(a2)			; RV64ZVE32F-NEXT: flh fa5, 0(a2)
	▲ Show 20 Lines • Show All 95 Lines • ▼ Show 20 Lines
	; RV64ZVE32F-NEXT: .LBB69_3: # %cond.load			; RV64ZVE32F-NEXT: .LBB69_3: # %cond.load
	; RV64ZVE32F-NEXT: flw fa5, 0(a0)			; RV64ZVE32F-NEXT: flw fa5, 0(a0)
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e32, m1, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 2, e32, m1, tu, ma
	; RV64ZVE32F-NEXT: vfmv.s.f v8, fa5			; RV64ZVE32F-NEXT: vfmv.s.f v8, fa5
	; RV64ZVE32F-NEXT: andi a2, a2, 2			; RV64ZVE32F-NEXT: andi a2, a2, 2
	; RV64ZVE32F-NEXT: beqz a2, .LBB69_2			; RV64ZVE32F-NEXT: beqz a2, .LBB69_2
	; RV64ZVE32F-NEXT: .LBB69_4: # %cond.load1			; RV64ZVE32F-NEXT: .LBB69_4: # %cond.load1
	; RV64ZVE32F-NEXT: flw fa5, 0(a1)			; RV64ZVE32F-NEXT: flw fa5, 0(a1)
				; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
				; RV64ZVE32F-NEXT: vmv.v.i v0, 2
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e32, m1, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 2, e32, m1, ta, ma
	; RV64ZVE32F-NEXT: vfmv.s.f v9, fa5			; RV64ZVE32F-NEXT: vfmerge.vfm v8, v8, fa5, v0
	; RV64ZVE32F-NEXT: vslideup.vi v8, v9, 1
	; RV64ZVE32F-NEXT: ret			; RV64ZVE32F-NEXT: ret
	%v = call <2 x float> @llvm.masked.gather.v2f32.v2p0(<2 x ptr> %ptrs, i32 4, <2 x i1> %m, <2 x float> %passthru)			%v = call <2 x float> @llvm.masked.gather.v2f32.v2p0(<2 x ptr> %ptrs, i32 4, <2 x i1> %m, <2 x float> %passthru)
	ret <2 x float> %v			ret <2 x float> %v
	}			}

	declare <4 x float> @llvm.masked.gather.v4f32.v4p0(<4 x ptr>, i32, <4 x i1>, <4 x float>)			declare <4 x float> @llvm.masked.gather.v4f32.v4p0(<4 x ptr>, i32, <4 x i1>, <4 x float>)

	define <4 x float> @mgather_v4f32(<4 x ptr> %ptrs, <4 x i1> %m, <4 x float> %passthru) {			define <4 x float> @mgather_v4f32(<4 x ptr> %ptrs, <4 x i1> %m, <4 x float> %passthru) {
	Show All 33 Lines
	; RV64ZVE32F-NEXT: flw fa5, 0(a2)			; RV64ZVE32F-NEXT: flw fa5, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 4, e32, m1, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 4, e32, m1, tu, ma
	; RV64ZVE32F-NEXT: vfmv.s.f v8, fa5			; RV64ZVE32F-NEXT: vfmv.s.f v8, fa5
	; RV64ZVE32F-NEXT: andi a2, a1, 2			; RV64ZVE32F-NEXT: andi a2, a1, 2
	; RV64ZVE32F-NEXT: beqz a2, .LBB70_2			; RV64ZVE32F-NEXT: beqz a2, .LBB70_2
	; RV64ZVE32F-NEXT: .LBB70_6: # %cond.load1			; RV64ZVE32F-NEXT: .LBB70_6: # %cond.load1
	; RV64ZVE32F-NEXT: ld a2, 8(a0)			; RV64ZVE32F-NEXT: ld a2, 8(a0)
	; RV64ZVE32F-NEXT: flw fa5, 0(a2)			; RV64ZVE32F-NEXT: flw fa5, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e32, m1, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vfmv.s.f v9, fa5			; RV64ZVE32F-NEXT: vmv.v.i v0, 2
	; RV64ZVE32F-NEXT: vslideup.vi v8, v9, 1			; RV64ZVE32F-NEXT: vsetivli zero, 4, e32, m1, ta, ma
				; RV64ZVE32F-NEXT: vfmerge.vfm v8, v8, fa5, v0
	; RV64ZVE32F-NEXT: andi a2, a1, 4			; RV64ZVE32F-NEXT: andi a2, a1, 4
	; RV64ZVE32F-NEXT: beqz a2, .LBB70_3			; RV64ZVE32F-NEXT: beqz a2, .LBB70_3
	; RV64ZVE32F-NEXT: .LBB70_7: # %cond.load4			; RV64ZVE32F-NEXT: .LBB70_7: # %cond.load4
	; RV64ZVE32F-NEXT: ld a2, 16(a0)			; RV64ZVE32F-NEXT: ld a2, 16(a0)
	; RV64ZVE32F-NEXT: flw fa5, 0(a2)			; RV64ZVE32F-NEXT: flw fa5, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 3, e32, m1, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vfmv.s.f v9, fa5			; RV64ZVE32F-NEXT: vmv.v.i v0, 4
	; RV64ZVE32F-NEXT: vslideup.vi v8, v9, 2			; RV64ZVE32F-NEXT: vsetivli zero, 4, e32, m1, ta, ma
				; RV64ZVE32F-NEXT: vfmerge.vfm v8, v8, fa5, v0
	; RV64ZVE32F-NEXT: andi a1, a1, 8			; RV64ZVE32F-NEXT: andi a1, a1, 8
	; RV64ZVE32F-NEXT: beqz a1, .LBB70_4			; RV64ZVE32F-NEXT: beqz a1, .LBB70_4
	; RV64ZVE32F-NEXT: .LBB70_8: # %cond.load7			; RV64ZVE32F-NEXT: .LBB70_8: # %cond.load7
	; RV64ZVE32F-NEXT: ld a0, 24(a0)			; RV64ZVE32F-NEXT: ld a0, 24(a0)
	; RV64ZVE32F-NEXT: flw fa5, 0(a0)			; RV64ZVE32F-NEXT: flw fa5, 0(a0)
				; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
				; RV64ZVE32F-NEXT: vmv.v.i v0, 8
	; RV64ZVE32F-NEXT: vsetivli zero, 4, e32, m1, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 4, e32, m1, ta, ma
	; RV64ZVE32F-NEXT: vfmv.s.f v9, fa5			; RV64ZVE32F-NEXT: vfmerge.vfm v8, v8, fa5, v0
	; RV64ZVE32F-NEXT: vslideup.vi v8, v9, 3
	; RV64ZVE32F-NEXT: ret			; RV64ZVE32F-NEXT: ret
	%v = call <4 x float> @llvm.masked.gather.v4f32.v4p0(<4 x ptr> %ptrs, i32 4, <4 x i1> %m, <4 x float> %passthru)			%v = call <4 x float> @llvm.masked.gather.v4f32.v4p0(<4 x ptr> %ptrs, i32 4, <4 x i1> %m, <4 x float> %passthru)
	ret <4 x float> %v			ret <4 x float> %v
	}			}

	define <4 x float> @mgather_truemask_v4f32(<4 x ptr> %ptrs, <4 x float> %passthru) {			define <4 x float> @mgather_truemask_v4f32(<4 x ptr> %ptrs, <4 x float> %passthru) {
	; RV32-LABEL: mgather_truemask_v4f32:			; RV32-LABEL: mgather_truemask_v4f32:
	; RV32: # %bb.0:			; RV32: # %bb.0:
	Show All 30 Lines
	; RV64ZVE32F-NEXT: flw fa5, 0(a2)			; RV64ZVE32F-NEXT: flw fa5, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 4, e32, m1, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 4, e32, m1, tu, ma
	; RV64ZVE32F-NEXT: vfmv.s.f v8, fa5			; RV64ZVE32F-NEXT: vfmv.s.f v8, fa5
	; RV64ZVE32F-NEXT: andi a2, a1, 2			; RV64ZVE32F-NEXT: andi a2, a1, 2
	; RV64ZVE32F-NEXT: beqz a2, .LBB71_2			; RV64ZVE32F-NEXT: beqz a2, .LBB71_2
	; RV64ZVE32F-NEXT: .LBB71_6: # %cond.load1			; RV64ZVE32F-NEXT: .LBB71_6: # %cond.load1
	; RV64ZVE32F-NEXT: ld a2, 8(a0)			; RV64ZVE32F-NEXT: ld a2, 8(a0)
	; RV64ZVE32F-NEXT: flw fa5, 0(a2)			; RV64ZVE32F-NEXT: flw fa5, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e32, m1, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vfmv.s.f v9, fa5			; RV64ZVE32F-NEXT: vmv.v.i v0, 2
	; RV64ZVE32F-NEXT: vslideup.vi v8, v9, 1			; RV64ZVE32F-NEXT: vsetivli zero, 4, e32, m1, ta, ma
				; RV64ZVE32F-NEXT: vfmerge.vfm v8, v8, fa5, v0
	; RV64ZVE32F-NEXT: andi a2, a1, 4			; RV64ZVE32F-NEXT: andi a2, a1, 4
	; RV64ZVE32F-NEXT: beqz a2, .LBB71_3			; RV64ZVE32F-NEXT: beqz a2, .LBB71_3
	; RV64ZVE32F-NEXT: .LBB71_7: # %cond.load4			; RV64ZVE32F-NEXT: .LBB71_7: # %cond.load4
	; RV64ZVE32F-NEXT: ld a2, 16(a0)			; RV64ZVE32F-NEXT: ld a2, 16(a0)
	; RV64ZVE32F-NEXT: flw fa5, 0(a2)			; RV64ZVE32F-NEXT: flw fa5, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 3, e32, m1, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vfmv.s.f v9, fa5			; RV64ZVE32F-NEXT: vmv.v.i v0, 4
	; RV64ZVE32F-NEXT: vslideup.vi v8, v9, 2			; RV64ZVE32F-NEXT: vsetivli zero, 4, e32, m1, ta, ma
				; RV64ZVE32F-NEXT: vfmerge.vfm v8, v8, fa5, v0
	; RV64ZVE32F-NEXT: andi a1, a1, 8			; RV64ZVE32F-NEXT: andi a1, a1, 8
	; RV64ZVE32F-NEXT: beqz a1, .LBB71_4			; RV64ZVE32F-NEXT: beqz a1, .LBB71_4
	; RV64ZVE32F-NEXT: .LBB71_8: # %cond.load7			; RV64ZVE32F-NEXT: .LBB71_8: # %cond.load7
	; RV64ZVE32F-NEXT: ld a0, 24(a0)			; RV64ZVE32F-NEXT: ld a0, 24(a0)
	; RV64ZVE32F-NEXT: flw fa5, 0(a0)			; RV64ZVE32F-NEXT: flw fa5, 0(a0)
				; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
				; RV64ZVE32F-NEXT: vmv.v.i v0, 8
	; RV64ZVE32F-NEXT: vsetivli zero, 4, e32, m1, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 4, e32, m1, ta, ma
	; RV64ZVE32F-NEXT: vfmv.s.f v9, fa5			; RV64ZVE32F-NEXT: vfmerge.vfm v8, v8, fa5, v0
	; RV64ZVE32F-NEXT: vslideup.vi v8, v9, 3
	; RV64ZVE32F-NEXT: ret			; RV64ZVE32F-NEXT: ret
	%mhead = insertelement <4 x i1> poison, i1 1, i32 0			%mhead = insertelement <4 x i1> poison, i1 1, i32 0
	%mtrue = shufflevector <4 x i1> %mhead, <4 x i1> poison, <4 x i32> zeroinitializer			%mtrue = shufflevector <4 x i1> %mhead, <4 x i1> poison, <4 x i32> zeroinitializer
	%v = call <4 x float> @llvm.masked.gather.v4f32.v4p0(<4 x ptr> %ptrs, i32 4, <4 x i1> %mtrue, <4 x float> %passthru)			%v = call <4 x float> @llvm.masked.gather.v4f32.v4p0(<4 x ptr> %ptrs, i32 4, <4 x i1> %mtrue, <4 x float> %passthru)
	ret <4 x float> %v			ret <4 x float> %v
	}			}

	define <4 x float> @mgather_falsemask_v4f32(<4 x ptr> %ptrs, <4 x float> %passthru) {			define <4 x float> @mgather_falsemask_v4f32(<4 x ptr> %ptrs, <4 x float> %passthru) {
	▲ Show 20 Lines • Show All 65 Lines • ▼ Show 20 Lines
	; RV64ZVE32F-NEXT: flw fa5, 0(a2)			; RV64ZVE32F-NEXT: flw fa5, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 8, e32, m2, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 8, e32, m2, tu, ma
	; RV64ZVE32F-NEXT: vfmv.s.f v8, fa5			; RV64ZVE32F-NEXT: vfmv.s.f v8, fa5
	; RV64ZVE32F-NEXT: andi a2, a1, 2			; RV64ZVE32F-NEXT: andi a2, a1, 2
	; RV64ZVE32F-NEXT: beqz a2, .LBB73_2			; RV64ZVE32F-NEXT: beqz a2, .LBB73_2
	; RV64ZVE32F-NEXT: .LBB73_10: # %cond.load1			; RV64ZVE32F-NEXT: .LBB73_10: # %cond.load1
	; RV64ZVE32F-NEXT: ld a2, 8(a0)			; RV64ZVE32F-NEXT: ld a2, 8(a0)
	; RV64ZVE32F-NEXT: flw fa5, 0(a2)			; RV64ZVE32F-NEXT: flw fa5, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e32, m2, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vfmv.s.f v10, fa5			; RV64ZVE32F-NEXT: vmv.v.i v0, 2
	; RV64ZVE32F-NEXT: vslideup.vi v8, v10, 1			; RV64ZVE32F-NEXT: vsetivli zero, 8, e32, m2, ta, ma
				; RV64ZVE32F-NEXT: vfmerge.vfm v8, v8, fa5, v0
	; RV64ZVE32F-NEXT: andi a2, a1, 4			; RV64ZVE32F-NEXT: andi a2, a1, 4
	; RV64ZVE32F-NEXT: beqz a2, .LBB73_3			; RV64ZVE32F-NEXT: beqz a2, .LBB73_3
	; RV64ZVE32F-NEXT: .LBB73_11: # %cond.load4			; RV64ZVE32F-NEXT: .LBB73_11: # %cond.load4
	; RV64ZVE32F-NEXT: ld a2, 16(a0)			; RV64ZVE32F-NEXT: ld a2, 16(a0)
	; RV64ZVE32F-NEXT: flw fa5, 0(a2)			; RV64ZVE32F-NEXT: flw fa5, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 3, e32, m2, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vfmv.s.f v10, fa5			; RV64ZVE32F-NEXT: vmv.v.i v0, 4
	; RV64ZVE32F-NEXT: vslideup.vi v8, v10, 2			; RV64ZVE32F-NEXT: vsetivli zero, 8, e32, m2, ta, ma
				; RV64ZVE32F-NEXT: vfmerge.vfm v8, v8, fa5, v0
	; RV64ZVE32F-NEXT: andi a2, a1, 8			; RV64ZVE32F-NEXT: andi a2, a1, 8
	; RV64ZVE32F-NEXT: beqz a2, .LBB73_4			; RV64ZVE32F-NEXT: beqz a2, .LBB73_4
	; RV64ZVE32F-NEXT: .LBB73_12: # %cond.load7			; RV64ZVE32F-NEXT: .LBB73_12: # %cond.load7
	; RV64ZVE32F-NEXT: ld a2, 24(a0)			; RV64ZVE32F-NEXT: ld a2, 24(a0)
	; RV64ZVE32F-NEXT: flw fa5, 0(a2)			; RV64ZVE32F-NEXT: flw fa5, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 4, e32, m2, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vfmv.s.f v10, fa5			; RV64ZVE32F-NEXT: vmv.v.i v0, 8
	; RV64ZVE32F-NEXT: vslideup.vi v8, v10, 3			; RV64ZVE32F-NEXT: vsetivli zero, 8, e32, m2, ta, ma
				; RV64ZVE32F-NEXT: vfmerge.vfm v8, v8, fa5, v0
	; RV64ZVE32F-NEXT: andi a2, a1, 16			; RV64ZVE32F-NEXT: andi a2, a1, 16
	; RV64ZVE32F-NEXT: beqz a2, .LBB73_5			; RV64ZVE32F-NEXT: beqz a2, .LBB73_5
	; RV64ZVE32F-NEXT: .LBB73_13: # %cond.load10			; RV64ZVE32F-NEXT: .LBB73_13: # %cond.load10
	; RV64ZVE32F-NEXT: ld a2, 32(a0)			; RV64ZVE32F-NEXT: ld a2, 32(a0)
	; RV64ZVE32F-NEXT: flw fa5, 0(a2)			; RV64ZVE32F-NEXT: flw fa5, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 5, e32, m2, tu, ma			; RV64ZVE32F-NEXT: li a2, 16
	; RV64ZVE32F-NEXT: vfmv.s.f v10, fa5			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vslideup.vi v8, v10, 4			; RV64ZVE32F-NEXT: vmv.v.x v0, a2
				; RV64ZVE32F-NEXT: vsetivli zero, 8, e32, m2, ta, ma
				; RV64ZVE32F-NEXT: vfmerge.vfm v8, v8, fa5, v0
	; RV64ZVE32F-NEXT: andi a2, a1, 32			; RV64ZVE32F-NEXT: andi a2, a1, 32
	; RV64ZVE32F-NEXT: beqz a2, .LBB73_6			; RV64ZVE32F-NEXT: beqz a2, .LBB73_6
	; RV64ZVE32F-NEXT: .LBB73_14: # %cond.load13			; RV64ZVE32F-NEXT: .LBB73_14: # %cond.load13
	; RV64ZVE32F-NEXT: ld a2, 40(a0)			; RV64ZVE32F-NEXT: ld a2, 40(a0)
	; RV64ZVE32F-NEXT: flw fa5, 0(a2)			; RV64ZVE32F-NEXT: flw fa5, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 6, e32, m2, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 6, e32, m2, tu, ma
	; RV64ZVE32F-NEXT: vfmv.s.f v10, fa5			; RV64ZVE32F-NEXT: vfmv.s.f v10, fa5
	; RV64ZVE32F-NEXT: vslideup.vi v8, v10, 5			; RV64ZVE32F-NEXT: vslideup.vi v8, v10, 5
	▲ Show 20 Lines • Show All 56 Lines • ▼ Show 20 Lines
	; RV64ZVE32F-NEXT: beqz a2, .LBB74_4			; RV64ZVE32F-NEXT: beqz a2, .LBB74_4
	; RV64ZVE32F-NEXT: # %bb.3: # %cond.load1			; RV64ZVE32F-NEXT: # %bb.3: # %cond.load1
	; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vslidedown.vi v9, v8, 1			; RV64ZVE32F-NEXT: vslidedown.vi v9, v8, 1
	; RV64ZVE32F-NEXT: vmv.x.s a2, v9			; RV64ZVE32F-NEXT: vmv.x.s a2, v9
	; RV64ZVE32F-NEXT: slli a2, a2, 2			; RV64ZVE32F-NEXT: slli a2, a2, 2
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: flw fa5, 0(a2)			; RV64ZVE32F-NEXT: flw fa5, 0(a2)
	; RV64ZVE32F-NEXT: vsetvli zero, zero, e32, m1, ta, ma			; RV64ZVE32F-NEXT: vmv.v.i v0, 2
	; RV64ZVE32F-NEXT: vfmv.s.f v12, fa5			; RV64ZVE32F-NEXT: vsetivli zero, 8, e32, m2, ta, ma
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e32, m2, tu, ma			; RV64ZVE32F-NEXT: vfmerge.vfm v10, v10, fa5, v0
	; RV64ZVE32F-NEXT: vslideup.vi v10, v12, 1
	; RV64ZVE32F-NEXT: .LBB74_4: # %else2			; RV64ZVE32F-NEXT: .LBB74_4: # %else2
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e8, mf4, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 2, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: andi a2, a1, 4			; RV64ZVE32F-NEXT: andi a2, a1, 4
	; RV64ZVE32F-NEXT: vslidedown.vi v9, v8, 2			; RV64ZVE32F-NEXT: vslidedown.vi v9, v8, 2
	; RV64ZVE32F-NEXT: beqz a2, .LBB74_6			; RV64ZVE32F-NEXT: beqz a2, .LBB74_6
	; RV64ZVE32F-NEXT: # %bb.5: # %cond.load4			; RV64ZVE32F-NEXT: # %bb.5: # %cond.load4
	; RV64ZVE32F-NEXT: vmv.x.s a2, v9			; RV64ZVE32F-NEXT: vmv.x.s a2, v9
	; RV64ZVE32F-NEXT: slli a2, a2, 2			; RV64ZVE32F-NEXT: slli a2, a2, 2
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: flw fa5, 0(a2)			; RV64ZVE32F-NEXT: flw fa5, 0(a2)
	; RV64ZVE32F-NEXT: vsetvli zero, zero, e32, m1, ta, ma			; RV64ZVE32F-NEXT: vmv.v.i v0, 4
	; RV64ZVE32F-NEXT: vfmv.s.f v12, fa5			; RV64ZVE32F-NEXT: vsetivli zero, 8, e32, m2, ta, ma
	; RV64ZVE32F-NEXT: vsetivli zero, 3, e32, m2, tu, ma			; RV64ZVE32F-NEXT: vfmerge.vfm v10, v10, fa5, v0
	; RV64ZVE32F-NEXT: vslideup.vi v10, v12, 2
	; RV64ZVE32F-NEXT: .LBB74_6: # %else5			; RV64ZVE32F-NEXT: .LBB74_6: # %else5
	; RV64ZVE32F-NEXT: vsetivli zero, 4, e8, mf2, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 4, e8, mf2, ta, ma
	; RV64ZVE32F-NEXT: andi a2, a1, 8			; RV64ZVE32F-NEXT: andi a2, a1, 8
	; RV64ZVE32F-NEXT: vslidedown.vi v8, v8, 4			; RV64ZVE32F-NEXT: vslidedown.vi v8, v8, 4
	; RV64ZVE32F-NEXT: bnez a2, .LBB74_13			; RV64ZVE32F-NEXT: bnez a2, .LBB74_13
	; RV64ZVE32F-NEXT: # %bb.7: # %else8			; RV64ZVE32F-NEXT: # %bb.7: # %else8
	; RV64ZVE32F-NEXT: andi a2, a1, 16			; RV64ZVE32F-NEXT: andi a2, a1, 16
	; RV64ZVE32F-NEXT: bnez a2, .LBB74_14			; RV64ZVE32F-NEXT: bnez a2, .LBB74_14
	Show All 24 Lines
	; RV64ZVE32F-NEXT: ret			; RV64ZVE32F-NEXT: ret
	; RV64ZVE32F-NEXT: .LBB74_13: # %cond.load7			; RV64ZVE32F-NEXT: .LBB74_13: # %cond.load7
	; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vslidedown.vi v9, v9, 1			; RV64ZVE32F-NEXT: vslidedown.vi v9, v9, 1
	; RV64ZVE32F-NEXT: vmv.x.s a2, v9			; RV64ZVE32F-NEXT: vmv.x.s a2, v9
	; RV64ZVE32F-NEXT: slli a2, a2, 2			; RV64ZVE32F-NEXT: slli a2, a2, 2
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: flw fa5, 0(a2)			; RV64ZVE32F-NEXT: flw fa5, 0(a2)
	; RV64ZVE32F-NEXT: vsetvli zero, zero, e32, m1, ta, ma			; RV64ZVE32F-NEXT: vmv.v.i v0, 8
	; RV64ZVE32F-NEXT: vfmv.s.f v12, fa5			; RV64ZVE32F-NEXT: vsetivli zero, 8, e32, m2, ta, ma
	; RV64ZVE32F-NEXT: vsetivli zero, 4, e32, m2, tu, ma			; RV64ZVE32F-NEXT: vfmerge.vfm v10, v10, fa5, v0
	; RV64ZVE32F-NEXT: vslideup.vi v10, v12, 3
	; RV64ZVE32F-NEXT: andi a2, a1, 16			; RV64ZVE32F-NEXT: andi a2, a1, 16
	; RV64ZVE32F-NEXT: beqz a2, .LBB74_8			; RV64ZVE32F-NEXT: beqz a2, .LBB74_8
	; RV64ZVE32F-NEXT: .LBB74_14: # %cond.load10			; RV64ZVE32F-NEXT: .LBB74_14: # %cond.load10
	; RV64ZVE32F-NEXT: vsetivli zero, 0, e8, mf4, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vmv.x.s a2, v8			; RV64ZVE32F-NEXT: vmv.x.s a2, v8
	; RV64ZVE32F-NEXT: slli a2, a2, 2			; RV64ZVE32F-NEXT: slli a2, a2, 2
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: flw fa5, 0(a2)			; RV64ZVE32F-NEXT: flw fa5, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 5, e32, m2, tu, ma			; RV64ZVE32F-NEXT: li a2, 16
	; RV64ZVE32F-NEXT: vfmv.s.f v12, fa5			; RV64ZVE32F-NEXT: vmv.v.x v0, a2
	; RV64ZVE32F-NEXT: vslideup.vi v10, v12, 4			; RV64ZVE32F-NEXT: vsetivli zero, 8, e32, m2, ta, ma
				; RV64ZVE32F-NEXT: vfmerge.vfm v10, v10, fa5, v0
	; RV64ZVE32F-NEXT: andi a2, a1, 32			; RV64ZVE32F-NEXT: andi a2, a1, 32
	; RV64ZVE32F-NEXT: bnez a2, .LBB74_9			; RV64ZVE32F-NEXT: bnez a2, .LBB74_9
	; RV64ZVE32F-NEXT: j .LBB74_10			; RV64ZVE32F-NEXT: j .LBB74_10
	; RV64ZVE32F-NEXT: .LBB74_15: # %cond.load16			; RV64ZVE32F-NEXT: .LBB74_15: # %cond.load16
	; RV64ZVE32F-NEXT: vmv.x.s a2, v8			; RV64ZVE32F-NEXT: vmv.x.s a2, v8
	; RV64ZVE32F-NEXT: slli a2, a2, 2			; RV64ZVE32F-NEXT: slli a2, a2, 2
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: flw fa5, 0(a2)			; RV64ZVE32F-NEXT: flw fa5, 0(a2)
	▲ Show 20 Lines • Show All 59 Lines • ▼ Show 20 Lines
	; RV64ZVE32F-NEXT: beqz a2, .LBB75_4			; RV64ZVE32F-NEXT: beqz a2, .LBB75_4
	; RV64ZVE32F-NEXT: # %bb.3: # %cond.load1			; RV64ZVE32F-NEXT: # %bb.3: # %cond.load1
	; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vslidedown.vi v9, v8, 1			; RV64ZVE32F-NEXT: vslidedown.vi v9, v8, 1
	; RV64ZVE32F-NEXT: vmv.x.s a2, v9			; RV64ZVE32F-NEXT: vmv.x.s a2, v9
	; RV64ZVE32F-NEXT: slli a2, a2, 2			; RV64ZVE32F-NEXT: slli a2, a2, 2
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: flw fa5, 0(a2)			; RV64ZVE32F-NEXT: flw fa5, 0(a2)
	; RV64ZVE32F-NEXT: vsetvli zero, zero, e32, m1, ta, ma			; RV64ZVE32F-NEXT: vmv.v.i v0, 2
	; RV64ZVE32F-NEXT: vfmv.s.f v12, fa5			; RV64ZVE32F-NEXT: vsetivli zero, 8, e32, m2, ta, ma
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e32, m2, tu, ma			; RV64ZVE32F-NEXT: vfmerge.vfm v10, v10, fa5, v0
	; RV64ZVE32F-NEXT: vslideup.vi v10, v12, 1
	; RV64ZVE32F-NEXT: .LBB75_4: # %else2			; RV64ZVE32F-NEXT: .LBB75_4: # %else2
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e8, mf4, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 2, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: andi a2, a1, 4			; RV64ZVE32F-NEXT: andi a2, a1, 4
	; RV64ZVE32F-NEXT: vslidedown.vi v9, v8, 2			; RV64ZVE32F-NEXT: vslidedown.vi v9, v8, 2
	; RV64ZVE32F-NEXT: beqz a2, .LBB75_6			; RV64ZVE32F-NEXT: beqz a2, .LBB75_6
	; RV64ZVE32F-NEXT: # %bb.5: # %cond.load4			; RV64ZVE32F-NEXT: # %bb.5: # %cond.load4
	; RV64ZVE32F-NEXT: vmv.x.s a2, v9			; RV64ZVE32F-NEXT: vmv.x.s a2, v9
	; RV64ZVE32F-NEXT: slli a2, a2, 2			; RV64ZVE32F-NEXT: slli a2, a2, 2
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: flw fa5, 0(a2)			; RV64ZVE32F-NEXT: flw fa5, 0(a2)
	; RV64ZVE32F-NEXT: vsetvli zero, zero, e32, m1, ta, ma			; RV64ZVE32F-NEXT: vmv.v.i v0, 4
	; RV64ZVE32F-NEXT: vfmv.s.f v12, fa5			; RV64ZVE32F-NEXT: vsetivli zero, 8, e32, m2, ta, ma
	; RV64ZVE32F-NEXT: vsetivli zero, 3, e32, m2, tu, ma			; RV64ZVE32F-NEXT: vfmerge.vfm v10, v10, fa5, v0
	; RV64ZVE32F-NEXT: vslideup.vi v10, v12, 2
	; RV64ZVE32F-NEXT: .LBB75_6: # %else5			; RV64ZVE32F-NEXT: .LBB75_6: # %else5
	; RV64ZVE32F-NEXT: vsetivli zero, 4, e8, mf2, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 4, e8, mf2, ta, ma
	; RV64ZVE32F-NEXT: andi a2, a1, 8			; RV64ZVE32F-NEXT: andi a2, a1, 8
	; RV64ZVE32F-NEXT: vslidedown.vi v8, v8, 4			; RV64ZVE32F-NEXT: vslidedown.vi v8, v8, 4
	; RV64ZVE32F-NEXT: bnez a2, .LBB75_13			; RV64ZVE32F-NEXT: bnez a2, .LBB75_13
	; RV64ZVE32F-NEXT: # %bb.7: # %else8			; RV64ZVE32F-NEXT: # %bb.7: # %else8
	; RV64ZVE32F-NEXT: andi a2, a1, 16			; RV64ZVE32F-NEXT: andi a2, a1, 16
	; RV64ZVE32F-NEXT: bnez a2, .LBB75_14			; RV64ZVE32F-NEXT: bnez a2, .LBB75_14
	Show All 24 Lines
	; RV64ZVE32F-NEXT: ret			; RV64ZVE32F-NEXT: ret
	; RV64ZVE32F-NEXT: .LBB75_13: # %cond.load7			; RV64ZVE32F-NEXT: .LBB75_13: # %cond.load7
	; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vslidedown.vi v9, v9, 1			; RV64ZVE32F-NEXT: vslidedown.vi v9, v9, 1
	; RV64ZVE32F-NEXT: vmv.x.s a2, v9			; RV64ZVE32F-NEXT: vmv.x.s a2, v9
	; RV64ZVE32F-NEXT: slli a2, a2, 2			; RV64ZVE32F-NEXT: slli a2, a2, 2
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: flw fa5, 0(a2)			; RV64ZVE32F-NEXT: flw fa5, 0(a2)
	; RV64ZVE32F-NEXT: vsetvli zero, zero, e32, m1, ta, ma			; RV64ZVE32F-NEXT: vmv.v.i v0, 8
	; RV64ZVE32F-NEXT: vfmv.s.f v12, fa5			; RV64ZVE32F-NEXT: vsetivli zero, 8, e32, m2, ta, ma
	; RV64ZVE32F-NEXT: vsetivli zero, 4, e32, m2, tu, ma			; RV64ZVE32F-NEXT: vfmerge.vfm v10, v10, fa5, v0
	; RV64ZVE32F-NEXT: vslideup.vi v10, v12, 3
	; RV64ZVE32F-NEXT: andi a2, a1, 16			; RV64ZVE32F-NEXT: andi a2, a1, 16
	; RV64ZVE32F-NEXT: beqz a2, .LBB75_8			; RV64ZVE32F-NEXT: beqz a2, .LBB75_8
	; RV64ZVE32F-NEXT: .LBB75_14: # %cond.load10			; RV64ZVE32F-NEXT: .LBB75_14: # %cond.load10
	; RV64ZVE32F-NEXT: vsetivli zero, 0, e8, mf4, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vmv.x.s a2, v8			; RV64ZVE32F-NEXT: vmv.x.s a2, v8
	; RV64ZVE32F-NEXT: slli a2, a2, 2			; RV64ZVE32F-NEXT: slli a2, a2, 2
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: flw fa5, 0(a2)			; RV64ZVE32F-NEXT: flw fa5, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 5, e32, m2, tu, ma			; RV64ZVE32F-NEXT: li a2, 16
	; RV64ZVE32F-NEXT: vfmv.s.f v12, fa5			; RV64ZVE32F-NEXT: vmv.v.x v0, a2
	; RV64ZVE32F-NEXT: vslideup.vi v10, v12, 4			; RV64ZVE32F-NEXT: vsetivli zero, 8, e32, m2, ta, ma
				; RV64ZVE32F-NEXT: vfmerge.vfm v10, v10, fa5, v0
	; RV64ZVE32F-NEXT: andi a2, a1, 32			; RV64ZVE32F-NEXT: andi a2, a1, 32
	; RV64ZVE32F-NEXT: bnez a2, .LBB75_9			; RV64ZVE32F-NEXT: bnez a2, .LBB75_9
	; RV64ZVE32F-NEXT: j .LBB75_10			; RV64ZVE32F-NEXT: j .LBB75_10
	; RV64ZVE32F-NEXT: .LBB75_15: # %cond.load16			; RV64ZVE32F-NEXT: .LBB75_15: # %cond.load16
	; RV64ZVE32F-NEXT: vmv.x.s a2, v8			; RV64ZVE32F-NEXT: vmv.x.s a2, v8
	; RV64ZVE32F-NEXT: slli a2, a2, 2			; RV64ZVE32F-NEXT: slli a2, a2, 2
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: flw fa5, 0(a2)			; RV64ZVE32F-NEXT: flw fa5, 0(a2)
	▲ Show 20 Lines • Show All 62 Lines • ▼ Show 20 Lines
	; RV64ZVE32F-NEXT: # %bb.3: # %cond.load1			; RV64ZVE32F-NEXT: # %bb.3: # %cond.load1
	; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vslidedown.vi v9, v8, 1			; RV64ZVE32F-NEXT: vslidedown.vi v9, v8, 1
	; RV64ZVE32F-NEXT: vmv.x.s a2, v9			; RV64ZVE32F-NEXT: vmv.x.s a2, v9
	; RV64ZVE32F-NEXT: andi a2, a2, 255			; RV64ZVE32F-NEXT: andi a2, a2, 255
	; RV64ZVE32F-NEXT: slli a2, a2, 2			; RV64ZVE32F-NEXT: slli a2, a2, 2
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: flw fa5, 0(a2)			; RV64ZVE32F-NEXT: flw fa5, 0(a2)
	; RV64ZVE32F-NEXT: vsetvli zero, zero, e32, m1, ta, ma			; RV64ZVE32F-NEXT: vmv.v.i v0, 2
	; RV64ZVE32F-NEXT: vfmv.s.f v12, fa5			; RV64ZVE32F-NEXT: vsetivli zero, 8, e32, m2, ta, ma
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e32, m2, tu, ma			; RV64ZVE32F-NEXT: vfmerge.vfm v10, v10, fa5, v0
	; RV64ZVE32F-NEXT: vslideup.vi v10, v12, 1
	; RV64ZVE32F-NEXT: .LBB76_4: # %else2			; RV64ZVE32F-NEXT: .LBB76_4: # %else2
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e8, mf4, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 2, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: andi a2, a1, 4			; RV64ZVE32F-NEXT: andi a2, a1, 4
	; RV64ZVE32F-NEXT: vslidedown.vi v9, v8, 2			; RV64ZVE32F-NEXT: vslidedown.vi v9, v8, 2
	; RV64ZVE32F-NEXT: beqz a2, .LBB76_6			; RV64ZVE32F-NEXT: beqz a2, .LBB76_6
	; RV64ZVE32F-NEXT: # %bb.5: # %cond.load4			; RV64ZVE32F-NEXT: # %bb.5: # %cond.load4
	; RV64ZVE32F-NEXT: vmv.x.s a2, v9			; RV64ZVE32F-NEXT: vmv.x.s a2, v9
	; RV64ZVE32F-NEXT: andi a2, a2, 255			; RV64ZVE32F-NEXT: andi a2, a2, 255
	; RV64ZVE32F-NEXT: slli a2, a2, 2			; RV64ZVE32F-NEXT: slli a2, a2, 2
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: flw fa5, 0(a2)			; RV64ZVE32F-NEXT: flw fa5, 0(a2)
	; RV64ZVE32F-NEXT: vsetvli zero, zero, e32, m1, ta, ma			; RV64ZVE32F-NEXT: vmv.v.i v0, 4
	; RV64ZVE32F-NEXT: vfmv.s.f v12, fa5			; RV64ZVE32F-NEXT: vsetivli zero, 8, e32, m2, ta, ma
	; RV64ZVE32F-NEXT: vsetivli zero, 3, e32, m2, tu, ma			; RV64ZVE32F-NEXT: vfmerge.vfm v10, v10, fa5, v0
	; RV64ZVE32F-NEXT: vslideup.vi v10, v12, 2
	; RV64ZVE32F-NEXT: .LBB76_6: # %else5			; RV64ZVE32F-NEXT: .LBB76_6: # %else5
	; RV64ZVE32F-NEXT: vsetivli zero, 4, e8, mf2, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 4, e8, mf2, ta, ma
	; RV64ZVE32F-NEXT: andi a2, a1, 8			; RV64ZVE32F-NEXT: andi a2, a1, 8
	; RV64ZVE32F-NEXT: vslidedown.vi v8, v8, 4			; RV64ZVE32F-NEXT: vslidedown.vi v8, v8, 4
	; RV64ZVE32F-NEXT: bnez a2, .LBB76_13			; RV64ZVE32F-NEXT: bnez a2, .LBB76_13
	; RV64ZVE32F-NEXT: # %bb.7: # %else8			; RV64ZVE32F-NEXT: # %bb.7: # %else8
	; RV64ZVE32F-NEXT: andi a2, a1, 16			; RV64ZVE32F-NEXT: andi a2, a1, 16
	; RV64ZVE32F-NEXT: bnez a2, .LBB76_14			; RV64ZVE32F-NEXT: bnez a2, .LBB76_14
	Show All 26 Lines
	; RV64ZVE32F-NEXT: .LBB76_13: # %cond.load7			; RV64ZVE32F-NEXT: .LBB76_13: # %cond.load7
	; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vslidedown.vi v9, v9, 1			; RV64ZVE32F-NEXT: vslidedown.vi v9, v9, 1
	; RV64ZVE32F-NEXT: vmv.x.s a2, v9			; RV64ZVE32F-NEXT: vmv.x.s a2, v9
	; RV64ZVE32F-NEXT: andi a2, a2, 255			; RV64ZVE32F-NEXT: andi a2, a2, 255
	; RV64ZVE32F-NEXT: slli a2, a2, 2			; RV64ZVE32F-NEXT: slli a2, a2, 2
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: flw fa5, 0(a2)			; RV64ZVE32F-NEXT: flw fa5, 0(a2)
	; RV64ZVE32F-NEXT: vsetvli zero, zero, e32, m1, ta, ma			; RV64ZVE32F-NEXT: vmv.v.i v0, 8
	; RV64ZVE32F-NEXT: vfmv.s.f v12, fa5			; RV64ZVE32F-NEXT: vsetivli zero, 8, e32, m2, ta, ma
	; RV64ZVE32F-NEXT: vsetivli zero, 4, e32, m2, tu, ma			; RV64ZVE32F-NEXT: vfmerge.vfm v10, v10, fa5, v0
	; RV64ZVE32F-NEXT: vslideup.vi v10, v12, 3
	; RV64ZVE32F-NEXT: andi a2, a1, 16			; RV64ZVE32F-NEXT: andi a2, a1, 16
	; RV64ZVE32F-NEXT: beqz a2, .LBB76_8			; RV64ZVE32F-NEXT: beqz a2, .LBB76_8
	; RV64ZVE32F-NEXT: .LBB76_14: # %cond.load10			; RV64ZVE32F-NEXT: .LBB76_14: # %cond.load10
	; RV64ZVE32F-NEXT: vsetivli zero, 0, e8, mf4, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vmv.x.s a2, v8			; RV64ZVE32F-NEXT: vmv.x.s a2, v8
	; RV64ZVE32F-NEXT: andi a2, a2, 255			; RV64ZVE32F-NEXT: andi a2, a2, 255
	; RV64ZVE32F-NEXT: slli a2, a2, 2			; RV64ZVE32F-NEXT: slli a2, a2, 2
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: flw fa5, 0(a2)			; RV64ZVE32F-NEXT: flw fa5, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 5, e32, m2, tu, ma			; RV64ZVE32F-NEXT: li a2, 16
	; RV64ZVE32F-NEXT: vfmv.s.f v12, fa5			; RV64ZVE32F-NEXT: vmv.v.x v0, a2
	; RV64ZVE32F-NEXT: vslideup.vi v10, v12, 4			; RV64ZVE32F-NEXT: vsetivli zero, 8, e32, m2, ta, ma
				; RV64ZVE32F-NEXT: vfmerge.vfm v10, v10, fa5, v0
	; RV64ZVE32F-NEXT: andi a2, a1, 32			; RV64ZVE32F-NEXT: andi a2, a1, 32
	; RV64ZVE32F-NEXT: bnez a2, .LBB76_9			; RV64ZVE32F-NEXT: bnez a2, .LBB76_9
	; RV64ZVE32F-NEXT: j .LBB76_10			; RV64ZVE32F-NEXT: j .LBB76_10
	; RV64ZVE32F-NEXT: .LBB76_15: # %cond.load16			; RV64ZVE32F-NEXT: .LBB76_15: # %cond.load16
	; RV64ZVE32F-NEXT: vmv.x.s a2, v8			; RV64ZVE32F-NEXT: vmv.x.s a2, v8
	; RV64ZVE32F-NEXT: andi a2, a2, 255			; RV64ZVE32F-NEXT: andi a2, a2, 255
	; RV64ZVE32F-NEXT: slli a2, a2, 2			; RV64ZVE32F-NEXT: slli a2, a2, 2
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	▲ Show 20 Lines • Show All 63 Lines • ▼ Show 20 Lines
	; RV64ZVE32F-NEXT: beqz a2, .LBB77_4			; RV64ZVE32F-NEXT: beqz a2, .LBB77_4
	; RV64ZVE32F-NEXT: # %bb.3: # %cond.load1			; RV64ZVE32F-NEXT: # %bb.3: # %cond.load1
	; RV64ZVE32F-NEXT: vsetivli zero, 1, e16, mf2, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e16, mf2, ta, ma
	; RV64ZVE32F-NEXT: vslidedown.vi v9, v8, 1			; RV64ZVE32F-NEXT: vslidedown.vi v9, v8, 1
	; RV64ZVE32F-NEXT: vmv.x.s a2, v9			; RV64ZVE32F-NEXT: vmv.x.s a2, v9
	; RV64ZVE32F-NEXT: slli a2, a2, 2			; RV64ZVE32F-NEXT: slli a2, a2, 2
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: flw fa5, 0(a2)			; RV64ZVE32F-NEXT: flw fa5, 0(a2)
	; RV64ZVE32F-NEXT: vsetvli zero, zero, e32, m1, ta, ma			; RV64ZVE32F-NEXT: vmv.v.i v0, 2
	; RV64ZVE32F-NEXT: vfmv.s.f v12, fa5			; RV64ZVE32F-NEXT: vsetivli zero, 8, e32, m2, ta, ma
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e32, m2, tu, ma			; RV64ZVE32F-NEXT: vfmerge.vfm v10, v10, fa5, v0
	; RV64ZVE32F-NEXT: vslideup.vi v10, v12, 1
	; RV64ZVE32F-NEXT: .LBB77_4: # %else2			; RV64ZVE32F-NEXT: .LBB77_4: # %else2
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e16, mf2, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 2, e16, mf2, ta, ma
	; RV64ZVE32F-NEXT: andi a2, a1, 4			; RV64ZVE32F-NEXT: andi a2, a1, 4
	; RV64ZVE32F-NEXT: vslidedown.vi v9, v8, 2			; RV64ZVE32F-NEXT: vslidedown.vi v9, v8, 2
	; RV64ZVE32F-NEXT: beqz a2, .LBB77_6			; RV64ZVE32F-NEXT: beqz a2, .LBB77_6
	; RV64ZVE32F-NEXT: # %bb.5: # %cond.load4			; RV64ZVE32F-NEXT: # %bb.5: # %cond.load4
	; RV64ZVE32F-NEXT: vmv.x.s a2, v9			; RV64ZVE32F-NEXT: vmv.x.s a2, v9
	; RV64ZVE32F-NEXT: slli a2, a2, 2			; RV64ZVE32F-NEXT: slli a2, a2, 2
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: flw fa5, 0(a2)			; RV64ZVE32F-NEXT: flw fa5, 0(a2)
	; RV64ZVE32F-NEXT: vsetvli zero, zero, e32, m1, ta, ma			; RV64ZVE32F-NEXT: vmv.v.i v0, 4
	; RV64ZVE32F-NEXT: vfmv.s.f v12, fa5			; RV64ZVE32F-NEXT: vsetivli zero, 8, e32, m2, ta, ma
	; RV64ZVE32F-NEXT: vsetivli zero, 3, e32, m2, tu, ma			; RV64ZVE32F-NEXT: vfmerge.vfm v10, v10, fa5, v0
	; RV64ZVE32F-NEXT: vslideup.vi v10, v12, 2
	; RV64ZVE32F-NEXT: .LBB77_6: # %else5			; RV64ZVE32F-NEXT: .LBB77_6: # %else5
	; RV64ZVE32F-NEXT: vsetivli zero, 4, e16, m1, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 4, e16, m1, ta, ma
	; RV64ZVE32F-NEXT: andi a2, a1, 8			; RV64ZVE32F-NEXT: andi a2, a1, 8
	; RV64ZVE32F-NEXT: vslidedown.vi v8, v8, 4			; RV64ZVE32F-NEXT: vslidedown.vi v8, v8, 4
	; RV64ZVE32F-NEXT: bnez a2, .LBB77_13			; RV64ZVE32F-NEXT: bnez a2, .LBB77_13
	; RV64ZVE32F-NEXT: # %bb.7: # %else8			; RV64ZVE32F-NEXT: # %bb.7: # %else8
	; RV64ZVE32F-NEXT: andi a2, a1, 16			; RV64ZVE32F-NEXT: andi a2, a1, 16
	; RV64ZVE32F-NEXT: bnez a2, .LBB77_14			; RV64ZVE32F-NEXT: bnez a2, .LBB77_14
	Show All 24 Lines
	; RV64ZVE32F-NEXT: ret			; RV64ZVE32F-NEXT: ret
	; RV64ZVE32F-NEXT: .LBB77_13: # %cond.load7			; RV64ZVE32F-NEXT: .LBB77_13: # %cond.load7
	; RV64ZVE32F-NEXT: vsetivli zero, 1, e16, mf2, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e16, mf2, ta, ma
	; RV64ZVE32F-NEXT: vslidedown.vi v9, v9, 1			; RV64ZVE32F-NEXT: vslidedown.vi v9, v9, 1
	; RV64ZVE32F-NEXT: vmv.x.s a2, v9			; RV64ZVE32F-NEXT: vmv.x.s a2, v9
	; RV64ZVE32F-NEXT: slli a2, a2, 2			; RV64ZVE32F-NEXT: slli a2, a2, 2
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: flw fa5, 0(a2)			; RV64ZVE32F-NEXT: flw fa5, 0(a2)
	; RV64ZVE32F-NEXT: vsetvli zero, zero, e32, m1, ta, ma			; RV64ZVE32F-NEXT: vmv.v.i v0, 8
	; RV64ZVE32F-NEXT: vfmv.s.f v12, fa5			; RV64ZVE32F-NEXT: vsetivli zero, 8, e32, m2, ta, ma
	; RV64ZVE32F-NEXT: vsetivli zero, 4, e32, m2, tu, ma			; RV64ZVE32F-NEXT: vfmerge.vfm v10, v10, fa5, v0
	; RV64ZVE32F-NEXT: vslideup.vi v10, v12, 3
	; RV64ZVE32F-NEXT: andi a2, a1, 16			; RV64ZVE32F-NEXT: andi a2, a1, 16
	; RV64ZVE32F-NEXT: beqz a2, .LBB77_8			; RV64ZVE32F-NEXT: beqz a2, .LBB77_8
	; RV64ZVE32F-NEXT: .LBB77_14: # %cond.load10			; RV64ZVE32F-NEXT: .LBB77_14: # %cond.load10
	; RV64ZVE32F-NEXT: vsetivli zero, 0, e16, mf2, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 0, e16, mf2, ta, ma
	; RV64ZVE32F-NEXT: vmv.x.s a2, v8			; RV64ZVE32F-NEXT: vmv.x.s a2, v8
	; RV64ZVE32F-NEXT: slli a2, a2, 2			; RV64ZVE32F-NEXT: slli a2, a2, 2
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: flw fa5, 0(a2)			; RV64ZVE32F-NEXT: flw fa5, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 5, e32, m2, tu, ma			; RV64ZVE32F-NEXT: li a2, 16
	; RV64ZVE32F-NEXT: vfmv.s.f v12, fa5			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vslideup.vi v10, v12, 4			; RV64ZVE32F-NEXT: vmv.v.x v0, a2
				; RV64ZVE32F-NEXT: vsetivli zero, 8, e32, m2, ta, ma
				; RV64ZVE32F-NEXT: vfmerge.vfm v10, v10, fa5, v0
	; RV64ZVE32F-NEXT: andi a2, a1, 32			; RV64ZVE32F-NEXT: andi a2, a1, 32
	; RV64ZVE32F-NEXT: bnez a2, .LBB77_9			; RV64ZVE32F-NEXT: bnez a2, .LBB77_9
	; RV64ZVE32F-NEXT: j .LBB77_10			; RV64ZVE32F-NEXT: j .LBB77_10
	; RV64ZVE32F-NEXT: .LBB77_15: # %cond.load16			; RV64ZVE32F-NEXT: .LBB77_15: # %cond.load16
	; RV64ZVE32F-NEXT: vmv.x.s a2, v8			; RV64ZVE32F-NEXT: vmv.x.s a2, v8
	; RV64ZVE32F-NEXT: slli a2, a2, 2			; RV64ZVE32F-NEXT: slli a2, a2, 2
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: flw fa5, 0(a2)			; RV64ZVE32F-NEXT: flw fa5, 0(a2)
	▲ Show 20 Lines • Show All 60 Lines • ▼ Show 20 Lines
	; RV64ZVE32F-NEXT: beqz a2, .LBB78_4			; RV64ZVE32F-NEXT: beqz a2, .LBB78_4
	; RV64ZVE32F-NEXT: # %bb.3: # %cond.load1			; RV64ZVE32F-NEXT: # %bb.3: # %cond.load1
	; RV64ZVE32F-NEXT: vsetivli zero, 1, e16, mf2, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e16, mf2, ta, ma
	; RV64ZVE32F-NEXT: vslidedown.vi v9, v8, 1			; RV64ZVE32F-NEXT: vslidedown.vi v9, v8, 1
	; RV64ZVE32F-NEXT: vmv.x.s a2, v9			; RV64ZVE32F-NEXT: vmv.x.s a2, v9
	; RV64ZVE32F-NEXT: slli a2, a2, 2			; RV64ZVE32F-NEXT: slli a2, a2, 2
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: flw fa5, 0(a2)			; RV64ZVE32F-NEXT: flw fa5, 0(a2)
	; RV64ZVE32F-NEXT: vsetvli zero, zero, e32, m1, ta, ma			; RV64ZVE32F-NEXT: vmv.v.i v0, 2
	; RV64ZVE32F-NEXT: vfmv.s.f v12, fa5			; RV64ZVE32F-NEXT: vsetivli zero, 8, e32, m2, ta, ma
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e32, m2, tu, ma			; RV64ZVE32F-NEXT: vfmerge.vfm v10, v10, fa5, v0
	; RV64ZVE32F-NEXT: vslideup.vi v10, v12, 1
	; RV64ZVE32F-NEXT: .LBB78_4: # %else2			; RV64ZVE32F-NEXT: .LBB78_4: # %else2
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e16, mf2, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 2, e16, mf2, ta, ma
	; RV64ZVE32F-NEXT: andi a2, a1, 4			; RV64ZVE32F-NEXT: andi a2, a1, 4
	; RV64ZVE32F-NEXT: vslidedown.vi v9, v8, 2			; RV64ZVE32F-NEXT: vslidedown.vi v9, v8, 2
	; RV64ZVE32F-NEXT: beqz a2, .LBB78_6			; RV64ZVE32F-NEXT: beqz a2, .LBB78_6
	; RV64ZVE32F-NEXT: # %bb.5: # %cond.load4			; RV64ZVE32F-NEXT: # %bb.5: # %cond.load4
	; RV64ZVE32F-NEXT: vmv.x.s a2, v9			; RV64ZVE32F-NEXT: vmv.x.s a2, v9
	; RV64ZVE32F-NEXT: slli a2, a2, 2			; RV64ZVE32F-NEXT: slli a2, a2, 2
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: flw fa5, 0(a2)			; RV64ZVE32F-NEXT: flw fa5, 0(a2)
	; RV64ZVE32F-NEXT: vsetvli zero, zero, e32, m1, ta, ma			; RV64ZVE32F-NEXT: vmv.v.i v0, 4
	; RV64ZVE32F-NEXT: vfmv.s.f v12, fa5			; RV64ZVE32F-NEXT: vsetivli zero, 8, e32, m2, ta, ma
	; RV64ZVE32F-NEXT: vsetivli zero, 3, e32, m2, tu, ma			; RV64ZVE32F-NEXT: vfmerge.vfm v10, v10, fa5, v0
	; RV64ZVE32F-NEXT: vslideup.vi v10, v12, 2
	; RV64ZVE32F-NEXT: .LBB78_6: # %else5			; RV64ZVE32F-NEXT: .LBB78_6: # %else5
	; RV64ZVE32F-NEXT: vsetivli zero, 4, e16, m1, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 4, e16, m1, ta, ma
	; RV64ZVE32F-NEXT: andi a2, a1, 8			; RV64ZVE32F-NEXT: andi a2, a1, 8
	; RV64ZVE32F-NEXT: vslidedown.vi v8, v8, 4			; RV64ZVE32F-NEXT: vslidedown.vi v8, v8, 4
	; RV64ZVE32F-NEXT: bnez a2, .LBB78_13			; RV64ZVE32F-NEXT: bnez a2, .LBB78_13
	; RV64ZVE32F-NEXT: # %bb.7: # %else8			; RV64ZVE32F-NEXT: # %bb.7: # %else8
	; RV64ZVE32F-NEXT: andi a2, a1, 16			; RV64ZVE32F-NEXT: andi a2, a1, 16
	; RV64ZVE32F-NEXT: bnez a2, .LBB78_14			; RV64ZVE32F-NEXT: bnez a2, .LBB78_14
	Show All 24 Lines
	; RV64ZVE32F-NEXT: ret			; RV64ZVE32F-NEXT: ret
	; RV64ZVE32F-NEXT: .LBB78_13: # %cond.load7			; RV64ZVE32F-NEXT: .LBB78_13: # %cond.load7
	; RV64ZVE32F-NEXT: vsetivli zero, 1, e16, mf2, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e16, mf2, ta, ma
	; RV64ZVE32F-NEXT: vslidedown.vi v9, v9, 1			; RV64ZVE32F-NEXT: vslidedown.vi v9, v9, 1
	; RV64ZVE32F-NEXT: vmv.x.s a2, v9			; RV64ZVE32F-NEXT: vmv.x.s a2, v9
	; RV64ZVE32F-NEXT: slli a2, a2, 2			; RV64ZVE32F-NEXT: slli a2, a2, 2
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: flw fa5, 0(a2)			; RV64ZVE32F-NEXT: flw fa5, 0(a2)
	; RV64ZVE32F-NEXT: vsetvli zero, zero, e32, m1, ta, ma			; RV64ZVE32F-NEXT: vmv.v.i v0, 8
	; RV64ZVE32F-NEXT: vfmv.s.f v12, fa5			; RV64ZVE32F-NEXT: vsetivli zero, 8, e32, m2, ta, ma
	; RV64ZVE32F-NEXT: vsetivli zero, 4, e32, m2, tu, ma			; RV64ZVE32F-NEXT: vfmerge.vfm v10, v10, fa5, v0
	; RV64ZVE32F-NEXT: vslideup.vi v10, v12, 3
	; RV64ZVE32F-NEXT: andi a2, a1, 16			; RV64ZVE32F-NEXT: andi a2, a1, 16
	; RV64ZVE32F-NEXT: beqz a2, .LBB78_8			; RV64ZVE32F-NEXT: beqz a2, .LBB78_8
	; RV64ZVE32F-NEXT: .LBB78_14: # %cond.load10			; RV64ZVE32F-NEXT: .LBB78_14: # %cond.load10
	; RV64ZVE32F-NEXT: vsetivli zero, 0, e16, mf2, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 0, e16, mf2, ta, ma
	; RV64ZVE32F-NEXT: vmv.x.s a2, v8			; RV64ZVE32F-NEXT: vmv.x.s a2, v8
	; RV64ZVE32F-NEXT: slli a2, a2, 2			; RV64ZVE32F-NEXT: slli a2, a2, 2
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: flw fa5, 0(a2)			; RV64ZVE32F-NEXT: flw fa5, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 5, e32, m2, tu, ma			; RV64ZVE32F-NEXT: li a2, 16
	; RV64ZVE32F-NEXT: vfmv.s.f v12, fa5			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vslideup.vi v10, v12, 4			; RV64ZVE32F-NEXT: vmv.v.x v0, a2
				; RV64ZVE32F-NEXT: vsetivli zero, 8, e32, m2, ta, ma
				; RV64ZVE32F-NEXT: vfmerge.vfm v10, v10, fa5, v0
	; RV64ZVE32F-NEXT: andi a2, a1, 32			; RV64ZVE32F-NEXT: andi a2, a1, 32
	; RV64ZVE32F-NEXT: bnez a2, .LBB78_9			; RV64ZVE32F-NEXT: bnez a2, .LBB78_9
	; RV64ZVE32F-NEXT: j .LBB78_10			; RV64ZVE32F-NEXT: j .LBB78_10
	; RV64ZVE32F-NEXT: .LBB78_15: # %cond.load16			; RV64ZVE32F-NEXT: .LBB78_15: # %cond.load16
	; RV64ZVE32F-NEXT: vmv.x.s a2, v8			; RV64ZVE32F-NEXT: vmv.x.s a2, v8
	; RV64ZVE32F-NEXT: slli a2, a2, 2			; RV64ZVE32F-NEXT: slli a2, a2, 2
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: flw fa5, 0(a2)			; RV64ZVE32F-NEXT: flw fa5, 0(a2)
	▲ Show 20 Lines • Show All 65 Lines • ▼ Show 20 Lines
	; RV64ZVE32F-NEXT: # %bb.3: # %cond.load1			; RV64ZVE32F-NEXT: # %bb.3: # %cond.load1
	; RV64ZVE32F-NEXT: vsetivli zero, 1, e16, mf2, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e16, mf2, ta, ma
	; RV64ZVE32F-NEXT: vslidedown.vi v9, v8, 1			; RV64ZVE32F-NEXT: vslidedown.vi v9, v8, 1
	; RV64ZVE32F-NEXT: vmv.x.s a3, v9			; RV64ZVE32F-NEXT: vmv.x.s a3, v9
	; RV64ZVE32F-NEXT: and a3, a3, a1			; RV64ZVE32F-NEXT: and a3, a3, a1
	; RV64ZVE32F-NEXT: slli a3, a3, 2			; RV64ZVE32F-NEXT: slli a3, a3, 2
	; RV64ZVE32F-NEXT: add a3, a0, a3			; RV64ZVE32F-NEXT: add a3, a0, a3
	; RV64ZVE32F-NEXT: flw fa5, 0(a3)			; RV64ZVE32F-NEXT: flw fa5, 0(a3)
	; RV64ZVE32F-NEXT: vsetvli zero, zero, e32, m1, ta, ma			; RV64ZVE32F-NEXT: vmv.v.i v0, 2
	; RV64ZVE32F-NEXT: vfmv.s.f v12, fa5			; RV64ZVE32F-NEXT: vsetivli zero, 8, e32, m2, ta, ma
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e32, m2, tu, ma			; RV64ZVE32F-NEXT: vfmerge.vfm v10, v10, fa5, v0
	; RV64ZVE32F-NEXT: vslideup.vi v10, v12, 1
	; RV64ZVE32F-NEXT: .LBB79_4: # %else2			; RV64ZVE32F-NEXT: .LBB79_4: # %else2
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e16, mf2, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 2, e16, mf2, ta, ma
	; RV64ZVE32F-NEXT: andi a3, a2, 4			; RV64ZVE32F-NEXT: andi a3, a2, 4
	; RV64ZVE32F-NEXT: vslidedown.vi v9, v8, 2			; RV64ZVE32F-NEXT: vslidedown.vi v9, v8, 2
	; RV64ZVE32F-NEXT: beqz a3, .LBB79_6			; RV64ZVE32F-NEXT: beqz a3, .LBB79_6
	; RV64ZVE32F-NEXT: # %bb.5: # %cond.load4			; RV64ZVE32F-NEXT: # %bb.5: # %cond.load4
	; RV64ZVE32F-NEXT: vmv.x.s a3, v9			; RV64ZVE32F-NEXT: vmv.x.s a3, v9
	; RV64ZVE32F-NEXT: and a3, a3, a1			; RV64ZVE32F-NEXT: and a3, a3, a1
	; RV64ZVE32F-NEXT: slli a3, a3, 2			; RV64ZVE32F-NEXT: slli a3, a3, 2
	; RV64ZVE32F-NEXT: add a3, a0, a3			; RV64ZVE32F-NEXT: add a3, a0, a3
	; RV64ZVE32F-NEXT: flw fa5, 0(a3)			; RV64ZVE32F-NEXT: flw fa5, 0(a3)
	; RV64ZVE32F-NEXT: vsetvli zero, zero, e32, m1, ta, ma			; RV64ZVE32F-NEXT: vmv.v.i v0, 4
	; RV64ZVE32F-NEXT: vfmv.s.f v12, fa5			; RV64ZVE32F-NEXT: vsetivli zero, 8, e32, m2, ta, ma
	; RV64ZVE32F-NEXT: vsetivli zero, 3, e32, m2, tu, ma			; RV64ZVE32F-NEXT: vfmerge.vfm v10, v10, fa5, v0
	; RV64ZVE32F-NEXT: vslideup.vi v10, v12, 2
	; RV64ZVE32F-NEXT: .LBB79_6: # %else5			; RV64ZVE32F-NEXT: .LBB79_6: # %else5
	; RV64ZVE32F-NEXT: vsetivli zero, 4, e16, m1, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 4, e16, m1, ta, ma
	; RV64ZVE32F-NEXT: andi a3, a2, 8			; RV64ZVE32F-NEXT: andi a3, a2, 8
	; RV64ZVE32F-NEXT: vslidedown.vi v8, v8, 4			; RV64ZVE32F-NEXT: vslidedown.vi v8, v8, 4
	; RV64ZVE32F-NEXT: bnez a3, .LBB79_13			; RV64ZVE32F-NEXT: bnez a3, .LBB79_13
	; RV64ZVE32F-NEXT: # %bb.7: # %else8			; RV64ZVE32F-NEXT: # %bb.7: # %else8
	; RV64ZVE32F-NEXT: andi a3, a2, 16			; RV64ZVE32F-NEXT: andi a3, a2, 16
	; RV64ZVE32F-NEXT: bnez a3, .LBB79_14			; RV64ZVE32F-NEXT: bnez a3, .LBB79_14
	Show All 26 Lines
	; RV64ZVE32F-NEXT: .LBB79_13: # %cond.load7			; RV64ZVE32F-NEXT: .LBB79_13: # %cond.load7
	; RV64ZVE32F-NEXT: vsetivli zero, 1, e16, mf2, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e16, mf2, ta, ma
	; RV64ZVE32F-NEXT: vslidedown.vi v9, v9, 1			; RV64ZVE32F-NEXT: vslidedown.vi v9, v9, 1
	; RV64ZVE32F-NEXT: vmv.x.s a3, v9			; RV64ZVE32F-NEXT: vmv.x.s a3, v9
	; RV64ZVE32F-NEXT: and a3, a3, a1			; RV64ZVE32F-NEXT: and a3, a3, a1
	; RV64ZVE32F-NEXT: slli a3, a3, 2			; RV64ZVE32F-NEXT: slli a3, a3, 2
	; RV64ZVE32F-NEXT: add a3, a0, a3			; RV64ZVE32F-NEXT: add a3, a0, a3
	; RV64ZVE32F-NEXT: flw fa5, 0(a3)			; RV64ZVE32F-NEXT: flw fa5, 0(a3)
	; RV64ZVE32F-NEXT: vsetvli zero, zero, e32, m1, ta, ma			; RV64ZVE32F-NEXT: vmv.v.i v0, 8
	; RV64ZVE32F-NEXT: vfmv.s.f v12, fa5			; RV64ZVE32F-NEXT: vsetivli zero, 8, e32, m2, ta, ma
	; RV64ZVE32F-NEXT: vsetivli zero, 4, e32, m2, tu, ma			; RV64ZVE32F-NEXT: vfmerge.vfm v10, v10, fa5, v0
	; RV64ZVE32F-NEXT: vslideup.vi v10, v12, 3
	; RV64ZVE32F-NEXT: andi a3, a2, 16			; RV64ZVE32F-NEXT: andi a3, a2, 16
	; RV64ZVE32F-NEXT: beqz a3, .LBB79_8			; RV64ZVE32F-NEXT: beqz a3, .LBB79_8
	; RV64ZVE32F-NEXT: .LBB79_14: # %cond.load10			; RV64ZVE32F-NEXT: .LBB79_14: # %cond.load10
	; RV64ZVE32F-NEXT: vsetivli zero, 0, e16, mf2, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 0, e16, mf2, ta, ma
	; RV64ZVE32F-NEXT: vmv.x.s a3, v8			; RV64ZVE32F-NEXT: vmv.x.s a3, v8
	; RV64ZVE32F-NEXT: and a3, a3, a1			; RV64ZVE32F-NEXT: and a3, a3, a1
	; RV64ZVE32F-NEXT: slli a3, a3, 2			; RV64ZVE32F-NEXT: slli a3, a3, 2
	; RV64ZVE32F-NEXT: add a3, a0, a3			; RV64ZVE32F-NEXT: add a3, a0, a3
	; RV64ZVE32F-NEXT: flw fa5, 0(a3)			; RV64ZVE32F-NEXT: flw fa5, 0(a3)
	; RV64ZVE32F-NEXT: vsetivli zero, 5, e32, m2, tu, ma			; RV64ZVE32F-NEXT: li a3, 16
	; RV64ZVE32F-NEXT: vfmv.s.f v12, fa5			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vslideup.vi v10, v12, 4			; RV64ZVE32F-NEXT: vmv.v.x v0, a3
				; RV64ZVE32F-NEXT: vsetivli zero, 8, e32, m2, ta, ma
				; RV64ZVE32F-NEXT: vfmerge.vfm v10, v10, fa5, v0
	; RV64ZVE32F-NEXT: andi a3, a2, 32			; RV64ZVE32F-NEXT: andi a3, a2, 32
	; RV64ZVE32F-NEXT: bnez a3, .LBB79_9			; RV64ZVE32F-NEXT: bnez a3, .LBB79_9
	; RV64ZVE32F-NEXT: j .LBB79_10			; RV64ZVE32F-NEXT: j .LBB79_10
	; RV64ZVE32F-NEXT: .LBB79_15: # %cond.load16			; RV64ZVE32F-NEXT: .LBB79_15: # %cond.load16
	; RV64ZVE32F-NEXT: vmv.x.s a3, v8			; RV64ZVE32F-NEXT: vmv.x.s a3, v8
	; RV64ZVE32F-NEXT: and a3, a3, a1			; RV64ZVE32F-NEXT: and a3, a3, a1
	; RV64ZVE32F-NEXT: slli a3, a3, 2			; RV64ZVE32F-NEXT: slli a3, a3, 2
	; RV64ZVE32F-NEXT: add a3, a0, a3			; RV64ZVE32F-NEXT: add a3, a0, a3
	▲ Show 20 Lines • Show All 62 Lines • ▼ Show 20 Lines
	; RV64ZVE32F-NEXT: beqz a2, .LBB80_4			; RV64ZVE32F-NEXT: beqz a2, .LBB80_4
	; RV64ZVE32F-NEXT: # %bb.3: # %cond.load1			; RV64ZVE32F-NEXT: # %bb.3: # %cond.load1
	; RV64ZVE32F-NEXT: vsetivli zero, 1, e32, m1, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e32, m1, ta, ma
	; RV64ZVE32F-NEXT: vslidedown.vi v12, v8, 1			; RV64ZVE32F-NEXT: vslidedown.vi v12, v8, 1
	; RV64ZVE32F-NEXT: vmv.x.s a2, v12			; RV64ZVE32F-NEXT: vmv.x.s a2, v12
	; RV64ZVE32F-NEXT: slli a2, a2, 2			; RV64ZVE32F-NEXT: slli a2, a2, 2
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: flw fa5, 0(a2)			; RV64ZVE32F-NEXT: flw fa5, 0(a2)
	; RV64ZVE32F-NEXT: vfmv.s.f v12, fa5			; RV64ZVE32F-NEXT: vmv.v.i v0, 2
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e32, m2, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 8, e32, m2, ta, ma
	; RV64ZVE32F-NEXT: vslideup.vi v10, v12, 1			; RV64ZVE32F-NEXT: vfmerge.vfm v10, v10, fa5, v0
	; RV64ZVE32F-NEXT: .LBB80_4: # %else2			; RV64ZVE32F-NEXT: .LBB80_4: # %else2
	; RV64ZVE32F-NEXT: vsetivli zero, 4, e32, m2, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 4, e32, m2, ta, ma
	; RV64ZVE32F-NEXT: vslidedown.vi v12, v8, 4			; RV64ZVE32F-NEXT: vslidedown.vi v12, v8, 4
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e32, m1, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 2, e32, m1, ta, ma
	; RV64ZVE32F-NEXT: andi a2, a1, 4			; RV64ZVE32F-NEXT: andi a2, a1, 4
	; RV64ZVE32F-NEXT: vslidedown.vi v8, v8, 2			; RV64ZVE32F-NEXT: vslidedown.vi v8, v8, 2
	; RV64ZVE32F-NEXT: bnez a2, .LBB80_12			; RV64ZVE32F-NEXT: bnez a2, .LBB80_12
	; RV64ZVE32F-NEXT: # %bb.5: # %else5			; RV64ZVE32F-NEXT: # %bb.5: # %else5
	Show All 26 Lines
	; RV64ZVE32F-NEXT: .LBB80_11: # %else20			; RV64ZVE32F-NEXT: .LBB80_11: # %else20
	; RV64ZVE32F-NEXT: vmv2r.v v8, v10			; RV64ZVE32F-NEXT: vmv2r.v v8, v10
	; RV64ZVE32F-NEXT: ret			; RV64ZVE32F-NEXT: ret
	; RV64ZVE32F-NEXT: .LBB80_12: # %cond.load4			; RV64ZVE32F-NEXT: .LBB80_12: # %cond.load4
	; RV64ZVE32F-NEXT: vmv.x.s a2, v8			; RV64ZVE32F-NEXT: vmv.x.s a2, v8
	; RV64ZVE32F-NEXT: slli a2, a2, 2			; RV64ZVE32F-NEXT: slli a2, a2, 2
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: flw fa5, 0(a2)			; RV64ZVE32F-NEXT: flw fa5, 0(a2)
	; RV64ZVE32F-NEXT: vfmv.s.f v14, fa5			; RV64ZVE32F-NEXT: vmv.v.i v0, 4
	; RV64ZVE32F-NEXT: vsetivli zero, 3, e32, m2, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 8, e32, m2, ta, ma
	; RV64ZVE32F-NEXT: vslideup.vi v10, v14, 2			; RV64ZVE32F-NEXT: vfmerge.vfm v10, v10, fa5, v0
	; RV64ZVE32F-NEXT: andi a2, a1, 8			; RV64ZVE32F-NEXT: andi a2, a1, 8
	; RV64ZVE32F-NEXT: beqz a2, .LBB80_6			; RV64ZVE32F-NEXT: beqz a2, .LBB80_6
	; RV64ZVE32F-NEXT: .LBB80_13: # %cond.load7			; RV64ZVE32F-NEXT: .LBB80_13: # %cond.load7
	; RV64ZVE32F-NEXT: vsetivli zero, 1, e32, m1, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e32, m1, ta, ma
	; RV64ZVE32F-NEXT: vslidedown.vi v8, v8, 1			; RV64ZVE32F-NEXT: vslidedown.vi v8, v8, 1
	; RV64ZVE32F-NEXT: vmv.x.s a2, v8			; RV64ZVE32F-NEXT: vmv.x.s a2, v8
	; RV64ZVE32F-NEXT: slli a2, a2, 2			; RV64ZVE32F-NEXT: slli a2, a2, 2
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: flw fa5, 0(a2)			; RV64ZVE32F-NEXT: flw fa5, 0(a2)
	; RV64ZVE32F-NEXT: vfmv.s.f v8, fa5			; RV64ZVE32F-NEXT: vmv.v.i v0, 8
	; RV64ZVE32F-NEXT: vsetivli zero, 4, e32, m2, tu, ma			; RV64ZVE32F-NEXT: vsetivli zero, 8, e32, m2, ta, ma
	; RV64ZVE32F-NEXT: vslideup.vi v10, v8, 3			; RV64ZVE32F-NEXT: vfmerge.vfm v10, v10, fa5, v0
	; RV64ZVE32F-NEXT: andi a2, a1, 16			; RV64ZVE32F-NEXT: andi a2, a1, 16
	; RV64ZVE32F-NEXT: beqz a2, .LBB80_7			; RV64ZVE32F-NEXT: beqz a2, .LBB80_7
	; RV64ZVE32F-NEXT: .LBB80_14: # %cond.load10			; RV64ZVE32F-NEXT: .LBB80_14: # %cond.load10
	; RV64ZVE32F-NEXT: vsetivli zero, 0, e32, m1, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 0, e32, m1, ta, ma
	; RV64ZVE32F-NEXT: vmv.x.s a2, v12			; RV64ZVE32F-NEXT: vmv.x.s a2, v12
	; RV64ZVE32F-NEXT: slli a2, a2, 2			; RV64ZVE32F-NEXT: slli a2, a2, 2
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: flw fa5, 0(a2)			; RV64ZVE32F-NEXT: flw fa5, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 5, e32, m2, tu, ma			; RV64ZVE32F-NEXT: li a2, 16
	; RV64ZVE32F-NEXT: vfmv.s.f v8, fa5			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vslideup.vi v10, v8, 4			; RV64ZVE32F-NEXT: vmv.v.x v0, a2
				; RV64ZVE32F-NEXT: vsetivli zero, 8, e32, m2, ta, ma
				; RV64ZVE32F-NEXT: vfmerge.vfm v10, v10, fa5, v0
	; RV64ZVE32F-NEXT: andi a2, a1, 32			; RV64ZVE32F-NEXT: andi a2, a1, 32
	; RV64ZVE32F-NEXT: bnez a2, .LBB80_8			; RV64ZVE32F-NEXT: bnez a2, .LBB80_8
	; RV64ZVE32F-NEXT: j .LBB80_9			; RV64ZVE32F-NEXT: j .LBB80_9
	; RV64ZVE32F-NEXT: .LBB80_15: # %cond.load16			; RV64ZVE32F-NEXT: .LBB80_15: # %cond.load16
	; RV64ZVE32F-NEXT: vmv.x.s a2, v8			; RV64ZVE32F-NEXT: vmv.x.s a2, v8
	; RV64ZVE32F-NEXT: slli a2, a2, 2			; RV64ZVE32F-NEXT: slli a2, a2, 2
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: flw fa5, 0(a2)			; RV64ZVE32F-NEXT: flw fa5, 0(a2)
	▲ Show 20 Lines • Show All 2,804 Lines • ▼ Show 20 Lines
	; RV64ZVE32F-NEXT: andi a2, a1, 2			; RV64ZVE32F-NEXT: andi a2, a1, 2
	; RV64ZVE32F-NEXT: beqz a2, .LBB97_4			; RV64ZVE32F-NEXT: beqz a2, .LBB97_4
	; RV64ZVE32F-NEXT: # %bb.3: # %cond.load1			; RV64ZVE32F-NEXT: # %bb.3: # %cond.load1
	; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vslidedown.vi v10, v8, 1			; RV64ZVE32F-NEXT: vslidedown.vi v10, v8, 1
	; RV64ZVE32F-NEXT: vmv.x.s a2, v10			; RV64ZVE32F-NEXT: vmv.x.s a2, v10
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: lbu a2, 0(a2)			; RV64ZVE32F-NEXT: lbu a2, 0(a2)
	; RV64ZVE32F-NEXT: vmv.s.x v10, a2			; RV64ZVE32F-NEXT: vsetvli zero, zero, e16, mf2, ta, ma
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e8, m1, tu, ma			; RV64ZVE32F-NEXT: vmv.v.i v0, 2
	; RV64ZVE32F-NEXT: vslideup.vi v9, v10, 1			; RV64ZVE32F-NEXT: vsetivli zero, 16, e8, m1, ta, ma
				; RV64ZVE32F-NEXT: vmerge.vxm v9, v9, a2, v0
	; RV64ZVE32F-NEXT: .LBB97_4: # %else2			; RV64ZVE32F-NEXT: .LBB97_4: # %else2
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e8, mf4, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 2, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: andi a2, a1, 4			; RV64ZVE32F-NEXT: andi a2, a1, 4
	; RV64ZVE32F-NEXT: vslidedown.vi v11, v8, 2			; RV64ZVE32F-NEXT: vslidedown.vi v11, v8, 2
	; RV64ZVE32F-NEXT: beqz a2, .LBB97_6			; RV64ZVE32F-NEXT: beqz a2, .LBB97_6
	; RV64ZVE32F-NEXT: # %bb.5: # %cond.load4			; RV64ZVE32F-NEXT: # %bb.5: # %cond.load4
	; RV64ZVE32F-NEXT: vmv.x.s a2, v11			; RV64ZVE32F-NEXT: vmv.x.s a2, v11
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: lbu a2, 0(a2)			; RV64ZVE32F-NEXT: lbu a2, 0(a2)
	; RV64ZVE32F-NEXT: vmv.s.x v10, a2			; RV64ZVE32F-NEXT: vsetivli zero, 1, e16, mf2, ta, ma
	; RV64ZVE32F-NEXT: vsetivli zero, 3, e8, m1, tu, ma			; RV64ZVE32F-NEXT: vmv.v.i v0, 4
	; RV64ZVE32F-NEXT: vslideup.vi v9, v10, 2			; RV64ZVE32F-NEXT: vsetivli zero, 16, e8, m1, ta, ma
				; RV64ZVE32F-NEXT: vmerge.vxm v9, v9, a2, v0
	; RV64ZVE32F-NEXT: .LBB97_6: # %else5			; RV64ZVE32F-NEXT: .LBB97_6: # %else5
	; RV64ZVE32F-NEXT: vsetivli zero, 4, e8, mf2, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 4, e8, mf2, ta, ma
	; RV64ZVE32F-NEXT: andi a2, a1, 8			; RV64ZVE32F-NEXT: andi a2, a1, 8
	; RV64ZVE32F-NEXT: vslidedown.vi v10, v8, 4			; RV64ZVE32F-NEXT: vslidedown.vi v10, v8, 4
	; RV64ZVE32F-NEXT: bnez a2, .LBB97_26			; RV64ZVE32F-NEXT: bnez a2, .LBB97_26
	; RV64ZVE32F-NEXT: # %bb.7: # %else8			; RV64ZVE32F-NEXT: # %bb.7: # %else8
	; RV64ZVE32F-NEXT: andi a2, a1, 16			; RV64ZVE32F-NEXT: andi a2, a1, 16
	; RV64ZVE32F-NEXT: bnez a2, .LBB97_27			; RV64ZVE32F-NEXT: bnez a2, .LBB97_27
	▲ Show 20 Lines • Show All 95 Lines • ▼ Show 20 Lines
	; RV64ZVE32F-NEXT: vmv1r.v v8, v9			; RV64ZVE32F-NEXT: vmv1r.v v8, v9
	; RV64ZVE32F-NEXT: ret			; RV64ZVE32F-NEXT: ret
	; RV64ZVE32F-NEXT: .LBB97_26: # %cond.load7			; RV64ZVE32F-NEXT: .LBB97_26: # %cond.load7
	; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vslidedown.vi v11, v11, 1			; RV64ZVE32F-NEXT: vslidedown.vi v11, v11, 1
	; RV64ZVE32F-NEXT: vmv.x.s a2, v11			; RV64ZVE32F-NEXT: vmv.x.s a2, v11
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: lbu a2, 0(a2)			; RV64ZVE32F-NEXT: lbu a2, 0(a2)
	; RV64ZVE32F-NEXT: vmv.s.x v11, a2			; RV64ZVE32F-NEXT: vsetvli zero, zero, e16, mf2, ta, ma
	; RV64ZVE32F-NEXT: vsetivli zero, 4, e8, m1, tu, ma			; RV64ZVE32F-NEXT: vmv.v.i v0, 8
	; RV64ZVE32F-NEXT: vslideup.vi v9, v11, 3			; RV64ZVE32F-NEXT: vsetivli zero, 16, e8, m1, ta, ma
				; RV64ZVE32F-NEXT: vmerge.vxm v9, v9, a2, v0
	; RV64ZVE32F-NEXT: andi a2, a1, 16			; RV64ZVE32F-NEXT: andi a2, a1, 16
	; RV64ZVE32F-NEXT: beqz a2, .LBB97_8			; RV64ZVE32F-NEXT: beqz a2, .LBB97_8
	; RV64ZVE32F-NEXT: .LBB97_27: # %cond.load10			; RV64ZVE32F-NEXT: .LBB97_27: # %cond.load10
	; RV64ZVE32F-NEXT: vsetivli zero, 0, e8, mf4, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 0, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vmv.x.s a2, v10			; RV64ZVE32F-NEXT: vmv.x.s a2, v10
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: lbu a2, 0(a2)			; RV64ZVE32F-NEXT: lbu a2, 0(a2)
	; RV64ZVE32F-NEXT: vsetivli zero, 5, e8, m1, tu, ma			; RV64ZVE32F-NEXT: li a3, 16
	; RV64ZVE32F-NEXT: vmv.s.x v11, a2			; RV64ZVE32F-NEXT: vsetivli zero, 1, e16, mf2, ta, ma
	; RV64ZVE32F-NEXT: vslideup.vi v9, v11, 4			; RV64ZVE32F-NEXT: vmv.v.x v0, a3
				; RV64ZVE32F-NEXT: vsetivli zero, 16, e8, m1, ta, ma
				; RV64ZVE32F-NEXT: vmerge.vxm v9, v9, a2, v0
	; RV64ZVE32F-NEXT: andi a2, a1, 32			; RV64ZVE32F-NEXT: andi a2, a1, 32
	; RV64ZVE32F-NEXT: bnez a2, .LBB97_9			; RV64ZVE32F-NEXT: bnez a2, .LBB97_9
	; RV64ZVE32F-NEXT: j .LBB97_10			; RV64ZVE32F-NEXT: j .LBB97_10
	; RV64ZVE32F-NEXT: .LBB97_28: # %cond.load16			; RV64ZVE32F-NEXT: .LBB97_28: # %cond.load16
	; RV64ZVE32F-NEXT: vmv.x.s a2, v10			; RV64ZVE32F-NEXT: vmv.x.s a2, v10
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: lbu a2, 0(a2)			; RV64ZVE32F-NEXT: lbu a2, 0(a2)
	; RV64ZVE32F-NEXT: vmv.s.x v11, a2			; RV64ZVE32F-NEXT: vmv.s.x v11, a2
	▲ Show 20 Lines • Show All 105 Lines • ▼ Show 20 Lines
	; RV64ZVE32F-NEXT: andi a2, a1, 2			; RV64ZVE32F-NEXT: andi a2, a1, 2
	; RV64ZVE32F-NEXT: beqz a2, .LBB98_4			; RV64ZVE32F-NEXT: beqz a2, .LBB98_4
	; RV64ZVE32F-NEXT: # %bb.3: # %cond.load1			; RV64ZVE32F-NEXT: # %bb.3: # %cond.load1
	; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vslidedown.vi v12, v8, 1			; RV64ZVE32F-NEXT: vslidedown.vi v12, v8, 1
	; RV64ZVE32F-NEXT: vmv.x.s a2, v12			; RV64ZVE32F-NEXT: vmv.x.s a2, v12
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: lbu a2, 0(a2)			; RV64ZVE32F-NEXT: lbu a2, 0(a2)
				; RV64ZVE32F-NEXT: vsetvli zero, zero, e32, m1, ta, ma
				; RV64ZVE32F-NEXT: vmv.v.i v0, 2
	; RV64ZVE32F-NEXT: li a3, 32			; RV64ZVE32F-NEXT: li a3, 32
	; RV64ZVE32F-NEXT: vmv.s.x v12, a2			; RV64ZVE32F-NEXT: vsetvli zero, a3, e8, m2, ta, ma
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e8, m2, tu, ma			; RV64ZVE32F-NEXT: vmerge.vxm v10, v10, a2, v0
	; RV64ZVE32F-NEXT: vslideup.vi v10, v12, 1
	; RV64ZVE32F-NEXT: .LBB98_4: # %else2			; RV64ZVE32F-NEXT: .LBB98_4: # %else2
	; RV64ZVE32F-NEXT: vsetivli zero, 2, e8, mf4, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 2, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: andi a2, a1, 4			; RV64ZVE32F-NEXT: andi a2, a1, 4
	; RV64ZVE32F-NEXT: vslidedown.vi v12, v8, 2			; RV64ZVE32F-NEXT: vslidedown.vi v12, v8, 2
	; RV64ZVE32F-NEXT: beqz a2, .LBB98_6			; RV64ZVE32F-NEXT: beqz a2, .LBB98_6
	; RV64ZVE32F-NEXT: # %bb.5: # %cond.load4			; RV64ZVE32F-NEXT: # %bb.5: # %cond.load4
	; RV64ZVE32F-NEXT: vmv.x.s a2, v12			; RV64ZVE32F-NEXT: vmv.x.s a2, v12
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: lbu a2, 0(a2)			; RV64ZVE32F-NEXT: lbu a2, 0(a2)
				; RV64ZVE32F-NEXT: vsetivli zero, 1, e32, m1, ta, ma
				; RV64ZVE32F-NEXT: vmv.v.i v0, 4
	; RV64ZVE32F-NEXT: li a3, 32			; RV64ZVE32F-NEXT: li a3, 32
	; RV64ZVE32F-NEXT: vmv.s.x v14, a2			; RV64ZVE32F-NEXT: vsetvli zero, a3, e8, m2, ta, ma
	; RV64ZVE32F-NEXT: vsetivli zero, 3, e8, m2, tu, ma			; RV64ZVE32F-NEXT: vmerge.vxm v10, v10, a2, v0
	; RV64ZVE32F-NEXT: vslideup.vi v10, v14, 2
	; RV64ZVE32F-NEXT: .LBB98_6: # %else5			; RV64ZVE32F-NEXT: .LBB98_6: # %else5
	; RV64ZVE32F-NEXT: vsetivli zero, 4, e8, mf2, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 4, e8, mf2, ta, ma
	; RV64ZVE32F-NEXT: andi a2, a1, 8			; RV64ZVE32F-NEXT: andi a2, a1, 8
	; RV64ZVE32F-NEXT: vslidedown.vi v13, v8, 4			; RV64ZVE32F-NEXT: vslidedown.vi v13, v8, 4
	; RV64ZVE32F-NEXT: bnez a2, .LBB98_50			; RV64ZVE32F-NEXT: bnez a2, .LBB98_50
	; RV64ZVE32F-NEXT: # %bb.7: # %else8			; RV64ZVE32F-NEXT: # %bb.7: # %else8
	; RV64ZVE32F-NEXT: andi a2, a1, 16			; RV64ZVE32F-NEXT: andi a2, a1, 16
	; RV64ZVE32F-NEXT: bnez a2, .LBB98_51			; RV64ZVE32F-NEXT: bnez a2, .LBB98_51
	▲ Show 20 Lines • Show All 239 Lines • ▼ Show 20 Lines
	; RV64ZVE32F-NEXT: vmv2r.v v8, v10			; RV64ZVE32F-NEXT: vmv2r.v v8, v10
	; RV64ZVE32F-NEXT: ret			; RV64ZVE32F-NEXT: ret
	; RV64ZVE32F-NEXT: .LBB98_50: # %cond.load7			; RV64ZVE32F-NEXT: .LBB98_50: # %cond.load7
	; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 1, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vslidedown.vi v12, v12, 1			; RV64ZVE32F-NEXT: vslidedown.vi v12, v12, 1
	; RV64ZVE32F-NEXT: vmv.x.s a2, v12			; RV64ZVE32F-NEXT: vmv.x.s a2, v12
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: lbu a2, 0(a2)			; RV64ZVE32F-NEXT: lbu a2, 0(a2)
				; RV64ZVE32F-NEXT: vsetvli zero, zero, e32, m1, ta, ma
				; RV64ZVE32F-NEXT: vmv.v.i v0, 8
	; RV64ZVE32F-NEXT: li a3, 32			; RV64ZVE32F-NEXT: li a3, 32
	; RV64ZVE32F-NEXT: vmv.s.x v14, a2			; RV64ZVE32F-NEXT: vsetvli zero, a3, e8, m2, ta, ma
	; RV64ZVE32F-NEXT: vsetivli zero, 4, e8, m2, tu, ma			; RV64ZVE32F-NEXT: vmerge.vxm v10, v10, a2, v0
	; RV64ZVE32F-NEXT: vslideup.vi v10, v14, 3
	; RV64ZVE32F-NEXT: andi a2, a1, 16			; RV64ZVE32F-NEXT: andi a2, a1, 16
	; RV64ZVE32F-NEXT: beqz a2, .LBB98_8			; RV64ZVE32F-NEXT: beqz a2, .LBB98_8
	; RV64ZVE32F-NEXT: .LBB98_51: # %cond.load10			; RV64ZVE32F-NEXT: .LBB98_51: # %cond.load10
	; RV64ZVE32F-NEXT: vsetivli zero, 0, e8, mf4, ta, ma			; RV64ZVE32F-NEXT: vsetivli zero, 0, e8, mf4, ta, ma
	; RV64ZVE32F-NEXT: vmv.x.s a2, v13			; RV64ZVE32F-NEXT: vmv.x.s a2, v13
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: lbu a2, 0(a2)			; RV64ZVE32F-NEXT: lbu a2, 0(a2)
				; RV64ZVE32F-NEXT: li a3, 16
				; RV64ZVE32F-NEXT: vsetivli zero, 1, e32, m1, ta, ma
				; RV64ZVE32F-NEXT: vmv.v.x v0, a3
	; RV64ZVE32F-NEXT: li a3, 32			; RV64ZVE32F-NEXT: li a3, 32
	; RV64ZVE32F-NEXT: vsetvli zero, a3, e8, m1, ta, ma			; RV64ZVE32F-NEXT: vsetvli zero, a3, e8, m2, ta, ma
	; RV64ZVE32F-NEXT: vmv.s.x v14, a2			; RV64ZVE32F-NEXT: vmerge.vxm v10, v10, a2, v0
	; RV64ZVE32F-NEXT: vsetivli zero, 5, e8, m2, tu, ma
	; RV64ZVE32F-NEXT: vslideup.vi v10, v14, 4
	; RV64ZVE32F-NEXT: andi a2, a1, 32			; RV64ZVE32F-NEXT: andi a2, a1, 32
	; RV64ZVE32F-NEXT: bnez a2, .LBB98_9			; RV64ZVE32F-NEXT: bnez a2, .LBB98_9
	; RV64ZVE32F-NEXT: j .LBB98_10			; RV64ZVE32F-NEXT: j .LBB98_10
	; RV64ZVE32F-NEXT: .LBB98_52: # %cond.load16			; RV64ZVE32F-NEXT: .LBB98_52: # %cond.load16
	; RV64ZVE32F-NEXT: vmv.x.s a2, v13			; RV64ZVE32F-NEXT: vmv.x.s a2, v13
	; RV64ZVE32F-NEXT: add a2, a0, a2			; RV64ZVE32F-NEXT: add a2, a0, a2
	; RV64ZVE32F-NEXT: lbu a2, 0(a2)			; RV64ZVE32F-NEXT: lbu a2, 0(a2)
	; RV64ZVE32F-NEXT: li a3, 32			; RV64ZVE32F-NEXT: li a3, 32
	▲ Show 20 Lines • Show All 154 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-shuffle-vslide1down.ll

Show First 20 Lines • Show All 252 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%v2 = shufflevector <4 x i8> %v1, <4 x i8> %v, <4 x i32> <i32 5, i32 6, i32 7, i32 1>		%v2 = shufflevector <4 x i8> %v1, <4 x i8> %v, <4 x i32> <i32 5, i32 6, i32 7, i32 1>
ret <4 x i8> %v2		ret <4 x i8> %v2
}		}

define <2 x double> @vslide1down_v2f64_inverted(<2 x double> %v, double %b) {		define <2 x double> @vslide1down_v2f64_inverted(<2 x double> %v, double %b) {
; CHECK-LABEL: vslide1down_v2f64_inverted:		; CHECK-LABEL: vslide1down_v2f64_inverted:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 2, e64, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 2, e64, m1, ta, ma
		; CHECK-NEXT: vmv.v.i v0, 2
; CHECK-NEXT: vrgather.vi v9, v8, 0		; CHECK-NEXT: vrgather.vi v9, v8, 0
; CHECK-NEXT: vfmv.s.f v8, fa0		; CHECK-NEXT: vfmerge.vfm v8, v9, fa0, v0
; CHECK-NEXT: vslideup.vi v9, v8, 1
; CHECK-NEXT: vmv.v.v v8, v9
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v1 = shufflevector <2 x double> %v, <2 x double> poison, <2 x i32> <i32 0, i32 0>		%v1 = shufflevector <2 x double> %v, <2 x double> poison, <2 x i32> <i32 0, i32 0>
%v2 = insertelement <2 x double> %v1, double %b, i64 1		%v2 = insertelement <2 x double> %v1, double %b, i64 1
ret <2 x double> %v2		ret <2 x double> %v2
}		}

define <4 x i8> @vslide1down_4xi8_inverted(<4 x i8> %v, i8 %b) {		define <4 x i8> @vslide1down_4xi8_inverted(<4 x i8> %v, i8 %b) {
; CHECK-LABEL: vslide1down_4xi8_inverted:		; CHECK-LABEL: vslide1down_4xi8_inverted:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: vsetivli zero, 4, e8, mf4, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e8, mf4, ta, ma
		; CHECK-NEXT: vmv.v.i v0, 2
; CHECK-NEXT: vslideup.vi v9, v8, 1		; CHECK-NEXT: vslideup.vi v9, v8, 1
; CHECK-NEXT: vmv.s.x v8, a0		; CHECK-NEXT: vmerge.vxm v8, v9, a0, v0
; CHECK-NEXT: vsetivli zero, 2, e8, mf4, tu, ma
; CHECK-NEXT: vslideup.vi v9, v8, 1
; CHECK-NEXT: vmv1r.v v8, v9
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v1 = shufflevector <4 x i8> %v, <4 x i8> poison, <4 x i32> <i32 undef, i32 0, i32 1, i32 2>		%v1 = shufflevector <4 x i8> %v, <4 x i8> poison, <4 x i32> <i32 undef, i32 0, i32 1, i32 2>
%v2 = insertelement <4 x i8> %v1, i8 %b, i64 1		%v2 = insertelement <4 x i8> %v1, i8 %b, i64 1
ret <4 x i8> %v2		ret <4 x i8> %v2
}		}

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-shuffle-vslide1up.ll

Show First 20 Lines • Show All 296 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%v1 = shufflevector <4 x i8> %v, <4 x i8> poison, <4 x i32> <i32 undef, i32 0, i32 1, i32 2>		%v1 = shufflevector <4 x i8> %v, <4 x i8> poison, <4 x i32> <i32 undef, i32 0, i32 1, i32 2>
%v2 = insertelement <4 x i8> %v1, i8 %b, i64 0		%v2 = insertelement <4 x i8> %v1, i8 %b, i64 0
ret <4 x i8> %v2		ret <4 x i8> %v2
}		}

define <2 x double> @vslide1up_2xf64_as_rotate(<2 x double> %v, double %b) {		define <2 x double> @vslide1up_2xf64_as_rotate(<2 x double> %v, double %b) {
; CHECK-LABEL: vslide1up_2xf64_as_rotate:		; CHECK-LABEL: vslide1up_2xf64_as_rotate:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
		; CHECK-NEXT: vsetivli zero, 1, e8, mf8, ta, ma
		; CHECK-NEXT: vmv.v.i v0, 2
; CHECK-NEXT: vsetivli zero, 2, e64, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 2, e64, m1, ta, ma
; CHECK-NEXT: vfmv.s.f v9, fa0		; CHECK-NEXT: vfmerge.vfm v9, v8, fa0, v0
		; CHECK-NEXT: vslidedown.vi v8, v9, 1
; CHECK-NEXT: vslideup.vi v8, v9, 1		; CHECK-NEXT: vslideup.vi v8, v9, 1
; CHECK-NEXT: vslidedown.vi v9, v8, 1
; CHECK-NEXT: vslideup.vi v9, v8, 1
; CHECK-NEXT: vmv.v.v v8, v9
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v1 = insertelement <2 x double> %v, double %b, i64 1		%v1 = insertelement <2 x double> %v, double %b, i64 1
%v2 = shufflevector <2 x double> %v1, <2 x double> poison, <2 x i32> <i32 1, i32 0>		%v2 = shufflevector <2 x double> %v1, <2 x double> poison, <2 x i32> <i32 1, i32 0>
ret <2 x double> %v2		ret <2 x double> %v2
}		}

define <4 x i8> @vslide1up_4xi8_as_rotate(<4 x i8> %v, i8 %b) {		define <4 x i8> @vslide1up_4xi8_as_rotate(<4 x i8> %v, i8 %b) {
; CHECK-LABEL: vslide1up_4xi8_as_rotate:		; CHECK-LABEL: vslide1up_4xi8_as_rotate:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
		; CHECK-NEXT: vsetivli zero, 1, e8, mf8, ta, ma
		; CHECK-NEXT: vmv.v.i v0, 8
; CHECK-NEXT: vsetivli zero, 4, e8, mf4, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e8, mf4, ta, ma
; CHECK-NEXT: vmv.s.x v9, a0		; CHECK-NEXT: vmerge.vxm v9, v8, a0, v0
; CHECK-NEXT: vslideup.vi v8, v9, 3		; CHECK-NEXT: vslidedown.vi v8, v9, 3
; CHECK-NEXT: vslidedown.vi v9, v8, 3		; CHECK-NEXT: vslideup.vi v8, v9, 1
; CHECK-NEXT: vslideup.vi v9, v8, 1
; CHECK-NEXT: vmv1r.v v8, v9
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v1 = insertelement <4 x i8> %v, i8 %b, i64 3		%v1 = insertelement <4 x i8> %v, i8 %b, i64 3
%v2 = shufflevector <4 x i8> %v1, <4 x i8> poison, <4 x i32> <i32 3, i32 0, i32 1, i32 2>		%v2 = shufflevector <4 x i8> %v1, <4 x i8> poison, <4 x i32> <i32 3, i32 0, i32 1, i32 2>
ret <4 x i8> %v2		ret <4 x i8> %v2
}		}

; The length of the shift is less than the suffix, since we'd have to		; The length of the shift is less than the suffix, since we'd have to
; materailize the splat, using the vslide1up doesn't help us.		; materailize the splat, using the vslide1up doesn't help us.
▲ Show 20 Lines • Show All 93 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-stepvector.ll

	Show First 20 Lines • Show All 184 Lines • ▼ Show 20 Lines
	}			}

	declare <2 x i64> @llvm.experimental.stepvector.v2i64()			declare <2 x i64> @llvm.experimental.stepvector.v2i64()

	define <2 x i64> @stepvector_v2i64() {			define <2 x i64> @stepvector_v2i64() {
	; RV32LMULMAX1-LABEL: stepvector_v2i64:			; RV32LMULMAX1-LABEL: stepvector_v2i64:
	; RV32LMULMAX1: # %bb.0:			; RV32LMULMAX1: # %bb.0:
	; RV32LMULMAX1-NEXT: vsetivli zero, 4, e32, m1, ta, ma			; RV32LMULMAX1-NEXT: vsetivli zero, 4, e32, m1, ta, ma
	; RV32LMULMAX1-NEXT: vmv.v.i v9, 1			; RV32LMULMAX1-NEXT: vmv.v.i v0, 4
	; RV32LMULMAX1-NEXT: vmv.v.i v8, 0			; RV32LMULMAX1-NEXT: vmv.v.i v8, 0
	; RV32LMULMAX1-NEXT: vsetivli zero, 3, e32, m1, tu, ma			; RV32LMULMAX1-NEXT: vmerge.vim v8, v8, 1, v0
	; RV32LMULMAX1-NEXT: vslideup.vi v8, v9, 2
	; RV32LMULMAX1-NEXT: ret			; RV32LMULMAX1-NEXT: ret
	;			;
	; RV64LMULMAX1-LABEL: stepvector_v2i64:			; RV64LMULMAX1-LABEL: stepvector_v2i64:
	; RV64LMULMAX1: # %bb.0:			; RV64LMULMAX1: # %bb.0:
	; RV64LMULMAX1-NEXT: vsetivli zero, 2, e64, m1, ta, ma			; RV64LMULMAX1-NEXT: vsetivli zero, 2, e64, m1, ta, ma
	; RV64LMULMAX1-NEXT: vid.v v8			; RV64LMULMAX1-NEXT: vid.v v8
	; RV64LMULMAX1-NEXT: ret			; RV64LMULMAX1-NEXT: ret
	;			;
	; RV32LMULMAX2-LABEL: stepvector_v2i64:			; RV32LMULMAX2-LABEL: stepvector_v2i64:
	; RV32LMULMAX2: # %bb.0:			; RV32LMULMAX2: # %bb.0:
	; RV32LMULMAX2-NEXT: vsetivli zero, 4, e32, m1, ta, ma			; RV32LMULMAX2-NEXT: vsetivli zero, 4, e32, m1, ta, ma
	; RV32LMULMAX2-NEXT: vmv.v.i v9, 1			; RV32LMULMAX2-NEXT: vmv.v.i v0, 4
	; RV32LMULMAX2-NEXT: vmv.v.i v8, 0			; RV32LMULMAX2-NEXT: vmv.v.i v8, 0
	; RV32LMULMAX2-NEXT: vsetivli zero, 3, e32, m1, tu, ma			; RV32LMULMAX2-NEXT: vmerge.vim v8, v8, 1, v0
	; RV32LMULMAX2-NEXT: vslideup.vi v8, v9, 2
	; RV32LMULMAX2-NEXT: ret			; RV32LMULMAX2-NEXT: ret
	;			;
	; RV64LMULMAX2-LABEL: stepvector_v2i64:			; RV64LMULMAX2-LABEL: stepvector_v2i64:
	; RV64LMULMAX2: # %bb.0:			; RV64LMULMAX2: # %bb.0:
	; RV64LMULMAX2-NEXT: vsetivli zero, 2, e64, m1, ta, ma			; RV64LMULMAX2-NEXT: vsetivli zero, 2, e64, m1, ta, ma
	; RV64LMULMAX2-NEXT: vid.v v8			; RV64LMULMAX2-NEXT: vid.v v8
	; RV64LMULMAX2-NEXT: ret			; RV64LMULMAX2-NEXT: ret
	%v = call <2 x i64> @llvm.experimental.stepvector.v2i64()			%v = call <2 x i64> @llvm.experimental.stepvector.v2i64()
	ret <2 x i64> %v			ret <2 x i64> %v
	}			}

	declare <4 x i64> @llvm.experimental.stepvector.v4i64()			declare <4 x i64> @llvm.experimental.stepvector.v4i64()

	define <4 x i64> @stepvector_v4i64() {			define <4 x i64> @stepvector_v4i64() {
	; RV32LMULMAX1-LABEL: stepvector_v4i64:			; RV32LMULMAX1-LABEL: stepvector_v4i64:
	; RV32LMULMAX1: # %bb.0:			; RV32LMULMAX1: # %bb.0:
	; RV32LMULMAX1-NEXT: vsetivli zero, 4, e32, m1, ta, ma			; RV32LMULMAX1-NEXT: vsetivli zero, 4, e32, m1, ta, ma
	; RV32LMULMAX1-NEXT: vmv.v.i v9, 1
	; RV32LMULMAX1-NEXT: vmv.v.i v8, 0
	; RV32LMULMAX1-NEXT: vsetivli zero, 3, e32, m1, tu, ma
	; RV32LMULMAX1-NEXT: vslideup.vi v8, v9, 2
	; RV32LMULMAX1-NEXT: lui a0, %hi(.LCPI14_0)			; RV32LMULMAX1-NEXT: lui a0, %hi(.LCPI14_0)
	; RV32LMULMAX1-NEXT: addi a0, a0, %lo(.LCPI14_0)			; RV32LMULMAX1-NEXT: addi a0, a0, %lo(.LCPI14_0)
	; RV32LMULMAX1-NEXT: vsetivli zero, 4, e32, m1, ta, ma
	; RV32LMULMAX1-NEXT: vle32.v v9, (a0)			; RV32LMULMAX1-NEXT: vle32.v v9, (a0)
				; RV32LMULMAX1-NEXT: vmv.v.i v0, 4
				; RV32LMULMAX1-NEXT: vmv.v.i v8, 0
				; RV32LMULMAX1-NEXT: vmerge.vim v8, v8, 1, v0
	; RV32LMULMAX1-NEXT: ret			; RV32LMULMAX1-NEXT: ret
	;			;
	; RV64LMULMAX1-LABEL: stepvector_v4i64:			; RV64LMULMAX1-LABEL: stepvector_v4i64:
	; RV64LMULMAX1: # %bb.0:			; RV64LMULMAX1: # %bb.0:
	; RV64LMULMAX1-NEXT: vsetivli zero, 2, e64, m1, ta, ma			; RV64LMULMAX1-NEXT: vsetivli zero, 2, e64, m1, ta, ma
	; RV64LMULMAX1-NEXT: vid.v v8			; RV64LMULMAX1-NEXT: vid.v v8
	; RV64LMULMAX1-NEXT: vadd.vi v9, v8, 2			; RV64LMULMAX1-NEXT: vadd.vi v9, v8, 2
	; RV64LMULMAX1-NEXT: ret			; RV64LMULMAX1-NEXT: ret
	Show All 16 Lines
	}			}

	declare <8 x i64> @llvm.experimental.stepvector.v8i64()			declare <8 x i64> @llvm.experimental.stepvector.v8i64()

	define <8 x i64> @stepvector_v8i64() {			define <8 x i64> @stepvector_v8i64() {
	; RV32LMULMAX1-LABEL: stepvector_v8i64:			; RV32LMULMAX1-LABEL: stepvector_v8i64:
	; RV32LMULMAX1: # %bb.0:			; RV32LMULMAX1: # %bb.0:
	; RV32LMULMAX1-NEXT: vsetivli zero, 4, e32, m1, ta, ma			; RV32LMULMAX1-NEXT: vsetivli zero, 4, e32, m1, ta, ma
	; RV32LMULMAX1-NEXT: vmv.v.i v9, 1
	; RV32LMULMAX1-NEXT: vmv.v.i v8, 0
	; RV32LMULMAX1-NEXT: vsetivli zero, 3, e32, m1, tu, ma
	; RV32LMULMAX1-NEXT: vslideup.vi v8, v9, 2
	; RV32LMULMAX1-NEXT: lui a0, %hi(.LCPI15_0)			; RV32LMULMAX1-NEXT: lui a0, %hi(.LCPI15_0)
	; RV32LMULMAX1-NEXT: addi a0, a0, %lo(.LCPI15_0)			; RV32LMULMAX1-NEXT: addi a0, a0, %lo(.LCPI15_0)
	; RV32LMULMAX1-NEXT: vsetivli zero, 4, e32, m1, ta, ma
	; RV32LMULMAX1-NEXT: vle32.v v9, (a0)			; RV32LMULMAX1-NEXT: vle32.v v9, (a0)
	; RV32LMULMAX1-NEXT: lui a0, %hi(.LCPI15_1)			; RV32LMULMAX1-NEXT: lui a0, %hi(.LCPI15_1)
	; RV32LMULMAX1-NEXT: addi a0, a0, %lo(.LCPI15_1)			; RV32LMULMAX1-NEXT: addi a0, a0, %lo(.LCPI15_1)
	; RV32LMULMAX1-NEXT: vle32.v v10, (a0)			; RV32LMULMAX1-NEXT: vle32.v v10, (a0)
	; RV32LMULMAX1-NEXT: lui a0, %hi(.LCPI15_2)			; RV32LMULMAX1-NEXT: lui a0, %hi(.LCPI15_2)
	; RV32LMULMAX1-NEXT: addi a0, a0, %lo(.LCPI15_2)			; RV32LMULMAX1-NEXT: addi a0, a0, %lo(.LCPI15_2)
	; RV32LMULMAX1-NEXT: vle32.v v11, (a0)			; RV32LMULMAX1-NEXT: vle32.v v11, (a0)
				; RV32LMULMAX1-NEXT: vmv.v.i v0, 4
				; RV32LMULMAX1-NEXT: vmv.v.i v8, 0
				; RV32LMULMAX1-NEXT: vmerge.vim v8, v8, 1, v0
	; RV32LMULMAX1-NEXT: ret			; RV32LMULMAX1-NEXT: ret
	;			;
	; RV64LMULMAX1-LABEL: stepvector_v8i64:			; RV64LMULMAX1-LABEL: stepvector_v8i64:
	; RV64LMULMAX1: # %bb.0:			; RV64LMULMAX1: # %bb.0:
	; RV64LMULMAX1-NEXT: vsetivli zero, 2, e64, m1, ta, ma			; RV64LMULMAX1-NEXT: vsetivli zero, 2, e64, m1, ta, ma
	; RV64LMULMAX1-NEXT: vid.v v8			; RV64LMULMAX1-NEXT: vid.v v8
	; RV64LMULMAX1-NEXT: vadd.vi v9, v8, 2			; RV64LMULMAX1-NEXT: vadd.vi v9, v8, 2
	; RV64LMULMAX1-NEXT: vadd.vi v10, v8, 4			; RV64LMULMAX1-NEXT: vadd.vi v10, v8, 4
	Show All 22 Lines
	}			}

	declare <16 x i64> @llvm.experimental.stepvector.v16i64()			declare <16 x i64> @llvm.experimental.stepvector.v16i64()

	define <16 x i64> @stepvector_v16i64() {			define <16 x i64> @stepvector_v16i64() {
	; RV32LMULMAX1-LABEL: stepvector_v16i64:			; RV32LMULMAX1-LABEL: stepvector_v16i64:
	; RV32LMULMAX1: # %bb.0:			; RV32LMULMAX1: # %bb.0:
	; RV32LMULMAX1-NEXT: vsetivli zero, 4, e32, m1, ta, ma			; RV32LMULMAX1-NEXT: vsetivli zero, 4, e32, m1, ta, ma
	; RV32LMULMAX1-NEXT: vmv.v.i v9, 1
	; RV32LMULMAX1-NEXT: vmv.v.i v8, 0
	; RV32LMULMAX1-NEXT: vsetivli zero, 3, e32, m1, tu, ma
	; RV32LMULMAX1-NEXT: vslideup.vi v8, v9, 2
	; RV32LMULMAX1-NEXT: lui a0, %hi(.LCPI16_0)			; RV32LMULMAX1-NEXT: lui a0, %hi(.LCPI16_0)
	; RV32LMULMAX1-NEXT: addi a0, a0, %lo(.LCPI16_0)			; RV32LMULMAX1-NEXT: addi a0, a0, %lo(.LCPI16_0)
	; RV32LMULMAX1-NEXT: vsetivli zero, 4, e32, m1, ta, ma
	; RV32LMULMAX1-NEXT: vle32.v v9, (a0)			; RV32LMULMAX1-NEXT: vle32.v v9, (a0)
	; RV32LMULMAX1-NEXT: lui a0, %hi(.LCPI16_1)			; RV32LMULMAX1-NEXT: lui a0, %hi(.LCPI16_1)
	; RV32LMULMAX1-NEXT: addi a0, a0, %lo(.LCPI16_1)			; RV32LMULMAX1-NEXT: addi a0, a0, %lo(.LCPI16_1)
	; RV32LMULMAX1-NEXT: vle32.v v10, (a0)			; RV32LMULMAX1-NEXT: vle32.v v10, (a0)
	; RV32LMULMAX1-NEXT: lui a0, %hi(.LCPI16_2)			; RV32LMULMAX1-NEXT: lui a0, %hi(.LCPI16_2)
	; RV32LMULMAX1-NEXT: addi a0, a0, %lo(.LCPI16_2)			; RV32LMULMAX1-NEXT: addi a0, a0, %lo(.LCPI16_2)
	; RV32LMULMAX1-NEXT: vle32.v v11, (a0)			; RV32LMULMAX1-NEXT: vle32.v v11, (a0)
	; RV32LMULMAX1-NEXT: lui a0, %hi(.LCPI16_3)			; RV32LMULMAX1-NEXT: lui a0, %hi(.LCPI16_3)
	; RV32LMULMAX1-NEXT: addi a0, a0, %lo(.LCPI16_3)			; RV32LMULMAX1-NEXT: addi a0, a0, %lo(.LCPI16_3)
	; RV32LMULMAX1-NEXT: vle32.v v12, (a0)			; RV32LMULMAX1-NEXT: vle32.v v12, (a0)
	; RV32LMULMAX1-NEXT: lui a0, %hi(.LCPI16_4)			; RV32LMULMAX1-NEXT: lui a0, %hi(.LCPI16_4)
	; RV32LMULMAX1-NEXT: addi a0, a0, %lo(.LCPI16_4)			; RV32LMULMAX1-NEXT: addi a0, a0, %lo(.LCPI16_4)
	; RV32LMULMAX1-NEXT: vle32.v v13, (a0)			; RV32LMULMAX1-NEXT: vle32.v v13, (a0)
	; RV32LMULMAX1-NEXT: lui a0, %hi(.LCPI16_5)			; RV32LMULMAX1-NEXT: lui a0, %hi(.LCPI16_5)
	; RV32LMULMAX1-NEXT: addi a0, a0, %lo(.LCPI16_5)			; RV32LMULMAX1-NEXT: addi a0, a0, %lo(.LCPI16_5)
	; RV32LMULMAX1-NEXT: vle32.v v14, (a0)			; RV32LMULMAX1-NEXT: vle32.v v14, (a0)
	; RV32LMULMAX1-NEXT: lui a0, %hi(.LCPI16_6)			; RV32LMULMAX1-NEXT: lui a0, %hi(.LCPI16_6)
	; RV32LMULMAX1-NEXT: addi a0, a0, %lo(.LCPI16_6)			; RV32LMULMAX1-NEXT: addi a0, a0, %lo(.LCPI16_6)
	; RV32LMULMAX1-NEXT: vle32.v v15, (a0)			; RV32LMULMAX1-NEXT: vle32.v v15, (a0)
				; RV32LMULMAX1-NEXT: vmv.v.i v0, 4
				; RV32LMULMAX1-NEXT: vmv.v.i v8, 0
				; RV32LMULMAX1-NEXT: vmerge.vim v8, v8, 1, v0
	; RV32LMULMAX1-NEXT: ret			; RV32LMULMAX1-NEXT: ret
	;			;
	; RV64LMULMAX1-LABEL: stepvector_v16i64:			; RV64LMULMAX1-LABEL: stepvector_v16i64:
	; RV64LMULMAX1: # %bb.0:			; RV64LMULMAX1: # %bb.0:
	; RV64LMULMAX1-NEXT: vsetivli zero, 2, e64, m1, ta, ma			; RV64LMULMAX1-NEXT: vsetivli zero, 2, e64, m1, ta, ma
	; RV64LMULMAX1-NEXT: vid.v v8			; RV64LMULMAX1-NEXT: vid.v v8
	; RV64LMULMAX1-NEXT: vadd.vi v9, v8, 2			; RV64LMULMAX1-NEXT: vadd.vi v9, v8, 2
	; RV64LMULMAX1-NEXT: vadd.vi v10, v8, 4			; RV64LMULMAX1-NEXT: vadd.vi v10, v8, 4
	Show All 35 Lines

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-unaligned.ll

	Show First 20 Lines • Show All 100 Lines • ▼ Show 20 Lines
	; RV32-SLOW-NEXT: .LBB4_4: # %cond.load1			; RV32-SLOW-NEXT: .LBB4_4: # %cond.load1
	; RV32-SLOW-NEXT: vsetivli zero, 1, e32, mf2, ta, ma			; RV32-SLOW-NEXT: vsetivli zero, 1, e32, mf2, ta, ma
	; RV32-SLOW-NEXT: vslidedown.vi v8, v8, 1			; RV32-SLOW-NEXT: vslidedown.vi v8, v8, 1
	; RV32-SLOW-NEXT: vmv.x.s a0, v8			; RV32-SLOW-NEXT: vmv.x.s a0, v8
	; RV32-SLOW-NEXT: lbu a1, 1(a0)			; RV32-SLOW-NEXT: lbu a1, 1(a0)
	; RV32-SLOW-NEXT: lbu a0, 0(a0)			; RV32-SLOW-NEXT: lbu a0, 0(a0)
	; RV32-SLOW-NEXT: slli a1, a1, 8			; RV32-SLOW-NEXT: slli a1, a1, 8
	; RV32-SLOW-NEXT: or a0, a1, a0			; RV32-SLOW-NEXT: or a0, a1, a0
	; RV32-SLOW-NEXT: vmv.s.x v8, a0			; RV32-SLOW-NEXT: vmv.v.i v0, 2
	; RV32-SLOW-NEXT: vsetivli zero, 2, e16, mf4, ta, ma			; RV32-SLOW-NEXT: vsetivli zero, 2, e16, mf4, ta, ma
	; RV32-SLOW-NEXT: vslideup.vi v9, v8, 1			; RV32-SLOW-NEXT: vmerge.vxm v9, v9, a0, v0
	; RV32-SLOW-NEXT: vmv1r.v v8, v9			; RV32-SLOW-NEXT: vmv1r.v v8, v9
	; RV32-SLOW-NEXT: ret			; RV32-SLOW-NEXT: ret
	;			;
	; RV64-SLOW-LABEL: mgather_v2i16_align1:			; RV64-SLOW-LABEL: mgather_v2i16_align1:
	; RV64-SLOW: # %bb.0:			; RV64-SLOW: # %bb.0:
	; RV64-SLOW-NEXT: vsetivli zero, 0, e8, mf8, ta, ma			; RV64-SLOW-NEXT: vsetivli zero, 0, e8, mf8, ta, ma
	; RV64-SLOW-NEXT: vmv.x.s a0, v0			; RV64-SLOW-NEXT: vmv.x.s a0, v0
	; RV64-SLOW-NEXT: andi a1, a0, 1			; RV64-SLOW-NEXT: andi a1, a0, 1
	Show All 18 Lines
	; RV64-SLOW-NEXT: .LBB4_4: # %cond.load1			; RV64-SLOW-NEXT: .LBB4_4: # %cond.load1
	; RV64-SLOW-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV64-SLOW-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; RV64-SLOW-NEXT: vslidedown.vi v8, v8, 1			; RV64-SLOW-NEXT: vslidedown.vi v8, v8, 1
	; RV64-SLOW-NEXT: vmv.x.s a0, v8			; RV64-SLOW-NEXT: vmv.x.s a0, v8
	; RV64-SLOW-NEXT: lbu a1, 1(a0)			; RV64-SLOW-NEXT: lbu a1, 1(a0)
	; RV64-SLOW-NEXT: lbu a0, 0(a0)			; RV64-SLOW-NEXT: lbu a0, 0(a0)
	; RV64-SLOW-NEXT: slli a1, a1, 8			; RV64-SLOW-NEXT: slli a1, a1, 8
	; RV64-SLOW-NEXT: or a0, a1, a0			; RV64-SLOW-NEXT: or a0, a1, a0
	; RV64-SLOW-NEXT: vmv.s.x v8, a0			; RV64-SLOW-NEXT: vmv.v.i v0, 2
	; RV64-SLOW-NEXT: vsetivli zero, 2, e16, mf4, ta, ma			; RV64-SLOW-NEXT: vsetivli zero, 2, e16, mf4, ta, ma
	; RV64-SLOW-NEXT: vslideup.vi v9, v8, 1			; RV64-SLOW-NEXT: vmerge.vxm v9, v9, a0, v0
	; RV64-SLOW-NEXT: vmv1r.v v8, v9			; RV64-SLOW-NEXT: vmv1r.v v8, v9
	; RV64-SLOW-NEXT: ret			; RV64-SLOW-NEXT: ret
	;			;
	; RV32-FAST-LABEL: mgather_v2i16_align1:			; RV32-FAST-LABEL: mgather_v2i16_align1:
	; RV32-FAST: # %bb.0:			; RV32-FAST: # %bb.0:
	; RV32-FAST-NEXT: vsetivli zero, 2, e16, mf4, ta, mu			; RV32-FAST-NEXT: vsetivli zero, 2, e16, mf4, ta, mu
	; RV32-FAST-NEXT: vluxei32.v v9, (zero), v8, v0.t			; RV32-FAST-NEXT: vluxei32.v v9, (zero), v8, v0.t
	; RV32-FAST-NEXT: vmv1r.v v8, v9			; RV32-FAST-NEXT: vmv1r.v v8, v9
	▲ Show 20 Lines • Show All 74 Lines • ▼ Show 20 Lines
	; RV64-SLOW-NEXT: .LBB5_4: # %cond.load1			; RV64-SLOW-NEXT: .LBB5_4: # %cond.load1
	; RV64-SLOW-NEXT: vsetivli zero, 1, e64, m1, ta, ma			; RV64-SLOW-NEXT: vsetivli zero, 1, e64, m1, ta, ma
	; RV64-SLOW-NEXT: vslidedown.vi v8, v8, 1			; RV64-SLOW-NEXT: vslidedown.vi v8, v8, 1
	; RV64-SLOW-NEXT: vmv.x.s a0, v8			; RV64-SLOW-NEXT: vmv.x.s a0, v8
	; RV64-SLOW-NEXT: lwu a1, 4(a0)			; RV64-SLOW-NEXT: lwu a1, 4(a0)
	; RV64-SLOW-NEXT: lwu a0, 0(a0)			; RV64-SLOW-NEXT: lwu a0, 0(a0)
	; RV64-SLOW-NEXT: slli a1, a1, 32			; RV64-SLOW-NEXT: slli a1, a1, 32
	; RV64-SLOW-NEXT: or a0, a1, a0			; RV64-SLOW-NEXT: or a0, a1, a0
	; RV64-SLOW-NEXT: vmv.s.x v8, a0			; RV64-SLOW-NEXT: vmv.v.i v0, 2
	; RV64-SLOW-NEXT: vsetivli zero, 2, e64, m1, ta, ma			; RV64-SLOW-NEXT: vsetivli zero, 2, e64, m1, ta, ma
	; RV64-SLOW-NEXT: vslideup.vi v9, v8, 1			; RV64-SLOW-NEXT: vmerge.vxm v9, v9, a0, v0
	; RV64-SLOW-NEXT: vmv1r.v v8, v9			; RV64-SLOW-NEXT: vmv1r.v v8, v9
	; RV64-SLOW-NEXT: ret			; RV64-SLOW-NEXT: ret
	;			;
	; RV32-FAST-LABEL: mgather_v2i64_align4:			; RV32-FAST-LABEL: mgather_v2i64_align4:
	; RV32-FAST: # %bb.0:			; RV32-FAST: # %bb.0:
	; RV32-FAST-NEXT: vsetivli zero, 2, e64, m1, ta, mu			; RV32-FAST-NEXT: vsetivli zero, 2, e64, m1, ta, mu
	; RV32-FAST-NEXT: vluxei32.v v9, (zero), v8, v0.t			; RV32-FAST-NEXT: vluxei32.v v9, (zero), v8, v0.t
	; RV32-FAST-NEXT: vmv.v.v v8, v9			; RV32-FAST-NEXT: vmv.v.v v8, v9
	▲ Show 20 Lines • Show All 269 Lines • ▼ Show 20 Lines
	; RV32-SLOW-NEXT: lbu a4, 6(a0)			; RV32-SLOW-NEXT: lbu a4, 6(a0)
	; RV32-SLOW-NEXT: lbu a0, 7(a0)			; RV32-SLOW-NEXT: lbu a0, 7(a0)
	; RV32-SLOW-NEXT: slli a2, a2, 8			; RV32-SLOW-NEXT: slli a2, a2, 8
	; RV32-SLOW-NEXT: or a2, a2, a3			; RV32-SLOW-NEXT: or a2, a2, a3
	; RV32-SLOW-NEXT: slli a4, a4, 16			; RV32-SLOW-NEXT: slli a4, a4, 16
	; RV32-SLOW-NEXT: slli a0, a0, 24			; RV32-SLOW-NEXT: slli a0, a0, 24
	; RV32-SLOW-NEXT: or a0, a0, a4			; RV32-SLOW-NEXT: or a0, a0, a4
	; RV32-SLOW-NEXT: or a0, a0, a2			; RV32-SLOW-NEXT: or a0, a0, a2
				; RV32-SLOW-NEXT: vsetivli zero, 1, e8, mf8, ta, ma
				; RV32-SLOW-NEXT: vmv.v.i v0, 2
	; RV32-SLOW-NEXT: vsetivli zero, 2, e32, mf2, ta, ma			; RV32-SLOW-NEXT: vsetivli zero, 2, e32, mf2, ta, ma
	; RV32-SLOW-NEXT: vmv.s.x v9, a0			; RV32-SLOW-NEXT: vmerge.vxm v8, v8, a0, v0
	; RV32-SLOW-NEXT: vslideup.vi v8, v9, 1
	; RV32-SLOW-NEXT: .LBB8_4: # %else2			; RV32-SLOW-NEXT: .LBB8_4: # %else2
	; RV32-SLOW-NEXT: vsetivli zero, 2, e32, mf2, ta, ma			; RV32-SLOW-NEXT: vsetivli zero, 2, e32, mf2, ta, ma
	; RV32-SLOW-NEXT: vse32.v v8, (a1)			; RV32-SLOW-NEXT: vse32.v v8, (a1)
	; RV32-SLOW-NEXT: ret			; RV32-SLOW-NEXT: ret
	;			;
	; RV64-SLOW-LABEL: masked_load_v2i32_align1:			; RV64-SLOW-LABEL: masked_load_v2i32_align1:
	; RV64-SLOW: # %bb.0:			; RV64-SLOW: # %bb.0:
	; RV64-SLOW-NEXT: vsetivli zero, 2, e32, mf2, ta, ma			; RV64-SLOW-NEXT: vsetivli zero, 2, e32, mf2, ta, ma
	Show All 25 Lines
	; RV64-SLOW-NEXT: lbu a4, 6(a0)			; RV64-SLOW-NEXT: lbu a4, 6(a0)
	; RV64-SLOW-NEXT: lb a0, 7(a0)			; RV64-SLOW-NEXT: lb a0, 7(a0)
	; RV64-SLOW-NEXT: slli a2, a2, 8			; RV64-SLOW-NEXT: slli a2, a2, 8
	; RV64-SLOW-NEXT: or a2, a2, a3			; RV64-SLOW-NEXT: or a2, a2, a3
	; RV64-SLOW-NEXT: slli a4, a4, 16			; RV64-SLOW-NEXT: slli a4, a4, 16
	; RV64-SLOW-NEXT: slli a0, a0, 24			; RV64-SLOW-NEXT: slli a0, a0, 24
	; RV64-SLOW-NEXT: or a0, a0, a4			; RV64-SLOW-NEXT: or a0, a0, a4
	; RV64-SLOW-NEXT: or a0, a0, a2			; RV64-SLOW-NEXT: or a0, a0, a2
				; RV64-SLOW-NEXT: vsetivli zero, 1, e8, mf8, ta, ma
				; RV64-SLOW-NEXT: vmv.v.i v0, 2
	; RV64-SLOW-NEXT: vsetivli zero, 2, e32, mf2, ta, ma			; RV64-SLOW-NEXT: vsetivli zero, 2, e32, mf2, ta, ma
	; RV64-SLOW-NEXT: vmv.s.x v9, a0			; RV64-SLOW-NEXT: vmerge.vxm v8, v8, a0, v0
	; RV64-SLOW-NEXT: vslideup.vi v8, v9, 1
	; RV64-SLOW-NEXT: .LBB8_4: # %else2			; RV64-SLOW-NEXT: .LBB8_4: # %else2
	; RV64-SLOW-NEXT: vsetivli zero, 2, e32, mf2, ta, ma			; RV64-SLOW-NEXT: vsetivli zero, 2, e32, mf2, ta, ma
	; RV64-SLOW-NEXT: vse32.v v8, (a1)			; RV64-SLOW-NEXT: vse32.v v8, (a1)
	; RV64-SLOW-NEXT: ret			; RV64-SLOW-NEXT: ret
	;			;
	; FAST-LABEL: masked_load_v2i32_align1:			; FAST-LABEL: masked_load_v2i32_align1:
	; FAST: # %bb.0:			; FAST: # %bb.0:
	; FAST-NEXT: vsetivli zero, 2, e32, mf2, ta, ma			; FAST-NEXT: vsetivli zero, 2, e32, mf2, ta, ma
	▲ Show 20 Lines • Show All 53 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/srem-seteq-illegal-types.ll

	Show First 20 Lines • Show All 662 Lines • ▼ Show 20 Lines
	; RV32MV-NEXT: vslidedown.vi v8, v8, 2			; RV32MV-NEXT: vslidedown.vi v8, v8, 2
	; RV32MV-NEXT: li a0, 85			; RV32MV-NEXT: li a0, 85
	; RV32MV-NEXT: vsetivli zero, 1, e8, mf8, ta, ma			; RV32MV-NEXT: vsetivli zero, 1, e8, mf8, ta, ma
	; RV32MV-NEXT: vmv.v.x v0, a0			; RV32MV-NEXT: vmv.v.x v0, a0
	; RV32MV-NEXT: vsetivli zero, 8, e32, m2, ta, ma			; RV32MV-NEXT: vsetivli zero, 8, e32, m2, ta, ma
	; RV32MV-NEXT: vmv.v.i v10, 1			; RV32MV-NEXT: vmv.v.i v10, 1
	; RV32MV-NEXT: vmerge.vim v10, v10, -1, v0			; RV32MV-NEXT: vmerge.vim v10, v10, -1, v0
	; RV32MV-NEXT: vand.vv v8, v8, v10			; RV32MV-NEXT: vand.vv v8, v8, v10
	; RV32MV-NEXT: li a0, 2			; RV32MV-NEXT: vmv.v.i v10, 0
	; RV32MV-NEXT: vmv.s.x v10, a0			; RV32MV-NEXT: vsetivli zero, 1, e8, mf8, ta, ma
	; RV32MV-NEXT: li a0, 1			; RV32MV-NEXT: vmv.v.i v0, 4
	; RV32MV-NEXT: vmv.s.x v12, a0			; RV32MV-NEXT: vsetivli zero, 8, e32, m2, ta, ma
	; RV32MV-NEXT: vmv.v.i v14, 0			; RV32MV-NEXT: vmerge.vim v10, v10, 1, v0
	; RV32MV-NEXT: vsetivli zero, 3, e32, m2, tu, ma			; RV32MV-NEXT: li a0, 16
	; RV32MV-NEXT: vslideup.vi v14, v12, 2			; RV32MV-NEXT: vsetivli zero, 1, e8, mf8, ta, ma
	; RV32MV-NEXT: vsetivli zero, 5, e32, m2, tu, ma			; RV32MV-NEXT: vmv.v.x v0, a0
	; RV32MV-NEXT: vslideup.vi v14, v10, 4			; RV32MV-NEXT: vsetivli zero, 8, e32, m2, ta, ma
				; RV32MV-NEXT: vmerge.vim v10, v10, 2, v0
	; RV32MV-NEXT: vsetivli zero, 4, e64, m2, ta, ma			; RV32MV-NEXT: vsetivli zero, 4, e64, m2, ta, ma
	; RV32MV-NEXT: vmsne.vv v0, v8, v14			; RV32MV-NEXT: vmsne.vv v0, v8, v10
	; RV32MV-NEXT: vmv.v.i v8, 0			; RV32MV-NEXT: vmv.v.i v8, 0
	; RV32MV-NEXT: vmerge.vim v8, v8, -1, v0			; RV32MV-NEXT: vmerge.vim v8, v8, -1, v0
	; RV32MV-NEXT: vsetivli zero, 1, e32, m2, ta, ma			; RV32MV-NEXT: vsetivli zero, 1, e32, m2, ta, ma
	; RV32MV-NEXT: vse32.v v8, (s0)			; RV32MV-NEXT: vse32.v v8, (s0)
	; RV32MV-NEXT: vslidedown.vi v10, v8, 1			; RV32MV-NEXT: vslidedown.vi v10, v8, 1
	; RV32MV-NEXT: vmv.x.s a0, v10			; RV32MV-NEXT: vmv.x.s a0, v10
	; RV32MV-NEXT: vslidedown.vi v10, v8, 2			; RV32MV-NEXT: vslidedown.vi v10, v8, 2
	; RV32MV-NEXT: vmv.x.s a1, v10			; RV32MV-NEXT: vmv.x.s a1, v10
	▲ Show 20 Lines • Show All 114 Lines • Show Last 20 Lines