This is an archive of the discontinued LLVM Phabricator instance.

[RISCV] Hoist VSETVLI out of some scalable loops
ClosedPublic

Authored by reames on May 24 2022, 3:42 PM.

Download Raw Diff

Details

Reviewers

craig.topper
frasercrmck
kito-cheng

Commits

rG2a3b6f2cba92: [RISCV] Hoist VSETVLI vlmax, vtype out of scalable loops

Summary

This is a straight forward extension of the PRE transform introduced in D124869 to handle the VLMAX case.

The test changes here look quite positive. This surprised me until I realized that all the tests are using @llvm.vscale to figure out the VLMAX, not the llvm.riscv.vsetvlmax intrinsic. If they'd used the later, these would have been full redundancy cases and fully handled by the data flow. I'm not really sure if use of vscale here is representative or not. If it is, we should probably look at using VSETVLI to lower vscale rather than a raw read of vlenb and some math.

Diff Detail

Repository: rG LLVM Github Monorepo

Event Timeline

reames created this revision.May 24 2022, 3:42 PM

Herald added a project: Restricted Project. · View Herald TranscriptMay 24 2022, 3:42 PM

Herald added subscribers: sunshaoce, VincentWu, luke957 and 30 others. · View Herald Transcript

reames requested review of this revision.May 24 2022, 3:42 PM

Herald added a project: Restricted Project. · View Herald TranscriptMay 24 2022, 3:42 PM

Herald added subscribers: alextsao1999, • pcwang-thead, eopXD, MaskRay. · View Herald Transcript

The use of vscale came from the scalable vector autovectorizer. llvm.vscale is VLEN/RISCV::RVVBitsPerBlock. Which I guess is the right VLMAX for SEW=RISCV::RVVBitsPerBlock where RISCV::RVVBitPerBlock is 64.

Harbormaster completed remote builds in B166155: Diff 431817.May 24 2022, 5:36 PM

LGTM

This revision is now accepted and ready to land.May 24 2022, 7:09 PM

This revision was landed with ongoing or failed builds.May 25 2022, 8:10 AM

Closed by commit rG2a3b6f2cba92: [RISCV] Hoist VSETVLI vlmax, vtype out of scalable loops (authored by reames). · Explain Why

This revision was automatically updated to reflect the committed changes.

reames added a commit: rG2a3b6f2cba92: [RISCV] Hoist VSETVLI vlmax, vtype out of scalable loops.

Revision Contents

Path

Size

llvm/

lib/

Target/

RISCV/

RISCVInsertVSETVLI.cpp

7 lines

test/

CodeGen/

RISCV/

rvv/

sink-splat-operands.ll

240 lines

Diff 432003

llvm/lib/Target/RISCV/RISCVInsertVSETVLI.cpp

Show First 20 Lines • Show All 1,282 Lines • ▼ Show 20 Lines	if (MI.isCall() \|\| MI.isInlineAsm() \|\| MI.modifiesRegister(RISCV::VL) \|\|
MI.modifiesRegister(RISCV::VTYPE))		MI.modifiesRegister(RISCV::VTYPE))
CurInfo = VSETVLIInfo::getUnknown();		CurInfo = VSETVLIInfo::getUnknown();
}		}
}		}

/// Return true if the VL value configured must be equal to the requested one.		/// Return true if the VL value configured must be equal to the requested one.
static bool hasFixedResult(const VSETVLIInfo &Info, const RISCVSubtarget &ST) {		static bool hasFixedResult(const VSETVLIInfo &Info, const RISCVSubtarget &ST) {
if (!Info.hasAVLImm())		if (!Info.hasAVLImm())
// TODO: Could allow VLMAX (e.g. X0), and possibly other registers		// VLMAX is always the same value.
// by looking at the associated vreg def placement.		// TODO: Could extend to other registers by looking at the associated
return false;		// vreg def placement.
		return RISCV::X0 == Info.getAVLReg();

if (RISCVII::LMUL_1 != Info.getVLMUL())		if (RISCVII::LMUL_1 != Info.getVLMUL())
// TODO: Generalize the code below to account for LMUL		// TODO: Generalize the code below to account for LMUL
return false;		return false;

unsigned AVL = Info.getAVLImm();		unsigned AVL = Info.getAVLImm();
unsigned SEW = Info.getSEW();		unsigned SEW = Info.getSEW();
unsigned AVLInBits = AVL * SEW;		unsigned AVLInBits = AVL * SEW;
▲ Show 20 Lines • Show All 167 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/sink-splat-operands.ll

Show First 20 Lines • Show All 251 Lines • ▼ Show 20 Lines

for.cond.cleanup: ; preds = %vector.body		for.cond.cleanup: ; preds = %vector.body
ret void		ret void
}		}

define void @sink_splat_mul_scalable(i32* nocapture %a, i32 signext %x) {		define void @sink_splat_mul_scalable(i32* nocapture %a, i32 signext %x) {
; CHECK-LABEL: sink_splat_mul_scalable:		; CHECK-LABEL: sink_splat_mul_scalable:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: csrr a6, vlenb		; CHECK-NEXT: csrr a5, vlenb
; CHECK-NEXT: srli a2, a6, 1		; CHECK-NEXT: srli a2, a5, 1
; CHECK-NEXT: li a3, 1024		; CHECK-NEXT: li a3, 1024
; CHECK-NEXT: bgeu a3, a2, .LBB7_2		; CHECK-NEXT: bgeu a3, a2, .LBB7_2
; CHECK-NEXT: # %bb.1:		; CHECK-NEXT: # %bb.1:
; CHECK-NEXT: li a3, 0		; CHECK-NEXT: li a3, 0
; CHECK-NEXT: j .LBB7_5		; CHECK-NEXT: j .LBB7_5
; CHECK-NEXT: .LBB7_2: # %vector.ph		; CHECK-NEXT: .LBB7_2: # %vector.ph
; CHECK-NEXT: li a5, 0		; CHECK-NEXT: li a6, 0
; CHECK-NEXT: remu a4, a3, a2		; CHECK-NEXT: remu a4, a3, a2
; CHECK-NEXT: sub a3, a3, a4		; CHECK-NEXT: sub a3, a3, a4
; CHECK-NEXT: slli a6, a6, 1		; CHECK-NEXT: slli a5, a5, 1
		; CHECK-NEXT: vsetvli a7, zero, e32, m2, ta, mu
; CHECK-NEXT: mv a7, a0		; CHECK-NEXT: mv a7, a0
; CHECK-NEXT: .LBB7_3: # %vector.body		; CHECK-NEXT: .LBB7_3: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vl2re32.v v8, (a7)		; CHECK-NEXT: vl2re32.v v8, (a7)
; CHECK-NEXT: vsetvli t0, zero, e32, m2, ta, mu
; CHECK-NEXT: vmul.vx v8, v8, a1		; CHECK-NEXT: vmul.vx v8, v8, a1
; CHECK-NEXT: vs2r.v v8, (a7)		; CHECK-NEXT: vs2r.v v8, (a7)
; CHECK-NEXT: add a5, a5, a2		; CHECK-NEXT: add a6, a6, a2
; CHECK-NEXT: add a7, a7, a6		; CHECK-NEXT: add a7, a7, a5
; CHECK-NEXT: bne a5, a3, .LBB7_3		; CHECK-NEXT: bne a6, a3, .LBB7_3
; CHECK-NEXT: # %bb.4: # %middle.block		; CHECK-NEXT: # %bb.4: # %middle.block
; CHECK-NEXT: beqz a4, .LBB7_7		; CHECK-NEXT: beqz a4, .LBB7_7
; CHECK-NEXT: .LBB7_5: # %for.body.preheader		; CHECK-NEXT: .LBB7_5: # %for.body.preheader
; CHECK-NEXT: addi a2, a3, -1024		; CHECK-NEXT: addi a2, a3, -1024
; CHECK-NEXT: slli a3, a3, 2		; CHECK-NEXT: slli a3, a3, 2
; CHECK-NEXT: add a0, a0, a3		; CHECK-NEXT: add a0, a0, a3
; CHECK-NEXT: .LBB7_6: # %for.body		; CHECK-NEXT: .LBB7_6: # %for.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
▲ Show 20 Lines • Show All 54 Lines • ▼ Show 20 Lines	for.body: ; preds = %for.body.preheader, %for.body
%indvars.iv.next = add nuw nsw i64 %indvars.iv, 1		%indvars.iv.next = add nuw nsw i64 %indvars.iv, 1
%cmp.not = icmp eq i64 %indvars.iv.next, 1024		%cmp.not = icmp eq i64 %indvars.iv.next, 1024
br i1 %cmp.not, label %for.cond.cleanup, label %for.body		br i1 %cmp.not, label %for.cond.cleanup, label %for.body
}		}

define void @sink_splat_add_scalable(i32* nocapture %a, i32 signext %x) {		define void @sink_splat_add_scalable(i32* nocapture %a, i32 signext %x) {
; CHECK-LABEL: sink_splat_add_scalable:		; CHECK-LABEL: sink_splat_add_scalable:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: csrr a6, vlenb		; CHECK-NEXT: csrr a5, vlenb
; CHECK-NEXT: srli a2, a6, 1		; CHECK-NEXT: srli a2, a5, 1
; CHECK-NEXT: li a3, 1024		; CHECK-NEXT: li a3, 1024
; CHECK-NEXT: bgeu a3, a2, .LBB8_2		; CHECK-NEXT: bgeu a3, a2, .LBB8_2
; CHECK-NEXT: # %bb.1:		; CHECK-NEXT: # %bb.1:
; CHECK-NEXT: li a3, 0		; CHECK-NEXT: li a3, 0
; CHECK-NEXT: j .LBB8_5		; CHECK-NEXT: j .LBB8_5
; CHECK-NEXT: .LBB8_2: # %vector.ph		; CHECK-NEXT: .LBB8_2: # %vector.ph
; CHECK-NEXT: li a5, 0		; CHECK-NEXT: li a6, 0
; CHECK-NEXT: remu a4, a3, a2		; CHECK-NEXT: remu a4, a3, a2
; CHECK-NEXT: sub a3, a3, a4		; CHECK-NEXT: sub a3, a3, a4
; CHECK-NEXT: slli a6, a6, 1		; CHECK-NEXT: slli a5, a5, 1
		; CHECK-NEXT: vsetvli a7, zero, e32, m2, ta, mu
; CHECK-NEXT: mv a7, a0		; CHECK-NEXT: mv a7, a0
; CHECK-NEXT: .LBB8_3: # %vector.body		; CHECK-NEXT: .LBB8_3: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vl2re32.v v8, (a7)		; CHECK-NEXT: vl2re32.v v8, (a7)
; CHECK-NEXT: vsetvli t0, zero, e32, m2, ta, mu
; CHECK-NEXT: vadd.vx v8, v8, a1		; CHECK-NEXT: vadd.vx v8, v8, a1
; CHECK-NEXT: vs2r.v v8, (a7)		; CHECK-NEXT: vs2r.v v8, (a7)
; CHECK-NEXT: add a5, a5, a2		; CHECK-NEXT: add a6, a6, a2
; CHECK-NEXT: add a7, a7, a6		; CHECK-NEXT: add a7, a7, a5
; CHECK-NEXT: bne a5, a3, .LBB8_3		; CHECK-NEXT: bne a6, a3, .LBB8_3
; CHECK-NEXT: # %bb.4: # %middle.block		; CHECK-NEXT: # %bb.4: # %middle.block
; CHECK-NEXT: beqz a4, .LBB8_7		; CHECK-NEXT: beqz a4, .LBB8_7
; CHECK-NEXT: .LBB8_5: # %for.body.preheader		; CHECK-NEXT: .LBB8_5: # %for.body.preheader
; CHECK-NEXT: addi a2, a3, -1024		; CHECK-NEXT: addi a2, a3, -1024
; CHECK-NEXT: slli a3, a3, 2		; CHECK-NEXT: slli a3, a3, 2
; CHECK-NEXT: add a0, a0, a3		; CHECK-NEXT: add a0, a0, a3
; CHECK-NEXT: .LBB8_6: # %for.body		; CHECK-NEXT: .LBB8_6: # %for.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
▲ Show 20 Lines • Show All 54 Lines • ▼ Show 20 Lines	for.body: ; preds = %for.body.preheader, %for.body
%indvars.iv.next = add nuw nsw i64 %indvars.iv, 1		%indvars.iv.next = add nuw nsw i64 %indvars.iv, 1
%cmp.not = icmp eq i64 %indvars.iv.next, 1024		%cmp.not = icmp eq i64 %indvars.iv.next, 1024
br i1 %cmp.not, label %for.cond.cleanup, label %for.body		br i1 %cmp.not, label %for.cond.cleanup, label %for.body
}		}

define void @sink_splat_sub_scalable(i32* nocapture %a, i32 signext %x) {		define void @sink_splat_sub_scalable(i32* nocapture %a, i32 signext %x) {
; CHECK-LABEL: sink_splat_sub_scalable:		; CHECK-LABEL: sink_splat_sub_scalable:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: csrr a6, vlenb		; CHECK-NEXT: csrr a5, vlenb
; CHECK-NEXT: srli a2, a6, 1		; CHECK-NEXT: srli a2, a5, 1
; CHECK-NEXT: li a3, 1024		; CHECK-NEXT: li a3, 1024
; CHECK-NEXT: bgeu a3, a2, .LBB9_2		; CHECK-NEXT: bgeu a3, a2, .LBB9_2
; CHECK-NEXT: # %bb.1:		; CHECK-NEXT: # %bb.1:
; CHECK-NEXT: li a3, 0		; CHECK-NEXT: li a3, 0
; CHECK-NEXT: j .LBB9_5		; CHECK-NEXT: j .LBB9_5
; CHECK-NEXT: .LBB9_2: # %vector.ph		; CHECK-NEXT: .LBB9_2: # %vector.ph
; CHECK-NEXT: li a5, 0		; CHECK-NEXT: li a6, 0
; CHECK-NEXT: remu a4, a3, a2		; CHECK-NEXT: remu a4, a3, a2
; CHECK-NEXT: sub a3, a3, a4		; CHECK-NEXT: sub a3, a3, a4
; CHECK-NEXT: slli a6, a6, 1		; CHECK-NEXT: slli a5, a5, 1
		; CHECK-NEXT: vsetvli a7, zero, e32, m2, ta, mu
; CHECK-NEXT: mv a7, a0		; CHECK-NEXT: mv a7, a0
; CHECK-NEXT: .LBB9_3: # %vector.body		; CHECK-NEXT: .LBB9_3: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vl2re32.v v8, (a7)		; CHECK-NEXT: vl2re32.v v8, (a7)
; CHECK-NEXT: vsetvli t0, zero, e32, m2, ta, mu
; CHECK-NEXT: vsub.vx v8, v8, a1		; CHECK-NEXT: vsub.vx v8, v8, a1
; CHECK-NEXT: vs2r.v v8, (a7)		; CHECK-NEXT: vs2r.v v8, (a7)
; CHECK-NEXT: add a5, a5, a2		; CHECK-NEXT: add a6, a6, a2
; CHECK-NEXT: add a7, a7, a6		; CHECK-NEXT: add a7, a7, a5
; CHECK-NEXT: bne a5, a3, .LBB9_3		; CHECK-NEXT: bne a6, a3, .LBB9_3
; CHECK-NEXT: # %bb.4: # %middle.block		; CHECK-NEXT: # %bb.4: # %middle.block
; CHECK-NEXT: beqz a4, .LBB9_7		; CHECK-NEXT: beqz a4, .LBB9_7
; CHECK-NEXT: .LBB9_5: # %for.body.preheader		; CHECK-NEXT: .LBB9_5: # %for.body.preheader
; CHECK-NEXT: addi a2, a3, -1024		; CHECK-NEXT: addi a2, a3, -1024
; CHECK-NEXT: slli a3, a3, 2		; CHECK-NEXT: slli a3, a3, 2
; CHECK-NEXT: add a0, a0, a3		; CHECK-NEXT: add a0, a0, a3
; CHECK-NEXT: .LBB9_6: # %for.body		; CHECK-NEXT: .LBB9_6: # %for.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
▲ Show 20 Lines • Show All 54 Lines • ▼ Show 20 Lines	for.body: ; preds = %for.body.preheader, %for.body
%indvars.iv.next = add nuw nsw i64 %indvars.iv, 1		%indvars.iv.next = add nuw nsw i64 %indvars.iv, 1
%cmp.not = icmp eq i64 %indvars.iv.next, 1024		%cmp.not = icmp eq i64 %indvars.iv.next, 1024
br i1 %cmp.not, label %for.cond.cleanup, label %for.body		br i1 %cmp.not, label %for.cond.cleanup, label %for.body
}		}

define void @sink_splat_rsub_scalable(i32* nocapture %a, i32 signext %x) {		define void @sink_splat_rsub_scalable(i32* nocapture %a, i32 signext %x) {
; CHECK-LABEL: sink_splat_rsub_scalable:		; CHECK-LABEL: sink_splat_rsub_scalable:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: csrr a6, vlenb		; CHECK-NEXT: csrr a5, vlenb
; CHECK-NEXT: srli a2, a6, 1		; CHECK-NEXT: srli a2, a5, 1
; CHECK-NEXT: li a3, 1024		; CHECK-NEXT: li a3, 1024
; CHECK-NEXT: bgeu a3, a2, .LBB10_2		; CHECK-NEXT: bgeu a3, a2, .LBB10_2
; CHECK-NEXT: # %bb.1:		; CHECK-NEXT: # %bb.1:
; CHECK-NEXT: li a3, 0		; CHECK-NEXT: li a3, 0
; CHECK-NEXT: j .LBB10_5		; CHECK-NEXT: j .LBB10_5
; CHECK-NEXT: .LBB10_2: # %vector.ph		; CHECK-NEXT: .LBB10_2: # %vector.ph
; CHECK-NEXT: li a5, 0		; CHECK-NEXT: li a6, 0
; CHECK-NEXT: remu a4, a3, a2		; CHECK-NEXT: remu a4, a3, a2
; CHECK-NEXT: sub a3, a3, a4		; CHECK-NEXT: sub a3, a3, a4
; CHECK-NEXT: slli a6, a6, 1		; CHECK-NEXT: slli a5, a5, 1
		; CHECK-NEXT: vsetvli a7, zero, e32, m2, ta, mu
; CHECK-NEXT: mv a7, a0		; CHECK-NEXT: mv a7, a0
; CHECK-NEXT: .LBB10_3: # %vector.body		; CHECK-NEXT: .LBB10_3: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vl2re32.v v8, (a7)		; CHECK-NEXT: vl2re32.v v8, (a7)
; CHECK-NEXT: vsetvli t0, zero, e32, m2, ta, mu
; CHECK-NEXT: vrsub.vx v8, v8, a1		; CHECK-NEXT: vrsub.vx v8, v8, a1
; CHECK-NEXT: vs2r.v v8, (a7)		; CHECK-NEXT: vs2r.v v8, (a7)
; CHECK-NEXT: add a5, a5, a2		; CHECK-NEXT: add a6, a6, a2
; CHECK-NEXT: add a7, a7, a6		; CHECK-NEXT: add a7, a7, a5
; CHECK-NEXT: bne a5, a3, .LBB10_3		; CHECK-NEXT: bne a6, a3, .LBB10_3
; CHECK-NEXT: # %bb.4: # %middle.block		; CHECK-NEXT: # %bb.4: # %middle.block
; CHECK-NEXT: beqz a4, .LBB10_7		; CHECK-NEXT: beqz a4, .LBB10_7
; CHECK-NEXT: .LBB10_5: # %for.body.preheader		; CHECK-NEXT: .LBB10_5: # %for.body.preheader
; CHECK-NEXT: addi a2, a3, -1024		; CHECK-NEXT: addi a2, a3, -1024
; CHECK-NEXT: slli a3, a3, 2		; CHECK-NEXT: slli a3, a3, 2
; CHECK-NEXT: add a0, a0, a3		; CHECK-NEXT: add a0, a0, a3
; CHECK-NEXT: .LBB10_6: # %for.body		; CHECK-NEXT: .LBB10_6: # %for.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
▲ Show 20 Lines • Show All 54 Lines • ▼ Show 20 Lines	for.body: ; preds = %for.body.preheader, %for.body
%indvars.iv.next = add nuw nsw i64 %indvars.iv, 1		%indvars.iv.next = add nuw nsw i64 %indvars.iv, 1
%cmp.not = icmp eq i64 %indvars.iv.next, 1024		%cmp.not = icmp eq i64 %indvars.iv.next, 1024
br i1 %cmp.not, label %for.cond.cleanup, label %for.body		br i1 %cmp.not, label %for.cond.cleanup, label %for.body
}		}

define void @sink_splat_and_scalable(i32* nocapture %a, i32 signext %x) {		define void @sink_splat_and_scalable(i32* nocapture %a, i32 signext %x) {
; CHECK-LABEL: sink_splat_and_scalable:		; CHECK-LABEL: sink_splat_and_scalable:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: csrr a6, vlenb		; CHECK-NEXT: csrr a5, vlenb
; CHECK-NEXT: srli a2, a6, 1		; CHECK-NEXT: srli a2, a5, 1
; CHECK-NEXT: li a3, 1024		; CHECK-NEXT: li a3, 1024
; CHECK-NEXT: bgeu a3, a2, .LBB11_2		; CHECK-NEXT: bgeu a3, a2, .LBB11_2
; CHECK-NEXT: # %bb.1:		; CHECK-NEXT: # %bb.1:
; CHECK-NEXT: li a3, 0		; CHECK-NEXT: li a3, 0
; CHECK-NEXT: j .LBB11_5		; CHECK-NEXT: j .LBB11_5
; CHECK-NEXT: .LBB11_2: # %vector.ph		; CHECK-NEXT: .LBB11_2: # %vector.ph
; CHECK-NEXT: li a5, 0		; CHECK-NEXT: li a6, 0
; CHECK-NEXT: remu a4, a3, a2		; CHECK-NEXT: remu a4, a3, a2
; CHECK-NEXT: sub a3, a3, a4		; CHECK-NEXT: sub a3, a3, a4
; CHECK-NEXT: slli a6, a6, 1		; CHECK-NEXT: slli a5, a5, 1
		; CHECK-NEXT: vsetvli a7, zero, e32, m2, ta, mu
; CHECK-NEXT: mv a7, a0		; CHECK-NEXT: mv a7, a0
; CHECK-NEXT: .LBB11_3: # %vector.body		; CHECK-NEXT: .LBB11_3: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vl2re32.v v8, (a7)		; CHECK-NEXT: vl2re32.v v8, (a7)
; CHECK-NEXT: vsetvli t0, zero, e32, m2, ta, mu
; CHECK-NEXT: vand.vx v8, v8, a1		; CHECK-NEXT: vand.vx v8, v8, a1
; CHECK-NEXT: vs2r.v v8, (a7)		; CHECK-NEXT: vs2r.v v8, (a7)
; CHECK-NEXT: add a5, a5, a2		; CHECK-NEXT: add a6, a6, a2
; CHECK-NEXT: add a7, a7, a6		; CHECK-NEXT: add a7, a7, a5
; CHECK-NEXT: bne a5, a3, .LBB11_3		; CHECK-NEXT: bne a6, a3, .LBB11_3
; CHECK-NEXT: # %bb.4: # %middle.block		; CHECK-NEXT: # %bb.4: # %middle.block
; CHECK-NEXT: beqz a4, .LBB11_7		; CHECK-NEXT: beqz a4, .LBB11_7
; CHECK-NEXT: .LBB11_5: # %for.body.preheader		; CHECK-NEXT: .LBB11_5: # %for.body.preheader
; CHECK-NEXT: addi a2, a3, -1024		; CHECK-NEXT: addi a2, a3, -1024
; CHECK-NEXT: slli a3, a3, 2		; CHECK-NEXT: slli a3, a3, 2
; CHECK-NEXT: add a0, a0, a3		; CHECK-NEXT: add a0, a0, a3
; CHECK-NEXT: .LBB11_6: # %for.body		; CHECK-NEXT: .LBB11_6: # %for.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
▲ Show 20 Lines • Show All 54 Lines • ▼ Show 20 Lines	for.body: ; preds = %for.body.preheader, %for.body
%indvars.iv.next = add nuw nsw i64 %indvars.iv, 1		%indvars.iv.next = add nuw nsw i64 %indvars.iv, 1
%cmp.not = icmp eq i64 %indvars.iv.next, 1024		%cmp.not = icmp eq i64 %indvars.iv.next, 1024
br i1 %cmp.not, label %for.cond.cleanup, label %for.body		br i1 %cmp.not, label %for.cond.cleanup, label %for.body
}		}

define void @sink_splat_or_scalable(i32* nocapture %a, i32 signext %x) {		define void @sink_splat_or_scalable(i32* nocapture %a, i32 signext %x) {
; CHECK-LABEL: sink_splat_or_scalable:		; CHECK-LABEL: sink_splat_or_scalable:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: csrr a6, vlenb		; CHECK-NEXT: csrr a5, vlenb
; CHECK-NEXT: srli a2, a6, 1		; CHECK-NEXT: srli a2, a5, 1
; CHECK-NEXT: li a3, 1024		; CHECK-NEXT: li a3, 1024
; CHECK-NEXT: bgeu a3, a2, .LBB12_2		; CHECK-NEXT: bgeu a3, a2, .LBB12_2
; CHECK-NEXT: # %bb.1:		; CHECK-NEXT: # %bb.1:
; CHECK-NEXT: li a3, 0		; CHECK-NEXT: li a3, 0
; CHECK-NEXT: j .LBB12_5		; CHECK-NEXT: j .LBB12_5
; CHECK-NEXT: .LBB12_2: # %vector.ph		; CHECK-NEXT: .LBB12_2: # %vector.ph
; CHECK-NEXT: li a5, 0		; CHECK-NEXT: li a6, 0
; CHECK-NEXT: remu a4, a3, a2		; CHECK-NEXT: remu a4, a3, a2
; CHECK-NEXT: sub a3, a3, a4		; CHECK-NEXT: sub a3, a3, a4
; CHECK-NEXT: slli a6, a6, 1		; CHECK-NEXT: slli a5, a5, 1
		; CHECK-NEXT: vsetvli a7, zero, e32, m2, ta, mu
; CHECK-NEXT: mv a7, a0		; CHECK-NEXT: mv a7, a0
; CHECK-NEXT: .LBB12_3: # %vector.body		; CHECK-NEXT: .LBB12_3: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vl2re32.v v8, (a7)		; CHECK-NEXT: vl2re32.v v8, (a7)
; CHECK-NEXT: vsetvli t0, zero, e32, m2, ta, mu
; CHECK-NEXT: vor.vx v8, v8, a1		; CHECK-NEXT: vor.vx v8, v8, a1
; CHECK-NEXT: vs2r.v v8, (a7)		; CHECK-NEXT: vs2r.v v8, (a7)
; CHECK-NEXT: add a5, a5, a2		; CHECK-NEXT: add a6, a6, a2
; CHECK-NEXT: add a7, a7, a6		; CHECK-NEXT: add a7, a7, a5
; CHECK-NEXT: bne a5, a3, .LBB12_3		; CHECK-NEXT: bne a6, a3, .LBB12_3
; CHECK-NEXT: # %bb.4: # %middle.block		; CHECK-NEXT: # %bb.4: # %middle.block
; CHECK-NEXT: beqz a4, .LBB12_7		; CHECK-NEXT: beqz a4, .LBB12_7
; CHECK-NEXT: .LBB12_5: # %for.body.preheader		; CHECK-NEXT: .LBB12_5: # %for.body.preheader
; CHECK-NEXT: addi a2, a3, -1024		; CHECK-NEXT: addi a2, a3, -1024
; CHECK-NEXT: slli a3, a3, 2		; CHECK-NEXT: slli a3, a3, 2
; CHECK-NEXT: add a0, a0, a3		; CHECK-NEXT: add a0, a0, a3
; CHECK-NEXT: .LBB12_6: # %for.body		; CHECK-NEXT: .LBB12_6: # %for.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
▲ Show 20 Lines • Show All 54 Lines • ▼ Show 20 Lines	for.body: ; preds = %for.body.preheader, %for.body
%indvars.iv.next = add nuw nsw i64 %indvars.iv, 1		%indvars.iv.next = add nuw nsw i64 %indvars.iv, 1
%cmp.not = icmp eq i64 %indvars.iv.next, 1024		%cmp.not = icmp eq i64 %indvars.iv.next, 1024
br i1 %cmp.not, label %for.cond.cleanup, label %for.body		br i1 %cmp.not, label %for.cond.cleanup, label %for.body
}		}

define void @sink_splat_xor_scalable(i32* nocapture %a, i32 signext %x) {		define void @sink_splat_xor_scalable(i32* nocapture %a, i32 signext %x) {
; CHECK-LABEL: sink_splat_xor_scalable:		; CHECK-LABEL: sink_splat_xor_scalable:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: csrr a6, vlenb		; CHECK-NEXT: csrr a5, vlenb
; CHECK-NEXT: srli a2, a6, 1		; CHECK-NEXT: srli a2, a5, 1
; CHECK-NEXT: li a3, 1024		; CHECK-NEXT: li a3, 1024
; CHECK-NEXT: bgeu a3, a2, .LBB13_2		; CHECK-NEXT: bgeu a3, a2, .LBB13_2
; CHECK-NEXT: # %bb.1:		; CHECK-NEXT: # %bb.1:
; CHECK-NEXT: li a3, 0		; CHECK-NEXT: li a3, 0
; CHECK-NEXT: j .LBB13_5		; CHECK-NEXT: j .LBB13_5
; CHECK-NEXT: .LBB13_2: # %vector.ph		; CHECK-NEXT: .LBB13_2: # %vector.ph
; CHECK-NEXT: li a5, 0		; CHECK-NEXT: li a6, 0
; CHECK-NEXT: remu a4, a3, a2		; CHECK-NEXT: remu a4, a3, a2
; CHECK-NEXT: sub a3, a3, a4		; CHECK-NEXT: sub a3, a3, a4
; CHECK-NEXT: slli a6, a6, 1		; CHECK-NEXT: slli a5, a5, 1
		; CHECK-NEXT: vsetvli a7, zero, e32, m2, ta, mu
; CHECK-NEXT: mv a7, a0		; CHECK-NEXT: mv a7, a0
; CHECK-NEXT: .LBB13_3: # %vector.body		; CHECK-NEXT: .LBB13_3: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vl2re32.v v8, (a7)		; CHECK-NEXT: vl2re32.v v8, (a7)
; CHECK-NEXT: vsetvli t0, zero, e32, m2, ta, mu
; CHECK-NEXT: vxor.vx v8, v8, a1		; CHECK-NEXT: vxor.vx v8, v8, a1
; CHECK-NEXT: vs2r.v v8, (a7)		; CHECK-NEXT: vs2r.v v8, (a7)
; CHECK-NEXT: add a5, a5, a2		; CHECK-NEXT: add a6, a6, a2
; CHECK-NEXT: add a7, a7, a6		; CHECK-NEXT: add a7, a7, a5
; CHECK-NEXT: bne a5, a3, .LBB13_3		; CHECK-NEXT: bne a6, a3, .LBB13_3
; CHECK-NEXT: # %bb.4: # %middle.block		; CHECK-NEXT: # %bb.4: # %middle.block
; CHECK-NEXT: beqz a4, .LBB13_7		; CHECK-NEXT: beqz a4, .LBB13_7
; CHECK-NEXT: .LBB13_5: # %for.body.preheader		; CHECK-NEXT: .LBB13_5: # %for.body.preheader
; CHECK-NEXT: addi a2, a3, -1024		; CHECK-NEXT: addi a2, a3, -1024
; CHECK-NEXT: slli a3, a3, 2		; CHECK-NEXT: slli a3, a3, 2
; CHECK-NEXT: add a0, a0, a3		; CHECK-NEXT: add a0, a0, a3
; CHECK-NEXT: .LBB13_6: # %for.body		; CHECK-NEXT: .LBB13_6: # %for.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
▲ Show 20 Lines • Show All 162 Lines • ▼ Show 20 Lines

for.cond.cleanup: ; preds = %vector.body		for.cond.cleanup: ; preds = %vector.body
ret void		ret void
}		}

define void @sink_splat_shl_scalable(i32* nocapture %a, i32 signext %x) {		define void @sink_splat_shl_scalable(i32* nocapture %a, i32 signext %x) {
; CHECK-LABEL: sink_splat_shl_scalable:		; CHECK-LABEL: sink_splat_shl_scalable:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: csrr a6, vlenb		; CHECK-NEXT: csrr a5, vlenb
; CHECK-NEXT: srli a2, a6, 1		; CHECK-NEXT: srli a2, a5, 1
; CHECK-NEXT: li a3, 1024		; CHECK-NEXT: li a3, 1024
; CHECK-NEXT: bgeu a3, a2, .LBB17_2		; CHECK-NEXT: bgeu a3, a2, .LBB17_2
; CHECK-NEXT: # %bb.1:		; CHECK-NEXT: # %bb.1:
; CHECK-NEXT: li a3, 0		; CHECK-NEXT: li a3, 0
; CHECK-NEXT: j .LBB17_5		; CHECK-NEXT: j .LBB17_5
; CHECK-NEXT: .LBB17_2: # %vector.ph		; CHECK-NEXT: .LBB17_2: # %vector.ph
; CHECK-NEXT: li a5, 0		; CHECK-NEXT: li a6, 0
; CHECK-NEXT: remu a4, a3, a2		; CHECK-NEXT: remu a4, a3, a2
; CHECK-NEXT: sub a3, a3, a4		; CHECK-NEXT: sub a3, a3, a4
; CHECK-NEXT: slli a6, a6, 1		; CHECK-NEXT: slli a5, a5, 1
		; CHECK-NEXT: vsetvli a7, zero, e32, m2, ta, mu
; CHECK-NEXT: mv a7, a0		; CHECK-NEXT: mv a7, a0
; CHECK-NEXT: .LBB17_3: # %vector.body		; CHECK-NEXT: .LBB17_3: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vl2re32.v v8, (a7)		; CHECK-NEXT: vl2re32.v v8, (a7)
; CHECK-NEXT: vsetvli t0, zero, e32, m2, ta, mu
; CHECK-NEXT: vsll.vx v8, v8, a1		; CHECK-NEXT: vsll.vx v8, v8, a1
; CHECK-NEXT: vs2r.v v8, (a7)		; CHECK-NEXT: vs2r.v v8, (a7)
; CHECK-NEXT: add a5, a5, a2		; CHECK-NEXT: add a6, a6, a2
; CHECK-NEXT: add a7, a7, a6		; CHECK-NEXT: add a7, a7, a5
; CHECK-NEXT: bne a5, a3, .LBB17_3		; CHECK-NEXT: bne a6, a3, .LBB17_3
; CHECK-NEXT: # %bb.4: # %middle.block		; CHECK-NEXT: # %bb.4: # %middle.block
; CHECK-NEXT: beqz a4, .LBB17_7		; CHECK-NEXT: beqz a4, .LBB17_7
; CHECK-NEXT: .LBB17_5: # %for.body.preheader		; CHECK-NEXT: .LBB17_5: # %for.body.preheader
; CHECK-NEXT: addi a2, a3, -1024		; CHECK-NEXT: addi a2, a3, -1024
; CHECK-NEXT: slli a3, a3, 2		; CHECK-NEXT: slli a3, a3, 2
; CHECK-NEXT: add a0, a0, a3		; CHECK-NEXT: add a0, a0, a3
; CHECK-NEXT: .LBB17_6: # %for.body		; CHECK-NEXT: .LBB17_6: # %for.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
▲ Show 20 Lines • Show All 54 Lines • ▼ Show 20 Lines	for.body: ; preds = %for.body.preheader, %for.body
%indvars.iv.next = add nuw nsw i64 %indvars.iv, 1		%indvars.iv.next = add nuw nsw i64 %indvars.iv, 1
%cmp.not = icmp eq i64 %indvars.iv.next, 1024		%cmp.not = icmp eq i64 %indvars.iv.next, 1024
br i1 %cmp.not, label %for.cond.cleanup, label %for.body		br i1 %cmp.not, label %for.cond.cleanup, label %for.body
}		}

define void @sink_splat_lshr_scalable(i32* nocapture %a, i32 signext %x) {		define void @sink_splat_lshr_scalable(i32* nocapture %a, i32 signext %x) {
; CHECK-LABEL: sink_splat_lshr_scalable:		; CHECK-LABEL: sink_splat_lshr_scalable:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: csrr a6, vlenb		; CHECK-NEXT: csrr a5, vlenb
; CHECK-NEXT: srli a2, a6, 1		; CHECK-NEXT: srli a2, a5, 1
; CHECK-NEXT: li a3, 1024		; CHECK-NEXT: li a3, 1024
; CHECK-NEXT: bgeu a3, a2, .LBB18_2		; CHECK-NEXT: bgeu a3, a2, .LBB18_2
; CHECK-NEXT: # %bb.1:		; CHECK-NEXT: # %bb.1:
; CHECK-NEXT: li a3, 0		; CHECK-NEXT: li a3, 0
; CHECK-NEXT: j .LBB18_5		; CHECK-NEXT: j .LBB18_5
; CHECK-NEXT: .LBB18_2: # %vector.ph		; CHECK-NEXT: .LBB18_2: # %vector.ph
; CHECK-NEXT: li a5, 0		; CHECK-NEXT: li a6, 0
; CHECK-NEXT: remu a4, a3, a2		; CHECK-NEXT: remu a4, a3, a2
; CHECK-NEXT: sub a3, a3, a4		; CHECK-NEXT: sub a3, a3, a4
; CHECK-NEXT: slli a6, a6, 1		; CHECK-NEXT: slli a5, a5, 1
		; CHECK-NEXT: vsetvli a7, zero, e32, m2, ta, mu
; CHECK-NEXT: mv a7, a0		; CHECK-NEXT: mv a7, a0
; CHECK-NEXT: .LBB18_3: # %vector.body		; CHECK-NEXT: .LBB18_3: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vl2re32.v v8, (a7)		; CHECK-NEXT: vl2re32.v v8, (a7)
; CHECK-NEXT: vsetvli t0, zero, e32, m2, ta, mu
; CHECK-NEXT: vsrl.vx v8, v8, a1		; CHECK-NEXT: vsrl.vx v8, v8, a1
; CHECK-NEXT: vs2r.v v8, (a7)		; CHECK-NEXT: vs2r.v v8, (a7)
; CHECK-NEXT: add a5, a5, a2		; CHECK-NEXT: add a6, a6, a2
; CHECK-NEXT: add a7, a7, a6		; CHECK-NEXT: add a7, a7, a5
; CHECK-NEXT: bne a5, a3, .LBB18_3		; CHECK-NEXT: bne a6, a3, .LBB18_3
; CHECK-NEXT: # %bb.4: # %middle.block		; CHECK-NEXT: # %bb.4: # %middle.block
; CHECK-NEXT: beqz a4, .LBB18_7		; CHECK-NEXT: beqz a4, .LBB18_7
; CHECK-NEXT: .LBB18_5: # %for.body.preheader		; CHECK-NEXT: .LBB18_5: # %for.body.preheader
; CHECK-NEXT: addi a2, a3, -1024		; CHECK-NEXT: addi a2, a3, -1024
; CHECK-NEXT: slli a3, a3, 2		; CHECK-NEXT: slli a3, a3, 2
; CHECK-NEXT: add a0, a0, a3		; CHECK-NEXT: add a0, a0, a3
; CHECK-NEXT: .LBB18_6: # %for.body		; CHECK-NEXT: .LBB18_6: # %for.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
▲ Show 20 Lines • Show All 54 Lines • ▼ Show 20 Lines	for.body: ; preds = %for.body.preheader, %for.body
%indvars.iv.next = add nuw nsw i64 %indvars.iv, 1		%indvars.iv.next = add nuw nsw i64 %indvars.iv, 1
%cmp.not = icmp eq i64 %indvars.iv.next, 1024		%cmp.not = icmp eq i64 %indvars.iv.next, 1024
br i1 %cmp.not, label %for.cond.cleanup, label %for.body		br i1 %cmp.not, label %for.cond.cleanup, label %for.body
}		}

define void @sink_splat_ashr_scalable(i32* nocapture %a) {		define void @sink_splat_ashr_scalable(i32* nocapture %a) {
; CHECK-LABEL: sink_splat_ashr_scalable:		; CHECK-LABEL: sink_splat_ashr_scalable:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: csrr a5, vlenb		; CHECK-NEXT: csrr a4, vlenb
; CHECK-NEXT: srli a1, a5, 1		; CHECK-NEXT: srli a1, a4, 1
; CHECK-NEXT: li a2, 1024		; CHECK-NEXT: li a2, 1024
; CHECK-NEXT: bgeu a2, a1, .LBB19_2		; CHECK-NEXT: bgeu a2, a1, .LBB19_2
; CHECK-NEXT: # %bb.1:		; CHECK-NEXT: # %bb.1:
; CHECK-NEXT: li a2, 0		; CHECK-NEXT: li a2, 0
; CHECK-NEXT: j .LBB19_5		; CHECK-NEXT: j .LBB19_5
; CHECK-NEXT: .LBB19_2: # %vector.ph		; CHECK-NEXT: .LBB19_2: # %vector.ph
; CHECK-NEXT: li a4, 0		; CHECK-NEXT: li a5, 0
; CHECK-NEXT: remu a3, a2, a1		; CHECK-NEXT: remu a3, a2, a1
; CHECK-NEXT: sub a2, a2, a3		; CHECK-NEXT: sub a2, a2, a3
; CHECK-NEXT: slli a5, a5, 1		; CHECK-NEXT: slli a4, a4, 1
		; CHECK-NEXT: vsetvli a6, zero, e32, m2, ta, mu
; CHECK-NEXT: mv a6, a0		; CHECK-NEXT: mv a6, a0
; CHECK-NEXT: .LBB19_3: # %vector.body		; CHECK-NEXT: .LBB19_3: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vl2re32.v v8, (a6)		; CHECK-NEXT: vl2re32.v v8, (a6)
; CHECK-NEXT: vsetvli a7, zero, e32, m2, ta, mu
; CHECK-NEXT: vsra.vi v8, v8, 2		; CHECK-NEXT: vsra.vi v8, v8, 2
; CHECK-NEXT: vs2r.v v8, (a6)		; CHECK-NEXT: vs2r.v v8, (a6)
; CHECK-NEXT: add a4, a4, a1		; CHECK-NEXT: add a5, a5, a1
; CHECK-NEXT: add a6, a6, a5		; CHECK-NEXT: add a6, a6, a4
; CHECK-NEXT: bne a4, a2, .LBB19_3		; CHECK-NEXT: bne a5, a2, .LBB19_3
; CHECK-NEXT: # %bb.4: # %middle.block		; CHECK-NEXT: # %bb.4: # %middle.block
; CHECK-NEXT: beqz a3, .LBB19_7		; CHECK-NEXT: beqz a3, .LBB19_7
; CHECK-NEXT: .LBB19_5: # %for.body.preheader		; CHECK-NEXT: .LBB19_5: # %for.body.preheader
; CHECK-NEXT: addi a1, a2, -1024		; CHECK-NEXT: addi a1, a2, -1024
; CHECK-NEXT: slli a2, a2, 2		; CHECK-NEXT: slli a2, a2, 2
; CHECK-NEXT: add a0, a0, a2		; CHECK-NEXT: add a0, a0, a2
; CHECK-NEXT: .LBB19_6: # %for.body		; CHECK-NEXT: .LBB19_6: # %for.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
▲ Show 20 Lines • Show All 281 Lines • ▼ Show 20 Lines
; CHECK-NEXT: bgeu a3, a2, .LBB26_2		; CHECK-NEXT: bgeu a3, a2, .LBB26_2
; CHECK-NEXT: # %bb.1:		; CHECK-NEXT: # %bb.1:
; CHECK-NEXT: li a3, 0		; CHECK-NEXT: li a3, 0
; CHECK-NEXT: j .LBB26_5		; CHECK-NEXT: j .LBB26_5
; CHECK-NEXT: .LBB26_2: # %vector.ph		; CHECK-NEXT: .LBB26_2: # %vector.ph
; CHECK-NEXT: li a5, 0		; CHECK-NEXT: li a5, 0
; CHECK-NEXT: remu a4, a3, a2		; CHECK-NEXT: remu a4, a3, a2
; CHECK-NEXT: sub a3, a3, a4		; CHECK-NEXT: sub a3, a3, a4
		; CHECK-NEXT: vsetvli a6, zero, e32, m1, ta, mu
; CHECK-NEXT: mv a6, a0		; CHECK-NEXT: mv a6, a0
; CHECK-NEXT: .LBB26_3: # %vector.body		; CHECK-NEXT: .LBB26_3: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vl1re32.v v8, (a6)		; CHECK-NEXT: vl1re32.v v8, (a6)
; CHECK-NEXT: vsetvli a7, zero, e32, m1, ta, mu
; CHECK-NEXT: vfmul.vf v8, v8, fa0		; CHECK-NEXT: vfmul.vf v8, v8, fa0
; CHECK-NEXT: vs1r.v v8, (a6)		; CHECK-NEXT: vs1r.v v8, (a6)
; CHECK-NEXT: add a5, a5, a2		; CHECK-NEXT: add a5, a5, a2
; CHECK-NEXT: add a6, a6, a1		; CHECK-NEXT: add a6, a6, a1
; CHECK-NEXT: bne a5, a3, .LBB26_3		; CHECK-NEXT: bne a5, a3, .LBB26_3
; CHECK-NEXT: # %bb.4: # %middle.block		; CHECK-NEXT: # %bb.4: # %middle.block
; CHECK-NEXT: beqz a4, .LBB26_7		; CHECK-NEXT: beqz a4, .LBB26_7
; CHECK-NEXT: .LBB26_5: # %for.body.preheader		; CHECK-NEXT: .LBB26_5: # %for.body.preheader
▲ Show 20 Lines • Show All 70 Lines • ▼ Show 20 Lines
; CHECK-NEXT: bgeu a3, a2, .LBB27_2		; CHECK-NEXT: bgeu a3, a2, .LBB27_2
; CHECK-NEXT: # %bb.1:		; CHECK-NEXT: # %bb.1:
; CHECK-NEXT: li a3, 0		; CHECK-NEXT: li a3, 0
; CHECK-NEXT: j .LBB27_5		; CHECK-NEXT: j .LBB27_5
; CHECK-NEXT: .LBB27_2: # %vector.ph		; CHECK-NEXT: .LBB27_2: # %vector.ph
; CHECK-NEXT: li a5, 0		; CHECK-NEXT: li a5, 0
; CHECK-NEXT: remu a4, a3, a2		; CHECK-NEXT: remu a4, a3, a2
; CHECK-NEXT: sub a3, a3, a4		; CHECK-NEXT: sub a3, a3, a4
		; CHECK-NEXT: vsetvli a6, zero, e32, m1, ta, mu
; CHECK-NEXT: mv a6, a0		; CHECK-NEXT: mv a6, a0
; CHECK-NEXT: .LBB27_3: # %vector.body		; CHECK-NEXT: .LBB27_3: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vl1re32.v v8, (a6)		; CHECK-NEXT: vl1re32.v v8, (a6)
; CHECK-NEXT: vsetvli a7, zero, e32, m1, ta, mu
; CHECK-NEXT: vfdiv.vf v8, v8, fa0		; CHECK-NEXT: vfdiv.vf v8, v8, fa0
; CHECK-NEXT: vs1r.v v8, (a6)		; CHECK-NEXT: vs1r.v v8, (a6)
; CHECK-NEXT: add a5, a5, a2		; CHECK-NEXT: add a5, a5, a2
; CHECK-NEXT: add a6, a6, a1		; CHECK-NEXT: add a6, a6, a1
; CHECK-NEXT: bne a5, a3, .LBB27_3		; CHECK-NEXT: bne a5, a3, .LBB27_3
; CHECK-NEXT: # %bb.4: # %middle.block		; CHECK-NEXT: # %bb.4: # %middle.block
; CHECK-NEXT: beqz a4, .LBB27_7		; CHECK-NEXT: beqz a4, .LBB27_7
; CHECK-NEXT: .LBB27_5: # %for.body.preheader		; CHECK-NEXT: .LBB27_5: # %for.body.preheader
▲ Show 20 Lines • Show All 70 Lines • ▼ Show 20 Lines
; CHECK-NEXT: bgeu a3, a2, .LBB28_2		; CHECK-NEXT: bgeu a3, a2, .LBB28_2
; CHECK-NEXT: # %bb.1:		; CHECK-NEXT: # %bb.1:
; CHECK-NEXT: li a3, 0		; CHECK-NEXT: li a3, 0
; CHECK-NEXT: j .LBB28_5		; CHECK-NEXT: j .LBB28_5
; CHECK-NEXT: .LBB28_2: # %vector.ph		; CHECK-NEXT: .LBB28_2: # %vector.ph
; CHECK-NEXT: li a5, 0		; CHECK-NEXT: li a5, 0
; CHECK-NEXT: remu a4, a3, a2		; CHECK-NEXT: remu a4, a3, a2
; CHECK-NEXT: sub a3, a3, a4		; CHECK-NEXT: sub a3, a3, a4
		; CHECK-NEXT: vsetvli a6, zero, e32, m1, ta, mu
; CHECK-NEXT: mv a6, a0		; CHECK-NEXT: mv a6, a0
; CHECK-NEXT: .LBB28_3: # %vector.body		; CHECK-NEXT: .LBB28_3: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vl1re32.v v8, (a6)		; CHECK-NEXT: vl1re32.v v8, (a6)
; CHECK-NEXT: vsetvli a7, zero, e32, m1, ta, mu
; CHECK-NEXT: vfrdiv.vf v8, v8, fa0		; CHECK-NEXT: vfrdiv.vf v8, v8, fa0
; CHECK-NEXT: vs1r.v v8, (a6)		; CHECK-NEXT: vs1r.v v8, (a6)
; CHECK-NEXT: add a5, a5, a2		; CHECK-NEXT: add a5, a5, a2
; CHECK-NEXT: add a6, a6, a1		; CHECK-NEXT: add a6, a6, a1
; CHECK-NEXT: bne a5, a3, .LBB28_3		; CHECK-NEXT: bne a5, a3, .LBB28_3
; CHECK-NEXT: # %bb.4: # %middle.block		; CHECK-NEXT: # %bb.4: # %middle.block
; CHECK-NEXT: beqz a4, .LBB28_7		; CHECK-NEXT: beqz a4, .LBB28_7
; CHECK-NEXT: .LBB28_5: # %for.body.preheader		; CHECK-NEXT: .LBB28_5: # %for.body.preheader
▲ Show 20 Lines • Show All 70 Lines • ▼ Show 20 Lines
; CHECK-NEXT: bgeu a3, a2, .LBB29_2		; CHECK-NEXT: bgeu a3, a2, .LBB29_2
; CHECK-NEXT: # %bb.1:		; CHECK-NEXT: # %bb.1:
; CHECK-NEXT: li a3, 0		; CHECK-NEXT: li a3, 0
; CHECK-NEXT: j .LBB29_5		; CHECK-NEXT: j .LBB29_5
; CHECK-NEXT: .LBB29_2: # %vector.ph		; CHECK-NEXT: .LBB29_2: # %vector.ph
; CHECK-NEXT: li a5, 0		; CHECK-NEXT: li a5, 0
; CHECK-NEXT: remu a4, a3, a2		; CHECK-NEXT: remu a4, a3, a2
; CHECK-NEXT: sub a3, a3, a4		; CHECK-NEXT: sub a3, a3, a4
		; CHECK-NEXT: vsetvli a6, zero, e32, m1, ta, mu
; CHECK-NEXT: mv a6, a0		; CHECK-NEXT: mv a6, a0
; CHECK-NEXT: .LBB29_3: # %vector.body		; CHECK-NEXT: .LBB29_3: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vl1re32.v v8, (a6)		; CHECK-NEXT: vl1re32.v v8, (a6)
; CHECK-NEXT: vsetvli a7, zero, e32, m1, ta, mu
; CHECK-NEXT: vfadd.vf v8, v8, fa0		; CHECK-NEXT: vfadd.vf v8, v8, fa0
; CHECK-NEXT: vs1r.v v8, (a6)		; CHECK-NEXT: vs1r.v v8, (a6)
; CHECK-NEXT: add a5, a5, a2		; CHECK-NEXT: add a5, a5, a2
; CHECK-NEXT: add a6, a6, a1		; CHECK-NEXT: add a6, a6, a1
; CHECK-NEXT: bne a5, a3, .LBB29_3		; CHECK-NEXT: bne a5, a3, .LBB29_3
; CHECK-NEXT: # %bb.4: # %middle.block		; CHECK-NEXT: # %bb.4: # %middle.block
; CHECK-NEXT: beqz a4, .LBB29_7		; CHECK-NEXT: beqz a4, .LBB29_7
; CHECK-NEXT: .LBB29_5: # %for.body.preheader		; CHECK-NEXT: .LBB29_5: # %for.body.preheader
▲ Show 20 Lines • Show All 70 Lines • ▼ Show 20 Lines
; CHECK-NEXT: bgeu a3, a2, .LBB30_2		; CHECK-NEXT: bgeu a3, a2, .LBB30_2
; CHECK-NEXT: # %bb.1:		; CHECK-NEXT: # %bb.1:
; CHECK-NEXT: li a3, 0		; CHECK-NEXT: li a3, 0
; CHECK-NEXT: j .LBB30_5		; CHECK-NEXT: j .LBB30_5
; CHECK-NEXT: .LBB30_2: # %vector.ph		; CHECK-NEXT: .LBB30_2: # %vector.ph
; CHECK-NEXT: li a5, 0		; CHECK-NEXT: li a5, 0
; CHECK-NEXT: remu a4, a3, a2		; CHECK-NEXT: remu a4, a3, a2
; CHECK-NEXT: sub a3, a3, a4		; CHECK-NEXT: sub a3, a3, a4
		; CHECK-NEXT: vsetvli a6, zero, e32, m1, ta, mu
; CHECK-NEXT: mv a6, a0		; CHECK-NEXT: mv a6, a0
; CHECK-NEXT: .LBB30_3: # %vector.body		; CHECK-NEXT: .LBB30_3: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vl1re32.v v8, (a6)		; CHECK-NEXT: vl1re32.v v8, (a6)
; CHECK-NEXT: vsetvli a7, zero, e32, m1, ta, mu
; CHECK-NEXT: vfsub.vf v8, v8, fa0		; CHECK-NEXT: vfsub.vf v8, v8, fa0
; CHECK-NEXT: vs1r.v v8, (a6)		; CHECK-NEXT: vs1r.v v8, (a6)
; CHECK-NEXT: add a5, a5, a2		; CHECK-NEXT: add a5, a5, a2
; CHECK-NEXT: add a6, a6, a1		; CHECK-NEXT: add a6, a6, a1
; CHECK-NEXT: bne a5, a3, .LBB30_3		; CHECK-NEXT: bne a5, a3, .LBB30_3
; CHECK-NEXT: # %bb.4: # %middle.block		; CHECK-NEXT: # %bb.4: # %middle.block
; CHECK-NEXT: beqz a4, .LBB30_7		; CHECK-NEXT: beqz a4, .LBB30_7
; CHECK-NEXT: .LBB30_5: # %for.body.preheader		; CHECK-NEXT: .LBB30_5: # %for.body.preheader
▲ Show 20 Lines • Show All 70 Lines • ▼ Show 20 Lines
; CHECK-NEXT: bgeu a3, a2, .LBB31_2		; CHECK-NEXT: bgeu a3, a2, .LBB31_2
; CHECK-NEXT: # %bb.1:		; CHECK-NEXT: # %bb.1:
; CHECK-NEXT: li a3, 0		; CHECK-NEXT: li a3, 0
; CHECK-NEXT: j .LBB31_5		; CHECK-NEXT: j .LBB31_5
; CHECK-NEXT: .LBB31_2: # %vector.ph		; CHECK-NEXT: .LBB31_2: # %vector.ph
; CHECK-NEXT: li a5, 0		; CHECK-NEXT: li a5, 0
; CHECK-NEXT: remu a4, a3, a2		; CHECK-NEXT: remu a4, a3, a2
; CHECK-NEXT: sub a3, a3, a4		; CHECK-NEXT: sub a3, a3, a4
		; CHECK-NEXT: vsetvli a6, zero, e32, m1, ta, mu
; CHECK-NEXT: mv a6, a0		; CHECK-NEXT: mv a6, a0
; CHECK-NEXT: .LBB31_3: # %vector.body		; CHECK-NEXT: .LBB31_3: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vl1re32.v v8, (a6)		; CHECK-NEXT: vl1re32.v v8, (a6)
; CHECK-NEXT: vsetvli a7, zero, e32, m1, ta, mu
; CHECK-NEXT: vfrsub.vf v8, v8, fa0		; CHECK-NEXT: vfrsub.vf v8, v8, fa0
; CHECK-NEXT: vs1r.v v8, (a6)		; CHECK-NEXT: vs1r.v v8, (a6)
; CHECK-NEXT: add a5, a5, a2		; CHECK-NEXT: add a5, a5, a2
; CHECK-NEXT: add a6, a6, a1		; CHECK-NEXT: add a6, a6, a1
; CHECK-NEXT: bne a5, a3, .LBB31_3		; CHECK-NEXT: bne a5, a3, .LBB31_3
; CHECK-NEXT: # %bb.4: # %middle.block		; CHECK-NEXT: # %bb.4: # %middle.block
; CHECK-NEXT: beqz a4, .LBB31_7		; CHECK-NEXT: beqz a4, .LBB31_7
; CHECK-NEXT: .LBB31_5: # %for.body.preheader		; CHECK-NEXT: .LBB31_5: # %for.body.preheader
▲ Show 20 Lines • Show All 153 Lines • ▼ Show 20 Lines
; CHECK-NEXT: # %bb.1:		; CHECK-NEXT: # %bb.1:
; CHECK-NEXT: li a4, 0		; CHECK-NEXT: li a4, 0
; CHECK-NEXT: j .LBB34_5		; CHECK-NEXT: j .LBB34_5
; CHECK-NEXT: .LBB34_2: # %vector.ph		; CHECK-NEXT: .LBB34_2: # %vector.ph
; CHECK-NEXT: li a6, 0		; CHECK-NEXT: li a6, 0
; CHECK-NEXT: li a7, 0		; CHECK-NEXT: li a7, 0
; CHECK-NEXT: remu a5, a4, a3		; CHECK-NEXT: remu a5, a4, a3
; CHECK-NEXT: sub a4, a4, a5		; CHECK-NEXT: sub a4, a4, a5
		; CHECK-NEXT: vsetvli t0, zero, e32, m1, ta, mu
; CHECK-NEXT: .LBB34_3: # %vector.body		; CHECK-NEXT: .LBB34_3: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: add t0, a0, a6		; CHECK-NEXT: add t0, a0, a6
; CHECK-NEXT: vl1re32.v v8, (t0)		; CHECK-NEXT: vl1re32.v v8, (t0)
; CHECK-NEXT: add t1, a1, a6		; CHECK-NEXT: add t1, a1, a6
; CHECK-NEXT: vl1re32.v v9, (t1)		; CHECK-NEXT: vl1re32.v v9, (t1)
; CHECK-NEXT: vsetvli t1, zero, e32, m1, ta, mu
; CHECK-NEXT: vfmacc.vf v9, fa0, v8		; CHECK-NEXT: vfmacc.vf v9, fa0, v8
; CHECK-NEXT: vs1r.v v9, (t0)		; CHECK-NEXT: vs1r.v v9, (t0)
; CHECK-NEXT: add a7, a7, a3		; CHECK-NEXT: add a7, a7, a3
; CHECK-NEXT: add a6, a6, a2		; CHECK-NEXT: add a6, a6, a2
; CHECK-NEXT: bne a7, a4, .LBB34_3		; CHECK-NEXT: bne a7, a4, .LBB34_3
; CHECK-NEXT: # %bb.4: # %middle.block		; CHECK-NEXT: # %bb.4: # %middle.block
; CHECK-NEXT: beqz a5, .LBB34_7		; CHECK-NEXT: beqz a5, .LBB34_7
; CHECK-NEXT: .LBB34_5: # %for.body.preheader		; CHECK-NEXT: .LBB34_5: # %for.body.preheader
▲ Show 20 Lines • Show All 79 Lines • ▼ Show 20 Lines
; CHECK-NEXT: # %bb.1:		; CHECK-NEXT: # %bb.1:
; CHECK-NEXT: li a4, 0		; CHECK-NEXT: li a4, 0
; CHECK-NEXT: j .LBB35_5		; CHECK-NEXT: j .LBB35_5
; CHECK-NEXT: .LBB35_2: # %vector.ph		; CHECK-NEXT: .LBB35_2: # %vector.ph
; CHECK-NEXT: li a6, 0		; CHECK-NEXT: li a6, 0
; CHECK-NEXT: li a7, 0		; CHECK-NEXT: li a7, 0
; CHECK-NEXT: remu a5, a4, a3		; CHECK-NEXT: remu a5, a4, a3
; CHECK-NEXT: sub a4, a4, a5		; CHECK-NEXT: sub a4, a4, a5
		; CHECK-NEXT: vsetvli t0, zero, e32, m1, ta, mu
; CHECK-NEXT: .LBB35_3: # %vector.body		; CHECK-NEXT: .LBB35_3: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: add t0, a0, a6		; CHECK-NEXT: add t0, a0, a6
; CHECK-NEXT: vl1re32.v v8, (t0)		; CHECK-NEXT: vl1re32.v v8, (t0)
; CHECK-NEXT: add t1, a1, a6		; CHECK-NEXT: add t1, a1, a6
; CHECK-NEXT: vl1re32.v v9, (t1)		; CHECK-NEXT: vl1re32.v v9, (t1)
; CHECK-NEXT: vsetvli t1, zero, e32, m1, ta, mu
; CHECK-NEXT: vfmacc.vf v9, fa0, v8		; CHECK-NEXT: vfmacc.vf v9, fa0, v8
; CHECK-NEXT: vs1r.v v9, (t0)		; CHECK-NEXT: vs1r.v v9, (t0)
; CHECK-NEXT: add a7, a7, a3		; CHECK-NEXT: add a7, a7, a3
; CHECK-NEXT: add a6, a6, a2		; CHECK-NEXT: add a6, a6, a2
; CHECK-NEXT: bne a7, a4, .LBB35_3		; CHECK-NEXT: bne a7, a4, .LBB35_3
; CHECK-NEXT: # %bb.4: # %middle.block		; CHECK-NEXT: # %bb.4: # %middle.block
; CHECK-NEXT: beqz a5, .LBB35_7		; CHECK-NEXT: beqz a5, .LBB35_7
; CHECK-NEXT: .LBB35_5: # %for.body.preheader		; CHECK-NEXT: .LBB35_5: # %for.body.preheader
▲ Show 20 Lines • Show All 292 Lines • ▼ Show 20 Lines

for.cond.cleanup: ; preds = %vector.body		for.cond.cleanup: ; preds = %vector.body
ret void		ret void
}		}

define void @sink_splat_udiv_scalable(i32* nocapture %a, i32 signext %x) {		define void @sink_splat_udiv_scalable(i32* nocapture %a, i32 signext %x) {
; CHECK-LABEL: sink_splat_udiv_scalable:		; CHECK-LABEL: sink_splat_udiv_scalable:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: csrr a6, vlenb		; CHECK-NEXT: csrr a5, vlenb
; CHECK-NEXT: srli a2, a6, 1		; CHECK-NEXT: srli a2, a5, 1
; CHECK-NEXT: li a3, 1024		; CHECK-NEXT: li a3, 1024
; CHECK-NEXT: bgeu a3, a2, .LBB42_2		; CHECK-NEXT: bgeu a3, a2, .LBB42_2
; CHECK-NEXT: # %bb.1:		; CHECK-NEXT: # %bb.1:
; CHECK-NEXT: li a3, 0		; CHECK-NEXT: li a3, 0
; CHECK-NEXT: j .LBB42_5		; CHECK-NEXT: j .LBB42_5
; CHECK-NEXT: .LBB42_2: # %vector.ph		; CHECK-NEXT: .LBB42_2: # %vector.ph
; CHECK-NEXT: li a5, 0		; CHECK-NEXT: li a6, 0
; CHECK-NEXT: remu a4, a3, a2		; CHECK-NEXT: remu a4, a3, a2
; CHECK-NEXT: sub a3, a3, a4		; CHECK-NEXT: sub a3, a3, a4
; CHECK-NEXT: slli a6, a6, 1		; CHECK-NEXT: slli a5, a5, 1
		; CHECK-NEXT: vsetvli a7, zero, e32, m2, ta, mu
; CHECK-NEXT: mv a7, a0		; CHECK-NEXT: mv a7, a0
; CHECK-NEXT: .LBB42_3: # %vector.body		; CHECK-NEXT: .LBB42_3: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vl2re32.v v8, (a7)		; CHECK-NEXT: vl2re32.v v8, (a7)
; CHECK-NEXT: vsetvli t0, zero, e32, m2, ta, mu
; CHECK-NEXT: vdivu.vx v8, v8, a1		; CHECK-NEXT: vdivu.vx v8, v8, a1
; CHECK-NEXT: vs2r.v v8, (a7)		; CHECK-NEXT: vs2r.v v8, (a7)
; CHECK-NEXT: add a5, a5, a2		; CHECK-NEXT: add a6, a6, a2
; CHECK-NEXT: add a7, a7, a6		; CHECK-NEXT: add a7, a7, a5
; CHECK-NEXT: bne a5, a3, .LBB42_3		; CHECK-NEXT: bne a6, a3, .LBB42_3
; CHECK-NEXT: # %bb.4: # %middle.block		; CHECK-NEXT: # %bb.4: # %middle.block
; CHECK-NEXT: beqz a4, .LBB42_7		; CHECK-NEXT: beqz a4, .LBB42_7
; CHECK-NEXT: .LBB42_5: # %for.body.preheader		; CHECK-NEXT: .LBB42_5: # %for.body.preheader
; CHECK-NEXT: addi a2, a3, -1024		; CHECK-NEXT: addi a2, a3, -1024
; CHECK-NEXT: slli a3, a3, 2		; CHECK-NEXT: slli a3, a3, 2
; CHECK-NEXT: add a0, a0, a3		; CHECK-NEXT: add a0, a0, a3
; CHECK-NEXT: .LBB42_6: # %for.body		; CHECK-NEXT: .LBB42_6: # %for.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
▲ Show 20 Lines • Show All 54 Lines • ▼ Show 20 Lines	for.body: ; preds = %for.body.preheader, %for.body
%indvars.iv.next = add nuw nsw i64 %indvars.iv, 1		%indvars.iv.next = add nuw nsw i64 %indvars.iv, 1
%cmp.not = icmp eq i64 %indvars.iv.next, 1024		%cmp.not = icmp eq i64 %indvars.iv.next, 1024
br i1 %cmp.not, label %for.cond.cleanup, label %for.body		br i1 %cmp.not, label %for.cond.cleanup, label %for.body
}		}

define void @sink_splat_sdiv_scalable(i32* nocapture %a, i32 signext %x) {		define void @sink_splat_sdiv_scalable(i32* nocapture %a, i32 signext %x) {
; CHECK-LABEL: sink_splat_sdiv_scalable:		; CHECK-LABEL: sink_splat_sdiv_scalable:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: csrr a6, vlenb		; CHECK-NEXT: csrr a5, vlenb
; CHECK-NEXT: srli a2, a6, 1		; CHECK-NEXT: srli a2, a5, 1
; CHECK-NEXT: li a3, 1024		; CHECK-NEXT: li a3, 1024
; CHECK-NEXT: bgeu a3, a2, .LBB43_2		; CHECK-NEXT: bgeu a3, a2, .LBB43_2
; CHECK-NEXT: # %bb.1:		; CHECK-NEXT: # %bb.1:
; CHECK-NEXT: li a3, 0		; CHECK-NEXT: li a3, 0
; CHECK-NEXT: j .LBB43_5		; CHECK-NEXT: j .LBB43_5
; CHECK-NEXT: .LBB43_2: # %vector.ph		; CHECK-NEXT: .LBB43_2: # %vector.ph
; CHECK-NEXT: li a5, 0		; CHECK-NEXT: li a6, 0
; CHECK-NEXT: remu a4, a3, a2		; CHECK-NEXT: remu a4, a3, a2
; CHECK-NEXT: sub a3, a3, a4		; CHECK-NEXT: sub a3, a3, a4
; CHECK-NEXT: slli a6, a6, 1		; CHECK-NEXT: slli a5, a5, 1
		; CHECK-NEXT: vsetvli a7, zero, e32, m2, ta, mu
; CHECK-NEXT: mv a7, a0		; CHECK-NEXT: mv a7, a0
; CHECK-NEXT: .LBB43_3: # %vector.body		; CHECK-NEXT: .LBB43_3: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vl2re32.v v8, (a7)		; CHECK-NEXT: vl2re32.v v8, (a7)
; CHECK-NEXT: vsetvli t0, zero, e32, m2, ta, mu
; CHECK-NEXT: vdiv.vx v8, v8, a1		; CHECK-NEXT: vdiv.vx v8, v8, a1
; CHECK-NEXT: vs2r.v v8, (a7)		; CHECK-NEXT: vs2r.v v8, (a7)
; CHECK-NEXT: add a5, a5, a2		; CHECK-NEXT: add a6, a6, a2
; CHECK-NEXT: add a7, a7, a6		; CHECK-NEXT: add a7, a7, a5
; CHECK-NEXT: bne a5, a3, .LBB43_3		; CHECK-NEXT: bne a6, a3, .LBB43_3
; CHECK-NEXT: # %bb.4: # %middle.block		; CHECK-NEXT: # %bb.4: # %middle.block
; CHECK-NEXT: beqz a4, .LBB43_7		; CHECK-NEXT: beqz a4, .LBB43_7
; CHECK-NEXT: .LBB43_5: # %for.body.preheader		; CHECK-NEXT: .LBB43_5: # %for.body.preheader
; CHECK-NEXT: addi a2, a3, -1024		; CHECK-NEXT: addi a2, a3, -1024
; CHECK-NEXT: slli a3, a3, 2		; CHECK-NEXT: slli a3, a3, 2
; CHECK-NEXT: add a0, a0, a3		; CHECK-NEXT: add a0, a0, a3
; CHECK-NEXT: .LBB43_6: # %for.body		; CHECK-NEXT: .LBB43_6: # %for.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
▲ Show 20 Lines • Show All 54 Lines • ▼ Show 20 Lines	for.body: ; preds = %for.body.preheader, %for.body
%indvars.iv.next = add nuw nsw i64 %indvars.iv, 1		%indvars.iv.next = add nuw nsw i64 %indvars.iv, 1
%cmp.not = icmp eq i64 %indvars.iv.next, 1024		%cmp.not = icmp eq i64 %indvars.iv.next, 1024
br i1 %cmp.not, label %for.cond.cleanup, label %for.body		br i1 %cmp.not, label %for.cond.cleanup, label %for.body
}		}

define void @sink_splat_urem_scalable(i32* nocapture %a, i32 signext %x) {		define void @sink_splat_urem_scalable(i32* nocapture %a, i32 signext %x) {
; CHECK-LABEL: sink_splat_urem_scalable:		; CHECK-LABEL: sink_splat_urem_scalable:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: csrr a6, vlenb		; CHECK-NEXT: csrr a5, vlenb
; CHECK-NEXT: srli a2, a6, 1		; CHECK-NEXT: srli a2, a5, 1
; CHECK-NEXT: li a3, 1024		; CHECK-NEXT: li a3, 1024
; CHECK-NEXT: bgeu a3, a2, .LBB44_2		; CHECK-NEXT: bgeu a3, a2, .LBB44_2
; CHECK-NEXT: # %bb.1:		; CHECK-NEXT: # %bb.1:
; CHECK-NEXT: li a3, 0		; CHECK-NEXT: li a3, 0
; CHECK-NEXT: j .LBB44_5		; CHECK-NEXT: j .LBB44_5
; CHECK-NEXT: .LBB44_2: # %vector.ph		; CHECK-NEXT: .LBB44_2: # %vector.ph
; CHECK-NEXT: li a5, 0		; CHECK-NEXT: li a6, 0
; CHECK-NEXT: remu a4, a3, a2		; CHECK-NEXT: remu a4, a3, a2
; CHECK-NEXT: sub a3, a3, a4		; CHECK-NEXT: sub a3, a3, a4
; CHECK-NEXT: slli a6, a6, 1		; CHECK-NEXT: slli a5, a5, 1
		; CHECK-NEXT: vsetvli a7, zero, e32, m2, ta, mu
; CHECK-NEXT: mv a7, a0		; CHECK-NEXT: mv a7, a0
; CHECK-NEXT: .LBB44_3: # %vector.body		; CHECK-NEXT: .LBB44_3: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vl2re32.v v8, (a7)		; CHECK-NEXT: vl2re32.v v8, (a7)
; CHECK-NEXT: vsetvli t0, zero, e32, m2, ta, mu
; CHECK-NEXT: vremu.vx v8, v8, a1		; CHECK-NEXT: vremu.vx v8, v8, a1
; CHECK-NEXT: vs2r.v v8, (a7)		; CHECK-NEXT: vs2r.v v8, (a7)
; CHECK-NEXT: add a5, a5, a2		; CHECK-NEXT: add a6, a6, a2
; CHECK-NEXT: add a7, a7, a6		; CHECK-NEXT: add a7, a7, a5
; CHECK-NEXT: bne a5, a3, .LBB44_3		; CHECK-NEXT: bne a6, a3, .LBB44_3
; CHECK-NEXT: # %bb.4: # %middle.block		; CHECK-NEXT: # %bb.4: # %middle.block
; CHECK-NEXT: beqz a4, .LBB44_7		; CHECK-NEXT: beqz a4, .LBB44_7
; CHECK-NEXT: .LBB44_5: # %for.body.preheader		; CHECK-NEXT: .LBB44_5: # %for.body.preheader
; CHECK-NEXT: addi a2, a3, -1024		; CHECK-NEXT: addi a2, a3, -1024
; CHECK-NEXT: slli a3, a3, 2		; CHECK-NEXT: slli a3, a3, 2
; CHECK-NEXT: add a0, a0, a3		; CHECK-NEXT: add a0, a0, a3
; CHECK-NEXT: .LBB44_6: # %for.body		; CHECK-NEXT: .LBB44_6: # %for.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
▲ Show 20 Lines • Show All 54 Lines • ▼ Show 20 Lines	for.body: ; preds = %for.body.preheader, %for.body
%indvars.iv.next = add nuw nsw i64 %indvars.iv, 1		%indvars.iv.next = add nuw nsw i64 %indvars.iv, 1
%cmp.not = icmp eq i64 %indvars.iv.next, 1024		%cmp.not = icmp eq i64 %indvars.iv.next, 1024
br i1 %cmp.not, label %for.cond.cleanup, label %for.body		br i1 %cmp.not, label %for.cond.cleanup, label %for.body
}		}

define void @sink_splat_srem_scalable(i32* nocapture %a, i32 signext %x) {		define void @sink_splat_srem_scalable(i32* nocapture %a, i32 signext %x) {
; CHECK-LABEL: sink_splat_srem_scalable:		; CHECK-LABEL: sink_splat_srem_scalable:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: csrr a6, vlenb		; CHECK-NEXT: csrr a5, vlenb
; CHECK-NEXT: srli a2, a6, 1		; CHECK-NEXT: srli a2, a5, 1
; CHECK-NEXT: li a3, 1024		; CHECK-NEXT: li a3, 1024
; CHECK-NEXT: bgeu a3, a2, .LBB45_2		; CHECK-NEXT: bgeu a3, a2, .LBB45_2
; CHECK-NEXT: # %bb.1:		; CHECK-NEXT: # %bb.1:
; CHECK-NEXT: li a3, 0		; CHECK-NEXT: li a3, 0
; CHECK-NEXT: j .LBB45_5		; CHECK-NEXT: j .LBB45_5
; CHECK-NEXT: .LBB45_2: # %vector.ph		; CHECK-NEXT: .LBB45_2: # %vector.ph
; CHECK-NEXT: li a5, 0		; CHECK-NEXT: li a6, 0
; CHECK-NEXT: remu a4, a3, a2		; CHECK-NEXT: remu a4, a3, a2
; CHECK-NEXT: sub a3, a3, a4		; CHECK-NEXT: sub a3, a3, a4
; CHECK-NEXT: slli a6, a6, 1		; CHECK-NEXT: slli a5, a5, 1
		; CHECK-NEXT: vsetvli a7, zero, e32, m2, ta, mu
; CHECK-NEXT: mv a7, a0		; CHECK-NEXT: mv a7, a0
; CHECK-NEXT: .LBB45_3: # %vector.body		; CHECK-NEXT: .LBB45_3: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vl2re32.v v8, (a7)		; CHECK-NEXT: vl2re32.v v8, (a7)
; CHECK-NEXT: vsetvli t0, zero, e32, m2, ta, mu
; CHECK-NEXT: vrem.vx v8, v8, a1		; CHECK-NEXT: vrem.vx v8, v8, a1
; CHECK-NEXT: vs2r.v v8, (a7)		; CHECK-NEXT: vs2r.v v8, (a7)
; CHECK-NEXT: add a5, a5, a2		; CHECK-NEXT: add a6, a6, a2
; CHECK-NEXT: add a7, a7, a6		; CHECK-NEXT: add a7, a7, a5
; CHECK-NEXT: bne a5, a3, .LBB45_3		; CHECK-NEXT: bne a6, a3, .LBB45_3
; CHECK-NEXT: # %bb.4: # %middle.block		; CHECK-NEXT: # %bb.4: # %middle.block
; CHECK-NEXT: beqz a4, .LBB45_7		; CHECK-NEXT: beqz a4, .LBB45_7
; CHECK-NEXT: .LBB45_5: # %for.body.preheader		; CHECK-NEXT: .LBB45_5: # %for.body.preheader
; CHECK-NEXT: addi a2, a3, -1024		; CHECK-NEXT: addi a2, a3, -1024
; CHECK-NEXT: slli a3, a3, 2		; CHECK-NEXT: slli a3, a3, 2
; CHECK-NEXT: add a0, a0, a3		; CHECK-NEXT: add a0, a0, a3
; CHECK-NEXT: .LBB45_6: # %for.body		; CHECK-NEXT: .LBB45_6: # %for.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
▲ Show 20 Lines • Show All 1,438 Lines • Show Last 20 Lines