This is an archive of the discontinued LLVM Phabricator instance.

Paths

Table of Contentst

-
llvm/
-
include/llvm/
-
llvm/
-
Analysis/
1
TargetTransformInfo.h
-
TargetTransformInfoImpl.h
-
CodeGen/
-
BasicTTIImpl.h
-
lib/
-
Analysis/
-
TargetTransformInfo.cpp
-
Target/RISCV/
-
RISCV/
-
RISCVTargetTransformInfo.h
-
RISCVTargetTransformInfo.cpp
-
Transforms/Scalar/
-
Scalar/
-
LoopStrengthReduce.cpp
-
test/
-
CodeGen/RISCV/
-
RISCV/
-
branch-on-zero.ll
-
riscv-codegenprepare-asm.ll
-
rvv/
-
fixed-vector-strided-load-store-asm.ll
-
fixed-vectors-fp-buildvec.ll
-
sink-splat-operands.ll
-
vsetvli-insert-crossbb.ll
-
Transforms/LoopStrengthReduce/RISCV/
-
LoopStrengthReduce/
-
RISCV/
-
lsr-cost-compare.ll

Differential D134893

[LSR][TTI][RISCV] Add isAllowTerminatingConditionFoldingAfterLSR into TTI and enable it for RISC-V
AbandonedPublic

Authored by reames on Sep 29 2022, 9:39 AM.

Download Raw Diff

Details

Reviewers

craig.topper
mcberg2021
rogfer01
asb
eopXD

Summary

Previously in D132443, the transformation was added and guarded by an option.
This commit attempts to create an TTI and enable it for the RISC-V backend.

Diff Detail

Repository: rG LLVM Github Monorepo

Event Timeline

eopXD created this revision.Sep 29 2022, 9:39 AM

Herald added a project: Restricted Project. · View Herald TranscriptSep 29 2022, 9:39 AM

Herald added subscribers: sunshaoce, VincentWu, vkmr and 28 others. · View Herald Transcript

eopXD requested review of this revision.Sep 29 2022, 9:39 AM

Herald added a project: Restricted Project. · View Herald TranscriptSep 29 2022, 9:39 AM

Herald added subscribers: llvm-commits, • pcwang-thead, MaskRay. · View Herald Transcript

eopXD added reviewers: craig.topper, mcberg2021, reames, rogfer01, asb.Sep 29 2022, 9:40 AM

Herald added a subscriber: StephenFan. · View Herald TranscriptSep 29 2022, 9:40 AM

I ran through lit test under llvm/test/CodeGen/RISCV before submitting this patch, these two affected test case shows the benefit of the transformation.

Harbormaster completed remote builds in B189448: Diff 463939.Sep 29 2022, 11:05 AM

There is a error report as below if i apply this patch on branch main 8d4ebd1a7c9e1f47a4a610aeb41d1613f822ee20
error: Terminating value is not safe to expand, need to add it to predicate.

my compiler option is "-march=rv64gc -O2"
my test case is :

alac.i279 KBDownload

@JojoR Thanks for the report. I was wondering that whether the assertion would hit. Will add a patch to fix this.

I have a question about patch D132443, why do not you put optimization in pass "iv-users" ? I think it belongs to IV analyzation.

because that the pass "iv-users" do analyzation only without any transformation ?

In D134893#3855128, @JojoR wrote:

I have a question about patch D132443, why do not you put optimization in pass "iv-users" ? I think it belongs to IV analyzation.

because that the pass "iv-users" do analyzation only without any transformation ?

IVUser is an analysis pass, and the LSR pass uses it before doing strength reduction.
This transformation is beneficial after LSR, not before it.

In D134893#3855134, @eopXD wrote:

In D134893#3855128, @JojoR wrote:

I have a question about patch D132443, why do not you put optimization in pass "iv-users" ? I think it belongs to IV analyzation.

because that the pass "iv-users" do analyzation only without any transformation ?

IVUser is an analysis pass, and the LSR pass uses it before doing strength reduction.
This transformation is beneficial after LSR, not before it.

Got it, thanks :)

@eopXD I saw the patch D132443 only support eq/neq condterm, and I want to add gt/lt,
any suggestion for me ? or you have plan to implement that ?

In D134893#3855180, @JojoR wrote:

@eopXD I saw the patch D132443 only support eq/neq condterm, and I want to add gt/lt,
any suggestion for me ? or you have plan to implement that ?

I will submit proceeding patches for more support, thank you.

In D134893#3848868, @JojoR wrote:

There is a error report as below if i apply this patch on branch main 8d4ebd1a7c9e1f47a4a610aeb41d1613f822ee20
error: Terminating value is not safe to expand, need to add it to predicate.

my compiler option is "-march=rv64gc -O2"
my test case is :

alac.i279 KBDownload

Is it possible for you to have a reduced test case on this? It would help to land the revision to fix this. Thank you.

Rebase to latest main

Harbormaster completed remote builds in B193742: Diff 469899.Oct 22 2022, 8:36 AM

I think we should start discussion again, because this pass has changed.

@eopXD
@JojoR

Implemented : https://reviews.llvm.org/D145929

I saw the patch D132443 only support eq/neq condterm, and I want to add gt/lt,
any suggestion for me

Implemented : https://reviews.llvm.org/D136415

There is a error report as below if i apply this patch on branch main
error: Terminating value is not safe to expand, need to add it to predicate.

So, may we should rebase this MR and apply changes?

Herald added subscribers: jobnoorman, luke. · View Herald TranscriptMar 21 2023, 1:18 AM

I agree with @fhahn that such hook to a middle-end optimization like LSR is not a great approach. I have generally improving LSR term-fold and default enabling it as an item to my queue. I have the RVV intrinsics to be dealt with first but this will be the first thing I'll revisit once I am done there.

If there is no further comments I will drop this patch later this week.

lsr-term-fold is still wildly unsound. I have patches out to address this, but we should wait until that is done discussing enabling it (by default or by target).

Ok, at this point all the known soundness problems are fixed in tree. I was simply fixing ones obvious on inspection, and have not done any testing of this mechanism beyond the LIT tests themselves.

Before we move to discussing whether lsr-term-fold makes sense to enable by default, and on what basis, I think we need to have a discussion about validation and testing. Whoever is going to drive this patch forward needs to describe their testing, and validate that after all the bug fixes this still triggers enough to be worthwhile.

I will note that I am generally skeptical of this being enabled on a per-target basis. There needs to be a compelling argument as why this shouldn't be enabled more broadly. One of the major advantages of enabling this globally is increasing testing, and thus smoking out bugs more quickly. Given existing problems with testing, I think that advantage is one I'm very reluctant to give up. I also think that all targets should benefit from the transform as current framed, so I don't see any reason not to enable it. (I'm open to counter arguments here; they just need to be made.)

In D134893#4210164, @reames wrote:

I will note that I am generally skeptical of this being enabled on a per-target basis.

To circle back around here, I spent some time looking at the impact of this on other targets. In short, this heuristic really only makes sense on RISCV at the moment. Given this, my prior objection to a transform specific target hook no longer applies.

I do want to see some discussion of the testing this patch has been put through before we move forward with enabling it though. I'd encourage a rebase and a summary comment describing any testing which has been done.

Rebase to latest main.

Harbormaster completed remote builds in B234784: Diff 525965.May 26 2023, 12:55 AM

evandro removed a subscriber: evandro.May 26 2023, 10:32 AM

Resolve other test case failures.

Harbormaster completed remote builds in B235054: Diff 526313.May 27 2023, 11:36 PM

Reverse ping. Any progress on that testing summary?

Herald added a subscriber: wangpc. · View Herald TranscriptJul 7 2023, 8:23 AM

Reverse ping. I applied this locally, and collected dynamic instruction counts for SPEC on a rv64gcv config. The results didn't reveal any surprises or correctness issues. Dynamic instruction count was very mildly improved overall (0.42% geomean improvement), with no regression larger than 0.25%.

I'd like to see this landed. Can you rebase for a final LGTM?

llvm/include/llvm/Analysis/TargetTransformInfo.h
691	Please change to: shouldFoldTerminatingConditionAfterLSR

reames mentioned this in rGe947f953370a: [LSR][TTI][RISCV] Enable terminator folding for RISC-V.Wed, Nov 29, 12:14 PM

reames commandeered this revision.Wed, Nov 29, 12:14 PM

reames edited reviewers, added: eopXD; removed: reames.

Herald added subscribers: bollu, mcrosier. · View Herald TranscriptWed, Nov 29, 12:14 PM

A reworked version of this has been landed in e947f953370abe8ffc8713b8f3250a3ec39599fe.

Revision Contents

Path

Size

llvm/

include/

llvm/

Analysis/

TargetTransformInfo.h

7 lines

TargetTransformInfoImpl.h

2 lines

CodeGen/

BasicTTIImpl.h

5 lines

lib/

Analysis/

TargetTransformInfo.cpp

4 lines

Target/

RISCV/

RISCVTargetTransformInfo.h

2 lines

RISCVTargetTransformInfo.cpp

4 lines

Transforms/

Scalar/

LoopStrengthReduce.cpp

3 lines

test/

CodeGen/

RISCV/

branch-on-zero.ll

41 lines

riscv-codegenprepare-asm.ll

12 lines

rvv/

fixed-vector-strided-load-store-asm.ll

185 lines

fixed-vectors-fp-buildvec.ll

43 lines

sink-splat-operands.ll

748 lines

vsetvli-insert-crossbb.ll

5 lines

Transforms/

LoopStrengthReduce/

RISCV/

lsr-cost-compare.ll

52 lines

Diff 526313

llvm/include/llvm/Analysis/TargetTransformInfo.h

Show First 20 Lines • Show All 681 Lines • ▼ Show 20 Lines	public:
bool isLSRCostLess(const TargetTransformInfo::LSRCost &C1,		bool isLSRCostLess(const TargetTransformInfo::LSRCost &C1,
const TargetTransformInfo::LSRCost &C2) const;		const TargetTransformInfo::LSRCost &C2) const;

/// Return true if LSR major cost is number of registers. Targets which		/// Return true if LSR major cost is number of registers. Targets which
/// implement their own isLSRCostLess and unset number of registers as major		/// implement their own isLSRCostLess and unset number of registers as major
/// cost should return false, otherwise return true.		/// cost should return false, otherwise return true.
bool isNumRegsMajorCostOfLSR() const;		bool isNumRegsMajorCostOfLSR() const;

		/// Return true if LSR attempts to replace primary IV with other IV.
		bool isAllowTerminatingConditionFoldingAfterLSR() const;
		reamesAuthorUnsubmitted Not Done Reply Inline Actions Please change to: shouldFoldTerminatingConditionAfterLSR reames: Please change to: shouldFoldTerminatingConditionAfterLSR

/// \returns true if LSR should not optimize a chain that includes \p I.		/// \returns true if LSR should not optimize a chain that includes \p I.
bool isProfitableLSRChainElement(Instruction *I) const;		bool isProfitableLSRChainElement(Instruction *I) const;

/// Return true if the target can fuse a compare and branch.		/// Return true if the target can fuse a compare and branch.
/// Loop-strength-reduction (LSR) uses that knowledge to adjust its cost		/// Loop-strength-reduction (LSR) uses that knowledge to adjust its cost
/// calculation for the instructions in a loop.		/// calculation for the instructions in a loop.
bool canMacroFuseCmp() const;		bool canMacroFuseCmp() const;

▲ Show 20 Lines • Show All 1,025 Lines • ▼ Show 20 Lines	public:
virtual bool isLegalICmpImmediate(int64_t Imm) = 0;		virtual bool isLegalICmpImmediate(int64_t Imm) = 0;
virtual bool isLegalAddressingMode(Type Ty, GlobalValue BaseGV,		virtual bool isLegalAddressingMode(Type Ty, GlobalValue BaseGV,
int64_t BaseOffset, bool HasBaseReg,		int64_t BaseOffset, bool HasBaseReg,
int64_t Scale, unsigned AddrSpace,		int64_t Scale, unsigned AddrSpace,
Instruction *I) = 0;		Instruction *I) = 0;
virtual bool isLSRCostLess(const TargetTransformInfo::LSRCost &C1,		virtual bool isLSRCostLess(const TargetTransformInfo::LSRCost &C1,
const TargetTransformInfo::LSRCost &C2) = 0;		const TargetTransformInfo::LSRCost &C2) = 0;
virtual bool isNumRegsMajorCostOfLSR() = 0;		virtual bool isNumRegsMajorCostOfLSR() = 0;
		virtual bool isAllowTerminatingConditionFoldingAfterLSR() const = 0;
virtual bool isProfitableLSRChainElement(Instruction *I) = 0;		virtual bool isProfitableLSRChainElement(Instruction *I) = 0;
virtual bool canMacroFuseCmp() = 0;		virtual bool canMacroFuseCmp() = 0;
virtual bool canSaveCmp(Loop L, BranchInst BI, ScalarEvolution SE,		virtual bool canSaveCmp(Loop L, BranchInst BI, ScalarEvolution SE,
LoopInfo LI, DominatorTree DT, AssumptionCache *AC,		LoopInfo LI, DominatorTree DT, AssumptionCache *AC,
TargetLibraryInfo *LibInfo) = 0;		TargetLibraryInfo *LibInfo) = 0;
virtual AddressingModeKind		virtual AddressingModeKind
getPreferredAddressingMode(const Loop L, ScalarEvolution SE) const = 0;		getPreferredAddressingMode(const Loop L, ScalarEvolution SE) const = 0;
virtual bool isLegalMaskedStore(Type *DataType, Align Alignment) = 0;		virtual bool isLegalMaskedStore(Type *DataType, Align Alignment) = 0;
▲ Show 20 Lines • Show All 414 Lines • ▼ Show 20 Lines	public:
}		}
bool isLSRCostLess(const TargetTransformInfo::LSRCost &C1,		bool isLSRCostLess(const TargetTransformInfo::LSRCost &C1,
const TargetTransformInfo::LSRCost &C2) override {		const TargetTransformInfo::LSRCost &C2) override {
return Impl.isLSRCostLess(C1, C2);		return Impl.isLSRCostLess(C1, C2);
}		}
bool isNumRegsMajorCostOfLSR() override {		bool isNumRegsMajorCostOfLSR() override {
return Impl.isNumRegsMajorCostOfLSR();		return Impl.isNumRegsMajorCostOfLSR();
}		}
		bool isAllowTerminatingConditionFoldingAfterLSR() const override {
		return Impl.isAllowTerminatingConditionFoldingAfterLSR();
		}
bool isProfitableLSRChainElement(Instruction *I) override {		bool isProfitableLSRChainElement(Instruction *I) override {
return Impl.isProfitableLSRChainElement(I);		return Impl.isProfitableLSRChainElement(I);
}		}
bool canMacroFuseCmp() override { return Impl.canMacroFuseCmp(); }		bool canMacroFuseCmp() override { return Impl.canMacroFuseCmp(); }
bool canSaveCmp(Loop L, BranchInst BI, ScalarEvolution SE, LoopInfo *LI,		bool canSaveCmp(Loop L, BranchInst BI, ScalarEvolution SE, LoopInfo *LI,
DominatorTree DT, AssumptionCache AC,		DominatorTree DT, AssumptionCache AC,
TargetLibraryInfo *LibInfo) override {		TargetLibraryInfo *LibInfo) override {
return Impl.canSaveCmp(L, BI, SE, LI, DT, AC, LibInfo);		return Impl.canSaveCmp(L, BI, SE, LI, DT, AC, LibInfo);
▲ Show 20 Lines • Show All 635 Lines • Show Last 20 Lines

llvm/include/llvm/Analysis/TargetTransformInfoImpl.h

Show First 20 Lines • Show All 214 Lines • ▼ Show 20 Lines	bool isLSRCostLess(const TTI::LSRCost &C1, const TTI::LSRCost &C2) const {
return std::tie(C1.NumRegs, C1.AddRecCost, C1.NumIVMuls, C1.NumBaseAdds,		return std::tie(C1.NumRegs, C1.AddRecCost, C1.NumIVMuls, C1.NumBaseAdds,
C1.ScaleCost, C1.ImmCost, C1.SetupCost) <		C1.ScaleCost, C1.ImmCost, C1.SetupCost) <
std::tie(C2.NumRegs, C2.AddRecCost, C2.NumIVMuls, C2.NumBaseAdds,		std::tie(C2.NumRegs, C2.AddRecCost, C2.NumIVMuls, C2.NumBaseAdds,
C2.ScaleCost, C2.ImmCost, C2.SetupCost);		C2.ScaleCost, C2.ImmCost, C2.SetupCost);
}		}

bool isNumRegsMajorCostOfLSR() const { return true; }		bool isNumRegsMajorCostOfLSR() const { return true; }

		bool isAllowTerminatingConditionFoldingAfterLSR() const { return false; }

bool isProfitableLSRChainElement(Instruction *I) const { return false; }		bool isProfitableLSRChainElement(Instruction *I) const { return false; }

bool canMacroFuseCmp() const { return false; }		bool canMacroFuseCmp() const { return false; }

bool canSaveCmp(Loop L, BranchInst BI, ScalarEvolution SE, LoopInfo *LI,		bool canSaveCmp(Loop L, BranchInst BI, ScalarEvolution SE, LoopInfo *LI,
DominatorTree DT, AssumptionCache AC,		DominatorTree DT, AssumptionCache AC,
TargetLibraryInfo *LibInfo) const {		TargetLibraryInfo *LibInfo) const {
return false;		return false;
▲ Show 20 Lines • Show All 1,125 Lines • Show Last 20 Lines

llvm/include/llvm/CodeGen/BasicTTIImpl.h

Show First 20 Lines • Show All 372 Lines • ▼ Show 20 Lines	public:
bool isLSRCostLess(TTI::LSRCost C1, TTI::LSRCost C2) {		bool isLSRCostLess(TTI::LSRCost C1, TTI::LSRCost C2) {
return TargetTransformInfoImplBase::isLSRCostLess(C1, C2);		return TargetTransformInfoImplBase::isLSRCostLess(C1, C2);
}		}

bool isNumRegsMajorCostOfLSR() {		bool isNumRegsMajorCostOfLSR() {
return TargetTransformInfoImplBase::isNumRegsMajorCostOfLSR();		return TargetTransformInfoImplBase::isNumRegsMajorCostOfLSR();
}		}

		bool isAllowTerminatingConditionFoldingAfterLSR() const {
		return TargetTransformInfoImplBase::
		isAllowTerminatingConditionFoldingAfterLSR();
		}

bool isProfitableLSRChainElement(Instruction *I) {		bool isProfitableLSRChainElement(Instruction *I) {
return TargetTransformInfoImplBase::isProfitableLSRChainElement(I);		return TargetTransformInfoImplBase::isProfitableLSRChainElement(I);
}		}

InstructionCost getScalingFactorCost(Type Ty, GlobalValue BaseGV,		InstructionCost getScalingFactorCost(Type Ty, GlobalValue BaseGV,
int64_t BaseOffset, bool HasBaseReg,		int64_t BaseOffset, bool HasBaseReg,
int64_t Scale, unsigned AddrSpace) {		int64_t Scale, unsigned AddrSpace) {
TargetLoweringBase::AddrMode AM;		TargetLoweringBase::AddrMode AM;
▲ Show 20 Lines • Show All 2,080 Lines • Show Last 20 Lines

llvm/lib/Analysis/TargetTransformInfo.cpp

Show First 20 Lines • Show All 387 Lines • ▼ Show 20 Lines	bool TargetTransformInfo::isLSRCostLess(const LSRCost &C1,
const LSRCost &C2) const {		const LSRCost &C2) const {
return TTIImpl->isLSRCostLess(C1, C2);		return TTIImpl->isLSRCostLess(C1, C2);
}		}

bool TargetTransformInfo::isNumRegsMajorCostOfLSR() const {		bool TargetTransformInfo::isNumRegsMajorCostOfLSR() const {
return TTIImpl->isNumRegsMajorCostOfLSR();		return TTIImpl->isNumRegsMajorCostOfLSR();
}		}

		bool TargetTransformInfo::isAllowTerminatingConditionFoldingAfterLSR() const {
		return TTIImpl->isAllowTerminatingConditionFoldingAfterLSR();
		}

bool TargetTransformInfo::isProfitableLSRChainElement(Instruction *I) const {		bool TargetTransformInfo::isProfitableLSRChainElement(Instruction *I) const {
return TTIImpl->isProfitableLSRChainElement(I);		return TTIImpl->isProfitableLSRChainElement(I);
}		}

bool TargetTransformInfo::canMacroFuseCmp() const {		bool TargetTransformInfo::canMacroFuseCmp() const {
return TTIImpl->canMacroFuseCmp();		return TTIImpl->canMacroFuseCmp();
}		}

▲ Show 20 Lines • Show All 872 Lines • Show Last 20 Lines

llvm/lib/Target/RISCV/RISCVTargetTransformInfo.h

Show First 20 Lines • Show All 351 Lines • ▼ Show 20 Lines	const char *getRegisterClassName(unsigned ClassID) const {
case RISCVRegisterClass::VRRC:		case RISCVRegisterClass::VRRC:
return "RISCV::VRRC";		return "RISCV::VRRC";
}		}
llvm_unreachable("unknown register class");		llvm_unreachable("unknown register class");
}		}

bool isLSRCostLess(const TargetTransformInfo::LSRCost &C1,		bool isLSRCostLess(const TargetTransformInfo::LSRCost &C1,
const TargetTransformInfo::LSRCost &C2);		const TargetTransformInfo::LSRCost &C2);

		bool isAllowTerminatingConditionFoldingAfterLSR() const;
};		};

} // end namespace llvm		} // end namespace llvm

#endif // LLVM_LIB_TARGET_RISCV_RISCVTARGETTRANSFORMINFO_H		#endif // LLVM_LIB_TARGET_RISCV_RISCVTARGETTRANSFORMINFO_H

llvm/lib/Target/RISCV/RISCVTargetTransformInfo.cpp

Show First 20 Lines • Show All 1,750 Lines • ▼ Show 20 Lines	bool RISCVTTIImpl::isLSRCostLess(const TargetTransformInfo::LSRCost &C1,
// RISC-V specific here are "instruction number 1st priority".		// RISC-V specific here are "instruction number 1st priority".
return std::tie(C1.Insns, C1.NumRegs, C1.AddRecCost,		return std::tie(C1.Insns, C1.NumRegs, C1.AddRecCost,
C1.NumIVMuls, C1.NumBaseAdds,		C1.NumIVMuls, C1.NumBaseAdds,
C1.ScaleCost, C1.ImmCost, C1.SetupCost) <		C1.ScaleCost, C1.ImmCost, C1.SetupCost) <
std::tie(C2.Insns, C2.NumRegs, C2.AddRecCost,		std::tie(C2.Insns, C2.NumRegs, C2.AddRecCost,
C2.NumIVMuls, C2.NumBaseAdds,		C2.NumIVMuls, C2.NumBaseAdds,
C2.ScaleCost, C2.ImmCost, C2.SetupCost);		C2.ScaleCost, C2.ImmCost, C2.SetupCost);
}		}

		bool RISCVTTIImpl::isAllowTerminatingConditionFoldingAfterLSR() const {
		return true;
		}

llvm/lib/Transforms/Scalar/LoopStrengthReduce.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 6,902 Lines • ▼ Show 20 Lines	if (L->isRecursivelyLCSSAForm(DT, LI) && L->getExitBlock()) {
if (Rewrites) {		if (Rewrites) {
Changed = true;		Changed = true;
RecursivelyDeleteTriviallyDeadInstructionsPermissive(DeadInsts, &TLI,		RecursivelyDeleteTriviallyDeadInstructionsPermissive(DeadInsts, &TLI,
MSSAU.get());		MSSAU.get());
DeleteDeadPHIs(L->getHeader(), &TLI, MSSAU.get());		DeleteDeadPHIs(L->getHeader(), &TLI, MSSAU.get());
}		}
}		}

if (AllowTerminatingConditionFoldingAfterLSR) {		if (AllowTerminatingConditionFoldingAfterLSR \|\|
		TTI.isAllowTerminatingConditionFoldingAfterLSR()) {
if (auto Opt = canFoldTermCondOfLoop(L, SE, DT, LI)) {		if (auto Opt = canFoldTermCondOfLoop(L, SE, DT, LI)) {
auto [ToFold, ToHelpFold, TermValueS, MustDrop] = *Opt;		auto [ToFold, ToHelpFold, TermValueS, MustDrop] = *Opt;

Changed = true;		Changed = true;
NumTermFold++;		NumTermFold++;

BasicBlock *LoopPreheader = L->getLoopPreheader();		BasicBlock *LoopPreheader = L->getLoopPreheader();
BasicBlock *LoopLatch = L->getLoopLatch();		BasicBlock *LoopLatch = L->getLoopLatch();
▲ Show 20 Lines • Show All 126 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/branch-on-zero.ll

Show First 20 Lines • Show All 114 Lines • ▼ Show 20 Lines	for.end: ; preds = %for.body, %entry
%c.0.lcssa = phi i32 [ 0, %entry ], [ %add, %for.body ]		%c.0.lcssa = phi i32 [ 0, %entry ], [ %add, %for.body ]
ret i32 %c.0.lcssa		ret i32 %c.0.lcssa
}		}

define i32 @test_lshr2(ptr nocapture %x, ptr nocapture readonly %y, i32 %n) {		define i32 @test_lshr2(ptr nocapture %x, ptr nocapture readonly %y, i32 %n) {
; RV32-LABEL: test_lshr2:		; RV32-LABEL: test_lshr2:
; RV32: # %bb.0: # %entry		; RV32: # %bb.0: # %entry
; RV32-NEXT: srli a2, a2, 2		; RV32-NEXT: srli a2, a2, 2
; RV32-NEXT: beqz a2, .LBB3_2		; RV32-NEXT: beqz a2, .LBB3_3
; RV32-NEXT: .LBB3_1: # %while.body		; RV32-NEXT: # %bb.1: # %while.body.preheader
		; RV32-NEXT: slli a2, a2, 2
		; RV32-NEXT: add a2, a1, a2
		; RV32-NEXT: .LBB3_2: # %while.body
; RV32-NEXT: # =>This Inner Loop Header: Depth=1		; RV32-NEXT: # =>This Inner Loop Header: Depth=1
; RV32-NEXT: lw a3, 0(a1)		; RV32-NEXT: lw a3, 0(a1)
; RV32-NEXT: addi a1, a1, 4		; RV32-NEXT: addi a4, a1, 4
; RV32-NEXT: slli a3, a3, 1		; RV32-NEXT: slli a3, a3, 1
; RV32-NEXT: addi a4, a0, 4		; RV32-NEXT: addi a1, a0, 4
; RV32-NEXT: addi a2, a2, -1
; RV32-NEXT: sw a3, 0(a0)		; RV32-NEXT: sw a3, 0(a0)
; RV32-NEXT: mv a0, a4		; RV32-NEXT: mv a0, a1
; RV32-NEXT: bnez a2, .LBB3_1		; RV32-NEXT: mv a1, a4
; RV32-NEXT: .LBB3_2: # %while.end		; RV32-NEXT: bne a4, a2, .LBB3_2
		; RV32-NEXT: .LBB3_3: # %while.end
; RV32-NEXT: li a0, 0		; RV32-NEXT: li a0, 0
; RV32-NEXT: ret		; RV32-NEXT: ret
;		;
; RV64-LABEL: test_lshr2:		; RV64-LABEL: test_lshr2:
; RV64: # %bb.0: # %entry		; RV64: # %bb.0: # %entry
; RV64-NEXT: srliw a2, a2, 2		; RV64-NEXT: srliw a2, a2, 2
; RV64-NEXT: beqz a2, .LBB3_2		; RV64-NEXT: beqz a2, .LBB3_3
; RV64-NEXT: .LBB3_1: # %while.body		; RV64-NEXT: # %bb.1: # %while.body.preheader
		; RV64-NEXT: addiw a2, a2, -1
		; RV64-NEXT: slli a2, a2, 32
		; RV64-NEXT: srli a2, a2, 30
		; RV64-NEXT: add a2, a2, a1
		; RV64-NEXT: addi a2, a2, 4
		; RV64-NEXT: .LBB3_2: # %while.body
; RV64-NEXT: # =>This Inner Loop Header: Depth=1		; RV64-NEXT: # =>This Inner Loop Header: Depth=1
; RV64-NEXT: lw a3, 0(a1)		; RV64-NEXT: lw a3, 0(a1)
; RV64-NEXT: addi a1, a1, 4		; RV64-NEXT: addi a4, a1, 4
; RV64-NEXT: slli a3, a3, 1		; RV64-NEXT: slli a3, a3, 1
; RV64-NEXT: addi a4, a0, 4		; RV64-NEXT: addi a1, a0, 4
; RV64-NEXT: addiw a2, a2, -1
; RV64-NEXT: sw a3, 0(a0)		; RV64-NEXT: sw a3, 0(a0)
; RV64-NEXT: mv a0, a4		; RV64-NEXT: mv a0, a1
; RV64-NEXT: bnez a2, .LBB3_1		; RV64-NEXT: mv a1, a4
; RV64-NEXT: .LBB3_2: # %while.end		; RV64-NEXT: bne a4, a2, .LBB3_2
		; RV64-NEXT: .LBB3_3: # %while.end
; RV64-NEXT: li a0, 0		; RV64-NEXT: li a0, 0
; RV64-NEXT: ret		; RV64-NEXT: ret
entry:		entry:
%tobool.not4 = icmp ult i32 %n, 4		%tobool.not4 = icmp ult i32 %n, 4
br i1 %tobool.not4, label %while.end, label %while.body.preheader		br i1 %tobool.not4, label %while.end, label %while.body.preheader

while.body.preheader: ; preds = %entry		while.body.preheader: ; preds = %entry
%shr = lshr i32 %n, 2		%shr = lshr i32 %n, 2
Show All 18 Lines

llvm/test/CodeGen/RISCV/riscv-codegenprepare-asm.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc < %s -mtriple=riscv64 \| FileCheck %s			; RUN: llc < %s -mtriple=riscv64 \| FileCheck %s


	; Make sure we don't emit a pair of shift for the zext in the preheader. We			; Make sure we don't emit a pair of shift for the zext in the preheader. We
	; can tell that bit 31 is 0 in the preheader and rely on %n already being			; can tell that bit 31 is 0 in the preheader and rely on %n already being
	; sign extended without adding zeros explicitly.			; sign extended without adding zeros explicitly.
	define void @test1(ptr nocapture noundef %a, i32 noundef signext %n) {			define void @test1(ptr nocapture noundef %a, i32 noundef signext %n) {
	; CHECK-LABEL: test1:			; CHECK-LABEL: test1:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: blez a1, .LBB0_2			; CHECK-NEXT: blez a1, .LBB0_3
	; CHECK-NEXT: .LBB0_1: # %for.body			; CHECK-NEXT: # %bb.1: # %for.body.preheader
				; CHECK-NEXT: slli a1, a1, 2
				; CHECK-NEXT: add a1, a0, a1
				; CHECK-NEXT: .LBB0_2: # %for.body
	; CHECK-NEXT: # =>This Inner Loop Header: Depth=1			; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
	; CHECK-NEXT: lw a2, 0(a0)			; CHECK-NEXT: lw a2, 0(a0)
	; CHECK-NEXT: addiw a2, a2, 4			; CHECK-NEXT: addiw a2, a2, 4
	; CHECK-NEXT: sw a2, 0(a0)			; CHECK-NEXT: sw a2, 0(a0)
	; CHECK-NEXT: addi a1, a1, -1
	; CHECK-NEXT: addi a0, a0, 4			; CHECK-NEXT: addi a0, a0, 4
	; CHECK-NEXT: bnez a1, .LBB0_1			; CHECK-NEXT: bne a0, a1, .LBB0_2
	; CHECK-NEXT: .LBB0_2: # %for.cond.cleanup			; CHECK-NEXT: .LBB0_3: # %for.cond.cleanup
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	entry:			entry:
	%cmp3 = icmp sgt i32 %n, 0			%cmp3 = icmp sgt i32 %n, 0
	br i1 %cmp3, label %for.body.preheader, label %for.cond.cleanup			br i1 %cmp3, label %for.body.preheader, label %for.cond.cleanup

	for.body.preheader: ; preds = %entry			for.body.preheader: ; preds = %entry
	%wide.trip.count = zext i32 %n to i64			%wide.trip.count = zext i32 %n to i64
	br label %for.body			br label %for.body
	▲ Show 20 Lines • Show All 99 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/fixed-vector-strided-load-store-asm.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc < %s -mtriple=riscv64 -mattr=+m,+v -riscv-v-vector-bits-min=256 \| FileCheck %s --check-prefixes=CHECK,V			; RUN: llc < %s -mtriple=riscv64 -mattr=+m,+v -riscv-v-vector-bits-min=256 \| FileCheck %s --check-prefixes=CHECK,V
	; RUN: llc < %s -mtriple=riscv64 -mattr=+m,+f,+zve32f -riscv-v-vector-bits-min=256 \| FileCheck %s --check-prefixes=CHECK,ZVE32F			; RUN: llc < %s -mtriple=riscv64 -mattr=+m,+f,+zve32f -riscv-v-vector-bits-min=256 \| FileCheck %s --check-prefixes=CHECK,ZVE32F
	; RUN: llc < %s -mtriple=riscv64 -mattr=+m,+v,+no-optimized-zero-stride-load -riscv-v-vector-bits-min=256 \| FileCheck %s --check-prefixes=CHECK,NOT-OPTIMIZED			; RUN: llc < %s -mtriple=riscv64 -mattr=+m,+v,+no-optimized-zero-stride-load -riscv-v-vector-bits-min=256 \| FileCheck %s --check-prefixes=CHECK,NOT-OPTIMIZED
	; RUN: llc < %s -mtriple=riscv64 -mattr=+m,+f,+zve32f,+no-optimized-zero-stride-load -riscv-v-vector-bits-min=256 \| FileCheck %s --check-prefixes=CHECK,NOT-OPTIMIZED			; RUN: llc < %s -mtriple=riscv64 -mattr=+m,+f,+zve32f,+no-optimized-zero-stride-load -riscv-v-vector-bits-min=256 \| FileCheck %s --check-prefixes=CHECK,NOT-OPTIMIZED

	%struct.foo = type { i32, i32, i32, i32 }			%struct.foo = type { i32, i32, i32, i32 }

	; void gather(signed char * __restrict A, signed char * __restrict B) {			; void gather(signed char * __restrict A, signed char * __restrict B) {
	; for (int i = 0; i != 1024; ++i)			; for (int i = 0; i != 1024; ++i)
	; A[i] += B[i * 5];			; A[i] += B[i * 5];
	; }			; }
	define void @gather(ptr noalias nocapture %A, ptr noalias nocapture readonly %B) {			define void @gather(ptr noalias nocapture %A, ptr noalias nocapture readonly %B) {
	; CHECK-LABEL: gather:			; CHECK-LABEL: gather:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: li a2, 1024			; CHECK-NEXT: addi a2, a0, 1024
	; CHECK-NEXT: li a3, 32			; CHECK-NEXT: li a3, 32
	; CHECK-NEXT: li a4, 5			; CHECK-NEXT: li a4, 5
	; CHECK-NEXT: .LBB0_1: # %vector.body			; CHECK-NEXT: .LBB0_1: # %vector.body
	; CHECK-NEXT: # =>This Inner Loop Header: Depth=1			; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
	; CHECK-NEXT: vsetvli zero, a3, e8, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a3, e8, m1, ta, ma
	; CHECK-NEXT: vlse8.v v8, (a1), a4			; CHECK-NEXT: vlse8.v v8, (a1), a4
	; CHECK-NEXT: vle8.v v9, (a0)			; CHECK-NEXT: vle8.v v9, (a0)
	; CHECK-NEXT: vadd.vv v8, v9, v8			; CHECK-NEXT: vadd.vv v8, v9, v8
	; CHECK-NEXT: vse8.v v8, (a0)			; CHECK-NEXT: vse8.v v8, (a0)
	; CHECK-NEXT: addi a2, a2, -32
	; CHECK-NEXT: addi a0, a0, 32			; CHECK-NEXT: addi a0, a0, 32
	; CHECK-NEXT: addi a1, a1, 160			; CHECK-NEXT: addi a1, a1, 160
	; CHECK-NEXT: bnez a2, .LBB0_1			; CHECK-NEXT: bne a0, a2, .LBB0_1
	; CHECK-NEXT: # %bb.2: # %for.cond.cleanup			; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	entry:			entry:
	br label %vector.body			br label %vector.body

	vector.body: ; preds = %vector.body, %entry			vector.body: ; preds = %vector.body, %entry
	%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]			%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]
	%vec.ind = phi <32 x i64> [ <i64 0, i64 1, i64 2, i64 3, i64 4, i64 5, i64 6, i64 7, i64 8, i64 9, i64 10, i64 11, i64 12, i64 13, i64 14, i64 15, i64 16, i64 17, i64 18, i64 19, i64 20, i64 21, i64 22, i64 23, i64 24, i64 25, i64 26, i64 27, i64 28, i64 29, i64 30, i64 31>, %entry ], [ %vec.ind.next, %vector.body ]			%vec.ind = phi <32 x i64> [ <i64 0, i64 1, i64 2, i64 3, i64 4, i64 5, i64 6, i64 7, i64 8, i64 9, i64 10, i64 11, i64 12, i64 13, i64 14, i64 15, i64 16, i64 17, i64 18, i64 19, i64 20, i64 21, i64 22, i64 23, i64 24, i64 25, i64 26, i64 27, i64 28, i64 29, i64 30, i64 31>, %entry ], [ %vec.ind.next, %vector.body ]
	Show All 11 Lines

	for.cond.cleanup: ; preds = %vector.body			for.cond.cleanup: ; preds = %vector.body
	ret void			ret void
	}			}

	define void @gather_masked(ptr noalias nocapture %A, ptr noalias nocapture readonly %B, <32 x i8> %maskedoff) {			define void @gather_masked(ptr noalias nocapture %A, ptr noalias nocapture readonly %B, <32 x i8> %maskedoff) {
	; V-LABEL: gather_masked:			; V-LABEL: gather_masked:
	; V: # %bb.0: # %entry			; V: # %bb.0: # %entry
	; V-NEXT: li a2, 1024			; V-NEXT: addi a2, a0, 1024
	; V-NEXT: lui a3, 983765			; V-NEXT: lui a3, 983765
	; V-NEXT: addiw a3, a3, 873			; V-NEXT: addiw a3, a3, 873
	; V-NEXT: vsetivli zero, 1, e32, mf2, ta, ma			; V-NEXT: vsetivli zero, 1, e32, mf2, ta, ma
	; V-NEXT: vmv.s.x v0, a3			; V-NEXT: vmv.s.x v0, a3
	; V-NEXT: li a3, 32			; V-NEXT: li a3, 32
	; V-NEXT: li a4, 5			; V-NEXT: li a4, 5
	; V-NEXT: .LBB1_1: # %vector.body			; V-NEXT: .LBB1_1: # %vector.body
	; V-NEXT: # =>This Inner Loop Header: Depth=1			; V-NEXT: # =>This Inner Loop Header: Depth=1
	; V-NEXT: vsetvli zero, a3, e8, m1, ta, mu			; V-NEXT: vsetvli zero, a3, e8, m1, ta, mu
	; V-NEXT: vmv1r.v v9, v8			; V-NEXT: vmv1r.v v9, v8
	; V-NEXT: vlse8.v v9, (a1), a4, v0.t			; V-NEXT: vlse8.v v9, (a1), a4, v0.t
	; V-NEXT: vle8.v v10, (a0)			; V-NEXT: vle8.v v10, (a0)
	; V-NEXT: vadd.vv v9, v10, v9			; V-NEXT: vadd.vv v9, v10, v9
	; V-NEXT: vse8.v v9, (a0)			; V-NEXT: vse8.v v9, (a0)
	; V-NEXT: addi a2, a2, -32
	; V-NEXT: addi a0, a0, 32			; V-NEXT: addi a0, a0, 32
	; V-NEXT: addi a1, a1, 160			; V-NEXT: addi a1, a1, 160
	; V-NEXT: bnez a2, .LBB1_1			; V-NEXT: bne a0, a2, .LBB1_1
	; V-NEXT: # %bb.2: # %for.cond.cleanup			; V-NEXT: # %bb.2: # %for.cond.cleanup
	; V-NEXT: ret			; V-NEXT: ret
	;			;
	; ZVE32F-LABEL: gather_masked:			; ZVE32F-LABEL: gather_masked:
	; ZVE32F: # %bb.0: # %entry			; ZVE32F: # %bb.0: # %entry
	; ZVE32F-NEXT: li a2, 1024			; ZVE32F-NEXT: addi a2, a0, 1024
	; ZVE32F-NEXT: lui a3, 983765			; ZVE32F-NEXT: lui a3, 983765
	; ZVE32F-NEXT: addiw a3, a3, 873			; ZVE32F-NEXT: addiw a3, a3, 873
	; ZVE32F-NEXT: vsetivli zero, 1, e32, m1, ta, ma			; ZVE32F-NEXT: vsetivli zero, 1, e32, m1, ta, ma
	; ZVE32F-NEXT: vmv.s.x v0, a3			; ZVE32F-NEXT: vmv.s.x v0, a3
	; ZVE32F-NEXT: li a3, 32			; ZVE32F-NEXT: li a3, 32
	; ZVE32F-NEXT: li a4, 5			; ZVE32F-NEXT: li a4, 5
	; ZVE32F-NEXT: .LBB1_1: # %vector.body			; ZVE32F-NEXT: .LBB1_1: # %vector.body
	; ZVE32F-NEXT: # =>This Inner Loop Header: Depth=1			; ZVE32F-NEXT: # =>This Inner Loop Header: Depth=1
	; ZVE32F-NEXT: vsetvli zero, a3, e8, m1, ta, mu			; ZVE32F-NEXT: vsetvli zero, a3, e8, m1, ta, mu
	; ZVE32F-NEXT: vmv1r.v v9, v8			; ZVE32F-NEXT: vmv1r.v v9, v8
	; ZVE32F-NEXT: vlse8.v v9, (a1), a4, v0.t			; ZVE32F-NEXT: vlse8.v v9, (a1), a4, v0.t
	; ZVE32F-NEXT: vle8.v v10, (a0)			; ZVE32F-NEXT: vle8.v v10, (a0)
	; ZVE32F-NEXT: vadd.vv v9, v10, v9			; ZVE32F-NEXT: vadd.vv v9, v10, v9
	; ZVE32F-NEXT: vse8.v v9, (a0)			; ZVE32F-NEXT: vse8.v v9, (a0)
	; ZVE32F-NEXT: addi a2, a2, -32
	; ZVE32F-NEXT: addi a0, a0, 32			; ZVE32F-NEXT: addi a0, a0, 32
	; ZVE32F-NEXT: addi a1, a1, 160			; ZVE32F-NEXT: addi a1, a1, 160
	; ZVE32F-NEXT: bnez a2, .LBB1_1			; ZVE32F-NEXT: bne a0, a2, .LBB1_1
	; ZVE32F-NEXT: # %bb.2: # %for.cond.cleanup			; ZVE32F-NEXT: # %bb.2: # %for.cond.cleanup
	; ZVE32F-NEXT: ret			; ZVE32F-NEXT: ret
	entry:			entry:
	br label %vector.body			br label %vector.body

	vector.body: ; preds = %vector.body, %entry			vector.body: ; preds = %vector.body, %entry
	%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]			%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]
	%vec.ind = phi <32 x i64> [ <i64 0, i64 1, i64 2, i64 3, i64 4, i64 5, i64 6, i64 7, i64 8, i64 9, i64 10, i64 11, i64 12, i64 13, i64 14, i64 15, i64 16, i64 17, i64 18, i64 19, i64 20, i64 21, i64 22, i64 23, i64 24, i64 25, i64 26, i64 27, i64 28, i64 29, i64 30, i64 31>, %entry ], [ %vec.ind.next, %vector.body ]			%vec.ind = phi <32 x i64> [ <i64 0, i64 1, i64 2, i64 3, i64 4, i64 5, i64 6, i64 7, i64 8, i64 9, i64 10, i64 11, i64 12, i64 13, i64 14, i64 15, i64 16, i64 17, i64 18, i64 19, i64 20, i64 21, i64 22, i64 23, i64 24, i64 25, i64 26, i64 27, i64 28, i64 29, i64 30, i64 31>, %entry ], [ %vec.ind.next, %vector.body ]
	Show All 12 Lines
	for.cond.cleanup: ; preds = %vector.body			for.cond.cleanup: ; preds = %vector.body
	ret void			ret void
	}			}

	define void @gather_negative_stride(ptr noalias nocapture %A, ptr noalias nocapture readonly %B) {			define void @gather_negative_stride(ptr noalias nocapture %A, ptr noalias nocapture readonly %B) {
	; CHECK-LABEL: gather_negative_stride:			; CHECK-LABEL: gather_negative_stride:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: addi a1, a1, 155			; CHECK-NEXT: addi a1, a1, 155
	; CHECK-NEXT: li a2, 1024			; CHECK-NEXT: addi a2, a0, 1024
	; CHECK-NEXT: li a3, 32			; CHECK-NEXT: li a3, 32
	; CHECK-NEXT: li a4, -5			; CHECK-NEXT: li a4, -5
	; CHECK-NEXT: .LBB2_1: # %vector.body			; CHECK-NEXT: .LBB2_1: # %vector.body
	; CHECK-NEXT: # =>This Inner Loop Header: Depth=1			; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
	; CHECK-NEXT: vsetvli zero, a3, e8, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a3, e8, m1, ta, ma
	; CHECK-NEXT: vlse8.v v8, (a1), a4			; CHECK-NEXT: vlse8.v v8, (a1), a4
	; CHECK-NEXT: vle8.v v9, (a0)			; CHECK-NEXT: vle8.v v9, (a0)
	; CHECK-NEXT: vadd.vv v8, v9, v8			; CHECK-NEXT: vadd.vv v8, v9, v8
	; CHECK-NEXT: vse8.v v8, (a0)			; CHECK-NEXT: vse8.v v8, (a0)
	; CHECK-NEXT: addi a2, a2, -32
	; CHECK-NEXT: addi a0, a0, 32			; CHECK-NEXT: addi a0, a0, 32
	; CHECK-NEXT: addi a1, a1, 160			; CHECK-NEXT: addi a1, a1, 160
	; CHECK-NEXT: bnez a2, .LBB2_1			; CHECK-NEXT: bne a0, a2, .LBB2_1
	; CHECK-NEXT: # %bb.2: # %for.cond.cleanup			; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	entry:			entry:
	br label %vector.body			br label %vector.body

	vector.body: ; preds = %vector.body, %entry			vector.body: ; preds = %vector.body, %entry
	%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]			%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]
	%vec.ind = phi <32 x i64> [ <i64 31, i64 30, i64 29, i64 28, i64 27, i64 26, i64 25, i64 24, i64 23, i64 22, i64 21, i64 20, i64 19, i64 18, i64 17, i64 16, i64 15, i64 14, i64 13, i64 12, i64 11, i64 10, i64 9, i64 8, i64 7, i64 6, i64 5, i64 4, i64 3, i64 2, i64 1, i64 0>, %entry ], [ %vec.ind.next, %vector.body ]			%vec.ind = phi <32 x i64> [ <i64 31, i64 30, i64 29, i64 28, i64 27, i64 26, i64 25, i64 24, i64 23, i64 22, i64 21, i64 20, i64 19, i64 18, i64 17, i64 16, i64 15, i64 14, i64 13, i64 12, i64 11, i64 10, i64 9, i64 8, i64 7, i64 6, i64 5, i64 4, i64 3, i64 2, i64 1, i64 0>, %entry ], [ %vec.ind.next, %vector.body ]
	Show All 11 Lines

	for.cond.cleanup: ; preds = %vector.body			for.cond.cleanup: ; preds = %vector.body
	ret void			ret void
	}			}

	define void @gather_zero_stride(ptr noalias nocapture %A, ptr noalias nocapture readonly %B) {			define void @gather_zero_stride(ptr noalias nocapture %A, ptr noalias nocapture readonly %B) {
	; CHECK-LABEL: gather_zero_stride:			; CHECK-LABEL: gather_zero_stride:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: li a2, 1024			; CHECK-NEXT: addi a2, a0, 1024
	; CHECK-NEXT: li a3, 32			; CHECK-NEXT: li a3, 32
	; CHECK-NEXT: .LBB3_1: # %vector.body			; CHECK-NEXT: .LBB3_1: # %vector.body
	; CHECK-NEXT: # =>This Inner Loop Header: Depth=1			; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
	; CHECK-NEXT: lbu a4, 0(a1)			; CHECK-NEXT: lbu a4, 0(a1)
	; CHECK-NEXT: vsetvli zero, a3, e8, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a3, e8, m1, ta, ma
	; CHECK-NEXT: vle8.v v8, (a0)			; CHECK-NEXT: vle8.v v8, (a0)
	; CHECK-NEXT: vadd.vx v8, v8, a4			; CHECK-NEXT: vadd.vx v8, v8, a4
	; CHECK-NEXT: vse8.v v8, (a0)			; CHECK-NEXT: vse8.v v8, (a0)
	; CHECK-NEXT: addi a2, a2, -32
	; CHECK-NEXT: addi a0, a0, 32			; CHECK-NEXT: addi a0, a0, 32
	; CHECK-NEXT: addi a1, a1, 160			; CHECK-NEXT: addi a1, a1, 160
	; CHECK-NEXT: bnez a2, .LBB3_1			; CHECK-NEXT: bne a0, a2, .LBB3_1
	; CHECK-NEXT: # %bb.2: # %for.cond.cleanup			; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	entry:			entry:
	br label %vector.body			br label %vector.body

	vector.body: ; preds = %vector.body, %entry			vector.body: ; preds = %vector.body, %entry
	%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]			%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]
	%vec.ind = phi <32 x i64> [ zeroinitializer, %entry ], [ %vec.ind.next, %vector.body ]			%vec.ind = phi <32 x i64> [ zeroinitializer, %entry ], [ %vec.ind.next, %vector.body ]
	Show All 11 Lines

	for.cond.cleanup: ; preds = %vector.body			for.cond.cleanup: ; preds = %vector.body
	ret void			ret void
	}			}

	define void @gather_zero_stride_unfold(ptr noalias nocapture %A, ptr noalias nocapture readonly %B) {			define void @gather_zero_stride_unfold(ptr noalias nocapture %A, ptr noalias nocapture readonly %B) {
	; V-LABEL: gather_zero_stride_unfold:			; V-LABEL: gather_zero_stride_unfold:
	; V: # %bb.0: # %entry			; V: # %bb.0: # %entry
	; V-NEXT: li a2, 1024			; V-NEXT: addi a2, a0, 1024
	; V-NEXT: li a3, 32			; V-NEXT: li a3, 32
	; V-NEXT: .LBB4_1: # %vector.body			; V-NEXT: .LBB4_1: # %vector.body
	; V-NEXT: # =>This Inner Loop Header: Depth=1			; V-NEXT: # =>This Inner Loop Header: Depth=1
	; V-NEXT: vsetvli zero, a3, e8, m1, ta, ma			; V-NEXT: vsetvli zero, a3, e8, m1, ta, ma
	; V-NEXT: vlse8.v v8, (a1), zero			; V-NEXT: vlse8.v v8, (a1), zero
	; V-NEXT: vle8.v v9, (a0)			; V-NEXT: vle8.v v9, (a0)
	; V-NEXT: vdivu.vv v8, v8, v9			; V-NEXT: vdivu.vv v8, v8, v9
	; V-NEXT: vse8.v v8, (a0)			; V-NEXT: vse8.v v8, (a0)
	; V-NEXT: addi a2, a2, -32
	; V-NEXT: addi a0, a0, 32			; V-NEXT: addi a0, a0, 32
	; V-NEXT: addi a1, a1, 160			; V-NEXT: addi a1, a1, 160
	; V-NEXT: bnez a2, .LBB4_1			; V-NEXT: bne a0, a2, .LBB4_1
	; V-NEXT: # %bb.2: # %for.cond.cleanup			; V-NEXT: # %bb.2: # %for.cond.cleanup
	; V-NEXT: ret			; V-NEXT: ret
	;			;
	; ZVE32F-LABEL: gather_zero_stride_unfold:			; ZVE32F-LABEL: gather_zero_stride_unfold:
	; ZVE32F: # %bb.0: # %entry			; ZVE32F: # %bb.0: # %entry
	; ZVE32F-NEXT: li a2, 1024			; ZVE32F-NEXT: addi a2, a0, 1024
	; ZVE32F-NEXT: li a3, 32			; ZVE32F-NEXT: li a3, 32
	; ZVE32F-NEXT: .LBB4_1: # %vector.body			; ZVE32F-NEXT: .LBB4_1: # %vector.body
	; ZVE32F-NEXT: # =>This Inner Loop Header: Depth=1			; ZVE32F-NEXT: # =>This Inner Loop Header: Depth=1
	; ZVE32F-NEXT: vsetvli zero, a3, e8, m1, ta, ma			; ZVE32F-NEXT: vsetvli zero, a3, e8, m1, ta, ma
	; ZVE32F-NEXT: vlse8.v v8, (a1), zero			; ZVE32F-NEXT: vlse8.v v8, (a1), zero
	; ZVE32F-NEXT: vle8.v v9, (a0)			; ZVE32F-NEXT: vle8.v v9, (a0)
	; ZVE32F-NEXT: vdivu.vv v8, v8, v9			; ZVE32F-NEXT: vdivu.vv v8, v8, v9
	; ZVE32F-NEXT: vse8.v v8, (a0)			; ZVE32F-NEXT: vse8.v v8, (a0)
	; ZVE32F-NEXT: addi a2, a2, -32
	; ZVE32F-NEXT: addi a0, a0, 32			; ZVE32F-NEXT: addi a0, a0, 32
	; ZVE32F-NEXT: addi a1, a1, 160			; ZVE32F-NEXT: addi a1, a1, 160
	; ZVE32F-NEXT: bnez a2, .LBB4_1			; ZVE32F-NEXT: bne a0, a2, .LBB4_1
	; ZVE32F-NEXT: # %bb.2: # %for.cond.cleanup			; ZVE32F-NEXT: # %bb.2: # %for.cond.cleanup
	; ZVE32F-NEXT: ret			; ZVE32F-NEXT: ret
	;			;
	; NOT-OPTIMIZED-LABEL: gather_zero_stride_unfold:			; NOT-OPTIMIZED-LABEL: gather_zero_stride_unfold:
	; NOT-OPTIMIZED: # %bb.0: # %entry			; NOT-OPTIMIZED: # %bb.0: # %entry
	; NOT-OPTIMIZED-NEXT: li a2, 1024			; NOT-OPTIMIZED-NEXT: addi a2, a0, 1024
	; NOT-OPTIMIZED-NEXT: li a3, 32			; NOT-OPTIMIZED-NEXT: li a3, 32
	; NOT-OPTIMIZED-NEXT: .LBB4_1: # %vector.body			; NOT-OPTIMIZED-NEXT: .LBB4_1: # %vector.body
	; NOT-OPTIMIZED-NEXT: # =>This Inner Loop Header: Depth=1			; NOT-OPTIMIZED-NEXT: # =>This Inner Loop Header: Depth=1
	; NOT-OPTIMIZED-NEXT: lbu a4, 0(a1)			; NOT-OPTIMIZED-NEXT: lbu a4, 0(a1)
	; NOT-OPTIMIZED-NEXT: vsetvli zero, a3, e8, m1, ta, ma			; NOT-OPTIMIZED-NEXT: vsetvli zero, a3, e8, m1, ta, ma
	; NOT-OPTIMIZED-NEXT: vle8.v v8, (a0)			; NOT-OPTIMIZED-NEXT: vle8.v v8, (a0)
	; NOT-OPTIMIZED-NEXT: vmv.v.x v9, a4			; NOT-OPTIMIZED-NEXT: vmv.v.x v9, a4
	; NOT-OPTIMIZED-NEXT: vdivu.vv v8, v9, v8			; NOT-OPTIMIZED-NEXT: vdivu.vv v8, v9, v8
	; NOT-OPTIMIZED-NEXT: vse8.v v8, (a0)			; NOT-OPTIMIZED-NEXT: vse8.v v8, (a0)
	; NOT-OPTIMIZED-NEXT: addi a2, a2, -32
	; NOT-OPTIMIZED-NEXT: addi a0, a0, 32			; NOT-OPTIMIZED-NEXT: addi a0, a0, 32
	; NOT-OPTIMIZED-NEXT: addi a1, a1, 160			; NOT-OPTIMIZED-NEXT: addi a1, a1, 160
	; NOT-OPTIMIZED-NEXT: bnez a2, .LBB4_1			; NOT-OPTIMIZED-NEXT: bne a0, a2, .LBB4_1
	; NOT-OPTIMIZED-NEXT: # %bb.2: # %for.cond.cleanup			; NOT-OPTIMIZED-NEXT: # %bb.2: # %for.cond.cleanup
	; NOT-OPTIMIZED-NEXT: ret			; NOT-OPTIMIZED-NEXT: ret
	entry:			entry:
	br label %vector.body			br label %vector.body

	vector.body: ; preds = %vector.body, %entry			vector.body: ; preds = %vector.body, %entry
	%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]			%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]
	%vec.ind = phi <32 x i64> [ zeroinitializer, %entry ], [ %vec.ind.next, %vector.body ]			%vec.ind = phi <32 x i64> [ zeroinitializer, %entry ], [ %vec.ind.next, %vector.body ]
	Show All 15 Lines

	;void scatter(signed char * __restrict A, signed char * __restrict B) {			;void scatter(signed char * __restrict A, signed char * __restrict B) {
	; for (int i = 0; i < 1024; ++i)			; for (int i = 0; i < 1024; ++i)
	; A[i * 5] += B[i];			; A[i * 5] += B[i];
	;}			;}
	define void @scatter(ptr noalias nocapture %A, ptr noalias nocapture readonly %B) {			define void @scatter(ptr noalias nocapture %A, ptr noalias nocapture readonly %B) {
	; CHECK-LABEL: scatter:			; CHECK-LABEL: scatter:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: li a2, 1024			; CHECK-NEXT: addi a2, a1, 1024
	; CHECK-NEXT: li a3, 32			; CHECK-NEXT: li a3, 32
	; CHECK-NEXT: li a4, 5			; CHECK-NEXT: li a4, 5
	; CHECK-NEXT: .LBB5_1: # %vector.body			; CHECK-NEXT: .LBB5_1: # %vector.body
	; CHECK-NEXT: # =>This Inner Loop Header: Depth=1			; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
	; CHECK-NEXT: vsetvli zero, a3, e8, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a3, e8, m1, ta, ma
	; CHECK-NEXT: vle8.v v8, (a1)			; CHECK-NEXT: vle8.v v8, (a1)
	; CHECK-NEXT: vlse8.v v9, (a0), a4			; CHECK-NEXT: vlse8.v v9, (a0), a4
	; CHECK-NEXT: vadd.vv v8, v9, v8			; CHECK-NEXT: vadd.vv v8, v9, v8
	; CHECK-NEXT: vsse8.v v8, (a0), a4			; CHECK-NEXT: vsse8.v v8, (a0), a4
	; CHECK-NEXT: addi a2, a2, -32
	; CHECK-NEXT: addi a1, a1, 32			; CHECK-NEXT: addi a1, a1, 32
	; CHECK-NEXT: addi a0, a0, 160			; CHECK-NEXT: addi a0, a0, 160
	; CHECK-NEXT: bnez a2, .LBB5_1			; CHECK-NEXT: bne a1, a2, .LBB5_1
	; CHECK-NEXT: # %bb.2: # %for.cond.cleanup			; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	entry:			entry:
	br label %vector.body			br label %vector.body

	vector.body: ; preds = %vector.body, %entry			vector.body: ; preds = %vector.body, %entry
	%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]			%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]
	%vec.ind = phi <32 x i64> [ <i64 0, i64 1, i64 2, i64 3, i64 4, i64 5, i64 6, i64 7, i64 8, i64 9, i64 10, i64 11, i64 12, i64 13, i64 14, i64 15, i64 16, i64 17, i64 18, i64 19, i64 20, i64 21, i64 22, i64 23, i64 24, i64 25, i64 26, i64 27, i64 28, i64 29, i64 30, i64 31>, %entry ], [ %vec.ind.next, %vector.body ]			%vec.ind = phi <32 x i64> [ <i64 0, i64 1, i64 2, i64 3, i64 4, i64 5, i64 6, i64 7, i64 8, i64 9, i64 10, i64 11, i64 12, i64 13, i64 14, i64 15, i64 16, i64 17, i64 18, i64 19, i64 20, i64 21, i64 22, i64 23, i64 24, i64 25, i64 26, i64 27, i64 28, i64 29, i64 30, i64 31>, %entry ], [ %vec.ind.next, %vector.body ]
	Show All 11 Lines

	for.cond.cleanup: ; preds = %vector.body			for.cond.cleanup: ; preds = %vector.body
	ret void			ret void
	}			}

	define void @scatter_masked(ptr noalias nocapture %A, ptr noalias nocapture readonly %B, <32 x i8> %maskedoff) {			define void @scatter_masked(ptr noalias nocapture %A, ptr noalias nocapture readonly %B, <32 x i8> %maskedoff) {
	; V-LABEL: scatter_masked:			; V-LABEL: scatter_masked:
	; V: # %bb.0: # %entry			; V: # %bb.0: # %entry
	; V-NEXT: li a2, 1024			; V-NEXT: addi a2, a1, 1024
	; V-NEXT: li a3, 32			; V-NEXT: li a3, 32
	; V-NEXT: lui a4, 983765			; V-NEXT: lui a4, 983765
	; V-NEXT: addiw a4, a4, 873			; V-NEXT: addiw a4, a4, 873
	; V-NEXT: vsetivli zero, 1, e32, mf2, ta, ma			; V-NEXT: vsetivli zero, 1, e32, mf2, ta, ma
	; V-NEXT: vmv.s.x v0, a4			; V-NEXT: vmv.s.x v0, a4
	; V-NEXT: li a4, 5			; V-NEXT: li a4, 5
	; V-NEXT: .LBB6_1: # %vector.body			; V-NEXT: .LBB6_1: # %vector.body
	; V-NEXT: # =>This Inner Loop Header: Depth=1			; V-NEXT: # =>This Inner Loop Header: Depth=1
	; V-NEXT: vsetvli zero, a3, e8, m1, ta, mu			; V-NEXT: vsetvli zero, a3, e8, m1, ta, mu
	; V-NEXT: vle8.v v9, (a1)			; V-NEXT: vle8.v v9, (a1)
	; V-NEXT: vmv1r.v v10, v8			; V-NEXT: vmv1r.v v10, v8
	; V-NEXT: vlse8.v v10, (a0), a4, v0.t			; V-NEXT: vlse8.v v10, (a0), a4, v0.t
	; V-NEXT: vadd.vv v9, v10, v9			; V-NEXT: vadd.vv v9, v10, v9
	; V-NEXT: vsse8.v v9, (a0), a4, v0.t			; V-NEXT: vsse8.v v9, (a0), a4, v0.t
	; V-NEXT: addi a2, a2, -32
	; V-NEXT: addi a1, a1, 32			; V-NEXT: addi a1, a1, 32
	; V-NEXT: addi a0, a0, 160			; V-NEXT: addi a0, a0, 160
	; V-NEXT: bnez a2, .LBB6_1			; V-NEXT: bne a1, a2, .LBB6_1
	; V-NEXT: # %bb.2: # %for.cond.cleanup			; V-NEXT: # %bb.2: # %for.cond.cleanup
	; V-NEXT: ret			; V-NEXT: ret
	;			;
	; ZVE32F-LABEL: scatter_masked:			; ZVE32F-LABEL: scatter_masked:
	; ZVE32F: # %bb.0: # %entry			; ZVE32F: # %bb.0: # %entry
	; ZVE32F-NEXT: li a2, 1024			; ZVE32F-NEXT: addi a2, a1, 1024
	; ZVE32F-NEXT: li a3, 32			; ZVE32F-NEXT: li a3, 32
	; ZVE32F-NEXT: lui a4, 983765			; ZVE32F-NEXT: lui a4, 983765
	; ZVE32F-NEXT: addiw a4, a4, 873			; ZVE32F-NEXT: addiw a4, a4, 873
	; ZVE32F-NEXT: vsetivli zero, 1, e32, m1, ta, ma			; ZVE32F-NEXT: vsetivli zero, 1, e32, m1, ta, ma
	; ZVE32F-NEXT: vmv.s.x v0, a4			; ZVE32F-NEXT: vmv.s.x v0, a4
	; ZVE32F-NEXT: li a4, 5			; ZVE32F-NEXT: li a4, 5
	; ZVE32F-NEXT: .LBB6_1: # %vector.body			; ZVE32F-NEXT: .LBB6_1: # %vector.body
	; ZVE32F-NEXT: # =>This Inner Loop Header: Depth=1			; ZVE32F-NEXT: # =>This Inner Loop Header: Depth=1
	; ZVE32F-NEXT: vsetvli zero, a3, e8, m1, ta, mu			; ZVE32F-NEXT: vsetvli zero, a3, e8, m1, ta, mu
	; ZVE32F-NEXT: vle8.v v9, (a1)			; ZVE32F-NEXT: vle8.v v9, (a1)
	; ZVE32F-NEXT: vmv1r.v v10, v8			; ZVE32F-NEXT: vmv1r.v v10, v8
	; ZVE32F-NEXT: vlse8.v v10, (a0), a4, v0.t			; ZVE32F-NEXT: vlse8.v v10, (a0), a4, v0.t
	; ZVE32F-NEXT: vadd.vv v9, v10, v9			; ZVE32F-NEXT: vadd.vv v9, v10, v9
	; ZVE32F-NEXT: vsse8.v v9, (a0), a4, v0.t			; ZVE32F-NEXT: vsse8.v v9, (a0), a4, v0.t
	; ZVE32F-NEXT: addi a2, a2, -32
	; ZVE32F-NEXT: addi a1, a1, 32			; ZVE32F-NEXT: addi a1, a1, 32
	; ZVE32F-NEXT: addi a0, a0, 160			; ZVE32F-NEXT: addi a0, a0, 160
	; ZVE32F-NEXT: bnez a2, .LBB6_1			; ZVE32F-NEXT: bne a1, a2, .LBB6_1
	; ZVE32F-NEXT: # %bb.2: # %for.cond.cleanup			; ZVE32F-NEXT: # %bb.2: # %for.cond.cleanup
	; ZVE32F-NEXT: ret			; ZVE32F-NEXT: ret
	entry:			entry:
	br label %vector.body			br label %vector.body

	vector.body: ; preds = %vector.body, %entry			vector.body: ; preds = %vector.body, %entry
	%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]			%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]
	%vec.ind = phi <32 x i64> [ <i64 0, i64 1, i64 2, i64 3, i64 4, i64 5, i64 6, i64 7, i64 8, i64 9, i64 10, i64 11, i64 12, i64 13, i64 14, i64 15, i64 16, i64 17, i64 18, i64 19, i64 20, i64 21, i64 22, i64 23, i64 24, i64 25, i64 26, i64 27, i64 28, i64 29, i64 30, i64 31>, %entry ], [ %vec.ind.next, %vector.body ]			%vec.ind = phi <32 x i64> [ <i64 0, i64 1, i64 2, i64 3, i64 4, i64 5, i64 6, i64 7, i64 8, i64 9, i64 10, i64 11, i64 12, i64 13, i64 14, i64 15, i64 16, i64 17, i64 18, i64 19, i64 20, i64 21, i64 22, i64 23, i64 24, i64 25, i64 26, i64 27, i64 28, i64 29, i64 30, i64 31>, %entry ], [ %vec.ind.next, %vector.body ]
	Show All 15 Lines

	; void gather_pow2(signed char * __restrict A, signed char * __restrict B) {			; void gather_pow2(signed char * __restrict A, signed char * __restrict B) {
	; for (int i = 0; i != 1024; ++i)			; for (int i = 0; i != 1024; ++i)
	; A[i] += B[i * 4];			; A[i] += B[i * 4];
	; }			; }
	define void @gather_pow2(ptr noalias nocapture %A, ptr noalias nocapture readonly %B) {			define void @gather_pow2(ptr noalias nocapture %A, ptr noalias nocapture readonly %B) {
	; CHECK-LABEL: gather_pow2:			; CHECK-LABEL: gather_pow2:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: li a2, 1024			; CHECK-NEXT: lui a2, 1
				; CHECK-NEXT: add a2, a0, a2
	; CHECK-NEXT: li a3, 16			; CHECK-NEXT: li a3, 16
	; CHECK-NEXT: li a4, 32			; CHECK-NEXT: li a4, 32
	; CHECK-NEXT: .LBB7_1: # %vector.body			; CHECK-NEXT: .LBB7_1: # %vector.body
	; CHECK-NEXT: # =>This Inner Loop Header: Depth=1			; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
	; CHECK-NEXT: vsetivli zero, 8, e32, m1, ta, ma			; CHECK-NEXT: vsetivli zero, 8, e32, m1, ta, ma
	; CHECK-NEXT: vlse32.v v8, (a1), a3			; CHECK-NEXT: vlse32.v v8, (a1), a3
	; CHECK-NEXT: vsetvli zero, a4, e8, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a4, e8, m1, ta, ma
	; CHECK-NEXT: vle8.v v9, (a0)			; CHECK-NEXT: vle8.v v9, (a0)
	; CHECK-NEXT: vsetivli zero, 8, e32, m1, ta, ma			; CHECK-NEXT: vsetivli zero, 8, e32, m1, ta, ma
	; CHECK-NEXT: vadd.vv v8, v9, v8			; CHECK-NEXT: vadd.vv v8, v9, v8
	; CHECK-NEXT: vsetvli zero, a4, e8, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a4, e8, m1, ta, ma
	; CHECK-NEXT: vse8.v v8, (a0)			; CHECK-NEXT: vse8.v v8, (a0)
	; CHECK-NEXT: addi a2, a2, -8
	; CHECK-NEXT: addi a0, a0, 32			; CHECK-NEXT: addi a0, a0, 32
	; CHECK-NEXT: addi a1, a1, 128			; CHECK-NEXT: addi a1, a1, 128
	; CHECK-NEXT: bnez a2, .LBB7_1			; CHECK-NEXT: bne a0, a2, .LBB7_1
	; CHECK-NEXT: # %bb.2: # %for.cond.cleanup			; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	entry:			entry:
	br label %vector.body			br label %vector.body

	vector.body: ; preds = %vector.body, %entry			vector.body: ; preds = %vector.body, %entry
	%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]			%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]
	%vec.ind = phi <8 x i64> [ <i64 0, i64 1, i64 2, i64 3, i64 4, i64 5, i64 6, i64 7>, %entry ], [ %vec.ind.next, %vector.body ]			%vec.ind = phi <8 x i64> [ <i64 0, i64 1, i64 2, i64 3, i64 4, i64 5, i64 6, i64 7>, %entry ], [ %vec.ind.next, %vector.body ]
	Show All 15 Lines

	;void scatter_pow2(signed char * __restrict A, signed char * __restrict B) {			;void scatter_pow2(signed char * __restrict A, signed char * __restrict B) {
	; for (int i = 0; i < 1024; ++i)			; for (int i = 0; i < 1024; ++i)
	; A[i * 4] += B[i];			; A[i * 4] += B[i];
	;}			;}
	define void @scatter_pow2(ptr noalias nocapture %A, ptr noalias nocapture readonly %B) {			define void @scatter_pow2(ptr noalias nocapture %A, ptr noalias nocapture readonly %B) {
	; CHECK-LABEL: scatter_pow2:			; CHECK-LABEL: scatter_pow2:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: li a2, 1024			; CHECK-NEXT: lui a2, 1
				; CHECK-NEXT: add a2, a1, a2
	; CHECK-NEXT: li a3, 32			; CHECK-NEXT: li a3, 32
	; CHECK-NEXT: li a4, 16			; CHECK-NEXT: li a4, 16
	; CHECK-NEXT: .LBB8_1: # %vector.body			; CHECK-NEXT: .LBB8_1: # %vector.body
	; CHECK-NEXT: # =>This Inner Loop Header: Depth=1			; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
	; CHECK-NEXT: vsetvli zero, a3, e8, m1, ta, ma			; CHECK-NEXT: vsetvli zero, a3, e8, m1, ta, ma
	; CHECK-NEXT: vle8.v v8, (a1)			; CHECK-NEXT: vle8.v v8, (a1)
	; CHECK-NEXT: vsetivli zero, 8, e32, m1, ta, ma			; CHECK-NEXT: vsetivli zero, 8, e32, m1, ta, ma
	; CHECK-NEXT: vlse32.v v9, (a0), a4			; CHECK-NEXT: vlse32.v v9, (a0), a4
	; CHECK-NEXT: vadd.vv v8, v9, v8			; CHECK-NEXT: vadd.vv v8, v9, v8
	; CHECK-NEXT: vsse32.v v8, (a0), a4			; CHECK-NEXT: vsse32.v v8, (a0), a4
	; CHECK-NEXT: addi a2, a2, -8
	; CHECK-NEXT: addi a1, a1, 32			; CHECK-NEXT: addi a1, a1, 32
	; CHECK-NEXT: addi a0, a0, 128			; CHECK-NEXT: addi a0, a0, 128
	; CHECK-NEXT: bnez a2, .LBB8_1			; CHECK-NEXT: bne a1, a2, .LBB8_1
	; CHECK-NEXT: # %bb.2: # %for.cond.cleanup			; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	entry:			entry:
	br label %vector.body			br label %vector.body

	vector.body: ; preds = %vector.body, %entry			vector.body: ; preds = %vector.body, %entry
	%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]			%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]
	%vec.ind = phi <8 x i64> [ <i64 0, i64 1, i64 2, i64 3, i64 4, i64 5, i64 6, i64 7>, %entry ], [ %vec.ind.next, %vector.body ]			%vec.ind = phi <8 x i64> [ <i64 0, i64 1, i64 2, i64 3, i64 4, i64 5, i64 6, i64 7>, %entry ], [ %vec.ind.next, %vector.body ]
	Show All 20 Lines
	;void struct_gather(int * __restrict A, struct foo * __restrict B) {			;void struct_gather(int * __restrict A, struct foo * __restrict B) {
	; for (int i = 0; i < 1024; ++i)			; for (int i = 0; i < 1024; ++i)
	; A[i] += B[i].b;			; A[i] += B[i].b;
	;}			;}
	define void @struct_gather(ptr noalias nocapture %A, ptr noalias nocapture readonly %B) {			define void @struct_gather(ptr noalias nocapture %A, ptr noalias nocapture readonly %B) {
	; CHECK-LABEL: struct_gather:			; CHECK-LABEL: struct_gather:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: addi a1, a1, 132			; CHECK-NEXT: addi a1, a1, 132
	; CHECK-NEXT: li a2, 1024			; CHECK-NEXT: lui a2, 1
				; CHECK-NEXT: add a2, a0, a2
	; CHECK-NEXT: li a3, 16			; CHECK-NEXT: li a3, 16
	; CHECK-NEXT: vsetivli zero, 8, e32, m1, ta, ma			; CHECK-NEXT: vsetivli zero, 8, e32, m1, ta, ma
	; CHECK-NEXT: .LBB9_1: # %vector.body			; CHECK-NEXT: .LBB9_1: # %vector.body
	; CHECK-NEXT: # =>This Inner Loop Header: Depth=1			; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
	; CHECK-NEXT: addi a4, a0, 32			; CHECK-NEXT: addi a4, a0, 32
	; CHECK-NEXT: addi a5, a1, -128			; CHECK-NEXT: addi a5, a1, -128
	; CHECK-NEXT: vlse32.v v8, (a5), a3			; CHECK-NEXT: vlse32.v v8, (a5), a3
	; CHECK-NEXT: vlse32.v v9, (a1), a3			; CHECK-NEXT: vlse32.v v9, (a1), a3
	; CHECK-NEXT: vle32.v v10, (a0)			; CHECK-NEXT: vle32.v v10, (a0)
	; CHECK-NEXT: vle32.v v11, (a4)			; CHECK-NEXT: vle32.v v11, (a4)
	; CHECK-NEXT: vadd.vv v8, v10, v8			; CHECK-NEXT: vadd.vv v8, v10, v8
	; CHECK-NEXT: vadd.vv v9, v11, v9			; CHECK-NEXT: vadd.vv v9, v11, v9
	; CHECK-NEXT: vse32.v v8, (a0)			; CHECK-NEXT: vse32.v v8, (a0)
	; CHECK-NEXT: vse32.v v9, (a4)			; CHECK-NEXT: vse32.v v9, (a4)
	; CHECK-NEXT: addi a2, a2, -16
	; CHECK-NEXT: addi a0, a0, 64			; CHECK-NEXT: addi a0, a0, 64
	; CHECK-NEXT: addi a1, a1, 256			; CHECK-NEXT: addi a1, a1, 256
	; CHECK-NEXT: bnez a2, .LBB9_1			; CHECK-NEXT: bne a0, a2, .LBB9_1
	; CHECK-NEXT: # %bb.2: # %for.cond.cleanup			; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	entry:			entry:
	br label %vector.body			br label %vector.body

	vector.body: ; preds = %vector.body, %entry			vector.body: ; preds = %vector.body, %entry
	%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]			%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]
	%vec.ind = phi <8 x i64> [ <i64 0, i64 1, i64 2, i64 3, i64 4, i64 5, i64 6, i64 7>, %entry ], [ %vec.ind.next, %vector.body ]			%vec.ind = phi <8 x i64> [ <i64 0, i64 1, i64 2, i64 3, i64 4, i64 5, i64 6, i64 7>, %entry ], [ %vec.ind.next, %vector.body ]
	▲ Show 20 Lines • Show All 114 Lines • ▼ Show 20 Lines
	declare <8 x i32> @llvm.masked.gather.v8i32.v8p0(<8 x ptr>, i32 immarg, <8 x i1>, <8 x i32>)			declare <8 x i32> @llvm.masked.gather.v8i32.v8p0(<8 x ptr>, i32 immarg, <8 x i1>, <8 x i32>)
	declare void @llvm.masked.scatter.v32i8.v32p0(<32 x i8>, <32 x ptr>, i32 immarg, <32 x i1>)			declare void @llvm.masked.scatter.v32i8.v32p0(<32 x i8>, <32 x ptr>, i32 immarg, <32 x i1>)
	declare void @llvm.masked.scatter.v8i32.v8p0(<8 x i32>, <8 x ptr>, i32 immarg, <8 x i1>)			declare void @llvm.masked.scatter.v8i32.v8p0(<8 x i32>, <8 x ptr>, i32 immarg, <8 x i1>)

	; Make sure we don't crash in getTgtMemIntrinsic for a vector of pointers.			; Make sure we don't crash in getTgtMemIntrinsic for a vector of pointers.
	define void @gather_of_pointers(ptr noalias nocapture %arg, ptr noalias nocapture readonly %arg1) {			define void @gather_of_pointers(ptr noalias nocapture %arg, ptr noalias nocapture readonly %arg1) {
	; V-LABEL: gather_of_pointers:			; V-LABEL: gather_of_pointers:
	; V: # %bb.0: # %bb			; V: # %bb.0: # %bb
	; V-NEXT: li a2, 1024			; V-NEXT: lui a2, 2
				; V-NEXT: add a2, a0, a2
	; V-NEXT: li a3, 40			; V-NEXT: li a3, 40
	; V-NEXT: vsetivli zero, 2, e64, m1, ta, ma			; V-NEXT: vsetivli zero, 2, e64, m1, ta, ma
	; V-NEXT: .LBB11_1: # %bb2			; V-NEXT: .LBB11_1: # %bb2
	; V-NEXT: # =>This Inner Loop Header: Depth=1			; V-NEXT: # =>This Inner Loop Header: Depth=1
	; V-NEXT: addi a4, a1, 80			; V-NEXT: addi a4, a1, 80
	; V-NEXT: vlse64.v v8, (a1), a3			; V-NEXT: vlse64.v v8, (a1), a3
	; V-NEXT: vlse64.v v9, (a4), a3			; V-NEXT: vlse64.v v9, (a4), a3
	; V-NEXT: addi a4, a0, 16			; V-NEXT: addi a4, a0, 16
	; V-NEXT: vse64.v v8, (a0)			; V-NEXT: vse64.v v8, (a0)
	; V-NEXT: vse64.v v9, (a4)			; V-NEXT: vse64.v v9, (a4)
	; V-NEXT: addi a2, a2, -4
	; V-NEXT: addi a0, a0, 32			; V-NEXT: addi a0, a0, 32
	; V-NEXT: addi a1, a1, 160			; V-NEXT: addi a1, a1, 160
	; V-NEXT: bnez a2, .LBB11_1			; V-NEXT: bne a0, a2, .LBB11_1
	; V-NEXT: # %bb.2: # %bb18			; V-NEXT: # %bb.2: # %bb18
	; V-NEXT: ret			; V-NEXT: ret
	;			;
	; ZVE32F-LABEL: gather_of_pointers:			; ZVE32F-LABEL: gather_of_pointers:
	; ZVE32F: # %bb.0: # %bb			; ZVE32F: # %bb.0: # %bb
	; ZVE32F-NEXT: li a2, 0			; ZVE32F-NEXT: li a2, 0
	; ZVE32F-NEXT: li a3, 1			; ZVE32F-NEXT: lui a3, 2
	; ZVE32F-NEXT: li a4, 1024			; ZVE32F-NEXT: add a3, a0, a3
				; ZVE32F-NEXT: li a4, 1
	; ZVE32F-NEXT: li a5, 40			; ZVE32F-NEXT: li a5, 40
	; ZVE32F-NEXT: .LBB11_1: # %bb2			; ZVE32F-NEXT: .LBB11_1: # %bb2
	; ZVE32F-NEXT: # =>This Inner Loop Header: Depth=1			; ZVE32F-NEXT: # =>This Inner Loop Header: Depth=1
	; ZVE32F-NEXT: mul a6, a3, a5			; ZVE32F-NEXT: mul a6, a4, a5
	; ZVE32F-NEXT: add a6, a1, a6			; ZVE32F-NEXT: add a6, a1, a6
	; ZVE32F-NEXT: mul a7, a2, a5			; ZVE32F-NEXT: mul a7, a2, a5
	; ZVE32F-NEXT: add a7, a1, a7			; ZVE32F-NEXT: add a7, a1, a7
	; ZVE32F-NEXT: ld t0, 0(a6)			; ZVE32F-NEXT: ld t0, 0(a6)
	; ZVE32F-NEXT: ld t1, 0(a7)			; ZVE32F-NEXT: ld t1, 0(a7)
	; ZVE32F-NEXT: ld a6, 80(a6)			; ZVE32F-NEXT: ld a6, 80(a6)
	; ZVE32F-NEXT: ld a7, 80(a7)			; ZVE32F-NEXT: ld a7, 80(a7)
	; ZVE32F-NEXT: sd t0, 8(a0)			; ZVE32F-NEXT: sd t0, 8(a0)
	; ZVE32F-NEXT: sd t1, 0(a0)			; ZVE32F-NEXT: sd t1, 0(a0)
	; ZVE32F-NEXT: sd a6, 24(a0)			; ZVE32F-NEXT: sd a6, 24(a0)
	; ZVE32F-NEXT: sd a7, 16(a0)			; ZVE32F-NEXT: sd a7, 16(a0)
	; ZVE32F-NEXT: addi a2, a2, 4			; ZVE32F-NEXT: addi a2, a2, 4
	; ZVE32F-NEXT: addi a3, a3, 4
	; ZVE32F-NEXT: addi a4, a4, -4
	; ZVE32F-NEXT: addi a0, a0, 32			; ZVE32F-NEXT: addi a0, a0, 32
	; ZVE32F-NEXT: bnez a4, .LBB11_1			; ZVE32F-NEXT: addi a4, a4, 4
				; ZVE32F-NEXT: bne a0, a3, .LBB11_1
	; ZVE32F-NEXT: # %bb.2: # %bb18			; ZVE32F-NEXT: # %bb.2: # %bb18
	; ZVE32F-NEXT: ret			; ZVE32F-NEXT: ret
	bb:			bb:
	br label %bb2			br label %bb2

	bb2: ; preds = %bb2, %bb			bb2: ; preds = %bb2, %bb
	%i = phi i64 [ 0, %bb ], [ %i15, %bb2 ]			%i = phi i64 [ 0, %bb ], [ %i15, %bb2 ]
	%i3 = phi <2 x i64> [ <i64 0, i64 1>, %bb ], [ %i16, %bb2 ]			%i3 = phi <2 x i64> [ <i64 0, i64 1>, %bb ], [ %i16, %bb2 ]
	Show All 18 Lines
	}			}

	declare <2 x ptr> @llvm.masked.gather.v2p0.v2p0(<2 x ptr>, i32 immarg, <2 x i1>, <2 x ptr>)			declare <2 x ptr> @llvm.masked.gather.v2p0.v2p0(<2 x ptr>, i32 immarg, <2 x i1>, <2 x ptr>)

	; Make sure we don't crash in getTgtMemIntrinsic for a vector of pointers.			; Make sure we don't crash in getTgtMemIntrinsic for a vector of pointers.
	define void @scatter_of_pointers(ptr noalias nocapture %arg, ptr noalias nocapture readonly %arg1) {			define void @scatter_of_pointers(ptr noalias nocapture %arg, ptr noalias nocapture readonly %arg1) {
	; V-LABEL: scatter_of_pointers:			; V-LABEL: scatter_of_pointers:
	; V: # %bb.0: # %bb			; V: # %bb.0: # %bb
	; V-NEXT: li a2, 1024			; V-NEXT: lui a2, 2
				; V-NEXT: add a2, a1, a2
	; V-NEXT: li a3, 40			; V-NEXT: li a3, 40
	; V-NEXT: vsetivli zero, 2, e64, m1, ta, ma			; V-NEXT: vsetivli zero, 2, e64, m1, ta, ma
	; V-NEXT: .LBB12_1: # %bb2			; V-NEXT: .LBB12_1: # %bb2
	; V-NEXT: # =>This Inner Loop Header: Depth=1			; V-NEXT: # =>This Inner Loop Header: Depth=1
	; V-NEXT: addi a4, a1, 16			; V-NEXT: addi a4, a1, 16
	; V-NEXT: vle64.v v8, (a1)			; V-NEXT: vle64.v v8, (a1)
	; V-NEXT: vle64.v v9, (a4)			; V-NEXT: vle64.v v9, (a4)
	; V-NEXT: addi a4, a0, 80			; V-NEXT: addi a4, a0, 80
	; V-NEXT: vsse64.v v8, (a0), a3			; V-NEXT: vsse64.v v8, (a0), a3
	; V-NEXT: vsse64.v v9, (a4), a3			; V-NEXT: vsse64.v v9, (a4), a3
	; V-NEXT: addi a2, a2, -4
	; V-NEXT: addi a1, a1, 32			; V-NEXT: addi a1, a1, 32
	; V-NEXT: addi a0, a0, 160			; V-NEXT: addi a0, a0, 160
	; V-NEXT: bnez a2, .LBB12_1			; V-NEXT: bne a1, a2, .LBB12_1
	; V-NEXT: # %bb.2: # %bb18			; V-NEXT: # %bb.2: # %bb18
	; V-NEXT: ret			; V-NEXT: ret
	;			;
	; ZVE32F-LABEL: scatter_of_pointers:			; ZVE32F-LABEL: scatter_of_pointers:
	; ZVE32F: # %bb.0: # %bb			; ZVE32F: # %bb.0: # %bb
	; ZVE32F-NEXT: li a2, 0			; ZVE32F-NEXT: li a2, 0
	; ZVE32F-NEXT: li a3, 1			; ZVE32F-NEXT: lui a3, 2
	; ZVE32F-NEXT: li a4, 1024			; ZVE32F-NEXT: add a3, a1, a3
				; ZVE32F-NEXT: li a4, 1
	; ZVE32F-NEXT: li a5, 40			; ZVE32F-NEXT: li a5, 40
	; ZVE32F-NEXT: .LBB12_1: # %bb2			; ZVE32F-NEXT: .LBB12_1: # %bb2
	; ZVE32F-NEXT: # =>This Inner Loop Header: Depth=1			; ZVE32F-NEXT: # =>This Inner Loop Header: Depth=1
	; ZVE32F-NEXT: ld a6, 8(a1)			; ZVE32F-NEXT: ld a6, 8(a1)
	; ZVE32F-NEXT: ld a7, 0(a1)			; ZVE32F-NEXT: ld a7, 0(a1)
	; ZVE32F-NEXT: ld t0, 24(a1)			; ZVE32F-NEXT: ld t0, 24(a1)
	; ZVE32F-NEXT: ld t1, 16(a1)			; ZVE32F-NEXT: ld t1, 16(a1)
	; ZVE32F-NEXT: mul t2, a3, a5			; ZVE32F-NEXT: mul t2, a4, a5
	; ZVE32F-NEXT: add t2, a0, t2			; ZVE32F-NEXT: add t2, a0, t2
	; ZVE32F-NEXT: mul t3, a2, a5			; ZVE32F-NEXT: mul t3, a2, a5
	; ZVE32F-NEXT: add t3, a0, t3			; ZVE32F-NEXT: add t3, a0, t3
	; ZVE32F-NEXT: sd a7, 0(t3)			; ZVE32F-NEXT: sd a7, 0(t3)
	; ZVE32F-NEXT: sd a6, 0(t2)			; ZVE32F-NEXT: sd a6, 0(t2)
	; ZVE32F-NEXT: sd t1, 80(t3)			; ZVE32F-NEXT: sd t1, 80(t3)
	; ZVE32F-NEXT: sd t0, 80(t2)			; ZVE32F-NEXT: sd t0, 80(t2)
	; ZVE32F-NEXT: addi a2, a2, 4			; ZVE32F-NEXT: addi a2, a2, 4
	; ZVE32F-NEXT: addi a3, a3, 4
	; ZVE32F-NEXT: addi a4, a4, -4
	; ZVE32F-NEXT: addi a1, a1, 32			; ZVE32F-NEXT: addi a1, a1, 32
	; ZVE32F-NEXT: bnez a4, .LBB12_1			; ZVE32F-NEXT: addi a4, a4, 4
				; ZVE32F-NEXT: bne a1, a3, .LBB12_1
	; ZVE32F-NEXT: # %bb.2: # %bb18			; ZVE32F-NEXT: # %bb.2: # %bb18
	; ZVE32F-NEXT: ret			; ZVE32F-NEXT: ret
	bb:			bb:
	br label %bb2			br label %bb2

	bb2: ; preds = %bb2, %bb			bb2: ; preds = %bb2, %bb
	%i = phi i64 [ 0, %bb ], [ %i15, %bb2 ]			%i = phi i64 [ 0, %bb ], [ %i15, %bb2 ]
	%i3 = phi <2 x i64> [ <i64 0, i64 1>, %bb ], [ %i16, %bb2 ]			%i3 = phi <2 x i64> [ <i64 0, i64 1>, %bb ], [ %i16, %bb2 ]
	Show All 20 Lines
	declare void @llvm.masked.scatter.v2p0.v2p0(<2 x ptr>, <2 x ptr>, i32 immarg, <2 x i1>)			declare void @llvm.masked.scatter.v2p0.v2p0(<2 x ptr>, <2 x ptr>, i32 immarg, <2 x i1>)

	define void @strided_load_startval_add_with_splat(ptr noalias nocapture %arg, ptr noalias nocapture readonly %arg1, i32 signext %arg2) {			define void @strided_load_startval_add_with_splat(ptr noalias nocapture %arg, ptr noalias nocapture readonly %arg1, i32 signext %arg2) {
	; CHECK-LABEL: strided_load_startval_add_with_splat:			; CHECK-LABEL: strided_load_startval_add_with_splat:
	; CHECK: # %bb.0: # %bb			; CHECK: # %bb.0: # %bb
	; CHECK-NEXT: li a3, 1024			; CHECK-NEXT: li a3, 1024
	; CHECK-NEXT: beq a2, a3, .LBB13_7			; CHECK-NEXT: beq a2, a3, .LBB13_7
	; CHECK-NEXT: # %bb.1: # %bb3			; CHECK-NEXT: # %bb.1: # %bb3
	; CHECK-NEXT: li a4, 1023			; CHECK-NEXT: li a3, 1023
	; CHECK-NEXT: subw a4, a4, a2			; CHECK-NEXT: subw a5, a3, a2
	; CHECK-NEXT: li a5, 31			; CHECK-NEXT: li a6, 31
	; CHECK-NEXT: mv a3, a2			; CHECK-NEXT: mv a4, a2
	; CHECK-NEXT: bltu a4, a5, .LBB13_5			; CHECK-NEXT: bltu a5, a6, .LBB13_5
	; CHECK-NEXT: # %bb.2: # %bb9			; CHECK-NEXT: # %bb.2: # %bb9
	; CHECK-NEXT: slli a4, a4, 32			; CHECK-NEXT: slli a5, a5, 32
	; CHECK-NEXT: srli a4, a4, 32			; CHECK-NEXT: srli a5, a5, 32
	; CHECK-NEXT: addi a4, a4, 1			; CHECK-NEXT: addi a5, a5, 1
	; CHECK-NEXT: andi a5, a4, -32			; CHECK-NEXT: andi a6, a5, -32
	; CHECK-NEXT: add a3, a5, a2			; CHECK-NEXT: add a4, a6, a2
	; CHECK-NEXT: slli a7, a2, 2			; CHECK-NEXT: slli t0, a2, 2
	; CHECK-NEXT: add a6, a0, a2			; CHECK-NEXT: add a7, a0, a2
	; CHECK-NEXT: add a2, a1, a2			; CHECK-NEXT: add a2, a1, a2
	; CHECK-NEXT: add a2, a2, a7			; CHECK-NEXT: add a2, a2, t0
	; CHECK-NEXT: li a7, 32			; CHECK-NEXT: add t0, a4, a0
	; CHECK-NEXT: li t0, 5			; CHECK-NEXT: li t1, 32
	; CHECK-NEXT: mv t1, a5			; CHECK-NEXT: li t2, 5
	; CHECK-NEXT: .LBB13_3: # %bb15			; CHECK-NEXT: .LBB13_3: # %bb15
	; CHECK-NEXT: # =>This Inner Loop Header: Depth=1			; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
	; CHECK-NEXT: vsetvli zero, a7, e8, m1, ta, ma			; CHECK-NEXT: vsetvli zero, t1, e8, m1, ta, ma
	; CHECK-NEXT: vlse8.v v8, (a2), t0			; CHECK-NEXT: vlse8.v v8, (a2), t2
	; CHECK-NEXT: vle8.v v9, (a6)			; CHECK-NEXT: vle8.v v9, (a7)
	; CHECK-NEXT: vadd.vv v8, v9, v8			; CHECK-NEXT: vadd.vv v8, v9, v8
	; CHECK-NEXT: vse8.v v8, (a6)			; CHECK-NEXT: vse8.v v8, (a7)
	; CHECK-NEXT: addi t1, t1, -32			; CHECK-NEXT: addi a7, a7, 32
	; CHECK-NEXT: addi a6, a6, 32
	; CHECK-NEXT: addi a2, a2, 160			; CHECK-NEXT: addi a2, a2, 160
	; CHECK-NEXT: bnez t1, .LBB13_3			; CHECK-NEXT: bne a7, t0, .LBB13_3
	; CHECK-NEXT: # %bb.4: # %bb30			; CHECK-NEXT: # %bb.4: # %bb30
	; CHECK-NEXT: beq a4, a5, .LBB13_7			; CHECK-NEXT: beq a5, a6, .LBB13_7
	; CHECK-NEXT: .LBB13_5: # %bb32			; CHECK-NEXT: .LBB13_5: # %bb32
	; CHECK-NEXT: addiw a2, a3, -1024			; CHECK-NEXT: add a2, a0, a4
	; CHECK-NEXT: add a0, a0, a3			; CHECK-NEXT: slli a5, a4, 2
	; CHECK-NEXT: slli a4, a3, 2
	; CHECK-NEXT: add a1, a1, a3
	; CHECK-NEXT: add a1, a1, a4			; CHECK-NEXT: add a1, a1, a4
				; CHECK-NEXT: add a1, a1, a5
				; CHECK-NEXT: subw a3, a3, a4
				; CHECK-NEXT: slli a3, a3, 32
				; CHECK-NEXT: srli a3, a3, 32
				; CHECK-NEXT: add a0, a4, a0
				; CHECK-NEXT: add a0, a0, a3
				; CHECK-NEXT: addi a0, a0, 1
	; CHECK-NEXT: .LBB13_6: # %bb35			; CHECK-NEXT: .LBB13_6: # %bb35
	; CHECK-NEXT: # =>This Inner Loop Header: Depth=1			; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
	; CHECK-NEXT: lbu a3, 0(a1)			; CHECK-NEXT: lbu a3, 0(a1)
	; CHECK-NEXT: lbu a4, 0(a0)			; CHECK-NEXT: lbu a4, 0(a2)
	; CHECK-NEXT: add a3, a4, a3			; CHECK-NEXT: add a3, a4, a3
	; CHECK-NEXT: sb a3, 0(a0)			; CHECK-NEXT: sb a3, 0(a2)
	; CHECK-NEXT: addiw a2, a2, 1			; CHECK-NEXT: addi a2, a2, 1
	; CHECK-NEXT: addi a0, a0, 1
	; CHECK-NEXT: addi a1, a1, 5			; CHECK-NEXT: addi a1, a1, 5
	; CHECK-NEXT: bnez a2, .LBB13_6			; CHECK-NEXT: bne a2, a0, .LBB13_6
	; CHECK-NEXT: .LBB13_7: # %bb34			; CHECK-NEXT: .LBB13_7: # %bb34
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	bb:			bb:
	%i = icmp eq i32 %arg2, 1024			%i = icmp eq i32 %arg2, 1024
	br i1 %i, label %bb34, label %bb3			br i1 %i, label %bb34, label %bb3

	bb3: ; preds = %bb			bb3: ; preds = %bb
	%i4 = sext i32 %arg2 to i64			%i4 = sext i32 %arg2 to i64
	▲ Show 20 Lines • Show All 57 Lines • ▼ Show 20 Lines
	declare void @llvm.masked.scatter.v16i8.v16p0(<16 x i8>, <16 x ptr>, i32 immarg, <16 x i1>)			declare void @llvm.masked.scatter.v16i8.v16p0(<16 x i8>, <16 x ptr>, i32 immarg, <16 x i1>)

	define void @gather_no_scalar_remainder(ptr noalias nocapture noundef %arg, ptr noalias nocapture noundef readonly %arg1, i64 noundef %arg2) {			define void @gather_no_scalar_remainder(ptr noalias nocapture noundef %arg, ptr noalias nocapture noundef readonly %arg1, i64 noundef %arg2) {
	; CHECK-LABEL: gather_no_scalar_remainder:			; CHECK-LABEL: gather_no_scalar_remainder:
	; CHECK: # %bb.0: # %bb			; CHECK: # %bb.0: # %bb
	; CHECK-NEXT: slli a2, a2, 4			; CHECK-NEXT: slli a2, a2, 4
	; CHECK-NEXT: beqz a2, .LBB14_3			; CHECK-NEXT: beqz a2, .LBB14_3
	; CHECK-NEXT: # %bb.1: # %bb2			; CHECK-NEXT: # %bb.1: # %bb2
				; CHECK-NEXT: addi a2, a2, -16
				; CHECK-NEXT: andi a2, a2, -16
				; CHECK-NEXT: add a2, a2, a0
				; CHECK-NEXT: addi a2, a2, 16
	; CHECK-NEXT: li a3, 5			; CHECK-NEXT: li a3, 5
	; CHECK-NEXT: vsetivli zero, 16, e8, mf2, ta, ma			; CHECK-NEXT: vsetivli zero, 16, e8, mf2, ta, ma
	; CHECK-NEXT: .LBB14_2: # %bb4			; CHECK-NEXT: .LBB14_2: # %bb4
	; CHECK-NEXT: # =>This Inner Loop Header: Depth=1			; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
	; CHECK-NEXT: vlse8.v v8, (a1), a3			; CHECK-NEXT: vlse8.v v8, (a1), a3
	; CHECK-NEXT: vle8.v v9, (a0)			; CHECK-NEXT: vle8.v v9, (a0)
	; CHECK-NEXT: vadd.vv v8, v9, v8			; CHECK-NEXT: vadd.vv v8, v9, v8
	; CHECK-NEXT: vse8.v v8, (a0)			; CHECK-NEXT: vse8.v v8, (a0)
	; CHECK-NEXT: addi a2, a2, -16
	; CHECK-NEXT: addi a0, a0, 16			; CHECK-NEXT: addi a0, a0, 16
	; CHECK-NEXT: addi a1, a1, 80			; CHECK-NEXT: addi a1, a1, 80
	; CHECK-NEXT: bnez a2, .LBB14_2			; CHECK-NEXT: bne a0, a2, .LBB14_2
	; CHECK-NEXT: .LBB14_3: # %bb16			; CHECK-NEXT: .LBB14_3: # %bb16
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	bb:			bb:
	%i = shl i64 %arg2, 4			%i = shl i64 %arg2, 4
	%i3 = icmp eq i64 %i, 0			%i3 = icmp eq i64 %i, 0
	br i1 %i3, label %bb16, label %bb2			br i1 %i3, label %bb16, label %bb2

	bb2: ; preds = %bb			bb2: ; preds = %bb
	Show All 20 Lines

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-fp-buildvec.ll

Show First 20 Lines • Show All 240 Lines • ▼ Show 20 Lines	; LMULMAX2-NEXT: ret
%x = extractelement <8 x float> %v, i64 %idx		%x = extractelement <8 x float> %v, i64 %idx
%ins = insertelement <8 x float> poison, float %x, i32 0		%ins = insertelement <8 x float> poison, float %x, i32 0
%splat = shufflevector <8 x float> %ins, <8 x float> poison, <8 x i32> zeroinitializer		%splat = shufflevector <8 x float> %ins, <8 x float> poison, <8 x i32> zeroinitializer
ret <8 x float> %splat		ret <8 x float> %splat
}		}

; Test that we pull the vlse of the constant pool out of the loop.		; Test that we pull the vlse of the constant pool out of the loop.
define dso_local void @splat_load_licm(float* %0) {		define dso_local void @splat_load_licm(float* %0) {
; RV32-LABEL: splat_load_licm:		; CHECK-LABEL: splat_load_licm:
; RV32: # %bb.0:		; CHECK: # %bb.0:
; RV32-NEXT: li a1, 1024		; CHECK-NEXT: lui a1, 1
; RV32-NEXT: lui a2, 263168		; CHECK-NEXT: add a1, a0, a1
; RV32-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: lui a2, 263168
; RV32-NEXT: vmv.v.x v8, a2		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; RV32-NEXT: .LBB12_1: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: vmv.v.x v8, a2
; RV32-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: .LBB12_1: # =>This Inner Loop Header: Depth=1
; RV32-NEXT: addi a1, a1, -4		; CHECK-NEXT: vse32.v v8, (a0)
; RV32-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; RV32-NEXT: bnez a1, .LBB12_1		; CHECK-NEXT: bne a0, a1, .LBB12_1
; RV32-NEXT: # %bb.2:		; CHECK-NEXT: # %bb.2:
; RV32-NEXT: ret		; CHECK-NEXT: ret
;
; RV64-LABEL: splat_load_licm:
; RV64: # %bb.0:
; RV64-NEXT: li a1, 1024
; RV64-NEXT: lui a2, 263168
; RV64-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; RV64-NEXT: vmv.v.x v8, a2
; RV64-NEXT: .LBB12_1: # =>This Inner Loop Header: Depth=1
; RV64-NEXT: vse32.v v8, (a0)
; RV64-NEXT: addiw a1, a1, -4
; RV64-NEXT: addi a0, a0, 16
; RV64-NEXT: bnez a1, .LBB12_1
; RV64-NEXT: # %bb.2:
; RV64-NEXT: ret
br label %2		br label %2

2: ; preds = %2, %1		2: ; preds = %2, %1
%3 = phi i32 [ 0, %1 ], [ %6, %2 ]		%3 = phi i32 [ 0, %1 ], [ %6, %2 ]
%4 = getelementptr inbounds float, float* %0, i32 %3		%4 = getelementptr inbounds float, float* %0, i32 %3
%5 = bitcast float* %4 to <4 x float>*		%5 = bitcast float* %4 to <4 x float>*
store <4 x float> <float 3.000000e+00, float 3.000000e+00, float 3.000000e+00, float 3.000000e+00>, <4 x float>* %5, align 4		store <4 x float> <float 3.000000e+00, float 3.000000e+00, float 3.000000e+00, float 3.000000e+00>, <4 x float>* %5, align 4
%6 = add nuw i32 %3, 4		%6 = add nuw i32 %3, 4
▲ Show 20 Lines • Show All 62 Lines • ▼ Show 20 Lines
; CHECK-NEXT: vfslide1down.vf v8, v8, fa3		; CHECK-NEXT: vfslide1down.vf v8, v8, fa3
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%v1 = insertelement <4 x float> poison, float %a, i64 0		%v1 = insertelement <4 x float> poison, float %a, i64 0
%v2 = insertelement <4 x float> %v1, float %b, i64 1		%v2 = insertelement <4 x float> %v1, float %b, i64 1
%v3 = insertelement <4 x float> %v2, float %c, i64 2		%v3 = insertelement <4 x float> %v2, float %c, i64 2
%v4 = insertelement <4 x float> %v3, float %d, i64 3		%v4 = insertelement <4 x float> %v3, float %d, i64 3
ret <4 x float> %v4		ret <4 x float> %v4
}		}
		;; NOTE: These prefixes are unused and the list is autogenerated. Do not add tests below this line:
		; RV32: {{.*}}
		; RV64: {{.*}}

llvm/test/CodeGen/RISCV/rvv/sink-splat-operands.ll

; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py		; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
; RUN: llc < %s -mtriple=riscv64 -mattr=+m,+v,+f -target-abi=lp64f \		; RUN: llc < %s -mtriple=riscv64 -mattr=+m,+v,+f -target-abi=lp64f \
; RUN: -riscv-v-vector-bits-min=128 \| FileCheck %s		; RUN: -riscv-v-vector-bits-min=128 \| FileCheck %s

define void @sink_splat_mul(ptr nocapture %a, i32 signext %x) {		define void @sink_splat_mul(ptr nocapture %a, i32 signext %x) {
; CHECK-LABEL: sink_splat_mul:		; CHECK-LABEL: sink_splat_mul:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a2, 1024		; CHECK-NEXT: lui a2, 1
		; CHECK-NEXT: add a2, a0, a2
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: .LBB0_1: # %vector.body		; CHECK-NEXT: .LBB0_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vmul.vx v8, v8, a1		; CHECK-NEXT: vmul.vx v8, v8, a1
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a2, a2, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a2, .LBB0_1		; CHECK-NEXT: bne a0, a2, .LBB0_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%broadcast.splatinsert = insertelement <4 x i32> poison, i32 %x, i32 0		%broadcast.splatinsert = insertelement <4 x i32> poison, i32 %x, i32 0
%broadcast.splat = shufflevector <4 x i32> %broadcast.splatinsert, <4 x i32> poison, <4 x i32> zeroinitializer		%broadcast.splat = shufflevector <4 x i32> %broadcast.splatinsert, <4 x i32> poison, <4 x i32> zeroinitializer
br label %vector.body		br label %vector.body

vector.body: ; preds = %vector.body, %entry		vector.body: ; preds = %vector.body, %entry
%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]		%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]
%0 = getelementptr inbounds i32, ptr %a, i64 %index		%0 = getelementptr inbounds i32, ptr %a, i64 %index
%wide.load = load <4 x i32>, ptr %0, align 4		%wide.load = load <4 x i32>, ptr %0, align 4
%1 = mul <4 x i32> %wide.load, %broadcast.splat		%1 = mul <4 x i32> %wide.load, %broadcast.splat
store <4 x i32> %1, ptr %0, align 4		store <4 x i32> %1, ptr %0, align 4
%index.next = add nuw i64 %index, 4		%index.next = add nuw i64 %index, 4
%2 = icmp eq i64 %index.next, 1024		%2 = icmp eq i64 %index.next, 1024
br i1 %2, label %for.cond.cleanup, label %vector.body		br i1 %2, label %for.cond.cleanup, label %vector.body

for.cond.cleanup: ; preds = %vector.body		for.cond.cleanup: ; preds = %vector.body
ret void		ret void
}		}

define void @sink_splat_add(ptr nocapture %a, i32 signext %x) {		define void @sink_splat_add(ptr nocapture %a, i32 signext %x) {
; CHECK-LABEL: sink_splat_add:		; CHECK-LABEL: sink_splat_add:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a2, 1024		; CHECK-NEXT: lui a2, 1
		; CHECK-NEXT: add a2, a0, a2
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: .LBB1_1: # %vector.body		; CHECK-NEXT: .LBB1_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vadd.vx v8, v8, a1		; CHECK-NEXT: vadd.vx v8, v8, a1
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a2, a2, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a2, .LBB1_1		; CHECK-NEXT: bne a0, a2, .LBB1_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%broadcast.splatinsert = insertelement <4 x i32> poison, i32 %x, i32 0		%broadcast.splatinsert = insertelement <4 x i32> poison, i32 %x, i32 0
%broadcast.splat = shufflevector <4 x i32> %broadcast.splatinsert, <4 x i32> poison, <4 x i32> zeroinitializer		%broadcast.splat = shufflevector <4 x i32> %broadcast.splatinsert, <4 x i32> poison, <4 x i32> zeroinitializer
br label %vector.body		br label %vector.body

vector.body: ; preds = %vector.body, %entry		vector.body: ; preds = %vector.body, %entry
%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]		%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]
%0 = getelementptr inbounds i32, ptr %a, i64 %index		%0 = getelementptr inbounds i32, ptr %a, i64 %index
%wide.load = load <4 x i32>, ptr %0, align 4		%wide.load = load <4 x i32>, ptr %0, align 4
%1 = add <4 x i32> %wide.load, %broadcast.splat		%1 = add <4 x i32> %wide.load, %broadcast.splat
store <4 x i32> %1, ptr %0, align 4		store <4 x i32> %1, ptr %0, align 4
%index.next = add nuw i64 %index, 4		%index.next = add nuw i64 %index, 4
%2 = icmp eq i64 %index.next, 1024		%2 = icmp eq i64 %index.next, 1024
br i1 %2, label %for.cond.cleanup, label %vector.body		br i1 %2, label %for.cond.cleanup, label %vector.body

for.cond.cleanup: ; preds = %vector.body		for.cond.cleanup: ; preds = %vector.body
ret void		ret void
}		}

define void @sink_splat_sub(ptr nocapture %a, i32 signext %x) {		define void @sink_splat_sub(ptr nocapture %a, i32 signext %x) {
; CHECK-LABEL: sink_splat_sub:		; CHECK-LABEL: sink_splat_sub:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a2, 1024		; CHECK-NEXT: lui a2, 1
		; CHECK-NEXT: add a2, a0, a2
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: .LBB2_1: # %vector.body		; CHECK-NEXT: .LBB2_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsub.vx v8, v8, a1		; CHECK-NEXT: vsub.vx v8, v8, a1
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a2, a2, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a2, .LBB2_1		; CHECK-NEXT: bne a0, a2, .LBB2_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%broadcast.splatinsert = insertelement <4 x i32> poison, i32 %x, i32 0		%broadcast.splatinsert = insertelement <4 x i32> poison, i32 %x, i32 0
%broadcast.splat = shufflevector <4 x i32> %broadcast.splatinsert, <4 x i32> poison, <4 x i32> zeroinitializer		%broadcast.splat = shufflevector <4 x i32> %broadcast.splatinsert, <4 x i32> poison, <4 x i32> zeroinitializer
br label %vector.body		br label %vector.body

vector.body: ; preds = %vector.body, %entry		vector.body: ; preds = %vector.body, %entry
%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]		%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]
%0 = getelementptr inbounds i32, ptr %a, i64 %index		%0 = getelementptr inbounds i32, ptr %a, i64 %index
%wide.load = load <4 x i32>, ptr %0, align 4		%wide.load = load <4 x i32>, ptr %0, align 4
%1 = sub <4 x i32> %wide.load, %broadcast.splat		%1 = sub <4 x i32> %wide.load, %broadcast.splat
store <4 x i32> %1, ptr %0, align 4		store <4 x i32> %1, ptr %0, align 4
%index.next = add nuw i64 %index, 4		%index.next = add nuw i64 %index, 4
%2 = icmp eq i64 %index.next, 1024		%2 = icmp eq i64 %index.next, 1024
br i1 %2, label %for.cond.cleanup, label %vector.body		br i1 %2, label %for.cond.cleanup, label %vector.body

for.cond.cleanup: ; preds = %vector.body		for.cond.cleanup: ; preds = %vector.body
ret void		ret void
}		}

define void @sink_splat_rsub(ptr nocapture %a, i32 signext %x) {		define void @sink_splat_rsub(ptr nocapture %a, i32 signext %x) {
; CHECK-LABEL: sink_splat_rsub:		; CHECK-LABEL: sink_splat_rsub:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a2, 1024		; CHECK-NEXT: lui a2, 1
		; CHECK-NEXT: add a2, a0, a2
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: .LBB3_1: # %vector.body		; CHECK-NEXT: .LBB3_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vrsub.vx v8, v8, a1		; CHECK-NEXT: vrsub.vx v8, v8, a1
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a2, a2, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a2, .LBB3_1		; CHECK-NEXT: bne a0, a2, .LBB3_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%broadcast.splatinsert = insertelement <4 x i32> poison, i32 %x, i32 0		%broadcast.splatinsert = insertelement <4 x i32> poison, i32 %x, i32 0
%broadcast.splat = shufflevector <4 x i32> %broadcast.splatinsert, <4 x i32> poison, <4 x i32> zeroinitializer		%broadcast.splat = shufflevector <4 x i32> %broadcast.splatinsert, <4 x i32> poison, <4 x i32> zeroinitializer
br label %vector.body		br label %vector.body

vector.body: ; preds = %vector.body, %entry		vector.body: ; preds = %vector.body, %entry
%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]		%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]
%0 = getelementptr inbounds i32, ptr %a, i64 %index		%0 = getelementptr inbounds i32, ptr %a, i64 %index
%wide.load = load <4 x i32>, ptr %0, align 4		%wide.load = load <4 x i32>, ptr %0, align 4
%1 = sub <4 x i32> %broadcast.splat, %wide.load		%1 = sub <4 x i32> %broadcast.splat, %wide.load
store <4 x i32> %1, ptr %0, align 4		store <4 x i32> %1, ptr %0, align 4
%index.next = add nuw i64 %index, 4		%index.next = add nuw i64 %index, 4
%2 = icmp eq i64 %index.next, 1024		%2 = icmp eq i64 %index.next, 1024
br i1 %2, label %for.cond.cleanup, label %vector.body		br i1 %2, label %for.cond.cleanup, label %vector.body

for.cond.cleanup: ; preds = %vector.body		for.cond.cleanup: ; preds = %vector.body
ret void		ret void
}		}

define void @sink_splat_and(ptr nocapture %a, i32 signext %x) {		define void @sink_splat_and(ptr nocapture %a, i32 signext %x) {
; CHECK-LABEL: sink_splat_and:		; CHECK-LABEL: sink_splat_and:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a2, 1024		; CHECK-NEXT: lui a2, 1
		; CHECK-NEXT: add a2, a0, a2
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: .LBB4_1: # %vector.body		; CHECK-NEXT: .LBB4_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vand.vx v8, v8, a1		; CHECK-NEXT: vand.vx v8, v8, a1
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a2, a2, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a2, .LBB4_1		; CHECK-NEXT: bne a0, a2, .LBB4_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%broadcast.splatinsert = insertelement <4 x i32> poison, i32 %x, i32 0		%broadcast.splatinsert = insertelement <4 x i32> poison, i32 %x, i32 0
%broadcast.splat = shufflevector <4 x i32> %broadcast.splatinsert, <4 x i32> poison, <4 x i32> zeroinitializer		%broadcast.splat = shufflevector <4 x i32> %broadcast.splatinsert, <4 x i32> poison, <4 x i32> zeroinitializer
br label %vector.body		br label %vector.body

vector.body: ; preds = %vector.body, %entry		vector.body: ; preds = %vector.body, %entry
%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]		%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]
%0 = getelementptr inbounds i32, ptr %a, i64 %index		%0 = getelementptr inbounds i32, ptr %a, i64 %index
%wide.load = load <4 x i32>, ptr %0, align 4		%wide.load = load <4 x i32>, ptr %0, align 4
%1 = and <4 x i32> %wide.load, %broadcast.splat		%1 = and <4 x i32> %wide.load, %broadcast.splat
store <4 x i32> %1, ptr %0, align 4		store <4 x i32> %1, ptr %0, align 4
%index.next = add nuw i64 %index, 4		%index.next = add nuw i64 %index, 4
%2 = icmp eq i64 %index.next, 1024		%2 = icmp eq i64 %index.next, 1024
br i1 %2, label %for.cond.cleanup, label %vector.body		br i1 %2, label %for.cond.cleanup, label %vector.body

for.cond.cleanup: ; preds = %vector.body		for.cond.cleanup: ; preds = %vector.body
ret void		ret void
}		}

define void @sink_splat_or(ptr nocapture %a, i32 signext %x) {		define void @sink_splat_or(ptr nocapture %a, i32 signext %x) {
; CHECK-LABEL: sink_splat_or:		; CHECK-LABEL: sink_splat_or:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a2, 1024		; CHECK-NEXT: lui a2, 1
		; CHECK-NEXT: add a2, a0, a2
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: .LBB5_1: # %vector.body		; CHECK-NEXT: .LBB5_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vor.vx v8, v8, a1		; CHECK-NEXT: vor.vx v8, v8, a1
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a2, a2, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a2, .LBB5_1		; CHECK-NEXT: bne a0, a2, .LBB5_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%broadcast.splatinsert = insertelement <4 x i32> poison, i32 %x, i32 0		%broadcast.splatinsert = insertelement <4 x i32> poison, i32 %x, i32 0
%broadcast.splat = shufflevector <4 x i32> %broadcast.splatinsert, <4 x i32> poison, <4 x i32> zeroinitializer		%broadcast.splat = shufflevector <4 x i32> %broadcast.splatinsert, <4 x i32> poison, <4 x i32> zeroinitializer
br label %vector.body		br label %vector.body

vector.body: ; preds = %vector.body, %entry		vector.body: ; preds = %vector.body, %entry
%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]		%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]
%0 = getelementptr inbounds i32, ptr %a, i64 %index		%0 = getelementptr inbounds i32, ptr %a, i64 %index
%wide.load = load <4 x i32>, ptr %0, align 4		%wide.load = load <4 x i32>, ptr %0, align 4
%1 = or <4 x i32> %wide.load, %broadcast.splat		%1 = or <4 x i32> %wide.load, %broadcast.splat
store <4 x i32> %1, ptr %0, align 4		store <4 x i32> %1, ptr %0, align 4
%index.next = add nuw i64 %index, 4		%index.next = add nuw i64 %index, 4
%2 = icmp eq i64 %index.next, 1024		%2 = icmp eq i64 %index.next, 1024
br i1 %2, label %for.cond.cleanup, label %vector.body		br i1 %2, label %for.cond.cleanup, label %vector.body

for.cond.cleanup: ; preds = %vector.body		for.cond.cleanup: ; preds = %vector.body
ret void		ret void
}		}

define void @sink_splat_xor(ptr nocapture %a, i32 signext %x) {		define void @sink_splat_xor(ptr nocapture %a, i32 signext %x) {
; CHECK-LABEL: sink_splat_xor:		; CHECK-LABEL: sink_splat_xor:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a2, 1024		; CHECK-NEXT: lui a2, 1
		; CHECK-NEXT: add a2, a0, a2
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: .LBB6_1: # %vector.body		; CHECK-NEXT: .LBB6_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vxor.vx v8, v8, a1		; CHECK-NEXT: vxor.vx v8, v8, a1
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a2, a2, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a2, .LBB6_1		; CHECK-NEXT: bne a0, a2, .LBB6_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%broadcast.splatinsert = insertelement <4 x i32> poison, i32 %x, i32 0		%broadcast.splatinsert = insertelement <4 x i32> poison, i32 %x, i32 0
%broadcast.splat = shufflevector <4 x i32> %broadcast.splatinsert, <4 x i32> poison, <4 x i32> zeroinitializer		%broadcast.splat = shufflevector <4 x i32> %broadcast.splatinsert, <4 x i32> poison, <4 x i32> zeroinitializer
br label %vector.body		br label %vector.body

vector.body: ; preds = %vector.body, %entry		vector.body: ; preds = %vector.body, %entry
Show All 34 Lines
; CHECK-NEXT: vmul.vx v8, v8, a1		; CHECK-NEXT: vmul.vx v8, v8, a1
; CHECK-NEXT: vs2r.v v8, (a6)		; CHECK-NEXT: vs2r.v v8, (a6)
; CHECK-NEXT: sub a7, a7, a3		; CHECK-NEXT: sub a7, a7, a3
; CHECK-NEXT: add a6, a6, a5		; CHECK-NEXT: add a6, a6, a5
; CHECK-NEXT: bnez a7, .LBB7_3		; CHECK-NEXT: bnez a7, .LBB7_3
; CHECK-NEXT: # %bb.4: # %middle.block		; CHECK-NEXT: # %bb.4: # %middle.block
; CHECK-NEXT: beqz a4, .LBB7_7		; CHECK-NEXT: beqz a4, .LBB7_7
; CHECK-NEXT: .LBB7_5: # %for.body.preheader		; CHECK-NEXT: .LBB7_5: # %for.body.preheader
; CHECK-NEXT: addi a3, a2, -1024
; CHECK-NEXT: slli a2, a2, 2		; CHECK-NEXT: slli a2, a2, 2
; CHECK-NEXT: add a0, a0, a2		; CHECK-NEXT: add a2, a0, a2
		; CHECK-NEXT: lui a3, 1
		; CHECK-NEXT: add a0, a0, a3
; CHECK-NEXT: .LBB7_6: # %for.body		; CHECK-NEXT: .LBB7_6: # %for.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: lw a2, 0(a0)		; CHECK-NEXT: lw a3, 0(a2)
; CHECK-NEXT: mul a2, a2, a1		; CHECK-NEXT: mul a3, a3, a1
; CHECK-NEXT: sw a2, 0(a0)		; CHECK-NEXT: sw a3, 0(a2)
; CHECK-NEXT: addi a3, a3, 1		; CHECK-NEXT: addi a2, a2, 4
; CHECK-NEXT: addi a0, a0, 4		; CHECK-NEXT: bne a2, a0, .LBB7_6
; CHECK-NEXT: bnez a3, .LBB7_6
; CHECK-NEXT: .LBB7_7: # %for.cond.cleanup		; CHECK-NEXT: .LBB7_7: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%0 = call i64 @llvm.vscale.i64()		%0 = call i64 @llvm.vscale.i64()
%1 = shl i64 %0, 2		%1 = shl i64 %0, 2
%min.iters.check = icmp ugt i64 %1, 1024		%min.iters.check = icmp ugt i64 %1, 1024
br i1 %min.iters.check, label %for.body.preheader, label %vector.ph		br i1 %min.iters.check, label %for.body.preheader, label %vector.ph

▲ Show 20 Lines • Show All 64 Lines • ▼ Show 20 Lines
; CHECK-NEXT: vadd.vx v8, v8, a1		; CHECK-NEXT: vadd.vx v8, v8, a1
; CHECK-NEXT: vs2r.v v8, (a6)		; CHECK-NEXT: vs2r.v v8, (a6)
; CHECK-NEXT: sub a7, a7, a3		; CHECK-NEXT: sub a7, a7, a3
; CHECK-NEXT: add a6, a6, a5		; CHECK-NEXT: add a6, a6, a5
; CHECK-NEXT: bnez a7, .LBB8_3		; CHECK-NEXT: bnez a7, .LBB8_3
; CHECK-NEXT: # %bb.4: # %middle.block		; CHECK-NEXT: # %bb.4: # %middle.block
; CHECK-NEXT: beqz a4, .LBB8_7		; CHECK-NEXT: beqz a4, .LBB8_7
; CHECK-NEXT: .LBB8_5: # %for.body.preheader		; CHECK-NEXT: .LBB8_5: # %for.body.preheader
; CHECK-NEXT: addi a3, a2, -1024
; CHECK-NEXT: slli a2, a2, 2		; CHECK-NEXT: slli a2, a2, 2
; CHECK-NEXT: add a0, a0, a2		; CHECK-NEXT: add a2, a0, a2
		; CHECK-NEXT: lui a3, 1
		; CHECK-NEXT: add a0, a0, a3
; CHECK-NEXT: .LBB8_6: # %for.body		; CHECK-NEXT: .LBB8_6: # %for.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: lw a2, 0(a0)		; CHECK-NEXT: lw a3, 0(a2)
; CHECK-NEXT: add a2, a2, a1		; CHECK-NEXT: add a3, a3, a1
; CHECK-NEXT: sw a2, 0(a0)		; CHECK-NEXT: sw a3, 0(a2)
; CHECK-NEXT: addi a3, a3, 1		; CHECK-NEXT: addi a2, a2, 4
; CHECK-NEXT: addi a0, a0, 4		; CHECK-NEXT: bne a2, a0, .LBB8_6
; CHECK-NEXT: bnez a3, .LBB8_6
; CHECK-NEXT: .LBB8_7: # %for.cond.cleanup		; CHECK-NEXT: .LBB8_7: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%0 = call i64 @llvm.vscale.i64()		%0 = call i64 @llvm.vscale.i64()
%1 = shl i64 %0, 2		%1 = shl i64 %0, 2
%min.iters.check = icmp ugt i64 %1, 1024		%min.iters.check = icmp ugt i64 %1, 1024
br i1 %min.iters.check, label %for.body.preheader, label %vector.ph		br i1 %min.iters.check, label %for.body.preheader, label %vector.ph

▲ Show 20 Lines • Show All 64 Lines • ▼ Show 20 Lines
; CHECK-NEXT: vsub.vx v8, v8, a1		; CHECK-NEXT: vsub.vx v8, v8, a1
; CHECK-NEXT: vs2r.v v8, (a6)		; CHECK-NEXT: vs2r.v v8, (a6)
; CHECK-NEXT: sub a7, a7, a3		; CHECK-NEXT: sub a7, a7, a3
; CHECK-NEXT: add a6, a6, a5		; CHECK-NEXT: add a6, a6, a5
; CHECK-NEXT: bnez a7, .LBB9_3		; CHECK-NEXT: bnez a7, .LBB9_3
; CHECK-NEXT: # %bb.4: # %middle.block		; CHECK-NEXT: # %bb.4: # %middle.block
; CHECK-NEXT: beqz a4, .LBB9_7		; CHECK-NEXT: beqz a4, .LBB9_7
; CHECK-NEXT: .LBB9_5: # %for.body.preheader		; CHECK-NEXT: .LBB9_5: # %for.body.preheader
; CHECK-NEXT: addi a3, a2, -1024
; CHECK-NEXT: slli a2, a2, 2		; CHECK-NEXT: slli a2, a2, 2
; CHECK-NEXT: add a0, a0, a2		; CHECK-NEXT: add a2, a0, a2
		; CHECK-NEXT: lui a3, 1
		; CHECK-NEXT: add a0, a0, a3
; CHECK-NEXT: .LBB9_6: # %for.body		; CHECK-NEXT: .LBB9_6: # %for.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: lw a2, 0(a0)		; CHECK-NEXT: lw a3, 0(a2)
; CHECK-NEXT: add a2, a2, a1		; CHECK-NEXT: add a3, a3, a1
; CHECK-NEXT: sw a2, 0(a0)		; CHECK-NEXT: sw a3, 0(a2)
; CHECK-NEXT: addi a3, a3, 1		; CHECK-NEXT: addi a2, a2, 4
; CHECK-NEXT: addi a0, a0, 4		; CHECK-NEXT: bne a2, a0, .LBB9_6
; CHECK-NEXT: bnez a3, .LBB9_6
; CHECK-NEXT: .LBB9_7: # %for.cond.cleanup		; CHECK-NEXT: .LBB9_7: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%0 = call i64 @llvm.vscale.i64()		%0 = call i64 @llvm.vscale.i64()
%1 = shl i64 %0, 2		%1 = shl i64 %0, 2
%min.iters.check = icmp ugt i64 %1, 1024		%min.iters.check = icmp ugt i64 %1, 1024
br i1 %min.iters.check, label %for.body.preheader, label %vector.ph		br i1 %min.iters.check, label %for.body.preheader, label %vector.ph

▲ Show 20 Lines • Show All 64 Lines • ▼ Show 20 Lines
; CHECK-NEXT: vrsub.vx v8, v8, a1		; CHECK-NEXT: vrsub.vx v8, v8, a1
; CHECK-NEXT: vs2r.v v8, (a6)		; CHECK-NEXT: vs2r.v v8, (a6)
; CHECK-NEXT: sub a7, a7, a3		; CHECK-NEXT: sub a7, a7, a3
; CHECK-NEXT: add a6, a6, a5		; CHECK-NEXT: add a6, a6, a5
; CHECK-NEXT: bnez a7, .LBB10_3		; CHECK-NEXT: bnez a7, .LBB10_3
; CHECK-NEXT: # %bb.4: # %middle.block		; CHECK-NEXT: # %bb.4: # %middle.block
; CHECK-NEXT: beqz a4, .LBB10_7		; CHECK-NEXT: beqz a4, .LBB10_7
; CHECK-NEXT: .LBB10_5: # %for.body.preheader		; CHECK-NEXT: .LBB10_5: # %for.body.preheader
; CHECK-NEXT: addi a3, a2, -1024
; CHECK-NEXT: slli a2, a2, 2		; CHECK-NEXT: slli a2, a2, 2
; CHECK-NEXT: add a0, a0, a2		; CHECK-NEXT: add a2, a0, a2
		; CHECK-NEXT: lui a3, 1
		; CHECK-NEXT: add a0, a0, a3
; CHECK-NEXT: .LBB10_6: # %for.body		; CHECK-NEXT: .LBB10_6: # %for.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: lw a2, 0(a0)		; CHECK-NEXT: lw a3, 0(a2)
; CHECK-NEXT: subw a2, a1, a2		; CHECK-NEXT: subw a3, a1, a3
; CHECK-NEXT: sw a2, 0(a0)		; CHECK-NEXT: sw a3, 0(a2)
; CHECK-NEXT: addi a3, a3, 1		; CHECK-NEXT: addi a2, a2, 4
; CHECK-NEXT: addi a0, a0, 4		; CHECK-NEXT: bne a2, a0, .LBB10_6
; CHECK-NEXT: bnez a3, .LBB10_6
; CHECK-NEXT: .LBB10_7: # %for.cond.cleanup		; CHECK-NEXT: .LBB10_7: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%0 = call i64 @llvm.vscale.i64()		%0 = call i64 @llvm.vscale.i64()
%1 = shl i64 %0, 2		%1 = shl i64 %0, 2
%min.iters.check = icmp ugt i64 %1, 1024		%min.iters.check = icmp ugt i64 %1, 1024
br i1 %min.iters.check, label %for.body.preheader, label %vector.ph		br i1 %min.iters.check, label %for.body.preheader, label %vector.ph

▲ Show 20 Lines • Show All 64 Lines • ▼ Show 20 Lines
; CHECK-NEXT: vand.vx v8, v8, a1		; CHECK-NEXT: vand.vx v8, v8, a1
; CHECK-NEXT: vs2r.v v8, (a6)		; CHECK-NEXT: vs2r.v v8, (a6)
; CHECK-NEXT: sub a7, a7, a3		; CHECK-NEXT: sub a7, a7, a3
; CHECK-NEXT: add a6, a6, a5		; CHECK-NEXT: add a6, a6, a5
; CHECK-NEXT: bnez a7, .LBB11_3		; CHECK-NEXT: bnez a7, .LBB11_3
; CHECK-NEXT: # %bb.4: # %middle.block		; CHECK-NEXT: # %bb.4: # %middle.block
; CHECK-NEXT: beqz a4, .LBB11_7		; CHECK-NEXT: beqz a4, .LBB11_7
; CHECK-NEXT: .LBB11_5: # %for.body.preheader		; CHECK-NEXT: .LBB11_5: # %for.body.preheader
; CHECK-NEXT: addi a3, a2, -1024
; CHECK-NEXT: slli a2, a2, 2		; CHECK-NEXT: slli a2, a2, 2
; CHECK-NEXT: add a0, a0, a2		; CHECK-NEXT: add a2, a0, a2
		; CHECK-NEXT: lui a3, 1
		; CHECK-NEXT: add a0, a0, a3
; CHECK-NEXT: .LBB11_6: # %for.body		; CHECK-NEXT: .LBB11_6: # %for.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: lw a2, 0(a0)		; CHECK-NEXT: lw a3, 0(a2)
; CHECK-NEXT: and a2, a2, a1		; CHECK-NEXT: and a3, a3, a1
; CHECK-NEXT: sw a2, 0(a0)		; CHECK-NEXT: sw a3, 0(a2)
; CHECK-NEXT: addi a3, a3, 1		; CHECK-NEXT: addi a2, a2, 4
; CHECK-NEXT: addi a0, a0, 4		; CHECK-NEXT: bne a2, a0, .LBB11_6
; CHECK-NEXT: bnez a3, .LBB11_6
; CHECK-NEXT: .LBB11_7: # %for.cond.cleanup		; CHECK-NEXT: .LBB11_7: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%0 = call i64 @llvm.vscale.i64()		%0 = call i64 @llvm.vscale.i64()
%1 = shl i64 %0, 2		%1 = shl i64 %0, 2
%min.iters.check = icmp ugt i64 %1, 1024		%min.iters.check = icmp ugt i64 %1, 1024
br i1 %min.iters.check, label %for.body.preheader, label %vector.ph		br i1 %min.iters.check, label %for.body.preheader, label %vector.ph

▲ Show 20 Lines • Show All 64 Lines • ▼ Show 20 Lines
; CHECK-NEXT: vor.vx v8, v8, a1		; CHECK-NEXT: vor.vx v8, v8, a1
; CHECK-NEXT: vs2r.v v8, (a6)		; CHECK-NEXT: vs2r.v v8, (a6)
; CHECK-NEXT: sub a7, a7, a3		; CHECK-NEXT: sub a7, a7, a3
; CHECK-NEXT: add a6, a6, a5		; CHECK-NEXT: add a6, a6, a5
; CHECK-NEXT: bnez a7, .LBB12_3		; CHECK-NEXT: bnez a7, .LBB12_3
; CHECK-NEXT: # %bb.4: # %middle.block		; CHECK-NEXT: # %bb.4: # %middle.block
; CHECK-NEXT: beqz a4, .LBB12_7		; CHECK-NEXT: beqz a4, .LBB12_7
; CHECK-NEXT: .LBB12_5: # %for.body.preheader		; CHECK-NEXT: .LBB12_5: # %for.body.preheader
; CHECK-NEXT: addi a3, a2, -1024
; CHECK-NEXT: slli a2, a2, 2		; CHECK-NEXT: slli a2, a2, 2
; CHECK-NEXT: add a0, a0, a2		; CHECK-NEXT: add a2, a0, a2
		; CHECK-NEXT: lui a3, 1
		; CHECK-NEXT: add a0, a0, a3
; CHECK-NEXT: .LBB12_6: # %for.body		; CHECK-NEXT: .LBB12_6: # %for.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: lw a2, 0(a0)		; CHECK-NEXT: lw a3, 0(a2)
; CHECK-NEXT: or a2, a2, a1		; CHECK-NEXT: or a3, a3, a1
; CHECK-NEXT: sw a2, 0(a0)		; CHECK-NEXT: sw a3, 0(a2)
; CHECK-NEXT: addi a3, a3, 1		; CHECK-NEXT: addi a2, a2, 4
; CHECK-NEXT: addi a0, a0, 4		; CHECK-NEXT: bne a2, a0, .LBB12_6
; CHECK-NEXT: bnez a3, .LBB12_6
; CHECK-NEXT: .LBB12_7: # %for.cond.cleanup		; CHECK-NEXT: .LBB12_7: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%0 = call i64 @llvm.vscale.i64()		%0 = call i64 @llvm.vscale.i64()
%1 = shl i64 %0, 2		%1 = shl i64 %0, 2
%min.iters.check = icmp ugt i64 %1, 1024		%min.iters.check = icmp ugt i64 %1, 1024
br i1 %min.iters.check, label %for.body.preheader, label %vector.ph		br i1 %min.iters.check, label %for.body.preheader, label %vector.ph

▲ Show 20 Lines • Show All 64 Lines • ▼ Show 20 Lines
; CHECK-NEXT: vxor.vx v8, v8, a1		; CHECK-NEXT: vxor.vx v8, v8, a1
; CHECK-NEXT: vs2r.v v8, (a6)		; CHECK-NEXT: vs2r.v v8, (a6)
; CHECK-NEXT: sub a7, a7, a3		; CHECK-NEXT: sub a7, a7, a3
; CHECK-NEXT: add a6, a6, a5		; CHECK-NEXT: add a6, a6, a5
; CHECK-NEXT: bnez a7, .LBB13_3		; CHECK-NEXT: bnez a7, .LBB13_3
; CHECK-NEXT: # %bb.4: # %middle.block		; CHECK-NEXT: # %bb.4: # %middle.block
; CHECK-NEXT: beqz a4, .LBB13_7		; CHECK-NEXT: beqz a4, .LBB13_7
; CHECK-NEXT: .LBB13_5: # %for.body.preheader		; CHECK-NEXT: .LBB13_5: # %for.body.preheader
; CHECK-NEXT: addi a3, a2, -1024
; CHECK-NEXT: slli a2, a2, 2		; CHECK-NEXT: slli a2, a2, 2
; CHECK-NEXT: add a0, a0, a2		; CHECK-NEXT: add a2, a0, a2
		; CHECK-NEXT: lui a3, 1
		; CHECK-NEXT: add a0, a0, a3
; CHECK-NEXT: .LBB13_6: # %for.body		; CHECK-NEXT: .LBB13_6: # %for.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: lw a2, 0(a0)		; CHECK-NEXT: lw a3, 0(a2)
; CHECK-NEXT: xor a2, a2, a1		; CHECK-NEXT: xor a3, a3, a1
; CHECK-NEXT: sw a2, 0(a0)		; CHECK-NEXT: sw a3, 0(a2)
; CHECK-NEXT: addi a3, a3, 1		; CHECK-NEXT: addi a2, a2, 4
; CHECK-NEXT: addi a0, a0, 4		; CHECK-NEXT: bne a2, a0, .LBB13_6
; CHECK-NEXT: bnez a3, .LBB13_6
; CHECK-NEXT: .LBB13_7: # %for.cond.cleanup		; CHECK-NEXT: .LBB13_7: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%0 = call i64 @llvm.vscale.i64()		%0 = call i64 @llvm.vscale.i64()
%1 = shl i64 %0, 2		%1 = shl i64 %0, 2
%min.iters.check = icmp ugt i64 %1, 1024		%min.iters.check = icmp ugt i64 %1, 1024
br i1 %min.iters.check, label %for.body.preheader, label %vector.ph		br i1 %min.iters.check, label %for.body.preheader, label %vector.ph

Show All 38 Lines	for.body: ; preds = %for.body.preheader, %for.body
%indvars.iv.next = add nuw nsw i64 %indvars.iv, 1		%indvars.iv.next = add nuw nsw i64 %indvars.iv, 1
%cmp.not = icmp eq i64 %indvars.iv.next, 1024		%cmp.not = icmp eq i64 %indvars.iv.next, 1024
br i1 %cmp.not, label %for.cond.cleanup, label %for.body		br i1 %cmp.not, label %for.cond.cleanup, label %for.body
}		}

define void @sink_splat_shl(ptr nocapture %a, i32 signext %x) {		define void @sink_splat_shl(ptr nocapture %a, i32 signext %x) {
; CHECK-LABEL: sink_splat_shl:		; CHECK-LABEL: sink_splat_shl:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a2, 1024		; CHECK-NEXT: lui a2, 1
		; CHECK-NEXT: add a2, a0, a2
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: .LBB14_1: # %vector.body		; CHECK-NEXT: .LBB14_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsll.vx v8, v8, a1		; CHECK-NEXT: vsll.vx v8, v8, a1
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a2, a2, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a2, .LBB14_1		; CHECK-NEXT: bne a0, a2, .LBB14_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%broadcast.splatinsert = insertelement <4 x i32> poison, i32 %x, i32 0		%broadcast.splatinsert = insertelement <4 x i32> poison, i32 %x, i32 0
%broadcast.splat = shufflevector <4 x i32> %broadcast.splatinsert, <4 x i32> poison, <4 x i32> zeroinitializer		%broadcast.splat = shufflevector <4 x i32> %broadcast.splatinsert, <4 x i32> poison, <4 x i32> zeroinitializer
br label %vector.body		br label %vector.body

vector.body: ; preds = %vector.body, %entry		vector.body: ; preds = %vector.body, %entry
%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]		%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]
%0 = getelementptr inbounds i32, ptr %a, i64 %index		%0 = getelementptr inbounds i32, ptr %a, i64 %index
%wide.load = load <4 x i32>, ptr %0, align 4		%wide.load = load <4 x i32>, ptr %0, align 4
%1 = shl <4 x i32> %wide.load, %broadcast.splat		%1 = shl <4 x i32> %wide.load, %broadcast.splat
store <4 x i32> %1, ptr %0, align 4		store <4 x i32> %1, ptr %0, align 4
%index.next = add nuw i64 %index, 4		%index.next = add nuw i64 %index, 4
%2 = icmp eq i64 %index.next, 1024		%2 = icmp eq i64 %index.next, 1024
br i1 %2, label %for.cond.cleanup, label %vector.body		br i1 %2, label %for.cond.cleanup, label %vector.body

for.cond.cleanup: ; preds = %vector.body		for.cond.cleanup: ; preds = %vector.body
ret void		ret void
}		}

define void @sink_splat_lshr(ptr nocapture %a, i32 signext %x) {		define void @sink_splat_lshr(ptr nocapture %a, i32 signext %x) {
; CHECK-LABEL: sink_splat_lshr:		; CHECK-LABEL: sink_splat_lshr:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a2, 1024		; CHECK-NEXT: lui a2, 1
		; CHECK-NEXT: add a2, a0, a2
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: .LBB15_1: # %vector.body		; CHECK-NEXT: .LBB15_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsrl.vx v8, v8, a1		; CHECK-NEXT: vsrl.vx v8, v8, a1
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a2, a2, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a2, .LBB15_1		; CHECK-NEXT: bne a0, a2, .LBB15_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%broadcast.splatinsert = insertelement <4 x i32> poison, i32 %x, i32 0		%broadcast.splatinsert = insertelement <4 x i32> poison, i32 %x, i32 0
%broadcast.splat = shufflevector <4 x i32> %broadcast.splatinsert, <4 x i32> poison, <4 x i32> zeroinitializer		%broadcast.splat = shufflevector <4 x i32> %broadcast.splatinsert, <4 x i32> poison, <4 x i32> zeroinitializer
br label %vector.body		br label %vector.body

vector.body: ; preds = %vector.body, %entry		vector.body: ; preds = %vector.body, %entry
%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]		%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]
%0 = getelementptr inbounds i32, ptr %a, i64 %index		%0 = getelementptr inbounds i32, ptr %a, i64 %index
%wide.load = load <4 x i32>, ptr %0, align 4		%wide.load = load <4 x i32>, ptr %0, align 4
%1 = lshr <4 x i32> %wide.load, %broadcast.splat		%1 = lshr <4 x i32> %wide.load, %broadcast.splat
store <4 x i32> %1, ptr %0, align 4		store <4 x i32> %1, ptr %0, align 4
%index.next = add nuw i64 %index, 4		%index.next = add nuw i64 %index, 4
%2 = icmp eq i64 %index.next, 1024		%2 = icmp eq i64 %index.next, 1024
br i1 %2, label %for.cond.cleanup, label %vector.body		br i1 %2, label %for.cond.cleanup, label %vector.body

for.cond.cleanup: ; preds = %vector.body		for.cond.cleanup: ; preds = %vector.body
ret void		ret void
}		}

define void @sink_splat_ashr(ptr nocapture %a, i32 signext %x) {		define void @sink_splat_ashr(ptr nocapture %a, i32 signext %x) {
; CHECK-LABEL: sink_splat_ashr:		; CHECK-LABEL: sink_splat_ashr:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a2, 1024		; CHECK-NEXT: lui a2, 1
		; CHECK-NEXT: add a2, a0, a2
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: .LBB16_1: # %vector.body		; CHECK-NEXT: .LBB16_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsra.vx v8, v8, a1		; CHECK-NEXT: vsra.vx v8, v8, a1
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a2, a2, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a2, .LBB16_1		; CHECK-NEXT: bne a0, a2, .LBB16_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%broadcast.splatinsert = insertelement <4 x i32> poison, i32 %x, i32 0		%broadcast.splatinsert = insertelement <4 x i32> poison, i32 %x, i32 0
%broadcast.splat = shufflevector <4 x i32> %broadcast.splatinsert, <4 x i32> poison, <4 x i32> zeroinitializer		%broadcast.splat = shufflevector <4 x i32> %broadcast.splatinsert, <4 x i32> poison, <4 x i32> zeroinitializer
br label %vector.body		br label %vector.body

vector.body: ; preds = %vector.body, %entry		vector.body: ; preds = %vector.body, %entry
Show All 34 Lines
; CHECK-NEXT: vsll.vx v8, v8, a1		; CHECK-NEXT: vsll.vx v8, v8, a1
; CHECK-NEXT: vs2r.v v8, (a6)		; CHECK-NEXT: vs2r.v v8, (a6)
; CHECK-NEXT: sub a7, a7, a3		; CHECK-NEXT: sub a7, a7, a3
; CHECK-NEXT: add a6, a6, a5		; CHECK-NEXT: add a6, a6, a5
; CHECK-NEXT: bnez a7, .LBB17_3		; CHECK-NEXT: bnez a7, .LBB17_3
; CHECK-NEXT: # %bb.4: # %middle.block		; CHECK-NEXT: # %bb.4: # %middle.block
; CHECK-NEXT: beqz a4, .LBB17_7		; CHECK-NEXT: beqz a4, .LBB17_7
; CHECK-NEXT: .LBB17_5: # %for.body.preheader		; CHECK-NEXT: .LBB17_5: # %for.body.preheader
; CHECK-NEXT: addi a3, a2, -1024
; CHECK-NEXT: slli a2, a2, 2		; CHECK-NEXT: slli a2, a2, 2
; CHECK-NEXT: add a0, a0, a2		; CHECK-NEXT: add a2, a0, a2
		; CHECK-NEXT: lui a3, 1
		; CHECK-NEXT: add a0, a0, a3
; CHECK-NEXT: .LBB17_6: # %for.body		; CHECK-NEXT: .LBB17_6: # %for.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: lw a2, 0(a0)		; CHECK-NEXT: lw a3, 0(a2)
; CHECK-NEXT: sllw a2, a2, a1		; CHECK-NEXT: sllw a3, a3, a1
; CHECK-NEXT: sw a2, 0(a0)		; CHECK-NEXT: sw a3, 0(a2)
; CHECK-NEXT: addi a3, a3, 1		; CHECK-NEXT: addi a2, a2, 4
; CHECK-NEXT: addi a0, a0, 4		; CHECK-NEXT: bne a2, a0, .LBB17_6
; CHECK-NEXT: bnez a3, .LBB17_6
; CHECK-NEXT: .LBB17_7: # %for.cond.cleanup		; CHECK-NEXT: .LBB17_7: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%0 = call i64 @llvm.vscale.i64()		%0 = call i64 @llvm.vscale.i64()
%1 = shl i64 %0, 2		%1 = shl i64 %0, 2
%min.iters.check = icmp ugt i64 %1, 1024		%min.iters.check = icmp ugt i64 %1, 1024
br i1 %min.iters.check, label %for.body.preheader, label %vector.ph		br i1 %min.iters.check, label %for.body.preheader, label %vector.ph

▲ Show 20 Lines • Show All 64 Lines • ▼ Show 20 Lines
; CHECK-NEXT: vsrl.vx v8, v8, a1		; CHECK-NEXT: vsrl.vx v8, v8, a1
; CHECK-NEXT: vs2r.v v8, (a6)		; CHECK-NEXT: vs2r.v v8, (a6)
; CHECK-NEXT: sub a7, a7, a3		; CHECK-NEXT: sub a7, a7, a3
; CHECK-NEXT: add a6, a6, a5		; CHECK-NEXT: add a6, a6, a5
; CHECK-NEXT: bnez a7, .LBB18_3		; CHECK-NEXT: bnez a7, .LBB18_3
; CHECK-NEXT: # %bb.4: # %middle.block		; CHECK-NEXT: # %bb.4: # %middle.block
; CHECK-NEXT: beqz a4, .LBB18_7		; CHECK-NEXT: beqz a4, .LBB18_7
; CHECK-NEXT: .LBB18_5: # %for.body.preheader		; CHECK-NEXT: .LBB18_5: # %for.body.preheader
; CHECK-NEXT: addi a3, a2, -1024
; CHECK-NEXT: slli a2, a2, 2		; CHECK-NEXT: slli a2, a2, 2
; CHECK-NEXT: add a0, a0, a2		; CHECK-NEXT: add a2, a0, a2
		; CHECK-NEXT: lui a3, 1
		; CHECK-NEXT: add a0, a0, a3
; CHECK-NEXT: .LBB18_6: # %for.body		; CHECK-NEXT: .LBB18_6: # %for.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: lw a2, 0(a0)		; CHECK-NEXT: lw a3, 0(a2)
; CHECK-NEXT: srlw a2, a2, a1		; CHECK-NEXT: srlw a3, a3, a1
; CHECK-NEXT: sw a2, 0(a0)		; CHECK-NEXT: sw a3, 0(a2)
; CHECK-NEXT: addi a3, a3, 1		; CHECK-NEXT: addi a2, a2, 4
; CHECK-NEXT: addi a0, a0, 4		; CHECK-NEXT: bne a2, a0, .LBB18_6
; CHECK-NEXT: bnez a3, .LBB18_6
; CHECK-NEXT: .LBB18_7: # %for.cond.cleanup		; CHECK-NEXT: .LBB18_7: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%0 = call i64 @llvm.vscale.i64()		%0 = call i64 @llvm.vscale.i64()
%1 = shl i64 %0, 2		%1 = shl i64 %0, 2
%min.iters.check = icmp ugt i64 %1, 1024		%min.iters.check = icmp ugt i64 %1, 1024
br i1 %min.iters.check, label %for.body.preheader, label %vector.ph		br i1 %min.iters.check, label %for.body.preheader, label %vector.ph

▲ Show 20 Lines • Show All 64 Lines • ▼ Show 20 Lines
; CHECK-NEXT: vsra.vi v8, v8, 2		; CHECK-NEXT: vsra.vi v8, v8, 2
; CHECK-NEXT: vs2r.v v8, (a5)		; CHECK-NEXT: vs2r.v v8, (a5)
; CHECK-NEXT: sub a6, a6, a2		; CHECK-NEXT: sub a6, a6, a2
; CHECK-NEXT: add a5, a5, a4		; CHECK-NEXT: add a5, a5, a4
; CHECK-NEXT: bnez a6, .LBB19_3		; CHECK-NEXT: bnez a6, .LBB19_3
; CHECK-NEXT: # %bb.4: # %middle.block		; CHECK-NEXT: # %bb.4: # %middle.block
; CHECK-NEXT: beqz a3, .LBB19_7		; CHECK-NEXT: beqz a3, .LBB19_7
; CHECK-NEXT: .LBB19_5: # %for.body.preheader		; CHECK-NEXT: .LBB19_5: # %for.body.preheader
; CHECK-NEXT: addi a2, a1, -1024
; CHECK-NEXT: slli a1, a1, 2		; CHECK-NEXT: slli a1, a1, 2
; CHECK-NEXT: add a0, a0, a1		; CHECK-NEXT: add a1, a0, a1
		; CHECK-NEXT: lui a2, 1
		; CHECK-NEXT: add a0, a0, a2
; CHECK-NEXT: .LBB19_6: # %for.body		; CHECK-NEXT: .LBB19_6: # %for.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: lw a1, 0(a0)		; CHECK-NEXT: lw a2, 0(a1)
; CHECK-NEXT: srli a1, a1, 2		; CHECK-NEXT: srli a2, a2, 2
; CHECK-NEXT: sw a1, 0(a0)		; CHECK-NEXT: sw a2, 0(a1)
; CHECK-NEXT: addi a2, a2, 1		; CHECK-NEXT: addi a1, a1, 4
; CHECK-NEXT: addi a0, a0, 4		; CHECK-NEXT: bne a1, a0, .LBB19_6
; CHECK-NEXT: bnez a2, .LBB19_6
; CHECK-NEXT: .LBB19_7: # %for.cond.cleanup		; CHECK-NEXT: .LBB19_7: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%0 = call i64 @llvm.vscale.i64()		%0 = call i64 @llvm.vscale.i64()
%1 = shl i64 %0, 2		%1 = shl i64 %0, 2
%min.iters.check = icmp ugt i64 %1, 1024		%min.iters.check = icmp ugt i64 %1, 1024
br i1 %min.iters.check, label %for.body.preheader, label %vector.ph		br i1 %min.iters.check, label %for.body.preheader, label %vector.ph

Show All 38 Lines	for.body: ; preds = %for.body.preheader, %for.body
%indvars.iv.next = add nuw nsw i64 %indvars.iv, 1		%indvars.iv.next = add nuw nsw i64 %indvars.iv, 1
%cmp.not = icmp eq i64 %indvars.iv.next, 1024		%cmp.not = icmp eq i64 %indvars.iv.next, 1024
br i1 %cmp.not, label %for.cond.cleanup, label %for.body		br i1 %cmp.not, label %for.cond.cleanup, label %for.body
}		}

define void @sink_splat_fmul(ptr nocapture %a, float %x) {		define void @sink_splat_fmul(ptr nocapture %a, float %x) {
; CHECK-LABEL: sink_splat_fmul:		; CHECK-LABEL: sink_splat_fmul:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a1, 1024		; CHECK-NEXT: lui a1, 1
		; CHECK-NEXT: add a1, a0, a1
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: .LBB20_1: # %vector.body		; CHECK-NEXT: .LBB20_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vfmul.vf v8, v8, fa0		; CHECK-NEXT: vfmul.vf v8, v8, fa0
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a1, a1, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a1, .LBB20_1		; CHECK-NEXT: bne a0, a1, .LBB20_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%broadcast.splatinsert = insertelement <4 x float> poison, float %x, i32 0		%broadcast.splatinsert = insertelement <4 x float> poison, float %x, i32 0
%broadcast.splat = shufflevector <4 x float> %broadcast.splatinsert, <4 x float> poison, <4 x i32> zeroinitializer		%broadcast.splat = shufflevector <4 x float> %broadcast.splatinsert, <4 x float> poison, <4 x i32> zeroinitializer
br label %vector.body		br label %vector.body

vector.body: ; preds = %vector.body, %entry		vector.body: ; preds = %vector.body, %entry
%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]		%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]
%0 = getelementptr inbounds float, ptr %a, i64 %index		%0 = getelementptr inbounds float, ptr %a, i64 %index
%wide.load = load <4 x float>, ptr %0, align 4		%wide.load = load <4 x float>, ptr %0, align 4
%1 = fmul <4 x float> %wide.load, %broadcast.splat		%1 = fmul <4 x float> %wide.load, %broadcast.splat
store <4 x float> %1, ptr %0, align 4		store <4 x float> %1, ptr %0, align 4
%index.next = add nuw i64 %index, 4		%index.next = add nuw i64 %index, 4
%2 = icmp eq i64 %index.next, 1024		%2 = icmp eq i64 %index.next, 1024
br i1 %2, label %for.cond.cleanup, label %vector.body		br i1 %2, label %for.cond.cleanup, label %vector.body

for.cond.cleanup: ; preds = %vector.body		for.cond.cleanup: ; preds = %vector.body
ret void		ret void
}		}

define void @sink_splat_fdiv(ptr nocapture %a, float %x) {		define void @sink_splat_fdiv(ptr nocapture %a, float %x) {
; CHECK-LABEL: sink_splat_fdiv:		; CHECK-LABEL: sink_splat_fdiv:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a1, 1024		; CHECK-NEXT: lui a1, 1
		; CHECK-NEXT: add a1, a0, a1
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: .LBB21_1: # %vector.body		; CHECK-NEXT: .LBB21_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vfdiv.vf v8, v8, fa0		; CHECK-NEXT: vfdiv.vf v8, v8, fa0
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a1, a1, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a1, .LBB21_1		; CHECK-NEXT: bne a0, a1, .LBB21_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%broadcast.splatinsert = insertelement <4 x float> poison, float %x, i32 0		%broadcast.splatinsert = insertelement <4 x float> poison, float %x, i32 0
%broadcast.splat = shufflevector <4 x float> %broadcast.splatinsert, <4 x float> poison, <4 x i32> zeroinitializer		%broadcast.splat = shufflevector <4 x float> %broadcast.splatinsert, <4 x float> poison, <4 x i32> zeroinitializer
br label %vector.body		br label %vector.body

vector.body: ; preds = %vector.body, %entry		vector.body: ; preds = %vector.body, %entry
%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]		%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]
%0 = getelementptr inbounds float, ptr %a, i64 %index		%0 = getelementptr inbounds float, ptr %a, i64 %index
%wide.load = load <4 x float>, ptr %0, align 4		%wide.load = load <4 x float>, ptr %0, align 4
%1 = fdiv <4 x float> %wide.load, %broadcast.splat		%1 = fdiv <4 x float> %wide.load, %broadcast.splat
store <4 x float> %1, ptr %0, align 4		store <4 x float> %1, ptr %0, align 4
%index.next = add nuw i64 %index, 4		%index.next = add nuw i64 %index, 4
%2 = icmp eq i64 %index.next, 1024		%2 = icmp eq i64 %index.next, 1024
br i1 %2, label %for.cond.cleanup, label %vector.body		br i1 %2, label %for.cond.cleanup, label %vector.body

for.cond.cleanup: ; preds = %vector.body		for.cond.cleanup: ; preds = %vector.body
ret void		ret void
}		}

define void @sink_splat_frdiv(ptr nocapture %a, float %x) {		define void @sink_splat_frdiv(ptr nocapture %a, float %x) {
; CHECK-LABEL: sink_splat_frdiv:		; CHECK-LABEL: sink_splat_frdiv:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a1, 1024		; CHECK-NEXT: lui a1, 1
		; CHECK-NEXT: add a1, a0, a1
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: .LBB22_1: # %vector.body		; CHECK-NEXT: .LBB22_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vfrdiv.vf v8, v8, fa0		; CHECK-NEXT: vfrdiv.vf v8, v8, fa0
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a1, a1, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a1, .LBB22_1		; CHECK-NEXT: bne a0, a1, .LBB22_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%broadcast.splatinsert = insertelement <4 x float> poison, float %x, i32 0		%broadcast.splatinsert = insertelement <4 x float> poison, float %x, i32 0
%broadcast.splat = shufflevector <4 x float> %broadcast.splatinsert, <4 x float> poison, <4 x i32> zeroinitializer		%broadcast.splat = shufflevector <4 x float> %broadcast.splatinsert, <4 x float> poison, <4 x i32> zeroinitializer
br label %vector.body		br label %vector.body

vector.body: ; preds = %vector.body, %entry		vector.body: ; preds = %vector.body, %entry
%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]		%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]
%0 = getelementptr inbounds float, ptr %a, i64 %index		%0 = getelementptr inbounds float, ptr %a, i64 %index
%wide.load = load <4 x float>, ptr %0, align 4		%wide.load = load <4 x float>, ptr %0, align 4
%1 = fdiv <4 x float> %broadcast.splat, %wide.load		%1 = fdiv <4 x float> %broadcast.splat, %wide.load
store <4 x float> %1, ptr %0, align 4		store <4 x float> %1, ptr %0, align 4
%index.next = add nuw i64 %index, 4		%index.next = add nuw i64 %index, 4
%2 = icmp eq i64 %index.next, 1024		%2 = icmp eq i64 %index.next, 1024
br i1 %2, label %for.cond.cleanup, label %vector.body		br i1 %2, label %for.cond.cleanup, label %vector.body

for.cond.cleanup: ; preds = %vector.body		for.cond.cleanup: ; preds = %vector.body
ret void		ret void
}		}

define void @sink_splat_fadd(ptr nocapture %a, float %x) {		define void @sink_splat_fadd(ptr nocapture %a, float %x) {
; CHECK-LABEL: sink_splat_fadd:		; CHECK-LABEL: sink_splat_fadd:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a1, 1024		; CHECK-NEXT: lui a1, 1
		; CHECK-NEXT: add a1, a0, a1
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: .LBB23_1: # %vector.body		; CHECK-NEXT: .LBB23_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vfadd.vf v8, v8, fa0		; CHECK-NEXT: vfadd.vf v8, v8, fa0
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a1, a1, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a1, .LBB23_1		; CHECK-NEXT: bne a0, a1, .LBB23_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%broadcast.splatinsert = insertelement <4 x float> poison, float %x, i32 0		%broadcast.splatinsert = insertelement <4 x float> poison, float %x, i32 0
%broadcast.splat = shufflevector <4 x float> %broadcast.splatinsert, <4 x float> poison, <4 x i32> zeroinitializer		%broadcast.splat = shufflevector <4 x float> %broadcast.splatinsert, <4 x float> poison, <4 x i32> zeroinitializer
br label %vector.body		br label %vector.body

vector.body: ; preds = %vector.body, %entry		vector.body: ; preds = %vector.body, %entry
%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]		%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]
%0 = getelementptr inbounds float, ptr %a, i64 %index		%0 = getelementptr inbounds float, ptr %a, i64 %index
%wide.load = load <4 x float>, ptr %0, align 4		%wide.load = load <4 x float>, ptr %0, align 4
%1 = fadd <4 x float> %wide.load, %broadcast.splat		%1 = fadd <4 x float> %wide.load, %broadcast.splat
store <4 x float> %1, ptr %0, align 4		store <4 x float> %1, ptr %0, align 4
%index.next = add nuw i64 %index, 4		%index.next = add nuw i64 %index, 4
%2 = icmp eq i64 %index.next, 1024		%2 = icmp eq i64 %index.next, 1024
br i1 %2, label %for.cond.cleanup, label %vector.body		br i1 %2, label %for.cond.cleanup, label %vector.body

for.cond.cleanup: ; preds = %vector.body		for.cond.cleanup: ; preds = %vector.body
ret void		ret void
}		}

define void @sink_splat_fsub(ptr nocapture %a, float %x) {		define void @sink_splat_fsub(ptr nocapture %a, float %x) {
; CHECK-LABEL: sink_splat_fsub:		; CHECK-LABEL: sink_splat_fsub:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a1, 1024		; CHECK-NEXT: lui a1, 1
		; CHECK-NEXT: add a1, a0, a1
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: .LBB24_1: # %vector.body		; CHECK-NEXT: .LBB24_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vfsub.vf v8, v8, fa0		; CHECK-NEXT: vfsub.vf v8, v8, fa0
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a1, a1, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a1, .LBB24_1		; CHECK-NEXT: bne a0, a1, .LBB24_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%broadcast.splatinsert = insertelement <4 x float> poison, float %x, i32 0		%broadcast.splatinsert = insertelement <4 x float> poison, float %x, i32 0
%broadcast.splat = shufflevector <4 x float> %broadcast.splatinsert, <4 x float> poison, <4 x i32> zeroinitializer		%broadcast.splat = shufflevector <4 x float> %broadcast.splatinsert, <4 x float> poison, <4 x i32> zeroinitializer
br label %vector.body		br label %vector.body

vector.body: ; preds = %vector.body, %entry		vector.body: ; preds = %vector.body, %entry
%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]		%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]
%0 = getelementptr inbounds float, ptr %a, i64 %index		%0 = getelementptr inbounds float, ptr %a, i64 %index
%wide.load = load <4 x float>, ptr %0, align 4		%wide.load = load <4 x float>, ptr %0, align 4
%1 = fsub <4 x float> %wide.load, %broadcast.splat		%1 = fsub <4 x float> %wide.load, %broadcast.splat
store <4 x float> %1, ptr %0, align 4		store <4 x float> %1, ptr %0, align 4
%index.next = add nuw i64 %index, 4		%index.next = add nuw i64 %index, 4
%2 = icmp eq i64 %index.next, 1024		%2 = icmp eq i64 %index.next, 1024
br i1 %2, label %for.cond.cleanup, label %vector.body		br i1 %2, label %for.cond.cleanup, label %vector.body

for.cond.cleanup: ; preds = %vector.body		for.cond.cleanup: ; preds = %vector.body
ret void		ret void
}		}

define void @sink_splat_frsub(ptr nocapture %a, float %x) {		define void @sink_splat_frsub(ptr nocapture %a, float %x) {
; CHECK-LABEL: sink_splat_frsub:		; CHECK-LABEL: sink_splat_frsub:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a1, 1024		; CHECK-NEXT: lui a1, 1
		; CHECK-NEXT: add a1, a0, a1
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: .LBB25_1: # %vector.body		; CHECK-NEXT: .LBB25_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vfrsub.vf v8, v8, fa0		; CHECK-NEXT: vfrsub.vf v8, v8, fa0
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a1, a1, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a1, .LBB25_1		; CHECK-NEXT: bne a0, a1, .LBB25_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%broadcast.splatinsert = insertelement <4 x float> poison, float %x, i32 0		%broadcast.splatinsert = insertelement <4 x float> poison, float %x, i32 0
%broadcast.splat = shufflevector <4 x float> %broadcast.splatinsert, <4 x float> poison, <4 x i32> zeroinitializer		%broadcast.splat = shufflevector <4 x float> %broadcast.splatinsert, <4 x float> poison, <4 x i32> zeroinitializer
br label %vector.body		br label %vector.body

vector.body: ; preds = %vector.body, %entry		vector.body: ; preds = %vector.body, %entry
Show All 33 Lines
; CHECK-NEXT: vfmul.vf v8, v8, fa0		; CHECK-NEXT: vfmul.vf v8, v8, fa0
; CHECK-NEXT: vs1r.v v8, (a5)		; CHECK-NEXT: vs1r.v v8, (a5)
; CHECK-NEXT: sub a6, a6, a3		; CHECK-NEXT: sub a6, a6, a3
; CHECK-NEXT: add a5, a5, a2		; CHECK-NEXT: add a5, a5, a2
; CHECK-NEXT: bnez a6, .LBB26_3		; CHECK-NEXT: bnez a6, .LBB26_3
; CHECK-NEXT: # %bb.4: # %middle.block		; CHECK-NEXT: # %bb.4: # %middle.block
; CHECK-NEXT: beqz a4, .LBB26_7		; CHECK-NEXT: beqz a4, .LBB26_7
; CHECK-NEXT: .LBB26_5: # %for.body.preheader		; CHECK-NEXT: .LBB26_5: # %for.body.preheader
; CHECK-NEXT: addi a2, a1, -1024
; CHECK-NEXT: slli a1, a1, 2		; CHECK-NEXT: slli a1, a1, 2
; CHECK-NEXT: add a0, a0, a1		; CHECK-NEXT: add a1, a0, a1
		; CHECK-NEXT: lui a2, 1
		; CHECK-NEXT: add a0, a0, a2
; CHECK-NEXT: .LBB26_6: # %for.body		; CHECK-NEXT: .LBB26_6: # %for.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: flw fa5, 0(a0)		; CHECK-NEXT: flw fa5, 0(a1)
; CHECK-NEXT: fmul.s fa5, fa5, fa0		; CHECK-NEXT: fmul.s fa5, fa5, fa0
; CHECK-NEXT: fsw fa5, 0(a0)		; CHECK-NEXT: fsw fa5, 0(a1)
; CHECK-NEXT: addi a2, a2, 1		; CHECK-NEXT: addi a1, a1, 4
; CHECK-NEXT: addi a0, a0, 4		; CHECK-NEXT: bne a1, a0, .LBB26_6
; CHECK-NEXT: bnez a2, .LBB26_6
; CHECK-NEXT: .LBB26_7: # %for.cond.cleanup		; CHECK-NEXT: .LBB26_7: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%0 = call i64 @llvm.vscale.i64()		%0 = call i64 @llvm.vscale.i64()
%1 = shl i64 %0, 1		%1 = shl i64 %0, 1
%min.iters.check = icmp ugt i64 %1, 1024		%min.iters.check = icmp ugt i64 %1, 1024
br i1 %min.iters.check, label %for.body.preheader, label %vector.ph		br i1 %min.iters.check, label %for.body.preheader, label %vector.ph

▲ Show 20 Lines • Show All 63 Lines • ▼ Show 20 Lines
; CHECK-NEXT: vfdiv.vf v8, v8, fa0		; CHECK-NEXT: vfdiv.vf v8, v8, fa0
; CHECK-NEXT: vs1r.v v8, (a5)		; CHECK-NEXT: vs1r.v v8, (a5)
; CHECK-NEXT: sub a6, a6, a3		; CHECK-NEXT: sub a6, a6, a3
; CHECK-NEXT: add a5, a5, a2		; CHECK-NEXT: add a5, a5, a2
; CHECK-NEXT: bnez a6, .LBB27_3		; CHECK-NEXT: bnez a6, .LBB27_3
; CHECK-NEXT: # %bb.4: # %middle.block		; CHECK-NEXT: # %bb.4: # %middle.block
; CHECK-NEXT: beqz a4, .LBB27_7		; CHECK-NEXT: beqz a4, .LBB27_7
; CHECK-NEXT: .LBB27_5: # %for.body.preheader		; CHECK-NEXT: .LBB27_5: # %for.body.preheader
; CHECK-NEXT: addi a2, a1, -1024
; CHECK-NEXT: slli a1, a1, 2		; CHECK-NEXT: slli a1, a1, 2
; CHECK-NEXT: add a0, a0, a1		; CHECK-NEXT: add a1, a0, a1
		; CHECK-NEXT: lui a2, 1
		; CHECK-NEXT: add a0, a0, a2
; CHECK-NEXT: .LBB27_6: # %for.body		; CHECK-NEXT: .LBB27_6: # %for.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: flw fa5, 0(a0)		; CHECK-NEXT: flw fa5, 0(a1)
; CHECK-NEXT: fdiv.s fa5, fa5, fa0		; CHECK-NEXT: fdiv.s fa5, fa5, fa0
; CHECK-NEXT: fsw fa5, 0(a0)		; CHECK-NEXT: fsw fa5, 0(a1)
; CHECK-NEXT: addi a2, a2, 1		; CHECK-NEXT: addi a1, a1, 4
; CHECK-NEXT: addi a0, a0, 4		; CHECK-NEXT: bne a1, a0, .LBB27_6
; CHECK-NEXT: bnez a2, .LBB27_6
; CHECK-NEXT: .LBB27_7: # %for.cond.cleanup		; CHECK-NEXT: .LBB27_7: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%0 = call i64 @llvm.vscale.i64()		%0 = call i64 @llvm.vscale.i64()
%1 = shl i64 %0, 1		%1 = shl i64 %0, 1
%min.iters.check = icmp ugt i64 %1, 1024		%min.iters.check = icmp ugt i64 %1, 1024
br i1 %min.iters.check, label %for.body.preheader, label %vector.ph		br i1 %min.iters.check, label %for.body.preheader, label %vector.ph

▲ Show 20 Lines • Show All 63 Lines • ▼ Show 20 Lines
; CHECK-NEXT: vfrdiv.vf v8, v8, fa0		; CHECK-NEXT: vfrdiv.vf v8, v8, fa0
; CHECK-NEXT: vs1r.v v8, (a5)		; CHECK-NEXT: vs1r.v v8, (a5)
; CHECK-NEXT: sub a6, a6, a3		; CHECK-NEXT: sub a6, a6, a3
; CHECK-NEXT: add a5, a5, a2		; CHECK-NEXT: add a5, a5, a2
; CHECK-NEXT: bnez a6, .LBB28_3		; CHECK-NEXT: bnez a6, .LBB28_3
; CHECK-NEXT: # %bb.4: # %middle.block		; CHECK-NEXT: # %bb.4: # %middle.block
; CHECK-NEXT: beqz a4, .LBB28_7		; CHECK-NEXT: beqz a4, .LBB28_7
; CHECK-NEXT: .LBB28_5: # %for.body.preheader		; CHECK-NEXT: .LBB28_5: # %for.body.preheader
; CHECK-NEXT: addi a2, a1, -1024
; CHECK-NEXT: slli a1, a1, 2		; CHECK-NEXT: slli a1, a1, 2
; CHECK-NEXT: add a0, a0, a1		; CHECK-NEXT: add a1, a0, a1
		; CHECK-NEXT: lui a2, 1
		; CHECK-NEXT: add a0, a0, a2
; CHECK-NEXT: .LBB28_6: # %for.body		; CHECK-NEXT: .LBB28_6: # %for.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: flw fa5, 0(a0)		; CHECK-NEXT: flw fa5, 0(a1)
; CHECK-NEXT: fdiv.s fa5, fa0, fa5		; CHECK-NEXT: fdiv.s fa5, fa0, fa5
; CHECK-NEXT: fsw fa5, 0(a0)		; CHECK-NEXT: fsw fa5, 0(a1)
; CHECK-NEXT: addi a2, a2, 1		; CHECK-NEXT: addi a1, a1, 4
; CHECK-NEXT: addi a0, a0, 4		; CHECK-NEXT: bne a1, a0, .LBB28_6
; CHECK-NEXT: bnez a2, .LBB28_6
; CHECK-NEXT: .LBB28_7: # %for.cond.cleanup		; CHECK-NEXT: .LBB28_7: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%0 = call i64 @llvm.vscale.i64()		%0 = call i64 @llvm.vscale.i64()
%1 = shl i64 %0, 1		%1 = shl i64 %0, 1
%min.iters.check = icmp ugt i64 %1, 1024		%min.iters.check = icmp ugt i64 %1, 1024
br i1 %min.iters.check, label %for.body.preheader, label %vector.ph		br i1 %min.iters.check, label %for.body.preheader, label %vector.ph

▲ Show 20 Lines • Show All 63 Lines • ▼ Show 20 Lines
; CHECK-NEXT: vfadd.vf v8, v8, fa0		; CHECK-NEXT: vfadd.vf v8, v8, fa0
; CHECK-NEXT: vs1r.v v8, (a5)		; CHECK-NEXT: vs1r.v v8, (a5)
; CHECK-NEXT: sub a6, a6, a3		; CHECK-NEXT: sub a6, a6, a3
; CHECK-NEXT: add a5, a5, a2		; CHECK-NEXT: add a5, a5, a2
; CHECK-NEXT: bnez a6, .LBB29_3		; CHECK-NEXT: bnez a6, .LBB29_3
; CHECK-NEXT: # %bb.4: # %middle.block		; CHECK-NEXT: # %bb.4: # %middle.block
; CHECK-NEXT: beqz a4, .LBB29_7		; CHECK-NEXT: beqz a4, .LBB29_7
; CHECK-NEXT: .LBB29_5: # %for.body.preheader		; CHECK-NEXT: .LBB29_5: # %for.body.preheader
; CHECK-NEXT: addi a2, a1, -1024
; CHECK-NEXT: slli a1, a1, 2		; CHECK-NEXT: slli a1, a1, 2
; CHECK-NEXT: add a0, a0, a1		; CHECK-NEXT: add a1, a0, a1
		; CHECK-NEXT: lui a2, 1
		; CHECK-NEXT: add a0, a0, a2
; CHECK-NEXT: .LBB29_6: # %for.body		; CHECK-NEXT: .LBB29_6: # %for.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: flw fa5, 0(a0)		; CHECK-NEXT: flw fa5, 0(a1)
; CHECK-NEXT: fadd.s fa5, fa5, fa0		; CHECK-NEXT: fadd.s fa5, fa5, fa0
; CHECK-NEXT: fsw fa5, 0(a0)		; CHECK-NEXT: fsw fa5, 0(a1)
; CHECK-NEXT: addi a2, a2, 1		; CHECK-NEXT: addi a1, a1, 4
; CHECK-NEXT: addi a0, a0, 4		; CHECK-NEXT: bne a1, a0, .LBB29_6
; CHECK-NEXT: bnez a2, .LBB29_6
; CHECK-NEXT: .LBB29_7: # %for.cond.cleanup		; CHECK-NEXT: .LBB29_7: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%0 = call i64 @llvm.vscale.i64()		%0 = call i64 @llvm.vscale.i64()
%1 = shl i64 %0, 1		%1 = shl i64 %0, 1
%min.iters.check = icmp ugt i64 %1, 1024		%min.iters.check = icmp ugt i64 %1, 1024
br i1 %min.iters.check, label %for.body.preheader, label %vector.ph		br i1 %min.iters.check, label %for.body.preheader, label %vector.ph

▲ Show 20 Lines • Show All 63 Lines • ▼ Show 20 Lines
; CHECK-NEXT: vfsub.vf v8, v8, fa0		; CHECK-NEXT: vfsub.vf v8, v8, fa0
; CHECK-NEXT: vs1r.v v8, (a5)		; CHECK-NEXT: vs1r.v v8, (a5)
; CHECK-NEXT: sub a6, a6, a3		; CHECK-NEXT: sub a6, a6, a3
; CHECK-NEXT: add a5, a5, a2		; CHECK-NEXT: add a5, a5, a2
; CHECK-NEXT: bnez a6, .LBB30_3		; CHECK-NEXT: bnez a6, .LBB30_3
; CHECK-NEXT: # %bb.4: # %middle.block		; CHECK-NEXT: # %bb.4: # %middle.block
; CHECK-NEXT: beqz a4, .LBB30_7		; CHECK-NEXT: beqz a4, .LBB30_7
; CHECK-NEXT: .LBB30_5: # %for.body.preheader		; CHECK-NEXT: .LBB30_5: # %for.body.preheader
; CHECK-NEXT: addi a2, a1, -1024
; CHECK-NEXT: slli a1, a1, 2		; CHECK-NEXT: slli a1, a1, 2
; CHECK-NEXT: add a0, a0, a1		; CHECK-NEXT: add a1, a0, a1
		; CHECK-NEXT: lui a2, 1
		; CHECK-NEXT: add a0, a0, a2
; CHECK-NEXT: .LBB30_6: # %for.body		; CHECK-NEXT: .LBB30_6: # %for.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: flw fa5, 0(a0)		; CHECK-NEXT: flw fa5, 0(a1)
; CHECK-NEXT: fsub.s fa5, fa5, fa0		; CHECK-NEXT: fsub.s fa5, fa5, fa0
; CHECK-NEXT: fsw fa5, 0(a0)		; CHECK-NEXT: fsw fa5, 0(a1)
; CHECK-NEXT: addi a2, a2, 1		; CHECK-NEXT: addi a1, a1, 4
; CHECK-NEXT: addi a0, a0, 4		; CHECK-NEXT: bne a1, a0, .LBB30_6
; CHECK-NEXT: bnez a2, .LBB30_6
; CHECK-NEXT: .LBB30_7: # %for.cond.cleanup		; CHECK-NEXT: .LBB30_7: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%0 = call i64 @llvm.vscale.i64()		%0 = call i64 @llvm.vscale.i64()
%1 = shl i64 %0, 1		%1 = shl i64 %0, 1
%min.iters.check = icmp ugt i64 %1, 1024		%min.iters.check = icmp ugt i64 %1, 1024
br i1 %min.iters.check, label %for.body.preheader, label %vector.ph		br i1 %min.iters.check, label %for.body.preheader, label %vector.ph

▲ Show 20 Lines • Show All 63 Lines • ▼ Show 20 Lines
; CHECK-NEXT: vfrsub.vf v8, v8, fa0		; CHECK-NEXT: vfrsub.vf v8, v8, fa0
; CHECK-NEXT: vs1r.v v8, (a5)		; CHECK-NEXT: vs1r.v v8, (a5)
; CHECK-NEXT: sub a6, a6, a3		; CHECK-NEXT: sub a6, a6, a3
; CHECK-NEXT: add a5, a5, a2		; CHECK-NEXT: add a5, a5, a2
; CHECK-NEXT: bnez a6, .LBB31_3		; CHECK-NEXT: bnez a6, .LBB31_3
; CHECK-NEXT: # %bb.4: # %middle.block		; CHECK-NEXT: # %bb.4: # %middle.block
; CHECK-NEXT: beqz a4, .LBB31_7		; CHECK-NEXT: beqz a4, .LBB31_7
; CHECK-NEXT: .LBB31_5: # %for.body.preheader		; CHECK-NEXT: .LBB31_5: # %for.body.preheader
; CHECK-NEXT: addi a2, a1, -1024
; CHECK-NEXT: slli a1, a1, 2		; CHECK-NEXT: slli a1, a1, 2
; CHECK-NEXT: add a0, a0, a1		; CHECK-NEXT: add a1, a0, a1
		; CHECK-NEXT: lui a2, 1
		; CHECK-NEXT: add a0, a0, a2
; CHECK-NEXT: .LBB31_6: # %for.body		; CHECK-NEXT: .LBB31_6: # %for.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: flw fa5, 0(a0)		; CHECK-NEXT: flw fa5, 0(a1)
; CHECK-NEXT: fsub.s fa5, fa0, fa5		; CHECK-NEXT: fsub.s fa5, fa0, fa5
; CHECK-NEXT: fsw fa5, 0(a0)		; CHECK-NEXT: fsw fa5, 0(a1)
; CHECK-NEXT: addi a2, a2, 1		; CHECK-NEXT: addi a1, a1, 4
; CHECK-NEXT: addi a0, a0, 4		; CHECK-NEXT: bne a1, a0, .LBB31_6
; CHECK-NEXT: bnez a2, .LBB31_6
; CHECK-NEXT: .LBB31_7: # %for.cond.cleanup		; CHECK-NEXT: .LBB31_7: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%0 = call i64 @llvm.vscale.i64()		%0 = call i64 @llvm.vscale.i64()
%1 = shl i64 %0, 1		%1 = shl i64 %0, 1
%min.iters.check = icmp ugt i64 %1, 1024		%min.iters.check = icmp ugt i64 %1, 1024
br i1 %min.iters.check, label %for.body.preheader, label %vector.ph		br i1 %min.iters.check, label %for.body.preheader, label %vector.ph

Show All 38 Lines	for.body: ; preds = %for.body.preheader, %for.body
%indvars.iv.next = add nuw nsw i64 %indvars.iv, 1		%indvars.iv.next = add nuw nsw i64 %indvars.iv, 1
%cmp.not = icmp eq i64 %indvars.iv.next, 1024		%cmp.not = icmp eq i64 %indvars.iv.next, 1024
br i1 %cmp.not, label %for.cond.cleanup, label %for.body		br i1 %cmp.not, label %for.cond.cleanup, label %for.body
}		}

define void @sink_splat_fma(ptr noalias nocapture %a, ptr nocapture readonly %b, float %x) {		define void @sink_splat_fma(ptr noalias nocapture %a, ptr nocapture readonly %b, float %x) {
; CHECK-LABEL: sink_splat_fma:		; CHECK-LABEL: sink_splat_fma:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a2, 1024		; CHECK-NEXT: lui a2, 1
		; CHECK-NEXT: add a2, a1, a2
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: .LBB32_1: # %vector.body		; CHECK-NEXT: .LBB32_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vle32.v v9, (a1)		; CHECK-NEXT: vle32.v v9, (a1)
; CHECK-NEXT: vfmacc.vf v9, fa0, v8		; CHECK-NEXT: vfmacc.vf v9, fa0, v8
; CHECK-NEXT: vse32.v v9, (a0)		; CHECK-NEXT: vse32.v v9, (a0)
; CHECK-NEXT: addi a2, a2, -4
; CHECK-NEXT: addi a1, a1, 16		; CHECK-NEXT: addi a1, a1, 16
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a2, .LBB32_1		; CHECK-NEXT: bne a1, a2, .LBB32_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%broadcast.splatinsert = insertelement <4 x float> poison, float %x, i32 0		%broadcast.splatinsert = insertelement <4 x float> poison, float %x, i32 0
%broadcast.splat = shufflevector <4 x float> %broadcast.splatinsert, <4 x float> poison, <4 x i32> zeroinitializer		%broadcast.splat = shufflevector <4 x float> %broadcast.splatinsert, <4 x float> poison, <4 x i32> zeroinitializer
br label %vector.body		br label %vector.body

vector.body: ; preds = %vector.body, %entry		vector.body: ; preds = %vector.body, %entry
Show All 10 Lines

for.cond.cleanup: ; preds = %vector.body		for.cond.cleanup: ; preds = %vector.body
ret void		ret void
}		}

define void @sink_splat_fma_commute(ptr noalias nocapture %a, ptr nocapture readonly %b, float %x) {		define void @sink_splat_fma_commute(ptr noalias nocapture %a, ptr nocapture readonly %b, float %x) {
; CHECK-LABEL: sink_splat_fma_commute:		; CHECK-LABEL: sink_splat_fma_commute:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a2, 1024		; CHECK-NEXT: lui a2, 1
		; CHECK-NEXT: add a2, a1, a2
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: .LBB33_1: # %vector.body		; CHECK-NEXT: .LBB33_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vle32.v v9, (a1)		; CHECK-NEXT: vle32.v v9, (a1)
; CHECK-NEXT: vfmacc.vf v9, fa0, v8		; CHECK-NEXT: vfmacc.vf v9, fa0, v8
; CHECK-NEXT: vse32.v v9, (a0)		; CHECK-NEXT: vse32.v v9, (a0)
; CHECK-NEXT: addi a2, a2, -4
; CHECK-NEXT: addi a1, a1, 16		; CHECK-NEXT: addi a1, a1, 16
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a2, .LBB33_1		; CHECK-NEXT: bne a1, a2, .LBB33_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%broadcast.splatinsert = insertelement <4 x float> poison, float %x, i32 0		%broadcast.splatinsert = insertelement <4 x float> poison, float %x, i32 0
%broadcast.splat = shufflevector <4 x float> %broadcast.splatinsert, <4 x float> poison, <4 x i32> zeroinitializer		%broadcast.splat = shufflevector <4 x float> %broadcast.splatinsert, <4 x float> poison, <4 x i32> zeroinitializer
br label %vector.body		br label %vector.body

vector.body: ; preds = %vector.body, %entry		vector.body: ; preds = %vector.body, %entry
Show All 38 Lines
; CHECK-NEXT: vs1r.v v9, (a6)		; CHECK-NEXT: vs1r.v v9, (a6)
; CHECK-NEXT: sub t0, t0, a4		; CHECK-NEXT: sub t0, t0, a4
; CHECK-NEXT: add a7, a7, a3		; CHECK-NEXT: add a7, a7, a3
; CHECK-NEXT: add a6, a6, a3		; CHECK-NEXT: add a6, a6, a3
; CHECK-NEXT: bnez t0, .LBB34_3		; CHECK-NEXT: bnez t0, .LBB34_3
; CHECK-NEXT: # %bb.4: # %middle.block		; CHECK-NEXT: # %bb.4: # %middle.block
; CHECK-NEXT: beqz a5, .LBB34_7		; CHECK-NEXT: beqz a5, .LBB34_7
; CHECK-NEXT: .LBB34_5: # %for.body.preheader		; CHECK-NEXT: .LBB34_5: # %for.body.preheader
; CHECK-NEXT: addi a3, a2, -1024		; CHECK-NEXT: slli a3, a2, 2
; CHECK-NEXT: slli a2, a2, 2		; CHECK-NEXT: add a2, a1, a3
; CHECK-NEXT: add a1, a1, a2		; CHECK-NEXT: add a0, a0, a3
; CHECK-NEXT: add a0, a0, a2		; CHECK-NEXT: lui a3, 1
		; CHECK-NEXT: add a1, a1, a3
; CHECK-NEXT: .LBB34_6: # %for.body		; CHECK-NEXT: .LBB34_6: # %for.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: flw fa5, 0(a0)		; CHECK-NEXT: flw fa5, 0(a0)
; CHECK-NEXT: flw fa4, 0(a1)		; CHECK-NEXT: flw fa4, 0(a2)
; CHECK-NEXT: fmadd.s fa5, fa5, fa0, fa4		; CHECK-NEXT: fmadd.s fa5, fa5, fa0, fa4
; CHECK-NEXT: fsw fa5, 0(a0)		; CHECK-NEXT: fsw fa5, 0(a0)
; CHECK-NEXT: addi a3, a3, 1		; CHECK-NEXT: addi a2, a2, 4
; CHECK-NEXT: addi a1, a1, 4
; CHECK-NEXT: addi a0, a0, 4		; CHECK-NEXT: addi a0, a0, 4
; CHECK-NEXT: bnez a3, .LBB34_6		; CHECK-NEXT: bne a2, a1, .LBB34_6
; CHECK-NEXT: .LBB34_7: # %for.cond.cleanup		; CHECK-NEXT: .LBB34_7: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%0 = call i64 @llvm.vscale.i64()		%0 = call i64 @llvm.vscale.i64()
%1 = shl i64 %0, 1		%1 = shl i64 %0, 1
%min.iters.check = icmp ugt i64 %1, 1024		%min.iters.check = icmp ugt i64 %1, 1024
br i1 %min.iters.check, label %for.body.preheader, label %vector.ph		br i1 %min.iters.check, label %for.body.preheader, label %vector.ph

▲ Show 20 Lines • Show All 70 Lines • ▼ Show 20 Lines
; CHECK-NEXT: vs1r.v v9, (a6)		; CHECK-NEXT: vs1r.v v9, (a6)
; CHECK-NEXT: sub t0, t0, a4		; CHECK-NEXT: sub t0, t0, a4
; CHECK-NEXT: add a7, a7, a3		; CHECK-NEXT: add a7, a7, a3
; CHECK-NEXT: add a6, a6, a3		; CHECK-NEXT: add a6, a6, a3
; CHECK-NEXT: bnez t0, .LBB35_3		; CHECK-NEXT: bnez t0, .LBB35_3
; CHECK-NEXT: # %bb.4: # %middle.block		; CHECK-NEXT: # %bb.4: # %middle.block
; CHECK-NEXT: beqz a5, .LBB35_7		; CHECK-NEXT: beqz a5, .LBB35_7
; CHECK-NEXT: .LBB35_5: # %for.body.preheader		; CHECK-NEXT: .LBB35_5: # %for.body.preheader
; CHECK-NEXT: addi a3, a2, -1024		; CHECK-NEXT: slli a3, a2, 2
; CHECK-NEXT: slli a2, a2, 2		; CHECK-NEXT: add a2, a1, a3
; CHECK-NEXT: add a1, a1, a2		; CHECK-NEXT: add a0, a0, a3
; CHECK-NEXT: add a0, a0, a2		; CHECK-NEXT: lui a3, 1
		; CHECK-NEXT: add a1, a1, a3
; CHECK-NEXT: .LBB35_6: # %for.body		; CHECK-NEXT: .LBB35_6: # %for.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: flw fa5, 0(a0)		; CHECK-NEXT: flw fa5, 0(a0)
; CHECK-NEXT: flw fa4, 0(a1)		; CHECK-NEXT: flw fa4, 0(a2)
; CHECK-NEXT: fmadd.s fa5, fa0, fa5, fa4		; CHECK-NEXT: fmadd.s fa5, fa0, fa5, fa4
; CHECK-NEXT: fsw fa5, 0(a0)		; CHECK-NEXT: fsw fa5, 0(a0)
; CHECK-NEXT: addi a3, a3, 1		; CHECK-NEXT: addi a2, a2, 4
; CHECK-NEXT: addi a1, a1, 4
; CHECK-NEXT: addi a0, a0, 4		; CHECK-NEXT: addi a0, a0, 4
; CHECK-NEXT: bnez a3, .LBB35_6		; CHECK-NEXT: bne a2, a1, .LBB35_6
; CHECK-NEXT: .LBB35_7: # %for.cond.cleanup		; CHECK-NEXT: .LBB35_7: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%0 = call i64 @llvm.vscale.i64()		%0 = call i64 @llvm.vscale.i64()
%1 = shl i64 %0, 1		%1 = shl i64 %0, 1
%min.iters.check = icmp ugt i64 %1, 1024		%min.iters.check = icmp ugt i64 %1, 1024
br i1 %min.iters.check, label %for.body.preheader, label %vector.ph		br i1 %min.iters.check, label %for.body.preheader, label %vector.ph

▲ Show 20 Lines • Show All 47 Lines • ▼ Show 20 Lines
declare i64 @llvm.vscale.i64()		declare i64 @llvm.vscale.i64()
declare <4 x float> @llvm.fma.v4f32(<4 x float>, <4 x float>, <4 x float>)		declare <4 x float> @llvm.fma.v4f32(<4 x float>, <4 x float>, <4 x float>)
declare <vscale x 2 x float> @llvm.fma.nxv2f32(<vscale x 2 x float>, <vscale x 2 x float>, <vscale x 2 x float>)		declare <vscale x 2 x float> @llvm.fma.nxv2f32(<vscale x 2 x float>, <vscale x 2 x float>, <vscale x 2 x float>)
declare float @llvm.fma.f32(float, float, float)		declare float @llvm.fma.f32(float, float, float)

define void @sink_splat_icmp(ptr nocapture %x, i32 signext %y) {		define void @sink_splat_icmp(ptr nocapture %x, i32 signext %y) {
; CHECK-LABEL: sink_splat_icmp:		; CHECK-LABEL: sink_splat_icmp:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a2, 1024		; CHECK-NEXT: lui a2, 1
		; CHECK-NEXT: add a2, a0, a2
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: vmv.v.i v8, 0		; CHECK-NEXT: vmv.v.i v8, 0
; CHECK-NEXT: .LBB36_1: # %vector.body		; CHECK-NEXT: .LBB36_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vle32.v v9, (a0)		; CHECK-NEXT: vle32.v v9, (a0)
; CHECK-NEXT: vmseq.vx v0, v9, a1		; CHECK-NEXT: vmseq.vx v0, v9, a1
; CHECK-NEXT: vse32.v v8, (a0), v0.t		; CHECK-NEXT: vse32.v v8, (a0), v0.t
; CHECK-NEXT: addi a2, a2, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a2, .LBB36_1		; CHECK-NEXT: bne a0, a2, .LBB36_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%broadcast.splatinsert = insertelement <4 x i32> poison, i32 %y, i32 0		%broadcast.splatinsert = insertelement <4 x i32> poison, i32 %y, i32 0
%broadcast.splat = shufflevector <4 x i32> %broadcast.splatinsert, <4 x i32> poison, <4 x i32> zeroinitializer		%broadcast.splat = shufflevector <4 x i32> %broadcast.splatinsert, <4 x i32> poison, <4 x i32> zeroinitializer
br label %vector.body		br label %vector.body

vector.body: ; preds = %vector.body, %entry		vector.body: ; preds = %vector.body, %entry
Show All 9 Lines
for.cond.cleanup: ; preds = %vector.body		for.cond.cleanup: ; preds = %vector.body
ret void		ret void
}		}
declare void @llvm.masked.store.v4i32.p0(<4 x i32>, ptr, i32, <4 x i1>)		declare void @llvm.masked.store.v4i32.p0(<4 x i32>, ptr, i32, <4 x i1>)

define void @sink_splat_fcmp(ptr nocapture %x, float %y) {		define void @sink_splat_fcmp(ptr nocapture %x, float %y) {
; CHECK-LABEL: sink_splat_fcmp:		; CHECK-LABEL: sink_splat_fcmp:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a1, 1024		; CHECK-NEXT: lui a1, 1
		; CHECK-NEXT: add a1, a0, a1
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: vmv.v.i v8, 0		; CHECK-NEXT: vmv.v.i v8, 0
; CHECK-NEXT: .LBB37_1: # %vector.body		; CHECK-NEXT: .LBB37_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vle32.v v9, (a0)		; CHECK-NEXT: vle32.v v9, (a0)
; CHECK-NEXT: vmfeq.vf v0, v9, fa0		; CHECK-NEXT: vmfeq.vf v0, v9, fa0
; CHECK-NEXT: vse32.v v8, (a0), v0.t		; CHECK-NEXT: vse32.v v8, (a0), v0.t
; CHECK-NEXT: addi a1, a1, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a1, .LBB37_1		; CHECK-NEXT: bne a0, a1, .LBB37_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%broadcast.splatinsert = insertelement <4 x float> poison, float %y, i32 0		%broadcast.splatinsert = insertelement <4 x float> poison, float %y, i32 0
%broadcast.splat = shufflevector <4 x float> %broadcast.splatinsert, <4 x float> poison, <4 x i32> zeroinitializer		%broadcast.splat = shufflevector <4 x float> %broadcast.splatinsert, <4 x float> poison, <4 x i32> zeroinitializer
br label %vector.body		br label %vector.body

vector.body: ; preds = %vector.body, %entry		vector.body: ; preds = %vector.body, %entry
Show All 9 Lines
for.cond.cleanup: ; preds = %vector.body		for.cond.cleanup: ; preds = %vector.body
ret void		ret void
}		}
declare void @llvm.masked.store.v4f32.p0(<4 x float>, ptr, i32, <4 x i1>)		declare void @llvm.masked.store.v4f32.p0(<4 x float>, ptr, i32, <4 x i1>)

define void @sink_splat_udiv(ptr nocapture %a, i32 signext %x) {		define void @sink_splat_udiv(ptr nocapture %a, i32 signext %x) {
; CHECK-LABEL: sink_splat_udiv:		; CHECK-LABEL: sink_splat_udiv:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a2, 1024		; CHECK-NEXT: lui a2, 1
		; CHECK-NEXT: add a2, a0, a2
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: .LBB38_1: # %vector.body		; CHECK-NEXT: .LBB38_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vdivu.vx v8, v8, a1		; CHECK-NEXT: vdivu.vx v8, v8, a1
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a2, a2, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a2, .LBB38_1		; CHECK-NEXT: bne a0, a2, .LBB38_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%broadcast.splatinsert = insertelement <4 x i32> poison, i32 %x, i32 0		%broadcast.splatinsert = insertelement <4 x i32> poison, i32 %x, i32 0
%broadcast.splat = shufflevector <4 x i32> %broadcast.splatinsert, <4 x i32> poison, <4 x i32> zeroinitializer		%broadcast.splat = shufflevector <4 x i32> %broadcast.splatinsert, <4 x i32> poison, <4 x i32> zeroinitializer
br label %vector.body		br label %vector.body

vector.body: ; preds = %vector.body, %entry		vector.body: ; preds = %vector.body, %entry
%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]		%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]
%0 = getelementptr inbounds i32, ptr %a, i64 %index		%0 = getelementptr inbounds i32, ptr %a, i64 %index
%wide.load = load <4 x i32>, ptr %0, align 4		%wide.load = load <4 x i32>, ptr %0, align 4
%1 = udiv <4 x i32> %wide.load, %broadcast.splat		%1 = udiv <4 x i32> %wide.load, %broadcast.splat
store <4 x i32> %1, ptr %0, align 4		store <4 x i32> %1, ptr %0, align 4
%index.next = add nuw i64 %index, 4		%index.next = add nuw i64 %index, 4
%2 = icmp eq i64 %index.next, 1024		%2 = icmp eq i64 %index.next, 1024
br i1 %2, label %for.cond.cleanup, label %vector.body		br i1 %2, label %for.cond.cleanup, label %vector.body

for.cond.cleanup: ; preds = %vector.body		for.cond.cleanup: ; preds = %vector.body
ret void		ret void
}		}

define void @sink_splat_sdiv(ptr nocapture %a, i32 signext %x) {		define void @sink_splat_sdiv(ptr nocapture %a, i32 signext %x) {
; CHECK-LABEL: sink_splat_sdiv:		; CHECK-LABEL: sink_splat_sdiv:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a2, 1024		; CHECK-NEXT: lui a2, 1
		; CHECK-NEXT: add a2, a0, a2
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: .LBB39_1: # %vector.body		; CHECK-NEXT: .LBB39_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vdiv.vx v8, v8, a1		; CHECK-NEXT: vdiv.vx v8, v8, a1
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a2, a2, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a2, .LBB39_1		; CHECK-NEXT: bne a0, a2, .LBB39_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%broadcast.splatinsert = insertelement <4 x i32> poison, i32 %x, i32 0		%broadcast.splatinsert = insertelement <4 x i32> poison, i32 %x, i32 0
%broadcast.splat = shufflevector <4 x i32> %broadcast.splatinsert, <4 x i32> poison, <4 x i32> zeroinitializer		%broadcast.splat = shufflevector <4 x i32> %broadcast.splatinsert, <4 x i32> poison, <4 x i32> zeroinitializer
br label %vector.body		br label %vector.body

vector.body: ; preds = %vector.body, %entry		vector.body: ; preds = %vector.body, %entry
%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]		%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]
%0 = getelementptr inbounds i32, ptr %a, i64 %index		%0 = getelementptr inbounds i32, ptr %a, i64 %index
%wide.load = load <4 x i32>, ptr %0, align 4		%wide.load = load <4 x i32>, ptr %0, align 4
%1 = sdiv <4 x i32> %wide.load, %broadcast.splat		%1 = sdiv <4 x i32> %wide.load, %broadcast.splat
store <4 x i32> %1, ptr %0, align 4		store <4 x i32> %1, ptr %0, align 4
%index.next = add nuw i64 %index, 4		%index.next = add nuw i64 %index, 4
%2 = icmp eq i64 %index.next, 1024		%2 = icmp eq i64 %index.next, 1024
br i1 %2, label %for.cond.cleanup, label %vector.body		br i1 %2, label %for.cond.cleanup, label %vector.body

for.cond.cleanup: ; preds = %vector.body		for.cond.cleanup: ; preds = %vector.body
ret void		ret void
}		}

define void @sink_splat_urem(ptr nocapture %a, i32 signext %x) {		define void @sink_splat_urem(ptr nocapture %a, i32 signext %x) {
; CHECK-LABEL: sink_splat_urem:		; CHECK-LABEL: sink_splat_urem:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a2, 1024		; CHECK-NEXT: lui a2, 1
		; CHECK-NEXT: add a2, a0, a2
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: .LBB40_1: # %vector.body		; CHECK-NEXT: .LBB40_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vremu.vx v8, v8, a1		; CHECK-NEXT: vremu.vx v8, v8, a1
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a2, a2, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a2, .LBB40_1		; CHECK-NEXT: bne a0, a2, .LBB40_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%broadcast.splatinsert = insertelement <4 x i32> poison, i32 %x, i32 0		%broadcast.splatinsert = insertelement <4 x i32> poison, i32 %x, i32 0
%broadcast.splat = shufflevector <4 x i32> %broadcast.splatinsert, <4 x i32> poison, <4 x i32> zeroinitializer		%broadcast.splat = shufflevector <4 x i32> %broadcast.splatinsert, <4 x i32> poison, <4 x i32> zeroinitializer
br label %vector.body		br label %vector.body

vector.body: ; preds = %vector.body, %entry		vector.body: ; preds = %vector.body, %entry
%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]		%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]
%0 = getelementptr inbounds i32, ptr %a, i64 %index		%0 = getelementptr inbounds i32, ptr %a, i64 %index
%wide.load = load <4 x i32>, ptr %0, align 4		%wide.load = load <4 x i32>, ptr %0, align 4
%1 = urem <4 x i32> %wide.load, %broadcast.splat		%1 = urem <4 x i32> %wide.load, %broadcast.splat
store <4 x i32> %1, ptr %0, align 4		store <4 x i32> %1, ptr %0, align 4
%index.next = add nuw i64 %index, 4		%index.next = add nuw i64 %index, 4
%2 = icmp eq i64 %index.next, 1024		%2 = icmp eq i64 %index.next, 1024
br i1 %2, label %for.cond.cleanup, label %vector.body		br i1 %2, label %for.cond.cleanup, label %vector.body

for.cond.cleanup: ; preds = %vector.body		for.cond.cleanup: ; preds = %vector.body
ret void		ret void
}		}

define void @sink_splat_srem(ptr nocapture %a, i32 signext %x) {		define void @sink_splat_srem(ptr nocapture %a, i32 signext %x) {
; CHECK-LABEL: sink_splat_srem:		; CHECK-LABEL: sink_splat_srem:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a2, 1024		; CHECK-NEXT: lui a2, 1
		; CHECK-NEXT: add a2, a0, a2
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: .LBB41_1: # %vector.body		; CHECK-NEXT: .LBB41_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vrem.vx v8, v8, a1		; CHECK-NEXT: vrem.vx v8, v8, a1
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a2, a2, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a2, .LBB41_1		; CHECK-NEXT: bne a0, a2, .LBB41_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%broadcast.splatinsert = insertelement <4 x i32> poison, i32 %x, i32 0		%broadcast.splatinsert = insertelement <4 x i32> poison, i32 %x, i32 0
%broadcast.splat = shufflevector <4 x i32> %broadcast.splatinsert, <4 x i32> poison, <4 x i32> zeroinitializer		%broadcast.splat = shufflevector <4 x i32> %broadcast.splatinsert, <4 x i32> poison, <4 x i32> zeroinitializer
br label %vector.body		br label %vector.body

vector.body: ; preds = %vector.body, %entry		vector.body: ; preds = %vector.body, %entry
Show All 34 Lines
; CHECK-NEXT: vdivu.vx v8, v8, a1		; CHECK-NEXT: vdivu.vx v8, v8, a1
; CHECK-NEXT: vs2r.v v8, (a6)		; CHECK-NEXT: vs2r.v v8, (a6)
; CHECK-NEXT: sub a7, a7, a3		; CHECK-NEXT: sub a7, a7, a3
; CHECK-NEXT: add a6, a6, a5		; CHECK-NEXT: add a6, a6, a5
; CHECK-NEXT: bnez a7, .LBB42_3		; CHECK-NEXT: bnez a7, .LBB42_3
; CHECK-NEXT: # %bb.4: # %middle.block		; CHECK-NEXT: # %bb.4: # %middle.block
; CHECK-NEXT: beqz a4, .LBB42_7		; CHECK-NEXT: beqz a4, .LBB42_7
; CHECK-NEXT: .LBB42_5: # %for.body.preheader		; CHECK-NEXT: .LBB42_5: # %for.body.preheader
; CHECK-NEXT: addi a3, a2, -1024
; CHECK-NEXT: slli a2, a2, 2		; CHECK-NEXT: slli a2, a2, 2
; CHECK-NEXT: add a0, a0, a2		; CHECK-NEXT: add a2, a0, a2
		; CHECK-NEXT: lui a3, 1
		; CHECK-NEXT: add a0, a0, a3
; CHECK-NEXT: .LBB42_6: # %for.body		; CHECK-NEXT: .LBB42_6: # %for.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: lw a2, 0(a0)		; CHECK-NEXT: lw a3, 0(a2)
; CHECK-NEXT: divuw a2, a2, a1		; CHECK-NEXT: divuw a3, a3, a1
; CHECK-NEXT: sw a2, 0(a0)		; CHECK-NEXT: sw a3, 0(a2)
; CHECK-NEXT: addi a3, a3, 1		; CHECK-NEXT: addi a2, a2, 4
; CHECK-NEXT: addi a0, a0, 4		; CHECK-NEXT: bne a2, a0, .LBB42_6
; CHECK-NEXT: bnez a3, .LBB42_6
; CHECK-NEXT: .LBB42_7: # %for.cond.cleanup		; CHECK-NEXT: .LBB42_7: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%0 = call i64 @llvm.vscale.i64()		%0 = call i64 @llvm.vscale.i64()
%1 = shl i64 %0, 2		%1 = shl i64 %0, 2
%min.iters.check = icmp ugt i64 %1, 1024		%min.iters.check = icmp ugt i64 %1, 1024
br i1 %min.iters.check, label %for.body.preheader, label %vector.ph		br i1 %min.iters.check, label %for.body.preheader, label %vector.ph

▲ Show 20 Lines • Show All 64 Lines • ▼ Show 20 Lines
; CHECK-NEXT: vdiv.vx v8, v8, a1		; CHECK-NEXT: vdiv.vx v8, v8, a1
; CHECK-NEXT: vs2r.v v8, (a6)		; CHECK-NEXT: vs2r.v v8, (a6)
; CHECK-NEXT: sub a7, a7, a3		; CHECK-NEXT: sub a7, a7, a3
; CHECK-NEXT: add a6, a6, a5		; CHECK-NEXT: add a6, a6, a5
; CHECK-NEXT: bnez a7, .LBB43_3		; CHECK-NEXT: bnez a7, .LBB43_3
; CHECK-NEXT: # %bb.4: # %middle.block		; CHECK-NEXT: # %bb.4: # %middle.block
; CHECK-NEXT: beqz a4, .LBB43_7		; CHECK-NEXT: beqz a4, .LBB43_7
; CHECK-NEXT: .LBB43_5: # %for.body.preheader		; CHECK-NEXT: .LBB43_5: # %for.body.preheader
; CHECK-NEXT: addi a3, a2, -1024
; CHECK-NEXT: slli a2, a2, 2		; CHECK-NEXT: slli a2, a2, 2
; CHECK-NEXT: add a0, a0, a2		; CHECK-NEXT: add a2, a0, a2
		; CHECK-NEXT: lui a3, 1
		; CHECK-NEXT: add a0, a0, a3
; CHECK-NEXT: .LBB43_6: # %for.body		; CHECK-NEXT: .LBB43_6: # %for.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: lw a2, 0(a0)		; CHECK-NEXT: lw a3, 0(a2)
; CHECK-NEXT: divw a2, a2, a1		; CHECK-NEXT: divw a3, a3, a1
; CHECK-NEXT: sw a2, 0(a0)		; CHECK-NEXT: sw a3, 0(a2)
; CHECK-NEXT: addi a3, a3, 1		; CHECK-NEXT: addi a2, a2, 4
; CHECK-NEXT: addi a0, a0, 4		; CHECK-NEXT: bne a2, a0, .LBB43_6
; CHECK-NEXT: bnez a3, .LBB43_6
; CHECK-NEXT: .LBB43_7: # %for.cond.cleanup		; CHECK-NEXT: .LBB43_7: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%0 = call i64 @llvm.vscale.i64()		%0 = call i64 @llvm.vscale.i64()
%1 = shl i64 %0, 2		%1 = shl i64 %0, 2
%min.iters.check = icmp ugt i64 %1, 1024		%min.iters.check = icmp ugt i64 %1, 1024
br i1 %min.iters.check, label %for.body.preheader, label %vector.ph		br i1 %min.iters.check, label %for.body.preheader, label %vector.ph

▲ Show 20 Lines • Show All 64 Lines • ▼ Show 20 Lines
; CHECK-NEXT: vremu.vx v8, v8, a1		; CHECK-NEXT: vremu.vx v8, v8, a1
; CHECK-NEXT: vs2r.v v8, (a6)		; CHECK-NEXT: vs2r.v v8, (a6)
; CHECK-NEXT: sub a7, a7, a3		; CHECK-NEXT: sub a7, a7, a3
; CHECK-NEXT: add a6, a6, a5		; CHECK-NEXT: add a6, a6, a5
; CHECK-NEXT: bnez a7, .LBB44_3		; CHECK-NEXT: bnez a7, .LBB44_3
; CHECK-NEXT: # %bb.4: # %middle.block		; CHECK-NEXT: # %bb.4: # %middle.block
; CHECK-NEXT: beqz a4, .LBB44_7		; CHECK-NEXT: beqz a4, .LBB44_7
; CHECK-NEXT: .LBB44_5: # %for.body.preheader		; CHECK-NEXT: .LBB44_5: # %for.body.preheader
; CHECK-NEXT: addi a3, a2, -1024
; CHECK-NEXT: slli a2, a2, 2		; CHECK-NEXT: slli a2, a2, 2
; CHECK-NEXT: add a0, a0, a2		; CHECK-NEXT: add a2, a0, a2
		; CHECK-NEXT: lui a3, 1
		; CHECK-NEXT: add a0, a0, a3
; CHECK-NEXT: .LBB44_6: # %for.body		; CHECK-NEXT: .LBB44_6: # %for.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: lw a2, 0(a0)		; CHECK-NEXT: lw a3, 0(a2)
; CHECK-NEXT: remuw a2, a2, a1		; CHECK-NEXT: remuw a3, a3, a1
; CHECK-NEXT: sw a2, 0(a0)		; CHECK-NEXT: sw a3, 0(a2)
; CHECK-NEXT: addi a3, a3, 1		; CHECK-NEXT: addi a2, a2, 4
; CHECK-NEXT: addi a0, a0, 4		; CHECK-NEXT: bne a2, a0, .LBB44_6
; CHECK-NEXT: bnez a3, .LBB44_6
; CHECK-NEXT: .LBB44_7: # %for.cond.cleanup		; CHECK-NEXT: .LBB44_7: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%0 = call i64 @llvm.vscale.i64()		%0 = call i64 @llvm.vscale.i64()
%1 = shl i64 %0, 2		%1 = shl i64 %0, 2
%min.iters.check = icmp ugt i64 %1, 1024		%min.iters.check = icmp ugt i64 %1, 1024
br i1 %min.iters.check, label %for.body.preheader, label %vector.ph		br i1 %min.iters.check, label %for.body.preheader, label %vector.ph

▲ Show 20 Lines • Show All 64 Lines • ▼ Show 20 Lines
; CHECK-NEXT: vrem.vx v8, v8, a1		; CHECK-NEXT: vrem.vx v8, v8, a1
; CHECK-NEXT: vs2r.v v8, (a6)		; CHECK-NEXT: vs2r.v v8, (a6)
; CHECK-NEXT: sub a7, a7, a3		; CHECK-NEXT: sub a7, a7, a3
; CHECK-NEXT: add a6, a6, a5		; CHECK-NEXT: add a6, a6, a5
; CHECK-NEXT: bnez a7, .LBB45_3		; CHECK-NEXT: bnez a7, .LBB45_3
; CHECK-NEXT: # %bb.4: # %middle.block		; CHECK-NEXT: # %bb.4: # %middle.block
; CHECK-NEXT: beqz a4, .LBB45_7		; CHECK-NEXT: beqz a4, .LBB45_7
; CHECK-NEXT: .LBB45_5: # %for.body.preheader		; CHECK-NEXT: .LBB45_5: # %for.body.preheader
; CHECK-NEXT: addi a3, a2, -1024
; CHECK-NEXT: slli a2, a2, 2		; CHECK-NEXT: slli a2, a2, 2
; CHECK-NEXT: add a0, a0, a2		; CHECK-NEXT: add a2, a0, a2
		; CHECK-NEXT: lui a3, 1
		; CHECK-NEXT: add a0, a0, a3
; CHECK-NEXT: .LBB45_6: # %for.body		; CHECK-NEXT: .LBB45_6: # %for.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: lw a2, 0(a0)		; CHECK-NEXT: lw a3, 0(a2)
; CHECK-NEXT: remw a2, a2, a1		; CHECK-NEXT: remw a3, a3, a1
; CHECK-NEXT: sw a2, 0(a0)		; CHECK-NEXT: sw a3, 0(a2)
; CHECK-NEXT: addi a3, a3, 1		; CHECK-NEXT: addi a2, a2, 4
; CHECK-NEXT: addi a0, a0, 4		; CHECK-NEXT: bne a2, a0, .LBB45_6
; CHECK-NEXT: bnez a3, .LBB45_6
; CHECK-NEXT: .LBB45_7: # %for.cond.cleanup		; CHECK-NEXT: .LBB45_7: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%0 = call i64 @llvm.vscale.i64()		%0 = call i64 @llvm.vscale.i64()
%1 = shl i64 %0, 2		%1 = shl i64 %0, 2
%min.iters.check = icmp ugt i64 %1, 1024		%min.iters.check = icmp ugt i64 %1, 1024
br i1 %min.iters.check, label %for.body.preheader, label %vector.ph		br i1 %min.iters.check, label %for.body.preheader, label %vector.ph

Show All 40 Lines	for.body: ; preds = %for.body.preheader, %for.body
br i1 %cmp.not, label %for.cond.cleanup, label %for.body		br i1 %cmp.not, label %for.cond.cleanup, label %for.body
}		}

declare <4 x i32> @llvm.vp.mul.v4i32(<4 x i32>, <4 x i32>, <4 x i1>, i32)		declare <4 x i32> @llvm.vp.mul.v4i32(<4 x i32>, <4 x i32>, <4 x i1>, i32)

define void @sink_splat_vp_mul(ptr nocapture %a, i32 signext %x, <4 x i1> %m, i32 zeroext %vl) {		define void @sink_splat_vp_mul(ptr nocapture %a, i32 signext %x, <4 x i1> %m, i32 zeroext %vl) {
; CHECK-LABEL: sink_splat_vp_mul:		; CHECK-LABEL: sink_splat_vp_mul:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a3, 1024		; CHECK-NEXT: lui a3, 1
		; CHECK-NEXT: add a3, a0, a3
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: .LBB46_1: # %vector.body		; CHECK-NEXT: .LBB46_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsetvli zero, a2, e32, m1, ta, ma		; CHECK-NEXT: vsetvli zero, a2, e32, m1, ta, ma
; CHECK-NEXT: vmul.vx v8, v8, a1, v0.t		; CHECK-NEXT: vmul.vx v8, v8, a1, v0.t
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a3, a3, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a3, .LBB46_1		; CHECK-NEXT: bne a0, a3, .LBB46_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%broadcast.splatinsert = insertelement <4 x i32> poison, i32 %x, i32 0		%broadcast.splatinsert = insertelement <4 x i32> poison, i32 %x, i32 0
%broadcast.splat = shufflevector <4 x i32> %broadcast.splatinsert, <4 x i32> poison, <4 x i32> zeroinitializer		%broadcast.splat = shufflevector <4 x i32> %broadcast.splatinsert, <4 x i32> poison, <4 x i32> zeroinitializer
br label %vector.body		br label %vector.body

vector.body: ; preds = %vector.body, %entry		vector.body: ; preds = %vector.body, %entry
Show All 10 Lines	for.cond.cleanup: ; preds = %vector.body
ret void		ret void
}		}

declare <4 x i32> @llvm.vp.add.v4i32(<4 x i32>, <4 x i32>, <4 x i1>, i32)		declare <4 x i32> @llvm.vp.add.v4i32(<4 x i32>, <4 x i32>, <4 x i1>, i32)

define void @sink_splat_vp_add(ptr nocapture %a, i32 signext %x, <4 x i1> %m, i32 zeroext %vl) {		define void @sink_splat_vp_add(ptr nocapture %a, i32 signext %x, <4 x i1> %m, i32 zeroext %vl) {
; CHECK-LABEL: sink_splat_vp_add:		; CHECK-LABEL: sink_splat_vp_add:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a3, 1024		; CHECK-NEXT: lui a3, 1
		; CHECK-NEXT: add a3, a0, a3
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: .LBB47_1: # %vector.body		; CHECK-NEXT: .LBB47_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsetvli zero, a2, e32, m1, ta, ma		; CHECK-NEXT: vsetvli zero, a2, e32, m1, ta, ma
; CHECK-NEXT: vadd.vx v8, v8, a1, v0.t		; CHECK-NEXT: vadd.vx v8, v8, a1, v0.t
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a3, a3, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a3, .LBB47_1		; CHECK-NEXT: bne a0, a3, .LBB47_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%broadcast.splatinsert = insertelement <4 x i32> poison, i32 %x, i32 0		%broadcast.splatinsert = insertelement <4 x i32> poison, i32 %x, i32 0
%broadcast.splat = shufflevector <4 x i32> %broadcast.splatinsert, <4 x i32> poison, <4 x i32> zeroinitializer		%broadcast.splat = shufflevector <4 x i32> %broadcast.splatinsert, <4 x i32> poison, <4 x i32> zeroinitializer
br label %vector.body		br label %vector.body

vector.body: ; preds = %vector.body, %entry		vector.body: ; preds = %vector.body, %entry
%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]		%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]
%0 = getelementptr inbounds i32, ptr %a, i64 %index		%0 = getelementptr inbounds i32, ptr %a, i64 %index
%wide.load = load <4 x i32>, ptr %0, align 4		%wide.load = load <4 x i32>, ptr %0, align 4
%1 = call <4 x i32> @llvm.vp.add.v4i32(<4 x i32> %wide.load, <4 x i32> %broadcast.splat, <4 x i1> %m, i32 %vl)		%1 = call <4 x i32> @llvm.vp.add.v4i32(<4 x i32> %wide.load, <4 x i32> %broadcast.splat, <4 x i1> %m, i32 %vl)
store <4 x i32> %1, ptr %0, align 4		store <4 x i32> %1, ptr %0, align 4
%index.next = add nuw i64 %index, 4		%index.next = add nuw i64 %index, 4
%2 = icmp eq i64 %index.next, 1024		%2 = icmp eq i64 %index.next, 1024
br i1 %2, label %for.cond.cleanup, label %vector.body		br i1 %2, label %for.cond.cleanup, label %vector.body

for.cond.cleanup: ; preds = %vector.body		for.cond.cleanup: ; preds = %vector.body
ret void		ret void
}		}

define void @sink_splat_vp_add_commute(ptr nocapture %a, i32 signext %x, <4 x i1> %m, i32 zeroext %vl) {		define void @sink_splat_vp_add_commute(ptr nocapture %a, i32 signext %x, <4 x i1> %m, i32 zeroext %vl) {
; CHECK-LABEL: sink_splat_vp_add_commute:		; CHECK-LABEL: sink_splat_vp_add_commute:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a3, 1024		; CHECK-NEXT: lui a3, 1
		; CHECK-NEXT: add a3, a0, a3
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: .LBB48_1: # %vector.body		; CHECK-NEXT: .LBB48_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsetvli zero, a2, e32, m1, ta, ma		; CHECK-NEXT: vsetvli zero, a2, e32, m1, ta, ma
; CHECK-NEXT: vadd.vx v8, v8, a1, v0.t		; CHECK-NEXT: vadd.vx v8, v8, a1, v0.t
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a3, a3, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a3, .LBB48_1		; CHECK-NEXT: bne a0, a3, .LBB48_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%broadcast.splatinsert = insertelement <4 x i32> poison, i32 %x, i32 0		%broadcast.splatinsert = insertelement <4 x i32> poison, i32 %x, i32 0
%broadcast.splat = shufflevector <4 x i32> %broadcast.splatinsert, <4 x i32> poison, <4 x i32> zeroinitializer		%broadcast.splat = shufflevector <4 x i32> %broadcast.splatinsert, <4 x i32> poison, <4 x i32> zeroinitializer
br label %vector.body		br label %vector.body

vector.body: ; preds = %vector.body, %entry		vector.body: ; preds = %vector.body, %entry
Show All 10 Lines	for.cond.cleanup: ; preds = %vector.body
ret void		ret void
}		}

declare <4 x i32> @llvm.vp.sub.v4i32(<4 x i32>, <4 x i32>, <4 x i1>, i32)		declare <4 x i32> @llvm.vp.sub.v4i32(<4 x i32>, <4 x i32>, <4 x i1>, i32)

define void @sink_splat_vp_sub(ptr nocapture %a, i32 signext %x, <4 x i1> %m, i32 zeroext %vl) {		define void @sink_splat_vp_sub(ptr nocapture %a, i32 signext %x, <4 x i1> %m, i32 zeroext %vl) {
; CHECK-LABEL: sink_splat_vp_sub:		; CHECK-LABEL: sink_splat_vp_sub:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a3, 1024		; CHECK-NEXT: lui a3, 1
		; CHECK-NEXT: add a3, a0, a3
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: .LBB49_1: # %vector.body		; CHECK-NEXT: .LBB49_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsetvli zero, a2, e32, m1, ta, ma		; CHECK-NEXT: vsetvli zero, a2, e32, m1, ta, ma
; CHECK-NEXT: vsub.vx v8, v8, a1, v0.t		; CHECK-NEXT: vsub.vx v8, v8, a1, v0.t
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a3, a3, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a3, .LBB49_1		; CHECK-NEXT: bne a0, a3, .LBB49_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%broadcast.splatinsert = insertelement <4 x i32> poison, i32 %x, i32 0		%broadcast.splatinsert = insertelement <4 x i32> poison, i32 %x, i32 0
%broadcast.splat = shufflevector <4 x i32> %broadcast.splatinsert, <4 x i32> poison, <4 x i32> zeroinitializer		%broadcast.splat = shufflevector <4 x i32> %broadcast.splatinsert, <4 x i32> poison, <4 x i32> zeroinitializer
br label %vector.body		br label %vector.body

vector.body: ; preds = %vector.body, %entry		vector.body: ; preds = %vector.body, %entry
%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]		%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]
%0 = getelementptr inbounds i32, ptr %a, i64 %index		%0 = getelementptr inbounds i32, ptr %a, i64 %index
%wide.load = load <4 x i32>, ptr %0, align 4		%wide.load = load <4 x i32>, ptr %0, align 4
%1 = call <4 x i32> @llvm.vp.sub.v4i32(<4 x i32> %wide.load, <4 x i32> %broadcast.splat, <4 x i1> %m, i32 %vl)		%1 = call <4 x i32> @llvm.vp.sub.v4i32(<4 x i32> %wide.load, <4 x i32> %broadcast.splat, <4 x i1> %m, i32 %vl)
store <4 x i32> %1, ptr %0, align 4		store <4 x i32> %1, ptr %0, align 4
%index.next = add nuw i64 %index, 4		%index.next = add nuw i64 %index, 4
%2 = icmp eq i64 %index.next, 1024		%2 = icmp eq i64 %index.next, 1024
br i1 %2, label %for.cond.cleanup, label %vector.body		br i1 %2, label %for.cond.cleanup, label %vector.body

for.cond.cleanup: ; preds = %vector.body		for.cond.cleanup: ; preds = %vector.body
ret void		ret void
}		}

define void @sink_splat_vp_rsub(ptr nocapture %a, i32 signext %x, <4 x i1> %m, i32 zeroext %vl) {		define void @sink_splat_vp_rsub(ptr nocapture %a, i32 signext %x, <4 x i1> %m, i32 zeroext %vl) {
; CHECK-LABEL: sink_splat_vp_rsub:		; CHECK-LABEL: sink_splat_vp_rsub:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a3, 1024		; CHECK-NEXT: lui a3, 1
		; CHECK-NEXT: add a3, a0, a3
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: .LBB50_1: # %vector.body		; CHECK-NEXT: .LBB50_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsetvli zero, a2, e32, m1, ta, ma		; CHECK-NEXT: vsetvli zero, a2, e32, m1, ta, ma
; CHECK-NEXT: vrsub.vx v8, v8, a1, v0.t		; CHECK-NEXT: vrsub.vx v8, v8, a1, v0.t
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a3, a3, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a3, .LBB50_1		; CHECK-NEXT: bne a0, a3, .LBB50_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%broadcast.splatinsert = insertelement <4 x i32> poison, i32 %x, i32 0		%broadcast.splatinsert = insertelement <4 x i32> poison, i32 %x, i32 0
%broadcast.splat = shufflevector <4 x i32> %broadcast.splatinsert, <4 x i32> poison, <4 x i32> zeroinitializer		%broadcast.splat = shufflevector <4 x i32> %broadcast.splatinsert, <4 x i32> poison, <4 x i32> zeroinitializer
br label %vector.body		br label %vector.body

vector.body: ; preds = %vector.body, %entry		vector.body: ; preds = %vector.body, %entry
Show All 10 Lines	for.cond.cleanup: ; preds = %vector.body
ret void		ret void
}		}

declare <4 x i32> @llvm.vp.shl.v4i32(<4 x i32>, <4 x i32>, <4 x i1>, i32)		declare <4 x i32> @llvm.vp.shl.v4i32(<4 x i32>, <4 x i32>, <4 x i1>, i32)

define void @sink_splat_vp_shl(ptr nocapture %a, i32 signext %x, <4 x i1> %m, i32 zeroext %vl) {		define void @sink_splat_vp_shl(ptr nocapture %a, i32 signext %x, <4 x i1> %m, i32 zeroext %vl) {
; CHECK-LABEL: sink_splat_vp_shl:		; CHECK-LABEL: sink_splat_vp_shl:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a3, 1024		; CHECK-NEXT: lui a3, 1
		; CHECK-NEXT: add a3, a0, a3
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: .LBB51_1: # %vector.body		; CHECK-NEXT: .LBB51_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsetvli zero, a2, e32, m1, ta, ma		; CHECK-NEXT: vsetvli zero, a2, e32, m1, ta, ma
; CHECK-NEXT: vsll.vx v8, v8, a1, v0.t		; CHECK-NEXT: vsll.vx v8, v8, a1, v0.t
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a3, a3, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a3, .LBB51_1		; CHECK-NEXT: bne a0, a3, .LBB51_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%broadcast.splatinsert = insertelement <4 x i32> poison, i32 %x, i32 0		%broadcast.splatinsert = insertelement <4 x i32> poison, i32 %x, i32 0
%broadcast.splat = shufflevector <4 x i32> %broadcast.splatinsert, <4 x i32> poison, <4 x i32> zeroinitializer		%broadcast.splat = shufflevector <4 x i32> %broadcast.splatinsert, <4 x i32> poison, <4 x i32> zeroinitializer
br label %vector.body		br label %vector.body

vector.body: ; preds = %vector.body, %entry		vector.body: ; preds = %vector.body, %entry
Show All 10 Lines	for.cond.cleanup: ; preds = %vector.body
ret void		ret void
}		}

declare <4 x i32> @llvm.vp.lshr.v4i32(<4 x i32>, <4 x i32>, <4 x i1>, i32)		declare <4 x i32> @llvm.vp.lshr.v4i32(<4 x i32>, <4 x i32>, <4 x i1>, i32)

define void @sink_splat_vp_lshr(ptr nocapture %a, i32 signext %x, <4 x i1> %m, i32 zeroext %vl) {		define void @sink_splat_vp_lshr(ptr nocapture %a, i32 signext %x, <4 x i1> %m, i32 zeroext %vl) {
; CHECK-LABEL: sink_splat_vp_lshr:		; CHECK-LABEL: sink_splat_vp_lshr:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a3, 1024		; CHECK-NEXT: lui a3, 1
		; CHECK-NEXT: add a3, a0, a3
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: .LBB52_1: # %vector.body		; CHECK-NEXT: .LBB52_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsetvli zero, a2, e32, m1, ta, ma		; CHECK-NEXT: vsetvli zero, a2, e32, m1, ta, ma
; CHECK-NEXT: vsrl.vx v8, v8, a1, v0.t		; CHECK-NEXT: vsrl.vx v8, v8, a1, v0.t
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a3, a3, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a3, .LBB52_1		; CHECK-NEXT: bne a0, a3, .LBB52_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%broadcast.splatinsert = insertelement <4 x i32> poison, i32 %x, i32 0		%broadcast.splatinsert = insertelement <4 x i32> poison, i32 %x, i32 0
%broadcast.splat = shufflevector <4 x i32> %broadcast.splatinsert, <4 x i32> poison, <4 x i32> zeroinitializer		%broadcast.splat = shufflevector <4 x i32> %broadcast.splatinsert, <4 x i32> poison, <4 x i32> zeroinitializer
br label %vector.body		br label %vector.body

vector.body: ; preds = %vector.body, %entry		vector.body: ; preds = %vector.body, %entry
Show All 10 Lines	for.cond.cleanup: ; preds = %vector.body
ret void		ret void
}		}

declare <4 x i32> @llvm.vp.ashr.v4i32(<4 x i32>, <4 x i32>, <4 x i1>, i32)		declare <4 x i32> @llvm.vp.ashr.v4i32(<4 x i32>, <4 x i32>, <4 x i1>, i32)

define void @sink_splat_vp_ashr(ptr nocapture %a, i32 signext %x, <4 x i1> %m, i32 zeroext %vl) {		define void @sink_splat_vp_ashr(ptr nocapture %a, i32 signext %x, <4 x i1> %m, i32 zeroext %vl) {
; CHECK-LABEL: sink_splat_vp_ashr:		; CHECK-LABEL: sink_splat_vp_ashr:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a3, 1024		; CHECK-NEXT: lui a3, 1
		; CHECK-NEXT: add a3, a0, a3
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: .LBB53_1: # %vector.body		; CHECK-NEXT: .LBB53_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsetvli zero, a2, e32, m1, ta, ma		; CHECK-NEXT: vsetvli zero, a2, e32, m1, ta, ma
; CHECK-NEXT: vsra.vx v8, v8, a1, v0.t		; CHECK-NEXT: vsra.vx v8, v8, a1, v0.t
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a3, a3, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a3, .LBB53_1		; CHECK-NEXT: bne a0, a3, .LBB53_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%broadcast.splatinsert = insertelement <4 x i32> poison, i32 %x, i32 0		%broadcast.splatinsert = insertelement <4 x i32> poison, i32 %x, i32 0
%broadcast.splat = shufflevector <4 x i32> %broadcast.splatinsert, <4 x i32> poison, <4 x i32> zeroinitializer		%broadcast.splat = shufflevector <4 x i32> %broadcast.splatinsert, <4 x i32> poison, <4 x i32> zeroinitializer
br label %vector.body		br label %vector.body

vector.body: ; preds = %vector.body, %entry		vector.body: ; preds = %vector.body, %entry
Show All 10 Lines	for.cond.cleanup: ; preds = %vector.body
ret void		ret void
}		}

declare <4 x float> @llvm.vp.fmul.v4i32(<4 x float>, <4 x float>, <4 x i1>, i32)		declare <4 x float> @llvm.vp.fmul.v4i32(<4 x float>, <4 x float>, <4 x i1>, i32)

define void @sink_splat_vp_fmul(ptr nocapture %a, float %x, <4 x i1> %m, i32 zeroext %vl) {		define void @sink_splat_vp_fmul(ptr nocapture %a, float %x, <4 x i1> %m, i32 zeroext %vl) {
; CHECK-LABEL: sink_splat_vp_fmul:		; CHECK-LABEL: sink_splat_vp_fmul:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a2, 1024		; CHECK-NEXT: lui a2, 1
		; CHECK-NEXT: add a2, a0, a2
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: .LBB54_1: # %vector.body		; CHECK-NEXT: .LBB54_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsetvli zero, a1, e32, m1, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e32, m1, ta, ma
; CHECK-NEXT: vfmul.vf v8, v8, fa0, v0.t		; CHECK-NEXT: vfmul.vf v8, v8, fa0, v0.t
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a2, a2, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a2, .LBB54_1		; CHECK-NEXT: bne a0, a2, .LBB54_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%broadcast.splatinsert = insertelement <4 x float> poison, float %x, i32 0		%broadcast.splatinsert = insertelement <4 x float> poison, float %x, i32 0
%broadcast.splat = shufflevector <4 x float> %broadcast.splatinsert, <4 x float> poison, <4 x i32> zeroinitializer		%broadcast.splat = shufflevector <4 x float> %broadcast.splatinsert, <4 x float> poison, <4 x i32> zeroinitializer
br label %vector.body		br label %vector.body

vector.body: ; preds = %vector.body, %entry		vector.body: ; preds = %vector.body, %entry
Show All 10 Lines	for.cond.cleanup: ; preds = %vector.body
ret void		ret void
}		}

declare <4 x float> @llvm.vp.fdiv.v4i32(<4 x float>, <4 x float>, <4 x i1>, i32)		declare <4 x float> @llvm.vp.fdiv.v4i32(<4 x float>, <4 x float>, <4 x i1>, i32)

define void @sink_splat_vp_fdiv(ptr nocapture %a, float %x, <4 x i1> %m, i32 zeroext %vl) {		define void @sink_splat_vp_fdiv(ptr nocapture %a, float %x, <4 x i1> %m, i32 zeroext %vl) {
; CHECK-LABEL: sink_splat_vp_fdiv:		; CHECK-LABEL: sink_splat_vp_fdiv:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a2, 1024		; CHECK-NEXT: lui a2, 1
		; CHECK-NEXT: add a2, a0, a2
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: .LBB55_1: # %vector.body		; CHECK-NEXT: .LBB55_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsetvli zero, a1, e32, m1, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e32, m1, ta, ma
; CHECK-NEXT: vfdiv.vf v8, v8, fa0, v0.t		; CHECK-NEXT: vfdiv.vf v8, v8, fa0, v0.t
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a2, a2, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a2, .LBB55_1		; CHECK-NEXT: bne a0, a2, .LBB55_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%broadcast.splatinsert = insertelement <4 x float> poison, float %x, i32 0		%broadcast.splatinsert = insertelement <4 x float> poison, float %x, i32 0
%broadcast.splat = shufflevector <4 x float> %broadcast.splatinsert, <4 x float> poison, <4 x i32> zeroinitializer		%broadcast.splat = shufflevector <4 x float> %broadcast.splatinsert, <4 x float> poison, <4 x i32> zeroinitializer
br label %vector.body		br label %vector.body

vector.body: ; preds = %vector.body, %entry		vector.body: ; preds = %vector.body, %entry
%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]		%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]
%0 = getelementptr inbounds float, ptr %a, i64 %index		%0 = getelementptr inbounds float, ptr %a, i64 %index
%wide.load = load <4 x float>, ptr %0, align 4		%wide.load = load <4 x float>, ptr %0, align 4
%1 = call <4 x float> @llvm.vp.fdiv.v4i32(<4 x float> %wide.load, <4 x float> %broadcast.splat, <4 x i1> %m, i32 %vl)		%1 = call <4 x float> @llvm.vp.fdiv.v4i32(<4 x float> %wide.load, <4 x float> %broadcast.splat, <4 x i1> %m, i32 %vl)
store <4 x float> %1, ptr %0, align 4		store <4 x float> %1, ptr %0, align 4
%index.next = add nuw i64 %index, 4		%index.next = add nuw i64 %index, 4
%2 = icmp eq i64 %index.next, 1024		%2 = icmp eq i64 %index.next, 1024
br i1 %2, label %for.cond.cleanup, label %vector.body		br i1 %2, label %for.cond.cleanup, label %vector.body

for.cond.cleanup: ; preds = %vector.body		for.cond.cleanup: ; preds = %vector.body
ret void		ret void
}		}

define void @sink_splat_vp_frdiv(ptr nocapture %a, float %x, <4 x i1> %m, i32 zeroext %vl) {		define void @sink_splat_vp_frdiv(ptr nocapture %a, float %x, <4 x i1> %m, i32 zeroext %vl) {
; CHECK-LABEL: sink_splat_vp_frdiv:		; CHECK-LABEL: sink_splat_vp_frdiv:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a2, 1024		; CHECK-NEXT: lui a2, 1
		; CHECK-NEXT: add a2, a0, a2
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: .LBB56_1: # %vector.body		; CHECK-NEXT: .LBB56_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsetvli zero, a1, e32, m1, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e32, m1, ta, ma
; CHECK-NEXT: vfrdiv.vf v8, v8, fa0, v0.t		; CHECK-NEXT: vfrdiv.vf v8, v8, fa0, v0.t
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a2, a2, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a2, .LBB56_1		; CHECK-NEXT: bne a0, a2, .LBB56_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%broadcast.splatinsert = insertelement <4 x float> poison, float %x, i32 0		%broadcast.splatinsert = insertelement <4 x float> poison, float %x, i32 0
%broadcast.splat = shufflevector <4 x float> %broadcast.splatinsert, <4 x float> poison, <4 x i32> zeroinitializer		%broadcast.splat = shufflevector <4 x float> %broadcast.splatinsert, <4 x float> poison, <4 x i32> zeroinitializer
br label %vector.body		br label %vector.body

vector.body: ; preds = %vector.body, %entry		vector.body: ; preds = %vector.body, %entry
Show All 10 Lines	for.cond.cleanup: ; preds = %vector.body
ret void		ret void
}		}

declare <4 x float> @llvm.vp.fadd.v4i32(<4 x float>, <4 x float>, <4 x i1>, i32)		declare <4 x float> @llvm.vp.fadd.v4i32(<4 x float>, <4 x float>, <4 x i1>, i32)

define void @sink_splat_vp_fadd(ptr nocapture %a, float %x, <4 x i1> %m, i32 zeroext %vl) {		define void @sink_splat_vp_fadd(ptr nocapture %a, float %x, <4 x i1> %m, i32 zeroext %vl) {
; CHECK-LABEL: sink_splat_vp_fadd:		; CHECK-LABEL: sink_splat_vp_fadd:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a2, 1024		; CHECK-NEXT: lui a2, 1
		; CHECK-NEXT: add a2, a0, a2
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: .LBB57_1: # %vector.body		; CHECK-NEXT: .LBB57_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsetvli zero, a1, e32, m1, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e32, m1, ta, ma
; CHECK-NEXT: vfadd.vf v8, v8, fa0, v0.t		; CHECK-NEXT: vfadd.vf v8, v8, fa0, v0.t
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a2, a2, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a2, .LBB57_1		; CHECK-NEXT: bne a0, a2, .LBB57_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%broadcast.splatinsert = insertelement <4 x float> poison, float %x, i32 0		%broadcast.splatinsert = insertelement <4 x float> poison, float %x, i32 0
%broadcast.splat = shufflevector <4 x float> %broadcast.splatinsert, <4 x float> poison, <4 x i32> zeroinitializer		%broadcast.splat = shufflevector <4 x float> %broadcast.splatinsert, <4 x float> poison, <4 x i32> zeroinitializer
br label %vector.body		br label %vector.body

vector.body: ; preds = %vector.body, %entry		vector.body: ; preds = %vector.body, %entry
Show All 10 Lines	for.cond.cleanup: ; preds = %vector.body
ret void		ret void
}		}

declare <4 x float> @llvm.vp.fsub.v4i32(<4 x float>, <4 x float>, <4 x i1>, i32)		declare <4 x float> @llvm.vp.fsub.v4i32(<4 x float>, <4 x float>, <4 x i1>, i32)

define void @sink_splat_vp_fsub(ptr nocapture %a, float %x, <4 x i1> %m, i32 zeroext %vl) {		define void @sink_splat_vp_fsub(ptr nocapture %a, float %x, <4 x i1> %m, i32 zeroext %vl) {
; CHECK-LABEL: sink_splat_vp_fsub:		; CHECK-LABEL: sink_splat_vp_fsub:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a2, 1024		; CHECK-NEXT: lui a2, 1
		; CHECK-NEXT: add a2, a0, a2
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: .LBB58_1: # %vector.body		; CHECK-NEXT: .LBB58_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsetvli zero, a1, e32, m1, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e32, m1, ta, ma
; CHECK-NEXT: vfsub.vf v8, v8, fa0, v0.t		; CHECK-NEXT: vfsub.vf v8, v8, fa0, v0.t
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a2, a2, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a2, .LBB58_1		; CHECK-NEXT: bne a0, a2, .LBB58_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%broadcast.splatinsert = insertelement <4 x float> poison, float %x, i32 0		%broadcast.splatinsert = insertelement <4 x float> poison, float %x, i32 0
%broadcast.splat = shufflevector <4 x float> %broadcast.splatinsert, <4 x float> poison, <4 x i32> zeroinitializer		%broadcast.splat = shufflevector <4 x float> %broadcast.splatinsert, <4 x float> poison, <4 x i32> zeroinitializer
br label %vector.body		br label %vector.body

vector.body: ; preds = %vector.body, %entry		vector.body: ; preds = %vector.body, %entry
Show All 10 Lines	for.cond.cleanup: ; preds = %vector.body
ret void		ret void
}		}

declare <4 x float> @llvm.vp.frsub.v4i32(<4 x float>, <4 x float>, <4 x i1>, i32)		declare <4 x float> @llvm.vp.frsub.v4i32(<4 x float>, <4 x float>, <4 x i1>, i32)

define void @sink_splat_vp_frsub(ptr nocapture %a, float %x, <4 x i1> %m, i32 zeroext %vl) {		define void @sink_splat_vp_frsub(ptr nocapture %a, float %x, <4 x i1> %m, i32 zeroext %vl) {
; CHECK-LABEL: sink_splat_vp_frsub:		; CHECK-LABEL: sink_splat_vp_frsub:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a2, 1024		; CHECK-NEXT: lui a2, 1
		; CHECK-NEXT: add a2, a0, a2
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: .LBB59_1: # %vector.body		; CHECK-NEXT: .LBB59_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsetvli zero, a1, e32, m1, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e32, m1, ta, ma
; CHECK-NEXT: vfrsub.vf v8, v8, fa0, v0.t		; CHECK-NEXT: vfrsub.vf v8, v8, fa0, v0.t
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a2, a2, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a2, .LBB59_1		; CHECK-NEXT: bne a0, a2, .LBB59_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%broadcast.splatinsert = insertelement <4 x float> poison, float %x, i32 0		%broadcast.splatinsert = insertelement <4 x float> poison, float %x, i32 0
%broadcast.splat = shufflevector <4 x float> %broadcast.splatinsert, <4 x float> poison, <4 x i32> zeroinitializer		%broadcast.splat = shufflevector <4 x float> %broadcast.splatinsert, <4 x float> poison, <4 x i32> zeroinitializer
br label %vector.body		br label %vector.body

vector.body: ; preds = %vector.body, %entry		vector.body: ; preds = %vector.body, %entry
Show All 10 Lines	for.cond.cleanup: ; preds = %vector.body
ret void		ret void
}		}

declare <4 x i32> @llvm.vp.udiv.v4i32(<4 x i32>, <4 x i32>, <4 x i1>, i32)		declare <4 x i32> @llvm.vp.udiv.v4i32(<4 x i32>, <4 x i32>, <4 x i1>, i32)

define void @sink_splat_vp_udiv(ptr nocapture %a, i32 signext %x, <4 x i1> %m, i32 zeroext %vl) {		define void @sink_splat_vp_udiv(ptr nocapture %a, i32 signext %x, <4 x i1> %m, i32 zeroext %vl) {
; CHECK-LABEL: sink_splat_vp_udiv:		; CHECK-LABEL: sink_splat_vp_udiv:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a3, 1024		; CHECK-NEXT: lui a3, 1
		; CHECK-NEXT: add a3, a0, a3
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: .LBB60_1: # %vector.body		; CHECK-NEXT: .LBB60_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsetvli zero, a2, e32, m1, ta, ma		; CHECK-NEXT: vsetvli zero, a2, e32, m1, ta, ma
; CHECK-NEXT: vdivu.vx v8, v8, a1, v0.t		; CHECK-NEXT: vdivu.vx v8, v8, a1, v0.t
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a3, a3, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a3, .LBB60_1		; CHECK-NEXT: bne a0, a3, .LBB60_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%broadcast.splatinsert = insertelement <4 x i32> poison, i32 %x, i32 0		%broadcast.splatinsert = insertelement <4 x i32> poison, i32 %x, i32 0
%broadcast.splat = shufflevector <4 x i32> %broadcast.splatinsert, <4 x i32> poison, <4 x i32> zeroinitializer		%broadcast.splat = shufflevector <4 x i32> %broadcast.splatinsert, <4 x i32> poison, <4 x i32> zeroinitializer
br label %vector.body		br label %vector.body

vector.body: ; preds = %vector.body, %entry		vector.body: ; preds = %vector.body, %entry
Show All 10 Lines	for.cond.cleanup: ; preds = %vector.body
ret void		ret void
}		}

declare <4 x i32> @llvm.vp.sdiv.v4i32(<4 x i32>, <4 x i32>, <4 x i1>, i32)		declare <4 x i32> @llvm.vp.sdiv.v4i32(<4 x i32>, <4 x i32>, <4 x i1>, i32)

define void @sink_splat_vp_sdiv(ptr nocapture %a, i32 signext %x, <4 x i1> %m, i32 zeroext %vl) {		define void @sink_splat_vp_sdiv(ptr nocapture %a, i32 signext %x, <4 x i1> %m, i32 zeroext %vl) {
; CHECK-LABEL: sink_splat_vp_sdiv:		; CHECK-LABEL: sink_splat_vp_sdiv:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a3, 1024		; CHECK-NEXT: lui a3, 1
		; CHECK-NEXT: add a3, a0, a3
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: .LBB61_1: # %vector.body		; CHECK-NEXT: .LBB61_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsetvli zero, a2, e32, m1, ta, ma		; CHECK-NEXT: vsetvli zero, a2, e32, m1, ta, ma
; CHECK-NEXT: vdiv.vx v8, v8, a1, v0.t		; CHECK-NEXT: vdiv.vx v8, v8, a1, v0.t
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a3, a3, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a3, .LBB61_1		; CHECK-NEXT: bne a0, a3, .LBB61_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%broadcast.splatinsert = insertelement <4 x i32> poison, i32 %x, i32 0		%broadcast.splatinsert = insertelement <4 x i32> poison, i32 %x, i32 0
%broadcast.splat = shufflevector <4 x i32> %broadcast.splatinsert, <4 x i32> poison, <4 x i32> zeroinitializer		%broadcast.splat = shufflevector <4 x i32> %broadcast.splatinsert, <4 x i32> poison, <4 x i32> zeroinitializer
br label %vector.body		br label %vector.body

vector.body: ; preds = %vector.body, %entry		vector.body: ; preds = %vector.body, %entry
Show All 10 Lines	for.cond.cleanup: ; preds = %vector.body
ret void		ret void
}		}

declare <4 x i32> @llvm.vp.urem.v4i32(<4 x i32>, <4 x i32>, <4 x i1>, i32)		declare <4 x i32> @llvm.vp.urem.v4i32(<4 x i32>, <4 x i32>, <4 x i1>, i32)

define void @sink_splat_vp_urem(ptr nocapture %a, i32 signext %x, <4 x i1> %m, i32 zeroext %vl) {		define void @sink_splat_vp_urem(ptr nocapture %a, i32 signext %x, <4 x i1> %m, i32 zeroext %vl) {
; CHECK-LABEL: sink_splat_vp_urem:		; CHECK-LABEL: sink_splat_vp_urem:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a3, 1024		; CHECK-NEXT: lui a3, 1
		; CHECK-NEXT: add a3, a0, a3
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: .LBB62_1: # %vector.body		; CHECK-NEXT: .LBB62_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsetvli zero, a2, e32, m1, ta, ma		; CHECK-NEXT: vsetvli zero, a2, e32, m1, ta, ma
; CHECK-NEXT: vremu.vx v8, v8, a1, v0.t		; CHECK-NEXT: vremu.vx v8, v8, a1, v0.t
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a3, a3, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a3, .LBB62_1		; CHECK-NEXT: bne a0, a3, .LBB62_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%broadcast.splatinsert = insertelement <4 x i32> poison, i32 %x, i32 0		%broadcast.splatinsert = insertelement <4 x i32> poison, i32 %x, i32 0
%broadcast.splat = shufflevector <4 x i32> %broadcast.splatinsert, <4 x i32> poison, <4 x i32> zeroinitializer		%broadcast.splat = shufflevector <4 x i32> %broadcast.splatinsert, <4 x i32> poison, <4 x i32> zeroinitializer
br label %vector.body		br label %vector.body

vector.body: ; preds = %vector.body, %entry		vector.body: ; preds = %vector.body, %entry
Show All 10 Lines	for.cond.cleanup: ; preds = %vector.body
ret void		ret void
}		}

declare <4 x i32> @llvm.vp.srem.v4i32(<4 x i32>, <4 x i32>, <4 x i1>, i32)		declare <4 x i32> @llvm.vp.srem.v4i32(<4 x i32>, <4 x i32>, <4 x i1>, i32)

define void @sink_splat_vp_srem(ptr nocapture %a, i32 signext %x, <4 x i1> %m, i32 zeroext %vl) {		define void @sink_splat_vp_srem(ptr nocapture %a, i32 signext %x, <4 x i1> %m, i32 zeroext %vl) {
; CHECK-LABEL: sink_splat_vp_srem:		; CHECK-LABEL: sink_splat_vp_srem:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a3, 1024		; CHECK-NEXT: lui a3, 1
		; CHECK-NEXT: add a3, a0, a3
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: .LBB63_1: # %vector.body		; CHECK-NEXT: .LBB63_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsetvli zero, a2, e32, m1, ta, ma		; CHECK-NEXT: vsetvli zero, a2, e32, m1, ta, ma
; CHECK-NEXT: vrem.vx v8, v8, a1, v0.t		; CHECK-NEXT: vrem.vx v8, v8, a1, v0.t
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a3, a3, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a3, .LBB63_1		; CHECK-NEXT: bne a0, a3, .LBB63_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%broadcast.splatinsert = insertelement <4 x i32> poison, i32 %x, i32 0		%broadcast.splatinsert = insertelement <4 x i32> poison, i32 %x, i32 0
%broadcast.splat = shufflevector <4 x i32> %broadcast.splatinsert, <4 x i32> poison, <4 x i32> zeroinitializer		%broadcast.splat = shufflevector <4 x i32> %broadcast.splatinsert, <4 x i32> poison, <4 x i32> zeroinitializer
br label %vector.body		br label %vector.body

vector.body: ; preds = %vector.body, %entry		vector.body: ; preds = %vector.body, %entry
Show All 12 Lines

; Check that we don't sink a splat operand that has no chance of being folded.		; Check that we don't sink a splat operand that has no chance of being folded.

define void @sink_splat_vp_srem_commute(ptr nocapture %a, i32 signext %x, <4 x i1> %m, i32 zeroext %vl) {		define void @sink_splat_vp_srem_commute(ptr nocapture %a, i32 signext %x, <4 x i1> %m, i32 zeroext %vl) {
; CHECK-LABEL: sink_splat_vp_srem_commute:		; CHECK-LABEL: sink_splat_vp_srem_commute:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: vmv.v.x v8, a1		; CHECK-NEXT: vmv.v.x v8, a1
; CHECK-NEXT: li a1, 1024		; CHECK-NEXT: lui a1, 1
		; CHECK-NEXT: add a1, a0, a1
; CHECK-NEXT: .LBB64_1: # %vector.body		; CHECK-NEXT: .LBB64_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vle32.v v9, (a0)		; CHECK-NEXT: vle32.v v9, (a0)
; CHECK-NEXT: vsetvli zero, a2, e32, m1, ta, ma		; CHECK-NEXT: vsetvli zero, a2, e32, m1, ta, ma
; CHECK-NEXT: vrem.vv v9, v8, v9, v0.t		; CHECK-NEXT: vrem.vv v9, v8, v9, v0.t
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: vse32.v v9, (a0)		; CHECK-NEXT: vse32.v v9, (a0)
; CHECK-NEXT: addi a1, a1, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a1, .LBB64_1		; CHECK-NEXT: bne a0, a1, .LBB64_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%broadcast.splatinsert = insertelement <4 x i32> poison, i32 %x, i32 0		%broadcast.splatinsert = insertelement <4 x i32> poison, i32 %x, i32 0
%broadcast.splat = shufflevector <4 x i32> %broadcast.splatinsert, <4 x i32> poison, <4 x i32> zeroinitializer		%broadcast.splat = shufflevector <4 x i32> %broadcast.splatinsert, <4 x i32> poison, <4 x i32> zeroinitializer
br label %vector.body		br label %vector.body

vector.body: ; preds = %vector.body, %entry		vector.body: ; preds = %vector.body, %entry
Show All 10 Lines	for.cond.cleanup: ; preds = %vector.body
ret void		ret void
}		}

declare <4 x float> @llvm.vp.fma.v4f32(<4 x float>, <4 x float>, <4 x float>, <4 x i1>, i32)		declare <4 x float> @llvm.vp.fma.v4f32(<4 x float>, <4 x float>, <4 x float>, <4 x i1>, i32)

define void @sink_splat_vp_fma(ptr noalias nocapture %a, ptr nocapture readonly %b, float %x, <4 x i1> %m, i32 zeroext %vl) {		define void @sink_splat_vp_fma(ptr noalias nocapture %a, ptr nocapture readonly %b, float %x, <4 x i1> %m, i32 zeroext %vl) {
; CHECK-LABEL: sink_splat_vp_fma:		; CHECK-LABEL: sink_splat_vp_fma:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a3, 1024		; CHECK-NEXT: lui a3, 1
		; CHECK-NEXT: add a3, a1, a3
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: .LBB65_1: # %vector.body		; CHECK-NEXT: .LBB65_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vle32.v v9, (a1)		; CHECK-NEXT: vle32.v v9, (a1)
; CHECK-NEXT: vsetvli zero, a2, e32, m1, ta, ma		; CHECK-NEXT: vsetvli zero, a2, e32, m1, ta, ma
; CHECK-NEXT: vfmadd.vf v8, fa0, v9, v0.t		; CHECK-NEXT: vfmadd.vf v8, fa0, v9, v0.t
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a3, a3, -4
; CHECK-NEXT: addi a1, a1, 16		; CHECK-NEXT: addi a1, a1, 16
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a3, .LBB65_1		; CHECK-NEXT: bne a1, a3, .LBB65_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%broadcast.splatinsert = insertelement <4 x float> poison, float %x, i32 0		%broadcast.splatinsert = insertelement <4 x float> poison, float %x, i32 0
%broadcast.splat = shufflevector <4 x float> %broadcast.splatinsert, <4 x float> poison, <4 x i32> zeroinitializer		%broadcast.splat = shufflevector <4 x float> %broadcast.splatinsert, <4 x float> poison, <4 x i32> zeroinitializer
br label %vector.body		br label %vector.body

vector.body: ; preds = %vector.body, %entry		vector.body: ; preds = %vector.body, %entry
Show All 10 Lines

for.cond.cleanup: ; preds = %vector.body		for.cond.cleanup: ; preds = %vector.body
ret void		ret void
}		}

define void @sink_splat_vp_fma_commute(ptr noalias nocapture %a, ptr nocapture readonly %b, float %x, <4 x i1> %m, i32 zeroext %vl) {		define void @sink_splat_vp_fma_commute(ptr noalias nocapture %a, ptr nocapture readonly %b, float %x, <4 x i1> %m, i32 zeroext %vl) {
; CHECK-LABEL: sink_splat_vp_fma_commute:		; CHECK-LABEL: sink_splat_vp_fma_commute:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a3, 1024		; CHECK-NEXT: lui a3, 1
		; CHECK-NEXT: add a3, a1, a3
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: .LBB66_1: # %vector.body		; CHECK-NEXT: .LBB66_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vle32.v v9, (a1)		; CHECK-NEXT: vle32.v v9, (a1)
; CHECK-NEXT: vsetvli zero, a2, e32, m1, ta, ma		; CHECK-NEXT: vsetvli zero, a2, e32, m1, ta, ma
; CHECK-NEXT: vfmadd.vf v8, fa0, v9, v0.t		; CHECK-NEXT: vfmadd.vf v8, fa0, v9, v0.t
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a3, a3, -4
; CHECK-NEXT: addi a1, a1, 16		; CHECK-NEXT: addi a1, a1, 16
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a3, .LBB66_1		; CHECK-NEXT: bne a1, a3, .LBB66_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%broadcast.splatinsert = insertelement <4 x float> poison, float %x, i32 0		%broadcast.splatinsert = insertelement <4 x float> poison, float %x, i32 0
%broadcast.splat = shufflevector <4 x float> %broadcast.splatinsert, <4 x float> poison, <4 x i32> zeroinitializer		%broadcast.splat = shufflevector <4 x float> %broadcast.splatinsert, <4 x float> poison, <4 x i32> zeroinitializer
br label %vector.body		br label %vector.body

vector.body: ; preds = %vector.body, %entry		vector.body: ; preds = %vector.body, %entry
Show All 11 Lines
for.cond.cleanup: ; preds = %vector.body		for.cond.cleanup: ; preds = %vector.body
ret void		ret void
}		}


define void @sink_splat_mul_lmul2(ptr nocapture %a, i64 signext %x) {		define void @sink_splat_mul_lmul2(ptr nocapture %a, i64 signext %x) {
; CHECK-LABEL: sink_splat_mul_lmul2:		; CHECK-LABEL: sink_splat_mul_lmul2:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a2, 1024		; CHECK-NEXT: lui a2, 2
		; CHECK-NEXT: add a2, a0, a2
; CHECK-NEXT: vsetivli zero, 4, e64, m2, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e64, m2, ta, ma
; CHECK-NEXT: .LBB67_1: # %vector.body		; CHECK-NEXT: .LBB67_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vle64.v v8, (a0)		; CHECK-NEXT: vle64.v v8, (a0)
; CHECK-NEXT: vmul.vx v8, v8, a1		; CHECK-NEXT: vmul.vx v8, v8, a1
; CHECK-NEXT: vse64.v v8, (a0)		; CHECK-NEXT: vse64.v v8, (a0)
; CHECK-NEXT: addi a2, a2, -4
; CHECK-NEXT: addi a0, a0, 32		; CHECK-NEXT: addi a0, a0, 32
; CHECK-NEXT: bnez a2, .LBB67_1		; CHECK-NEXT: bne a0, a2, .LBB67_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%broadcast.splatinsert = insertelement <4 x i64> poison, i64 %x, i64 0		%broadcast.splatinsert = insertelement <4 x i64> poison, i64 %x, i64 0
%broadcast.splat = shufflevector <4 x i64> %broadcast.splatinsert, <4 x i64> poison, <4 x i32> zeroinitializer		%broadcast.splat = shufflevector <4 x i64> %broadcast.splatinsert, <4 x i64> poison, <4 x i32> zeroinitializer
br label %vector.body		br label %vector.body

vector.body: ; preds = %vector.body, %entry		vector.body: ; preds = %vector.body, %entry
%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]		%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]
%0 = getelementptr inbounds i64, ptr %a, i64 %index		%0 = getelementptr inbounds i64, ptr %a, i64 %index
%wide.load = load <4 x i64>, ptr %0, align 8		%wide.load = load <4 x i64>, ptr %0, align 8
%1 = mul <4 x i64> %wide.load, %broadcast.splat		%1 = mul <4 x i64> %wide.load, %broadcast.splat
store <4 x i64> %1, ptr %0, align 8		store <4 x i64> %1, ptr %0, align 8
%index.next = add nuw i64 %index, 4		%index.next = add nuw i64 %index, 4
%2 = icmp eq i64 %index.next, 1024		%2 = icmp eq i64 %index.next, 1024
br i1 %2, label %for.cond.cleanup, label %vector.body		br i1 %2, label %for.cond.cleanup, label %vector.body

for.cond.cleanup: ; preds = %vector.body		for.cond.cleanup: ; preds = %vector.body
ret void		ret void
}		}

define void @sink_splat_add_lmul2(ptr nocapture %a, i64 signext %x) {		define void @sink_splat_add_lmul2(ptr nocapture %a, i64 signext %x) {
; CHECK-LABEL: sink_splat_add_lmul2:		; CHECK-LABEL: sink_splat_add_lmul2:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a2, 1024		; CHECK-NEXT: lui a2, 2
		; CHECK-NEXT: add a2, a0, a2
; CHECK-NEXT: vsetivli zero, 4, e64, m2, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e64, m2, ta, ma
; CHECK-NEXT: .LBB68_1: # %vector.body		; CHECK-NEXT: .LBB68_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vle64.v v8, (a0)		; CHECK-NEXT: vle64.v v8, (a0)
; CHECK-NEXT: vadd.vx v8, v8, a1		; CHECK-NEXT: vadd.vx v8, v8, a1
; CHECK-NEXT: vse64.v v8, (a0)		; CHECK-NEXT: vse64.v v8, (a0)
; CHECK-NEXT: addi a2, a2, -4
; CHECK-NEXT: addi a0, a0, 32		; CHECK-NEXT: addi a0, a0, 32
; CHECK-NEXT: bnez a2, .LBB68_1		; CHECK-NEXT: bne a0, a2, .LBB68_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%broadcast.splatinsert = insertelement <4 x i64> poison, i64 %x, i64 0		%broadcast.splatinsert = insertelement <4 x i64> poison, i64 %x, i64 0
%broadcast.splat = shufflevector <4 x i64> %broadcast.splatinsert, <4 x i64> poison, <4 x i32> zeroinitializer		%broadcast.splat = shufflevector <4 x i64> %broadcast.splatinsert, <4 x i64> poison, <4 x i32> zeroinitializer
br label %vector.body		br label %vector.body

vector.body: ; preds = %vector.body, %entry		vector.body: ; preds = %vector.body, %entry
%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]		%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]
%0 = getelementptr inbounds i64, ptr %a, i64 %index		%0 = getelementptr inbounds i64, ptr %a, i64 %index
%wide.load = load <4 x i64>, ptr %0, align 8		%wide.load = load <4 x i64>, ptr %0, align 8
%1 = add <4 x i64> %wide.load, %broadcast.splat		%1 = add <4 x i64> %wide.load, %broadcast.splat
store <4 x i64> %1, ptr %0, align 8		store <4 x i64> %1, ptr %0, align 8
%index.next = add nuw i64 %index, 4		%index.next = add nuw i64 %index, 4
%2 = icmp eq i64 %index.next, 1024		%2 = icmp eq i64 %index.next, 1024
br i1 %2, label %for.cond.cleanup, label %vector.body		br i1 %2, label %for.cond.cleanup, label %vector.body

for.cond.cleanup: ; preds = %vector.body		for.cond.cleanup: ; preds = %vector.body
ret void		ret void
}		}

define void @sink_splat_sub_lmul2(ptr nocapture %a, i64 signext %x) {		define void @sink_splat_sub_lmul2(ptr nocapture %a, i64 signext %x) {
; CHECK-LABEL: sink_splat_sub_lmul2:		; CHECK-LABEL: sink_splat_sub_lmul2:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a2, 1024		; CHECK-NEXT: lui a2, 2
		; CHECK-NEXT: add a2, a0, a2
; CHECK-NEXT: vsetivli zero, 4, e64, m2, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e64, m2, ta, ma
; CHECK-NEXT: .LBB69_1: # %vector.body		; CHECK-NEXT: .LBB69_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vle64.v v8, (a0)		; CHECK-NEXT: vle64.v v8, (a0)
; CHECK-NEXT: vsub.vx v8, v8, a1		; CHECK-NEXT: vsub.vx v8, v8, a1
; CHECK-NEXT: vse64.v v8, (a0)		; CHECK-NEXT: vse64.v v8, (a0)
; CHECK-NEXT: addi a2, a2, -4
; CHECK-NEXT: addi a0, a0, 32		; CHECK-NEXT: addi a0, a0, 32
; CHECK-NEXT: bnez a2, .LBB69_1		; CHECK-NEXT: bne a0, a2, .LBB69_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%broadcast.splatinsert = insertelement <4 x i64> poison, i64 %x, i64 0		%broadcast.splatinsert = insertelement <4 x i64> poison, i64 %x, i64 0
%broadcast.splat = shufflevector <4 x i64> %broadcast.splatinsert, <4 x i64> poison, <4 x i32> zeroinitializer		%broadcast.splat = shufflevector <4 x i64> %broadcast.splatinsert, <4 x i64> poison, <4 x i32> zeroinitializer
br label %vector.body		br label %vector.body

vector.body: ; preds = %vector.body, %entry		vector.body: ; preds = %vector.body, %entry
%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]		%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]
%0 = getelementptr inbounds i64, ptr %a, i64 %index		%0 = getelementptr inbounds i64, ptr %a, i64 %index
%wide.load = load <4 x i64>, ptr %0, align 8		%wide.load = load <4 x i64>, ptr %0, align 8
%1 = sub <4 x i64> %wide.load, %broadcast.splat		%1 = sub <4 x i64> %wide.load, %broadcast.splat
store <4 x i64> %1, ptr %0, align 8		store <4 x i64> %1, ptr %0, align 8
%index.next = add nuw i64 %index, 4		%index.next = add nuw i64 %index, 4
%2 = icmp eq i64 %index.next, 1024		%2 = icmp eq i64 %index.next, 1024
br i1 %2, label %for.cond.cleanup, label %vector.body		br i1 %2, label %for.cond.cleanup, label %vector.body

for.cond.cleanup: ; preds = %vector.body		for.cond.cleanup: ; preds = %vector.body
ret void		ret void
}		}

define void @sink_splat_rsub_lmul2(ptr nocapture %a, i64 signext %x) {		define void @sink_splat_rsub_lmul2(ptr nocapture %a, i64 signext %x) {
; CHECK-LABEL: sink_splat_rsub_lmul2:		; CHECK-LABEL: sink_splat_rsub_lmul2:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a2, 1024		; CHECK-NEXT: lui a2, 2
		; CHECK-NEXT: add a2, a0, a2
; CHECK-NEXT: vsetivli zero, 4, e64, m2, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e64, m2, ta, ma
; CHECK-NEXT: .LBB70_1: # %vector.body		; CHECK-NEXT: .LBB70_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vle64.v v8, (a0)		; CHECK-NEXT: vle64.v v8, (a0)
; CHECK-NEXT: vrsub.vx v8, v8, a1		; CHECK-NEXT: vrsub.vx v8, v8, a1
; CHECK-NEXT: vse64.v v8, (a0)		; CHECK-NEXT: vse64.v v8, (a0)
; CHECK-NEXT: addi a2, a2, -4
; CHECK-NEXT: addi a0, a0, 32		; CHECK-NEXT: addi a0, a0, 32
; CHECK-NEXT: bnez a2, .LBB70_1		; CHECK-NEXT: bne a0, a2, .LBB70_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%broadcast.splatinsert = insertelement <4 x i64> poison, i64 %x, i64 0		%broadcast.splatinsert = insertelement <4 x i64> poison, i64 %x, i64 0
%broadcast.splat = shufflevector <4 x i64> %broadcast.splatinsert, <4 x i64> poison, <4 x i32> zeroinitializer		%broadcast.splat = shufflevector <4 x i64> %broadcast.splatinsert, <4 x i64> poison, <4 x i32> zeroinitializer
br label %vector.body		br label %vector.body

vector.body: ; preds = %vector.body, %entry		vector.body: ; preds = %vector.body, %entry
%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]		%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]
%0 = getelementptr inbounds i64, ptr %a, i64 %index		%0 = getelementptr inbounds i64, ptr %a, i64 %index
%wide.load = load <4 x i64>, ptr %0, align 8		%wide.load = load <4 x i64>, ptr %0, align 8
%1 = sub <4 x i64> %broadcast.splat, %wide.load		%1 = sub <4 x i64> %broadcast.splat, %wide.load
store <4 x i64> %1, ptr %0, align 8		store <4 x i64> %1, ptr %0, align 8
%index.next = add nuw i64 %index, 4		%index.next = add nuw i64 %index, 4
%2 = icmp eq i64 %index.next, 1024		%2 = icmp eq i64 %index.next, 1024
br i1 %2, label %for.cond.cleanup, label %vector.body		br i1 %2, label %for.cond.cleanup, label %vector.body

for.cond.cleanup: ; preds = %vector.body		for.cond.cleanup: ; preds = %vector.body
ret void		ret void
}		}

define void @sink_splat_and_lmul2(ptr nocapture %a, i64 signext %x) {		define void @sink_splat_and_lmul2(ptr nocapture %a, i64 signext %x) {
; CHECK-LABEL: sink_splat_and_lmul2:		; CHECK-LABEL: sink_splat_and_lmul2:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a2, 1024		; CHECK-NEXT: lui a2, 2
		; CHECK-NEXT: add a2, a0, a2
; CHECK-NEXT: vsetivli zero, 4, e64, m2, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e64, m2, ta, ma
; CHECK-NEXT: .LBB71_1: # %vector.body		; CHECK-NEXT: .LBB71_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vle64.v v8, (a0)		; CHECK-NEXT: vle64.v v8, (a0)
; CHECK-NEXT: vand.vx v8, v8, a1		; CHECK-NEXT: vand.vx v8, v8, a1
; CHECK-NEXT: vse64.v v8, (a0)		; CHECK-NEXT: vse64.v v8, (a0)
; CHECK-NEXT: addi a2, a2, -4
; CHECK-NEXT: addi a0, a0, 32		; CHECK-NEXT: addi a0, a0, 32
; CHECK-NEXT: bnez a2, .LBB71_1		; CHECK-NEXT: bne a0, a2, .LBB71_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%broadcast.splatinsert = insertelement <4 x i64> poison, i64 %x, i64 0		%broadcast.splatinsert = insertelement <4 x i64> poison, i64 %x, i64 0
%broadcast.splat = shufflevector <4 x i64> %broadcast.splatinsert, <4 x i64> poison, <4 x i32> zeroinitializer		%broadcast.splat = shufflevector <4 x i64> %broadcast.splatinsert, <4 x i64> poison, <4 x i32> zeroinitializer
br label %vector.body		br label %vector.body

vector.body: ; preds = %vector.body, %entry		vector.body: ; preds = %vector.body, %entry
%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]		%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]
%0 = getelementptr inbounds i64, ptr %a, i64 %index		%0 = getelementptr inbounds i64, ptr %a, i64 %index
%wide.load = load <4 x i64>, ptr %0, align 8		%wide.load = load <4 x i64>, ptr %0, align 8
%1 = and <4 x i64> %wide.load, %broadcast.splat		%1 = and <4 x i64> %wide.load, %broadcast.splat
store <4 x i64> %1, ptr %0, align 8		store <4 x i64> %1, ptr %0, align 8
%index.next = add nuw i64 %index, 4		%index.next = add nuw i64 %index, 4
%2 = icmp eq i64 %index.next, 1024		%2 = icmp eq i64 %index.next, 1024
br i1 %2, label %for.cond.cleanup, label %vector.body		br i1 %2, label %for.cond.cleanup, label %vector.body

for.cond.cleanup: ; preds = %vector.body		for.cond.cleanup: ; preds = %vector.body
ret void		ret void
}		}

define void @sink_splat_or_lmul2(ptr nocapture %a, i64 signext %x) {		define void @sink_splat_or_lmul2(ptr nocapture %a, i64 signext %x) {
; CHECK-LABEL: sink_splat_or_lmul2:		; CHECK-LABEL: sink_splat_or_lmul2:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a2, 1024		; CHECK-NEXT: lui a2, 2
		; CHECK-NEXT: add a2, a0, a2
; CHECK-NEXT: vsetivli zero, 4, e64, m2, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e64, m2, ta, ma
; CHECK-NEXT: .LBB72_1: # %vector.body		; CHECK-NEXT: .LBB72_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vle64.v v8, (a0)		; CHECK-NEXT: vle64.v v8, (a0)
; CHECK-NEXT: vor.vx v8, v8, a1		; CHECK-NEXT: vor.vx v8, v8, a1
; CHECK-NEXT: vse64.v v8, (a0)		; CHECK-NEXT: vse64.v v8, (a0)
; CHECK-NEXT: addi a2, a2, -4
; CHECK-NEXT: addi a0, a0, 32		; CHECK-NEXT: addi a0, a0, 32
; CHECK-NEXT: bnez a2, .LBB72_1		; CHECK-NEXT: bne a0, a2, .LBB72_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%broadcast.splatinsert = insertelement <4 x i64> poison, i64 %x, i64 0		%broadcast.splatinsert = insertelement <4 x i64> poison, i64 %x, i64 0
%broadcast.splat = shufflevector <4 x i64> %broadcast.splatinsert, <4 x i64> poison, <4 x i32> zeroinitializer		%broadcast.splat = shufflevector <4 x i64> %broadcast.splatinsert, <4 x i64> poison, <4 x i32> zeroinitializer
br label %vector.body		br label %vector.body

vector.body: ; preds = %vector.body, %entry		vector.body: ; preds = %vector.body, %entry
%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]		%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]
%0 = getelementptr inbounds i64, ptr %a, i64 %index		%0 = getelementptr inbounds i64, ptr %a, i64 %index
%wide.load = load <4 x i64>, ptr %0, align 8		%wide.load = load <4 x i64>, ptr %0, align 8
%1 = or <4 x i64> %wide.load, %broadcast.splat		%1 = or <4 x i64> %wide.load, %broadcast.splat
store <4 x i64> %1, ptr %0, align 8		store <4 x i64> %1, ptr %0, align 8
%index.next = add nuw i64 %index, 4		%index.next = add nuw i64 %index, 4
%2 = icmp eq i64 %index.next, 1024		%2 = icmp eq i64 %index.next, 1024
br i1 %2, label %for.cond.cleanup, label %vector.body		br i1 %2, label %for.cond.cleanup, label %vector.body

for.cond.cleanup: ; preds = %vector.body		for.cond.cleanup: ; preds = %vector.body
ret void		ret void
}		}

define void @sink_splat_xor_lmul2(ptr nocapture %a, i64 signext %x) {		define void @sink_splat_xor_lmul2(ptr nocapture %a, i64 signext %x) {
; CHECK-LABEL: sink_splat_xor_lmul2:		; CHECK-LABEL: sink_splat_xor_lmul2:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a2, 1024		; CHECK-NEXT: lui a2, 2
		; CHECK-NEXT: add a2, a0, a2
; CHECK-NEXT: vsetivli zero, 4, e64, m2, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e64, m2, ta, ma
; CHECK-NEXT: .LBB73_1: # %vector.body		; CHECK-NEXT: .LBB73_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vle64.v v8, (a0)		; CHECK-NEXT: vle64.v v8, (a0)
; CHECK-NEXT: vxor.vx v8, v8, a1		; CHECK-NEXT: vxor.vx v8, v8, a1
; CHECK-NEXT: vse64.v v8, (a0)		; CHECK-NEXT: vse64.v v8, (a0)
; CHECK-NEXT: addi a2, a2, -4
; CHECK-NEXT: addi a0, a0, 32		; CHECK-NEXT: addi a0, a0, 32
; CHECK-NEXT: bnez a2, .LBB73_1		; CHECK-NEXT: bne a0, a2, .LBB73_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%broadcast.splatinsert = insertelement <4 x i64> poison, i64 %x, i64 0		%broadcast.splatinsert = insertelement <4 x i64> poison, i64 %x, i64 0
%broadcast.splat = shufflevector <4 x i64> %broadcast.splatinsert, <4 x i64> poison, <4 x i32> zeroinitializer		%broadcast.splat = shufflevector <4 x i64> %broadcast.splatinsert, <4 x i64> poison, <4 x i32> zeroinitializer
br label %vector.body		br label %vector.body

vector.body: ; preds = %vector.body, %entry		vector.body: ; preds = %vector.body, %entry
%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]		%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]
%0 = getelementptr inbounds i64, ptr %a, i64 %index		%0 = getelementptr inbounds i64, ptr %a, i64 %index
%wide.load = load <4 x i64>, ptr %0, align 8		%wide.load = load <4 x i64>, ptr %0, align 8
%1 = xor <4 x i64> %wide.load, %broadcast.splat		%1 = xor <4 x i64> %wide.load, %broadcast.splat
store <4 x i64> %1, ptr %0, align 8		store <4 x i64> %1, ptr %0, align 8
%index.next = add nuw i64 %index, 4		%index.next = add nuw i64 %index, 4
%2 = icmp eq i64 %index.next, 1024		%2 = icmp eq i64 %index.next, 1024
br i1 %2, label %for.cond.cleanup, label %vector.body		br i1 %2, label %for.cond.cleanup, label %vector.body

for.cond.cleanup: ; preds = %vector.body		for.cond.cleanup: ; preds = %vector.body
ret void		ret void
}		}

define void @sink_splat_mul_lmul8(ptr nocapture %a, i32 signext %x) {		define void @sink_splat_mul_lmul8(ptr nocapture %a, i32 signext %x) {
; CHECK-LABEL: sink_splat_mul_lmul8:		; CHECK-LABEL: sink_splat_mul_lmul8:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a2, 1024		; CHECK-NEXT: lui a2, 1
		; CHECK-NEXT: add a2, a0, a2
; CHECK-NEXT: li a3, 32		; CHECK-NEXT: li a3, 32
; CHECK-NEXT: .LBB74_1: # %vector.body		; CHECK-NEXT: .LBB74_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vsetvli zero, a3, e32, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a3, e32, m8, ta, ma
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vmul.vx v8, v8, a1		; CHECK-NEXT: vmul.vx v8, v8, a1
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a2, a2, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a2, .LBB74_1		; CHECK-NEXT: bne a0, a2, .LBB74_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%broadcast.splatinsert = insertelement <32 x i32> poison, i32 %x, i32 0		%broadcast.splatinsert = insertelement <32 x i32> poison, i32 %x, i32 0
%broadcast.splat = shufflevector <32 x i32> %broadcast.splatinsert, <32 x i32> poison, <32 x i32> zeroinitializer		%broadcast.splat = shufflevector <32 x i32> %broadcast.splatinsert, <32 x i32> poison, <32 x i32> zeroinitializer
br label %vector.body		br label %vector.body

vector.body: ; preds = %vector.body, %entry		vector.body: ; preds = %vector.body, %entry
%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]		%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]
%0 = getelementptr inbounds i32, ptr %a, i64 %index		%0 = getelementptr inbounds i32, ptr %a, i64 %index
%wide.load = load <32 x i32>, ptr %0, align 4		%wide.load = load <32 x i32>, ptr %0, align 4
%1 = mul <32 x i32> %wide.load, %broadcast.splat		%1 = mul <32 x i32> %wide.load, %broadcast.splat
store <32 x i32> %1, ptr %0, align 4		store <32 x i32> %1, ptr %0, align 4
%index.next = add nuw i64 %index, 4		%index.next = add nuw i64 %index, 4
%2 = icmp eq i64 %index.next, 1024		%2 = icmp eq i64 %index.next, 1024
br i1 %2, label %for.cond.cleanup, label %vector.body		br i1 %2, label %for.cond.cleanup, label %vector.body

for.cond.cleanup: ; preds = %vector.body		for.cond.cleanup: ; preds = %vector.body
ret void		ret void
}		}

define void @sink_splat_add_lmul8(ptr nocapture %a, i32 signext %x) {		define void @sink_splat_add_lmul8(ptr nocapture %a, i32 signext %x) {
; CHECK-LABEL: sink_splat_add_lmul8:		; CHECK-LABEL: sink_splat_add_lmul8:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a2, 1024		; CHECK-NEXT: lui a2, 1
		; CHECK-NEXT: add a2, a0, a2
; CHECK-NEXT: li a3, 32		; CHECK-NEXT: li a3, 32
; CHECK-NEXT: .LBB75_1: # %vector.body		; CHECK-NEXT: .LBB75_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vsetvli zero, a3, e32, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a3, e32, m8, ta, ma
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vadd.vx v8, v8, a1		; CHECK-NEXT: vadd.vx v8, v8, a1
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a2, a2, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a2, .LBB75_1		; CHECK-NEXT: bne a0, a2, .LBB75_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%broadcast.splatinsert = insertelement <32 x i32> poison, i32 %x, i32 0		%broadcast.splatinsert = insertelement <32 x i32> poison, i32 %x, i32 0
%broadcast.splat = shufflevector <32 x i32> %broadcast.splatinsert, <32 x i32> poison, <32 x i32> zeroinitializer		%broadcast.splat = shufflevector <32 x i32> %broadcast.splatinsert, <32 x i32> poison, <32 x i32> zeroinitializer
br label %vector.body		br label %vector.body

vector.body: ; preds = %vector.body, %entry		vector.body: ; preds = %vector.body, %entry
%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]		%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]
%0 = getelementptr inbounds i32, ptr %a, i64 %index		%0 = getelementptr inbounds i32, ptr %a, i64 %index
%wide.load = load <32 x i32>, ptr %0, align 4		%wide.load = load <32 x i32>, ptr %0, align 4
%1 = add <32 x i32> %wide.load, %broadcast.splat		%1 = add <32 x i32> %wide.load, %broadcast.splat
store <32 x i32> %1, ptr %0, align 4		store <32 x i32> %1, ptr %0, align 4
%index.next = add nuw i64 %index, 4		%index.next = add nuw i64 %index, 4
%2 = icmp eq i64 %index.next, 1024		%2 = icmp eq i64 %index.next, 1024
br i1 %2, label %for.cond.cleanup, label %vector.body		br i1 %2, label %for.cond.cleanup, label %vector.body

for.cond.cleanup: ; preds = %vector.body		for.cond.cleanup: ; preds = %vector.body
ret void		ret void
}		}

define void @sink_splat_sub_lmul8(ptr nocapture %a, i32 signext %x) {		define void @sink_splat_sub_lmul8(ptr nocapture %a, i32 signext %x) {
; CHECK-LABEL: sink_splat_sub_lmul8:		; CHECK-LABEL: sink_splat_sub_lmul8:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a2, 1024		; CHECK-NEXT: lui a2, 1
		; CHECK-NEXT: add a2, a0, a2
; CHECK-NEXT: li a3, 32		; CHECK-NEXT: li a3, 32
; CHECK-NEXT: .LBB76_1: # %vector.body		; CHECK-NEXT: .LBB76_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vsetvli zero, a3, e32, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a3, e32, m8, ta, ma
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsub.vx v8, v8, a1		; CHECK-NEXT: vsub.vx v8, v8, a1
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a2, a2, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a2, .LBB76_1		; CHECK-NEXT: bne a0, a2, .LBB76_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%broadcast.splatinsert = insertelement <32 x i32> poison, i32 %x, i32 0		%broadcast.splatinsert = insertelement <32 x i32> poison, i32 %x, i32 0
%broadcast.splat = shufflevector <32 x i32> %broadcast.splatinsert, <32 x i32> poison, <32 x i32> zeroinitializer		%broadcast.splat = shufflevector <32 x i32> %broadcast.splatinsert, <32 x i32> poison, <32 x i32> zeroinitializer
br label %vector.body		br label %vector.body

vector.body: ; preds = %vector.body, %entry		vector.body: ; preds = %vector.body, %entry
%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]		%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]
%0 = getelementptr inbounds i32, ptr %a, i64 %index		%0 = getelementptr inbounds i32, ptr %a, i64 %index
%wide.load = load <32 x i32>, ptr %0, align 4		%wide.load = load <32 x i32>, ptr %0, align 4
%1 = sub <32 x i32> %wide.load, %broadcast.splat		%1 = sub <32 x i32> %wide.load, %broadcast.splat
store <32 x i32> %1, ptr %0, align 4		store <32 x i32> %1, ptr %0, align 4
%index.next = add nuw i64 %index, 4		%index.next = add nuw i64 %index, 4
%2 = icmp eq i64 %index.next, 1024		%2 = icmp eq i64 %index.next, 1024
br i1 %2, label %for.cond.cleanup, label %vector.body		br i1 %2, label %for.cond.cleanup, label %vector.body

for.cond.cleanup: ; preds = %vector.body		for.cond.cleanup: ; preds = %vector.body
ret void		ret void
}		}

define void @sink_splat_rsub_lmul8(ptr nocapture %a, i32 signext %x) {		define void @sink_splat_rsub_lmul8(ptr nocapture %a, i32 signext %x) {
; CHECK-LABEL: sink_splat_rsub_lmul8:		; CHECK-LABEL: sink_splat_rsub_lmul8:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a2, 1024		; CHECK-NEXT: lui a2, 1
		; CHECK-NEXT: add a2, a0, a2
; CHECK-NEXT: li a3, 32		; CHECK-NEXT: li a3, 32
; CHECK-NEXT: .LBB77_1: # %vector.body		; CHECK-NEXT: .LBB77_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vsetvli zero, a3, e32, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a3, e32, m8, ta, ma
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vrsub.vx v8, v8, a1		; CHECK-NEXT: vrsub.vx v8, v8, a1
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a2, a2, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a2, .LBB77_1		; CHECK-NEXT: bne a0, a2, .LBB77_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%broadcast.splatinsert = insertelement <32 x i32> poison, i32 %x, i32 0		%broadcast.splatinsert = insertelement <32 x i32> poison, i32 %x, i32 0
%broadcast.splat = shufflevector <32 x i32> %broadcast.splatinsert, <32 x i32> poison, <32 x i32> zeroinitializer		%broadcast.splat = shufflevector <32 x i32> %broadcast.splatinsert, <32 x i32> poison, <32 x i32> zeroinitializer
br label %vector.body		br label %vector.body

vector.body: ; preds = %vector.body, %entry		vector.body: ; preds = %vector.body, %entry
%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]		%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]
%0 = getelementptr inbounds i32, ptr %a, i64 %index		%0 = getelementptr inbounds i32, ptr %a, i64 %index
%wide.load = load <32 x i32>, ptr %0, align 4		%wide.load = load <32 x i32>, ptr %0, align 4
%1 = sub <32 x i32> %broadcast.splat, %wide.load		%1 = sub <32 x i32> %broadcast.splat, %wide.load
store <32 x i32> %1, ptr %0, align 4		store <32 x i32> %1, ptr %0, align 4
%index.next = add nuw i64 %index, 4		%index.next = add nuw i64 %index, 4
%2 = icmp eq i64 %index.next, 1024		%2 = icmp eq i64 %index.next, 1024
br i1 %2, label %for.cond.cleanup, label %vector.body		br i1 %2, label %for.cond.cleanup, label %vector.body

for.cond.cleanup: ; preds = %vector.body		for.cond.cleanup: ; preds = %vector.body
ret void		ret void
}		}

define void @sink_splat_and_lmul8(ptr nocapture %a, i32 signext %x) {		define void @sink_splat_and_lmul8(ptr nocapture %a, i32 signext %x) {
; CHECK-LABEL: sink_splat_and_lmul8:		; CHECK-LABEL: sink_splat_and_lmul8:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a2, 1024		; CHECK-NEXT: lui a2, 1
		; CHECK-NEXT: add a2, a0, a2
; CHECK-NEXT: li a3, 32		; CHECK-NEXT: li a3, 32
; CHECK-NEXT: .LBB78_1: # %vector.body		; CHECK-NEXT: .LBB78_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vsetvli zero, a3, e32, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a3, e32, m8, ta, ma
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vand.vx v8, v8, a1		; CHECK-NEXT: vand.vx v8, v8, a1
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a2, a2, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a2, .LBB78_1		; CHECK-NEXT: bne a0, a2, .LBB78_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%broadcast.splatinsert = insertelement <32 x i32> poison, i32 %x, i32 0		%broadcast.splatinsert = insertelement <32 x i32> poison, i32 %x, i32 0
%broadcast.splat = shufflevector <32 x i32> %broadcast.splatinsert, <32 x i32> poison, <32 x i32> zeroinitializer		%broadcast.splat = shufflevector <32 x i32> %broadcast.splatinsert, <32 x i32> poison, <32 x i32> zeroinitializer
br label %vector.body		br label %vector.body

vector.body: ; preds = %vector.body, %entry		vector.body: ; preds = %vector.body, %entry
%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]		%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]
%0 = getelementptr inbounds i32, ptr %a, i64 %index		%0 = getelementptr inbounds i32, ptr %a, i64 %index
%wide.load = load <32 x i32>, ptr %0, align 4		%wide.load = load <32 x i32>, ptr %0, align 4
%1 = and <32 x i32> %wide.load, %broadcast.splat		%1 = and <32 x i32> %wide.load, %broadcast.splat
store <32 x i32> %1, ptr %0, align 4		store <32 x i32> %1, ptr %0, align 4
%index.next = add nuw i64 %index, 4		%index.next = add nuw i64 %index, 4
%2 = icmp eq i64 %index.next, 1024		%2 = icmp eq i64 %index.next, 1024
br i1 %2, label %for.cond.cleanup, label %vector.body		br i1 %2, label %for.cond.cleanup, label %vector.body

for.cond.cleanup: ; preds = %vector.body		for.cond.cleanup: ; preds = %vector.body
ret void		ret void
}		}

define void @sink_splat_or_lmul8(ptr nocapture %a, i32 signext %x) {		define void @sink_splat_or_lmul8(ptr nocapture %a, i32 signext %x) {
; CHECK-LABEL: sink_splat_or_lmul8:		; CHECK-LABEL: sink_splat_or_lmul8:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a2, 1024		; CHECK-NEXT: lui a2, 1
		; CHECK-NEXT: add a2, a0, a2
; CHECK-NEXT: li a3, 32		; CHECK-NEXT: li a3, 32
; CHECK-NEXT: .LBB79_1: # %vector.body		; CHECK-NEXT: .LBB79_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vsetvli zero, a3, e32, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a3, e32, m8, ta, ma
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vor.vx v8, v8, a1		; CHECK-NEXT: vor.vx v8, v8, a1
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a2, a2, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a2, .LBB79_1		; CHECK-NEXT: bne a0, a2, .LBB79_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%broadcast.splatinsert = insertelement <32 x i32> poison, i32 %x, i32 0		%broadcast.splatinsert = insertelement <32 x i32> poison, i32 %x, i32 0
%broadcast.splat = shufflevector <32 x i32> %broadcast.splatinsert, <32 x i32> poison, <32 x i32> zeroinitializer		%broadcast.splat = shufflevector <32 x i32> %broadcast.splatinsert, <32 x i32> poison, <32 x i32> zeroinitializer
br label %vector.body		br label %vector.body

vector.body: ; preds = %vector.body, %entry		vector.body: ; preds = %vector.body, %entry
%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]		%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]
%0 = getelementptr inbounds i32, ptr %a, i64 %index		%0 = getelementptr inbounds i32, ptr %a, i64 %index
%wide.load = load <32 x i32>, ptr %0, align 4		%wide.load = load <32 x i32>, ptr %0, align 4
%1 = or <32 x i32> %wide.load, %broadcast.splat		%1 = or <32 x i32> %wide.load, %broadcast.splat
store <32 x i32> %1, ptr %0, align 4		store <32 x i32> %1, ptr %0, align 4
%index.next = add nuw i64 %index, 4		%index.next = add nuw i64 %index, 4
%2 = icmp eq i64 %index.next, 1024		%2 = icmp eq i64 %index.next, 1024
br i1 %2, label %for.cond.cleanup, label %vector.body		br i1 %2, label %for.cond.cleanup, label %vector.body

for.cond.cleanup: ; preds = %vector.body		for.cond.cleanup: ; preds = %vector.body
ret void		ret void
}		}

define void @sink_splat_xor_lmul8(ptr nocapture %a, i32 signext %x) {		define void @sink_splat_xor_lmul8(ptr nocapture %a, i32 signext %x) {
; CHECK-LABEL: sink_splat_xor_lmul8:		; CHECK-LABEL: sink_splat_xor_lmul8:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a2, 1024		; CHECK-NEXT: lui a2, 1
		; CHECK-NEXT: add a2, a0, a2
; CHECK-NEXT: li a3, 32		; CHECK-NEXT: li a3, 32
; CHECK-NEXT: .LBB80_1: # %vector.body		; CHECK-NEXT: .LBB80_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vsetvli zero, a3, e32, m8, ta, ma		; CHECK-NEXT: vsetvli zero, a3, e32, m8, ta, ma
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vxor.vx v8, v8, a1		; CHECK-NEXT: vxor.vx v8, v8, a1
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a2, a2, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a2, .LBB80_1		; CHECK-NEXT: bne a0, a2, .LBB80_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%broadcast.splatinsert = insertelement <32 x i32> poison, i32 %x, i32 0		%broadcast.splatinsert = insertelement <32 x i32> poison, i32 %x, i32 0
%broadcast.splat = shufflevector <32 x i32> %broadcast.splatinsert, <32 x i32> poison, <32 x i32> zeroinitializer		%broadcast.splat = shufflevector <32 x i32> %broadcast.splatinsert, <32 x i32> poison, <32 x i32> zeroinitializer
br label %vector.body		br label %vector.body

vector.body: ; preds = %vector.body, %entry		vector.body: ; preds = %vector.body, %entry
%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]		%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]
%0 = getelementptr inbounds i32, ptr %a, i64 %index		%0 = getelementptr inbounds i32, ptr %a, i64 %index
%wide.load = load <32 x i32>, ptr %0, align 4		%wide.load = load <32 x i32>, ptr %0, align 4
%1 = xor <32 x i32> %wide.load, %broadcast.splat		%1 = xor <32 x i32> %wide.load, %broadcast.splat
store <32 x i32> %1, ptr %0, align 4		store <32 x i32> %1, ptr %0, align 4
%index.next = add nuw i64 %index, 4		%index.next = add nuw i64 %index, 4
%2 = icmp eq i64 %index.next, 1024		%2 = icmp eq i64 %index.next, 1024
br i1 %2, label %for.cond.cleanup, label %vector.body		br i1 %2, label %for.cond.cleanup, label %vector.body

for.cond.cleanup: ; preds = %vector.body		for.cond.cleanup: ; preds = %vector.body
ret void		ret void
}		}

define void @sink_splat_mul_lmulmf2(ptr nocapture %a, i32 signext %x) {		define void @sink_splat_mul_lmulmf2(ptr nocapture %a, i32 signext %x) {
; CHECK-LABEL: sink_splat_mul_lmulmf2:		; CHECK-LABEL: sink_splat_mul_lmulmf2:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a2, 1024		; CHECK-NEXT: lui a2, 2
		; CHECK-NEXT: add a2, a0, a2
; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, ma		; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, ma
; CHECK-NEXT: .LBB81_1: # %vector.body		; CHECK-NEXT: .LBB81_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vmul.vx v8, v8, a1		; CHECK-NEXT: vmul.vx v8, v8, a1
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a2, a2, -4
; CHECK-NEXT: addi a0, a0, 32		; CHECK-NEXT: addi a0, a0, 32
; CHECK-NEXT: bnez a2, .LBB81_1		; CHECK-NEXT: bne a0, a2, .LBB81_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%broadcast.splatinsert = insertelement <2 x i32> poison, i32 %x, i64 0		%broadcast.splatinsert = insertelement <2 x i32> poison, i32 %x, i64 0
%broadcast.splat = shufflevector <2 x i32> %broadcast.splatinsert, <2 x i32> poison, <2 x i32> zeroinitializer		%broadcast.splat = shufflevector <2 x i32> %broadcast.splatinsert, <2 x i32> poison, <2 x i32> zeroinitializer
br label %vector.body		br label %vector.body

vector.body: ; preds = %vector.body, %entry		vector.body: ; preds = %vector.body, %entry
%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]		%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]
%0 = getelementptr inbounds i64, ptr %a, i64 %index		%0 = getelementptr inbounds i64, ptr %a, i64 %index
%wide.load = load <2 x i32>, ptr %0, align 8		%wide.load = load <2 x i32>, ptr %0, align 8
%1 = mul <2 x i32> %wide.load, %broadcast.splat		%1 = mul <2 x i32> %wide.load, %broadcast.splat
store <2 x i32> %1, ptr %0, align 8		store <2 x i32> %1, ptr %0, align 8
%index.next = add nuw i64 %index, 4		%index.next = add nuw i64 %index, 4
%2 = icmp eq i64 %index.next, 1024		%2 = icmp eq i64 %index.next, 1024
br i1 %2, label %for.cond.cleanup, label %vector.body		br i1 %2, label %for.cond.cleanup, label %vector.body

for.cond.cleanup: ; preds = %vector.body		for.cond.cleanup: ; preds = %vector.body
ret void		ret void
}		}

define void @sink_splat_add_lmulmf2(ptr nocapture %a, i32 signext %x) {		define void @sink_splat_add_lmulmf2(ptr nocapture %a, i32 signext %x) {
; CHECK-LABEL: sink_splat_add_lmulmf2:		; CHECK-LABEL: sink_splat_add_lmulmf2:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a2, 1024		; CHECK-NEXT: lui a2, 2
		; CHECK-NEXT: add a2, a0, a2
; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, ma		; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, ma
; CHECK-NEXT: .LBB82_1: # %vector.body		; CHECK-NEXT: .LBB82_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vadd.vx v8, v8, a1		; CHECK-NEXT: vadd.vx v8, v8, a1
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a2, a2, -4
; CHECK-NEXT: addi a0, a0, 32		; CHECK-NEXT: addi a0, a0, 32
; CHECK-NEXT: bnez a2, .LBB82_1		; CHECK-NEXT: bne a0, a2, .LBB82_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%broadcast.splatinsert = insertelement <2 x i32> poison, i32 %x, i64 0		%broadcast.splatinsert = insertelement <2 x i32> poison, i32 %x, i64 0
%broadcast.splat = shufflevector <2 x i32> %broadcast.splatinsert, <2 x i32> poison, <2 x i32> zeroinitializer		%broadcast.splat = shufflevector <2 x i32> %broadcast.splatinsert, <2 x i32> poison, <2 x i32> zeroinitializer
br label %vector.body		br label %vector.body

vector.body: ; preds = %vector.body, %entry		vector.body: ; preds = %vector.body, %entry
%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]		%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]
%0 = getelementptr inbounds i64, ptr %a, i64 %index		%0 = getelementptr inbounds i64, ptr %a, i64 %index
%wide.load = load <2 x i32>, ptr %0, align 8		%wide.load = load <2 x i32>, ptr %0, align 8
%1 = add <2 x i32> %wide.load, %broadcast.splat		%1 = add <2 x i32> %wide.load, %broadcast.splat
store <2 x i32> %1, ptr %0, align 8		store <2 x i32> %1, ptr %0, align 8
%index.next = add nuw i64 %index, 4		%index.next = add nuw i64 %index, 4
%2 = icmp eq i64 %index.next, 1024		%2 = icmp eq i64 %index.next, 1024
br i1 %2, label %for.cond.cleanup, label %vector.body		br i1 %2, label %for.cond.cleanup, label %vector.body

for.cond.cleanup: ; preds = %vector.body		for.cond.cleanup: ; preds = %vector.body
ret void		ret void
}		}

define void @sink_splat_sub_lmulmf2(ptr nocapture %a, i32 signext %x) {		define void @sink_splat_sub_lmulmf2(ptr nocapture %a, i32 signext %x) {
; CHECK-LABEL: sink_splat_sub_lmulmf2:		; CHECK-LABEL: sink_splat_sub_lmulmf2:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a2, 1024		; CHECK-NEXT: lui a2, 2
		; CHECK-NEXT: add a2, a0, a2
; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, ma		; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, ma
; CHECK-NEXT: .LBB83_1: # %vector.body		; CHECK-NEXT: .LBB83_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsub.vx v8, v8, a1		; CHECK-NEXT: vsub.vx v8, v8, a1
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a2, a2, -4
; CHECK-NEXT: addi a0, a0, 32		; CHECK-NEXT: addi a0, a0, 32
; CHECK-NEXT: bnez a2, .LBB83_1		; CHECK-NEXT: bne a0, a2, .LBB83_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%broadcast.splatinsert = insertelement <2 x i32> poison, i32 %x, i64 0		%broadcast.splatinsert = insertelement <2 x i32> poison, i32 %x, i64 0
%broadcast.splat = shufflevector <2 x i32> %broadcast.splatinsert, <2 x i32> poison, <2 x i32> zeroinitializer		%broadcast.splat = shufflevector <2 x i32> %broadcast.splatinsert, <2 x i32> poison, <2 x i32> zeroinitializer
br label %vector.body		br label %vector.body

vector.body: ; preds = %vector.body, %entry		vector.body: ; preds = %vector.body, %entry
%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]		%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]
%0 = getelementptr inbounds i64, ptr %a, i64 %index		%0 = getelementptr inbounds i64, ptr %a, i64 %index
%wide.load = load <2 x i32>, ptr %0, align 8		%wide.load = load <2 x i32>, ptr %0, align 8
%1 = sub <2 x i32> %wide.load, %broadcast.splat		%1 = sub <2 x i32> %wide.load, %broadcast.splat
store <2 x i32> %1, ptr %0, align 8		store <2 x i32> %1, ptr %0, align 8
%index.next = add nuw i64 %index, 4		%index.next = add nuw i64 %index, 4
%2 = icmp eq i64 %index.next, 1024		%2 = icmp eq i64 %index.next, 1024
br i1 %2, label %for.cond.cleanup, label %vector.body		br i1 %2, label %for.cond.cleanup, label %vector.body

for.cond.cleanup: ; preds = %vector.body		for.cond.cleanup: ; preds = %vector.body
ret void		ret void
}		}

define void @sink_splat_rsub_lmulmf2(ptr nocapture %a, i32 signext %x) {		define void @sink_splat_rsub_lmulmf2(ptr nocapture %a, i32 signext %x) {
; CHECK-LABEL: sink_splat_rsub_lmulmf2:		; CHECK-LABEL: sink_splat_rsub_lmulmf2:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a2, 1024		; CHECK-NEXT: lui a2, 2
		; CHECK-NEXT: add a2, a0, a2
; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, ma		; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, ma
; CHECK-NEXT: .LBB84_1: # %vector.body		; CHECK-NEXT: .LBB84_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vrsub.vx v8, v8, a1		; CHECK-NEXT: vrsub.vx v8, v8, a1
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a2, a2, -4
; CHECK-NEXT: addi a0, a0, 32		; CHECK-NEXT: addi a0, a0, 32
; CHECK-NEXT: bnez a2, .LBB84_1		; CHECK-NEXT: bne a0, a2, .LBB84_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%broadcast.splatinsert = insertelement <2 x i32> poison, i32 %x, i64 0		%broadcast.splatinsert = insertelement <2 x i32> poison, i32 %x, i64 0
%broadcast.splat = shufflevector <2 x i32> %broadcast.splatinsert, <2 x i32> poison, <2 x i32> zeroinitializer		%broadcast.splat = shufflevector <2 x i32> %broadcast.splatinsert, <2 x i32> poison, <2 x i32> zeroinitializer
br label %vector.body		br label %vector.body

vector.body: ; preds = %vector.body, %entry		vector.body: ; preds = %vector.body, %entry
%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]		%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]
%0 = getelementptr inbounds i64, ptr %a, i64 %index		%0 = getelementptr inbounds i64, ptr %a, i64 %index
%wide.load = load <2 x i32>, ptr %0, align 8		%wide.load = load <2 x i32>, ptr %0, align 8
%1 = sub <2 x i32> %broadcast.splat, %wide.load		%1 = sub <2 x i32> %broadcast.splat, %wide.load
store <2 x i32> %1, ptr %0, align 8		store <2 x i32> %1, ptr %0, align 8
%index.next = add nuw i64 %index, 4		%index.next = add nuw i64 %index, 4
%2 = icmp eq i64 %index.next, 1024		%2 = icmp eq i64 %index.next, 1024
br i1 %2, label %for.cond.cleanup, label %vector.body		br i1 %2, label %for.cond.cleanup, label %vector.body

for.cond.cleanup: ; preds = %vector.body		for.cond.cleanup: ; preds = %vector.body
ret void		ret void
}		}

define void @sink_splat_and_lmulmf2(ptr nocapture %a, i32 signext %x) {		define void @sink_splat_and_lmulmf2(ptr nocapture %a, i32 signext %x) {
; CHECK-LABEL: sink_splat_and_lmulmf2:		; CHECK-LABEL: sink_splat_and_lmulmf2:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a2, 1024		; CHECK-NEXT: lui a2, 2
		; CHECK-NEXT: add a2, a0, a2
; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, ma		; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, ma
; CHECK-NEXT: .LBB85_1: # %vector.body		; CHECK-NEXT: .LBB85_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vand.vx v8, v8, a1		; CHECK-NEXT: vand.vx v8, v8, a1
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a2, a2, -4
; CHECK-NEXT: addi a0, a0, 32		; CHECK-NEXT: addi a0, a0, 32
; CHECK-NEXT: bnez a2, .LBB85_1		; CHECK-NEXT: bne a0, a2, .LBB85_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%broadcast.splatinsert = insertelement <2 x i32> poison, i32 %x, i64 0		%broadcast.splatinsert = insertelement <2 x i32> poison, i32 %x, i64 0
%broadcast.splat = shufflevector <2 x i32> %broadcast.splatinsert, <2 x i32> poison, <2 x i32> zeroinitializer		%broadcast.splat = shufflevector <2 x i32> %broadcast.splatinsert, <2 x i32> poison, <2 x i32> zeroinitializer
br label %vector.body		br label %vector.body

vector.body: ; preds = %vector.body, %entry		vector.body: ; preds = %vector.body, %entry
%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]		%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]
%0 = getelementptr inbounds i64, ptr %a, i64 %index		%0 = getelementptr inbounds i64, ptr %a, i64 %index
%wide.load = load <2 x i32>, ptr %0, align 8		%wide.load = load <2 x i32>, ptr %0, align 8
%1 = and <2 x i32> %wide.load, %broadcast.splat		%1 = and <2 x i32> %wide.load, %broadcast.splat
store <2 x i32> %1, ptr %0, align 8		store <2 x i32> %1, ptr %0, align 8
%index.next = add nuw i64 %index, 4		%index.next = add nuw i64 %index, 4
%2 = icmp eq i64 %index.next, 1024		%2 = icmp eq i64 %index.next, 1024
br i1 %2, label %for.cond.cleanup, label %vector.body		br i1 %2, label %for.cond.cleanup, label %vector.body

for.cond.cleanup: ; preds = %vector.body		for.cond.cleanup: ; preds = %vector.body
ret void		ret void
}		}

define void @sink_splat_or_lmulmf2(ptr nocapture %a, i32 signext %x) {		define void @sink_splat_or_lmulmf2(ptr nocapture %a, i32 signext %x) {
; CHECK-LABEL: sink_splat_or_lmulmf2:		; CHECK-LABEL: sink_splat_or_lmulmf2:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a2, 1024		; CHECK-NEXT: lui a2, 2
		; CHECK-NEXT: add a2, a0, a2
; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, ma		; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, ma
; CHECK-NEXT: .LBB86_1: # %vector.body		; CHECK-NEXT: .LBB86_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vor.vx v8, v8, a1		; CHECK-NEXT: vor.vx v8, v8, a1
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a2, a2, -4
; CHECK-NEXT: addi a0, a0, 32		; CHECK-NEXT: addi a0, a0, 32
; CHECK-NEXT: bnez a2, .LBB86_1		; CHECK-NEXT: bne a0, a2, .LBB86_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%broadcast.splatinsert = insertelement <2 x i32> poison, i32 %x, i64 0		%broadcast.splatinsert = insertelement <2 x i32> poison, i32 %x, i64 0
%broadcast.splat = shufflevector <2 x i32> %broadcast.splatinsert, <2 x i32> poison, <2 x i32> zeroinitializer		%broadcast.splat = shufflevector <2 x i32> %broadcast.splatinsert, <2 x i32> poison, <2 x i32> zeroinitializer
br label %vector.body		br label %vector.body

vector.body: ; preds = %vector.body, %entry		vector.body: ; preds = %vector.body, %entry
%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]		%index = phi i64 [ 0, %entry ], [ %index.next, %vector.body ]
%0 = getelementptr inbounds i64, ptr %a, i64 %index		%0 = getelementptr inbounds i64, ptr %a, i64 %index
%wide.load = load <2 x i32>, ptr %0, align 8		%wide.load = load <2 x i32>, ptr %0, align 8
%1 = or <2 x i32> %wide.load, %broadcast.splat		%1 = or <2 x i32> %wide.load, %broadcast.splat
store <2 x i32> %1, ptr %0, align 8		store <2 x i32> %1, ptr %0, align 8
%index.next = add nuw i64 %index, 4		%index.next = add nuw i64 %index, 4
%2 = icmp eq i64 %index.next, 1024		%2 = icmp eq i64 %index.next, 1024
br i1 %2, label %for.cond.cleanup, label %vector.body		br i1 %2, label %for.cond.cleanup, label %vector.body

for.cond.cleanup: ; preds = %vector.body		for.cond.cleanup: ; preds = %vector.body
ret void		ret void
}		}

define void @sink_splat_xor_lmulmf2(ptr nocapture %a, i32 signext %x) {		define void @sink_splat_xor_lmulmf2(ptr nocapture %a, i32 signext %x) {
; CHECK-LABEL: sink_splat_xor_lmulmf2:		; CHECK-LABEL: sink_splat_xor_lmulmf2:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a2, 1024		; CHECK-NEXT: lui a2, 2
		; CHECK-NEXT: add a2, a0, a2
; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, ma		; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, ma
; CHECK-NEXT: .LBB87_1: # %vector.body		; CHECK-NEXT: .LBB87_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vxor.vx v8, v8, a1		; CHECK-NEXT: vxor.vx v8, v8, a1
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a2, a2, -4
; CHECK-NEXT: addi a0, a0, 32		; CHECK-NEXT: addi a0, a0, 32
; CHECK-NEXT: bnez a2, .LBB87_1		; CHECK-NEXT: bne a0, a2, .LBB87_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%broadcast.splatinsert = insertelement <2 x i32> poison, i32 %x, i64 0		%broadcast.splatinsert = insertelement <2 x i32> poison, i32 %x, i64 0
%broadcast.splat = shufflevector <2 x i32> %broadcast.splatinsert, <2 x i32> poison, <2 x i32> zeroinitializer		%broadcast.splat = shufflevector <2 x i32> %broadcast.splatinsert, <2 x i32> poison, <2 x i32> zeroinitializer
br label %vector.body		br label %vector.body

vector.body: ; preds = %vector.body, %entry		vector.body: ; preds = %vector.body, %entry
Show All 11 Lines
}		}

declare <4 x i1> @llvm.vp.icmp.v4i32(<4 x i32>, <4 x i32>, metadata, <4 x i1>, i32)		declare <4 x i1> @llvm.vp.icmp.v4i32(<4 x i32>, <4 x i32>, metadata, <4 x i1>, i32)

define void @sink_splat_vp_icmp(ptr nocapture %x, i32 signext %y, <4 x i1> %m, i32 zeroext %vl) {		define void @sink_splat_vp_icmp(ptr nocapture %x, i32 signext %y, <4 x i1> %m, i32 zeroext %vl) {
; CHECK-LABEL: sink_splat_vp_icmp:		; CHECK-LABEL: sink_splat_vp_icmp:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: vmv1r.v v8, v0		; CHECK-NEXT: vmv1r.v v8, v0
; CHECK-NEXT: li a3, 1024		; CHECK-NEXT: lui a3, 1
		; CHECK-NEXT: add a3, a0, a3
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: vmv.v.i v9, 0		; CHECK-NEXT: vmv.v.i v9, 0
; CHECK-NEXT: .LBB88_1: # %vector.body		; CHECK-NEXT: .LBB88_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vle32.v v10, (a0)		; CHECK-NEXT: vle32.v v10, (a0)
; CHECK-NEXT: vsetvli zero, a2, e32, m1, ta, ma		; CHECK-NEXT: vsetvli zero, a2, e32, m1, ta, ma
; CHECK-NEXT: vmv1r.v v0, v8		; CHECK-NEXT: vmv1r.v v0, v8
; CHECK-NEXT: vmseq.vx v0, v10, a1, v0.t		; CHECK-NEXT: vmseq.vx v0, v10, a1, v0.t
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: vse32.v v9, (a0), v0.t		; CHECK-NEXT: vse32.v v9, (a0), v0.t
; CHECK-NEXT: addi a3, a3, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a3, .LBB88_1		; CHECK-NEXT: bne a0, a3, .LBB88_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%broadcast.splatinsert = insertelement <4 x i32> poison, i32 %y, i32 0		%broadcast.splatinsert = insertelement <4 x i32> poison, i32 %y, i32 0
%broadcast.splat = shufflevector <4 x i32> %broadcast.splatinsert, <4 x i32> poison, <4 x i32> zeroinitializer		%broadcast.splat = shufflevector <4 x i32> %broadcast.splatinsert, <4 x i32> poison, <4 x i32> zeroinitializer
br label %vector.body		br label %vector.body

vector.body: ; preds = %vector.body, %entry		vector.body: ; preds = %vector.body, %entry
Show All 11 Lines
}		}

declare <4 x i1> @llvm.vp.fcmp.v4f32(<4 x float>, <4 x float>, metadata, <4 x i1>, i32)		declare <4 x i1> @llvm.vp.fcmp.v4f32(<4 x float>, <4 x float>, metadata, <4 x i1>, i32)

define void @sink_splat_vp_fcmp(ptr nocapture %x, float %y, <4 x i1> %m, i32 zeroext %vl) {		define void @sink_splat_vp_fcmp(ptr nocapture %x, float %y, <4 x i1> %m, i32 zeroext %vl) {
; CHECK-LABEL: sink_splat_vp_fcmp:		; CHECK-LABEL: sink_splat_vp_fcmp:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: vmv1r.v v8, v0		; CHECK-NEXT: vmv1r.v v8, v0
; CHECK-NEXT: li a2, 1024		; CHECK-NEXT: lui a2, 1
		; CHECK-NEXT: add a2, a0, a2
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: vmv.v.i v9, 0		; CHECK-NEXT: vmv.v.i v9, 0
; CHECK-NEXT: .LBB89_1: # %vector.body		; CHECK-NEXT: .LBB89_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vle32.v v10, (a0)		; CHECK-NEXT: vle32.v v10, (a0)
; CHECK-NEXT: vsetvli zero, a1, e32, m1, ta, ma		; CHECK-NEXT: vsetvli zero, a1, e32, m1, ta, ma
; CHECK-NEXT: vmv1r.v v0, v8		; CHECK-NEXT: vmv1r.v v0, v8
; CHECK-NEXT: vmfeq.vf v0, v10, fa0, v0.t		; CHECK-NEXT: vmfeq.vf v0, v10, fa0, v0.t
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, ma
; CHECK-NEXT: vse32.v v9, (a0), v0.t		; CHECK-NEXT: vse32.v v9, (a0), v0.t
; CHECK-NEXT: addi a2, a2, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a2, .LBB89_1		; CHECK-NEXT: bne a0, a2, .LBB89_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%broadcast.splatinsert = insertelement <4 x float> poison, float %y, i32 0		%broadcast.splatinsert = insertelement <4 x float> poison, float %y, i32 0
%broadcast.splat = shufflevector <4 x float> %broadcast.splatinsert, <4 x float> poison, <4 x i32> zeroinitializer		%broadcast.splat = shufflevector <4 x float> %broadcast.splatinsert, <4 x float> poison, <4 x i32> zeroinitializer
br label %vector.body		br label %vector.body

vector.body: ; preds = %vector.body, %entry		vector.body: ; preds = %vector.body, %entry
Show All 12 Lines

llvm/test/CodeGen/RISCV/rvv/vsetvli-insert-crossbb.ll

Show First 20 Lines • Show All 945 Lines • ▼ Show 20 Lines	if.end:
ret <vscale x 2 x i32> %e		ret <vscale x 2 x i32> %e
}		}

; This case demonstrates a PRE case where the first instruction in the block		; This case demonstrates a PRE case where the first instruction in the block
; doesn't require a state transition.		; doesn't require a state transition.
define void @pre_over_vle(ptr %A) {		define void @pre_over_vle(ptr %A) {
; CHECK-LABEL: pre_over_vle:		; CHECK-LABEL: pre_over_vle:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a1, 100		; CHECK-NEXT: addi a1, a0, 800
; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, ma		; CHECK-NEXT: vsetivli zero, 2, e32, mf2, ta, ma
; CHECK-NEXT: .LBB22_1: # %vector.body		; CHECK-NEXT: .LBB22_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vle8.v v8, (a0)		; CHECK-NEXT: vle8.v v8, (a0)
; CHECK-NEXT: vsext.vf4 v9, v8		; CHECK-NEXT: vsext.vf4 v9, v8
; CHECK-NEXT: vse32.v v9, (a0)		; CHECK-NEXT: vse32.v v9, (a0)
; CHECK-NEXT: addi a1, a1, -1
; CHECK-NEXT: addi a0, a0, 8		; CHECK-NEXT: addi a0, a0, 8
; CHECK-NEXT: bnez a1, .LBB22_1		; CHECK-NEXT: bne a0, a1, .LBB22_1
; CHECK-NEXT: # %bb.2: # %exit		; CHECK-NEXT: # %bb.2: # %exit
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
br label %vector.body		br label %vector.body

vector.body:		vector.body:
%iv = phi i64 [ 0, %entry], [%iv.next, %vector.body]		%iv = phi i64 [ 0, %entry], [%iv.next, %vector.body]
%addr = getelementptr inbounds <2 x i32>, ptr %A, i64 %iv		%addr = getelementptr inbounds <2 x i32>, ptr %A, i64 %iv
Show All 21 Lines

llvm/test/Transforms/LoopStrengthReduce/RISCV/lsr-cost-compare.ll

	; NOTE: Assertions have been autogenerated by utils/update_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_test_checks.py
	; RUN: opt < %s -loop-reduce -S \| FileCheck %s			; RUN: opt < %s -loop-reduce -S \| FileCheck %s

	target datalayout = "e-m:e-p:64:64-i64:64-i128:128-n64-S128"			target datalayout = "e-m:e-p:64:64-i64:64-i128:128-n64-S128"
	target triple = "riscv64"			target triple = "riscv64"

	; a[] = 1.0			; a[] = 1.0
	define void @test1(ptr %a) {			define void @test1(ptr %a) {
	; CHECK-LABEL: @test1(			; CHECK-LABEL: @test1(
	; CHECK-NEXT: entry:			; CHECK-NEXT: entry:
				; CHECK-NEXT: [[SCEVGEP2:%.]] = getelementptr i8, ptr [[A:%.]], i64 128000
	; CHECK-NEXT: br label [[LOOP:%.*]]			; CHECK-NEXT: br label [[LOOP:%.*]]
	; CHECK: loop:			; CHECK: loop:
	; CHECK-NEXT: [[LSR_IV1:%.]] = phi ptr [ [[UGLYGEP:%.]], [[LOOP]] ], [ [[A:%.]], [[ENTRY:%.]] ]			; CHECK-NEXT: [[LSR_IV1:%.]] = phi ptr [ [[SCEVGEP:%.]], [[LOOP]] ], [ [[A]], [[ENTRY:%.*]] ]
	; CHECK-NEXT: [[LSR_IV:%.]] = phi i64 [ [[LSR_IV_NEXT:%.]], [[LOOP]] ], [ 32000, [[ENTRY]] ]
	; CHECK-NEXT: store float 1.000000e+00, ptr [[LSR_IV1]], align 4			; CHECK-NEXT: store float 1.000000e+00, ptr [[LSR_IV1]], align 4
	; CHECK-NEXT: [[LSR_IV_NEXT]] = add nsw i64 [[LSR_IV]], -1			; CHECK-NEXT: [[SCEVGEP]] = getelementptr i8, ptr [[LSR_IV1]], i64 4
	; CHECK-NEXT: [[UGLYGEP]] = getelementptr i8, ptr [[LSR_IV1]], i64 4			; CHECK-NEXT: [[LSR_FOLD_TERM_COND_REPLACED_TERM_COND:%.*]] = icmp eq ptr [[SCEVGEP]], [[SCEVGEP2]]
	; CHECK-NEXT: [[T21:%.*]] = icmp eq i64 [[LSR_IV_NEXT]], 0			; CHECK-NEXT: br i1 [[LSR_FOLD_TERM_COND_REPLACED_TERM_COND]], label [[EXIT:%.*]], label [[LOOP]]
	; CHECK-NEXT: br i1 [[T21]], label [[EXIT:%.*]], label [[LOOP]]
	; CHECK: exit:			; CHECK: exit:
	; CHECK-NEXT: ret void			; CHECK-NEXT: ret void
	;			;
	entry:			entry:
	br label %loop			br label %loop

	loop: ; preds = %loop, %entry			loop: ; preds = %loop, %entry
	%t15 = phi i64 [ 0, %entry ], [ %t20, %loop ]			%t15 = phi i64 [ 0, %entry ], [ %t20, %loop ]
	%t19 = getelementptr inbounds [32000 x float], ptr %a, i64 0, i64 %t15			%t19 = getelementptr inbounds [32000 x float], ptr %a, i64 0, i64 %t15
	store float 1.0, ptr %t19, align 4			store float 1.0, ptr %t19, align 4
	%t20 = add nuw nsw i64 %t15, 1			%t20 = add nuw nsw i64 %t15, 1
	%t21 = icmp eq i64 %t20, 32000			%t21 = icmp eq i64 %t20, 32000
	br i1 %t21, label %exit, label %loop			br i1 %t21, label %exit, label %loop

	exit: ; preds = %loop			exit: ; preds = %loop
	ret void			ret void
	}			}

	; Same as test1, but with a use of a added outside the loop			; Same as test1, but with a use of a added outside the loop
	define void @test2(ptr %a) {			define void @test2(ptr %a) {
	; CHECK-LABEL: @test2(			; CHECK-LABEL: @test2(
	; CHECK-NEXT: entry:			; CHECK-NEXT: entry:
				; CHECK-NEXT: [[SCEVGEP2:%.]] = getelementptr i8, ptr [[A:%.]], i64 128000
	; CHECK-NEXT: br label [[LOOP:%.*]]			; CHECK-NEXT: br label [[LOOP:%.*]]
	; CHECK: loop:			; CHECK: loop:
	; CHECK-NEXT: [[LSR_IV1:%.]] = phi ptr [ [[UGLYGEP:%.]], [[LOOP]] ], [ [[A:%.]], [[ENTRY:%.]] ]			; CHECK-NEXT: [[LSR_IV1:%.]] = phi ptr [ [[SCEVGEP:%.]], [[LOOP]] ], [ [[A]], [[ENTRY:%.*]] ]
	; CHECK-NEXT: [[LSR_IV:%.]] = phi i64 [ [[LSR_IV_NEXT:%.]], [[LOOP]] ], [ 32000, [[ENTRY]] ]
	; CHECK-NEXT: store float 1.000000e+00, ptr [[LSR_IV1]], align 4			; CHECK-NEXT: store float 1.000000e+00, ptr [[LSR_IV1]], align 4
	; CHECK-NEXT: [[LSR_IV_NEXT]] = add nsw i64 [[LSR_IV]], -1			; CHECK-NEXT: [[SCEVGEP]] = getelementptr i8, ptr [[LSR_IV1]], i64 4
	; CHECK-NEXT: [[UGLYGEP]] = getelementptr i8, ptr [[LSR_IV1]], i64 4			; CHECK-NEXT: [[LSR_FOLD_TERM_COND_REPLACED_TERM_COND:%.*]] = icmp eq ptr [[SCEVGEP]], [[SCEVGEP2]]
	; CHECK-NEXT: [[T21:%.*]] = icmp eq i64 [[LSR_IV_NEXT]], 0			; CHECK-NEXT: br i1 [[LSR_FOLD_TERM_COND_REPLACED_TERM_COND]], label [[EXIT:%.*]], label [[LOOP]]
	; CHECK-NEXT: br i1 [[T21]], label [[EXIT:%.*]], label [[LOOP]]
	; CHECK: exit:			; CHECK: exit:
	; CHECK-NEXT: call void @use(ptr [[A]])			; CHECK-NEXT: call void @use(ptr [[A]])
	; CHECK-NEXT: ret void			; CHECK-NEXT: ret void
	;			;
	entry:			entry:
	br label %loop			br label %loop

	loop: ; preds = %loop, %entry			loop: ; preds = %loop, %entry
	%t15 = phi i64 [ 0, %entry ], [ %t20, %loop ]			%t15 = phi i64 [ 0, %entry ], [ %t20, %loop ]
	%t19 = getelementptr inbounds [32000 x float], ptr %a, i64 0, i64 %t15			%t19 = getelementptr inbounds [32000 x float], ptr %a, i64 0, i64 %t15
	store float 1.0, ptr %t19, align 4			store float 1.0, ptr %t19, align 4
	%t20 = add nuw nsw i64 %t15, 1			%t20 = add nuw nsw i64 %t15, 1
	%t21 = icmp eq i64 %t20, 32000			%t21 = icmp eq i64 %t20, 32000
	br i1 %t21, label %exit, label %loop			br i1 %t21, label %exit, label %loop

	exit: ; preds = %loop			exit: ; preds = %loop
	call void @use(ptr %a)			call void @use(ptr %a)
	ret void			ret void
	}			}

	; b[] = a[] + 1.0			; b[] = a[] + 1.0
	define void @test3(ptr %a, ptr %b) {			define void @test3(ptr %a, ptr %b) {
	; CHECK-LABEL: @test3(			; CHECK-LABEL: @test3(
	; CHECK-NEXT: entry:			; CHECK-NEXT: entry:
				; CHECK-NEXT: [[SCEVGEP4:%.]] = getelementptr i8, ptr [[B:%.]], i64 128000
	; CHECK-NEXT: br label [[LOOP:%.*]]			; CHECK-NEXT: br label [[LOOP:%.*]]
	; CHECK: loop:			; CHECK: loop:
	; CHECK-NEXT: [[LSR_IV2:%.]] = phi ptr [ [[UGLYGEP3:%.]], [[LOOP]] ], [ [[A:%.]], [[ENTRY:%.]] ]			; CHECK-NEXT: [[LSR_IV2:%.]] = phi ptr [ [[SCEVGEP3:%.]], [[LOOP]] ], [ [[A:%.]], [[ENTRY:%.]] ]
	; CHECK-NEXT: [[LSR_IV1:%.]] = phi ptr [ [[UGLYGEP:%.]], [[LOOP]] ], [ [[B:%.*]], [[ENTRY]] ]			; CHECK-NEXT: [[LSR_IV1:%.]] = phi ptr [ [[SCEVGEP:%.]], [[LOOP]] ], [ [[B]], [[ENTRY]] ]
	; CHECK-NEXT: [[LSR_IV:%.]] = phi i64 [ [[LSR_IV_NEXT:%.]], [[LOOP]] ], [ 32000, [[ENTRY]] ]
	; CHECK-NEXT: [[T17:%.*]] = load float, ptr [[LSR_IV2]], align 4			; CHECK-NEXT: [[T17:%.*]] = load float, ptr [[LSR_IV2]], align 4
	; CHECK-NEXT: [[T18:%.*]] = fadd float [[T17]], 1.000000e+00			; CHECK-NEXT: [[T18:%.*]] = fadd float [[T17]], 1.000000e+00
	; CHECK-NEXT: store float [[T18]], ptr [[LSR_IV1]], align 4			; CHECK-NEXT: store float [[T18]], ptr [[LSR_IV1]], align 4
	; CHECK-NEXT: [[LSR_IV_NEXT]] = add nsw i64 [[LSR_IV]], -1			; CHECK-NEXT: [[SCEVGEP]] = getelementptr i8, ptr [[LSR_IV1]], i64 4
	; CHECK-NEXT: [[UGLYGEP]] = getelementptr i8, ptr [[LSR_IV1]], i64 4			; CHECK-NEXT: [[SCEVGEP3]] = getelementptr i8, ptr [[LSR_IV2]], i64 4
	; CHECK-NEXT: [[UGLYGEP3]] = getelementptr i8, ptr [[LSR_IV2]], i64 4			; CHECK-NEXT: [[LSR_FOLD_TERM_COND_REPLACED_TERM_COND:%.*]] = icmp eq ptr [[SCEVGEP]], [[SCEVGEP4]]
	; CHECK-NEXT: [[T21:%.*]] = icmp eq i64 [[LSR_IV_NEXT]], 0			; CHECK-NEXT: br i1 [[LSR_FOLD_TERM_COND_REPLACED_TERM_COND]], label [[EXIT:%.*]], label [[LOOP]]
	; CHECK-NEXT: br i1 [[T21]], label [[EXIT:%.*]], label [[LOOP]]
	; CHECK: exit:			; CHECK: exit:
	; CHECK-NEXT: ret void			; CHECK-NEXT: ret void
	;			;
	entry:			entry:
	br label %loop			br label %loop

	loop: ; preds = %loop, %entry			loop: ; preds = %loop, %entry
	%t15 = phi i64 [ 0, %entry ], [ %t20, %loop ]			%t15 = phi i64 [ 0, %entry ], [ %t20, %loop ]
	Show All 9 Lines
	exit: ; preds = %loop			exit: ; preds = %loop
	ret void			ret void
	}			}

	; Same as test3, but with a use of both a and b outside the loop			; Same as test3, but with a use of both a and b outside the loop
	define void @test4(ptr %a, ptr %b) {			define void @test4(ptr %a, ptr %b) {
	; CHECK-LABEL: @test4(			; CHECK-LABEL: @test4(
	; CHECK-NEXT: entry:			; CHECK-NEXT: entry:
				; CHECK-NEXT: [[SCEVGEP4:%.]] = getelementptr i8, ptr [[B:%.]], i64 128000
	; CHECK-NEXT: br label [[LOOP:%.*]]			; CHECK-NEXT: br label [[LOOP:%.*]]
	; CHECK: loop:			; CHECK: loop:
	; CHECK-NEXT: [[LSR_IV2:%.]] = phi ptr [ [[UGLYGEP3:%.]], [[LOOP]] ], [ [[A:%.]], [[ENTRY:%.]] ]			; CHECK-NEXT: [[LSR_IV2:%.]] = phi ptr [ [[SCEVGEP3:%.]], [[LOOP]] ], [ [[A:%.]], [[ENTRY:%.]] ]
	; CHECK-NEXT: [[LSR_IV1:%.]] = phi ptr [ [[UGLYGEP:%.]], [[LOOP]] ], [ [[B:%.*]], [[ENTRY]] ]			; CHECK-NEXT: [[LSR_IV1:%.]] = phi ptr [ [[SCEVGEP:%.]], [[LOOP]] ], [ [[B]], [[ENTRY]] ]
	; CHECK-NEXT: [[LSR_IV:%.]] = phi i64 [ [[LSR_IV_NEXT:%.]], [[LOOP]] ], [ 32000, [[ENTRY]] ]
	; CHECK-NEXT: [[T17:%.*]] = load float, ptr [[LSR_IV2]], align 4			; CHECK-NEXT: [[T17:%.*]] = load float, ptr [[LSR_IV2]], align 4
	; CHECK-NEXT: [[T18:%.*]] = fadd float [[T17]], 1.000000e+00			; CHECK-NEXT: [[T18:%.*]] = fadd float [[T17]], 1.000000e+00
	; CHECK-NEXT: store float [[T18]], ptr [[LSR_IV1]], align 4			; CHECK-NEXT: store float [[T18]], ptr [[LSR_IV1]], align 4
	; CHECK-NEXT: [[LSR_IV_NEXT]] = add nsw i64 [[LSR_IV]], -1			; CHECK-NEXT: [[SCEVGEP]] = getelementptr i8, ptr [[LSR_IV1]], i64 4
	; CHECK-NEXT: [[UGLYGEP]] = getelementptr i8, ptr [[LSR_IV1]], i64 4			; CHECK-NEXT: [[SCEVGEP3]] = getelementptr i8, ptr [[LSR_IV2]], i64 4
	; CHECK-NEXT: [[UGLYGEP3]] = getelementptr i8, ptr [[LSR_IV2]], i64 4			; CHECK-NEXT: [[LSR_FOLD_TERM_COND_REPLACED_TERM_COND:%.*]] = icmp eq ptr [[SCEVGEP]], [[SCEVGEP4]]
	; CHECK-NEXT: [[T21:%.*]] = icmp eq i64 [[LSR_IV_NEXT]], 0			; CHECK-NEXT: br i1 [[LSR_FOLD_TERM_COND_REPLACED_TERM_COND]], label [[EXIT:%.*]], label [[LOOP]]
	; CHECK-NEXT: br i1 [[T21]], label [[EXIT:%.*]], label [[LOOP]]
	; CHECK: exit:			; CHECK: exit:
	; CHECK-NEXT: call void @use(ptr [[A]])			; CHECK-NEXT: call void @use(ptr [[A]])
	; CHECK-NEXT: call void @use(ptr [[B]])			; CHECK-NEXT: call void @use(ptr [[B]])
	; CHECK-NEXT: ret void			; CHECK-NEXT: ret void
	;			;
	entry:			entry:
	br label %loop			br label %loop

	Show All 19 Lines

This is an archive of the discontinued LLVM Phabricator instance.

[LSR][TTI][RISCV] Add isAllowTerminatingConditionFoldingAfterLSR into TTI and enable it for RISC-VAbandonedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 526313

llvm/include/llvm/Analysis/TargetTransformInfo.h

llvm/include/llvm/Analysis/TargetTransformInfoImpl.h

llvm/include/llvm/CodeGen/BasicTTIImpl.h

llvm/lib/Analysis/TargetTransformInfo.cpp

llvm/lib/Target/RISCV/RISCVTargetTransformInfo.h

llvm/lib/Target/RISCV/RISCVTargetTransformInfo.cpp

llvm/lib/Transforms/Scalar/LoopStrengthReduce.cpp

llvm/test/CodeGen/RISCV/branch-on-zero.ll

llvm/test/CodeGen/RISCV/riscv-codegenprepare-asm.ll

llvm/test/CodeGen/RISCV/rvv/fixed-vector-strided-load-store-asm.ll

llvm/test/CodeGen/RISCV/rvv/fixed-vectors-fp-buildvec.ll

llvm/test/CodeGen/RISCV/rvv/sink-splat-operands.ll

llvm/test/CodeGen/RISCV/rvv/vsetvli-insert-crossbb.ll

llvm/test/Transforms/LoopStrengthReduce/RISCV/lsr-cost-compare.ll

[LSR][TTI][RISCV] Add isAllowTerminatingConditionFoldingAfterLSR into TTI and enable it for RISC-V
AbandonedPublic