This is an archive of the discontinued LLVM Phabricator instance.

Paths

Table of Contentst

-
llvm/
-
lib/Target/RISCV/
-
Target/
-
RISCV/
3/20
RISCVInsertVSETVLI.cpp
-
test/CodeGen/RISCV/rvv/
-
CodeGen/
-
RISCV/
-
rvv/
1
fixed-vector-strided-load-store.ll
-
sink-splat-operands.ll

Differential D124869

[RISCV] Hoist VSETVLI out of idiomatic fixed length vector loops
ClosedPublic

Authored by reames on May 3 2022, 12:32 PM.

Download Raw Diff

Details

Reviewers

craig.topper
khchen
Chenbing.Zheng
jacquesguan
frasercrmck

Commits

rGa95ecb20bca8: [RISCV] Hoist VSETVLI out of idiomatic fixed length vector loops

Summary

This patch teaches the VSETVLI insertion pass to perform a very limited form of partial redundancy elimination. The motivating example comes from the fixed length vectorization of a simple loop such as:

for (unsigned i = 0; i < a_len; i++)
    a[i] += b;

Without this change, the core vector loop and preheader is as follows:

.LBB0_3:                                # %vector.ph
	andi	a1, a6, -8
	addi	a4, a0, 16
	mv	a5, a1
.LBB0_4:                                # %vector.body
                                        # =>This Inner Loop Header: Depth=1
	addi	a3, a4, -16
	vsetivli	zero, 4, e32, m1, ta, mu
	vle32.v	v8, (a3)
	vle32.v	v9, (a4)
	vadd.vx	v8, v8, a2
	vadd.vx	v9, v9, a2
	vse32.v	v8, (a3)
	vse32.v	v9, (a4)
	addi	a5, a5, -8
	addi	a4, a4, 32
	bnez	a5, .LBB0_4

The key thing to note here is that, I believe, the execution of the vsetivli only needs to happen once. Since there's no tail folding happening here, the value of the vector configuration registers are invariant through the loop.

After this patch, we hoist the configuration into the preheader and perform it once.

.LBB0_3:                                # %vector.ph
	andi	a1, a6, -8
	vsetivli	zero, 4, e32, m1, ta, mu
	addi	a4, a0, 16
	mv	a5, a1
.LBB0_4:                                # %vector.body
                                        # =>This Inner Loop Header: Depth=1
	addi	a3, a4, -16
	vle32.v	v8, (a3)
	vle32.v	v9, (a4)
	vadd.vx	v8, v8, a2
	vadd.vx	v9, v9, a2
	vse32.v	v8, (a3)
	vse32.v	v9, (a4)
	addi	a5, a5, -8
	addi	a4, a4, 32
	bnez	a5, .LBB0_4

Once this lands, I plan on extending it to non-immediate AVLs in a separate patch, but frankly, that's less important. For a scalable loop, we always have a setvli above, and in most cases, full redundancy (via the existing dataflow) kicks in. There's enough cases to be worth handling via FRE eventually, but fixed length vectors are definitely much higher impact.

Diff Detail

Repository: rG LLVM Github Monorepo

Event Timeline

reames created this revision.May 3 2022, 12:32 PM

Herald added a project: Restricted Project. · View Herald TranscriptMay 3 2022, 12:32 PM

Herald added subscribers: sunshaoce, VincentWu, luke957 and 31 others. · View Herald Transcript

reames requested review of this revision.May 3 2022, 12:32 PM

Herald added a project: Restricted Project. · View Herald TranscriptMay 3 2022, 12:32 PM

Herald added subscribers: • pcwang-thead, eopXD, MaskRay. · View Herald Transcript

Harbormaster completed remote builds in B162535: Diff 426801.May 3 2022, 2:17 PM

I like the idea. We should move vsetvli out when possible. It doesn't look like all the test changes are improvements.

llvm/lib/Target/RISCV/RISCVInsertVSETVLI.cpp
1297	confiuuered -> configured
1308	You can use the not well named ST.getRealMinVLen() here I think. It takes into account the Zvl*b provided value.
1313	begining -> beginning
1326	Use curly braches for this else body for consistency
1401	Would it make sense to use a BitVector using MBB numbering?
llvm/test/CodeGen/RISCV/rvv/vsetvli-insert.ll
113 ↗	(On Diff #426801)	This seems worse

reames mentioned this in rG18ed2ee80c54: [RISCV] Add a version of insertVSETVLI which uses an iterator [NFC].May 4 2022, 2:48 PM

frasercrmck added a reviewer: frasercrmck.May 5 2022, 3:54 AM

frasercrmck added inline comments.

llvm/lib/Target/RISCV/RISCVInsertVSETVLI.cpp
308	This is very helpful, thank you!
1313	it's -> its
1324	`return` on new line
llvm/test/CodeGen/RISCV/rvv/fixed-vector-strided-load-store.ll
510	This seems like a regression too
llvm/test/CodeGen/RISCV/rvv/vsetvli-insert-crossbb.ll
521 ↗	(On Diff #426801)	I'm curious, would this be showing a bug if it was instead `e16,mf2` followed by `vle16.v` in `bb.0` and `e32,m1` followed by `vle32.v` in `bb.1`? If we moved the vsetvli down past the `vle32.v` we'd be using the old vtype with a 2-byte alignment requirement, which the `vle32.v` isn't obliged to use.

JFYI: Staring more closely at the test diffs on this WIP led me right into wondering about the correctness of the data flow. This is probably on hold until we've addressed correctness of the underlying algorithm.

reames added a parent revision: D125271: [riscv] Enable strict assertions in InsertVSETVLI data flow.May 9 2022, 2:29 PM

Rebase, and generally cleanup. Now ready for actual review.

Herald added subscribers: alextsao1999, shiva0217. · View Herald TranscriptMay 24 2022, 9:59 AM

craig.topper added inline comments.May 24 2022, 10:43 AM

llvm/lib/Target/RISCV/RISCVInsertVSETVLI.cpp
105	Any reason to restrict this uint8_t? Looks like it's a assigned to unsigned where it's used.
1287	`Info` could be a const reference I think.
1302	VSETVL -> VSETVLI
1317	Can PredInfo be a reference? Though maybe it's small enough that copies are cheap?
1363	This is more than 80 columns

reames added inline comments.May 24 2022, 10:53 AM

llvm/lib/Target/RISCV/RISCVInsertVSETVLI.cpp
105	uint8_t matches the actual type of the field. I can change it if you want, but it seems cleaner to me to match the field type.

address review comments

craig.topper added inline comments.May 24 2022, 11:23 AM

llvm/lib/Target/RISCV/RISCVInsertVSETVLI.cpp
105	I was thinking of the uint8_t as an implementation choice I made to keep the data structure size down. It could have been a 7 bit bitfield or stored in log2 form. It would also need to change if SEW=256, 512, or 1024 came back to life. That was just my thinking. If you want to keep it as uint8_t it's fine with me.

craig.topper added inline comments.May 24 2022, 11:30 AM

llvm/lib/Target/RISCV/RISCVInsertVSETVLI.cpp
1293	What prevents supporting other LMULs?

reames added inline comments.May 24 2022, 1:03 PM

llvm/lib/Target/RISCV/RISCVInsertVSETVLI.cpp
105	I see your point, could go either way. I think either answer is reasonable here.
1293	Nothing, we just need to adjust the formula below for it. Mind if I do this in a separate change? I'm still not 100% trusting my mental model of L:MUL, and would prefer to have that reviewed on its own. I will add a TODO.

Harbormaster completed remote builds in B166090: Diff 431726.May 24 2022, 1:13 PM

craig.topper added inline comments.May 24 2022, 2:01 PM

llvm/lib/Target/RISCV/RISCVInsertVSETVLI.cpp
1293	Separate review is fine.

Anything left outstanding here? I think this could land now; it shouldn't need to wait for the strict assert change as the workaround should be perfectly compatible.

LGTM. Other than that last comment.

llvm/lib/Target/RISCV/RISCVInsertVSETVLI.cpp
1371	Can this use getFirstInstrTerminator()?

craig.topper accepted this revision.May 24 2022, 2:11 PM

This revision is now accepted and ready to land.May 24 2022, 2:11 PM

This revision was landed with ongoing or failed builds.May 24 2022, 2:56 PM

Closed by commit rGa95ecb20bca8: [RISCV] Hoist VSETVLI out of idiomatic fixed length vector loops (authored by reames). · Explain Why

This revision was automatically updated to reflect the committed changes.

reames added a commit: rGa95ecb20bca8: [RISCV] Hoist VSETVLI out of idiomatic fixed length vector loops.

reames mentioned this in D126338: [RISCV] Hoist VSETVLI out of some scalable loops.May 24 2022, 3:42 PM

reames mentioned this in rG2a3b6f2cba92: [RISCV] Hoist VSETVLI vlmax, vtype out of scalable loops.May 25 2022, 8:10 AM

reames mentioned this in D126563: [RISCV] Allow PRE of vsetvli involving non-1 LMUL.May 27 2022, 1:28 PM

reames mentioned this in rG85b4470035b7: [RISCV] Allow PRE of vsetvli involving non-1 LMUL.May 27 2022, 3:50 PM

Revision Contents

Path

Size

llvm/

lib/

Target/

RISCV/

RISCVInsertVSETVLI.cpp

101 lines

test/

CodeGen/

RISCV/

rvv/

fixed-vector-strided-load-store.ll

8 lines

sink-splat-operands.ll

82 lines

Diff 431806

llvm/lib/Target/RISCV/RISCVInsertVSETVLI.cpp

Show First 20 Lines • Show All 95 Lines • ▼ Show 20 Lines	public:
Register getAVLReg() const {		Register getAVLReg() const {
assert(hasAVLReg());		assert(hasAVLReg());
return AVLReg;		return AVLReg;
}		}
unsigned getAVLImm() const {		unsigned getAVLImm() const {
assert(hasAVLImm());		assert(hasAVLImm());
return AVLImm;		return AVLImm;
}		}

		unsigned getSEW() const { return SEW; }
		craig.topperUnsubmitted Not Done Reply Inline Actions Any reason to restrict this uint8_t? Looks like it's a assigned to unsigned where it's used. craig.topper: Any reason to restrict this uint8_t? Looks like it's a assigned to unsigned where it's used.
		reamesAuthorUnsubmitted Done Reply Inline Actions uint8_t matches the actual type of the field. I can change it if you want, but it seems cleaner to me to match the field type. reames: uint8_t matches the actual type of the field. I can change it if you want, but it seems…
		craig.topperUnsubmitted Not Done Reply Inline Actions I was thinking of the uint8_t as an implementation choice I made to keep the data structure size down. It could have been a 7 bit bitfield or stored in log2 form. It would also need to change if SEW=256, 512, or 1024 came back to life. That was just my thinking. If you want to keep it as uint8_t it's fine with me. craig.topper: I was thinking of the uint8_t as an implementation choice I made to keep the data structure…
		reamesAuthorUnsubmitted Done Reply Inline Actions I see your point, could go either way. I think either answer is reasonable here. reames: I see your point, could go either way. I think either answer is reasonable here.
		RISCVII::VLMUL getVLMUL() const { return VLMul; }

bool hasZeroAVL() const {		bool hasZeroAVL() const {
if (hasAVLImm())		if (hasAVLImm())
return getAVLImm() == 0;		return getAVLImm() == 0;
return false;		return false;
}		}
bool hasNonZeroAVL() const {		bool hasNonZeroAVL() const {
if (hasAVLImm())		if (hasAVLImm())
return getAVLImm() > 0;		return getAVLImm() > 0;
▲ Show 20 Lines • Show All 184 Lines • ▼ Show 20 Lines	bool isCompatibleWithLoadStoreEEW(unsigned EEW,
// Stores can ignore the tail and mask policies.		// Stores can ignore the tail and mask policies.
if (!Require.StoreOp && (TailAgnostic != Require.TailAgnostic \|\|		if (!Require.StoreOp && (TailAgnostic != Require.TailAgnostic \|\|
MaskAgnostic != Require.MaskAgnostic))		MaskAgnostic != Require.MaskAgnostic))
return false;		return false;

return getSEWLMULRatio() == getSEWLMULRatio(EEW, Require.VLMul);		return getSEWLMULRatio() == getSEWLMULRatio(EEW, Require.VLMul);
}		}

bool operator==(const VSETVLIInfo &Other) const {		bool operator==(const VSETVLIInfo &Other) const {
		frasercrmckUnsubmitted Not Done Reply Inline Actions This is very helpful, thank you! frasercrmck: This is very helpful, thank you!
// Uninitialized is only equal to another Uninitialized.		// Uninitialized is only equal to another Uninitialized.
if (!isValid())		if (!isValid())
return !Other.isValid();		return !Other.isValid();
if (!Other.isValid())		if (!Other.isValid())
return !isValid();		return !isValid();

// Unknown is only equal to another Unknown.		// Unknown is only equal to another Unknown.
if (isUnknown())		if (isUnknown())
▲ Show 20 Lines • Show All 140 Lines • ▼ Show 20 Lines	private:
void insertVSETVLI(MachineBasicBlock &MBB,		void insertVSETVLI(MachineBasicBlock &MBB,
MachineBasicBlock::iterator InsertPt, DebugLoc DL,		MachineBasicBlock::iterator InsertPt, DebugLoc DL,
const VSETVLIInfo &Info, const VSETVLIInfo &PrevInfo);		const VSETVLIInfo &Info, const VSETVLIInfo &PrevInfo);

bool computeVLVTYPEChanges(const MachineBasicBlock &MBB);		bool computeVLVTYPEChanges(const MachineBasicBlock &MBB);
void computeIncomingVLVTYPE(const MachineBasicBlock &MBB);		void computeIncomingVLVTYPE(const MachineBasicBlock &MBB);
void emitVSETVLIs(MachineBasicBlock &MBB);		void emitVSETVLIs(MachineBasicBlock &MBB);
void doLocalPrepass(MachineBasicBlock &MBB);		void doLocalPrepass(MachineBasicBlock &MBB);
		void doPRE(MachineBasicBlock &MBB);
};		};

} // end anonymous namespace		} // end anonymous namespace

char RISCVInsertVSETVLI::ID = 0;		char RISCVInsertVSETVLI::ID = 0;

INITIALIZE_PASS(RISCVInsertVSETVLI, DEBUG_TYPE, RISCV_INSERT_VSETVLI_NAME,		INITIALIZE_PASS(RISCVInsertVSETVLI, DEBUG_TYPE, RISCV_INSERT_VSETVLI_NAME,
false, false)		false, false)
▲ Show 20 Lines • Show All 804 Lines • ▼ Show 20 Lines	for (MachineInstr &MI : MBB) {
// If this is something that updates VL/VTYPE that we don't know about,		// If this is something that updates VL/VTYPE that we don't know about,
// set the state to unknown.		// set the state to unknown.
if (MI.isCall() \|\| MI.isInlineAsm() \|\| MI.modifiesRegister(RISCV::VL) \|\|		if (MI.isCall() \|\| MI.isInlineAsm() \|\| MI.modifiesRegister(RISCV::VL) \|\|
MI.modifiesRegister(RISCV::VTYPE))		MI.modifiesRegister(RISCV::VTYPE))
CurInfo = VSETVLIInfo::getUnknown();		CurInfo = VSETVLIInfo::getUnknown();
}		}
}		}

		/// Return true if the VL value configured must be equal to the requested one.
		static bool hasFixedResult(const VSETVLIInfo &Info, const RISCVSubtarget &ST) {
		craig.topperUnsubmitted Not Done Reply Inline Actions `Info` could be a const reference I think. craig.topper: `Info` could be a const reference I think.
		if (!Info.hasAVLImm())
		// TODO: Could allow VLMAX (e.g. X0), and possibly other registers
		// by looking at the associated vreg def placement.
		return false;

		if (RISCVII::LMUL_1 != Info.getVLMUL())
		craig.topperUnsubmitted Not Done Reply Inline Actions What prevents supporting other LMULs? craig.topper: What prevents supporting other LMULs?
		reamesAuthorUnsubmitted Done Reply Inline Actions Nothing, we just need to adjust the formula below for it. Mind if I do this in a separate change? I'm still not 100% trusting my mental model of L:MUL, and would prefer to have that reviewed on its own. I will add a TODO. reames: Nothing, we just need to adjust the formula below for it. Mind if I do this in a separate…
		craig.topperUnsubmitted Not Done Reply Inline Actions Separate review is fine. craig.topper: Separate review is fine.
		// TODO: Generalize the code below to account for LMUL
		return false;

		unsigned AVL = Info.getAVLImm();
		craig.topperUnsubmitted Not Done Reply Inline Actions confiuuered -> configured craig.topper: confiuuered -> configured
		unsigned SEW = Info.getSEW();
		unsigned AVLInBits = AVL * SEW;
		return ST.getRealMinVLen() >= AVLInBits;
		}

		craig.topperUnsubmitted Not Done Reply Inline Actions VSETVL -> VSETVLI craig.topper: VSETVL -> VSETVLI
		/// Perform simple partial redundancy elimination of the VSETVLI instructions
		/// we're about to insert by looking for cases where we can PRE from the
		/// beginning of one block to the end of one of its predecessors. Specifically,
		/// this is geared to catch the common case of a fixed length vsetvl in a single
		/// block loop when it could execute once in the preheader instead.
		void RISCVInsertVSETVLI::doPRE(MachineBasicBlock &MBB) {
		craig.topperUnsubmitted Not Done Reply Inline Actions You can use the not well named ST.getRealMinVLen() here I think. It takes into account the Zvlb provided value. craig.topper:* You can use the not well named ST.getRealMinVLen() here I think. It takes into account the…
		const MachineFunction &MF = *MBB.getParent();
		const RISCVSubtarget &ST = MF.getSubtarget<RISCVSubtarget>();

		if (!BlockInfo[MBB.getNumber()].Pred.isUnknown())
		return;
		craig.topperUnsubmitted Not Done Reply Inline Actions begining -> beginning craig.topper: begining -> beginning
		frasercrmckUnsubmitted Not Done Reply Inline Actions it's -> its frasercrmck: it's -> its

		MachineBasicBlock *UnavailablePred = nullptr;
		VSETVLIInfo AvailableInfo;
		for (MachineBasicBlock *P : MBB.predecessors()) {
		craig.topperUnsubmitted Not Done Reply Inline Actions Can PredInfo be a reference? Though maybe it's small enough that copies are cheap? craig.topper: Can PredInfo be a reference? Though maybe it's small enough that copies are cheap?
		const VSETVLIInfo &PredInfo = BlockInfo[P->getNumber()].Exit;
		if (PredInfo.isUnknown()) {
		if (UnavailablePred)
		return;
		UnavailablePred = P;
		} else if (!AvailableInfo.isValid()) {
		AvailableInfo = PredInfo;
		frasercrmckUnsubmitted Not Done Reply Inline Actions `return` on new line frasercrmck: `return` on new line
		} else if (AvailableInfo != PredInfo) {
		return;
		craig.topperUnsubmitted Not Done Reply Inline Actions Use curly braches for this else body for consistency craig.topper: Use curly braches for this else body for consistency
		}
		}

		// unreachable, single pred, or full redundancy. Note that FRE
		// is handled by phase 3.
		if (!UnavailablePred \|\| !AvailableInfo.isValid())
		return;

		// critical edge - TODO: consider splitting?
		if (UnavailablePred->succ_size() != 1)
		return;

		// If VL can be less than AVL, then we can't reduce the frequency of exec.
		if (!hasFixedResult(AvailableInfo, ST))
		return;

		// Does it actually let us remove an implicit transition in MBB?
		bool Found = false;
		for (auto &MI : MBB) {
		if (isVectorConfigInstr(MI))
		return;

		const uint64_t TSFlags = MI.getDesc().TSFlags;
		if (RISCVII::hasSEWOp(TSFlags)) {
		if (AvailableInfo != computeInfoForInstr(MI, TSFlags, MRI))
		return;
		Found = true;
		break;
		}
		}
		if (!Found)
		return;

		// Finally, update both data flow state and insert the actual vsetvli.
		// Doing both keeps the code in sync with the dataflow results, which
		// is critical for correctness of phase 3.
		auto OldInfo = BlockInfo[UnavailablePred->getNumber()].Exit;
		craig.topperUnsubmitted Not Done Reply Inline Actions This is more than 80 columns craig.topper: This is more than 80 columns
		LLVM_DEBUG(dbgs() << "PRE VSETVLI from " << MBB.getName() << " to "
		<< UnavailablePred->getName() << " with state "
		<< AvailableInfo << "\n");
		BlockInfo[UnavailablePred->getNumber()].Exit = AvailableInfo;
		BlockInfo[MBB.getNumber()].Pred = AvailableInfo;

		// Note there's an implicit assumption here that terminators never use
		// or modify VL or VTYPE. Also, fallthrough will return end().
		craig.topperUnsubmitted Not Done Reply Inline Actions Can this use getFirstInstrTerminator()? craig.topper: Can this use getFirstInstrTerminator()?
		auto InsertPt = UnavailablePred->getFirstInstrTerminator();
		insertVSETVLI(*UnavailablePred, InsertPt,
		UnavailablePred->findDebugLoc(InsertPt),
		AvailableInfo, OldInfo);
		}

bool RISCVInsertVSETVLI::runOnMachineFunction(MachineFunction &MF) {		bool RISCVInsertVSETVLI::runOnMachineFunction(MachineFunction &MF) {
// Skip if the vector extension is not enabled.		// Skip if the vector extension is not enabled.
const RISCVSubtarget &ST = MF.getSubtarget<RISCVSubtarget>();		const RISCVSubtarget &ST = MF.getSubtarget<RISCVSubtarget>();
if (!ST.hasVInstructions())		if (!ST.hasVInstructions())
return false;		return false;

LLVM_DEBUG(dbgs() << "Entering InsertVSETVLI for " << MF.getName() << "\n");		LLVM_DEBUG(dbgs() << "Entering InsertVSETVLI for " << MF.getName() << "\n");

TII = ST.getInstrInfo();		TII = ST.getInstrInfo();
MRI = &MF.getRegInfo();		MRI = &MF.getRegInfo();

assert(BlockInfo.empty() && "Expect empty block infos");		assert(BlockInfo.empty() && "Expect empty block infos");
BlockInfo.resize(MF.getNumBlockIDs());		BlockInfo.resize(MF.getNumBlockIDs());

// Scan the block locally for cases where we can mutate the operands		// Scan the block locally for cases where we can mutate the operands
// of the instructions to reduce state transitions. Critically, this		// of the instructions to reduce state transitions. Critically, this
// must be done before we start propagating data flow states as these		// must be done before we start propagating data flow states as these
// transforms are allowed to change the contents of VTYPE and VL so		// transforms are allowed to change the contents of VTYPE and VL so
// long as the semantics of the program stays the same.		// long as the semantics of the program stays the same.
for (MachineBasicBlock &MBB : MF)		for (MachineBasicBlock &MBB : MF)
doLocalPrepass(MBB);		doLocalPrepass(MBB);

bool HaveVectorOp = false;		bool HaveVectorOp = false;

		craig.topperUnsubmitted Not Done Reply Inline Actions Would it make sense to use a BitVector using MBB numbering? craig.topper: Would it make sense to use a BitVector using MBB numbering?
// Phase 1 - determine how VL/VTYPE are affected by the each block.		// Phase 1 - determine how VL/VTYPE are affected by the each block.
for (const MachineBasicBlock &MBB : MF) {		for (const MachineBasicBlock &MBB : MF) {
HaveVectorOp \|= computeVLVTYPEChanges(MBB);		HaveVectorOp \|= computeVLVTYPEChanges(MBB);
// Initial exit state is whatever change we found in the block.		// Initial exit state is whatever change we found in the block.
BlockData &BBInfo = BlockInfo[MBB.getNumber()];		BlockData &BBInfo = BlockInfo[MBB.getNumber()];
BBInfo.Exit = BBInfo.Change;		BBInfo.Exit = BBInfo.Change;
LLVM_DEBUG(dbgs() << "Initial exit state of " << printMBBReference(MBB)		LLVM_DEBUG(dbgs() << "Initial exit state of " << printMBBReference(MBB)
<< " is " << BBInfo.Exit << "\n");		<< " is " << BBInfo.Exit << "\n");
Show All 14 Lines	for (const MachineBasicBlock &MBB : MF) {
BlockInfo[MBB.getNumber()].InQueue = true;		BlockInfo[MBB.getNumber()].InQueue = true;
}		}
while (!WorkList.empty()) {		while (!WorkList.empty()) {
const MachineBasicBlock &MBB = *WorkList.front();		const MachineBasicBlock &MBB = *WorkList.front();
WorkList.pop();		WorkList.pop();
computeIncomingVLVTYPE(MBB);		computeIncomingVLVTYPE(MBB);
}		}

		// Perform partial redundancy elimination of vsetvli transitions.
		for (MachineBasicBlock &MBB : MF)
		doPRE(MBB);

// Phase 3 - add any vsetvli instructions needed in the block. Use the		// Phase 3 - add any vsetvli instructions needed in the block. Use the
// Phase 2 information to avoid adding vsetvlis before the first vector		// Phase 2 information to avoid adding vsetvlis before the first vector
// instruction in the block if the VL/VTYPE is satisfied by its		// instruction in the block if the VL/VTYPE is satisfied by its
// predecessors.		// predecessors.
for (MachineBasicBlock &MBB : MF)		for (MachineBasicBlock &MBB : MF)
emitVSETVLIs(MBB);		emitVSETVLIs(MBB);

// Once we're fully done rewriting all the instructions, do a final pass		// Once we're fully done rewriting all the instructions, do a final pass
Show All 23 Lines

llvm/test/CodeGen/RISCV/rvv/fixed-vector-strided-load-store.ll

	Show First 20 Lines • Show All 501 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: br i1 [[TMP4]], label [[FOR_COND_CLEANUP:%.*]], label [[VECTOR_BODY]]			; CHECK-NEXT: br i1 [[TMP4]], label [[FOR_COND_CLEANUP:%.*]], label [[VECTOR_BODY]]
	; CHECK: for.cond.cleanup:			; CHECK: for.cond.cleanup:
	; CHECK-NEXT: ret void			; CHECK-NEXT: ret void
	;			;
	; CHECK-ASM-LABEL: scatter_pow2:			; CHECK-ASM-LABEL: scatter_pow2:
	; CHECK-ASM: # %bb.0: # %entry			; CHECK-ASM: # %bb.0: # %entry
	; CHECK-ASM-NEXT: li a2, 1024			; CHECK-ASM-NEXT: li a2, 1024
	; CHECK-ASM-NEXT: li a3, 32			; CHECK-ASM-NEXT: li a3, 32
	; CHECK-ASM-NEXT: li a4, 16			; CHECK-ASM-NEXT: li a4, 16
				frasercrmckUnsubmitted Not Done Reply Inline Actions This seems like a regression too frasercrmck: This seems like a regression too
	; CHECK-ASM-NEXT: .LBB7_1: # %vector.body			; CHECK-ASM-NEXT: .LBB7_1: # %vector.body
	; CHECK-ASM-NEXT: # =>This Inner Loop Header: Depth=1			; CHECK-ASM-NEXT: # =>This Inner Loop Header: Depth=1
	; CHECK-ASM-NEXT: vsetvli zero, a3, e8, m1, ta, mu			; CHECK-ASM-NEXT: vsetvli zero, a3, e8, m1, ta, mu
	; CHECK-ASM-NEXT: vle8.v v8, (a1)			; CHECK-ASM-NEXT: vle8.v v8, (a1)
	; CHECK-ASM-NEXT: vsetivli zero, 8, e32, m1, ta, mu			; CHECK-ASM-NEXT: vsetivli zero, 8, e32, m1, ta, mu
	; CHECK-ASM-NEXT: vlse32.v v9, (a0), a4			; CHECK-ASM-NEXT: vlse32.v v9, (a0), a4
	; CHECK-ASM-NEXT: vadd.vv v8, v9, v8			; CHECK-ASM-NEXT: vadd.vv v8, v9, v8
	; CHECK-ASM-NEXT: vsse32.v v8, (a0), a4			; CHECK-ASM-NEXT: vsse32.v v8, (a0), a4
	▲ Show 20 Lines • Show All 66 Lines • ▼ Show 20 Lines
	; CHECK: for.cond.cleanup:			; CHECK: for.cond.cleanup:
	; CHECK-NEXT: ret void			; CHECK-NEXT: ret void
	;			;
	; CHECK-ASM-LABEL: struct_gather:			; CHECK-ASM-LABEL: struct_gather:
	; CHECK-ASM: # %bb.0: # %entry			; CHECK-ASM: # %bb.0: # %entry
	; CHECK-ASM-NEXT: addi a1, a1, 132			; CHECK-ASM-NEXT: addi a1, a1, 132
	; CHECK-ASM-NEXT: li a2, 1024			; CHECK-ASM-NEXT: li a2, 1024
	; CHECK-ASM-NEXT: li a3, 16			; CHECK-ASM-NEXT: li a3, 16
				; CHECK-ASM-NEXT: vsetivli zero, 8, e32, m1, ta, mu
	; CHECK-ASM-NEXT: .LBB8_1: # %vector.body			; CHECK-ASM-NEXT: .LBB8_1: # %vector.body
	; CHECK-ASM-NEXT: # =>This Inner Loop Header: Depth=1			; CHECK-ASM-NEXT: # =>This Inner Loop Header: Depth=1
	; CHECK-ASM-NEXT: addi a4, a1, -128			; CHECK-ASM-NEXT: addi a4, a1, -128
	; CHECK-ASM-NEXT: vsetivli zero, 8, e32, m1, ta, mu
	; CHECK-ASM-NEXT: vlse32.v v8, (a4), a3			; CHECK-ASM-NEXT: vlse32.v v8, (a4), a3
	; CHECK-ASM-NEXT: vlse32.v v9, (a1), a3			; CHECK-ASM-NEXT: vlse32.v v9, (a1), a3
	; CHECK-ASM-NEXT: vle32.v v10, (a0)			; CHECK-ASM-NEXT: vle32.v v10, (a0)
	; CHECK-ASM-NEXT: addi a4, a0, 32			; CHECK-ASM-NEXT: addi a4, a0, 32
	; CHECK-ASM-NEXT: vle32.v v11, (a4)			; CHECK-ASM-NEXT: vle32.v v11, (a4)
	; CHECK-ASM-NEXT: vadd.vv v8, v10, v8			; CHECK-ASM-NEXT: vadd.vv v8, v10, v8
	; CHECK-ASM-NEXT: vadd.vv v9, v11, v9			; CHECK-ASM-NEXT: vadd.vv v9, v11, v9
	; CHECK-ASM-NEXT: vse32.v v8, (a0)			; CHECK-ASM-NEXT: vse32.v v8, (a0)
	▲ Show 20 Lines • Show All 96 Lines • ▼ Show 20 Lines
	; CHECK: for.cond.cleanup:			; CHECK: for.cond.cleanup:
	; CHECK-NEXT: ret void			; CHECK-NEXT: ret void
	;			;
	; CHECK-ASM-LABEL: gather_unroll:			; CHECK-ASM-LABEL: gather_unroll:
	; CHECK-ASM: # %bb.0: # %entry			; CHECK-ASM: # %bb.0: # %entry
	; CHECK-ASM-NEXT: li a2, 256			; CHECK-ASM-NEXT: li a2, 256
	; CHECK-ASM-NEXT: li a3, 64			; CHECK-ASM-NEXT: li a3, 64
	; CHECK-ASM-NEXT: li a4, 16			; CHECK-ASM-NEXT: li a4, 16
				; CHECK-ASM-NEXT: vsetivli zero, 8, e32, m1, ta, mu
	; CHECK-ASM-NEXT: .LBB9_1: # %vector.body			; CHECK-ASM-NEXT: .LBB9_1: # %vector.body
	; CHECK-ASM-NEXT: # =>This Inner Loop Header: Depth=1			; CHECK-ASM-NEXT: # =>This Inner Loop Header: Depth=1
	; CHECK-ASM-NEXT: vsetivli zero, 8, e32, m1, ta, mu
	; CHECK-ASM-NEXT: vlse32.v v8, (a1), a3			; CHECK-ASM-NEXT: vlse32.v v8, (a1), a3
	; CHECK-ASM-NEXT: vlse32.v v9, (a0), a4			; CHECK-ASM-NEXT: vlse32.v v9, (a0), a4
	; CHECK-ASM-NEXT: vadd.vv v8, v9, v8			; CHECK-ASM-NEXT: vadd.vv v8, v9, v8
	; CHECK-ASM-NEXT: vsse32.v v8, (a0), a4			; CHECK-ASM-NEXT: vsse32.v v8, (a0), a4
	; CHECK-ASM-NEXT: addi a5, a1, 16			; CHECK-ASM-NEXT: addi a5, a1, 16
	; CHECK-ASM-NEXT: vlse32.v v8, (a5), a3			; CHECK-ASM-NEXT: vlse32.v v8, (a5), a3
	; CHECK-ASM-NEXT: addi a5, a0, 4			; CHECK-ASM-NEXT: addi a5, a0, 4
	; CHECK-ASM-NEXT: vlse32.v v9, (a5), a4			; CHECK-ASM-NEXT: vlse32.v v9, (a5), a4
	▲ Show 20 Lines • Show All 93 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: br i1 [[TMP14]], label [[TMP15:%.*]], label [[TMP3]]			; CHECK-NEXT: br i1 [[TMP14]], label [[TMP15:%.*]], label [[TMP3]]
	; CHECK: 15:			; CHECK: 15:
	; CHECK-NEXT: ret void			; CHECK-NEXT: ret void
	;			;
	; CHECK-ASM-LABEL: gather_of_pointers:			; CHECK-ASM-LABEL: gather_of_pointers:
	; CHECK-ASM: # %bb.0:			; CHECK-ASM: # %bb.0:
	; CHECK-ASM-NEXT: li a2, 1024			; CHECK-ASM-NEXT: li a2, 1024
	; CHECK-ASM-NEXT: li a3, 40			; CHECK-ASM-NEXT: li a3, 40
	; CHECK-ASM-NEXT: .LBB10_1: # =>This Inner Loop Header: Depth=1
	; CHECK-ASM-NEXT: vsetivli zero, 2, e64, m1, ta, mu			; CHECK-ASM-NEXT: vsetivli zero, 2, e64, m1, ta, mu
				; CHECK-ASM-NEXT: .LBB10_1: # =>This Inner Loop Header: Depth=1
	; CHECK-ASM-NEXT: vlse64.v v8, (a1), a3			; CHECK-ASM-NEXT: vlse64.v v8, (a1), a3
	; CHECK-ASM-NEXT: addi a4, a1, 80			; CHECK-ASM-NEXT: addi a4, a1, 80
	; CHECK-ASM-NEXT: vlse64.v v9, (a4), a3			; CHECK-ASM-NEXT: vlse64.v v9, (a4), a3
	; CHECK-ASM-NEXT: vse64.v v8, (a0)			; CHECK-ASM-NEXT: vse64.v v8, (a0)
	; CHECK-ASM-NEXT: addi a4, a0, 16			; CHECK-ASM-NEXT: addi a4, a0, 16
	; CHECK-ASM-NEXT: vse64.v v9, (a4)			; CHECK-ASM-NEXT: vse64.v v9, (a4)
	; CHECK-ASM-NEXT: addi a2, a2, -4			; CHECK-ASM-NEXT: addi a2, a2, -4
	; CHECK-ASM-NEXT: addi a0, a0, 32			; CHECK-ASM-NEXT: addi a0, a0, 32
	▲ Show 20 Lines • Show All 55 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: br i1 [[TMP14]], label [[TMP15:%.*]], label [[TMP3]]			; CHECK-NEXT: br i1 [[TMP14]], label [[TMP15:%.*]], label [[TMP3]]
	; CHECK: 15:			; CHECK: 15:
	; CHECK-NEXT: ret void			; CHECK-NEXT: ret void
	;			;
	; CHECK-ASM-LABEL: scatter_of_pointers:			; CHECK-ASM-LABEL: scatter_of_pointers:
	; CHECK-ASM: # %bb.0:			; CHECK-ASM: # %bb.0:
	; CHECK-ASM-NEXT: li a2, 1024			; CHECK-ASM-NEXT: li a2, 1024
	; CHECK-ASM-NEXT: li a3, 40			; CHECK-ASM-NEXT: li a3, 40
	; CHECK-ASM-NEXT: .LBB11_1: # =>This Inner Loop Header: Depth=1
	; CHECK-ASM-NEXT: vsetivli zero, 2, e64, m1, ta, mu			; CHECK-ASM-NEXT: vsetivli zero, 2, e64, m1, ta, mu
				; CHECK-ASM-NEXT: .LBB11_1: # =>This Inner Loop Header: Depth=1
	; CHECK-ASM-NEXT: vle64.v v8, (a1)			; CHECK-ASM-NEXT: vle64.v v8, (a1)
	; CHECK-ASM-NEXT: addi a4, a1, 16			; CHECK-ASM-NEXT: addi a4, a1, 16
	; CHECK-ASM-NEXT: vle64.v v9, (a4)			; CHECK-ASM-NEXT: vle64.v v9, (a4)
	; CHECK-ASM-NEXT: addi a4, a0, 80			; CHECK-ASM-NEXT: addi a4, a0, 80
	; CHECK-ASM-NEXT: vsse64.v v8, (a0), a3			; CHECK-ASM-NEXT: vsse64.v v8, (a0), a3
	; CHECK-ASM-NEXT: vsse64.v v9, (a4), a3			; CHECK-ASM-NEXT: vsse64.v v9, (a4), a3
	; CHECK-ASM-NEXT: addi a2, a2, -4			; CHECK-ASM-NEXT: addi a2, a2, -4
	; CHECK-ASM-NEXT: addi a1, a1, 32			; CHECK-ASM-NEXT: addi a1, a1, 32
	▲ Show 20 Lines • Show All 202 Lines • Show Last 20 Lines

llvm/test/CodeGen/RISCV/rvv/sink-splat-operands.ll

; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py		; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
; RUN: llc < %s -mtriple=riscv64 -mattr=+m,+v,+f -target-abi=lp64f \		; RUN: llc < %s -mtriple=riscv64 -mattr=+m,+v,+f -target-abi=lp64f \
; RUN: -riscv-v-vector-bits-min=128 \| FileCheck %s		; RUN: -riscv-v-vector-bits-min=128 \| FileCheck %s

define void @sink_splat_mul(i32* nocapture %a, i32 signext %x) {		define void @sink_splat_mul(i32* nocapture %a, i32 signext %x) {
; CHECK-LABEL: sink_splat_mul:		; CHECK-LABEL: sink_splat_mul:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a2, 1024		; CHECK-NEXT: li a2, 1024
		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: .LBB0_1: # %vector.body		; CHECK-NEXT: .LBB0_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vmul.vx v8, v8, a1		; CHECK-NEXT: vmul.vx v8, v8, a1
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a2, a2, -4		; CHECK-NEXT: addi a2, a2, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a2, .LBB0_1		; CHECK-NEXT: bnez a2, .LBB0_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
Show All 17 Lines
for.cond.cleanup: ; preds = %vector.body		for.cond.cleanup: ; preds = %vector.body
ret void		ret void
}		}

define void @sink_splat_add(i32* nocapture %a, i32 signext %x) {		define void @sink_splat_add(i32* nocapture %a, i32 signext %x) {
; CHECK-LABEL: sink_splat_add:		; CHECK-LABEL: sink_splat_add:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a2, 1024		; CHECK-NEXT: li a2, 1024
		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: .LBB1_1: # %vector.body		; CHECK-NEXT: .LBB1_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vadd.vx v8, v8, a1		; CHECK-NEXT: vadd.vx v8, v8, a1
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a2, a2, -4		; CHECK-NEXT: addi a2, a2, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a2, .LBB1_1		; CHECK-NEXT: bnez a2, .LBB1_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
Show All 17 Lines
for.cond.cleanup: ; preds = %vector.body		for.cond.cleanup: ; preds = %vector.body
ret void		ret void
}		}

define void @sink_splat_sub(i32* nocapture %a, i32 signext %x) {		define void @sink_splat_sub(i32* nocapture %a, i32 signext %x) {
; CHECK-LABEL: sink_splat_sub:		; CHECK-LABEL: sink_splat_sub:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a2, 1024		; CHECK-NEXT: li a2, 1024
		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: .LBB2_1: # %vector.body		; CHECK-NEXT: .LBB2_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsub.vx v8, v8, a1		; CHECK-NEXT: vsub.vx v8, v8, a1
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a2, a2, -4		; CHECK-NEXT: addi a2, a2, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a2, .LBB2_1		; CHECK-NEXT: bnez a2, .LBB2_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
Show All 17 Lines
for.cond.cleanup: ; preds = %vector.body		for.cond.cleanup: ; preds = %vector.body
ret void		ret void
}		}

define void @sink_splat_rsub(i32* nocapture %a, i32 signext %x) {		define void @sink_splat_rsub(i32* nocapture %a, i32 signext %x) {
; CHECK-LABEL: sink_splat_rsub:		; CHECK-LABEL: sink_splat_rsub:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a2, 1024		; CHECK-NEXT: li a2, 1024
		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: .LBB3_1: # %vector.body		; CHECK-NEXT: .LBB3_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vrsub.vx v8, v8, a1		; CHECK-NEXT: vrsub.vx v8, v8, a1
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a2, a2, -4		; CHECK-NEXT: addi a2, a2, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a2, .LBB3_1		; CHECK-NEXT: bnez a2, .LBB3_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
Show All 17 Lines
for.cond.cleanup: ; preds = %vector.body		for.cond.cleanup: ; preds = %vector.body
ret void		ret void
}		}

define void @sink_splat_and(i32* nocapture %a, i32 signext %x) {		define void @sink_splat_and(i32* nocapture %a, i32 signext %x) {
; CHECK-LABEL: sink_splat_and:		; CHECK-LABEL: sink_splat_and:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a2, 1024		; CHECK-NEXT: li a2, 1024
		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: .LBB4_1: # %vector.body		; CHECK-NEXT: .LBB4_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vand.vx v8, v8, a1		; CHECK-NEXT: vand.vx v8, v8, a1
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a2, a2, -4		; CHECK-NEXT: addi a2, a2, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a2, .LBB4_1		; CHECK-NEXT: bnez a2, .LBB4_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
Show All 17 Lines
for.cond.cleanup: ; preds = %vector.body		for.cond.cleanup: ; preds = %vector.body
ret void		ret void
}		}

define void @sink_splat_or(i32* nocapture %a, i32 signext %x) {		define void @sink_splat_or(i32* nocapture %a, i32 signext %x) {
; CHECK-LABEL: sink_splat_or:		; CHECK-LABEL: sink_splat_or:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a2, 1024		; CHECK-NEXT: li a2, 1024
		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: .LBB5_1: # %vector.body		; CHECK-NEXT: .LBB5_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vor.vx v8, v8, a1		; CHECK-NEXT: vor.vx v8, v8, a1
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a2, a2, -4		; CHECK-NEXT: addi a2, a2, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a2, .LBB5_1		; CHECK-NEXT: bnez a2, .LBB5_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
Show All 17 Lines
for.cond.cleanup: ; preds = %vector.body		for.cond.cleanup: ; preds = %vector.body
ret void		ret void
}		}

define void @sink_splat_xor(i32* nocapture %a, i32 signext %x) {		define void @sink_splat_xor(i32* nocapture %a, i32 signext %x) {
; CHECK-LABEL: sink_splat_xor:		; CHECK-LABEL: sink_splat_xor:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a2, 1024		; CHECK-NEXT: li a2, 1024
		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: .LBB6_1: # %vector.body		; CHECK-NEXT: .LBB6_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vxor.vx v8, v8, a1		; CHECK-NEXT: vxor.vx v8, v8, a1
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a2, a2, -4		; CHECK-NEXT: addi a2, a2, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a2, .LBB6_1		; CHECK-NEXT: bnez a2, .LBB6_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
▲ Show 20 Lines • Show All 661 Lines • ▼ Show 20 Lines	for.body: ; preds = %for.body.preheader, %for.body
%cmp.not = icmp eq i64 %indvars.iv.next, 1024		%cmp.not = icmp eq i64 %indvars.iv.next, 1024
br i1 %cmp.not, label %for.cond.cleanup, label %for.body		br i1 %cmp.not, label %for.cond.cleanup, label %for.body
}		}

define void @sink_splat_shl(i32* nocapture %a, i32 signext %x) {		define void @sink_splat_shl(i32* nocapture %a, i32 signext %x) {
; CHECK-LABEL: sink_splat_shl:		; CHECK-LABEL: sink_splat_shl:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a2, 1024		; CHECK-NEXT: li a2, 1024
		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: .LBB14_1: # %vector.body		; CHECK-NEXT: .LBB14_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsll.vx v8, v8, a1		; CHECK-NEXT: vsll.vx v8, v8, a1
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a2, a2, -4		; CHECK-NEXT: addi a2, a2, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a2, .LBB14_1		; CHECK-NEXT: bnez a2, .LBB14_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
Show All 17 Lines
for.cond.cleanup: ; preds = %vector.body		for.cond.cleanup: ; preds = %vector.body
ret void		ret void
}		}

define void @sink_splat_lshr(i32* nocapture %a, i32 signext %x) {		define void @sink_splat_lshr(i32* nocapture %a, i32 signext %x) {
; CHECK-LABEL: sink_splat_lshr:		; CHECK-LABEL: sink_splat_lshr:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a2, 1024		; CHECK-NEXT: li a2, 1024
		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: .LBB15_1: # %vector.body		; CHECK-NEXT: .LBB15_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsrl.vx v8, v8, a1		; CHECK-NEXT: vsrl.vx v8, v8, a1
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a2, a2, -4		; CHECK-NEXT: addi a2, a2, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a2, .LBB15_1		; CHECK-NEXT: bnez a2, .LBB15_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
Show All 17 Lines
for.cond.cleanup: ; preds = %vector.body		for.cond.cleanup: ; preds = %vector.body
ret void		ret void
}		}

define void @sink_splat_ashr(i32* nocapture %a, i32 signext %x) {		define void @sink_splat_ashr(i32* nocapture %a, i32 signext %x) {
; CHECK-LABEL: sink_splat_ashr:		; CHECK-LABEL: sink_splat_ashr:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a2, 1024		; CHECK-NEXT: li a2, 1024
		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: .LBB16_1: # %vector.body		; CHECK-NEXT: .LBB16_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsra.vx v8, v8, a1		; CHECK-NEXT: vsra.vx v8, v8, a1
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a2, a2, -4		; CHECK-NEXT: addi a2, a2, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a2, .LBB16_1		; CHECK-NEXT: bnez a2, .LBB16_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
▲ Show 20 Lines • Show All 293 Lines • ▼ Show 20 Lines	for.body: ; preds = %for.body.preheader, %for.body
%cmp.not = icmp eq i64 %indvars.iv.next, 1024		%cmp.not = icmp eq i64 %indvars.iv.next, 1024
br i1 %cmp.not, label %for.cond.cleanup, label %for.body		br i1 %cmp.not, label %for.cond.cleanup, label %for.body
}		}

define void @sink_splat_fmul(float* nocapture %a, float %x) {		define void @sink_splat_fmul(float* nocapture %a, float %x) {
; CHECK-LABEL: sink_splat_fmul:		; CHECK-LABEL: sink_splat_fmul:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a1, 1024		; CHECK-NEXT: li a1, 1024
		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: .LBB20_1: # %vector.body		; CHECK-NEXT: .LBB20_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vfmul.vf v8, v8, fa0		; CHECK-NEXT: vfmul.vf v8, v8, fa0
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a1, a1, -4		; CHECK-NEXT: addi a1, a1, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a1, .LBB20_1		; CHECK-NEXT: bnez a1, .LBB20_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
Show All 17 Lines
for.cond.cleanup: ; preds = %vector.body		for.cond.cleanup: ; preds = %vector.body
ret void		ret void
}		}

define void @sink_splat_fdiv(float* nocapture %a, float %x) {		define void @sink_splat_fdiv(float* nocapture %a, float %x) {
; CHECK-LABEL: sink_splat_fdiv:		; CHECK-LABEL: sink_splat_fdiv:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a1, 1024		; CHECK-NEXT: li a1, 1024
		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: .LBB21_1: # %vector.body		; CHECK-NEXT: .LBB21_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vfdiv.vf v8, v8, fa0		; CHECK-NEXT: vfdiv.vf v8, v8, fa0
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a1, a1, -4		; CHECK-NEXT: addi a1, a1, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a1, .LBB21_1		; CHECK-NEXT: bnez a1, .LBB21_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
Show All 17 Lines
for.cond.cleanup: ; preds = %vector.body		for.cond.cleanup: ; preds = %vector.body
ret void		ret void
}		}

define void @sink_splat_frdiv(float* nocapture %a, float %x) {		define void @sink_splat_frdiv(float* nocapture %a, float %x) {
; CHECK-LABEL: sink_splat_frdiv:		; CHECK-LABEL: sink_splat_frdiv:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a1, 1024		; CHECK-NEXT: li a1, 1024
		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: .LBB22_1: # %vector.body		; CHECK-NEXT: .LBB22_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vfrdiv.vf v8, v8, fa0		; CHECK-NEXT: vfrdiv.vf v8, v8, fa0
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a1, a1, -4		; CHECK-NEXT: addi a1, a1, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a1, .LBB22_1		; CHECK-NEXT: bnez a1, .LBB22_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
Show All 17 Lines
for.cond.cleanup: ; preds = %vector.body		for.cond.cleanup: ; preds = %vector.body
ret void		ret void
}		}

define void @sink_splat_fadd(float* nocapture %a, float %x) {		define void @sink_splat_fadd(float* nocapture %a, float %x) {
; CHECK-LABEL: sink_splat_fadd:		; CHECK-LABEL: sink_splat_fadd:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a1, 1024		; CHECK-NEXT: li a1, 1024
		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: .LBB23_1: # %vector.body		; CHECK-NEXT: .LBB23_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vfadd.vf v8, v8, fa0		; CHECK-NEXT: vfadd.vf v8, v8, fa0
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a1, a1, -4		; CHECK-NEXT: addi a1, a1, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a1, .LBB23_1		; CHECK-NEXT: bnez a1, .LBB23_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
Show All 17 Lines
for.cond.cleanup: ; preds = %vector.body		for.cond.cleanup: ; preds = %vector.body
ret void		ret void
}		}

define void @sink_splat_fsub(float* nocapture %a, float %x) {		define void @sink_splat_fsub(float* nocapture %a, float %x) {
; CHECK-LABEL: sink_splat_fsub:		; CHECK-LABEL: sink_splat_fsub:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a1, 1024		; CHECK-NEXT: li a1, 1024
		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: .LBB24_1: # %vector.body		; CHECK-NEXT: .LBB24_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vfsub.vf v8, v8, fa0		; CHECK-NEXT: vfsub.vf v8, v8, fa0
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a1, a1, -4		; CHECK-NEXT: addi a1, a1, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a1, .LBB24_1		; CHECK-NEXT: bnez a1, .LBB24_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
Show All 17 Lines
for.cond.cleanup: ; preds = %vector.body		for.cond.cleanup: ; preds = %vector.body
ret void		ret void
}		}

define void @sink_splat_frsub(float* nocapture %a, float %x) {		define void @sink_splat_frsub(float* nocapture %a, float %x) {
; CHECK-LABEL: sink_splat_frsub:		; CHECK-LABEL: sink_splat_frsub:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a1, 1024		; CHECK-NEXT: li a1, 1024
		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: .LBB25_1: # %vector.body		; CHECK-NEXT: .LBB25_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vfrsub.vf v8, v8, fa0		; CHECK-NEXT: vfrsub.vf v8, v8, fa0
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a1, a1, -4		; CHECK-NEXT: addi a1, a1, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a1, .LBB25_1		; CHECK-NEXT: bnez a1, .LBB25_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
▲ Show 20 Lines • Show All 563 Lines • ▼ Show 20 Lines	for.body: ; preds = %for.body.preheader, %for.body
%cmp.not = icmp eq i64 %indvars.iv.next, 1024		%cmp.not = icmp eq i64 %indvars.iv.next, 1024
br i1 %cmp.not, label %for.cond.cleanup, label %for.body		br i1 %cmp.not, label %for.cond.cleanup, label %for.body
}		}

define void @sink_splat_fma(float* noalias nocapture %a, float* nocapture readonly %b, float %x) {		define void @sink_splat_fma(float* noalias nocapture %a, float* nocapture readonly %b, float %x) {
; CHECK-LABEL: sink_splat_fma:		; CHECK-LABEL: sink_splat_fma:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a2, 1024		; CHECK-NEXT: li a2, 1024
		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: .LBB32_1: # %vector.body		; CHECK-NEXT: .LBB32_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vle32.v v9, (a1)		; CHECK-NEXT: vle32.v v9, (a1)
; CHECK-NEXT: vfmacc.vf v9, fa0, v8		; CHECK-NEXT: vfmacc.vf v9, fa0, v8
; CHECK-NEXT: vse32.v v9, (a0)		; CHECK-NEXT: vse32.v v9, (a0)
; CHECK-NEXT: addi a2, a2, -4		; CHECK-NEXT: addi a2, a2, -4
; CHECK-NEXT: addi a1, a1, 16		; CHECK-NEXT: addi a1, a1, 16
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a2, .LBB32_1		; CHECK-NEXT: bnez a2, .LBB32_1
Show All 22 Lines
for.cond.cleanup: ; preds = %vector.body		for.cond.cleanup: ; preds = %vector.body
ret void		ret void
}		}

define void @sink_splat_fma_commute(float* noalias nocapture %a, float* nocapture readonly %b, float %x) {		define void @sink_splat_fma_commute(float* noalias nocapture %a, float* nocapture readonly %b, float %x) {
; CHECK-LABEL: sink_splat_fma_commute:		; CHECK-LABEL: sink_splat_fma_commute:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a2, 1024		; CHECK-NEXT: li a2, 1024
		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: .LBB33_1: # %vector.body		; CHECK-NEXT: .LBB33_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vle32.v v9, (a1)		; CHECK-NEXT: vle32.v v9, (a1)
; CHECK-NEXT: vfmacc.vf v9, fa0, v8		; CHECK-NEXT: vfmacc.vf v9, fa0, v8
; CHECK-NEXT: vse32.v v9, (a0)		; CHECK-NEXT: vse32.v v9, (a0)
; CHECK-NEXT: addi a2, a2, -4		; CHECK-NEXT: addi a2, a2, -4
; CHECK-NEXT: addi a1, a1, 16		; CHECK-NEXT: addi a1, a1, 16
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a2, .LBB33_1		; CHECK-NEXT: bnez a2, .LBB33_1
▲ Show 20 Lines • Show All 307 Lines • ▼ Show 20 Lines	for.cond.cleanup: ; preds = %vector.body
ret void		ret void
}		}
declare void @llvm.masked.store.v4f32.p0v4f32(<4 x float>, <4 x float>*, i32, <4 x i1>)		declare void @llvm.masked.store.v4f32.p0v4f32(<4 x float>, <4 x float>*, i32, <4 x i1>)

define void @sink_splat_udiv(i32* nocapture %a, i32 signext %x) {		define void @sink_splat_udiv(i32* nocapture %a, i32 signext %x) {
; CHECK-LABEL: sink_splat_udiv:		; CHECK-LABEL: sink_splat_udiv:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a2, 1024		; CHECK-NEXT: li a2, 1024
		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: .LBB38_1: # %vector.body		; CHECK-NEXT: .LBB38_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vdivu.vx v8, v8, a1		; CHECK-NEXT: vdivu.vx v8, v8, a1
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a2, a2, -4		; CHECK-NEXT: addi a2, a2, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a2, .LBB38_1		; CHECK-NEXT: bnez a2, .LBB38_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
Show All 17 Lines
for.cond.cleanup: ; preds = %vector.body		for.cond.cleanup: ; preds = %vector.body
ret void		ret void
}		}

define void @sink_splat_sdiv(i32* nocapture %a, i32 signext %x) {		define void @sink_splat_sdiv(i32* nocapture %a, i32 signext %x) {
; CHECK-LABEL: sink_splat_sdiv:		; CHECK-LABEL: sink_splat_sdiv:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a2, 1024		; CHECK-NEXT: li a2, 1024
		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: .LBB39_1: # %vector.body		; CHECK-NEXT: .LBB39_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vdiv.vx v8, v8, a1		; CHECK-NEXT: vdiv.vx v8, v8, a1
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a2, a2, -4		; CHECK-NEXT: addi a2, a2, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a2, .LBB39_1		; CHECK-NEXT: bnez a2, .LBB39_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
Show All 17 Lines
for.cond.cleanup: ; preds = %vector.body		for.cond.cleanup: ; preds = %vector.body
ret void		ret void
}		}

define void @sink_splat_urem(i32* nocapture %a, i32 signext %x) {		define void @sink_splat_urem(i32* nocapture %a, i32 signext %x) {
; CHECK-LABEL: sink_splat_urem:		; CHECK-LABEL: sink_splat_urem:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a2, 1024		; CHECK-NEXT: li a2, 1024
		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: .LBB40_1: # %vector.body		; CHECK-NEXT: .LBB40_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vremu.vx v8, v8, a1		; CHECK-NEXT: vremu.vx v8, v8, a1
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a2, a2, -4		; CHECK-NEXT: addi a2, a2, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a2, .LBB40_1		; CHECK-NEXT: bnez a2, .LBB40_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
Show All 17 Lines
for.cond.cleanup: ; preds = %vector.body		for.cond.cleanup: ; preds = %vector.body
ret void		ret void
}		}

define void @sink_splat_srem(i32* nocapture %a, i32 signext %x) {		define void @sink_splat_srem(i32* nocapture %a, i32 signext %x) {
; CHECK-LABEL: sink_splat_srem:		; CHECK-LABEL: sink_splat_srem:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a2, 1024		; CHECK-NEXT: li a2, 1024
		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: .LBB41_1: # %vector.body		; CHECK-NEXT: .LBB41_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vrem.vx v8, v8, a1		; CHECK-NEXT: vrem.vx v8, v8, a1
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a2, a2, -4		; CHECK-NEXT: addi a2, a2, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a2, .LBB41_1		; CHECK-NEXT: bnez a2, .LBB41_1
; CHECK-NEXT: # %bb.2: # %for.cond.cleanup		; CHECK-NEXT: # %bb.2: # %for.cond.cleanup
; CHECK-NEXT: ret		; CHECK-NEXT: ret
▲ Show 20 Lines • Show All 387 Lines • ▼ Show 20 Lines
}		}

declare <4 x i32> @llvm.vp.mul.v4i32(<4 x i32>, <4 x i32>, <4 x i1>, i32)		declare <4 x i32> @llvm.vp.mul.v4i32(<4 x i32>, <4 x i32>, <4 x i1>, i32)

define void @sink_splat_vp_mul(i32* nocapture %a, i32 signext %x, <4 x i1> %m, i32 zeroext %vl) {		define void @sink_splat_vp_mul(i32* nocapture %a, i32 signext %x, <4 x i1> %m, i32 zeroext %vl) {
; CHECK-LABEL: sink_splat_vp_mul:		; CHECK-LABEL: sink_splat_vp_mul:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a3, 1024		; CHECK-NEXT: li a3, 1024
		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: .LBB46_1: # %vector.body		; CHECK-NEXT: .LBB46_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsetvli zero, a2, e32, m1, ta, mu		; CHECK-NEXT: vsetvli zero, a2, e32, m1, ta, mu
; CHECK-NEXT: vmul.vx v8, v8, a1, v0.t		; CHECK-NEXT: vmul.vx v8, v8, a1, v0.t
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a3, a3, -4		; CHECK-NEXT: addi a3, a3, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a3, .LBB46_1		; CHECK-NEXT: bnez a3, .LBB46_1
Show All 21 Lines
}		}

declare <4 x i32> @llvm.vp.add.v4i32(<4 x i32>, <4 x i32>, <4 x i1>, i32)		declare <4 x i32> @llvm.vp.add.v4i32(<4 x i32>, <4 x i32>, <4 x i1>, i32)

define void @sink_splat_vp_add(i32* nocapture %a, i32 signext %x, <4 x i1> %m, i32 zeroext %vl) {		define void @sink_splat_vp_add(i32* nocapture %a, i32 signext %x, <4 x i1> %m, i32 zeroext %vl) {
; CHECK-LABEL: sink_splat_vp_add:		; CHECK-LABEL: sink_splat_vp_add:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a3, 1024		; CHECK-NEXT: li a3, 1024
		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: .LBB47_1: # %vector.body		; CHECK-NEXT: .LBB47_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsetvli zero, a2, e32, m1, ta, mu		; CHECK-NEXT: vsetvli zero, a2, e32, m1, ta, mu
; CHECK-NEXT: vadd.vx v8, v8, a1, v0.t		; CHECK-NEXT: vadd.vx v8, v8, a1, v0.t
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a3, a3, -4		; CHECK-NEXT: addi a3, a3, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a3, .LBB47_1		; CHECK-NEXT: bnez a3, .LBB47_1
▲ Show 20 Lines • Show All 63 Lines • ▼ Show 20 Lines
}		}

declare <4 x i32> @llvm.vp.sub.v4i32(<4 x i32>, <4 x i32>, <4 x i1>, i32)		declare <4 x i32> @llvm.vp.sub.v4i32(<4 x i32>, <4 x i32>, <4 x i1>, i32)

define void @sink_splat_vp_sub(i32* nocapture %a, i32 signext %x, <4 x i1> %m, i32 zeroext %vl) {		define void @sink_splat_vp_sub(i32* nocapture %a, i32 signext %x, <4 x i1> %m, i32 zeroext %vl) {
; CHECK-LABEL: sink_splat_vp_sub:		; CHECK-LABEL: sink_splat_vp_sub:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a3, 1024		; CHECK-NEXT: li a3, 1024
		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: .LBB49_1: # %vector.body		; CHECK-NEXT: .LBB49_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsetvli zero, a2, e32, m1, ta, mu		; CHECK-NEXT: vsetvli zero, a2, e32, m1, ta, mu
; CHECK-NEXT: vsub.vx v8, v8, a1, v0.t		; CHECK-NEXT: vsub.vx v8, v8, a1, v0.t
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a3, a3, -4		; CHECK-NEXT: addi a3, a3, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a3, .LBB49_1		; CHECK-NEXT: bnez a3, .LBB49_1
Show All 19 Lines
for.cond.cleanup: ; preds = %vector.body		for.cond.cleanup: ; preds = %vector.body
ret void		ret void
}		}

define void @sink_splat_vp_rsub(i32* nocapture %a, i32 signext %x, <4 x i1> %m, i32 zeroext %vl) {		define void @sink_splat_vp_rsub(i32* nocapture %a, i32 signext %x, <4 x i1> %m, i32 zeroext %vl) {
; CHECK-LABEL: sink_splat_vp_rsub:		; CHECK-LABEL: sink_splat_vp_rsub:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a3, 1024		; CHECK-NEXT: li a3, 1024
		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: .LBB50_1: # %vector.body		; CHECK-NEXT: .LBB50_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsetvli zero, a2, e32, m1, ta, mu		; CHECK-NEXT: vsetvli zero, a2, e32, m1, ta, mu
; CHECK-NEXT: vrsub.vx v8, v8, a1, v0.t		; CHECK-NEXT: vrsub.vx v8, v8, a1, v0.t
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a3, a3, -4		; CHECK-NEXT: addi a3, a3, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a3, .LBB50_1		; CHECK-NEXT: bnez a3, .LBB50_1
Show All 21 Lines
}		}

declare <4 x i32> @llvm.vp.shl.v4i32(<4 x i32>, <4 x i32>, <4 x i1>, i32)		declare <4 x i32> @llvm.vp.shl.v4i32(<4 x i32>, <4 x i32>, <4 x i1>, i32)

define void @sink_splat_vp_shl(i32* nocapture %a, i32 signext %x, <4 x i1> %m, i32 zeroext %vl) {		define void @sink_splat_vp_shl(i32* nocapture %a, i32 signext %x, <4 x i1> %m, i32 zeroext %vl) {
; CHECK-LABEL: sink_splat_vp_shl:		; CHECK-LABEL: sink_splat_vp_shl:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a3, 1024		; CHECK-NEXT: li a3, 1024
		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: .LBB51_1: # %vector.body		; CHECK-NEXT: .LBB51_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsetvli zero, a2, e32, m1, ta, mu		; CHECK-NEXT: vsetvli zero, a2, e32, m1, ta, mu
; CHECK-NEXT: vsll.vx v8, v8, a1, v0.t		; CHECK-NEXT: vsll.vx v8, v8, a1, v0.t
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a3, a3, -4		; CHECK-NEXT: addi a3, a3, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a3, .LBB51_1		; CHECK-NEXT: bnez a3, .LBB51_1
Show All 21 Lines
}		}

declare <4 x i32> @llvm.vp.lshr.v4i32(<4 x i32>, <4 x i32>, <4 x i1>, i32)		declare <4 x i32> @llvm.vp.lshr.v4i32(<4 x i32>, <4 x i32>, <4 x i1>, i32)

define void @sink_splat_vp_lshr(i32* nocapture %a, i32 signext %x, <4 x i1> %m, i32 zeroext %vl) {		define void @sink_splat_vp_lshr(i32* nocapture %a, i32 signext %x, <4 x i1> %m, i32 zeroext %vl) {
; CHECK-LABEL: sink_splat_vp_lshr:		; CHECK-LABEL: sink_splat_vp_lshr:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a3, 1024		; CHECK-NEXT: li a3, 1024
		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: .LBB52_1: # %vector.body		; CHECK-NEXT: .LBB52_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsetvli zero, a2, e32, m1, ta, mu		; CHECK-NEXT: vsetvli zero, a2, e32, m1, ta, mu
; CHECK-NEXT: vsrl.vx v8, v8, a1, v0.t		; CHECK-NEXT: vsrl.vx v8, v8, a1, v0.t
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a3, a3, -4		; CHECK-NEXT: addi a3, a3, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a3, .LBB52_1		; CHECK-NEXT: bnez a3, .LBB52_1
Show All 21 Lines
}		}

declare <4 x i32> @llvm.vp.ashr.v4i32(<4 x i32>, <4 x i32>, <4 x i1>, i32)		declare <4 x i32> @llvm.vp.ashr.v4i32(<4 x i32>, <4 x i32>, <4 x i1>, i32)

define void @sink_splat_vp_ashr(i32* nocapture %a, i32 signext %x, <4 x i1> %m, i32 zeroext %vl) {		define void @sink_splat_vp_ashr(i32* nocapture %a, i32 signext %x, <4 x i1> %m, i32 zeroext %vl) {
; CHECK-LABEL: sink_splat_vp_ashr:		; CHECK-LABEL: sink_splat_vp_ashr:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a3, 1024		; CHECK-NEXT: li a3, 1024
		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: .LBB53_1: # %vector.body		; CHECK-NEXT: .LBB53_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsetvli zero, a2, e32, m1, ta, mu		; CHECK-NEXT: vsetvli zero, a2, e32, m1, ta, mu
; CHECK-NEXT: vsra.vx v8, v8, a1, v0.t		; CHECK-NEXT: vsra.vx v8, v8, a1, v0.t
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a3, a3, -4		; CHECK-NEXT: addi a3, a3, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a3, .LBB53_1		; CHECK-NEXT: bnez a3, .LBB53_1
Show All 21 Lines
}		}

declare <4 x float> @llvm.vp.fmul.v4i32(<4 x float>, <4 x float>, <4 x i1>, i32)		declare <4 x float> @llvm.vp.fmul.v4i32(<4 x float>, <4 x float>, <4 x i1>, i32)

define void @sink_splat_vp_fmul(float* nocapture %a, float %x, <4 x i1> %m, i32 zeroext %vl) {		define void @sink_splat_vp_fmul(float* nocapture %a, float %x, <4 x i1> %m, i32 zeroext %vl) {
; CHECK-LABEL: sink_splat_vp_fmul:		; CHECK-LABEL: sink_splat_vp_fmul:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a2, 1024		; CHECK-NEXT: li a2, 1024
		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: .LBB54_1: # %vector.body		; CHECK-NEXT: .LBB54_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsetvli zero, a1, e32, m1, ta, mu		; CHECK-NEXT: vsetvli zero, a1, e32, m1, ta, mu
; CHECK-NEXT: vfmul.vf v8, v8, fa0, v0.t		; CHECK-NEXT: vfmul.vf v8, v8, fa0, v0.t
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a2, a2, -4		; CHECK-NEXT: addi a2, a2, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a2, .LBB54_1		; CHECK-NEXT: bnez a2, .LBB54_1
Show All 21 Lines
}		}

declare <4 x float> @llvm.vp.fdiv.v4i32(<4 x float>, <4 x float>, <4 x i1>, i32)		declare <4 x float> @llvm.vp.fdiv.v4i32(<4 x float>, <4 x float>, <4 x i1>, i32)

define void @sink_splat_vp_fdiv(float* nocapture %a, float %x, <4 x i1> %m, i32 zeroext %vl) {		define void @sink_splat_vp_fdiv(float* nocapture %a, float %x, <4 x i1> %m, i32 zeroext %vl) {
; CHECK-LABEL: sink_splat_vp_fdiv:		; CHECK-LABEL: sink_splat_vp_fdiv:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a2, 1024		; CHECK-NEXT: li a2, 1024
		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: .LBB55_1: # %vector.body		; CHECK-NEXT: .LBB55_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsetvli zero, a1, e32, m1, ta, mu		; CHECK-NEXT: vsetvli zero, a1, e32, m1, ta, mu
; CHECK-NEXT: vfdiv.vf v8, v8, fa0, v0.t		; CHECK-NEXT: vfdiv.vf v8, v8, fa0, v0.t
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a2, a2, -4		; CHECK-NEXT: addi a2, a2, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a2, .LBB55_1		; CHECK-NEXT: bnez a2, .LBB55_1
Show All 19 Lines
for.cond.cleanup: ; preds = %vector.body		for.cond.cleanup: ; preds = %vector.body
ret void		ret void
}		}

define void @sink_splat_vp_frdiv(float* nocapture %a, float %x, <4 x i1> %m, i32 zeroext %vl) {		define void @sink_splat_vp_frdiv(float* nocapture %a, float %x, <4 x i1> %m, i32 zeroext %vl) {
; CHECK-LABEL: sink_splat_vp_frdiv:		; CHECK-LABEL: sink_splat_vp_frdiv:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a2, 1024		; CHECK-NEXT: li a2, 1024
		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: .LBB56_1: # %vector.body		; CHECK-NEXT: .LBB56_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsetvli zero, a1, e32, m1, ta, mu		; CHECK-NEXT: vsetvli zero, a1, e32, m1, ta, mu
; CHECK-NEXT: vfrdiv.vf v8, v8, fa0, v0.t		; CHECK-NEXT: vfrdiv.vf v8, v8, fa0, v0.t
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a2, a2, -4		; CHECK-NEXT: addi a2, a2, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a2, .LBB56_1		; CHECK-NEXT: bnez a2, .LBB56_1
Show All 21 Lines
}		}

declare <4 x float> @llvm.vp.fadd.v4i32(<4 x float>, <4 x float>, <4 x i1>, i32)		declare <4 x float> @llvm.vp.fadd.v4i32(<4 x float>, <4 x float>, <4 x i1>, i32)

define void @sink_splat_vp_fadd(float* nocapture %a, float %x, <4 x i1> %m, i32 zeroext %vl) {		define void @sink_splat_vp_fadd(float* nocapture %a, float %x, <4 x i1> %m, i32 zeroext %vl) {
; CHECK-LABEL: sink_splat_vp_fadd:		; CHECK-LABEL: sink_splat_vp_fadd:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a2, 1024		; CHECK-NEXT: li a2, 1024
		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: .LBB57_1: # %vector.body		; CHECK-NEXT: .LBB57_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsetvli zero, a1, e32, m1, ta, mu		; CHECK-NEXT: vsetvli zero, a1, e32, m1, ta, mu
; CHECK-NEXT: vfadd.vf v8, v8, fa0, v0.t		; CHECK-NEXT: vfadd.vf v8, v8, fa0, v0.t
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a2, a2, -4		; CHECK-NEXT: addi a2, a2, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a2, .LBB57_1		; CHECK-NEXT: bnez a2, .LBB57_1
Show All 21 Lines
}		}

declare <4 x float> @llvm.vp.fsub.v4i32(<4 x float>, <4 x float>, <4 x i1>, i32)		declare <4 x float> @llvm.vp.fsub.v4i32(<4 x float>, <4 x float>, <4 x i1>, i32)

define void @sink_splat_vp_fsub(float* nocapture %a, float %x, <4 x i1> %m, i32 zeroext %vl) {		define void @sink_splat_vp_fsub(float* nocapture %a, float %x, <4 x i1> %m, i32 zeroext %vl) {
; CHECK-LABEL: sink_splat_vp_fsub:		; CHECK-LABEL: sink_splat_vp_fsub:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a2, 1024		; CHECK-NEXT: li a2, 1024
		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: .LBB58_1: # %vector.body		; CHECK-NEXT: .LBB58_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsetvli zero, a1, e32, m1, ta, mu		; CHECK-NEXT: vsetvli zero, a1, e32, m1, ta, mu
; CHECK-NEXT: vfsub.vf v8, v8, fa0, v0.t		; CHECK-NEXT: vfsub.vf v8, v8, fa0, v0.t
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a2, a2, -4		; CHECK-NEXT: addi a2, a2, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a2, .LBB58_1		; CHECK-NEXT: bnez a2, .LBB58_1
Show All 21 Lines
}		}

declare <4 x float> @llvm.vp.frsub.v4i32(<4 x float>, <4 x float>, <4 x i1>, i32)		declare <4 x float> @llvm.vp.frsub.v4i32(<4 x float>, <4 x float>, <4 x i1>, i32)

define void @sink_splat_vp_frsub(float* nocapture %a, float %x, <4 x i1> %m, i32 zeroext %vl) {		define void @sink_splat_vp_frsub(float* nocapture %a, float %x, <4 x i1> %m, i32 zeroext %vl) {
; CHECK-LABEL: sink_splat_vp_frsub:		; CHECK-LABEL: sink_splat_vp_frsub:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a2, 1024		; CHECK-NEXT: li a2, 1024
		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: .LBB59_1: # %vector.body		; CHECK-NEXT: .LBB59_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsetvli zero, a1, e32, m1, ta, mu		; CHECK-NEXT: vsetvli zero, a1, e32, m1, ta, mu
; CHECK-NEXT: vfrsub.vf v8, v8, fa0, v0.t		; CHECK-NEXT: vfrsub.vf v8, v8, fa0, v0.t
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a2, a2, -4		; CHECK-NEXT: addi a2, a2, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a2, .LBB59_1		; CHECK-NEXT: bnez a2, .LBB59_1
Show All 21 Lines
}		}

declare <4 x i32> @llvm.vp.udiv.v4i32(<4 x i32>, <4 x i32>, <4 x i1>, i32)		declare <4 x i32> @llvm.vp.udiv.v4i32(<4 x i32>, <4 x i32>, <4 x i1>, i32)

define void @sink_splat_vp_udiv(i32* nocapture %a, i32 signext %x, <4 x i1> %m, i32 zeroext %vl) {		define void @sink_splat_vp_udiv(i32* nocapture %a, i32 signext %x, <4 x i1> %m, i32 zeroext %vl) {
; CHECK-LABEL: sink_splat_vp_udiv:		; CHECK-LABEL: sink_splat_vp_udiv:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a3, 1024		; CHECK-NEXT: li a3, 1024
		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: .LBB60_1: # %vector.body		; CHECK-NEXT: .LBB60_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsetvli zero, a2, e32, m1, ta, mu		; CHECK-NEXT: vsetvli zero, a2, e32, m1, ta, mu
; CHECK-NEXT: vdivu.vx v8, v8, a1, v0.t		; CHECK-NEXT: vdivu.vx v8, v8, a1, v0.t
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a3, a3, -4		; CHECK-NEXT: addi a3, a3, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a3, .LBB60_1		; CHECK-NEXT: bnez a3, .LBB60_1
Show All 21 Lines
}		}

declare <4 x i32> @llvm.vp.sdiv.v4i32(<4 x i32>, <4 x i32>, <4 x i1>, i32)		declare <4 x i32> @llvm.vp.sdiv.v4i32(<4 x i32>, <4 x i32>, <4 x i1>, i32)

define void @sink_splat_vp_sdiv(i32* nocapture %a, i32 signext %x, <4 x i1> %m, i32 zeroext %vl) {		define void @sink_splat_vp_sdiv(i32* nocapture %a, i32 signext %x, <4 x i1> %m, i32 zeroext %vl) {
; CHECK-LABEL: sink_splat_vp_sdiv:		; CHECK-LABEL: sink_splat_vp_sdiv:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a3, 1024		; CHECK-NEXT: li a3, 1024
		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: .LBB61_1: # %vector.body		; CHECK-NEXT: .LBB61_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsetvli zero, a2, e32, m1, ta, mu		; CHECK-NEXT: vsetvli zero, a2, e32, m1, ta, mu
; CHECK-NEXT: vdiv.vx v8, v8, a1, v0.t		; CHECK-NEXT: vdiv.vx v8, v8, a1, v0.t
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a3, a3, -4		; CHECK-NEXT: addi a3, a3, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a3, .LBB61_1		; CHECK-NEXT: bnez a3, .LBB61_1
Show All 21 Lines
}		}

declare <4 x i32> @llvm.vp.urem.v4i32(<4 x i32>, <4 x i32>, <4 x i1>, i32)		declare <4 x i32> @llvm.vp.urem.v4i32(<4 x i32>, <4 x i32>, <4 x i1>, i32)

define void @sink_splat_vp_urem(i32* nocapture %a, i32 signext %x, <4 x i1> %m, i32 zeroext %vl) {		define void @sink_splat_vp_urem(i32* nocapture %a, i32 signext %x, <4 x i1> %m, i32 zeroext %vl) {
; CHECK-LABEL: sink_splat_vp_urem:		; CHECK-LABEL: sink_splat_vp_urem:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a3, 1024		; CHECK-NEXT: li a3, 1024
		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: .LBB62_1: # %vector.body		; CHECK-NEXT: .LBB62_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsetvli zero, a2, e32, m1, ta, mu		; CHECK-NEXT: vsetvli zero, a2, e32, m1, ta, mu
; CHECK-NEXT: vremu.vx v8, v8, a1, v0.t		; CHECK-NEXT: vremu.vx v8, v8, a1, v0.t
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a3, a3, -4		; CHECK-NEXT: addi a3, a3, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a3, .LBB62_1		; CHECK-NEXT: bnez a3, .LBB62_1
Show All 21 Lines
}		}

declare <4 x i32> @llvm.vp.srem.v4i32(<4 x i32>, <4 x i32>, <4 x i1>, i32)		declare <4 x i32> @llvm.vp.srem.v4i32(<4 x i32>, <4 x i32>, <4 x i1>, i32)

define void @sink_splat_vp_srem(i32* nocapture %a, i32 signext %x, <4 x i1> %m, i32 zeroext %vl) {		define void @sink_splat_vp_srem(i32* nocapture %a, i32 signext %x, <4 x i1> %m, i32 zeroext %vl) {
; CHECK-LABEL: sink_splat_vp_srem:		; CHECK-LABEL: sink_splat_vp_srem:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a3, 1024		; CHECK-NEXT: li a3, 1024
		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: .LBB63_1: # %vector.body		; CHECK-NEXT: .LBB63_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vsetvli zero, a2, e32, m1, ta, mu		; CHECK-NEXT: vsetvli zero, a2, e32, m1, ta, mu
; CHECK-NEXT: vrem.vx v8, v8, a1, v0.t		; CHECK-NEXT: vrem.vx v8, v8, a1, v0.t
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a3, a3, -4		; CHECK-NEXT: addi a3, a3, -4
; CHECK-NEXT: addi a0, a0, 16		; CHECK-NEXT: addi a0, a0, 16
; CHECK-NEXT: bnez a3, .LBB63_1		; CHECK-NEXT: bnez a3, .LBB63_1
▲ Show 20 Lines • Show All 62 Lines • ▼ Show 20 Lines
}		}

declare <4 x float> @llvm.vp.fma.v4f32(<4 x float>, <4 x float>, <4 x float>, <4 x i1>, i32)		declare <4 x float> @llvm.vp.fma.v4f32(<4 x float>, <4 x float>, <4 x float>, <4 x i1>, i32)

define void @sink_splat_vp_fma(float* noalias nocapture %a, float* nocapture readonly %b, float %x, <4 x i1> %m, i32 zeroext %vl) {		define void @sink_splat_vp_fma(float* noalias nocapture %a, float* nocapture readonly %b, float %x, <4 x i1> %m, i32 zeroext %vl) {
; CHECK-LABEL: sink_splat_vp_fma:		; CHECK-LABEL: sink_splat_vp_fma:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a3, 1024		; CHECK-NEXT: li a3, 1024
		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: .LBB65_1: # %vector.body		; CHECK-NEXT: .LBB65_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vle32.v v9, (a1)		; CHECK-NEXT: vle32.v v9, (a1)
; CHECK-NEXT: vsetvli zero, a2, e32, m1, tu, mu		; CHECK-NEXT: vsetvli zero, a2, e32, m1, tu, mu
; CHECK-NEXT: vfmadd.vf v8, fa0, v9, v0.t		; CHECK-NEXT: vfmadd.vf v8, fa0, v9, v0.t
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a3, a3, -4		; CHECK-NEXT: addi a3, a3, -4
; CHECK-NEXT: addi a1, a1, 16		; CHECK-NEXT: addi a1, a1, 16
Show All 24 Lines
for.cond.cleanup: ; preds = %vector.body		for.cond.cleanup: ; preds = %vector.body
ret void		ret void
}		}

define void @sink_splat_vp_fma_commute(float* noalias nocapture %a, float* nocapture readonly %b, float %x, <4 x i1> %m, i32 zeroext %vl) {		define void @sink_splat_vp_fma_commute(float* noalias nocapture %a, float* nocapture readonly %b, float %x, <4 x i1> %m, i32 zeroext %vl) {
; CHECK-LABEL: sink_splat_vp_fma_commute:		; CHECK-LABEL: sink_splat_vp_fma_commute:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: li a3, 1024		; CHECK-NEXT: li a3, 1024
		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: .LBB66_1: # %vector.body		; CHECK-NEXT: .LBB66_1: # %vector.body
; CHECK-NEXT: # =>This Inner Loop Header: Depth=1		; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: vle32.v v8, (a0)		; CHECK-NEXT: vle32.v v8, (a0)
; CHECK-NEXT: vle32.v v9, (a1)		; CHECK-NEXT: vle32.v v9, (a1)
; CHECK-NEXT: vsetvli zero, a2, e32, m1, tu, mu		; CHECK-NEXT: vsetvli zero, a2, e32, m1, tu, mu
; CHECK-NEXT: vfmadd.vf v8, fa0, v9, v0.t		; CHECK-NEXT: vfmadd.vf v8, fa0, v9, v0.t
; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu		; CHECK-NEXT: vsetivli zero, 4, e32, m1, ta, mu
; CHECK-NEXT: vse32.v v8, (a0)		; CHECK-NEXT: vse32.v v8, (a0)
; CHECK-NEXT: addi a3, a3, -4		; CHECK-NEXT: addi a3, a3, -4
; CHECK-NEXT: addi a1, a1, 16		; CHECK-NEXT: addi a1, a1, 16
Show All 27 Lines