Diff 250534

llvm/lib/Target/ARM/MVEVPTBlockPass.cpp

Show All 28 Lines
#include <cassert>		#include <cassert>
#include <new>		#include <new>

using namespace llvm;		using namespace llvm;

#define DEBUG_TYPE "arm-mve-vpt"		#define DEBUG_TYPE "arm-mve-vpt"

namespace {		namespace {
class MVEVPTBlock : public MachineFunctionPass {		class MVEVPTBlock : public MachineFunctionPass {
public:		public:
static char ID;		static char ID;
const Thumb2InstrInfo *TII;		const Thumb2InstrInfo *TII;
const TargetRegisterInfo *TRI;		const TargetRegisterInfo *TRI;

MVEVPTBlock() : MachineFunctionPass(ID) {}		MVEVPTBlock() : MachineFunctionPass(ID) {}

bool runOnMachineFunction(MachineFunction &Fn) override;		bool runOnMachineFunction(MachineFunction &Fn) override;

MachineFunctionProperties getRequiredProperties() const override {		MachineFunctionProperties getRequiredProperties() const override {
return MachineFunctionProperties().set(		return MachineFunctionProperties().set(
MachineFunctionProperties::Property::NoVRegs);		MachineFunctionProperties::Property::NoVRegs);
}		}

StringRef getPassName() const override {		StringRef getPassName() const override {
return "MVE VPT block insertion pass";		return "MVE VPT block insertion pass";
}		}

private:		private:
bool InsertVPTBlocks(MachineBasicBlock &MBB);		bool InsertVPTBlocks(MachineBasicBlock &MBB);
};		};

char MVEVPTBlock::ID = 0;		char MVEVPTBlock::ID = 0;

} // end anonymous namespace		} // end anonymous namespace

INITIALIZE_PASS(MVEVPTBlock, DEBUG_TYPE, "ARM MVE VPT block pass", false, false)		INITIALIZE_PASS(MVEVPTBlock, DEBUG_TYPE, "ARM MVE VPT block pass", false, false)

static MachineInstr *findVCMPToFoldIntoVPST(MachineBasicBlock::iterator MI,		static MachineInstr *findVCMPToFoldIntoVPST(MachineBasicBlock::iterator MI,
const TargetRegisterInfo *TRI,		const TargetRegisterInfo *TRI,
unsigned &NewOpcode) {		unsigned &NewOpcode) {
Show All 20 Lines	if (registerDefinedBetween(CmpMI->getOperand(1).getReg(), std::next(CmpMI),
MI, TRI))		MI, TRI))
return nullptr;		return nullptr;
if (registerDefinedBetween(CmpMI->getOperand(2).getReg(), std::next(CmpMI),		if (registerDefinedBetween(CmpMI->getOperand(2).getReg(), std::next(CmpMI),
MI, TRI))		MI, TRI))
return nullptr;		return nullptr;
return &*CmpMI;		return &*CmpMI;
}		}

		static unsigned ExpandBlockMask(unsigned BlockMask, unsigned Count,
		dmgreenUnsubmitted Done Reply Inline Actions Is this only called with a Count of 1 now? If so, can it be simplified. dmgreen: Is this only called with a Count of 1 now? If so, can it be simplified.
		ARMVCC::VPTCodes Kind) {
		assert(Count != 0 && Kind != ARMVCC::None);
		assert(countTrailingZeros(BlockMask) != 0 && "Mask is already full");

		dmgreenUnsubmitted Done Reply Inline Actions Add a message for the assert. dmgreen: Add a message for the assert.
		auto Done = [&](unsigned AddedThen, unsigned AddedElse) {
		unsigned Mask = (Kind == ARMVCC::Then) ? AddedThen : AddedElse;
		return (Count == 1) ? Mask : ExpandBlockMask(Mask, Count - 1, Kind);
		};

		switch (BlockMask) {
		case ARMVCC::T:
		return Done(ARMVCC::TT, ARMVCC::TE);
		case ARMVCC::TT:
		return Done(ARMVCC::TTT, ARMVCC::TTE);
		case ARMVCC::TE:
		return Done(ARMVCC::TET, ARMVCC::TEE);
		case ARMVCC::TTT:
		return Done(ARMVCC::TTTT, ARMVCC::TTTE);
		case ARMVCC::TTE:
		return Done(ARMVCC::TTET, ARMVCC::TTEE);
		case ARMVCC::TET:
		return Done(ARMVCC::TETT, ARMVCC::TETE);
		case ARMVCC::TEE:
		return Done(ARMVCC::TEET, ARMVCC::TEEE);
		default:
		llvm_unreachable("Unknown Mask");
		}
		}

		// Simply skips a block of predicated instructions.
		// Returns true if this successfully skipped the whole block of predicated
		// instructions. Returns false when it stopped early (due to MaxSkips), or if
		// Iter didn't point to a predicated instruction.
		static bool SkipPredicatedInstrs(MachineBasicBlock::instr_iterator &Iter,
		MachineBasicBlock::instr_iterator EndIter,
		unsigned MaxSkips, unsigned &NumInstSkipped) {
		ARMVCC::VPTCodes NextPred = ARMVCC::None;
		dmgreenUnsubmitted Not Done Reply Inline Actions Maybe name this "AddPredicatedInstruction", as we conceptually "adding" them to the block, as opposed to skipping them. dmgreen: Maybe name this "AddPredicatedInstruction", as we conceptually "adding" them to the block, as…
		Pierre-vhAuthorUnsubmitted Done Reply Inline Actions I named the function "Skip" because it advances the iterator (it skips the predicated instruction in front of the iterator), this function doesn't really "care" about the block as a whole, so for me calling it "AddPredicatedInstructions" doesn't make sense. Pierre-vh: I named the function "Skip" because it advances the iterator (it skips the predicated…
		dmgreenUnsubmitted Done Reply Inline Actions Hmm. "Skip" implied to me that we would not end up doing anything with these instructions. Like we would skip instructions between VPT blocks that are not predicated. We just leave them alone. How about "StepOver" instead? dmgreen: Hmm. "Skip" implied to me that we would not end up doing anything with these instructions. Like…
		Pierre-vhAuthorUnsubmitted Done Reply Inline Actions `StepOverPredicatedInstrs` is good I think. I'll change it. Pierre-vh: `StepOverPredicatedInstrs` is good I think. I'll change it.
		unsigned PredReg;
		NumInstSkipped = 0;

		while (Iter != EndIter) {
		NextPred = getVPTInstrPredicate(*Iter, PredReg);
		assert(NextPred != ARMVCC::Else &&
		"VPT block pass does not expect Else preds");
		if (NextPred == ARMVCC::None \|\| MaxSkips == 0)
		break;
		--MaxSkips;
		++Iter;
		++NumInstSkipped;
		};

		return NumInstSkipped != 0 && (NextPred == ARMVCC::None \|\| Iter == EndIter);
		}

		// Returns true if at least one instruction in the range [Iter, End) defines
		// or kills VPR.
		static bool IsVPRDefinedOrKilledByBlock(MachineBasicBlock::iterator Iter,
		MachineBasicBlock::iterator End) {
		for (; Iter != End; ++Iter)
		if (Iter->definesRegister(ARM::VPR) \|\|
		Iter->findRegisterUseOperandIdx(ARM::VPR, true) != -1)
		return true;
		return false;
		}
		dmgreenUnsubmitted Done Reply Inline Actions Can this use killsRegister? dmgreen: Can this use killsRegister?

		// Given an iterator (Iter) that points at an instruction with a "Then"
		// predicate, tries to create the largest block of continuous predicated
		// instructions possible, and returns the VPT Block Mask of that block.
		//
		// This will try to perform some minor optimization in order to maximize the
		// size of the block.
		static unsigned
		CreateVPTBlock(MachineBasicBlock::instr_iterator &Iter,
		MachineBasicBlock::instr_iterator EndIter,
		SmallVectorImpl<MachineInstr *> &DeadInstructions) {
		MachineBasicBlock::instr_iterator BlockBeg = Iter;
		assert(getVPTInstrPredicate(*Iter) == ARMVCC::Then);

		LLVM_DEBUG(dbgs() << "VPT block created for: "; Iter->dump());

		dmgreenUnsubmitted Done Reply Inline Actions Add a message to the assert. dmgreen: Add a message to the assert.
		unsigned BlockSize;
		SkipPredicatedInstrs(Iter, EndIter, 4, BlockSize);

		LLVM_DEBUG(for (MachineBasicBlock::instr_iterator AddedInstIter =
		std::next(BlockBeg);
		AddedInstIter != Iter; ++AddedInstIter) {
		dbgs() << " adding: ";
		AddedInstIter->dump();
		});

		// Generate the initial BlockMask
		unsigned BlockMask = getARMVPTBlockMask(BlockSize);

		// If we have a block of 4 predicated instructions, we have reached the end
		// iterator, or there's no VPNOT in sight, then we're done.
		if (BlockSize == 4 \|\| Iter == EndIter \|\| Iter->getOpcode() != ARM::MVE_VPNOT)
		return BlockMask;

		// Try to skip all of the predicated instructions after the VPNOT, stopping
		// after (4 - VPTThenInstCnt).
		unsigned ElseInstCnt = 0;
		MachineBasicBlock::instr_iterator VPNOTBlockEndIter = std::next(Iter);
		if (!SkipPredicatedInstrs(VPNOTBlockEndIter, EndIter, (4 - BlockSize),
		ElseInstCnt))
		dmgreenUnsubmitted Done Reply Inline Actions Was VPTThenInstCnt renamed to something else? BlockSize? dmgreen: Was VPTThenInstCnt renamed to something else? BlockSize?
		Pierre-vhAuthorUnsubmitted Done Reply Inline Actions It's indeed "BlockSize" now, I'll change this comment. Pierre-vh: It's indeed "BlockSize" now, I'll change this comment.
		return BlockMask;

		// Check if this VPNOT can be removed or not: It can only be removed if at
		// least one of the predicated instruction that follows it kills or sets
		// VPR.
		if (!IsVPRDefinedOrKilledByBlock(Iter, VPNOTBlockEndIter))
		return BlockMask;

		LLVM_DEBUG(dbgs() << " removing VPNOT: "; Iter->dump(););

		// Record the VPNot to remove it later.
		DeadInstructions.push_back(&*Iter);
		++Iter;

		// Replace "then" by "elses" in the block until we find an instruction that
		// defines VPR, then after that leave everything to "t".
		// Note that we are using "Iter" to iterate over the block so we can update it
		// at the same time.
		bool ChangeToElse = true;
		for (; Iter != VPNOTBlockEndIter; ++Iter) {
		// Find the register in which the predicate is
		int OpIdx = findFirstVPTPredOperandIdx(*Iter);
		assert(OpIdx != -1);

		// Update the mask + change the predicate to an else if needed.
		if (ChangeToElse) {
		// Change the predicate and update the mask
		Iter->getOperand(OpIdx).setImm(ARMVCC::Else);
		BlockMask = ExpandBlockMask(BlockMask, 1, ARMVCC::Else);
		dmgreenUnsubmitted Not Done Reply Inline Actions Find the register -> Find the operand holding the predicate dmgreen: Find the register -> Find the operand holding the predicate
		// Reset back to a "then" predicate if this instruction defines VPR.
		if (Iter->definesRegister(ARM::VPR))
		ChangeToElse = false;
		} else
		BlockMask = ExpandBlockMask(BlockMask, 1, ARMVCC::Then);

		LLVM_DEBUG(dbgs() << " adding: "; Iter->dump());
		}

		return BlockMask;
		}

bool MVEVPTBlock::InsertVPTBlocks(MachineBasicBlock &Block) {		bool MVEVPTBlock::InsertVPTBlocks(MachineBasicBlock &Block) {
bool Modified = false;		bool Modified = false;
MachineBasicBlock::instr_iterator MBIter = Block.instr_begin();		MachineBasicBlock::instr_iterator MBIter = Block.instr_begin();
MachineBasicBlock::instr_iterator EndIter = Block.instr_end();		MachineBasicBlock::instr_iterator EndIter = Block.instr_end();

		SmallVector<MachineInstr *, 4> DeadInstructions;

while (MBIter != EndIter) {		while (MBIter != EndIter) {
MachineInstr MI = &MBIter;		MachineInstr MI = &MBIter;
		dmgreenUnsubmitted Done Reply Inline Actions Maybe just use: CurrentPredicate = CurrentPredicate == ARMVCC::Then ? ARMVCC::Else : ARMVCC::Then; dmgreen: Maybe just use: CurrentPredicate = CurrentPredicate == ARMVCC::Then ? ARMVCC::Else : ARMVCC…
unsigned PredReg = 0;		unsigned PredReg = 0;
DebugLoc dl = MI->getDebugLoc();		DebugLoc DL = MI->getDebugLoc();

ARMVCC::VPTCodes Pred = getVPTInstrPredicate(*MI, PredReg);		ARMVCC::VPTCodes Pred = getVPTInstrPredicate(*MI, PredReg);

// The idea of the predicate is that None, Then and Else are for use when		// The idea of the predicate is that None, Then and Else are for use when
// handling assembly language: they correspond to the three possible		// handling assembly language: they correspond to the three possible
// suffixes "", "t" and "e" on the mnemonic. So when instructions are read		// suffixes "", "t" and "e" on the mnemonic. So when instructions are read
// from assembly source or disassembled from object code, you expect to see		// from assembly source or disassembled from object code, you expect to
// a mixture whenever there's a long VPT block. But in code generation, we		// see a mixture whenever there's a long VPT block. But in code
// hope we'll never generate an Else as input to this pass.		// generation, we hope we'll never generate an Else as input to this pass.
assert(Pred != ARMVCC::Else && "VPT block pass does not expect Else preds");		assert(Pred != ARMVCC::Else && "VPT block pass does not expect Else preds");
		dmgreenUnsubmitted Done Reply Inline Actions This doesn't look like it needed to change? Unless the line after is too long too? dmgreen: This doesn't look like it needed to change? Unless the line after is too long too?
		Pierre-vhAuthorUnsubmitted Done Reply Inline Actions You are right, it doesn't need to change. It was probably changed by mistake by me or clang-format. Pierre-vh: You are right, it doesn't need to change. It was probably changed by mistake by me or clang…

if (Pred == ARMVCC::None) {		if (Pred == ARMVCC::None) {
++MBIter;		++MBIter;
continue;		continue;
}		}

LLVM_DEBUG(dbgs() << "VPT block created for: "; MI->dump());		unsigned BlockMask = CreateVPTBlock(MBIter, EndIter, DeadInstructions);
int VPTInstCnt = 1;
ARMVCC::VPTCodes NextPred;

		dmgreenUnsubmitted Not Done Reply Inline Actions Why use a uint64_t? dmgreen: Why use a uint64_t?
		Pierre-vhAuthorUnsubmitted Done Reply Inline Actions It's the type of the argument of `addImm` below. Of course I can also use `unsigned` if you prefer, or I can change this to `ARM::PredBlockMask` and convert to `uint64_t` when calling `addImm`. Pierre-vh: It's the type of the argument of `addImm` below. Of course I can also use `unsigned` if you…
		dmgreenUnsubmitted Done Reply Inline Actions unsigned is probably fine, it will fit in either case. If the printing is still simple, PredBlockMask would probably be best. Up to you. dmgreen: unsigned is probably fine, it will fit in either case. If the printing is still simple…
		Pierre-vhAuthorUnsubmitted Done Reply Inline Actions I'll do something like this then: ARM::PredBlockMask BlockMask = CreateVPTBlock(MBIter, EndIter, DeadInstructions); // ... MIBuilder.addImm((uint64_t)BlockMask); // ... MIBuilder.addImm((uint64_t)BlockMask); Pierre-vh: I'll do something like this then: ``` ARM::PredBlockMask BlockMask = CreateVPTBlock(MBIter…
// Look at subsequent instructions, checking if they can be in the same VPT		// Search back for a VCMP that can be folded to create a VPT, or else
// block.		// create a VPST directly
++MBIter;
while (MBIter != EndIter && VPTInstCnt < 4) {
NextPred = getVPTInstrPredicate(*MBIter, PredReg);
assert(NextPred != ARMVCC::Else &&
"VPT block pass does not expect Else preds");
if (NextPred != Pred)
break;
LLVM_DEBUG(dbgs() << " adding : "; MBIter->dump());
++VPTInstCnt;
++MBIter;
};

unsigned BlockMask = getARMVPTBlockMask(VPTInstCnt);

// Search back for a VCMP that can be folded to create a VPT, or else create
// a VPST directly
MachineInstrBuilder MIBuilder;		MachineInstrBuilder MIBuilder;
unsigned NewOpcode;		unsigned NewOpcode;
MachineInstr *VCMP = findVCMPToFoldIntoVPST(MI, TRI, NewOpcode);		LLVM_DEBUG(dbgs() << " final block mask: " << BlockMask << "\n");
if (VCMP) {		if (MachineInstr *VCMP = findVCMPToFoldIntoVPST(MI, TRI, NewOpcode)) {
LLVM_DEBUG(dbgs() << " folding VCMP into VPST: "; VCMP->dump());		LLVM_DEBUG(dbgs() << " folding VCMP into VPST: "; VCMP->dump());
MIBuilder = BuildMI(Block, MI, dl, TII->get(NewOpcode));		MIBuilder = BuildMI(Block, MI, DL, TII->get(NewOpcode));
MIBuilder.addImm(BlockMask);		MIBuilder.addImm(BlockMask);
MIBuilder.add(VCMP->getOperand(1));		MIBuilder.add(VCMP->getOperand(1));
MIBuilder.add(VCMP->getOperand(2));		MIBuilder.add(VCMP->getOperand(2));
MIBuilder.add(VCMP->getOperand(3));		MIBuilder.add(VCMP->getOperand(3));
VCMP->eraseFromParent();		VCMP->eraseFromParent();
} else {		} else {
MIBuilder = BuildMI(Block, MI, dl, TII->get(ARM::MVE_VPST));		MIBuilder = BuildMI(Block, MI, DL, TII->get(ARM::MVE_VPST));
MIBuilder.addImm(BlockMask);		MIBuilder.addImm(BlockMask);
}		}

finalizeBundle(		finalizeBundle(
Block, MachineBasicBlock::instr_iterator(MIBuilder.getInstr()), MBIter);		Block, MachineBasicBlock::instr_iterator(MIBuilder.getInstr()), MBIter);

Modified = true;		Modified = true;
}		}

		// Erase all dead instructions
		for (MachineInstr *DeadMI : DeadInstructions) {
		if (DeadMI->isInsideBundle())
		DeadMI->eraseFromBundle();
		else
		DeadMI->eraseFromParent();
		}

return Modified;		return Modified;
}		}

bool MVEVPTBlock::runOnMachineFunction(MachineFunction &Fn) {		bool MVEVPTBlock::runOnMachineFunction(MachineFunction &Fn) {
const ARMSubtarget &STI =		const ARMSubtarget &STI =
static_cast<const ARMSubtarget &>(Fn.getSubtarget());		static_cast<const ARMSubtarget &>(Fn.getSubtarget());

if (!STI.isThumb2() \|\| !STI.hasMVEIntegerOps())		if (!STI.isThumb2() \|\| !STI.hasMVEIntegerOps())
return false;		return false;

TII = static_cast<const Thumb2InstrInfo *>(STI.getInstrInfo());		TII = static_cast<const Thumb2InstrInfo *>(STI.getInstrInfo());
TRI = STI.getRegisterInfo();		TRI = STI.getRegisterInfo();

LLVM_DEBUG(dbgs() << "******** ARM MVE VPT BLOCKS ********\n"		LLVM_DEBUG(dbgs() << "******** ARM MVE VPT BLOCKS ********\n"
<< "********** Function: " << Fn.getName() << '\n');		<< "********** Function: " << Fn.getName() << '\n');

		Pierre-vhAuthorUnsubmitted Done Reply Inline Actions This shouldn't be here and has been fixed locally. However, I won't send a new diff just for a single line, so I'll push it when I have more meaningful changes to accompany it. Pierre-vh: This shouldn't be here and has been fixed locally. However, I won't send a new diff just for a…
bool Modified = false;		bool Modified = false;
for (MachineBasicBlock &MBB : Fn)		for (MachineBasicBlock &MBB : Fn)
Modified \|= InsertVPTBlocks(MBB);		Modified \|= InsertVPTBlocks(MBB);

LLVM_DEBUG(dbgs() << "**************************************\n");		LLVM_DEBUG(dbgs() << "**************************************\n");
return Modified;		return Modified;
}		}

/// createMVEVPTBlock - Returns an instance of the MVE VPT block		/// createMVEVPTBlock - Returns an instance of the MVE VPT block
/// insertion pass.		/// insertion pass.
FunctionPass *llvm::createMVEVPTBlockPass() { return new MVEVPTBlock(); }		FunctionPass *llvm::createMVEVPTBlockPass() { return new MVEVPTBlock(); }

llvm/lib/Target/ARM/Thumb2InstrInfo.h

	Show First 20 Lines • Show All 68 Lines • ▼ Show 20 Lines
	/// instructions which are "predicated", but are not in IT blocks.			/// instructions which are "predicated", but are not in IT blocks.
	ARMCC::CondCodes getITInstrPredicate(const MachineInstr &MI, unsigned &PredReg);			ARMCC::CondCodes getITInstrPredicate(const MachineInstr &MI, unsigned &PredReg);

	// getVPTInstrPredicate: VPT analogue of that, plus a helper function			// getVPTInstrPredicate: VPT analogue of that, plus a helper function
	// corresponding to MachineInstr::findFirstPredOperandIdx.			// corresponding to MachineInstr::findFirstPredOperandIdx.
	int findFirstVPTPredOperandIdx(const MachineInstr &MI);			int findFirstVPTPredOperandIdx(const MachineInstr &MI);
	ARMVCC::VPTCodes getVPTInstrPredicate(const MachineInstr &MI,			ARMVCC::VPTCodes getVPTInstrPredicate(const MachineInstr &MI,
	unsigned &PredReg);			unsigned &PredReg);
				inline ARMVCC::VPTCodes getVPTInstrPredicate(const MachineInstr &MI) {
				unsigned PredReg;
				return getVPTInstrPredicate(MI, PredReg);
	}			}
				} // namespace llvm

	#endif			#endif

llvm/test/CodeGen/Thumb2/mve-pred-not.ll

Show First 20 Lines • Show All 377 Lines • ▼ Show 20 Lines	entry:
%o = xor <2 x i1> %c1, <i1 -1, i1 -1>		%o = xor <2 x i1> %c1, <i1 -1, i1 -1>
%s = select <2 x i1> %o, <2 x i64> %a, <2 x i64> %b		%s = select <2 x i1> %o, <2 x i64> %a, <2 x i64> %b
ret <2 x i64> %s		ret <2 x i64> %s
}		}

define arm_aapcs_vfpcc <4 x i32> @vpnot_v4i1(<4 x i32> %a, <4 x i32> %b, <4 x i32> %c) {		define arm_aapcs_vfpcc <4 x i32> @vpnot_v4i1(<4 x i32> %a, <4 x i32> %b, <4 x i32> %c) {
; CHECK-LABEL: vpnot_v4i1:		; CHECK-LABEL: vpnot_v4i1:
; CHECK: @ %bb.0: @ %entry		; CHECK: @ %bb.0: @ %entry
; CHECK-NEXT: vpt.s32 lt, q0, zr		; CHECK-NEXT: vpte.s32 lt, q0, zr
; CHECK-NEXT: vcmpt.s32 gt, q1, zr		; CHECK-NEXT: vcmpt.s32 gt, q1, zr
; CHECK-NEXT: vpnot		; CHECK-NEXT: vcmpe.i32 eq, q2, zr
; CHECK-NEXT: vpst
; CHECK-NEXT: vcmpt.i32 eq, q2, zr
; CHECK-NEXT: vpsel q0, q0, q1		; CHECK-NEXT: vpsel q0, q0, q1
; CHECK-NEXT: bx lr		; CHECK-NEXT: bx lr
entry:		entry:
%c1 = icmp slt <4 x i32> %a, zeroinitializer		%c1 = icmp slt <4 x i32> %a, zeroinitializer
%c2 = icmp sgt <4 x i32> %b, zeroinitializer		%c2 = icmp sgt <4 x i32> %b, zeroinitializer
%c3 = icmp eq <4 x i32> %c, zeroinitializer		%c3 = icmp eq <4 x i32> %c, zeroinitializer
%o1 = and <4 x i1> %c1, %c2		%o1 = and <4 x i1> %c1, %c2
%o2 = xor <4 x i1> %o1, <i1 -1, i1 -1, i1 -1, i1 -1>		%o2 = xor <4 x i1> %o1, <i1 -1, i1 -1, i1 -1, i1 -1>
%o = and <4 x i1> %c3, %o2		%o = and <4 x i1> %c3, %o2
%s = select <4 x i1> %o, <4 x i32> %a, <4 x i32> %b		%s = select <4 x i1> %o, <4 x i32> %a, <4 x i32> %b
ret <4 x i32> %s		ret <4 x i32> %s
}		}

llvm/test/CodeGen/Thumb2/mve-pred-threshold.ll

	Show All 13 Lines
	; CHECK-NEXT: movs r3, #1			; CHECK-NEXT: movs r3, #1
	; CHECK-NEXT: vmov.i32 q0, #0x0			; CHECK-NEXT: vmov.i32 q0, #0x0
	; CHECK-NEXT: add.w lr, r3, r1, lsr #2			; CHECK-NEXT: add.w lr, r3, r1, lsr #2
	; CHECK-NEXT: rsbs r1, r2, #0			; CHECK-NEXT: rsbs r1, r2, #0
	; CHECK-NEXT: dls lr, lr			; CHECK-NEXT: dls lr, lr
	; CHECK-NEXT: .LBB0_1: @ %vector.body			; CHECK-NEXT: .LBB0_1: @ %vector.body
	; CHECK-NEXT: @ =>This Inner Loop Header: Depth=1			; CHECK-NEXT: @ =>This Inner Loop Header: Depth=1
	; CHECK-NEXT: vldrw.u32 q1, [r0]			; CHECK-NEXT: vldrw.u32 q1, [r0]
	; CHECK-NEXT: vpt.s32 ge, q1, r2			; CHECK-NEXT: vpte.s32 ge, q1, r2
	; CHECK-NEXT: vcmpt.s32 le, q1, r1			; CHECK-NEXT: vcmpt.s32 le, q1, r1
	; CHECK-NEXT: vpnot			; CHECK-NEXT: vstrwe.32 q0, [r0], #16
	; CHECK-NEXT: vpst
	; CHECK-NEXT: vstrwt.32 q0, [r0], #16
	; CHECK-NEXT: le lr, .LBB0_1			; CHECK-NEXT: le lr, .LBB0_1
	; CHECK-NEXT: @ %bb.2: @ %for.cond.cleanup			; CHECK-NEXT: @ %bb.2: @ %for.cond.cleanup
	; CHECK-NEXT: pop {r7, pc}			; CHECK-NEXT: pop {r7, pc}
	entry:			entry:
	%conv = zext i16 %N to i32			%conv = zext i16 %N to i32
	%mul = shl nuw nsw i32 %conv, 2			%mul = shl nuw nsw i32 %conv, 2
	%cmp15 = icmp eq i16 %N, 0			%cmp15 = icmp eq i16 %N, 0
	br i1 %cmp15, label %for.cond.cleanup, label %vector.ph			br i1 %cmp15, label %for.cond.cleanup, label %vector.ph
	Show All 37 Lines
	; CHECK-NEXT: movs r3, #1			; CHECK-NEXT: movs r3, #1
	; CHECK-NEXT: vmov.i32 q0, #0x0			; CHECK-NEXT: vmov.i32 q0, #0x0
	; CHECK-NEXT: add.w lr, r3, r1, lsr #3			; CHECK-NEXT: add.w lr, r3, r1, lsr #3
	; CHECK-NEXT: rsbs r1, r2, #0			; CHECK-NEXT: rsbs r1, r2, #0
	; CHECK-NEXT: dls lr, lr			; CHECK-NEXT: dls lr, lr
	; CHECK-NEXT: .LBB1_1: @ %vector.body			; CHECK-NEXT: .LBB1_1: @ %vector.body
	; CHECK-NEXT: @ =>This Inner Loop Header: Depth=1			; CHECK-NEXT: @ =>This Inner Loop Header: Depth=1
	; CHECK-NEXT: vldrh.u16 q1, [r0]			; CHECK-NEXT: vldrh.u16 q1, [r0]
	; CHECK-NEXT: vpt.s16 ge, q1, r2			; CHECK-NEXT: vpte.s16 ge, q1, r2
	; CHECK-NEXT: vcmpt.s16 le, q1, r1			; CHECK-NEXT: vcmpt.s16 le, q1, r1
	; CHECK-NEXT: vpnot			; CHECK-NEXT: vstrhe.16 q0, [r0], #16
	; CHECK-NEXT: vpst
	; CHECK-NEXT: vstrht.16 q0, [r0], #16
	; CHECK-NEXT: le lr, .LBB1_1			; CHECK-NEXT: le lr, .LBB1_1
	; CHECK-NEXT: @ %bb.2: @ %for.cond.cleanup			; CHECK-NEXT: @ %bb.2: @ %for.cond.cleanup
	; CHECK-NEXT: pop {r7, pc}			; CHECK-NEXT: pop {r7, pc}
	entry:			entry:
	%conv2 = zext i16 %N to i32			%conv2 = zext i16 %N to i32
	%mul = shl nuw nsw i32 %conv2, 3			%mul = shl nuw nsw i32 %conv2, 3
	%cmp22 = icmp eq i16 %N, 0			%cmp22 = icmp eq i16 %N, 0
	br i1 %cmp22, label %for.cond.cleanup, label %vector.ph			br i1 %cmp22, label %for.cond.cleanup, label %vector.ph
	Show All 37 Lines
	; CHECK-NEXT: movs r3, #1			; CHECK-NEXT: movs r3, #1
	; CHECK-NEXT: vmov.i32 q0, #0x0			; CHECK-NEXT: vmov.i32 q0, #0x0
	; CHECK-NEXT: add.w lr, r3, r1, lsr #4			; CHECK-NEXT: add.w lr, r3, r1, lsr #4
	; CHECK-NEXT: rsbs r1, r2, #0			; CHECK-NEXT: rsbs r1, r2, #0
	; CHECK-NEXT: dls lr, lr			; CHECK-NEXT: dls lr, lr
	; CHECK-NEXT: .LBB2_1: @ %vector.body			; CHECK-NEXT: .LBB2_1: @ %vector.body
	; CHECK-NEXT: @ =>This Inner Loop Header: Depth=1			; CHECK-NEXT: @ =>This Inner Loop Header: Depth=1
	; CHECK-NEXT: vldrb.u8 q1, [r0]			; CHECK-NEXT: vldrb.u8 q1, [r0]
	; CHECK-NEXT: vpt.s8 ge, q1, r2			; CHECK-NEXT: vpte.s8 ge, q1, r2
	; CHECK-NEXT: vcmpt.s8 le, q1, r1			; CHECK-NEXT: vcmpt.s8 le, q1, r1
	; CHECK-NEXT: vpnot			; CHECK-NEXT: vstrbe.8 q0, [r0], #16
	; CHECK-NEXT: vpst
	; CHECK-NEXT: vstrbt.8 q0, [r0], #16
	; CHECK-NEXT: le lr, .LBB2_1			; CHECK-NEXT: le lr, .LBB2_1
	; CHECK-NEXT: @ %bb.2: @ %for.cond.cleanup			; CHECK-NEXT: @ %bb.2: @ %for.cond.cleanup
	; CHECK-NEXT: pop {r7, pc}			; CHECK-NEXT: pop {r7, pc}
	entry:			entry:
	%conv2 = zext i16 %N to i32			%conv2 = zext i16 %N to i32
	%mul = shl nuw nsw i32 %conv2, 4			%mul = shl nuw nsw i32 %conv2, 4
	%cmp20 = icmp eq i16 %N, 0			%cmp20 = icmp eq i16 %N, 0
	br i1 %cmp20, label %for.cond.cleanup, label %vector.ph			br i1 %cmp20, label %for.cond.cleanup, label %vector.ph
	▲ Show 20 Lines • Show All 41 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: vmov r1, s0			; CHECK-NEXT: vmov r1, s0
	; CHECK-NEXT: vdup.32 q0, r1			; CHECK-NEXT: vdup.32 q0, r1
	; CHECK-NEXT: dls lr, lr			; CHECK-NEXT: dls lr, lr
	; CHECK-NEXT: vmov r1, s4			; CHECK-NEXT: vmov r1, s4
	; CHECK-NEXT: vdup.32 q1, r1			; CHECK-NEXT: vdup.32 q1, r1
	; CHECK-NEXT: .LBB3_1: @ %vector.body			; CHECK-NEXT: .LBB3_1: @ %vector.body
	; CHECK-NEXT: @ =>This Inner Loop Header: Depth=1			; CHECK-NEXT: @ =>This Inner Loop Header: Depth=1
	; CHECK-NEXT: vldrw.u32 q3, [r0]			; CHECK-NEXT: vldrw.u32 q3, [r0]
	; CHECK-NEXT: vpt.f32 le, q0, q3			; CHECK-NEXT: vpte.f32 le, q0, q3
	; CHECK-NEXT: vcmpt.f32 le, q3, q1			; CHECK-NEXT: vcmpt.f32 le, q3, q1
	; CHECK-NEXT: vpnot			; CHECK-NEXT: vstrwe.32 q2, [r0], #16
	; CHECK-NEXT: vpst
	; CHECK-NEXT: vstrwt.32 q2, [r0], #16
	; CHECK-NEXT: le lr, .LBB3_1			; CHECK-NEXT: le lr, .LBB3_1
	; CHECK-NEXT: @ %bb.2: @ %for.cond.cleanup			; CHECK-NEXT: @ %bb.2: @ %for.cond.cleanup
	; CHECK-NEXT: pop {r7, pc}			; CHECK-NEXT: pop {r7, pc}
	entry:			entry:
	%conv = zext i16 %N to i32			%conv = zext i16 %N to i32
	%mul = shl nuw nsw i32 %conv, 2			%mul = shl nuw nsw i32 %conv, 2
	%cmp15 = icmp eq i16 %N, 0			%cmp15 = icmp eq i16 %N, 0
	br i1 %cmp15, label %for.cond.cleanup, label %vector.ph			br i1 %cmp15, label %for.cond.cleanup, label %vector.ph
	▲ Show 20 Lines • Show All 41 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: vneg.f16 s0, s0			; CHECK-NEXT: vneg.f16 s0, s0
	; CHECK-NEXT: vdup.16 q1, r1			; CHECK-NEXT: vdup.16 q1, r1
	; CHECK-NEXT: vmov r2, s0			; CHECK-NEXT: vmov r2, s0
	; CHECK-NEXT: dls lr, lr			; CHECK-NEXT: dls lr, lr
	; CHECK-NEXT: vdup.16 q0, r2			; CHECK-NEXT: vdup.16 q0, r2
	; CHECK-NEXT: .LBB4_1: @ %vector.body			; CHECK-NEXT: .LBB4_1: @ %vector.body
	; CHECK-NEXT: @ =>This Inner Loop Header: Depth=1			; CHECK-NEXT: @ =>This Inner Loop Header: Depth=1
	; CHECK-NEXT: vldrh.u16 q3, [r0]			; CHECK-NEXT: vldrh.u16 q3, [r0]
	; CHECK-NEXT: vpt.f16 le, q1, q3			; CHECK-NEXT: vpte.f16 le, q1, q3
	; CHECK-NEXT: vcmpt.f16 le, q3, q0			; CHECK-NEXT: vcmpt.f16 le, q3, q0
	; CHECK-NEXT: vpnot			; CHECK-NEXT: vstrhe.16 q2, [r0], #16
	; CHECK-NEXT: vpst
	; CHECK-NEXT: vstrht.16 q2, [r0], #16
	; CHECK-NEXT: le lr, .LBB4_1			; CHECK-NEXT: le lr, .LBB4_1
	; CHECK-NEXT: @ %bb.2: @ %for.cond.cleanup			; CHECK-NEXT: @ %bb.2: @ %for.cond.cleanup
	; CHECK-NEXT: pop {r7, pc}			; CHECK-NEXT: pop {r7, pc}
	entry:			entry:
	%0 = bitcast float %T.coerce to i32			%0 = bitcast float %T.coerce to i32
	%tmp.0.extract.trunc = trunc i32 %0 to i16			%tmp.0.extract.trunc = trunc i32 %0 to i16
	%1 = bitcast i16 %tmp.0.extract.trunc to half			%1 = bitcast i16 %tmp.0.extract.trunc to half
	%conv = zext i16 %N to i32			%conv = zext i16 %N to i32
	▲ Show 20 Lines • Show All 42 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: movs r3, #1			; CHECK-NEXT: movs r3, #1
	; CHECK-NEXT: vmov.i32 q0, #0x0			; CHECK-NEXT: vmov.i32 q0, #0x0
	; CHECK-NEXT: add.w lr, r3, r1, lsr #2			; CHECK-NEXT: add.w lr, r3, r1, lsr #2
	; CHECK-NEXT: rsbs r1, r2, #0			; CHECK-NEXT: rsbs r1, r2, #0
	; CHECK-NEXT: dls lr, lr			; CHECK-NEXT: dls lr, lr
	; CHECK-NEXT: .LBB5_1: @ %vector.body			; CHECK-NEXT: .LBB5_1: @ %vector.body
	; CHECK-NEXT: @ =>This Inner Loop Header: Depth=1			; CHECK-NEXT: @ =>This Inner Loop Header: Depth=1
	; CHECK-NEXT: vldrw.u32 q1, [r0]			; CHECK-NEXT: vldrw.u32 q1, [r0]
	; CHECK-NEXT: vpt.s32 ge, q1, r2			; CHECK-NEXT: vpte.s32 ge, q1, r2
	; CHECK-NEXT: vcmpt.s32 le, q1, r1			; CHECK-NEXT: vcmpt.s32 le, q1, r1
	; CHECK-NEXT: vpnot			; CHECK-NEXT: vstrwe.32 q0, [r0], #16
	; CHECK-NEXT: vpst
	; CHECK-NEXT: vstrwt.32 q0, [r0], #16
	; CHECK-NEXT: le lr, .LBB5_1			; CHECK-NEXT: le lr, .LBB5_1
	; CHECK-NEXT: @ %bb.2: @ %for.cond.cleanup			; CHECK-NEXT: @ %bb.2: @ %for.cond.cleanup
	; CHECK-NEXT: pop {r7, pc}			; CHECK-NEXT: pop {r7, pc}
	entry:			entry:
	%conv = zext i16 %N to i32			%conv = zext i16 %N to i32
	%mul = shl nuw nsw i32 %conv, 2			%mul = shl nuw nsw i32 %conv, 2
	%cmp15 = icmp eq i16 %N, 0			%cmp15 = icmp eq i16 %N, 0
	br i1 %cmp15, label %for.cond.cleanup, label %vector.ph			br i1 %cmp15, label %for.cond.cleanup, label %vector.ph
	Show All 37 Lines
	; CHECK-NEXT: movs r3, #1			; CHECK-NEXT: movs r3, #1
	; CHECK-NEXT: vmov.i32 q0, #0x0			; CHECK-NEXT: vmov.i32 q0, #0x0
	; CHECK-NEXT: add.w lr, r3, r1, lsr #3			; CHECK-NEXT: add.w lr, r3, r1, lsr #3
	; CHECK-NEXT: rsbs r1, r2, #0			; CHECK-NEXT: rsbs r1, r2, #0
	; CHECK-NEXT: dls lr, lr			; CHECK-NEXT: dls lr, lr
	; CHECK-NEXT: .LBB6_1: @ %vector.body			; CHECK-NEXT: .LBB6_1: @ %vector.body
	; CHECK-NEXT: @ =>This Inner Loop Header: Depth=1			; CHECK-NEXT: @ =>This Inner Loop Header: Depth=1
	; CHECK-NEXT: vldrh.u16 q1, [r0]			; CHECK-NEXT: vldrh.u16 q1, [r0]
	; CHECK-NEXT: vpt.s16 ge, q1, r2			; CHECK-NEXT: vpte.s16 ge, q1, r2
	; CHECK-NEXT: vcmpt.s16 le, q1, r1			; CHECK-NEXT: vcmpt.s16 le, q1, r1
	; CHECK-NEXT: vpnot			; CHECK-NEXT: vstrhe.16 q0, [r0], #16
	; CHECK-NEXT: vpst
	; CHECK-NEXT: vstrht.16 q0, [r0], #16
	; CHECK-NEXT: le lr, .LBB6_1			; CHECK-NEXT: le lr, .LBB6_1
	; CHECK-NEXT: @ %bb.2: @ %for.cond.cleanup			; CHECK-NEXT: @ %bb.2: @ %for.cond.cleanup
	; CHECK-NEXT: pop {r7, pc}			; CHECK-NEXT: pop {r7, pc}
	entry:			entry:
	%conv2 = zext i16 %N to i32			%conv2 = zext i16 %N to i32
	%mul = shl nuw nsw i32 %conv2, 3			%mul = shl nuw nsw i32 %conv2, 3
	%cmp22 = icmp eq i16 %N, 0			%cmp22 = icmp eq i16 %N, 0
	br i1 %cmp22, label %for.cond.cleanup, label %vector.ph			br i1 %cmp22, label %for.cond.cleanup, label %vector.ph
	Show All 37 Lines
	; CHECK-NEXT: movs r3, #1			; CHECK-NEXT: movs r3, #1
	; CHECK-NEXT: vmov.i32 q0, #0x0			; CHECK-NEXT: vmov.i32 q0, #0x0
	; CHECK-NEXT: add.w lr, r3, r1, lsr #4			; CHECK-NEXT: add.w lr, r3, r1, lsr #4
	; CHECK-NEXT: rsbs r1, r2, #0			; CHECK-NEXT: rsbs r1, r2, #0
	; CHECK-NEXT: dls lr, lr			; CHECK-NEXT: dls lr, lr
	; CHECK-NEXT: .LBB7_1: @ %vector.body			; CHECK-NEXT: .LBB7_1: @ %vector.body
	; CHECK-NEXT: @ =>This Inner Loop Header: Depth=1			; CHECK-NEXT: @ =>This Inner Loop Header: Depth=1
	; CHECK-NEXT: vldrb.u8 q1, [r0]			; CHECK-NEXT: vldrb.u8 q1, [r0]
	; CHECK-NEXT: vpt.s8 ge, q1, r2			; CHECK-NEXT: vpte.s8 ge, q1, r2
	; CHECK-NEXT: vcmpt.s8 le, q1, r1			; CHECK-NEXT: vcmpt.s8 le, q1, r1
	; CHECK-NEXT: vpnot			; CHECK-NEXT: vstrbe.8 q0, [r0], #16
	; CHECK-NEXT: vpst
	; CHECK-NEXT: vstrbt.8 q0, [r0], #16
	; CHECK-NEXT: le lr, .LBB7_1			; CHECK-NEXT: le lr, .LBB7_1
	; CHECK-NEXT: @ %bb.2: @ %for.cond.cleanup			; CHECK-NEXT: @ %bb.2: @ %for.cond.cleanup
	; CHECK-NEXT: pop {r7, pc}			; CHECK-NEXT: pop {r7, pc}
	entry:			entry:
	%conv2 = zext i16 %N to i32			%conv2 = zext i16 %N to i32
	%mul = shl nuw nsw i32 %conv2, 4			%mul = shl nuw nsw i32 %conv2, 4
	%cmp20 = icmp eq i16 %N, 0			%cmp20 = icmp eq i16 %N, 0
	br i1 %cmp20, label %for.cond.cleanup, label %vector.ph			br i1 %cmp20, label %for.cond.cleanup, label %vector.ph
	▲ Show 20 Lines • Show All 41 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: vmov r1, s0			; CHECK-NEXT: vmov r1, s0
	; CHECK-NEXT: vdup.32 q0, r1			; CHECK-NEXT: vdup.32 q0, r1
	; CHECK-NEXT: dls lr, lr			; CHECK-NEXT: dls lr, lr
	; CHECK-NEXT: vmov r1, s4			; CHECK-NEXT: vmov r1, s4
	; CHECK-NEXT: vdup.32 q1, r1			; CHECK-NEXT: vdup.32 q1, r1
	; CHECK-NEXT: .LBB8_1: @ %vector.body			; CHECK-NEXT: .LBB8_1: @ %vector.body
	; CHECK-NEXT: @ =>This Inner Loop Header: Depth=1			; CHECK-NEXT: @ =>This Inner Loop Header: Depth=1
	; CHECK-NEXT: vldrw.u32 q3, [r0]			; CHECK-NEXT: vldrw.u32 q3, [r0]
	; CHECK-NEXT: vpt.f32 le, q0, q3			; CHECK-NEXT: vpte.f32 le, q0, q3
	; CHECK-NEXT: vcmpt.f32 le, q3, q1			; CHECK-NEXT: vcmpt.f32 le, q3, q1
	; CHECK-NEXT: vpnot			; CHECK-NEXT: vstrwe.32 q2, [r0], #16
	; CHECK-NEXT: vpst
	; CHECK-NEXT: vstrwt.32 q2, [r0], #16
	; CHECK-NEXT: le lr, .LBB8_1			; CHECK-NEXT: le lr, .LBB8_1
	; CHECK-NEXT: @ %bb.2: @ %for.cond.cleanup			; CHECK-NEXT: @ %bb.2: @ %for.cond.cleanup
	; CHECK-NEXT: pop {r7, pc}			; CHECK-NEXT: pop {r7, pc}
	entry:			entry:
	%conv = zext i16 %N to i32			%conv = zext i16 %N to i32
	%mul = shl nuw nsw i32 %conv, 2			%mul = shl nuw nsw i32 %conv, 2
	%cmp15 = icmp eq i16 %N, 0			%cmp15 = icmp eq i16 %N, 0
	br i1 %cmp15, label %for.cond.cleanup, label %vector.ph			br i1 %cmp15, label %for.cond.cleanup, label %vector.ph
	▲ Show 20 Lines • Show All 41 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: vneg.f16 s0, s0			; CHECK-NEXT: vneg.f16 s0, s0
	; CHECK-NEXT: vdup.16 q1, r1			; CHECK-NEXT: vdup.16 q1, r1
	; CHECK-NEXT: vmov r2, s0			; CHECK-NEXT: vmov r2, s0
	; CHECK-NEXT: dls lr, lr			; CHECK-NEXT: dls lr, lr
	; CHECK-NEXT: vdup.16 q0, r2			; CHECK-NEXT: vdup.16 q0, r2
	; CHECK-NEXT: .LBB9_1: @ %vector.body			; CHECK-NEXT: .LBB9_1: @ %vector.body
	; CHECK-NEXT: @ =>This Inner Loop Header: Depth=1			; CHECK-NEXT: @ =>This Inner Loop Header: Depth=1
	; CHECK-NEXT: vldrh.u16 q3, [r0]			; CHECK-NEXT: vldrh.u16 q3, [r0]
	; CHECK-NEXT: vpt.f16 le, q1, q3			; CHECK-NEXT: vpte.f16 le, q1, q3
	; CHECK-NEXT: vcmpt.f16 le, q3, q0			; CHECK-NEXT: vcmpt.f16 le, q3, q0
	; CHECK-NEXT: vpnot			; CHECK-NEXT: vstrhe.16 q2, [r0], #16
	; CHECK-NEXT: vpst
	; CHECK-NEXT: vstrht.16 q2, [r0], #16
	; CHECK-NEXT: le lr, .LBB9_1			; CHECK-NEXT: le lr, .LBB9_1
	; CHECK-NEXT: @ %bb.2: @ %for.cond.cleanup			; CHECK-NEXT: @ %bb.2: @ %for.cond.cleanup
	; CHECK-NEXT: pop {r7, pc}			; CHECK-NEXT: pop {r7, pc}
	entry:			entry:
	%0 = bitcast float %T.coerce to i32			%0 = bitcast float %T.coerce to i32
	%tmp.0.extract.trunc = trunc i32 %0 to i16			%tmp.0.extract.trunc = trunc i32 %0 to i16
	%1 = bitcast i16 %tmp.0.extract.trunc to half			%1 = bitcast i16 %tmp.0.extract.trunc to half
	%conv = zext i16 %N to i32			%conv = zext i16 %N to i32
	Show All 38 Lines

llvm/test/CodeGen/Thumb2/mve-vpt-3-blocks-kill-vpr.mir

	Show First 20 Lines • Show All 62 Lines • ▼ Show 20 Lines
	body: \|			body: \|
	bb.0.entry:			bb.0.entry:
	liveins: $q0, $q1, $q2, $r0			liveins: $q0, $q1, $q2, $r0

	; CHECK-LABEL: name: vpt_3_blocks_kill_vpr			; CHECK-LABEL: name: vpt_3_blocks_kill_vpr
	; CHECK: liveins: $q0, $q1, $q2, $r0			; CHECK: liveins: $q0, $q1, $q2, $r0
	; CHECK: $vpr = VMSR_P0 killed $r0, 14 /* CC::al */, $noreg			; CHECK: $vpr = VMSR_P0 killed $r0, 14 /* CC::al */, $noreg
	; CHECK: $q3 = MVE_VORR $q0, $q0, 0, $noreg, undef $q3			; CHECK: $q3 = MVE_VORR $q0, $q0, 0, $noreg, undef $q3
	; CHECK: BUNDLE implicit-def $q3, implicit-def $d6, implicit-def $s12, implicit-def $s13, implicit-def $d7, implicit-def $s14, implicit-def $s15, implicit $vpr, implicit killed $q1, implicit $q2, implicit killed $q3 {			; CHECK: BUNDLE implicit-def dead $q3, implicit-def $d6, implicit-def $s12, implicit-def $s13, implicit-def $d7, implicit-def $s14, implicit-def $s15, implicit-def $vpr, implicit-def $q1, implicit-def $d2, implicit-def $s4, implicit-def $s5, implicit-def $d3, implicit-def $s6, implicit-def $s7, implicit killed $vpr, implicit killed $q1, implicit $q2, implicit killed $q3 {
	; CHECK: MVE_VPST 8, implicit $vpr			; CHECK: MVE_VPST 12, implicit $vpr
	; CHECK: renamable $q3 = nnan ninf nsz MVE_VMINNMf32 killed renamable $q1, renamable $q2, 1, renamable $vpr, killed renamable $q3			; CHECK: renamable $q3 = nnan ninf nsz MVE_VMINNMf32 killed renamable $q1, renamable $q2, 1, renamable $vpr, killed renamable $q3
	; CHECK: }			; CHECK: renamable $q1 = nnan ninf nsz MVE_VMINNMf32 internal killed renamable $q3, internal renamable $q3, 2, internal renamable $vpr, undef renamable $q1
	; CHECK: renamable $vpr = MVE_VPNOT killed renamable $vpr, 0, $noreg
	; CHECK: BUNDLE implicit-def $q1, implicit-def $d2, implicit-def $s4, implicit-def $s5, implicit-def $d3, implicit-def $s6, implicit-def $s7, implicit $vpr, implicit killed $q3, implicit undef $q1 {
	; CHECK: MVE_VPST 8, implicit $vpr
	; CHECK: renamable $q1 = nnan ninf nsz MVE_VMINNMf32 killed renamable $q3, renamable $q3, 1, renamable $vpr, undef renamable $q1
	; CHECK: }			; CHECK: }
	; CHECK: $q3 = MVE_VORR $q0, $q0, 0, $noreg, undef $q3			; CHECK: $q3 = MVE_VORR $q0, $q0, 0, $noreg, undef $q3
	; CHECK: BUNDLE implicit-def dead $q3, implicit-def $d6, implicit-def $s12, implicit-def $s13, implicit-def $d7, implicit-def $s14, implicit-def $s15, implicit-def $q0, implicit-def $d0, implicit-def $s0, implicit-def $s1, implicit-def $d1, implicit-def $s2, implicit-def $s3, implicit killed $vpr, implicit killed $q1, implicit killed $q2, implicit killed $q3, implicit killed $q0 {			; CHECK: BUNDLE implicit-def dead $q3, implicit-def $d6, implicit-def $s12, implicit-def $s13, implicit-def $d7, implicit-def $s14, implicit-def $s15, implicit-def $q0, implicit-def $d0, implicit-def $s0, implicit-def $s1, implicit-def $d1, implicit-def $s2, implicit-def $s3, implicit killed $vpr, implicit killed $q1, implicit killed $q2, implicit killed $q3, implicit killed $q0 {
	; CHECK: MVE_VPST 4, implicit $vpr			; CHECK: MVE_VPST 4, implicit $vpr
	; CHECK: renamable $q3 = nnan ninf nsz MVE_VMINNMf32 killed renamable $q1, renamable $q2, 1, renamable $vpr, killed renamable $q3			; CHECK: renamable $q3 = nnan ninf nsz MVE_VMINNMf32 killed renamable $q1, renamable $q2, 1, renamable $vpr, killed renamable $q3
	; CHECK: renamable $q0 = nnan ninf nsz MVE_VMINNMf32 internal killed renamable $q3, killed renamable $q2, 1, killed renamable $vpr, killed renamable $q0			; CHECK: renamable $q0 = nnan ninf nsz MVE_VMINNMf32 internal killed renamable $q3, killed renamable $q2, 1, killed renamable $vpr, killed renamable $q0
	; CHECK: }			; CHECK: }
	; CHECK: tBX_RET 14 /* CC::al */, $noreg, implicit $q0			; CHECK: tBX_RET 14 /* CC::al */, $noreg, implicit $q0
	Show All 11 Lines

llvm/test/CodeGen/Thumb2/mve-vpt-block-elses.mir

This file was added.

				# NOTE: Assertions have been autogenerated by utils/update_mir_test_checks.py
				# RUN: llc -run-pass arm-mve-vpt %s -o - \| FileCheck %s

				--- \|
				target datalayout = "e-m:e-p:32:32-Fi8-i64:64-v128:64:128-a:0:32-n32-S64"
				target triple = "thumbv8.1m.main-arm-none-eabi"

				define hidden arm_aapcs_vfpcc <4 x float> @vpt_block_else(<4 x float> %inactive1, <4 x float> %inactive2, <4 x float> %a, <4 x float> %b, i16 zeroext %p) local_unnamed_addr #0 {
				entry:
				%conv.i = zext i16 %p to i32
				%0 = tail call nnan ninf nsz <4 x float> @llvm.arm.mve.vminnm.m.v4f32.v4f32.v4f32.v4f32.i32(<4 x float> undef, <4 x float> %a, <4 x float> %b, i32 %conv.i) #2
				%1 = tail call nnan ninf nsz <4 x float> @llvm.arm.mve.vminnm.m.v4f32.v4f32.v4f32.v4f32.i32(<4 x float> undef, <4 x float> %0, <4 x float> %0, i32 %conv.i) #2
				%2 = tail call nnan ninf nsz <4 x float> @llvm.arm.mve.vminnm.m.v4f32.v4f32.v4f32.v4f32.i32(<4 x float> %inactive1, <4 x float> %1, <4 x float> %b, i32 %conv.i) #2
				%3 = tail call nnan ninf nsz <4 x float> @llvm.arm.mve.vminnm.m.v4f32.v4f32.v4f32.v4f32.i32(<4 x float> %inactive2, <4 x float> %2, <4 x float> %b, i32 %conv.i) #2
				ret <4 x float> %3
				}

				declare <4 x float> @llvm.arm.mve.vminnm.m.v4f32.v4f32.v4f32.v4f32.i32(<4 x float>, <4 x float>, <4 x float>, i32) #1

				attributes #0 = { nounwind readnone "correctly-rounded-divide-sqrt-fp-math"="false" "denormal-fp-math"="preserve-sign" "disable-tail-calls"="false" "less-precise-fpmad"="false" "min-legal-vector-width"="128" "frame-pointer"="none" "no-infs-fp-math"="true" "no-jump-tables"="false" "no-nans-fp-math"="true" "no-signed-zeros-fp-math"="true" "no-trapping-math"="true" "stack-protector-buffer-size"="8" "target-cpu"="generic" "target-features"="+armv8.1-m.main,+hwdiv,+mve.fp,+ras,+thumb-mode" "unsafe-fp-math"="false" "use-soft-float"="false" }
				attributes #1 = { nounwind readnone }
				attributes #2 = { nounwind }

				...
				---
				name: vpt_block_else
				alignment: 4
				exposesReturnsTwice: false
				legalized: false
				regBankSelected: false
				selected: false
				failedISel: false
				tracksRegLiveness: true
				hasWinCFI: false
				registers: []
				liveins:
				- { reg: '$q0', virtual-reg: '' }
				- { reg: '$q1', virtual-reg: '' }
				- { reg: '$q2', virtual-reg: '' }
				- { reg: '$q3', virtual-reg: '' }
				- { reg: '$r0', virtual-reg: '' }
				frameInfo:
				isFrameAddressTaken: false
				isReturnAddressTaken: false
				hasStackMap: false
				hasPatchPoint: false
				stackSize: 0
				offsetAdjustment: 0
				maxAlignment: 0
				adjustsStack: false
				hasCalls: false
				stackProtector: ''
				maxCallFrameSize: 0
				cvBytesOfCalleeSavedRegisters: 0
				hasOpaqueSPAdjustment: false
				hasVAStart: false
				hasMustTailInVarArgFunc: false
				localFrameSize: 0
				savePoint: ''
				restorePoint: ''
				fixedStack: []
				stack: []
				constants: []
				body: \|
				bb.0.entry:
				liveins: $q0, $q1, $q2

				; CHECK-LABEL: name: vpt_block_else
				; CHECK: liveins: $q0, $q1, $q2
				; CHECK: $q3 = MVE_VORR $q2, $q2, 0, $noreg, undef $q3
				; CHECK: BUNDLE implicit-def dead $vpr, implicit-def $q3, implicit-def $d6, implicit-def $s12, implicit-def $s13, implicit-def $d7, implicit-def $s14, implicit-def $s15, implicit killed $q0, implicit $q2, implicit $q1, implicit killed $q3, implicit $zr {
				; CHECK: MVE_VPTv4s32 5, renamable $q0, renamable $q2, 10, implicit-def $vpr
				; CHECK: renamable $q3 = MVE_VMAXs32 renamable $q0, renamable $q1, 1, internal renamable $vpr, killed renamable $q3
				; CHECK: renamable $vpr = MVE_VCMPs32r killed renamable $q0, $zr, 12, 1, internal killed renamable $vpr
				; CHECK: renamable $vpr = MVE_VCMPs32r renamable $q1, $zr, 12, 2, internal killed renamable $vpr
				; CHECK: renamable $q3 = MVE_VORR renamable $q2, renamable $q2, 1, internal killed renamable $vpr, internal renamable $q3
				; CHECK: }
				; CHECK: $q0 = MVE_VORR $q3, $q3, 0, $noreg, undef $q0
				; CHECK: $q3 = MVE_VORR $q2, $q2, 0, $noreg, undef $q3
				; CHECK: BUNDLE implicit-def dead $vpr, implicit-def $q3, implicit-def $d6, implicit-def $s12, implicit-def $s13, implicit-def $d7, implicit-def $s14, implicit-def $s15, implicit killed $q0, implicit $q2, implicit $q1, implicit killed $q3, implicit $zr {
				; CHECK: MVE_VPTv4s32 7, renamable $q0, renamable $q2, 10, implicit-def $vpr
				; CHECK: renamable $q3 = MVE_VMAXs32 renamable $q0, renamable $q1, 1, internal renamable $vpr, killed renamable $q3
				; CHECK: renamable $vpr = MVE_VCMPs32r killed renamable $q0, $zr, 12, 1, internal killed renamable $vpr
				; CHECK: renamable $q3 = MVE_VORR renamable $q2, renamable $q2, 2, internal renamable $vpr, internal renamable $q3
				; CHECK: renamable $q3 = MVE_VORR renamable $q2, renamable $q2, 2, internal killed renamable $vpr, internal renamable $q3
				; CHECK: }
				; CHECK: $q0 = MVE_VORR $q3, $q3, 0, $noreg, undef $q0
				; CHECK: $q3 = MVE_VORR $q2, $q2, 0, $noreg, undef $q3
				; CHECK: BUNDLE implicit-def dead $vpr, implicit-def $q3, implicit-def $d6, implicit-def $s12, implicit-def $s13, implicit-def $d7, implicit-def $s14, implicit-def $s15, implicit $q0, implicit $q2, implicit $q1, implicit killed $q3, implicit $zr {
				; CHECK: MVE_VPTv4s32 13, renamable $q0, renamable $q2, 10, implicit-def $vpr
				; CHECK: renamable $q3 = MVE_VMAXs32 renamable $q0, renamable $q1, 1, internal renamable $vpr, killed renamable $q3
				; CHECK: renamable $q3 = MVE_VORR renamable $q2, renamable $q2, 2, internal renamable $vpr, internal renamable $q3
				; CHECK: renamable $vpr = MVE_VCMPs32r renamable $q1, $zr, 12, 2, internal killed renamable $vpr
				; CHECK: renamable $q3 = MVE_VORR renamable $q2, renamable $q2, 1, internal killed renamable $vpr, internal killed renamable $q3
				; CHECK: }
				; CHECK: $q0 = MVE_VORR killed $q3, killed $q3, 0, $noreg, undef $q0
				; CHECK: $q3 = MVE_VORR $q2, $q2, 0, $noreg, undef $q3
				; CHECK: BUNDLE implicit-def dead $vpr, implicit-def $q3, implicit-def $d6, implicit-def $s12, implicit-def $s13, implicit-def $d7, implicit-def $s14, implicit-def $s15, implicit $q0, implicit $q2, implicit $q1, implicit killed $q3, implicit $zr {
				; CHECK: MVE_VPTv4s32 9, renamable $q0, renamable $q2, 10, implicit-def $vpr
				; CHECK: renamable $q3 = MVE_VMAXs32 renamable $q0, renamable $q1, 1, internal renamable $vpr, killed renamable $q3
				; CHECK: renamable $vpr = MVE_VCMPs32r renamable $q1, $zr, 12, 2, internal killed renamable $vpr
				; CHECK: renamable $q3 = MVE_VORR renamable $q2, renamable $q2, 1, internal renamable $vpr, internal renamable $q3
				; CHECK: renamable $q3 = MVE_VORR renamable $q2, renamable $q2, 1, internal killed renamable $vpr, internal killed renamable $q3
				; CHECK: }
				; CHECK: $q0 = MVE_VORR killed $q3, killed $q3, 0, $noreg, undef $q0
				; CHECK: $q3 = MVE_VORR $q2, $q2, 0, $noreg, undef $q3
				; CHECK: BUNDLE implicit-def dead $vpr, implicit-def $q3, implicit-def $d6, implicit-def $s12, implicit-def $s13, implicit-def $d7, implicit-def $s14, implicit-def $s15, implicit $q0, implicit $q2, implicit $q1, implicit killed $q3 {
				; CHECK: MVE_VPTv4s32 15, renamable $q0, renamable $q2, 10, implicit-def $vpr
				; CHECK: renamable $q3 = MVE_VMAXs32 renamable $q0, renamable $q1, 1, internal renamable $vpr, killed renamable $q3
				; CHECK: renamable $q3 = MVE_VORR renamable $q2, renamable $q2, 2, internal renamable $vpr, internal renamable $q3
				; CHECK: renamable $q3 = MVE_VORR renamable $q2, renamable $q2, 2, internal renamable $vpr, internal renamable $q3
				; CHECK: renamable $q3 = MVE_VORR renamable $q2, renamable $q2, 2, internal killed renamable $vpr, internal killed renamable $q3
				; CHECK: }
				; CHECK: $q0 = MVE_VORR killed $q3, killed $q3, 0, $noreg, undef $q0
				; CHECK: $q3 = MVE_VORR $q2, $q2, 0, $noreg, undef $q3
				; CHECK: BUNDLE implicit-def dead $vpr, implicit-def $q3, implicit-def $d6, implicit-def $s12, implicit-def $s13, implicit-def $d7, implicit-def $s14, implicit-def $s15, implicit $q0, implicit $q2, implicit $q1, implicit killed $q3 {
				; CHECK: MVE_VPTv4s32 14, renamable $q0, renamable $q2, 10, implicit-def $vpr
				; CHECK: renamable $q3 = MVE_VMAXs32 renamable $q0, renamable $q1, 1, internal renamable $vpr, killed renamable $q3
				; CHECK: renamable $q3 = MVE_VORR renamable $q2, renamable $q2, 2, internal renamable $vpr, internal renamable $q3
				; CHECK: renamable $q3 = MVE_VORR renamable $q2, renamable $q2, 2, internal killed renamable $vpr, internal killed renamable $q3
				; CHECK: }
				; CHECK: $q0 = MVE_VORR killed $q3, killed $q3, 0, $noreg, undef $q0
				; CHECK: $q3 = MVE_VORR $q2, $q2, 0, $noreg, undef $q3
				; CHECK: BUNDLE implicit-def dead $vpr, implicit-def $q3, implicit-def $d6, implicit-def $s12, implicit-def $s13, implicit-def $d7, implicit-def $s14, implicit-def $s15, implicit $q0, implicit $q2, implicit $q1, implicit killed $q3, implicit $zr {
				; CHECK: MVE_VPTv4s32 10, renamable $q0, renamable $q2, 10, implicit-def $vpr
				; CHECK: renamable $q3 = MVE_VMAXs32 renamable $q0, renamable $q1, 1, internal renamable $vpr, killed renamable $q3
				; CHECK: renamable $vpr = MVE_VCMPs32r renamable $q1, $zr, 12, 2, internal killed renamable $vpr
				; CHECK: renamable $q3 = MVE_VORR renamable $q2, renamable $q2, 1, internal killed renamable $vpr, internal killed renamable $q3
				; CHECK: }
				; CHECK: $q0 = MVE_VORR killed $q3, killed $q3, 0, $noreg, undef $q0
				; CHECK: $q3 = MVE_VORR $q2, $q2, 0, $noreg, undef $q3
				; CHECK: BUNDLE implicit-def dead $vpr, implicit-def $q3, implicit-def $d6, implicit-def $s12, implicit-def $s13, implicit-def $d7, implicit-def $s14, implicit-def $s15, implicit $q0, implicit $q2, implicit $q1, implicit killed $q3 {
				; CHECK: MVE_VPTv4s32 6, renamable $q0, renamable $q2, 10, implicit-def $vpr
				; CHECK: renamable $q3 = MVE_VMAXs32 renamable $q0, renamable $q1, 1, internal renamable $vpr, killed renamable $q3
				; CHECK: renamable $q3 = MVE_VORR renamable $q2, renamable $q2, 1, internal renamable $vpr, internal killed renamable $q3
				; CHECK: renamable $q3 = MVE_VORR renamable $q2, renamable $q2, 2, internal killed renamable $vpr, internal killed renamable $q3
				; CHECK: }
				; CHECK: $q0 = MVE_VORR killed $q3, killed $q3, 0, $noreg, undef $q0
				; CHECK: $q3 = MVE_VORR $q2, $q2, 0, $noreg, undef $q3
				; CHECK: BUNDLE implicit-def dead $vpr, implicit-def $q3, implicit-def $d6, implicit-def $s12, implicit-def $s13, implicit-def $d7, implicit-def $s14, implicit-def $s15, implicit $q0, implicit $q2, implicit $q1, implicit killed $q3, implicit $zr {
				; CHECK: MVE_VPTv4s32 11, renamable $q0, renamable $q2, 10, implicit-def $vpr
				; CHECK: renamable $q3 = MVE_VMAXs32 renamable $q0, renamable $q1, 1, internal renamable $vpr, killed renamable $q3
				; CHECK: renamable $vpr = MVE_VCMPs32r renamable $q1, $zr, 12, 2, internal killed renamable $vpr
				; CHECK: renamable $q3 = MVE_VORR renamable $q2, renamable $q2, 1, internal renamable $vpr, internal killed renamable $q3
				; CHECK: renamable $q3 = MVE_VORR renamable $q2, renamable $q2, 2, internal killed renamable $vpr, internal killed renamable $q3
				; CHECK: }
				; CHECK: $q0 = MVE_VORR killed $q3, killed $q3, 0, $noreg, undef $q0
				; CHECK: tBX_RET 14 /* CC::al */, $noreg, implicit $q0
				renamable $vpr = MVE_VCMPs32 renamable $q0, renamable $q2, 10, 0, $noreg
				$q3 = MVE_VORR $q2, $q2, 0, $noreg, undef $q3
				renamable $q3 = MVE_VMAXs32 renamable $q0, renamable $q1, 1, renamable $vpr, killed renamable $q3
				renamable $vpr = MVE_VCMPs32r killed renamable $q0, $zr, 12, 1, killed renamable $vpr
				renamable $vpr = MVE_VPNOT killed renamable $vpr, 0, $noreg
				renamable $vpr = MVE_VCMPs32r renamable $q1, $zr, 12, 1, killed renamable $vpr
				renamable $q3 = MVE_VORR renamable $q2, renamable $q2, 1, killed renamable $vpr, renamable $q3
				$q0 = MVE_VORR $q3, $q3, 0, $noreg, undef $q0

				renamable $vpr = MVE_VCMPs32 renamable $q0, renamable $q2, 10, 0, $noreg
				$q3 = MVE_VORR $q2, $q2, 0, $noreg, undef $q3
				renamable $q3 = MVE_VMAXs32 renamable $q0, renamable $q1, 1, renamable $vpr, killed renamable $q3
				renamable $vpr = MVE_VCMPs32r killed renamable $q0, $zr, 12, 1, killed renamable $vpr
				renamable $vpr = MVE_VPNOT killed renamable $vpr, 0, $noreg
				renamable $q3 = MVE_VORR renamable $q2, renamable $q2, 1, renamable $vpr, renamable $q3
				renamable $q3 = MVE_VORR renamable $q2, renamable $q2, 1, killed renamable $vpr, renamable $q3
				$q0 = MVE_VORR $q3, $q3, 0, $noreg, undef $q0

				renamable $vpr = MVE_VCMPs32 renamable $q0, renamable $q2, 10, 0, $noreg
				$q3 = MVE_VORR $q2, $q2, 0, $noreg, undef $q3
				renamable $q3 = MVE_VMAXs32 renamable $q0, renamable $q1, 1, renamable $vpr, killed renamable $q3
				renamable $vpr = MVE_VPNOT killed renamable $vpr, 0, $noreg
				renamable $q3 = MVE_VORR renamable $q2, renamable $q2, 1, renamable $vpr, renamable $q3
				renamable $vpr = MVE_VCMPs32r renamable $q1, $zr, 12, 1, killed renamable $vpr
				renamable $q3 = MVE_VORR renamable $q2, renamable $q2, 1, killed renamable $vpr, killed renamable $q3
				$q0 = MVE_VORR killed $q3, killed $q3, 0, $noreg, undef $q0

				renamable $vpr = MVE_VCMPs32 renamable $q0, renamable $q2, 10, 0, $noreg
				$q3 = MVE_VORR $q2, $q2, 0, $noreg, undef $q3
				renamable $q3 = MVE_VMAXs32 renamable $q0, renamable $q1, 1, renamable $vpr, killed renamable $q3
				renamable $vpr = MVE_VPNOT killed renamable $vpr, 0, $noreg
				renamable $vpr = MVE_VCMPs32r renamable $q1, $zr, 12, 1, killed renamable $vpr
				renamable $q3 = MVE_VORR renamable $q2, renamable $q2, 1, renamable $vpr, renamable $q3
				renamable $q3 = MVE_VORR renamable $q2, renamable $q2, 1, killed renamable $vpr, killed renamable $q3
				$q0 = MVE_VORR killed $q3, killed $q3, 0, $noreg, undef $q0

				renamable $vpr = MVE_VCMPs32 renamable $q0, renamable $q2, 10, 0, $noreg
				$q3 = MVE_VORR $q2, $q2, 0, $noreg, undef $q3
				renamable $q3 = MVE_VMAXs32 renamable $q0, renamable $q1, 1, renamable $vpr, killed renamable $q3
				renamable $vpr = MVE_VPNOT killed renamable $vpr, 0, $noreg
				renamable $q3 = MVE_VORR renamable $q2, renamable $q2, 1, renamable $vpr, renamable $q3
				renamable $q3 = MVE_VORR renamable $q2, renamable $q2, 1, renamable $vpr, renamable $q3
				renamable $q3 = MVE_VORR renamable $q2, renamable $q2, 1, killed renamable $vpr, killed renamable $q3
				$q0 = MVE_VORR killed $q3, killed $q3, 0, $noreg, undef $q0

				renamable $vpr = MVE_VCMPs32 renamable $q0, renamable $q2, 10, 0, $noreg
				$q3 = MVE_VORR $q2, $q2, 0, $noreg, undef $q3
				renamable $q3 = MVE_VMAXs32 renamable $q0, renamable $q1, 1, renamable $vpr, killed renamable $q3
				renamable $vpr = MVE_VPNOT killed renamable $vpr, 0, $noreg
				renamable $q3 = MVE_VORR renamable $q2, renamable $q2, 1, renamable $vpr, renamable $q3
				renamable $q3 = MVE_VORR renamable $q2, renamable $q2, 1, killed renamable $vpr, killed renamable $q3
				$q0 = MVE_VORR killed $q3, killed $q3, 0, $noreg, undef $q0

				renamable $vpr = MVE_VCMPs32 renamable $q0, renamable $q2, 10, 0, $noreg
				$q3 = MVE_VORR $q2, $q2, 0, $noreg, undef $q3
				renamable $q3 = MVE_VMAXs32 renamable $q0, renamable $q1, 1, renamable $vpr, killed renamable $q3
				renamable $vpr = MVE_VPNOT killed renamable $vpr, 0, $noreg
				renamable $vpr = MVE_VCMPs32r renamable $q1, $zr, 12, 1, killed renamable $vpr
				renamable $q3 = MVE_VORR renamable $q2, renamable $q2, 1, killed renamable $vpr, killed renamable $q3
				$q0 = MVE_VORR killed $q3, killed $q3, 0, $noreg, undef $q0

				renamable $vpr = MVE_VCMPs32 renamable $q0, renamable $q2, 10, 0, $noreg
				$q3 = MVE_VORR $q2, $q2, 0, $noreg, undef $q3
				renamable $q3 = MVE_VMAXs32 renamable $q0, renamable $q1, 1, renamable $vpr, killed renamable $q3
				renamable $q3 = MVE_VORR renamable $q2, renamable $q2, 1, renamable $vpr, killed renamable $q3
				renamable $vpr = MVE_VPNOT killed renamable $vpr, 0, $noreg
				renamable $q3 = MVE_VORR renamable $q2, renamable $q2, 1, killed renamable $vpr, killed renamable $q3
				$q0 = MVE_VORR killed $q3, killed $q3, 0, $noreg, undef $q0

				renamable $vpr = MVE_VCMPs32 renamable $q0, renamable $q2, 10, 0, $noreg
				$q3 = MVE_VORR $q2, $q2, 0, $noreg, undef $q3
				renamable $q3 = MVE_VMAXs32 renamable $q0, renamable $q1, 1, renamable $vpr, killed renamable $q3
				renamable $vpr = MVE_VPNOT killed renamable $vpr, 0, $noreg
				renamable $vpr = MVE_VCMPs32r renamable $q1, $zr, 12, 1, killed renamable $vpr
				renamable $q3 = MVE_VORR renamable $q2, renamable $q2, 1, renamable $vpr, killed renamable $q3
				renamable $vpr = MVE_VPNOT killed renamable $vpr, 0, $noreg
				renamable $q3 = MVE_VORR renamable $q2, renamable $q2, 1, killed renamable $vpr, killed renamable $q3
				$q0 = MVE_VORR killed $q3, killed $q3, 0, $noreg, undef $q0

				tBX_RET 14, $noreg, implicit $q0

				...

llvm/test/CodeGen/Thumb2/mve-vpt-nots.mir

Show First 20 Lines • Show All 55 Lines • ▼ Show 20 Lines	liveins:
- { reg: '$q1', virtual-reg: '' }		- { reg: '$q1', virtual-reg: '' }
- { reg: '$q2', virtual-reg: '' }		- { reg: '$q2', virtual-reg: '' }
body: \|		body: \|
bb.0.entry:		bb.0.entry:
liveins: $q0, $q1, $q2		liveins: $q0, $q1, $q2

; CHECK-LABEL: name: vpnot		; CHECK-LABEL: name: vpnot
; CHECK: liveins: $q0, $q1, $q2		; CHECK: liveins: $q0, $q1, $q2
; CHECK: BUNDLE implicit-def $vpr, implicit $q0, implicit $zr, implicit $q1 {		; CHECK: BUNDLE implicit-def $vpr, implicit $q0, implicit $zr, implicit $q1, implicit killed $q2 {
; CHECK: MVE_VPTv4s32r 8, renamable $q0, $zr, 11, implicit-def $vpr		; CHECK: MVE_VPTv4s32r 12, renamable $q0, $zr, 11, implicit-def $vpr
; CHECK: renamable $vpr = MVE_VCMPs32r renamable $q1, $zr, 12, 1, internal killed renamable $vpr		; CHECK: renamable $vpr = MVE_VCMPs32r renamable $q1, $zr, 12, 1, internal killed renamable $vpr
; CHECK: }		; CHECK: renamable $vpr = MVE_VCMPi32r killed renamable $q2, $zr, 0, 2, internal killed renamable $vpr
; CHECK: renamable $vpr = MVE_VPNOT killed renamable $vpr, 0, $noreg
; CHECK: BUNDLE implicit-def $vpr, implicit killed $vpr, implicit killed $q2, implicit $zr {
; CHECK: MVE_VPST 8, implicit $vpr
; CHECK: renamable $vpr = MVE_VCMPi32r killed renamable $q2, $zr, 0, 1, killed renamable $vpr
; CHECK: }		; CHECK: }
; CHECK: renamable $q0 = MVE_VPSEL killed renamable $q0, killed renamable $q1, 0, killed renamable $vpr		; CHECK: renamable $q0 = MVE_VPSEL killed renamable $q0, killed renamable $q1, 0, killed renamable $vpr
; CHECK: tBX_RET 14 /* CC::al */, $noreg, implicit $q0		; CHECK: tBX_RET 14 /* CC::al */, $noreg, implicit $q0
renamable $vpr = MVE_VCMPs32r renamable $q0, $zr, 11, 0, $noreg		renamable $vpr = MVE_VCMPs32r renamable $q0, $zr, 11, 0, $noreg
renamable $vpr = MVE_VCMPs32r renamable $q1, $zr, 12, 1, killed renamable $vpr		renamable $vpr = MVE_VCMPs32r renamable $q1, $zr, 12, 1, killed renamable $vpr
renamable $vpr = MVE_VPNOT killed renamable $vpr, 0, $noreg		renamable $vpr = MVE_VPNOT killed renamable $vpr, 0, $noreg
renamable $vpr = MVE_VCMPi32r killed renamable $q2, $zr, 0, 1, killed renamable $vpr		renamable $vpr = MVE_VCMPi32r killed renamable $q2, $zr, 0, 1, killed renamable $vpr
renamable $q0 = MVE_VPSEL killed renamable $q0, killed renamable $q1, 0, killed renamable $vpr		renamable $q0 = MVE_VPSEL killed renamable $q0, killed renamable $q1, 0, killed renamable $vpr
▲ Show 20 Lines • Show All 159 Lines • ▼ Show 20 Lines
body: \|		body: \|
bb.0.entry:		bb.0.entry:
liveins: $q0, $q1, $q2		liveins: $q0, $q1, $q2

; CHECK-LABEL: name: vpnot_many		; CHECK-LABEL: name: vpnot_many
; CHECK: liveins: $q0, $q1, $q2		; CHECK: liveins: $q0, $q1, $q2
; CHECK: renamable $vpr = MVE_VCMPs32r renamable $q0, $zr, 11, 0, $noreg		; CHECK: renamable $vpr = MVE_VCMPs32r renamable $q0, $zr, 11, 0, $noreg
; CHECK: renamable $vpr = MVE_VPNOT killed renamable $vpr, 0, $noreg		; CHECK: renamable $vpr = MVE_VPNOT killed renamable $vpr, 0, $noreg
; CHECK: BUNDLE implicit-def $vpr, implicit killed $vpr, implicit $q1, implicit $zr {		; CHECK: BUNDLE implicit-def $vpr, implicit killed $vpr, implicit $q1, implicit $zr, implicit killed $q2 {
; CHECK: MVE_VPST 8, implicit $vpr		; CHECK: MVE_VPST 12, implicit $vpr
; CHECK: renamable $vpr = MVE_VCMPs32r renamable $q1, $zr, 12, 1, killed renamable $vpr		; CHECK: renamable $vpr = MVE_VCMPs32r renamable $q1, $zr, 12, 1, killed renamable $vpr
; CHECK: }		; CHECK: renamable $vpr = MVE_VCMPi32r killed renamable $q2, $zr, 0, 2, internal killed renamable $vpr
; CHECK: renamable $vpr = MVE_VPNOT killed renamable $vpr, 0, $noreg
; CHECK: BUNDLE implicit-def $vpr, implicit killed $vpr, implicit killed $q2, implicit $zr {
; CHECK: MVE_VPST 8, implicit $vpr
; CHECK: renamable $vpr = MVE_VCMPi32r killed renamable $q2, $zr, 0, 1, killed renamable $vpr
; CHECK: }		; CHECK: }
; CHECK: renamable $vpr = MVE_VPNOT killed renamable $vpr, 0, $noreg		; CHECK: renamable $vpr = MVE_VPNOT killed renamable $vpr, 0, $noreg
; CHECK: renamable $q0 = MVE_VPSEL killed renamable $q0, killed renamable $q1, 0, killed renamable $vpr		; CHECK: renamable $q0 = MVE_VPSEL killed renamable $q0, killed renamable $q1, 0, killed renamable $vpr
; CHECK: tBX_RET 14 /* CC::al */, $noreg, implicit $q0		; CHECK: tBX_RET 14 /* CC::al */, $noreg, implicit $q0
renamable $vpr = MVE_VCMPs32r renamable $q0, $zr, 11, 0, $noreg		renamable $vpr = MVE_VCMPs32r renamable $q0, $zr, 11, 0, $noreg
renamable $vpr = MVE_VPNOT killed renamable $vpr, 0, $noreg		renamable $vpr = MVE_VPNOT killed renamable $vpr, 0, $noreg
renamable $vpr = MVE_VCMPs32r renamable $q1, $zr, 12, 1, killed renamable $vpr		renamable $vpr = MVE_VCMPs32r renamable $q1, $zr, 12, 1, killed renamable $vpr
renamable $vpr = MVE_VPNOT killed renamable $vpr, 0, $noreg		renamable $vpr = MVE_VPNOT killed renamable $vpr, 0, $noreg
renamable $vpr = MVE_VCMPi32r killed renamable $q2, $zr, 0, 1, killed renamable $vpr		renamable $vpr = MVE_VCMPi32r killed renamable $q2, $zr, 0, 1, killed renamable $vpr
renamable $vpr = MVE_VPNOT killed renamable $vpr, 0, $noreg		renamable $vpr = MVE_VPNOT killed renamable $vpr, 0, $noreg
renamable $q0 = MVE_VPSEL killed renamable $q0, killed renamable $q1, 0, killed renamable $vpr		renamable $q0 = MVE_VPSEL killed renamable $q0, killed renamable $q1, 0, killed renamable $vpr
tBX_RET 14, $noreg, implicit $q0		tBX_RET 14, $noreg, implicit $q0

...		...

This is an archive of the discontinued LLVM Phabricator instance.

[Target][ARM] Improvements to the VPT Block Insertion Pass
ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 250534

llvm/lib/Target/ARM/MVEVPTBlockPass.cpp

llvm/lib/Target/ARM/Thumb2InstrInfo.h

llvm/test/CodeGen/Thumb2/mve-pred-not.ll

llvm/test/CodeGen/Thumb2/mve-pred-threshold.ll

llvm/test/CodeGen/Thumb2/mve-vpt-3-blocks-kill-vpr.mir

llvm/test/CodeGen/Thumb2/mve-vpt-block-elses.mir

llvm/test/CodeGen/Thumb2/mve-vpt-nots.mir

This is an archive of the discontinued LLVM Phabricator instance.

[Target][ARM] Improvements to the VPT Block Insertion PassClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 250534

llvm/lib/Target/ARM/MVEVPTBlockPass.cpp

llvm/lib/Target/ARM/Thumb2InstrInfo.h

llvm/test/CodeGen/Thumb2/mve-pred-not.ll

llvm/test/CodeGen/Thumb2/mve-pred-threshold.ll

llvm/test/CodeGen/Thumb2/mve-vpt-3-blocks-kill-vpr.mir

llvm/test/CodeGen/Thumb2/mve-vpt-block-elses.mir

llvm/test/CodeGen/Thumb2/mve-vpt-nots.mir

[Target][ARM] Improvements to the VPT Block Insertion Pass
ClosedPublic