Diff 249877

llvm/lib/Target/ARM/MVEVPTBlockPass.cpp

Show All 28 Lines
#include <cassert>		#include <cassert>
#include <new>		#include <new>

using namespace llvm;		using namespace llvm;

#define DEBUG_TYPE "arm-mve-vpt"		#define DEBUG_TYPE "arm-mve-vpt"

namespace {		namespace {
class MVEVPTBlock : public MachineFunctionPass {		class MVEVPTBlock : public MachineFunctionPass {
public:		public:
static char ID;		static char ID;
const Thumb2InstrInfo *TII;		const Thumb2InstrInfo *TII;
const TargetRegisterInfo *TRI;		const TargetRegisterInfo *TRI;

MVEVPTBlock() : MachineFunctionPass(ID) {}		MVEVPTBlock() : MachineFunctionPass(ID) {}

bool runOnMachineFunction(MachineFunction &Fn) override;		bool runOnMachineFunction(MachineFunction &Fn) override;

MachineFunctionProperties getRequiredProperties() const override {		MachineFunctionProperties getRequiredProperties() const override {
return MachineFunctionProperties().set(		return MachineFunctionProperties().set(
MachineFunctionProperties::Property::NoVRegs);		MachineFunctionProperties::Property::NoVRegs);
}		}

StringRef getPassName() const override {		StringRef getPassName() const override {
return "MVE VPT block insertion pass";		return "MVE VPT block insertion pass";
}		}

private:		private:
bool InsertVPTBlocks(MachineBasicBlock &MBB);		bool InsertVPTBlocks(MachineBasicBlock &MBB);
};		};

char MVEVPTBlock::ID = 0;		char MVEVPTBlock::ID = 0;

} // end anonymous namespace		} // end anonymous namespace

INITIALIZE_PASS(MVEVPTBlock, DEBUG_TYPE, "ARM MVE VPT block pass", false, false)		INITIALIZE_PASS(MVEVPTBlock, DEBUG_TYPE, "ARM MVE VPT block pass", false, false)

static MachineInstr *findVCMPToFoldIntoVPST(MachineBasicBlock::iterator MI,		static MachineInstr *findVCMPToFoldIntoVPST(MachineBasicBlock::iterator MI,
const TargetRegisterInfo *TRI,		const TargetRegisterInfo *TRI,
unsigned &NewOpcode) {		unsigned &NewOpcode) {
Show All 20 Lines	if (registerDefinedBetween(CmpMI->getOperand(1).getReg(), std::next(CmpMI),
MI, TRI))		MI, TRI))
return nullptr;		return nullptr;
if (registerDefinedBetween(CmpMI->getOperand(2).getReg(), std::next(CmpMI),		if (registerDefinedBetween(CmpMI->getOperand(2).getReg(), std::next(CmpMI),
MI, TRI))		MI, TRI))
return nullptr;		return nullptr;
return &*CmpMI;		return &*CmpMI;
}		}

		// Adds "elses" to a T, TT or TTT blockmask.
		dmgreenUnsubmitted Done Reply Inline Actions Is this only called with a Count of 1 now? If so, can it be simplified. dmgreen: Is this only called with a Count of 1 now? If so, can it be simplified.
		static uint64_t AddElsesToARMVPTBlockMask(uint64_t BlockMask,
		unsigned NumElses) {
		static uint64_t Table[3][3] = {
		/T / {ARMVCC::TE, ARMVCC::TEE, ARMVCC::TEEE},
		dmgreenUnsubmitted Done Reply Inline Actions Add a message for the assert. dmgreen: Add a message for the assert.
		/TT / {ARMVCC::TTE, ARMVCC::TTEE, 0},
		/TTT/ {ARMVCC::TTTE, 0, 0},
		};
		assert(NumElses != 0);
		switch (BlockMask) {
		case ARMVCC::T:
		assert(NumElses <= 3 && "Cannot add more than 3 elses to a T BlockMask - "
		"Max BlockMask size is 4");
		return Table[0][NumElses - 1];
		case ARMVCC::TT:
		assert(NumElses <= 2 && "Cannot add more than 2 elses to a TT BlockMask - "
		"Max BlockMask size is 4");
		return Table[1][NumElses - 1];
		case ARMVCC::TTT:
		assert(NumElses == 1 && "Cannot add more than 1 else to a T BlockMask - "
		"Max BlockMask size is 4");
		return Table[2][NumElses - 1];
		default:
		llvm_unreachable("Unsupported BlockMask");
		}
		}

		// Skips a block of predicated instructions.
		// Returns true if this successfully skipped the whole block of predicated
		// instructions. Returns false when it stopped early (due to MaxSkips), or if
		// MBIter didn't point to a predicated instruction.
		static bool SkipPredicatedInstrs(MachineBasicBlock &Block,
		MachineBasicBlock::instr_iterator &MBIter,
		ARMVCC::VPTCodes Pred, unsigned MaxSkips,
		unsigned &NumInstSkipped) {
		MachineBasicBlock::instr_iterator EndIter = Block.instr_end();
		ARMVCC::VPTCodes NextPred = ARMVCC::None;
		unsigned PredReg;
		dmgreenUnsubmitted Not Done Reply Inline Actions Maybe name this "AddPredicatedInstruction", as we conceptually "adding" them to the block, as opposed to skipping them. dmgreen: Maybe name this "AddPredicatedInstruction", as we conceptually "adding" them to the block, as…
		Pierre-vhAuthorUnsubmitted Done Reply Inline Actions I named the function "Skip" because it advances the iterator (it skips the predicated instruction in front of the iterator), this function doesn't really "care" about the block as a whole, so for me calling it "AddPredicatedInstructions" doesn't make sense. Pierre-vh: I named the function "Skip" because it advances the iterator (it skips the predicated…
		dmgreenUnsubmitted Done Reply Inline Actions Hmm. "Skip" implied to me that we would not end up doing anything with these instructions. Like we would skip instructions between VPT blocks that are not predicated. We just leave them alone. How about "StepOver" instead? dmgreen: Hmm. "Skip" implied to me that we would not end up doing anything with these instructions. Like…
		Pierre-vhAuthorUnsubmitted Done Reply Inline Actions `StepOverPredicatedInstrs` is good I think. I'll change it. Pierre-vh: `StepOverPredicatedInstrs` is good I think. I'll change it.
		NumInstSkipped = 0;

		while (MBIter != EndIter) {
		NextPred = getVPTInstrPredicate(*MBIter, PredReg);
		assert(NextPred != ARMVCC::Else &&
		"VPT block pass does not expect Else preds");
		if ((NextPred != Pred) \|\| (MaxSkips == 0))
		break;
		--MaxSkips;
		++MBIter;
		++NumInstSkipped;
		};

		return NumInstSkipped != 0 && (NextPred == ARMVCC::None \|\| MBIter == EndIter);
		}

		// Returns true if we can safely optimize the block following a VPNOT.
		//
		// This considers that a VPNOT can be safely removed when at least one of the
		// instructions in its block defines VPR, or uses+kills it.
		static bool CanOptimizeVPNOTBlock(MachineBasicBlock::iterator Iter,
		MachineBasicBlock::iterator End) {
		for (; Iter != End; ++Iter)
		if (Iter->definesRegister(ARM::VPR) \|\|
		Iter->findRegisterUseOperandIdx(ARM::VPR, true) != -1)
		return true;
		return false;
		dmgreenUnsubmitted Done Reply Inline Actions Can this use killsRegister? dmgreen: Can this use killsRegister?
		}

bool MVEVPTBlock::InsertVPTBlocks(MachineBasicBlock &Block) {		bool MVEVPTBlock::InsertVPTBlocks(MachineBasicBlock &Block) {
bool Modified = false;		bool Modified = false;
MachineBasicBlock::instr_iterator MBIter = Block.instr_begin();		MachineBasicBlock::instr_iterator MBIter = Block.instr_begin();
MachineBasicBlock::instr_iterator EndIter = Block.instr_end();		MachineBasicBlock::instr_iterator EndIter = Block.instr_end();

		SmallVector<MachineInstr *, 4> DeadInstructions;

while (MBIter != EndIter) {		while (MBIter != EndIter) {
MachineInstr MI = &MBIter;		MachineInstr MI = &MBIter;
unsigned PredReg = 0;		unsigned PredReg = 0;
DebugLoc dl = MI->getDebugLoc();		DebugLoc DL = MI->getDebugLoc();

ARMVCC::VPTCodes Pred = getVPTInstrPredicate(*MI, PredReg);		ARMVCC::VPTCodes Pred = getVPTInstrPredicate(*MI, PredReg);

		dmgreenUnsubmitted Done Reply Inline Actions Add a message to the assert. dmgreen: Add a message to the assert.
// The idea of the predicate is that None, Then and Else are for use when		// The idea of the predicate is that None, Then and Else are for use when
// handling assembly language: they correspond to the three possible		// handling assembly language: they correspond to the three possible
// suffixes "", "t" and "e" on the mnemonic. So when instructions are read		// suffixes "", "t" and "e" on the mnemonic. So when instructions are read
// from assembly source or disassembled from object code, you expect to see		// from assembly source or disassembled from object code, you expect to see
// a mixture whenever there's a long VPT block. But in code generation, we		// a mixture whenever there's a long VPT block. But in code generation, we
// hope we'll never generate an Else as input to this pass.		// hope we'll never generate an Else as input to this pass.
assert(Pred != ARMVCC::Else && "VPT block pass does not expect Else preds");		assert(Pred != ARMVCC::Else && "VPT block pass does not expect Else preds");
		dmgreenUnsubmitted Done Reply Inline Actions This doesn't look like it needed to change? Unless the line after is too long too? dmgreen: This doesn't look like it needed to change? Unless the line after is too long too?
		Pierre-vhAuthorUnsubmitted Done Reply Inline Actions You are right, it doesn't need to change. It was probably changed by mistake by me or clang-format. Pierre-vh: You are right, it doesn't need to change. It was probably changed by mistake by me or clang…

if (Pred == ARMVCC::None) {
++MBIter;		++MBIter;
		if (Pred == ARMVCC::None)
continue;		continue;
}

LLVM_DEBUG(dbgs() << "VPT block created for: "; MI->dump());
int VPTInstCnt = 1;
ARMVCC::VPTCodes NextPred;

// Look at subsequent instructions, checking if they can be in the same VPT		// Look at subsequent instructions, checking if they can be in the same VPT
// block.		// block.
		LLVM_DEBUG(dbgs() << "VPT block created for: "; MI->dump());

		// The number of instructions in the "then" part of the VPT block.
		int VPTThenInstCnt = 1;

		unsigned SkippedInstrs;
		SkipPredicatedInstrs(Block, MBIter, Pred, 3, SkippedInstrs);

		VPTThenInstCnt += SkippedInstrs;
		assert(VPTThenInstCnt <= 4);
		dmgreenUnsubmitted Done Reply Inline Actions Was VPTThenInstCnt renamed to something else? BlockSize? dmgreen: Was VPTThenInstCnt renamed to something else? BlockSize?
		Pierre-vhAuthorUnsubmitted Done Reply Inline Actions It's indeed "BlockSize" now, I'll change this comment. Pierre-vh: It's indeed "BlockSize" now, I'll change this comment.

		LLVM_DEBUG(
		for (MachineBasicBlock::instr_iterator Iter = ++MI->getIterator(),
		End = MBIter;
		Iter != End; ++Iter) {
		dbgs() << " adding: ";
		Iter->dump();
		});

		// Generate the initial BlockMask
		unsigned BlockMask = getARMVPTBlockMask(VPTThenInstCnt);

		// If the next instr is VPNOT, we can even add an else block if there's room
		// for it in the VPT block above (at least one instr available) and if we
		// can safely remove the VPNOT
		if (MBIter != EndIter && VPTThenInstCnt < 4 &&
		MBIter->getOpcode() == ARM::MVE_VPNOT) {
		unsigned VPTElseInstCnt = 0;
		MachineBasicBlock::instr_iterator AfterVPNotIter = MBIter;
		++AfterVPNotIter;
		// Skip through the predicated instructions of the VPNOT, stopping after
		// (4 - VPTThenInstCnt). If the manage to skip a whole block, continue.
		if (SkipPredicatedInstrs(Block, AfterVPNotIter, ARMVCC::Then,
		(4 - VPTThenInstCnt), VPTElseInstCnt)) {
		// Check if we can optimize the VPNOT block.
		if (CanOptimizeVPNOTBlock(MBIter, AfterVPNotIter)) {
		LLVM_DEBUG(dbgs() << " removing VPNOT: "; MBIter->dump(););

		// Record the VPNot to remove it later.
		dmgreenUnsubmitted Not Done Reply Inline Actions Find the register -> Find the operand holding the predicate dmgreen: Find the register -> Find the operand holding the predicate
		DeadInstructions.push_back(&*MBIter);
++MBIter;		++MBIter;
while (MBIter != EndIter && VPTInstCnt < 4) {
NextPred = getVPTInstrPredicate(*MBIter, PredReg);
assert(NextPred != ARMVCC::Else &&
"VPT block pass does not expect Else preds");
if (NextPred != Pred)
break;
LLVM_DEBUG(dbgs() << " adding : "; MBIter->dump());
++VPTInstCnt;
++MBIter;
};

unsigned BlockMask = getARMVPTBlockMask(VPTInstCnt);		// Update the BlockMask to include the elses.
		BlockMask = AddElsesToARMVPTBlockMask(BlockMask, VPTElseInstCnt);

		// Replace all Thens with Elses in the predicated instructions block
		// and move MBIter past the end of the block.
		for (; MBIter != AfterVPNotIter; ++MBIter) {
		int OpIdx = findFirstVPTPredOperandIdx(*MBIter);
		assert(OpIdx != -1);
		MBIter->getOperand(OpIdx).setImm(ARMVCC::Else);

		LLVM_DEBUG(dbgs() << " adding else: "; MBIter->dump(););
		}
		}
		}
		}

		dmgreenUnsubmitted Not Done Reply Inline Actions Why use a uint64_t? dmgreen: Why use a uint64_t?
		Pierre-vhAuthorUnsubmitted Done Reply Inline Actions It's the type of the argument of `addImm` below. Of course I can also use `unsigned` if you prefer, or I can change this to `ARM::PredBlockMask` and convert to `uint64_t` when calling `addImm`. Pierre-vh: It's the type of the argument of `addImm` below. Of course I can also use `unsigned` if you…
		dmgreenUnsubmitted Done Reply Inline Actions unsigned is probably fine, it will fit in either case. If the printing is still simple, PredBlockMask would probably be best. Up to you. dmgreen: unsigned is probably fine, it will fit in either case. If the printing is still simple…
		Pierre-vhAuthorUnsubmitted Done Reply Inline Actions I'll do something like this then: ARM::PredBlockMask BlockMask = CreateVPTBlock(MBIter, EndIter, DeadInstructions); // ... MIBuilder.addImm((uint64_t)BlockMask); // ... MIBuilder.addImm((uint64_t)BlockMask); Pierre-vh: I'll do something like this then: ``` ARM::PredBlockMask BlockMask = CreateVPTBlock(MBIter…
// Search back for a VCMP that can be folded to create a VPT, or else create		// Search back for a VCMP that can be folded to create a VPT, or else create
// a VPST directly		// a VPST directly
		dmgreenUnsubmitted Done Reply Inline Actions Maybe just use: CurrentPredicate = CurrentPredicate == ARMVCC::Then ? ARMVCC::Else : ARMVCC::Then; dmgreen: Maybe just use: CurrentPredicate = CurrentPredicate == ARMVCC::Then ? ARMVCC::Else : ARMVCC…
MachineInstrBuilder MIBuilder;		MachineInstrBuilder MIBuilder;
unsigned NewOpcode;		unsigned NewOpcode;
MachineInstr *VCMP = findVCMPToFoldIntoVPST(MI, TRI, NewOpcode);		if (MachineInstr *VCMP = findVCMPToFoldIntoVPST(MI, TRI, NewOpcode)) {
if (VCMP) {
LLVM_DEBUG(dbgs() << " folding VCMP into VPST: "; VCMP->dump());		LLVM_DEBUG(dbgs() << " folding VCMP into VPST: "; VCMP->dump());
MIBuilder = BuildMI(Block, MI, dl, TII->get(NewOpcode));		MIBuilder = BuildMI(Block, MI, DL, TII->get(NewOpcode));
MIBuilder.addImm(BlockMask);		MIBuilder.addImm(BlockMask);
MIBuilder.add(VCMP->getOperand(1));		MIBuilder.add(VCMP->getOperand(1));
MIBuilder.add(VCMP->getOperand(2));		MIBuilder.add(VCMP->getOperand(2));
MIBuilder.add(VCMP->getOperand(3));		MIBuilder.add(VCMP->getOperand(3));
VCMP->eraseFromParent();		VCMP->eraseFromParent();
} else {		} else {
MIBuilder = BuildMI(Block, MI, dl, TII->get(ARM::MVE_VPST));		MIBuilder = BuildMI(Block, MI, DL, TII->get(ARM::MVE_VPST));
MIBuilder.addImm(BlockMask);		MIBuilder.addImm(BlockMask);
}		}

finalizeBundle(		finalizeBundle(
Block, MachineBasicBlock::instr_iterator(MIBuilder.getInstr()), MBIter);		Block, MachineBasicBlock::instr_iterator(MIBuilder.getInstr()), MBIter);

Modified = true;		Modified = true;
}		}

		// Erase all dead instructions
		for (MachineInstr *DeadMI : DeadInstructions) {
		if (DeadMI->isInsideBundle())
		DeadMI->eraseFromBundle();
		else
		DeadMI->eraseFromParent();
		}

return Modified;		return Modified;
}		}

bool MVEVPTBlock::runOnMachineFunction(MachineFunction &Fn) {		bool MVEVPTBlock::runOnMachineFunction(MachineFunction &Fn) {
const ARMSubtarget &STI =		const ARMSubtarget &STI =
static_cast<const ARMSubtarget &>(Fn.getSubtarget());		static_cast<const ARMSubtarget &>(Fn.getSubtarget());

if (!STI.isThumb2() \|\| !STI.hasMVEIntegerOps())		if (!STI.isThumb2() \|\| !STI.hasMVEIntegerOps())
return false;		return false;

TII = static_cast<const Thumb2InstrInfo *>(STI.getInstrInfo());		TII = static_cast<const Thumb2InstrInfo *>(STI.getInstrInfo());
TRI = STI.getRegisterInfo();		TRI = STI.getRegisterInfo();

LLVM_DEBUG(dbgs() << "******** ARM MVE VPT BLOCKS ********\n"		LLVM_DEBUG(dbgs() << "******** ARM MVE VPT BLOCKS ********\n"
<< "********** Function: " << Fn.getName() << '\n');		<< "********** Function: " << Fn.getName() << '\n');

		Pierre-vhAuthorUnsubmitted Done Reply Inline Actions This shouldn't be here and has been fixed locally. However, I won't send a new diff just for a single line, so I'll push it when I have more meaningful changes to accompany it. Pierre-vh: This shouldn't be here and has been fixed locally. However, I won't send a new diff just for a…
bool Modified = false;		bool Modified = false;
for (MachineBasicBlock &MBB : Fn)		for (MachineBasicBlock &MBB : Fn)
Modified \|= InsertVPTBlocks(MBB);		Modified \|= InsertVPTBlocks(MBB);

LLVM_DEBUG(dbgs() << "**************************************\n");		LLVM_DEBUG(dbgs() << "**************************************\n");
return Modified;		return Modified;
}		}

/// createMVEVPTBlock - Returns an instance of the MVE VPT block		/// createMVEVPTBlock - Returns an instance of the MVE VPT block
/// insertion pass.		/// insertion pass.
FunctionPass *llvm::createMVEVPTBlockPass() { return new MVEVPTBlock(); }		FunctionPass *llvm::createMVEVPTBlockPass() { return new MVEVPTBlock(); }

llvm/test/CodeGen/Thumb2/mve-pred-not.ll

Show First 20 Lines • Show All 377 Lines • ▼ Show 20 Lines	entry:
%o = xor <2 x i1> %c1, <i1 -1, i1 -1>		%o = xor <2 x i1> %c1, <i1 -1, i1 -1>
%s = select <2 x i1> %o, <2 x i64> %a, <2 x i64> %b		%s = select <2 x i1> %o, <2 x i64> %a, <2 x i64> %b
ret <2 x i64> %s		ret <2 x i64> %s
}		}

define arm_aapcs_vfpcc <4 x i32> @vpnot_v4i1(<4 x i32> %a, <4 x i32> %b, <4 x i32> %c) {		define arm_aapcs_vfpcc <4 x i32> @vpnot_v4i1(<4 x i32> %a, <4 x i32> %b, <4 x i32> %c) {
; CHECK-LABEL: vpnot_v4i1:		; CHECK-LABEL: vpnot_v4i1:
; CHECK: @ %bb.0: @ %entry		; CHECK: @ %bb.0: @ %entry
; CHECK-NEXT: vpt.s32 lt, q0, zr		; CHECK-NEXT: vpte.s32 lt, q0, zr
; CHECK-NEXT: vcmpt.s32 gt, q1, zr		; CHECK-NEXT: vcmpt.s32 gt, q1, zr
; CHECK-NEXT: vpnot		; CHECK-NEXT: vcmpe.i32 eq, q2, zr
; CHECK-NEXT: vpst
; CHECK-NEXT: vcmpt.i32 eq, q2, zr
; CHECK-NEXT: vpsel q0, q0, q1		; CHECK-NEXT: vpsel q0, q0, q1
; CHECK-NEXT: bx lr		; CHECK-NEXT: bx lr
entry:		entry:
%c1 = icmp slt <4 x i32> %a, zeroinitializer		%c1 = icmp slt <4 x i32> %a, zeroinitializer
%c2 = icmp sgt <4 x i32> %b, zeroinitializer		%c2 = icmp sgt <4 x i32> %b, zeroinitializer
%c3 = icmp eq <4 x i32> %c, zeroinitializer		%c3 = icmp eq <4 x i32> %c, zeroinitializer
%o1 = and <4 x i1> %c1, %c2		%o1 = and <4 x i1> %c1, %c2
%o2 = xor <4 x i1> %o1, <i1 -1, i1 -1, i1 -1, i1 -1>		%o2 = xor <4 x i1> %o1, <i1 -1, i1 -1, i1 -1, i1 -1>
%o = and <4 x i1> %c3, %o2		%o = and <4 x i1> %c3, %o2
%s = select <4 x i1> %o, <4 x i32> %a, <4 x i32> %b		%s = select <4 x i1> %o, <4 x i32> %a, <4 x i32> %b
ret <4 x i32> %s		ret <4 x i32> %s
}		}

llvm/test/CodeGen/Thumb2/mve-pred-threshold.ll

	Show All 13 Lines
	; CHECK-NEXT: movs r3, #1			; CHECK-NEXT: movs r3, #1
	; CHECK-NEXT: vmov.i32 q0, #0x0			; CHECK-NEXT: vmov.i32 q0, #0x0
	; CHECK-NEXT: add.w lr, r3, r1, lsr #2			; CHECK-NEXT: add.w lr, r3, r1, lsr #2
	; CHECK-NEXT: rsbs r1, r2, #0			; CHECK-NEXT: rsbs r1, r2, #0
	; CHECK-NEXT: dls lr, lr			; CHECK-NEXT: dls lr, lr
	; CHECK-NEXT: .LBB0_1: @ %vector.body			; CHECK-NEXT: .LBB0_1: @ %vector.body
	; CHECK-NEXT: @ =>This Inner Loop Header: Depth=1			; CHECK-NEXT: @ =>This Inner Loop Header: Depth=1
	; CHECK-NEXT: vldrw.u32 q1, [r0]			; CHECK-NEXT: vldrw.u32 q1, [r0]
	; CHECK-NEXT: vpt.s32 ge, q1, r2			; CHECK-NEXT: vpte.s32 ge, q1, r2
	; CHECK-NEXT: vcmpt.s32 le, q1, r1			; CHECK-NEXT: vcmpt.s32 le, q1, r1
	; CHECK-NEXT: vpnot			; CHECK-NEXT: vstrwe.32 q0, [r0], #16
	; CHECK-NEXT: vpst
	; CHECK-NEXT: vstrwt.32 q0, [r0], #16
	; CHECK-NEXT: le lr, .LBB0_1			; CHECK-NEXT: le lr, .LBB0_1
	; CHECK-NEXT: @ %bb.2: @ %for.cond.cleanup			; CHECK-NEXT: @ %bb.2: @ %for.cond.cleanup
	; CHECK-NEXT: pop {r7, pc}			; CHECK-NEXT: pop {r7, pc}
	entry:			entry:
	%conv = zext i16 %N to i32			%conv = zext i16 %N to i32
	%mul = shl nuw nsw i32 %conv, 2			%mul = shl nuw nsw i32 %conv, 2
	%cmp15 = icmp eq i16 %N, 0			%cmp15 = icmp eq i16 %N, 0
	br i1 %cmp15, label %for.cond.cleanup, label %vector.ph			br i1 %cmp15, label %for.cond.cleanup, label %vector.ph
	Show All 37 Lines
	; CHECK-NEXT: movs r3, #1			; CHECK-NEXT: movs r3, #1
	; CHECK-NEXT: vmov.i32 q0, #0x0			; CHECK-NEXT: vmov.i32 q0, #0x0
	; CHECK-NEXT: add.w lr, r3, r1, lsr #3			; CHECK-NEXT: add.w lr, r3, r1, lsr #3
	; CHECK-NEXT: rsbs r1, r2, #0			; CHECK-NEXT: rsbs r1, r2, #0
	; CHECK-NEXT: dls lr, lr			; CHECK-NEXT: dls lr, lr
	; CHECK-NEXT: .LBB1_1: @ %vector.body			; CHECK-NEXT: .LBB1_1: @ %vector.body
	; CHECK-NEXT: @ =>This Inner Loop Header: Depth=1			; CHECK-NEXT: @ =>This Inner Loop Header: Depth=1
	; CHECK-NEXT: vldrh.u16 q1, [r0]			; CHECK-NEXT: vldrh.u16 q1, [r0]
	; CHECK-NEXT: vpt.s16 ge, q1, r2			; CHECK-NEXT: vpte.s16 ge, q1, r2
	; CHECK-NEXT: vcmpt.s16 le, q1, r1			; CHECK-NEXT: vcmpt.s16 le, q1, r1
	; CHECK-NEXT: vpnot			; CHECK-NEXT: vstrhe.16 q0, [r0], #16
	; CHECK-NEXT: vpst
	; CHECK-NEXT: vstrht.16 q0, [r0], #16
	; CHECK-NEXT: le lr, .LBB1_1			; CHECK-NEXT: le lr, .LBB1_1
	; CHECK-NEXT: @ %bb.2: @ %for.cond.cleanup			; CHECK-NEXT: @ %bb.2: @ %for.cond.cleanup
	; CHECK-NEXT: pop {r7, pc}			; CHECK-NEXT: pop {r7, pc}
	entry:			entry:
	%conv2 = zext i16 %N to i32			%conv2 = zext i16 %N to i32
	%mul = shl nuw nsw i32 %conv2, 3			%mul = shl nuw nsw i32 %conv2, 3
	%cmp22 = icmp eq i16 %N, 0			%cmp22 = icmp eq i16 %N, 0
	br i1 %cmp22, label %for.cond.cleanup, label %vector.ph			br i1 %cmp22, label %for.cond.cleanup, label %vector.ph
	Show All 37 Lines
	; CHECK-NEXT: movs r3, #1			; CHECK-NEXT: movs r3, #1
	; CHECK-NEXT: vmov.i32 q0, #0x0			; CHECK-NEXT: vmov.i32 q0, #0x0
	; CHECK-NEXT: add.w lr, r3, r1, lsr #4			; CHECK-NEXT: add.w lr, r3, r1, lsr #4
	; CHECK-NEXT: rsbs r1, r2, #0			; CHECK-NEXT: rsbs r1, r2, #0
	; CHECK-NEXT: dls lr, lr			; CHECK-NEXT: dls lr, lr
	; CHECK-NEXT: .LBB2_1: @ %vector.body			; CHECK-NEXT: .LBB2_1: @ %vector.body
	; CHECK-NEXT: @ =>This Inner Loop Header: Depth=1			; CHECK-NEXT: @ =>This Inner Loop Header: Depth=1
	; CHECK-NEXT: vldrb.u8 q1, [r0]			; CHECK-NEXT: vldrb.u8 q1, [r0]
	; CHECK-NEXT: vpt.s8 ge, q1, r2			; CHECK-NEXT: vpte.s8 ge, q1, r2
	; CHECK-NEXT: vcmpt.s8 le, q1, r1			; CHECK-NEXT: vcmpt.s8 le, q1, r1
	; CHECK-NEXT: vpnot			; CHECK-NEXT: vstrbe.8 q0, [r0], #16
	; CHECK-NEXT: vpst
	; CHECK-NEXT: vstrbt.8 q0, [r0], #16
	; CHECK-NEXT: le lr, .LBB2_1			; CHECK-NEXT: le lr, .LBB2_1
	; CHECK-NEXT: @ %bb.2: @ %for.cond.cleanup			; CHECK-NEXT: @ %bb.2: @ %for.cond.cleanup
	; CHECK-NEXT: pop {r7, pc}			; CHECK-NEXT: pop {r7, pc}
	entry:			entry:
	%conv2 = zext i16 %N to i32			%conv2 = zext i16 %N to i32
	%mul = shl nuw nsw i32 %conv2, 4			%mul = shl nuw nsw i32 %conv2, 4
	%cmp20 = icmp eq i16 %N, 0			%cmp20 = icmp eq i16 %N, 0
	br i1 %cmp20, label %for.cond.cleanup, label %vector.ph			br i1 %cmp20, label %for.cond.cleanup, label %vector.ph
	▲ Show 20 Lines • Show All 41 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: vmov r1, s0			; CHECK-NEXT: vmov r1, s0
	; CHECK-NEXT: vdup.32 q0, r1			; CHECK-NEXT: vdup.32 q0, r1
	; CHECK-NEXT: dls lr, lr			; CHECK-NEXT: dls lr, lr
	; CHECK-NEXT: vmov r1, s4			; CHECK-NEXT: vmov r1, s4
	; CHECK-NEXT: vdup.32 q1, r1			; CHECK-NEXT: vdup.32 q1, r1
	; CHECK-NEXT: .LBB3_1: @ %vector.body			; CHECK-NEXT: .LBB3_1: @ %vector.body
	; CHECK-NEXT: @ =>This Inner Loop Header: Depth=1			; CHECK-NEXT: @ =>This Inner Loop Header: Depth=1
	; CHECK-NEXT: vldrw.u32 q3, [r0]			; CHECK-NEXT: vldrw.u32 q3, [r0]
	; CHECK-NEXT: vpt.f32 le, q0, q3			; CHECK-NEXT: vpte.f32 le, q0, q3
	; CHECK-NEXT: vcmpt.f32 le, q3, q1			; CHECK-NEXT: vcmpt.f32 le, q3, q1
	; CHECK-NEXT: vpnot			; CHECK-NEXT: vstrwe.32 q2, [r0], #16
	; CHECK-NEXT: vpst
	; CHECK-NEXT: vstrwt.32 q2, [r0], #16
	; CHECK-NEXT: le lr, .LBB3_1			; CHECK-NEXT: le lr, .LBB3_1
	; CHECK-NEXT: @ %bb.2: @ %for.cond.cleanup			; CHECK-NEXT: @ %bb.2: @ %for.cond.cleanup
	; CHECK-NEXT: pop {r7, pc}			; CHECK-NEXT: pop {r7, pc}
	entry:			entry:
	%conv = zext i16 %N to i32			%conv = zext i16 %N to i32
	%mul = shl nuw nsw i32 %conv, 2			%mul = shl nuw nsw i32 %conv, 2
	%cmp15 = icmp eq i16 %N, 0			%cmp15 = icmp eq i16 %N, 0
	br i1 %cmp15, label %for.cond.cleanup, label %vector.ph			br i1 %cmp15, label %for.cond.cleanup, label %vector.ph
	▲ Show 20 Lines • Show All 41 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: vneg.f16 s0, s0			; CHECK-NEXT: vneg.f16 s0, s0
	; CHECK-NEXT: vdup.16 q1, r1			; CHECK-NEXT: vdup.16 q1, r1
	; CHECK-NEXT: vmov r2, s0			; CHECK-NEXT: vmov r2, s0
	; CHECK-NEXT: dls lr, lr			; CHECK-NEXT: dls lr, lr
	; CHECK-NEXT: vdup.16 q0, r2			; CHECK-NEXT: vdup.16 q0, r2
	; CHECK-NEXT: .LBB4_1: @ %vector.body			; CHECK-NEXT: .LBB4_1: @ %vector.body
	; CHECK-NEXT: @ =>This Inner Loop Header: Depth=1			; CHECK-NEXT: @ =>This Inner Loop Header: Depth=1
	; CHECK-NEXT: vldrh.u16 q3, [r0]			; CHECK-NEXT: vldrh.u16 q3, [r0]
	; CHECK-NEXT: vpt.f16 le, q1, q3			; CHECK-NEXT: vpte.f16 le, q1, q3
	; CHECK-NEXT: vcmpt.f16 le, q3, q0			; CHECK-NEXT: vcmpt.f16 le, q3, q0
	; CHECK-NEXT: vpnot			; CHECK-NEXT: vstrhe.16 q2, [r0], #16
	; CHECK-NEXT: vpst
	; CHECK-NEXT: vstrht.16 q2, [r0], #16
	; CHECK-NEXT: le lr, .LBB4_1			; CHECK-NEXT: le lr, .LBB4_1
	; CHECK-NEXT: @ %bb.2: @ %for.cond.cleanup			; CHECK-NEXT: @ %bb.2: @ %for.cond.cleanup
	; CHECK-NEXT: pop {r7, pc}			; CHECK-NEXT: pop {r7, pc}
	entry:			entry:
	%0 = bitcast float %T.coerce to i32			%0 = bitcast float %T.coerce to i32
	%tmp.0.extract.trunc = trunc i32 %0 to i16			%tmp.0.extract.trunc = trunc i32 %0 to i16
	%1 = bitcast i16 %tmp.0.extract.trunc to half			%1 = bitcast i16 %tmp.0.extract.trunc to half
	%conv = zext i16 %N to i32			%conv = zext i16 %N to i32
	▲ Show 20 Lines • Show All 42 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: movs r3, #1			; CHECK-NEXT: movs r3, #1
	; CHECK-NEXT: vmov.i32 q0, #0x0			; CHECK-NEXT: vmov.i32 q0, #0x0
	; CHECK-NEXT: add.w lr, r3, r1, lsr #2			; CHECK-NEXT: add.w lr, r3, r1, lsr #2
	; CHECK-NEXT: rsbs r1, r2, #0			; CHECK-NEXT: rsbs r1, r2, #0
	; CHECK-NEXT: dls lr, lr			; CHECK-NEXT: dls lr, lr
	; CHECK-NEXT: .LBB5_1: @ %vector.body			; CHECK-NEXT: .LBB5_1: @ %vector.body
	; CHECK-NEXT: @ =>This Inner Loop Header: Depth=1			; CHECK-NEXT: @ =>This Inner Loop Header: Depth=1
	; CHECK-NEXT: vldrw.u32 q1, [r0]			; CHECK-NEXT: vldrw.u32 q1, [r0]
	; CHECK-NEXT: vpt.s32 ge, q1, r2			; CHECK-NEXT: vpte.s32 ge, q1, r2
	; CHECK-NEXT: vcmpt.s32 le, q1, r1			; CHECK-NEXT: vcmpt.s32 le, q1, r1
	; CHECK-NEXT: vpnot			; CHECK-NEXT: vstrwe.32 q0, [r0], #16
	; CHECK-NEXT: vpst
	; CHECK-NEXT: vstrwt.32 q0, [r0], #16
	; CHECK-NEXT: le lr, .LBB5_1			; CHECK-NEXT: le lr, .LBB5_1
	; CHECK-NEXT: @ %bb.2: @ %for.cond.cleanup			; CHECK-NEXT: @ %bb.2: @ %for.cond.cleanup
	; CHECK-NEXT: pop {r7, pc}			; CHECK-NEXT: pop {r7, pc}
	entry:			entry:
	%conv = zext i16 %N to i32			%conv = zext i16 %N to i32
	%mul = shl nuw nsw i32 %conv, 2			%mul = shl nuw nsw i32 %conv, 2
	%cmp15 = icmp eq i16 %N, 0			%cmp15 = icmp eq i16 %N, 0
	br i1 %cmp15, label %for.cond.cleanup, label %vector.ph			br i1 %cmp15, label %for.cond.cleanup, label %vector.ph
	Show All 37 Lines
	; CHECK-NEXT: movs r3, #1			; CHECK-NEXT: movs r3, #1
	; CHECK-NEXT: vmov.i32 q0, #0x0			; CHECK-NEXT: vmov.i32 q0, #0x0
	; CHECK-NEXT: add.w lr, r3, r1, lsr #3			; CHECK-NEXT: add.w lr, r3, r1, lsr #3
	; CHECK-NEXT: rsbs r1, r2, #0			; CHECK-NEXT: rsbs r1, r2, #0
	; CHECK-NEXT: dls lr, lr			; CHECK-NEXT: dls lr, lr
	; CHECK-NEXT: .LBB6_1: @ %vector.body			; CHECK-NEXT: .LBB6_1: @ %vector.body
	; CHECK-NEXT: @ =>This Inner Loop Header: Depth=1			; CHECK-NEXT: @ =>This Inner Loop Header: Depth=1
	; CHECK-NEXT: vldrh.u16 q1, [r0]			; CHECK-NEXT: vldrh.u16 q1, [r0]
	; CHECK-NEXT: vpt.s16 ge, q1, r2			; CHECK-NEXT: vpte.s16 ge, q1, r2
	; CHECK-NEXT: vcmpt.s16 le, q1, r1			; CHECK-NEXT: vcmpt.s16 le, q1, r1
	; CHECK-NEXT: vpnot			; CHECK-NEXT: vstrhe.16 q0, [r0], #16
	; CHECK-NEXT: vpst
	; CHECK-NEXT: vstrht.16 q0, [r0], #16
	; CHECK-NEXT: le lr, .LBB6_1			; CHECK-NEXT: le lr, .LBB6_1
	; CHECK-NEXT: @ %bb.2: @ %for.cond.cleanup			; CHECK-NEXT: @ %bb.2: @ %for.cond.cleanup
	; CHECK-NEXT: pop {r7, pc}			; CHECK-NEXT: pop {r7, pc}
	entry:			entry:
	%conv2 = zext i16 %N to i32			%conv2 = zext i16 %N to i32
	%mul = shl nuw nsw i32 %conv2, 3			%mul = shl nuw nsw i32 %conv2, 3
	%cmp22 = icmp eq i16 %N, 0			%cmp22 = icmp eq i16 %N, 0
	br i1 %cmp22, label %for.cond.cleanup, label %vector.ph			br i1 %cmp22, label %for.cond.cleanup, label %vector.ph
	Show All 37 Lines
	; CHECK-NEXT: movs r3, #1			; CHECK-NEXT: movs r3, #1
	; CHECK-NEXT: vmov.i32 q0, #0x0			; CHECK-NEXT: vmov.i32 q0, #0x0
	; CHECK-NEXT: add.w lr, r3, r1, lsr #4			; CHECK-NEXT: add.w lr, r3, r1, lsr #4
	; CHECK-NEXT: rsbs r1, r2, #0			; CHECK-NEXT: rsbs r1, r2, #0
	; CHECK-NEXT: dls lr, lr			; CHECK-NEXT: dls lr, lr
	; CHECK-NEXT: .LBB7_1: @ %vector.body			; CHECK-NEXT: .LBB7_1: @ %vector.body
	; CHECK-NEXT: @ =>This Inner Loop Header: Depth=1			; CHECK-NEXT: @ =>This Inner Loop Header: Depth=1
	; CHECK-NEXT: vldrb.u8 q1, [r0]			; CHECK-NEXT: vldrb.u8 q1, [r0]
	; CHECK-NEXT: vpt.s8 ge, q1, r2			; CHECK-NEXT: vpte.s8 ge, q1, r2
	; CHECK-NEXT: vcmpt.s8 le, q1, r1			; CHECK-NEXT: vcmpt.s8 le, q1, r1
	; CHECK-NEXT: vpnot			; CHECK-NEXT: vstrbe.8 q0, [r0], #16
	; CHECK-NEXT: vpst
	; CHECK-NEXT: vstrbt.8 q0, [r0], #16
	; CHECK-NEXT: le lr, .LBB7_1			; CHECK-NEXT: le lr, .LBB7_1
	; CHECK-NEXT: @ %bb.2: @ %for.cond.cleanup			; CHECK-NEXT: @ %bb.2: @ %for.cond.cleanup
	; CHECK-NEXT: pop {r7, pc}			; CHECK-NEXT: pop {r7, pc}
	entry:			entry:
	%conv2 = zext i16 %N to i32			%conv2 = zext i16 %N to i32
	%mul = shl nuw nsw i32 %conv2, 4			%mul = shl nuw nsw i32 %conv2, 4
	%cmp20 = icmp eq i16 %N, 0			%cmp20 = icmp eq i16 %N, 0
	br i1 %cmp20, label %for.cond.cleanup, label %vector.ph			br i1 %cmp20, label %for.cond.cleanup, label %vector.ph
	▲ Show 20 Lines • Show All 41 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: vmov r1, s0			; CHECK-NEXT: vmov r1, s0
	; CHECK-NEXT: vdup.32 q0, r1			; CHECK-NEXT: vdup.32 q0, r1
	; CHECK-NEXT: dls lr, lr			; CHECK-NEXT: dls lr, lr
	; CHECK-NEXT: vmov r1, s4			; CHECK-NEXT: vmov r1, s4
	; CHECK-NEXT: vdup.32 q1, r1			; CHECK-NEXT: vdup.32 q1, r1
	; CHECK-NEXT: .LBB8_1: @ %vector.body			; CHECK-NEXT: .LBB8_1: @ %vector.body
	; CHECK-NEXT: @ =>This Inner Loop Header: Depth=1			; CHECK-NEXT: @ =>This Inner Loop Header: Depth=1
	; CHECK-NEXT: vldrw.u32 q3, [r0]			; CHECK-NEXT: vldrw.u32 q3, [r0]
	; CHECK-NEXT: vpt.f32 le, q0, q3			; CHECK-NEXT: vpte.f32 le, q0, q3
	; CHECK-NEXT: vcmpt.f32 le, q3, q1			; CHECK-NEXT: vcmpt.f32 le, q3, q1
	; CHECK-NEXT: vpnot			; CHECK-NEXT: vstrwe.32 q2, [r0], #16
	; CHECK-NEXT: vpst
	; CHECK-NEXT: vstrwt.32 q2, [r0], #16
	; CHECK-NEXT: le lr, .LBB8_1			; CHECK-NEXT: le lr, .LBB8_1
	; CHECK-NEXT: @ %bb.2: @ %for.cond.cleanup			; CHECK-NEXT: @ %bb.2: @ %for.cond.cleanup
	; CHECK-NEXT: pop {r7, pc}			; CHECK-NEXT: pop {r7, pc}
	entry:			entry:
	%conv = zext i16 %N to i32			%conv = zext i16 %N to i32
	%mul = shl nuw nsw i32 %conv, 2			%mul = shl nuw nsw i32 %conv, 2
	%cmp15 = icmp eq i16 %N, 0			%cmp15 = icmp eq i16 %N, 0
	br i1 %cmp15, label %for.cond.cleanup, label %vector.ph			br i1 %cmp15, label %for.cond.cleanup, label %vector.ph
	▲ Show 20 Lines • Show All 41 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: vneg.f16 s0, s0			; CHECK-NEXT: vneg.f16 s0, s0
	; CHECK-NEXT: vdup.16 q1, r1			; CHECK-NEXT: vdup.16 q1, r1
	; CHECK-NEXT: vmov r2, s0			; CHECK-NEXT: vmov r2, s0
	; CHECK-NEXT: dls lr, lr			; CHECK-NEXT: dls lr, lr
	; CHECK-NEXT: vdup.16 q0, r2			; CHECK-NEXT: vdup.16 q0, r2
	; CHECK-NEXT: .LBB9_1: @ %vector.body			; CHECK-NEXT: .LBB9_1: @ %vector.body
	; CHECK-NEXT: @ =>This Inner Loop Header: Depth=1			; CHECK-NEXT: @ =>This Inner Loop Header: Depth=1
	; CHECK-NEXT: vldrh.u16 q3, [r0]			; CHECK-NEXT: vldrh.u16 q3, [r0]
	; CHECK-NEXT: vpt.f16 le, q1, q3			; CHECK-NEXT: vpte.f16 le, q1, q3
	; CHECK-NEXT: vcmpt.f16 le, q3, q0			; CHECK-NEXT: vcmpt.f16 le, q3, q0
	; CHECK-NEXT: vpnot			; CHECK-NEXT: vstrhe.16 q2, [r0], #16
	; CHECK-NEXT: vpst
	; CHECK-NEXT: vstrht.16 q2, [r0], #16
	; CHECK-NEXT: le lr, .LBB9_1			; CHECK-NEXT: le lr, .LBB9_1
	; CHECK-NEXT: @ %bb.2: @ %for.cond.cleanup			; CHECK-NEXT: @ %bb.2: @ %for.cond.cleanup
	; CHECK-NEXT: pop {r7, pc}			; CHECK-NEXT: pop {r7, pc}
	entry:			entry:
	%0 = bitcast float %T.coerce to i32			%0 = bitcast float %T.coerce to i32
	%tmp.0.extract.trunc = trunc i32 %0 to i16			%tmp.0.extract.trunc = trunc i32 %0 to i16
	%1 = bitcast i16 %tmp.0.extract.trunc to half			%1 = bitcast i16 %tmp.0.extract.trunc to half
	%conv = zext i16 %N to i32			%conv = zext i16 %N to i32
	Show All 38 Lines

llvm/test/CodeGen/Thumb2/mve-vpt-3-blocks-kill-vpr.mir

	Show First 20 Lines • Show All 62 Lines • ▼ Show 20 Lines
	body: \|			body: \|
	bb.0.entry:			bb.0.entry:
	liveins: $q0, $q1, $q2, $r0			liveins: $q0, $q1, $q2, $r0

	; CHECK-LABEL: name: vpt_3_blocks_kill_vpr			; CHECK-LABEL: name: vpt_3_blocks_kill_vpr
	; CHECK: liveins: $q0, $q1, $q2, $r0			; CHECK: liveins: $q0, $q1, $q2, $r0
	; CHECK: $vpr = VMSR_P0 killed $r0, 14 /* CC::al */, $noreg			; CHECK: $vpr = VMSR_P0 killed $r0, 14 /* CC::al */, $noreg
	; CHECK: $q3 = MVE_VORR $q0, $q0, 0, $noreg, undef $q3			; CHECK: $q3 = MVE_VORR $q0, $q0, 0, $noreg, undef $q3
	; CHECK: BUNDLE implicit-def $q3, implicit-def $d6, implicit-def $s12, implicit-def $s13, implicit-def $d7, implicit-def $s14, implicit-def $s15, implicit $vpr, implicit killed $q1, implicit $q2, implicit killed $q3 {			; CHECK: BUNDLE implicit-def dead $q3, implicit-def $d6, implicit-def $s12, implicit-def $s13, implicit-def $d7, implicit-def $s14, implicit-def $s15, implicit-def $vpr, implicit-def $q1, implicit-def $d2, implicit-def $s4, implicit-def $s5, implicit-def $d3, implicit-def $s6, implicit-def $s7, implicit killed $vpr, implicit killed $q1, implicit $q2, implicit killed $q3 {
	; CHECK: MVE_VPST 8, implicit $vpr			; CHECK: MVE_VPST 12, implicit $vpr
	; CHECK: renamable $q3 = nnan ninf nsz MVE_VMINNMf32 killed renamable $q1, renamable $q2, 1, renamable $vpr, killed renamable $q3			; CHECK: renamable $q3 = nnan ninf nsz MVE_VMINNMf32 killed renamable $q1, renamable $q2, 1, renamable $vpr, killed renamable $q3
	; CHECK: }			; CHECK: renamable $q1 = nnan ninf nsz MVE_VMINNMf32 internal killed renamable $q3, internal renamable $q3, 2, internal renamable $vpr, undef renamable $q1
	; CHECK: renamable $vpr = MVE_VPNOT killed renamable $vpr, 0, $noreg
	; CHECK: BUNDLE implicit-def $q1, implicit-def $d2, implicit-def $s4, implicit-def $s5, implicit-def $d3, implicit-def $s6, implicit-def $s7, implicit $vpr, implicit killed $q3, implicit undef $q1 {
	; CHECK: MVE_VPST 8, implicit $vpr
	; CHECK: renamable $q1 = nnan ninf nsz MVE_VMINNMf32 killed renamable $q3, renamable $q3, 1, renamable $vpr, undef renamable $q1
	; CHECK: }			; CHECK: }
	; CHECK: $q3 = MVE_VORR $q0, $q0, 0, $noreg, undef $q3			; CHECK: $q3 = MVE_VORR $q0, $q0, 0, $noreg, undef $q3
	; CHECK: BUNDLE implicit-def dead $q3, implicit-def $d6, implicit-def $s12, implicit-def $s13, implicit-def $d7, implicit-def $s14, implicit-def $s15, implicit-def $q0, implicit-def $d0, implicit-def $s0, implicit-def $s1, implicit-def $d1, implicit-def $s2, implicit-def $s3, implicit killed $vpr, implicit killed $q1, implicit killed $q2, implicit killed $q3, implicit killed $q0 {			; CHECK: BUNDLE implicit-def dead $q3, implicit-def $d6, implicit-def $s12, implicit-def $s13, implicit-def $d7, implicit-def $s14, implicit-def $s15, implicit-def $q0, implicit-def $d0, implicit-def $s0, implicit-def $s1, implicit-def $d1, implicit-def $s2, implicit-def $s3, implicit killed $vpr, implicit killed $q1, implicit killed $q2, implicit killed $q3, implicit killed $q0 {
	; CHECK: MVE_VPST 4, implicit $vpr			; CHECK: MVE_VPST 4, implicit $vpr
	; CHECK: renamable $q3 = nnan ninf nsz MVE_VMINNMf32 killed renamable $q1, renamable $q2, 1, renamable $vpr, killed renamable $q3			; CHECK: renamable $q3 = nnan ninf nsz MVE_VMINNMf32 killed renamable $q1, renamable $q2, 1, renamable $vpr, killed renamable $q3
	; CHECK: renamable $q0 = nnan ninf nsz MVE_VMINNMf32 internal killed renamable $q3, killed renamable $q2, 1, killed renamable $vpr, killed renamable $q0			; CHECK: renamable $q0 = nnan ninf nsz MVE_VMINNMf32 internal killed renamable $q3, killed renamable $q2, 1, killed renamable $vpr, killed renamable $q0
	; CHECK: }			; CHECK: }
	; CHECK: tBX_RET 14 /* CC::al */, $noreg, implicit $q0			; CHECK: tBX_RET 14 /* CC::al */, $noreg, implicit $q0
	Show All 11 Lines

llvm/test/CodeGen/Thumb2/mve-vpt-nots.mir

Show First 20 Lines • Show All 55 Lines • ▼ Show 20 Lines	liveins:
- { reg: '$q1', virtual-reg: '' }		- { reg: '$q1', virtual-reg: '' }
- { reg: '$q2', virtual-reg: '' }		- { reg: '$q2', virtual-reg: '' }
body: \|		body: \|
bb.0.entry:		bb.0.entry:
liveins: $q0, $q1, $q2		liveins: $q0, $q1, $q2

; CHECK-LABEL: name: vpnot		; CHECK-LABEL: name: vpnot
; CHECK: liveins: $q0, $q1, $q2		; CHECK: liveins: $q0, $q1, $q2
; CHECK: BUNDLE implicit-def $vpr, implicit $q0, implicit $zr, implicit $q1 {		; CHECK: BUNDLE implicit-def $vpr, implicit $q0, implicit $zr, implicit $q1, implicit killed $q2 {
; CHECK: MVE_VPTv4s32r 8, renamable $q0, $zr, 11, implicit-def $vpr		; CHECK: MVE_VPTv4s32r 12, renamable $q0, $zr, 11, implicit-def $vpr
; CHECK: renamable $vpr = MVE_VCMPs32r renamable $q1, $zr, 12, 1, internal killed renamable $vpr		; CHECK: renamable $vpr = MVE_VCMPs32r renamable $q1, $zr, 12, 1, internal killed renamable $vpr
; CHECK: }		; CHECK: renamable $vpr = MVE_VCMPi32r killed renamable $q2, $zr, 0, 2, internal killed renamable $vpr
; CHECK: renamable $vpr = MVE_VPNOT killed renamable $vpr, 0, $noreg
; CHECK: BUNDLE implicit-def $vpr, implicit killed $vpr, implicit killed $q2, implicit $zr {
; CHECK: MVE_VPST 8, implicit $vpr
; CHECK: renamable $vpr = MVE_VCMPi32r killed renamable $q2, $zr, 0, 1, killed renamable $vpr
; CHECK: }		; CHECK: }
; CHECK: renamable $q0 = MVE_VPSEL killed renamable $q0, killed renamable $q1, 0, killed renamable $vpr		; CHECK: renamable $q0 = MVE_VPSEL killed renamable $q0, killed renamable $q1, 0, killed renamable $vpr
; CHECK: tBX_RET 14 /* CC::al */, $noreg, implicit $q0		; CHECK: tBX_RET 14 /* CC::al */, $noreg, implicit $q0
renamable $vpr = MVE_VCMPs32r renamable $q0, $zr, 11, 0, $noreg		renamable $vpr = MVE_VCMPs32r renamable $q0, $zr, 11, 0, $noreg
renamable $vpr = MVE_VCMPs32r renamable $q1, $zr, 12, 1, killed renamable $vpr		renamable $vpr = MVE_VCMPs32r renamable $q1, $zr, 12, 1, killed renamable $vpr
renamable $vpr = MVE_VPNOT killed renamable $vpr, 0, $noreg		renamable $vpr = MVE_VPNOT killed renamable $vpr, 0, $noreg
renamable $vpr = MVE_VCMPi32r killed renamable $q2, $zr, 0, 1, killed renamable $vpr		renamable $vpr = MVE_VCMPi32r killed renamable $q2, $zr, 0, 1, killed renamable $vpr
renamable $q0 = MVE_VPSEL killed renamable $q0, killed renamable $q1, 0, killed renamable $vpr		renamable $q0 = MVE_VPSEL killed renamable $q0, killed renamable $q1, 0, killed renamable $vpr
▲ Show 20 Lines • Show All 159 Lines • ▼ Show 20 Lines
body: \|		body: \|
bb.0.entry:		bb.0.entry:
liveins: $q0, $q1, $q2		liveins: $q0, $q1, $q2

; CHECK-LABEL: name: vpnot_many		; CHECK-LABEL: name: vpnot_many
; CHECK: liveins: $q0, $q1, $q2		; CHECK: liveins: $q0, $q1, $q2
; CHECK: renamable $vpr = MVE_VCMPs32r renamable $q0, $zr, 11, 0, $noreg		; CHECK: renamable $vpr = MVE_VCMPs32r renamable $q0, $zr, 11, 0, $noreg
; CHECK: renamable $vpr = MVE_VPNOT killed renamable $vpr, 0, $noreg		; CHECK: renamable $vpr = MVE_VPNOT killed renamable $vpr, 0, $noreg
; CHECK: BUNDLE implicit-def $vpr, implicit killed $vpr, implicit $q1, implicit $zr {		; CHECK: BUNDLE implicit-def $vpr, implicit killed $vpr, implicit $q1, implicit $zr, implicit killed $q2 {
; CHECK: MVE_VPST 8, implicit $vpr		; CHECK: MVE_VPST 12, implicit $vpr
; CHECK: renamable $vpr = MVE_VCMPs32r renamable $q1, $zr, 12, 1, killed renamable $vpr		; CHECK: renamable $vpr = MVE_VCMPs32r renamable $q1, $zr, 12, 1, killed renamable $vpr
; CHECK: }		; CHECK: renamable $vpr = MVE_VCMPi32r killed renamable $q2, $zr, 0, 2, internal killed renamable $vpr
; CHECK: renamable $vpr = MVE_VPNOT killed renamable $vpr, 0, $noreg
; CHECK: BUNDLE implicit-def $vpr, implicit killed $vpr, implicit killed $q2, implicit $zr {
; CHECK: MVE_VPST 8, implicit $vpr
; CHECK: renamable $vpr = MVE_VCMPi32r killed renamable $q2, $zr, 0, 1, killed renamable $vpr
; CHECK: }		; CHECK: }
; CHECK: renamable $vpr = MVE_VPNOT killed renamable $vpr, 0, $noreg		; CHECK: renamable $vpr = MVE_VPNOT killed renamable $vpr, 0, $noreg
; CHECK: renamable $q0 = MVE_VPSEL killed renamable $q0, killed renamable $q1, 0, killed renamable $vpr		; CHECK: renamable $q0 = MVE_VPSEL killed renamable $q0, killed renamable $q1, 0, killed renamable $vpr
; CHECK: tBX_RET 14 /* CC::al */, $noreg, implicit $q0		; CHECK: tBX_RET 14 /* CC::al */, $noreg, implicit $q0
renamable $vpr = MVE_VCMPs32r renamable $q0, $zr, 11, 0, $noreg		renamable $vpr = MVE_VCMPs32r renamable $q0, $zr, 11, 0, $noreg
renamable $vpr = MVE_VPNOT killed renamable $vpr, 0, $noreg		renamable $vpr = MVE_VPNOT killed renamable $vpr, 0, $noreg
renamable $vpr = MVE_VCMPs32r renamable $q1, $zr, 12, 1, killed renamable $vpr		renamable $vpr = MVE_VCMPs32r renamable $q1, $zr, 12, 1, killed renamable $vpr
renamable $vpr = MVE_VPNOT killed renamable $vpr, 0, $noreg		renamable $vpr = MVE_VPNOT killed renamable $vpr, 0, $noreg
renamable $vpr = MVE_VCMPi32r killed renamable $q2, $zr, 0, 1, killed renamable $vpr		renamable $vpr = MVE_VCMPi32r killed renamable $q2, $zr, 0, 1, killed renamable $vpr
renamable $vpr = MVE_VPNOT killed renamable $vpr, 0, $noreg		renamable $vpr = MVE_VPNOT killed renamable $vpr, 0, $noreg
renamable $q0 = MVE_VPSEL killed renamable $q0, killed renamable $q1, 0, killed renamable $vpr		renamable $q0 = MVE_VPSEL killed renamable $q0, killed renamable $q1, 0, killed renamable $vpr
tBX_RET 14, $noreg, implicit $q0		tBX_RET 14, $noreg, implicit $q0

...		...

This is an archive of the discontinued LLVM Phabricator instance.

[Target][ARM] Improvements to the VPT Block Insertion Pass
ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 249877

llvm/lib/Target/ARM/MVEVPTBlockPass.cpp

llvm/test/CodeGen/Thumb2/mve-pred-not.ll

llvm/test/CodeGen/Thumb2/mve-pred-threshold.ll

llvm/test/CodeGen/Thumb2/mve-vpt-3-blocks-kill-vpr.mir

llvm/test/CodeGen/Thumb2/mve-vpt-nots.mir

This is an archive of the discontinued LLVM Phabricator instance.

[Target][ARM] Improvements to the VPT Block Insertion PassClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 249877

llvm/lib/Target/ARM/MVEVPTBlockPass.cpp

llvm/test/CodeGen/Thumb2/mve-pred-not.ll

llvm/test/CodeGen/Thumb2/mve-pred-threshold.ll

llvm/test/CodeGen/Thumb2/mve-vpt-3-blocks-kill-vpr.mir

llvm/test/CodeGen/Thumb2/mve-vpt-nots.mir

[Target][ARM] Improvements to the VPT Block Insertion Pass
ClosedPublic