Diff 382752

llvm/include/llvm/CodeGen/TargetInstrInfo.h

Show First 20 Lines • Show All 576 Lines • ▼ Show 20 Lines	public:
}		}

/// \returns The block that branch instruction \p MI jumps to.		/// \returns The block that branch instruction \p MI jumps to.
virtual MachineBasicBlock *getBranchDestBlock(const MachineInstr &MI) const {		virtual MachineBasicBlock *getBranchDestBlock(const MachineInstr &MI) const {
llvm_unreachable("target did not implement");		llvm_unreachable("target did not implement");
}		}

/// Insert an unconditional indirect branch at the end of \p MBB to \p		/// Insert an unconditional indirect branch at the end of \p MBB to \p
/// NewDestBB. \p BrOffset indicates the offset of \p NewDestBB relative to		/// NewDestBB. Optionally, insert the clobbered register restoring in \p
		/// RestoreBB. \p BrOffset indicates the offset of \p NewDestBB relative to
		arsenmUnsubmitted Done Reply Inline Actions typo Optiionally arsenm: typo Optiionally
/// the offset of the position to insert the new branch.		/// the offset of the position to insert the new branch.
///		virtual void insertIndirectBranch(MachineBasicBlock &MBB,
/// \returns The number of bytes added to the block.
virtual unsigned insertIndirectBranch(MachineBasicBlock &MBB,
MachineBasicBlock &NewDestBB,		MachineBasicBlock &NewDestBB,
const DebugLoc &DL,		MachineBasicBlock &RestoreBB,
int64_t BrOffset = 0,		const DebugLoc &DL, int64_t BrOffset = 0,
RegScavenger *RS = nullptr) const {		RegScavenger *RS = nullptr) const {
llvm_unreachable("target did not implement");		llvm_unreachable("target did not implement");
}		}

/// Analyze the branching code at the end of MBB, returning		/// Analyze the branching code at the end of MBB, returning
/// true if it cannot be understood (e.g. it's a switch dispatch or isn't		/// true if it cannot be understood (e.g. it's a switch dispatch or isn't
/// implemented for a target). Upon success, this returns false and returns		/// implemented for a target). Upon success, this returns false and returns
/// with the following information in various cases:		/// with the following information in various cases:
///		///
▲ Show 20 Lines • Show All 1,430 Lines • Show Last 20 Lines

llvm/lib/CodeGen/BranchRelaxation.cpp

Show First 20 Lines • Show All 457 Lines • ▼ Show 20 Lines	if (!MBB->empty()) {

BranchBB->sortUniqueLiveIns();		BranchBB->sortUniqueLiveIns();
BranchBB->addSuccessor(DestBB);		BranchBB->addSuccessor(DestBB);
MBB->replaceSuccessor(DestBB, BranchBB);		MBB->replaceSuccessor(DestBB, BranchBB);
}		}

DebugLoc DL = MI.getDebugLoc();		DebugLoc DL = MI.getDebugLoc();
MI.eraseFromParent();		MI.eraseFromParent();
BlockInfo[BranchBB->getNumber()].Size += TII->insertIndirectBranch(
BranchBB, DestBB, DL, DestOffset - SrcOffset, RS.get());

		// Create the optional restore block and, initially, place it at the end of
		// function. That block will be placed later if it's used; otherwise, it will
		// be erased.
		MachineBasicBlock *RestoreBB = createNewBlockAfter(MF->back());

		TII->insertIndirectBranch(BranchBB, DestBB, *RestoreBB, DL,
		DestOffset - SrcOffset, RS.get());

		BlockInfo[BranchBB->getNumber()].Size = computeBlockSize(*BranchBB);
adjustBlockOffsets(*MBB);		adjustBlockOffsets(*MBB);

		// If RestoreBB is required, try to place just before DestBB.
		if (!RestoreBB->empty()) {
		// TODO: For multiple far branches to the same destination, there are
		// chances that some restore blocks could be shared if they clobber the
		// same registers and share the same restore sequence. So far, those
		// restore blocks are just duplicated for each far branch.
		assert(!DestBB->isEntryBlock());
		MachineBasicBlock PrevBB = &std::prev(DestBB->getIterator());
		arsenmUnsubmitted Done Reply Inline Actions I'm pretty sure this is illegal, you can't have a branch to the entry block arsenm: I'm pretty sure this is illegal, you can't have a branch to the entry block
		hliaoAuthorUnsubmitted Done Reply Inline Actions yeah, you are absolutely right! hliao: yeah, you are absolutely right!
		if (auto *FT = PrevBB->getFallThrough()) {
		assert(FT == DestBB);
		TII->insertUnconditionalBranch(*PrevBB, DestBB, DebugLoc());
		// Recalculate the block size.
		BlockInfo[PrevBB->getNumber()].Size = computeBlockSize(*PrevBB);
		}
		// Now, RestoreBB could be placed directly before DestBB.
		MF->splice(DestBB->getIterator(), RestoreBB->getIterator());
		// Update successors and predecessors.
		RestoreBB->addSuccessor(DestBB);
		BranchBB->replaceSuccessor(DestBB, RestoreBB);
		if (TRI->trackLivenessAfterRegAlloc(*MF))
		computeAndAddLiveIns(LiveRegs, *RestoreBB);
		// Compute the restore block size.
		BlockInfo[RestoreBB->getNumber()].Size = computeBlockSize(*RestoreBB);
		// Update the offset starting from the previous block.
		adjustBlockOffsets(*PrevBB);
		} else {
		// Remove restore block if it's not required.
		MF->erase(RestoreBB);
		}

return true;		return true;
}		}

bool BranchRelaxation::relaxBranchInstructions() {		bool BranchRelaxation::relaxBranchInstructions() {
bool Changed = false;		bool Changed = false;

// Relaxing branches involves creating new basic blocks, so re-eval		// Relaxing branches involves creating new basic blocks, so re-eval
// end() for termination.		// end() for termination.
▲ Show 20 Lines • Show All 99 Lines • Show Last 20 Lines

llvm/lib/Target/AMDGPU/SIInstrInfo.h

Show First 20 Lines • Show All 269 Lines • ▼ Show 20 Lines	public:
bool findCommutedOpIndices(MCInstrDesc Desc, unsigned & SrcOpIdx0,		bool findCommutedOpIndices(MCInstrDesc Desc, unsigned & SrcOpIdx0,
unsigned & SrcOpIdx1) const;		unsigned & SrcOpIdx1) const;

bool isBranchOffsetInRange(unsigned BranchOpc,		bool isBranchOffsetInRange(unsigned BranchOpc,
int64_t BrOffset) const override;		int64_t BrOffset) const override;

MachineBasicBlock *getBranchDestBlock(const MachineInstr &MI) const override;		MachineBasicBlock *getBranchDestBlock(const MachineInstr &MI) const override;

unsigned insertIndirectBranch(MachineBasicBlock &MBB,		void insertIndirectBranch(MachineBasicBlock &MBB,
MachineBasicBlock &NewDestBB,		MachineBasicBlock &NewDestBB,
const DebugLoc &DL,		MachineBasicBlock &RestoreBB, const DebugLoc &DL,
int64_t BrOffset,		int64_t BrOffset, RegScavenger *RS) const override;
RegScavenger *RS = nullptr) const override;

bool analyzeBranchImpl(MachineBasicBlock &MBB,		bool analyzeBranchImpl(MachineBasicBlock &MBB,
MachineBasicBlock::iterator I,		MachineBasicBlock::iterator I,
MachineBasicBlock *&TBB,		MachineBasicBlock *&TBB,
MachineBasicBlock *&FBB,		MachineBasicBlock *&FBB,
SmallVectorImpl<MachineOperand> &Cond,		SmallVectorImpl<MachineOperand> &Cond,
bool AllowModify) const;		bool AllowModify) const;

▲ Show 20 Lines • Show All 991 Lines • Show Last 20 Lines

llvm/lib/Target/AMDGPU/SIInstrInfo.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 2,217 Lines • ▼ Show 20 Lines	if (MI.getOpcode() == AMDGPU::S_SETPC_B64) {
// This would be a difficult analysis to perform, but can always be legal so		// This would be a difficult analysis to perform, but can always be legal so
// there's no need to analyze it.		// there's no need to analyze it.
return nullptr;		return nullptr;
}		}

return MI.getOperand(0).getMBB();		return MI.getOperand(0).getMBB();
}		}

unsigned SIInstrInfo::insertIndirectBranch(MachineBasicBlock &MBB,		void SIInstrInfo::insertIndirectBranch(MachineBasicBlock &MBB,
MachineBasicBlock &DestBB,		MachineBasicBlock &DestBB,
const DebugLoc &DL,		MachineBasicBlock &RestoreBB,
int64_t BrOffset,		const DebugLoc &DL, int64_t BrOffset,
RegScavenger *RS) const {		RegScavenger *RS) const {
assert(RS && "RegScavenger required for long branching");		assert(RS && "RegScavenger required for long branching");
assert(MBB.empty() &&		assert(MBB.empty() &&
"new block should be inserted for expanding unconditional branch");		"new block should be inserted for expanding unconditional branch");
assert(MBB.pred_size() == 1);		assert(MBB.pred_size() == 1);
		assert(RestoreBB.empty() &&
		"restore block should be inserted for restoring clobbered registers");

MachineFunction *MF = MBB.getParent();		MachineFunction *MF = MBB.getParent();
MachineRegisterInfo &MRI = MF->getRegInfo();		MachineRegisterInfo &MRI = MF->getRegInfo();

// FIXME: Virtual register workaround for RegScavenger not working with empty		// FIXME: Virtual register workaround for RegScavenger not working with empty
// blocks.		// blocks.
Register PCReg = MRI.createVirtualRegister(&AMDGPU::SReg_64RegClass);		Register PCReg = MRI.createVirtualRegister(&AMDGPU::SReg_64RegClass);

Show All 20 Lines	BuildMI(MBB, I, DL, get(AMDGPU::S_ADDC_U32))
.addReg(PCReg, RegState::Define, AMDGPU::sub1)		.addReg(PCReg, RegState::Define, AMDGPU::sub1)
.addReg(PCReg, 0, AMDGPU::sub1)		.addReg(PCReg, 0, AMDGPU::sub1)
.addSym(OffsetHi, MO_FAR_BRANCH_OFFSET);		.addSym(OffsetHi, MO_FAR_BRANCH_OFFSET);

// Insert the indirect branch after the other terminator.		// Insert the indirect branch after the other terminator.
BuildMI(&MBB, DL, get(AMDGPU::S_SETPC_B64))		BuildMI(&MBB, DL, get(AMDGPU::S_SETPC_B64))
.addReg(PCReg);		.addReg(PCReg);

auto ComputeBlockSize = [](const TargetInstrInfo *TII,
const MachineBasicBlock &MBB) {
unsigned Size = 0;
for (const MachineInstr &MI : MBB)
Size += TII->getInstSizeInBytes(MI);
return Size;
};

// FIXME: If spilling is necessary, this will fail because this scavenger has		// FIXME: If spilling is necessary, this will fail because this scavenger has
// no emergency stack slots. It is non-trivial to spill in this situation,		// no emergency stack slots. It is non-trivial to spill in this situation,
// because the restore code needs to be specially placed after the		// because the restore code needs to be specially placed after the
// jump. BranchRelaxation then needs to be made aware of the newly inserted		// jump. BranchRelaxation then needs to be made aware of the newly inserted
// block.		// block.
//		//
// If a spill is needed for the pc register pair, we need to insert a spill		// If a spill is needed for the pc register pair, we need to insert a spill
// restore block right before the destination block, and insert a short branch		// restore block right before the destination block, and insert a short branch
Show All 22 Lines	void SIInstrInfo::insertIndirectBranch(MachineBasicBlock &MBB,
// restore s[8:9]		// restore s[8:9]
// fallthrough dest_bb		// fallthrough dest_bb
///		///
// dest_bb:		// dest_bb:
// buzz;		// buzz;

RS->enterBasicBlockEnd(MBB);		RS->enterBasicBlockEnd(MBB);
Register Scav = RS->scavengeRegisterBackwards(		Register Scav = RS->scavengeRegisterBackwards(
AMDGPU::SReg_64RegClass,		AMDGPU::SReg_64RegClass, MachineBasicBlock::iterator(GetPC),
MachineBasicBlock::iterator(GetPC), false, 0);		/* RestoreAfter / false, 0, / AllowSpill */ false);
		if (Scav) {
		RS->setRegUsed(Scav);
MRI.replaceRegWith(PCReg, Scav);		MRI.replaceRegWith(PCReg, Scav);
MRI.clearVirtRegs();		MRI.clearVirtRegs();
RS->setRegUsed(Scav);		} else {
		// As SGPR needs VGPR to be spilled, we reuse the slot of temporary VGPR for
		// SGPR spill.
		const GCNSubtarget &ST = MF->getSubtarget<GCNSubtarget>();
		const SIRegisterInfo *TRI = ST.getRegisterInfo();
		TRI->spillEmergencySGPR(GetPC, RestoreBB, AMDGPU::SGPR0_SGPR1, RS);
		MRI.replaceRegWith(PCReg, AMDGPU::SGPR0_SGPR1);
		MRI.clearVirtRegs();
		}

		MCSymbol *DestLabel = Scav ? DestBB.getSymbol() : RestoreBB.getSymbol();
// Now, the distance could be defined.		// Now, the distance could be defined.
auto *Offset = MCBinaryExpr::createSub(		auto *Offset = MCBinaryExpr::createSub(
MCSymbolRefExpr::create(DestBB.getSymbol(), MCCtx),		MCSymbolRefExpr::create(DestLabel, MCCtx),
MCSymbolRefExpr::create(PostGetPCLabel, MCCtx), MCCtx);		MCSymbolRefExpr::create(PostGetPCLabel, MCCtx), MCCtx);
// Add offset assignments.		// Add offset assignments.
auto *Mask = MCConstantExpr::create(0xFFFFFFFFULL, MCCtx);		auto *Mask = MCConstantExpr::create(0xFFFFFFFFULL, MCCtx);
OffsetLo->setVariableValue(MCBinaryExpr::createAnd(Offset, Mask, MCCtx));		OffsetLo->setVariableValue(MCBinaryExpr::createAnd(Offset, Mask, MCCtx));
auto *ShAmt = MCConstantExpr::create(32, MCCtx);		auto *ShAmt = MCConstantExpr::create(32, MCCtx);
OffsetHi->setVariableValue(MCBinaryExpr::createAShr(Offset, ShAmt, MCCtx));		OffsetHi->setVariableValue(MCBinaryExpr::createAShr(Offset, ShAmt, MCCtx));
return ComputeBlockSize(this, MBB);
		return;
}		}

unsigned SIInstrInfo::getBranchOpcode(SIInstrInfo::BranchPredicate Cond) {		unsigned SIInstrInfo::getBranchOpcode(SIInstrInfo::BranchPredicate Cond) {
switch (Cond) {		switch (Cond) {
case SIInstrInfo::SCC_TRUE:		case SIInstrInfo::SCC_TRUE:
return AMDGPU::S_CBRANCH_SCC1;		return AMDGPU::S_CBRANCH_SCC1;
case SIInstrInfo::SCC_FALSE:		case SIInstrInfo::SCC_FALSE:
return AMDGPU::S_CBRANCH_SCC0;		return AMDGPU::S_CBRANCH_SCC0;
▲ Show 20 Lines • Show All 5,934 Lines • Show Last 20 Lines

llvm/lib/Target/AMDGPU/SIRegisterInfo.h

Show First 20 Lines • Show All 124 Lines • ▼ Show 20 Lines	bool spillSGPR(MachineBasicBlock::iterator MI,
LiveIntervals *LIS = nullptr,		LiveIntervals *LIS = nullptr,
bool OnlyToVGPR = false) const;		bool OnlyToVGPR = false) const;

bool restoreSGPR(MachineBasicBlock::iterator MI,		bool restoreSGPR(MachineBasicBlock::iterator MI,
int FI, RegScavenger *RS,		int FI, RegScavenger *RS,
LiveIntervals *LIS = nullptr,		LiveIntervals *LIS = nullptr,
bool OnlyToVGPR = false) const;		bool OnlyToVGPR = false) const;

		bool spillEmergencySGPR(MachineBasicBlock::iterator MI,
		MachineBasicBlock &RestoreMBB, Register SGPR,
		RegScavenger *RS) const;

void eliminateFrameIndex(MachineBasicBlock::iterator MI, int SPAdj,		void eliminateFrameIndex(MachineBasicBlock::iterator MI, int SPAdj,
unsigned FIOperandNum,		unsigned FIOperandNum,
RegScavenger *RS) const override;		RegScavenger *RS) const override;

bool eliminateSGPRToVGPRSpillFrameIndex(MachineBasicBlock::iterator MI,		bool eliminateSGPRToVGPRSpillFrameIndex(MachineBasicBlock::iterator MI,
int FI, RegScavenger *RS,		int FI, RegScavenger *RS,
LiveIntervals *LIS = nullptr) const;		LiveIntervals *LIS = nullptr) const;

▲ Show 20 Lines • Show All 239 Lines • Show Last 20 Lines

llvm/lib/Target/AMDGPU/SIRegisterInfo.cpp

Show First 20 Lines • Show All 91 Lines • ▼ Show 20 Lines	struct SGPRSpillBuilder {
bool TmpVGPRLive = false;		bool TmpVGPRLive = false;
// Scavenged SGPR to save EXEC.		// Scavenged SGPR to save EXEC.
Register SavedExecReg = AMDGPU::NoRegister;		Register SavedExecReg = AMDGPU::NoRegister;
// Stack index to write the SGPRs to.		// Stack index to write the SGPRs to.
int Index;		int Index;
unsigned EltSize = 4;		unsigned EltSize = 4;

RegScavenger *RS;		RegScavenger *RS;
MachineBasicBlock &MBB;		MachineBasicBlock *MBB;
MachineFunction &MF;		MachineFunction &MF;
SIMachineFunctionInfo &MFI;		SIMachineFunctionInfo &MFI;
const SIInstrInfo &TII;		const SIInstrInfo &TII;
const SIRegisterInfo &TRI;		const SIRegisterInfo &TRI;
bool IsWave32;		bool IsWave32;
Register ExecReg;		Register ExecReg;
unsigned MovOpc;		unsigned MovOpc;
unsigned NotOpc;		unsigned NotOpc;

SGPRSpillBuilder(const SIRegisterInfo &TRI, const SIInstrInfo &TII,		SGPRSpillBuilder(const SIRegisterInfo &TRI, const SIInstrInfo &TII,
bool IsWave32, MachineBasicBlock::iterator MI, int Index,		bool IsWave32, MachineBasicBlock::iterator MI, int Index,
RegScavenger *RS)		RegScavenger *RS)
: SuperReg(MI->getOperand(0).getReg()), MI(MI),		: SGPRSpillBuilder(TRI, TII, IsWave32, MI, MI->getOperand(0).getReg(),
IsKill(MI->getOperand(0).isKill()), DL(MI->getDebugLoc()), Index(Index),		MI->getOperand(0).isKill(), Index, RS) {}
RS(RS), MBB(MI->getParent()), MF(MBB.getParent()),
		SGPRSpillBuilder(const SIRegisterInfo &TRI, const SIInstrInfo &TII,
		bool IsWave32, MachineBasicBlock::iterator MI, Register Reg,
		bool IsKill, int Index, RegScavenger *RS)
		: SuperReg(Reg), MI(MI), IsKill(IsKill), DL(MI->getDebugLoc()),
		Index(Index), RS(RS), MBB(MI->getParent()), MF(*MBB->getParent()),
MFI(*MF.getInfo<SIMachineFunctionInfo>()), TII(TII), TRI(TRI),		MFI(*MF.getInfo<SIMachineFunctionInfo>()), TII(TII), TRI(TRI),
IsWave32(IsWave32) {		IsWave32(IsWave32) {
const TargetRegisterClass *RC = TRI.getPhysRegClass(SuperReg);		const TargetRegisterClass *RC = TRI.getPhysRegClass(SuperReg);
SplitParts = TRI.getRegSplitParts(RC, EltSize);		SplitParts = TRI.getRegSplitParts(RC, EltSize);
NumSubRegs = SplitParts.empty() ? 1 : SplitParts.size();		NumSubRegs = SplitParts.empty() ? 1 : SplitParts.size();

if (IsWave32) {		if (IsWave32) {
ExecReg = AMDGPU::EXEC_LO;		ExecReg = AMDGPU::EXEC_LO;
▲ Show 20 Lines • Show All 60 Lines • ▼ Show 20 Lines	void prepare() {
RS->setRegUsed(SuperReg);		RS->setRegUsed(SuperReg);
SavedExecReg = RS->scavengeRegister(&RC, MI, 0, false);		SavedExecReg = RS->scavengeRegister(&RC, MI, 0, false);

int64_t VGPRLanes = getPerVGPRData().VGPRLanes;		int64_t VGPRLanes = getPerVGPRData().VGPRLanes;

if (SavedExecReg) {		if (SavedExecReg) {
RS->setRegUsed(SavedExecReg);		RS->setRegUsed(SavedExecReg);
// Set exec to needed lanes		// Set exec to needed lanes
BuildMI(MBB, MI, DL, TII.get(MovOpc), SavedExecReg).addReg(ExecReg);		BuildMI(*MBB, MI, DL, TII.get(MovOpc), SavedExecReg).addReg(ExecReg);
auto I = BuildMI(MBB, MI, DL, TII.get(MovOpc), ExecReg).addImm(VGPRLanes);		auto I =
		BuildMI(*MBB, MI, DL, TII.get(MovOpc), ExecReg).addImm(VGPRLanes);
if (!TmpVGPRLive)		if (!TmpVGPRLive)
I.addReg(TmpVGPR, RegState::ImplicitDefine);		I.addReg(TmpVGPR, RegState::ImplicitDefine);
// Spill needed lanes		// Spill needed lanes
TRI.buildVGPRSpillLoadStore(this, TmpVGPRIndex, 0, /IsLoad*/ false);		TRI.buildVGPRSpillLoadStore(this, TmpVGPRIndex, 0, /IsLoad*/ false);
} else {		} else {
// Spill active lanes		// Spill active lanes
if (TmpVGPRLive)		if (TmpVGPRLive)
TRI.buildVGPRSpillLoadStore(this, TmpVGPRIndex, 0, /IsLoad*/ false,		TRI.buildVGPRSpillLoadStore(this, TmpVGPRIndex, 0, /IsLoad*/ false,
/IsKill/ false);		/IsKill/ false);
// Spill inactive lanes		// Spill inactive lanes
auto I = BuildMI(MBB, MI, DL, TII.get(NotOpc), ExecReg).addReg(ExecReg);		auto I = BuildMI(*MBB, MI, DL, TII.get(NotOpc), ExecReg).addReg(ExecReg);
if (!TmpVGPRLive)		if (!TmpVGPRLive)
I.addReg(TmpVGPR, RegState::ImplicitDefine);		I.addReg(TmpVGPR, RegState::ImplicitDefine);
TRI.buildVGPRSpillLoadStore(this, TmpVGPRIndex, 0, /IsLoad*/ false);		TRI.buildVGPRSpillLoadStore(this, TmpVGPRIndex, 0, /IsLoad*/ false);
}		}
}		}

// Writes these instructions if an SGPR can be scavenged:		// Writes these instructions if an SGPR can be scavenged:
// buffer_load_dword v1 ; Write scavenged VGPR to emergency slot		// buffer_load_dword v1 ; Write scavenged VGPR to emergency slot
// s_waitcnt vmcnt(0) ; If a free VGPR was found		// s_waitcnt vmcnt(0) ; If a free VGPR was found
// s_mov_b64 exec, s[6:7] ; Save exec		// s_mov_b64 exec, s[6:7] ; Save exec
//		//
// Writes these instructions if no SGPR can be scavenged:		// Writes these instructions if no SGPR can be scavenged:
// buffer_load_dword v0 ; Restore inactive lanes		// buffer_load_dword v0 ; Restore inactive lanes
// s_waitcnt vmcnt(0) ; If a free VGPR was found		// s_waitcnt vmcnt(0) ; If a free VGPR was found
// s_not_b64 exec, exec		// s_not_b64 exec, exec
// buffer_load_dword v0 ; Only if no free VGPR was found		// buffer_load_dword v0 ; Only if no free VGPR was found
void restore() {		void restore() {
if (SavedExecReg) {		if (SavedExecReg) {
// Restore used lanes		// Restore used lanes
TRI.buildVGPRSpillLoadStore(this, TmpVGPRIndex, 0, /IsLoad*/ true,		TRI.buildVGPRSpillLoadStore(this, TmpVGPRIndex, 0, /IsLoad*/ true,
/IsKill/ false);		/IsKill/ false);
// Restore exec		// Restore exec
auto I = BuildMI(MBB, MI, DL, TII.get(MovOpc), ExecReg)		auto I = BuildMI(*MBB, MI, DL, TII.get(MovOpc), ExecReg)
.addReg(SavedExecReg, RegState::Kill);		.addReg(SavedExecReg, RegState::Kill);
// Add an implicit use of the load so it is not dead.		// Add an implicit use of the load so it is not dead.
// FIXME This inserts an unnecessary waitcnt		// FIXME This inserts an unnecessary waitcnt
if (!TmpVGPRLive) {		if (!TmpVGPRLive) {
I.addReg(TmpVGPR, RegState::ImplicitKill);		I.addReg(TmpVGPR, RegState::ImplicitKill);
}		}
} else {		} else {
// Restore inactive lanes		// Restore inactive lanes
TRI.buildVGPRSpillLoadStore(this, TmpVGPRIndex, 0, /IsLoad*/ true,		TRI.buildVGPRSpillLoadStore(this, TmpVGPRIndex, 0, /IsLoad*/ true,
/IsKill/ false);		/IsKill/ false);
auto I = BuildMI(MBB, MI, DL, TII.get(NotOpc), ExecReg).addReg(ExecReg);		auto I = BuildMI(*MBB, MI, DL, TII.get(NotOpc), ExecReg).addReg(ExecReg);
if (!TmpVGPRLive) {		if (!TmpVGPRLive) {
I.addReg(TmpVGPR, RegState::ImplicitKill);		I.addReg(TmpVGPR, RegState::ImplicitKill);
}		}
// Restore active lanes		// Restore active lanes
if (TmpVGPRLive)		if (TmpVGPRLive)
TRI.buildVGPRSpillLoadStore(this, TmpVGPRIndex, 0, /IsLoad*/ true);		TRI.buildVGPRSpillLoadStore(this, TmpVGPRIndex, 0, /IsLoad*/ true);
}		}
}		}
Show All 9 Lines	void readWriteTmpVGPR(unsigned Offset, bool IsLoad) {
if (SavedExecReg) {		if (SavedExecReg) {
// Spill needed lanes		// Spill needed lanes
TRI.buildVGPRSpillLoadStore(*this, Index, Offset, IsLoad);		TRI.buildVGPRSpillLoadStore(*this, Index, Offset, IsLoad);
} else {		} else {
// Spill active lanes		// Spill active lanes
TRI.buildVGPRSpillLoadStore(*this, Index, Offset, IsLoad,		TRI.buildVGPRSpillLoadStore(*this, Index, Offset, IsLoad,
/IsKill/ false);		/IsKill/ false);
// Spill inactive lanes		// Spill inactive lanes
BuildMI(MBB, MI, DL, TII.get(NotOpc), ExecReg).addReg(ExecReg);		BuildMI(*MBB, MI, DL, TII.get(NotOpc), ExecReg).addReg(ExecReg);
TRI.buildVGPRSpillLoadStore(*this, Index, Offset, IsLoad);		TRI.buildVGPRSpillLoadStore(*this, Index, Offset, IsLoad);
BuildMI(MBB, MI, DL, TII.get(NotOpc), ExecReg).addReg(ExecReg);		BuildMI(*MBB, MI, DL, TII.get(NotOpc), ExecReg).addReg(ExecReg);
}		}
}		}

		void setMI(MachineBasicBlock *NewMBB, MachineBasicBlock::iterator NewMI) {
		assert(MBB->getParent() == &MF);
		MI = NewMI;
		MBB = NewMBB;
		}
};		};

} // namespace llvm		} // namespace llvm

SIRegisterInfo::SIRegisterInfo(const GCNSubtarget &ST)		SIRegisterInfo::SIRegisterInfo(const GCNSubtarget &ST)
: AMDGPUGenRegisterInfo(AMDGPU::PC_REG, ST.getAMDGPUDwarfFlavour()), ST(ST),		: AMDGPUGenRegisterInfo(AMDGPU::PC_REG, ST.getAMDGPUDwarfFlavour()), ST(ST),
SpillSGPRToVGPR(EnableSpillSGPRToVGPR), isWave32(ST.isWave32()) {		SpillSGPRToVGPR(EnableSpillSGPRToVGPR), isWave32(ST.isWave32()) {

▲ Show 20 Lines • Show All 1,055 Lines • ▼ Show 20 Lines	void SIRegisterInfo::buildVGPRSpillLoadStore(SGPRSpillBuilder &SB, int Index,
MachinePointerInfo PtrInfo = MachinePointerInfo::getFixedStack(SB.MF, Index);		MachinePointerInfo PtrInfo = MachinePointerInfo::getFixedStack(SB.MF, Index);
MachineMemOperand *MMO = SB.MF.getMachineMemOperand(		MachineMemOperand *MMO = SB.MF.getMachineMemOperand(
PtrInfo, IsLoad ? MachineMemOperand::MOLoad : MachineMemOperand::MOStore,		PtrInfo, IsLoad ? MachineMemOperand::MOLoad : MachineMemOperand::MOStore,
SB.EltSize, Alignment);		SB.EltSize, Alignment);

if (IsLoad) {		if (IsLoad) {
unsigned Opc = ST.enableFlatScratch() ? AMDGPU::SCRATCH_LOAD_DWORD_SADDR		unsigned Opc = ST.enableFlatScratch() ? AMDGPU::SCRATCH_LOAD_DWORD_SADDR
: AMDGPU::BUFFER_LOAD_DWORD_OFFSET;		: AMDGPU::BUFFER_LOAD_DWORD_OFFSET;
buildSpillLoadStore(SB.MBB, SB.MI, Opc, Index, SB.TmpVGPR, false, FrameReg,		buildSpillLoadStore(*SB.MBB, SB.MI, Opc, Index, SB.TmpVGPR, false, FrameReg,
Offset * SB.EltSize, MMO, SB.RS);		Offset * SB.EltSize, MMO, SB.RS);
} else {		} else {
unsigned Opc = ST.enableFlatScratch() ? AMDGPU::SCRATCH_STORE_DWORD_SADDR		unsigned Opc = ST.enableFlatScratch() ? AMDGPU::SCRATCH_STORE_DWORD_SADDR
: AMDGPU::BUFFER_STORE_DWORD_OFFSET;		: AMDGPU::BUFFER_STORE_DWORD_OFFSET;
buildSpillLoadStore(SB.MBB, SB.MI, Opc, Index, SB.TmpVGPR, IsKill, FrameReg,		buildSpillLoadStore(*SB.MBB, SB.MI, Opc, Index, SB.TmpVGPR, IsKill,
Offset * SB.EltSize, MMO, SB.RS);		FrameReg, Offset * SB.EltSize, MMO, SB.RS);
// This only ever adds one VGPR spill		// This only ever adds one VGPR spill
SB.MFI.addToSpilledVGPRs(1);		SB.MFI.addToSpilledVGPRs(1);
}		}
}		}

bool SIRegisterInfo::spillSGPR(MachineBasicBlock::iterator MI,		bool SIRegisterInfo::spillSGPR(MachineBasicBlock::iterator MI,
int Index,		int Index,
RegScavenger *RS,		RegScavenger *RS,
Show All 21 Lines	for (unsigned i = 0, e = SB.NumSubRegs; i < e; ++i) {
? SB.SuperReg		? SB.SuperReg
: Register(getSubReg(SB.SuperReg, SB.SplitParts[i]));		: Register(getSubReg(SB.SuperReg, SB.SplitParts[i]));
SIMachineFunctionInfo::SpilledReg Spill = VGPRSpills[i];		SIMachineFunctionInfo::SpilledReg Spill = VGPRSpills[i];

bool UseKill = SB.IsKill && i == SB.NumSubRegs - 1;		bool UseKill = SB.IsKill && i == SB.NumSubRegs - 1;

// Mark the "old value of vgpr" input undef only if this is the first sgpr		// Mark the "old value of vgpr" input undef only if this is the first sgpr
// spill to this specific vgpr in the first basic block.		// spill to this specific vgpr in the first basic block.
auto MIB = BuildMI(SB.MBB, MI, SB.DL, SB.TII.get(AMDGPU::V_WRITELANE_B32),		auto MIB = BuildMI(*SB.MBB, MI, SB.DL,
Spill.VGPR)		SB.TII.get(AMDGPU::V_WRITELANE_B32), Spill.VGPR)
.addReg(SubReg, getKillRegState(UseKill))		.addReg(SubReg, getKillRegState(UseKill))
.addImm(Spill.Lane)		.addImm(Spill.Lane)
.addReg(Spill.VGPR);		.addReg(Spill.VGPR);
if (LIS) {		if (LIS) {
if (i == 0)		if (i == 0)
LIS->ReplaceMachineInstrInMaps(MI, MIB);		LIS->ReplaceMachineInstrInMaps(MI, MIB);
else		else
LIS->InsertMachineInstrInMaps(*MIB);		LIS->InsertMachineInstrInMaps(*MIB);
Show All 29 Lines	for (unsigned Offset = 0; Offset < PVD.NumVGPRs; ++Offset) {
e = std::min((Offset + 1) * PVD.PerVGPR, SB.NumSubRegs);		e = std::min((Offset + 1) * PVD.PerVGPR, SB.NumSubRegs);
i < e; ++i) {		i < e; ++i) {
Register SubReg =		Register SubReg =
SB.NumSubRegs == 1		SB.NumSubRegs == 1
? SB.SuperReg		? SB.SuperReg
: Register(getSubReg(SB.SuperReg, SB.SplitParts[i]));		: Register(getSubReg(SB.SuperReg, SB.SplitParts[i]));

MachineInstrBuilder WriteLane =		MachineInstrBuilder WriteLane =
BuildMI(SB.MBB, MI, SB.DL, SB.TII.get(AMDGPU::V_WRITELANE_B32),		BuildMI(*SB.MBB, MI, SB.DL, SB.TII.get(AMDGPU::V_WRITELANE_B32),
SB.TmpVGPR)		SB.TmpVGPR)
.addReg(SubReg, SubKillState)		.addReg(SubReg, SubKillState)
.addImm(i % PVD.PerVGPR)		.addImm(i % PVD.PerVGPR)
.addReg(SB.TmpVGPR, TmpVGPRFlags);		.addReg(SB.TmpVGPR, TmpVGPRFlags);
TmpVGPRFlags = 0;		TmpVGPRFlags = 0;

if (LIS) {		if (LIS) {
if (i == 0)		if (i == 0)
▲ Show 20 Lines • Show All 45 Lines • ▼ Show 20 Lines	bool SIRegisterInfo::restoreSGPR(MachineBasicBlock::iterator MI,
if (SpillToVGPR) {		if (SpillToVGPR) {
for (unsigned i = 0, e = SB.NumSubRegs; i < e; ++i) {		for (unsigned i = 0, e = SB.NumSubRegs; i < e; ++i) {
Register SubReg =		Register SubReg =
SB.NumSubRegs == 1		SB.NumSubRegs == 1
? SB.SuperReg		? SB.SuperReg
: Register(getSubReg(SB.SuperReg, SB.SplitParts[i]));		: Register(getSubReg(SB.SuperReg, SB.SplitParts[i]));

SIMachineFunctionInfo::SpilledReg Spill = VGPRSpills[i];		SIMachineFunctionInfo::SpilledReg Spill = VGPRSpills[i];
auto MIB =		auto MIB = BuildMI(*SB.MBB, MI, SB.DL, SB.TII.get(AMDGPU::V_READLANE_B32),
BuildMI(SB.MBB, MI, SB.DL, SB.TII.get(AMDGPU::V_READLANE_B32), SubReg)		SubReg)
.addReg(Spill.VGPR)		.addReg(Spill.VGPR)
.addImm(Spill.Lane);		.addImm(Spill.Lane);
if (SB.NumSubRegs > 1 && i == 0)		if (SB.NumSubRegs > 1 && i == 0)
MIB.addReg(SB.SuperReg, RegState::ImplicitDefine);		MIB.addReg(SB.SuperReg, RegState::ImplicitDefine);
if (LIS) {		if (LIS) {
if (i == e - 1)		if (i == e - 1)
LIS->ReplaceMachineInstrInMaps(MI, MIB);		LIS->ReplaceMachineInstrInMaps(MI, MIB);
else		else
LIS->InsertMachineInstrInMaps(*MIB);		LIS->InsertMachineInstrInMaps(*MIB);
}		}
Show All 14 Lines	for (unsigned Offset = 0; Offset < PVD.NumVGPRs; ++Offset) {
e = std::min((Offset + 1) * PVD.PerVGPR, SB.NumSubRegs);		e = std::min((Offset + 1) * PVD.PerVGPR, SB.NumSubRegs);
i < e; ++i) {		i < e; ++i) {
Register SubReg =		Register SubReg =
SB.NumSubRegs == 1		SB.NumSubRegs == 1
? SB.SuperReg		? SB.SuperReg
: Register(getSubReg(SB.SuperReg, SB.SplitParts[i]));		: Register(getSubReg(SB.SuperReg, SB.SplitParts[i]));

bool LastSubReg = (i + 1 == e);		bool LastSubReg = (i + 1 == e);
auto MIB = BuildMI(SB.MBB, MI, SB.DL,		auto MIB = BuildMI(*SB.MBB, MI, SB.DL,
SB.TII.get(AMDGPU::V_READLANE_B32), SubReg)		SB.TII.get(AMDGPU::V_READLANE_B32), SubReg)
.addReg(SB.TmpVGPR, getKillRegState(LastSubReg))		.addReg(SB.TmpVGPR, getKillRegState(LastSubReg))
.addImm(i);		.addImm(i);
if (SB.NumSubRegs > 1 && i == 0)		if (SB.NumSubRegs > 1 && i == 0)
MIB.addReg(SB.SuperReg, RegState::ImplicitDefine);		MIB.addReg(SB.SuperReg, RegState::ImplicitDefine);
if (LIS) {		if (LIS) {
if (i == e - 1)		if (i == e - 1)
LIS->ReplaceMachineInstrInMaps(MI, MIB);		LIS->ReplaceMachineInstrInMaps(MI, MIB);
Show All 9 Lines	bool SIRegisterInfo::restoreSGPR(MachineBasicBlock::iterator MI,
MI->eraseFromParent();		MI->eraseFromParent();

if (LIS)		if (LIS)
LIS->removeAllRegUnitsForPhysReg(SB.SuperReg);		LIS->removeAllRegUnitsForPhysReg(SB.SuperReg);

return true;		return true;
}		}

		bool SIRegisterInfo::spillEmergencySGPR(MachineBasicBlock::iterator MI,
		MachineBasicBlock &RestoreMBB,
		Register SGPR, RegScavenger *RS) const {
		SGPRSpillBuilder SB(this, ST.getInstrInfo(), isWave32, MI, SGPR, false, 0,
		RS);
		SB.prepare();
		// Generate the spill of SGPR to SB.TmpVGPR.
		unsigned SubKillState = getKillRegState((SB.NumSubRegs == 1) && SB.IsKill);
		auto PVD = SB.getPerVGPRData();
		for (unsigned Offset = 0; Offset < PVD.NumVGPRs; ++Offset) {
		unsigned TmpVGPRFlags = RegState::Undef;
		// Write sub registers into the VGPR
		for (unsigned i = Offset * PVD.PerVGPR,
		e = std::min((Offset + 1) * PVD.PerVGPR, SB.NumSubRegs);
		i < e; ++i) {
		Register SubReg =
		SB.NumSubRegs == 1
		? SB.SuperReg
		: Register(getSubReg(SB.SuperReg, SB.SplitParts[i]));

		MachineInstrBuilder WriteLane =
		BuildMI(*SB.MBB, MI, SB.DL, SB.TII.get(AMDGPU::V_WRITELANE_B32),
		SB.TmpVGPR)
		.addReg(SubReg, SubKillState)
		.addImm(i % PVD.PerVGPR)
		.addReg(SB.TmpVGPR, TmpVGPRFlags);
		TmpVGPRFlags = 0;
		// There could be undef components of a spilled super register.
		// TODO: Can we detect this and skip the spill?
		if (SB.NumSubRegs > 1) {
		// The last implicit use of the SB.SuperReg carries the "Kill" flag.
		unsigned SuperKillState = 0;
		if (i + 1 == SB.NumSubRegs)
		SuperKillState \|= getKillRegState(SB.IsKill);
		WriteLane.addReg(SB.SuperReg, RegState::Implicit \| SuperKillState);
		}
		}
		// Don't need to write VGPR out.
		}

		// Restore clobbered registers in the specified restore block.
		MI = RestoreMBB.end();
		SB.setMI(&RestoreMBB, MI);
		// Generate the restore of SGPR from SB.TmpVGPR.
		for (unsigned Offset = 0; Offset < PVD.NumVGPRs; ++Offset) {
		// Don't need to load VGPR in.
		// Unpack lanes
		for (unsigned i = Offset * PVD.PerVGPR,
		e = std::min((Offset + 1) * PVD.PerVGPR, SB.NumSubRegs);
		i < e; ++i) {
		Register SubReg =
		SB.NumSubRegs == 1
		? SB.SuperReg
		: Register(getSubReg(SB.SuperReg, SB.SplitParts[i]));
		bool LastSubReg = (i + 1 == e);
		auto MIB = BuildMI(*SB.MBB, MI, SB.DL, SB.TII.get(AMDGPU::V_READLANE_B32),
		SubReg)
		.addReg(SB.TmpVGPR, getKillRegState(LastSubReg))
		.addImm(i);
		if (SB.NumSubRegs > 1 && i == 0)
		MIB.addReg(SB.SuperReg, RegState::ImplicitDefine);
		}
		}
		SB.restore();

		SB.MFI.addToSpilledSGPRs(SB.NumSubRegs);
		return false;
		}

/// Special case of eliminateFrameIndex. Returns true if the SGPR was spilled to		/// Special case of eliminateFrameIndex. Returns true if the SGPR was spilled to
/// a VGPR and the stack slot can be safely eliminated when all other users are		/// a VGPR and the stack slot can be safely eliminated when all other users are
/// handled.		/// handled.
bool SIRegisterInfo::eliminateSGPRToVGPRSpillFrameIndex(		bool SIRegisterInfo::eliminateSGPRToVGPRSpillFrameIndex(
MachineBasicBlock::iterator MI,		MachineBasicBlock::iterator MI,
int FI,		int FI,
RegScavenger *RS,		RegScavenger *RS,
LiveIntervals *LIS) const {		LiveIntervals *LIS) const {
▲ Show 20 Lines • Show All 1,017 Lines • Show Last 20 Lines

llvm/lib/Target/AVR/AVRInstrInfo.h

Show First 20 Lines • Show All 101 Lines • ▼ Show 20 Lines	public:
bool		bool
reverseBranchCondition(SmallVectorImpl<MachineOperand> &Cond) const override;		reverseBranchCondition(SmallVectorImpl<MachineOperand> &Cond) const override;

MachineBasicBlock *getBranchDestBlock(const MachineInstr &MI) const override;		MachineBasicBlock *getBranchDestBlock(const MachineInstr &MI) const override;

bool isBranchOffsetInRange(unsigned BranchOpc,		bool isBranchOffsetInRange(unsigned BranchOpc,
int64_t BrOffset) const override;		int64_t BrOffset) const override;

unsigned insertIndirectBranch(MachineBasicBlock &MBB,		void insertIndirectBranch(MachineBasicBlock &MBB,
MachineBasicBlock &NewDestBB,		MachineBasicBlock &NewDestBB,
const DebugLoc &DL, int64_t BrOffset,		MachineBasicBlock &RestoreBB, const DebugLoc &DL,
RegScavenger *RS) const override;		int64_t BrOffset, RegScavenger *RS) const override;

private:		private:
const AVRRegisterInfo RI;		const AVRRegisterInfo RI;
};		};

} // end namespace llvm		} // end namespace llvm

#endif // LLVM_AVR_INSTR_INFO_H		#endif // LLVM_AVR_INSTR_INFO_H

llvm/lib/Target/AVR/AVRInstrInfo.cpp

Show First 20 Lines • Show All 554 Lines • ▼ Show 20 Lines	bool AVRInstrInfo::isBranchOffsetInRange(unsigned BranchOp,
case AVR::BRMIk:		case AVR::BRMIk:
case AVR::BRPLk:		case AVR::BRPLk:
case AVR::BRGEk:		case AVR::BRGEk:
case AVR::BRLTk:		case AVR::BRLTk:
return isIntN(7, BrOffset);		return isIntN(7, BrOffset);
}		}
}		}

unsigned AVRInstrInfo::insertIndirectBranch(MachineBasicBlock &MBB,		void AVRInstrInfo::insertIndirectBranch(MachineBasicBlock &MBB,
MachineBasicBlock &NewDestBB,		MachineBasicBlock &NewDestBB,
const DebugLoc &DL,		MachineBasicBlock &RestoreBB,
int64_t BrOffset,		const DebugLoc &DL, int64_t BrOffset,
RegScavenger *RS) const {		RegScavenger *RS) const {
// This method inserts a direct branch (JMP), despite its name.		// This method inserts a direct branch (JMP), despite its name.
// LLVM calls this method to fixup unconditional branches; it never calls		// LLVM calls this method to fixup unconditional branches; it never calls
// insertBranch or some hypothetical "insertDirectBranch".		// insertBranch or some hypothetical "insertDirectBranch".
// See lib/CodeGen/RegisterRelaxation.cpp for details.		// See lib/CodeGen/RegisterRelaxation.cpp for details.
// We end up here when a jump is too long for a RJMP instruction.		// We end up here when a jump is too long for a RJMP instruction.
auto &MI = *BuildMI(&MBB, DL, get(AVR::JMPk)).addMBB(&NewDestBB);		BuildMI(&MBB, DL, get(AVR::JMPk)).addMBB(&NewDestBB);

return getInstSizeInBytes(MI);		return;
}		}

} // end of namespace llvm		} // end of namespace llvm

llvm/lib/Target/RISCV/RISCVInstrInfo.h

Show First 20 Lines • Show All 79 Lines • ▼ Show 20 Lines	bool analyzeBranch(MachineBasicBlock &MBB, MachineBasicBlock *&TBB,
SmallVectorImpl<MachineOperand> &Cond,		SmallVectorImpl<MachineOperand> &Cond,
bool AllowModify) const override;		bool AllowModify) const override;

unsigned insertBranch(MachineBasicBlock &MBB, MachineBasicBlock *TBB,		unsigned insertBranch(MachineBasicBlock &MBB, MachineBasicBlock *TBB,
MachineBasicBlock *FBB, ArrayRef<MachineOperand> Cond,		MachineBasicBlock *FBB, ArrayRef<MachineOperand> Cond,
const DebugLoc &dl,		const DebugLoc &dl,
int *BytesAdded = nullptr) const override;		int *BytesAdded = nullptr) const override;

unsigned insertIndirectBranch(MachineBasicBlock &MBB,		void insertIndirectBranch(MachineBasicBlock &MBB,
MachineBasicBlock &NewDestBB,		MachineBasicBlock &NewDestBB,
const DebugLoc &DL, int64_t BrOffset,		MachineBasicBlock &RestoreBB, const DebugLoc &DL,
RegScavenger *RS = nullptr) const override;		int64_t BrOffset, RegScavenger *RS) const override;

unsigned removeBranch(MachineBasicBlock &MBB,		unsigned removeBranch(MachineBasicBlock &MBB,
int *BytesRemoved = nullptr) const override;		int *BytesRemoved = nullptr) const override;

bool		bool
reverseBranchCondition(SmallVectorImpl<MachineOperand> &Cond) const override;		reverseBranchCondition(SmallVectorImpl<MachineOperand> &Cond) const override;

MachineBasicBlock *getBranchDestBlock(const MachineInstr &MI) const override;		MachineBasicBlock *getBranchDestBlock(const MachineInstr &MI) const override;
▲ Show 20 Lines • Show All 102 Lines • Show Last 20 Lines

llvm/lib/Target/RISCV/RISCVInstrInfo.cpp

Show First 20 Lines • Show All 678 Lines • ▼ Show 20 Lines	unsigned RISCVInstrInfo::insertBranch(

// Two-way conditional branch.		// Two-way conditional branch.
MachineInstr &MI = *BuildMI(&MBB, DL, get(RISCV::PseudoBR)).addMBB(FBB);		MachineInstr &MI = *BuildMI(&MBB, DL, get(RISCV::PseudoBR)).addMBB(FBB);
if (BytesAdded)		if (BytesAdded)
*BytesAdded += getInstSizeInBytes(MI);		*BytesAdded += getInstSizeInBytes(MI);
return 2;		return 2;
}		}

unsigned RISCVInstrInfo::insertIndirectBranch(MachineBasicBlock &MBB,		void RISCVInstrInfo::insertIndirectBranch(MachineBasicBlock &MBB,
MachineBasicBlock &DestBB,		MachineBasicBlock &DestBB,
const DebugLoc &DL,		MachineBasicBlock &RestoreBB,
int64_t BrOffset,		const DebugLoc &DL, int64_t BrOffset,
RegScavenger *RS) const {		RegScavenger *RS) const {
assert(RS && "RegScavenger required for long branching");		assert(RS && "RegScavenger required for long branching");
assert(MBB.empty() &&		assert(MBB.empty() &&
"new block should be inserted for expanding unconditional branch");		"new block should be inserted for expanding unconditional branch");
assert(MBB.pred_size() == 1);		assert(MBB.pred_size() == 1);

MachineFunction *MF = MBB.getParent();		MachineFunction *MF = MBB.getParent();
MachineRegisterInfo &MRI = MF->getRegInfo();		MachineRegisterInfo &MRI = MF->getRegInfo();

Show All 9 Lines	void RISCVInstrInfo::insertIndirectBranch(MachineBasicBlock &MBB,

MachineInstr &MI = *BuildMI(MBB, II, DL, get(RISCV::PseudoJump))		MachineInstr &MI = *BuildMI(MBB, II, DL, get(RISCV::PseudoJump))
.addReg(ScratchReg, RegState::Define \| RegState::Dead)		.addReg(ScratchReg, RegState::Define \| RegState::Dead)
.addMBB(&DestBB, RISCVII::MO_CALL);		.addMBB(&DestBB, RISCVII::MO_CALL);

RS->enterBasicBlockEnd(MBB);		RS->enterBasicBlockEnd(MBB);
unsigned Scav = RS->scavengeRegisterBackwards(RISCV::GPRRegClass,		unsigned Scav = RS->scavengeRegisterBackwards(RISCV::GPRRegClass,
MI.getIterator(), false, 0);		MI.getIterator(), false, 0);
		// TODO: The case when there is no scavenged register needs special handling.
		assert(Scav != RISCV::NoRegister && "No register is scavenged!");
MRI.replaceRegWith(ScratchReg, Scav);		MRI.replaceRegWith(ScratchReg, Scav);
MRI.clearVirtRegs();		MRI.clearVirtRegs();
RS->setRegUsed(Scav);		RS->setRegUsed(Scav);
return 8;
}		}
		arsenmUnsubmitted Done Reply Inline Actions Can delete the return arsenm: Can delete the return
		arsenmUnsubmitted Done Reply Inline Actions Should turn this into an assert arsenm: Should turn this into an assert

bool RISCVInstrInfo::reverseBranchCondition(		bool RISCVInstrInfo::reverseBranchCondition(
SmallVectorImpl<MachineOperand> &Cond) const {		SmallVectorImpl<MachineOperand> &Cond) const {
assert((Cond.size() == 3) && "Invalid branch condition!");		assert((Cond.size() == 3) && "Invalid branch condition!");
auto CC = static_cast<RISCVCC::CondCode>(Cond[0].getImm());		auto CC = static_cast<RISCVCC::CondCode>(Cond[0].getImm());
Cond[0].setImm(getOppositeBranchCondition(CC));		Cond[0].setImm(getOppositeBranchCondition(CC));
return false;		return false;
}		}
▲ Show 20 Lines • Show All 952 Lines • Show Last 20 Lines

llvm/test/CodeGen/AMDGPU/branch-relax-spill.ll

; RUN: not --crash llc -march=amdgcn -mcpu=tahiti -verify-machineinstrs -amdgpu-s-branch-bits=4 < %s 2>&1 \| FileCheck -check-prefix=FAIL %s		; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
		; RUN: llc -mtriple=amdgcn-amd-amdhsa -mcpu=tahiti -verify-machineinstrs -amdgpu-s-branch-bits=5 -o - %s \| FileCheck %s
		arsenmUnsubmitted Done Reply Inline Actions Can you switch this to an amdhsa triple? I want to be sure the use of the sgpr0_sgpr1 ordinarily used for the scratch buffer is tested. I think you would need to add a test variant that is a non-kernel function too arsenm: Can you switch this to an amdhsa triple? I want to be sure the use of the sgpr0_sgpr1…
		hliaoAuthorUnsubmitted Done Reply Inline Actions that none-kernel case is added. however, due to calling convention, v0 is reused for spilling SGPR and is always available for spilling SGPRs. We cannot test the no-scavenged register case. Do you have suggestions to fabricate the test case for that purpose? hliao: that none-kernel case is added. however, due to calling convention, v0 is reused for spilling…
		arsenmUnsubmitted Not Done Reply Inline Actions It's not available for spilling if there's a call that clobbers VGPRs arsenm: It's not available for spilling if there's a call that clobbers VGPRs
; FIXME: This should be able to compile, but requires inserting an
; extra block to restore the scavenged register.

; FAIL: LLVM ERROR: Error while trying to spill SGPR0_SGPR1 from class SReg_64: Cannot scavenge register without an emergency spill slot!

define amdgpu_kernel void @spill(i32 addrspace(1)* %arg, i32 %cnd) #0 {		define amdgpu_kernel void @spill(i32 addrspace(1)* %arg, i32 %cnd) #0 {
		; CHECK-LABEL: spill:
		; CHECK: ; %bb.0: ; %entry
		; CHECK-NEXT: s_load_dword s27, s[4:5], 0x2
		; CHECK-NEXT: s_mov_b64 s[98:99], s[2:3]
		; CHECK-NEXT: s_mov_b64 s[96:97], s[0:1]
		; CHECK-NEXT: s_add_u32 s96, s96, s7
		; CHECK-NEXT: s_addc_u32 s97, s97, 0
		; CHECK-NEXT: s_waitcnt lgkmcnt(0)
		; CHECK-NEXT: s_cmp_eq_u32 s27, 0
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s0, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s1, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s2, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s3, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s4, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s5, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s6, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s7, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s8, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s9, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s10, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s11, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s12, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s13, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s14, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s15, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s16, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s17, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s18, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s19, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s20, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s21, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s22, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s23, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s24, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s25, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s26, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s27, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s28, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s29, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s30, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s31, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s32, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s33, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s34, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s35, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s36, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s37, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s38, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s39, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s40, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s41, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s42, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s43, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s44, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s45, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s46, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s47, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s48, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s49, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s50, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s51, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s52, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s53, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s54, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s55, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s56, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s57, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s58, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s59, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s60, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s61, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s62, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s63, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s64, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s65, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s66, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s67, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s68, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s69, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s70, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s71, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s72, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s73, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s74, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s75, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s76, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s77, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s78, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s79, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s80, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s81, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s82, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s83, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s84, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s85, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s86, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s87, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s88, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s89, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s90, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s91, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s92, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s93, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s94, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s95, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s96, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s97, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s98, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s99, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s100, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 s101, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 vcc_lo, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: s_mov_b32 vcc_hi, 0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: s_cbranch_scc0 BB0_1
		; CHECK-NEXT: BB0_3: ; %entry
		; CHECK-NEXT: s_not_b64 exec, exec
		; CHECK-NEXT: buffer_store_dword v0, off, s[96:99], 0
		; CHECK-NEXT: v_writelane_b32 v0, s0, 0
		; CHECK-NEXT: v_writelane_b32 v0, s1, 1
		arsenmUnsubmitted Not Done Reply Inline Actions Where did this frame index come from? arsenm: Where did this frame index come from?
		hliaoAuthorUnsubmitted Done Reply Inline Actions That's the scavenge frame index previously added in https://reviews.llvm.org/D96336. Here, we need to spill an SGPR into a VGPR, which needs spilling into a frame slow when no VGPR could be scavenged. hliao: That's the scavenge frame index previously added in https://reviews.llvm.org/D96336. Here, we…
		; CHECK-NEXT: s_getpc_b64 s[0:1]
		; CHECK-NEXT: .Lpost_getpc0:
		; CHECK-NEXT: s_add_u32 s0, s0, (BB0_4-.Lpost_getpc0)&4294967295
		; CHECK-NEXT: s_addc_u32 s1, s1, (BB0_4-.Lpost_getpc0)>>32
		; CHECK-NEXT: s_setpc_b64 s[0:1]
		; CHECK-NEXT: BB0_1: ; %bb2
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: v_nop_e64
		; CHECK-NEXT: v_nop_e64
		; CHECK-NEXT: v_nop_e64
		; CHECK-NEXT: v_nop_e64
		; CHECK-NEXT: v_nop_e64
		; CHECK-NEXT: v_nop_e64
		; CHECK-NEXT: v_nop_e64
		; CHECK-NEXT: v_nop_e64
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: s_branch BB0_2
		; CHECK-NEXT: BB0_4: ; %bb3
		; CHECK-NEXT: v_readlane_b32 s0, v0, 0
		; CHECK-NEXT: v_readlane_b32 s1, v0, 1
		; CHECK-NEXT: buffer_load_dword v0, off, s[96:99], 0
		; CHECK-NEXT: s_not_b64 exec, exec
		; CHECK-NEXT: BB0_2: ; %bb3
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s0
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s1
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s2
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s3
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s4
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s5
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s6
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s7
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s8
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s9
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s10
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s11
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s12
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s13
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s14
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s15
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s16
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s17
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s18
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s19
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s20
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s21
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s22
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s23
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s24
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s25
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s26
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s27
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s28
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s29
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s30
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s31
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s32
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s33
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s34
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s35
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s36
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s37
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s38
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s39
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s40
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s41
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s42
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s43
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s44
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s45
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s46
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s47
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s48
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s49
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s50
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s51
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s52
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s53
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s54
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s55
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s56
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s57
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s58
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s59
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s60
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s61
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s62
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s63
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s64
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s65
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s66
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s67
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s68
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s69
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s70
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s71
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s72
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s73
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s74
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s75
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s76
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s77
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s78
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s79
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s80
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s81
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s82
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s83
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s84
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s85
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s86
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s87
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s88
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s89
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s90
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s91
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s92
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s93
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s94
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s95
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s96
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s97
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s98
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s99
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s100
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use s101
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use vcc_lo
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: ;;#ASMSTART
		; CHECK-NEXT: ; reg use vcc_hi
		; CHECK-NEXT: ;;#ASMEND
		; CHECK-NEXT: s_endpgm
entry:		entry:
%sgpr0 = tail call i32 asm sideeffect "s_mov_b32 s0, 0", "={s0}"() #0		%sgpr0 = tail call i32 asm sideeffect "s_mov_b32 s0, 0", "={s0}"() #0
%sgpr1 = tail call i32 asm sideeffect "s_mov_b32 s1, 0", "={s1}"() #0		%sgpr1 = tail call i32 asm sideeffect "s_mov_b32 s1, 0", "={s1}"() #0
%sgpr2 = tail call i32 asm sideeffect "s_mov_b32 s2, 0", "={s2}"() #0		%sgpr2 = tail call i32 asm sideeffect "s_mov_b32 s2, 0", "={s2}"() #0
%sgpr3 = tail call i32 asm sideeffect "s_mov_b32 s3, 0", "={s3}"() #0		%sgpr3 = tail call i32 asm sideeffect "s_mov_b32 s3, 0", "={s3}"() #0
%sgpr4 = tail call i32 asm sideeffect "s_mov_b32 s4, 0", "={s4}"() #0		%sgpr4 = tail call i32 asm sideeffect "s_mov_b32 s4, 0", "={s4}"() #0
%sgpr5 = tail call i32 asm sideeffect "s_mov_b32 s5, 0", "={s5}"() #0		%sgpr5 = tail call i32 asm sideeffect "s_mov_b32 s5, 0", "={s5}"() #0
%sgpr6 = tail call i32 asm sideeffect "s_mov_b32 s6, 0", "={s6}"() #0		%sgpr6 = tail call i32 asm sideeffect "s_mov_b32 s6, 0", "={s6}"() #0
▲ Show 20 Lines • Show All 92 Lines • ▼ Show 20 Lines	entry:
%sgpr99 = tail call i32 asm sideeffect "s_mov_b32 s99, 0", "={s99}"() #0		%sgpr99 = tail call i32 asm sideeffect "s_mov_b32 s99, 0", "={s99}"() #0
%sgpr100 = tail call i32 asm sideeffect "s_mov_b32 s100, 0", "={s100}"() #0		%sgpr100 = tail call i32 asm sideeffect "s_mov_b32 s100, 0", "={s100}"() #0
%sgpr101 = tail call i32 asm sideeffect "s_mov_b32 s101, 0", "={s101}"() #0		%sgpr101 = tail call i32 asm sideeffect "s_mov_b32 s101, 0", "={s101}"() #0
%vcc_lo = tail call i32 asm sideeffect "s_mov_b32 $0, 0", "={vcc_lo}"() #0		%vcc_lo = tail call i32 asm sideeffect "s_mov_b32 $0, 0", "={vcc_lo}"() #0
%vcc_hi = tail call i32 asm sideeffect "s_mov_b32 $0, 0", "={vcc_hi}"() #0		%vcc_hi = tail call i32 asm sideeffect "s_mov_b32 $0, 0", "={vcc_hi}"() #0
%cmp = icmp eq i32 %cnd, 0		%cmp = icmp eq i32 %cnd, 0
br i1 %cmp, label %bb3, label %bb2 ; +8 dword branch		br i1 %cmp, label %bb3, label %bb2 ; +8 dword branch

bb2: ; 28 bytes		bb2: ; 68 bytes
; 24 byte asm		; 64 byte asm
call void asm sideeffect		call void asm sideeffect
"v_nop_e64		"v_nop_e64
v_nop_e64		v_nop_e64
v_nop_e64		v_nop_e64
		v_nop_e64
		v_nop_e64
		v_nop_e64
		v_nop_e64
v_nop_e64",""() #0		v_nop_e64",""() #0
br label %bb3		br label %bb3

bb3:		bb3:
tail call void asm sideeffect "; reg use $0", "{s0}"(i32 %sgpr0) #0		tail call void asm sideeffect "; reg use $0", "{s0}"(i32 %sgpr0) #0
tail call void asm sideeffect "; reg use $0", "{s1}"(i32 %sgpr1) #0		tail call void asm sideeffect "; reg use $0", "{s1}"(i32 %sgpr1) #0
tail call void asm sideeffect "; reg use $0", "{s2}"(i32 %sgpr2) #0		tail call void asm sideeffect "; reg use $0", "{s2}"(i32 %sgpr2) #0
tail call void asm sideeffect "; reg use $0", "{s3}"(i32 %sgpr3) #0		tail call void asm sideeffect "; reg use $0", "{s3}"(i32 %sgpr3) #0
▲ Show 20 Lines • Show All 104 Lines • Show Last 20 Lines

This is an archive of the discontinued LLVM Phabricator instance.

[amdgpu] Handle the case where there is no scavenged register.
ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 382752

llvm/include/llvm/CodeGen/TargetInstrInfo.h

llvm/lib/CodeGen/BranchRelaxation.cpp

llvm/lib/Target/AMDGPU/SIInstrInfo.h

llvm/lib/Target/AMDGPU/SIInstrInfo.cpp

llvm/lib/Target/AMDGPU/SIRegisterInfo.h

llvm/lib/Target/AMDGPU/SIRegisterInfo.cpp

llvm/lib/Target/AVR/AVRInstrInfo.h

llvm/lib/Target/AVR/AVRInstrInfo.cpp

llvm/lib/Target/RISCV/RISCVInstrInfo.h

llvm/lib/Target/RISCV/RISCVInstrInfo.cpp

llvm/test/CodeGen/AMDGPU/branch-relax-spill.ll

This is an archive of the discontinued LLVM Phabricator instance.

[amdgpu] Handle the case where there is no scavenged register.ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 382752

llvm/include/llvm/CodeGen/TargetInstrInfo.h

llvm/lib/CodeGen/BranchRelaxation.cpp

llvm/lib/Target/AMDGPU/SIInstrInfo.h

llvm/lib/Target/AMDGPU/SIInstrInfo.cpp

llvm/lib/Target/AMDGPU/SIRegisterInfo.h

llvm/lib/Target/AMDGPU/SIRegisterInfo.cpp

llvm/lib/Target/AVR/AVRInstrInfo.h

llvm/lib/Target/AVR/AVRInstrInfo.cpp

llvm/lib/Target/RISCV/RISCVInstrInfo.h

llvm/lib/Target/RISCV/RISCVInstrInfo.cpp

llvm/test/CodeGen/AMDGPU/branch-relax-spill.ll

[amdgpu] Handle the case where there is no scavenged register.
ClosedPublic