Diff 99159

llvm/trunk/lib/Target/AMDGPU/GCNSchedStrategy.h

Show First 20 Lines • Show All 69 Lines • ▼ Show 20 Lines	class GCNScheduleDAGMILive : public ScheduleDAGMILive {
unsigned StartingOccupancy;		unsigned StartingOccupancy;

// Minimal real occupancy recorder for the function.		// Minimal real occupancy recorder for the function.
unsigned MinOccupancy;		unsigned MinOccupancy;

// Scheduling stage number.		// Scheduling stage number.
unsigned Stage;		unsigned Stage;

		// Current region index.
		size_t RegionIdx;

// Vecor of regions recorder for later rescheduling		// Vecor of regions recorder for later rescheduling
SmallVector<std::pair<MachineBasicBlock::iterator,		SmallVector<std::pair<MachineBasicBlock::iterator,
MachineBasicBlock::iterator>, 32> Regions;		MachineBasicBlock::iterator>, 32> Regions;

// Region live-ins.		// Region live-in cache.
GCNRPTracker::LiveRegSet LiveIns;		SmallVector<GCNRPTracker::LiveRegSet, 32> LiveIns;

		// Region pressure cache.
		SmallVector<GCNRegPressure, 32> Pressure;

// Collect current region live-ins.		// Temporary basic block live-in cache.
void discoverLiveIns();		DenseMap<const MachineBasicBlock*, GCNRPTracker::LiveRegSet> MBBLiveIns;

// Return current region pressure.		// Return current region pressure.
GCNRegPressure getRealRegPressure() const;		GCNRegPressure getRealRegPressure() const;

		// Compute and cache live-ins and pressure for all regions in block.
		void computeBlockPressure(const MachineBasicBlock *MBB);


public:		public:
GCNScheduleDAGMILive(MachineSchedContext *C,		GCNScheduleDAGMILive(MachineSchedContext *C,
std::unique_ptr<MachineSchedStrategy> S);		std::unique_ptr<MachineSchedStrategy> S);

void schedule() override;		void schedule() override;

void finalizeSchedule() override;		void finalizeSchedule() override;
};		};

} // End namespace llvm		} // End namespace llvm

#endif // GCNSCHEDSTRATEGY_H		#endif // GCNSCHEDSTRATEGY_H

llvm/trunk/lib/Target/AMDGPU/GCNSchedStrategy.cpp

Show First 20 Lines • Show All 310 Lines • ▼ Show 20 Lines

GCNScheduleDAGMILive::GCNScheduleDAGMILive(MachineSchedContext *C,		GCNScheduleDAGMILive::GCNScheduleDAGMILive(MachineSchedContext *C,
std::unique_ptr<MachineSchedStrategy> S) :		std::unique_ptr<MachineSchedStrategy> S) :
ScheduleDAGMILive(C, std::move(S)),		ScheduleDAGMILive(C, std::move(S)),
ST(MF.getSubtarget<SISubtarget>()),		ST(MF.getSubtarget<SISubtarget>()),
MFI(*MF.getInfo<SIMachineFunctionInfo>()),		MFI(*MF.getInfo<SIMachineFunctionInfo>()),
StartingOccupancy(ST.getOccupancyWithLocalMemSize(MFI.getLDSSize(),		StartingOccupancy(ST.getOccupancyWithLocalMemSize(MFI.getLDSSize(),
*MF.getFunction())),		*MF.getFunction())),
MinOccupancy(StartingOccupancy), Stage(0) {		MinOccupancy(StartingOccupancy), Stage(0), RegionIdx(0) {

DEBUG(dbgs() << "Starting occupancy is " << StartingOccupancy << ".\n");		DEBUG(dbgs() << "Starting occupancy is " << StartingOccupancy << ".\n");
}		}

void GCNScheduleDAGMILive::schedule() {		void GCNScheduleDAGMILive::schedule() {
		if (Stage == 0) {
		// Just record regions at the first pass.
		Regions.push_back(std::make_pair(RegionBegin, RegionEnd));
		return;
		}

std::vector<MachineInstr*> Unsched;		std::vector<MachineInstr*> Unsched;
Unsched.reserve(NumRegionInstrs);		Unsched.reserve(NumRegionInstrs);
for (auto &I : *this)		for (auto &I : *this)
Unsched.push_back(&I);		Unsched.push_back(&I);

GCNRegPressure PressureBefore;		GCNRegPressure PressureBefore;
if (LIS) {		if (LIS) {
discoverLiveIns();		PressureBefore = Pressure[RegionIdx];
PressureBefore = getRealRegPressure();

DEBUG(dbgs() << "Pressure before scheduling:\nSGPR = "		DEBUG(const SIRegisterInfo SRI = static_cast<const SIRegisterInfo>(TRI);
		dbgs() << "Pressure before scheduling:\nRegion live-ins:";
		for (unsigned I = 0, E = MRI.getNumVirtRegs(); I != E; ++I) {
		unsigned Reg = TargetRegisterInfo::index2VirtReg(I);
		auto It = LiveIns[RegionIdx].find(Reg);
		if (It != LiveIns[RegionIdx].end() && It->second.any())
		dbgs() << ' ' << PrintVRegOrUnit(Reg, SRI) << ':'
		<< PrintLaneMask(It->second);
		}
		auto P = llvm::getRegPressure(MRI, LiveIns[RegionIdx]);
		dbgs() << "\nLive-in pressure:\nSGPR = " << P.getSGPRNum()
		<< "\nVGPR = " << P.getVGPRNum()
		<< "\nReal region's register pressure:\nSGPR = "
<< PressureBefore.getSGPRNum()		<< PressureBefore.getSGPRNum()
<< "\nVGPR = " << PressureBefore.getVGPRNum() << '\n');		<< "\nVGPR = " << PressureBefore.getVGPRNum() << '\n');

}		}

ScheduleDAGMILive::schedule();		ScheduleDAGMILive::schedule();
if (Stage == 0)		Regions[RegionIdx] = std::make_pair(RegionBegin, RegionEnd);
Regions.push_back(std::make_pair(RegionBegin, RegionEnd));

if (!LIS)		if (!LIS)
return;		return;

// Check the results of scheduling.		// Check the results of scheduling.
GCNMaxOccupancySchedStrategy &S = (GCNMaxOccupancySchedStrategy&)*SchedImpl;		GCNMaxOccupancySchedStrategy &S = (GCNMaxOccupancySchedStrategy&)*SchedImpl;
auto PressureAfter = getRealRegPressure();		auto PressureAfter = getRealRegPressure();

DEBUG(dbgs() << "Pressure after scheduling:\nSGPR = "		DEBUG(dbgs() << "Pressure after scheduling:\nSGPR = "
<< PressureAfter.getSGPRNum()		<< PressureAfter.getSGPRNum()
<< "\nVGPR = " << PressureAfter.getVGPRNum() << '\n');		<< "\nVGPR = " << PressureAfter.getVGPRNum() << '\n');

LiveIns.clear();

if (PressureAfter.getSGPRNum() <= S.SGPRCriticalLimit &&		if (PressureAfter.getSGPRNum() <= S.SGPRCriticalLimit &&
PressureAfter.getVGPRNum() <= S.VGPRCriticalLimit) {		PressureAfter.getVGPRNum() <= S.VGPRCriticalLimit) {
		Pressure[RegionIdx] = PressureAfter;
DEBUG(dbgs() << "Pressure in desired limits, done.\n");		DEBUG(dbgs() << "Pressure in desired limits, done.\n");
return;		return;
}		}
unsigned WavesAfter = getMaxWaves(PressureAfter.getSGPRNum(),		unsigned WavesAfter = getMaxWaves(PressureAfter.getSGPRNum(),
PressureAfter.getVGPRNum(), MF);		PressureAfter.getVGPRNum(), MF);
unsigned WavesBefore = getMaxWaves(PressureBefore.getSGPRNum(),		unsigned WavesBefore = getMaxWaves(PressureBefore.getSGPRNum(),
PressureBefore.getVGPRNum(), MF);		PressureBefore.getVGPRNum(), MF);
DEBUG(dbgs() << "Occupancy before scheduling: " << WavesBefore <<		DEBUG(dbgs() << "Occupancy before scheduling: " << WavesBefore <<
", after " << WavesAfter << ".\n");		", after " << WavesAfter << ".\n");

// We could not keep current target occupancy because of the just scheduled		// We could not keep current target occupancy because of the just scheduled
// region. Record new occupancy for next scheduling cycle.		// region. Record new occupancy for next scheduling cycle.
unsigned NewOccupancy = std::max(WavesAfter, WavesBefore);		unsigned NewOccupancy = std::max(WavesAfter, WavesBefore);
if (NewOccupancy < MinOccupancy) {		if (NewOccupancy < MinOccupancy) {
MinOccupancy = NewOccupancy;		MinOccupancy = NewOccupancy;
DEBUG(dbgs() << "Occupancy lowered for the function to "		DEBUG(dbgs() << "Occupancy lowered for the function to "
<< MinOccupancy << ".\n");		<< MinOccupancy << ".\n");
}		}

if (WavesAfter >= WavesBefore)		if (WavesAfter >= WavesBefore) {
		Pressure[RegionIdx] = PressureAfter;
return;		return;
		}

DEBUG(dbgs() << "Attempting to revert scheduling.\n");		DEBUG(dbgs() << "Attempting to revert scheduling.\n");
RegionEnd = RegionBegin;		RegionEnd = RegionBegin;
for (MachineInstr *MI : Unsched) {		for (MachineInstr *MI : Unsched) {
if (MI->getIterator() != RegionEnd) {		if (MI->getIterator() != RegionEnd) {
BB->remove(MI);		BB->remove(MI);
BB->insert(RegionEnd, MI);		BB->insert(RegionEnd, MI);
LIS->handleMove(*MI, true);		LIS->handleMove(*MI, true);
Show All 12 Lines	if (ShouldTrackLaneMasks) {
// Adjust for missing dead-def flags.		// Adjust for missing dead-def flags.
RegOpers.detectDeadDefs(MI, LIS);		RegOpers.detectDeadDefs(MI, LIS);
}		}
RegionEnd = MI->getIterator();		RegionEnd = MI->getIterator();
++RegionEnd;		++RegionEnd;
DEBUG(dbgs() << "Scheduling " << *MI);		DEBUG(dbgs() << "Scheduling " << *MI);
}		}
RegionBegin = Unsched.front()->getIterator();		RegionBegin = Unsched.front()->getIterator();
if (Stage == 0)		Regions[RegionIdx] = std::make_pair(RegionBegin, RegionEnd);
Regions.back() = std::make_pair(RegionBegin, RegionEnd);

placeDebugValues();		placeDebugValues();
}		}

void GCNScheduleDAGMILive::discoverLiveIns() {		GCNRegPressure GCNScheduleDAGMILive::getRealRegPressure() const {
GCNDownwardRPTracker RPTracker(*LIS);		GCNDownwardRPTracker RPTracker(*LIS);
RPTracker.reset(*begin());		RPTracker.advance(begin(), end(), &LiveIns[RegionIdx]);
		return RPTracker.moveMaxPressure();
		}

LiveIns = RPTracker.moveLiveRegs();		void GCNScheduleDAGMILive::computeBlockPressure(const MachineBasicBlock *MBB) {
		GCNDownwardRPTracker RPTracker(*LIS);

DEBUG(GCNRegPressure LiveInPressure = RPTracker.moveMaxPressure();		// If the block has the only successor then live-ins of that successor are
const SIRegisterInfo SRI = static_cast<const SIRegisterInfo>(TRI);		// live-outs of the current block. We can reuse calculated live set if the
dbgs() << "Region live-ins:";		// successor will be sent to scheduling past current block.
for (unsigned I = 0, E = MRI.getNumVirtRegs(); I != E; ++I) {		const MachineBasicBlock *OnlySucc = nullptr;
unsigned Reg = TargetRegisterInfo::index2VirtReg(I);		if (MBB->succ_size() == 1 && !(*MBB->succ_begin())->empty()) {
auto It = LiveIns.find(Reg);		SlotIndexes *Ind = LIS->getSlotIndexes();
if (It != LiveIns.end())		if (Ind->getMBBStartIdx(MBB) < Ind->getMBBStartIdx(*MBB->succ_begin()))
dbgs() << ' ' << PrintVRegOrUnit(Reg, SRI) << ':'		OnlySucc = *MBB->succ_begin();
<< PrintLaneMask(It->second);		}

		// Scheduler sends regions from the end of the block upwards.
		size_t CurRegion = RegionIdx;
		for (size_t E = Regions.size(); CurRegion != E; ++CurRegion)
		if (Regions[CurRegion].first->getParent() != MBB)
		break;
		--CurRegion;

		auto I = MBB->begin();
		auto LiveInIt = MBBLiveIns.find(MBB);
		if (LiveInIt != MBBLiveIns.end()) {
		auto LiveIn = std::move(LiveInIt->second);
		RPTracker.reset(*MBB->begin(), &LiveIn);
		MBBLiveIns.erase(LiveInIt);
		} else {
		I = Regions[CurRegion].first;
		RPTracker.reset(*I);
}		}
dbgs() << "\nLive-in pressure:\nSGPR = "
<< LiveInPressure.getSGPRNum()		for ( ; ; ) {
<< "\nVGPR = " << LiveInPressure.getVGPRNum() << '\n');		I = RPTracker.getNext();

		if (Regions[CurRegion].first == I) {
		LiveIns[CurRegion] = RPTracker.getLiveRegs();
		RPTracker.clearMaxPressure();
}		}

GCNRegPressure GCNScheduleDAGMILive::getRealRegPressure() const {		if (Regions[CurRegion].second == I) {
GCNDownwardRPTracker RPTracker(*LIS);		Pressure[CurRegion] = RPTracker.moveMaxPressure();
RPTracker.advance(begin(), end(), &LiveIns);		if (CurRegion-- == RegionIdx)
return RPTracker.moveMaxPressure();		break;
		}
		RPTracker.advanceToNext();
		RPTracker.advanceBeforeNext();
		}

		if (OnlySucc) {
		if (I != MBB->end()) {
		RPTracker.advanceToNext();
		RPTracker.advance(MBB->end());
		}
		RPTracker.reset(*OnlySucc->begin(), &RPTracker.getLiveRegs());
		RPTracker.advanceBeforeNext();
		MBBLiveIns[OnlySucc] = RPTracker.moveLiveRegs();
		}
}		}

void GCNScheduleDAGMILive::finalizeSchedule() {		void GCNScheduleDAGMILive::finalizeSchedule() {
		GCNMaxOccupancySchedStrategy &S = (GCNMaxOccupancySchedStrategy&)*SchedImpl;
		DEBUG(dbgs() << "All regions recorded, starting actual scheduling.\n");

		LiveIns.resize(Regions.size());
		Pressure.resize(Regions.size());

		do {
		Stage++;
		RegionIdx = 0;
		MachineBasicBlock *MBB = nullptr;

		if (Stage > 1) {
// Retry function scheduling if we found resulting occupancy and it is		// Retry function scheduling if we found resulting occupancy and it is
// lower than used for first pass scheduling. This will give more freedom		// lower than used for first pass scheduling. This will give more freedom
// to schedule low register pressure blocks.		// to schedule low register pressure blocks.
// Code is partially copied from MachineSchedulerBase::scheduleRegions().		// Code is partially copied from MachineSchedulerBase::scheduleRegions().

if (!LIS \|\| StartingOccupancy <= MinOccupancy)		if (!LIS \|\| StartingOccupancy <= MinOccupancy)
return;		break;

DEBUG(dbgs() << "Retrying function scheduling with lowest recorded occupancy "		DEBUG(dbgs()
		<< "Retrying function scheduling with lowest recorded occupancy "
<< MinOccupancy << ".\n");		<< MinOccupancy << ".\n");

Stage++;
GCNMaxOccupancySchedStrategy &S = (GCNMaxOccupancySchedStrategy&)*SchedImpl;
S.setTargetOccupancy(MinOccupancy);		S.setTargetOccupancy(MinOccupancy);
		}

MachineBasicBlock *MBB = nullptr;
for (auto Region : Regions) {		for (auto Region : Regions) {
RegionBegin = Region.first;		RegionBegin = Region.first;
RegionEnd = Region.second;		RegionEnd = Region.second;

if (RegionBegin->getParent() != MBB) {		if (RegionBegin->getParent() != MBB) {
if (MBB) finishBlock();		if (MBB) finishBlock();
MBB = RegionBegin->getParent();		MBB = RegionBegin->getParent();
startBlock(MBB);		startBlock(MBB);
		if (Stage == 1)
		computeBlockPressure(MBB);
}		}

unsigned NumRegionInstrs = std::distance(begin(), end());		unsigned NumRegionInstrs = std::distance(begin(), end());
enterRegion(MBB, begin(), end(), NumRegionInstrs);		enterRegion(MBB, begin(), end(), NumRegionInstrs);

// Skip empty scheduling regions (0 or 1 schedulable instructions).		// Skip empty scheduling regions (0 or 1 schedulable instructions).
if (begin() == end() \|\| begin() == std::prev(end())) {		if (begin() == end() \|\| begin() == std::prev(end())) {
exitRegion();		exitRegion();
continue;		continue;
}		}

DEBUG(dbgs() << "******** MI Scheduling ********\n");		DEBUG(dbgs() << "******** MI Scheduling ********\n");
DEBUG(dbgs() << MF.getName()		DEBUG(dbgs() << MF.getName()
<< ":BB#" << MBB->getNumber() << " " << MBB->getName()		<< ":BB#" << MBB->getNumber() << " " << MBB->getName()
<< "\n From: " << *begin() << " To: ";		<< "\n From: " << *begin() << " To: ";
if (RegionEnd != MBB->end()) dbgs() << *RegionEnd;		if (RegionEnd != MBB->end()) dbgs() << *RegionEnd;
else dbgs() << "End";		else dbgs() << "End";
dbgs() << " RegionInstrs: " << NumRegionInstrs << '\n');		dbgs() << " RegionInstrs: " << NumRegionInstrs << '\n');

schedule();		schedule();

exitRegion();		exitRegion();
		++RegionIdx;
}		}
finishBlock();		finishBlock();
LiveIns.shrink_and_clear();
		} while (Stage < 2);
}		}

This is an archive of the discontinued LLVM Phabricator instance.

[AMDGPU] Cache live-ins and register pressure in scheduler
ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 99159

llvm/trunk/lib/Target/AMDGPU/GCNSchedStrategy.h

llvm/trunk/lib/Target/AMDGPU/GCNSchedStrategy.cpp

This is an archive of the discontinued LLVM Phabricator instance.

[AMDGPU] Cache live-ins and register pressure in schedulerClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 99159

llvm/trunk/lib/Target/AMDGPU/GCNSchedStrategy.h

llvm/trunk/lib/Target/AMDGPU/GCNSchedStrategy.cpp

[AMDGPU] Cache live-ins and register pressure in scheduler
ClosedPublic