Diff 462785

llvm/lib/Transforms/Scalar/StructurizeCFG.cpp

//===- StructurizeCFG.cpp -------------------------------------------------===//		//===- StructurizeCFG.cpp -------------------------------------------------===//
//		//
// Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.		// Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.
// See https://llvm.org/LICENSE.txt for license information.		// See https://llvm.org/LICENSE.txt for license information.
// SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception		// SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception
//		//
//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//

#include "llvm/Transforms/Scalar/StructurizeCFG.h"		#include "llvm/Transforms/Scalar/StructurizeCFG.h"
#include "llvm/ADT/DenseMap.h"		#include "llvm/ADT/DenseMap.h"
#include "llvm/ADT/MapVector.h"		#include "llvm/ADT/MapVector.h"
#include "llvm/ADT/SCCIterator.h"		#include "llvm/ADT/SCCIterator.h"
#include "llvm/ADT/STLExtras.h"		#include "llvm/ADT/STLExtras.h"
#include "llvm/ADT/SmallPtrSet.h"		#include "llvm/ADT/SmallPtrSet.h"
		#include "llvm/ADT/SmallSet.h"
#include "llvm/ADT/SmallVector.h"		#include "llvm/ADT/SmallVector.h"
#include "llvm/Analysis/InstructionSimplify.h"		#include "llvm/Analysis/InstructionSimplify.h"
#include "llvm/Analysis/LegacyDivergenceAnalysis.h"		#include "llvm/Analysis/LegacyDivergenceAnalysis.h"
#include "llvm/Analysis/RegionInfo.h"		#include "llvm/Analysis/RegionInfo.h"
#include "llvm/Analysis/RegionIterator.h"		#include "llvm/Analysis/RegionIterator.h"
#include "llvm/Analysis/RegionPass.h"		#include "llvm/Analysis/RegionPass.h"
#include "llvm/IR/BasicBlock.h"		#include "llvm/IR/BasicBlock.h"
#include "llvm/IR/CFG.h"		#include "llvm/IR/CFG.h"
▲ Show 20 Lines • Show All 218 Lines • ▼ Show 20 Lines	class StructurizeCFG {
Function *Func;		Function *Func;
Region *ParentRegion;		Region *ParentRegion;

LegacyDivergenceAnalysis *DA = nullptr;		LegacyDivergenceAnalysis *DA = nullptr;
DominatorTree *DT;		DominatorTree *DT;

SmallVector<RegionNode *, 8> Order;		SmallVector<RegionNode *, 8> Order;
BBSet Visited;		BBSet Visited;
		BBSet FlowSet;

SmallVector<WeakVH, 8> AffectedPhis;		SmallVector<WeakVH, 8> AffectedPhis;
BBPhiMap DeletedPhis;		BBPhiMap DeletedPhis;
BB2BBVecMap AddedPhis;		BB2BBVecMap AddedPhis;

PredMap Predicates;		PredMap Predicates;
BranchVector Conditions;		BranchVector Conditions;

Show All 16 Lines	class StructurizeCFG {
void insertConditions(bool Loops);		void insertConditions(bool Loops);

void simplifyConditions();		void simplifyConditions();

void delPhiValues(BasicBlock From, BasicBlock To);		void delPhiValues(BasicBlock From, BasicBlock To);

void addPhiValues(BasicBlock From, BasicBlock To);		void addPhiValues(BasicBlock From, BasicBlock To);

		void findUndefBlocks(BasicBlock *PHIBlock,
		const SmallSet<BasicBlock *, 8> &Incomings,
		SmallVector<BasicBlock *> &UndefBlks) const;
void setPhiValues();		void setPhiValues();

void simplifyAffectedPhis();		void simplifyAffectedPhis();

void killTerminator(BasicBlock *BB);		void killTerminator(BasicBlock *BB);

void changeExit(RegionNode Node, BasicBlock NewExit,		void changeExit(RegionNode Node, BasicBlock NewExit,
bool IncludeDominator);		bool IncludeDominator);
▲ Show 20 Lines • Show All 338 Lines • ▼ Show 20 Lines
void StructurizeCFG::addPhiValues(BasicBlock From, BasicBlock To) {		void StructurizeCFG::addPhiValues(BasicBlock From, BasicBlock To) {
for (PHINode &Phi : To->phis()) {		for (PHINode &Phi : To->phis()) {
Value *Undef = UndefValue::get(Phi.getType());		Value *Undef = UndefValue::get(Phi.getType());
Phi.addIncoming(Undef, From);		Phi.addIncoming(Undef, From);
}		}
AddedPhis[To].push_back(From);		AddedPhis[To].push_back(From);
}		}

		/// When we are reconstructing a PHI inside \p PHIBlock with incoming values
		/// from predecessors \p Incomings, we have a chance to mark the available value
		/// from some blocks as undefined. The function will find out all such blocks
		/// and return in \p UndefBlks.
		void StructurizeCFG::findUndefBlocks(
		BasicBlock PHIBlock, const SmallSet<BasicBlock , 8> &Incomings,
		SmallVector<BasicBlock *> &UndefBlks) const {
		// We may get a post-structured CFG like below:
		//
		// \| P1
		// \|/
		// F1
		// \|\
		// \| N
		// \|/
		// F2
		// \|\
		// \| P2
		// \|/
		// F3
		// \|\
		// B
		//
		// B is the block that has a PHI being reconstructed. P1/P2 are predecessors
		// of B before structurization. F1/F2/F3 are flow blocks inserted during
		// structurization process. Block N is not a predecessor of B before
		// structurization, but are placed between the predecessors(P1/P2) of B after
		// structurization. This usually means that threads went to N never take the
		// path N->F2->F3->B. For example, the threads take the branch F1->N may
		// always take the branch F2->P2. So, when we are reconstructing a PHI
		// originally in B, we can safely say the incoming value from N is undefined.
		SmallSet<BasicBlock *, 8> VisitedBlock;
		SmallVector<BasicBlock *, 8> Stack;
		if (PHIBlock == ParentRegion->getExit()) {
		for (auto P : predecessors(PHIBlock)) {
		if (ParentRegion->contains(P))
		Stack.push_back(P);
		}
		} else {
		append_range(Stack, predecessors(PHIBlock));
		}

		// Do a backward traversal over the CFG, and stop further searching if
		// the block is not a Flow. If a block is neither flow block nor the
		// incoming predecessor, then the incoming value from the block is
		// undefined value for the PHI being reconstructed.
		while (!Stack.empty()) {
		BasicBlock *Current = Stack.pop_back_val();
		if (VisitedBlock.contains(Current))
		continue;

		VisitedBlock.insert(Current);
		if (FlowSet.contains(Current)) {
		for (auto P : predecessors(Current))
		Stack.push_back(P);
		} else if (!Incomings.contains(Current)) {
		UndefBlks.push_back(Current);
		}
		}
		}

/// Add the real PHI value as soon as everything is set up		/// Add the real PHI value as soon as everything is set up
void StructurizeCFG::setPhiValues() {		void StructurizeCFG::setPhiValues() {
SmallVector<PHINode *, 8> InsertedPhis;		SmallVector<PHINode *, 8> InsertedPhis;
SSAUpdater Updater(&InsertedPhis);		SSAUpdater Updater(&InsertedPhis);
for (const auto &AddedPhi : AddedPhis) {		for (const auto &AddedPhi : AddedPhis) {
BasicBlock *To = AddedPhi.first;		BasicBlock *To = AddedPhi.first;
const BBVector &From = AddedPhi.second;		const BBVector &From = AddedPhi.second;

if (!DeletedPhis.count(To))		if (!DeletedPhis.count(To))
continue;		continue;

		SmallVector<BasicBlock *> UndefBlks;
		bool CachedUndefs = false;
PhiMap &Map = DeletedPhis[To];		PhiMap &Map = DeletedPhis[To];
for (const auto &PI : Map) {		for (const auto &PI : Map) {
PHINode *Phi = PI.first;		PHINode *Phi = PI.first;
Value *Undef = UndefValue::get(Phi->getType());		Value *Undef = UndefValue::get(Phi->getType());
Updater.Initialize(Phi->getType(), "");		Updater.Initialize(Phi->getType(), "");
Updater.AddAvailableValue(&Func->getEntryBlock(), Undef);		Updater.AddAvailableValue(&Func->getEntryBlock(), Undef);
Updater.AddAvailableValue(To, Undef);		Updater.AddAvailableValue(To, Undef);

NearestCommonDominator Dominator(DT);		SmallSet<BasicBlock *, 8> Incomings;
Dominator.addBlock(To);		SmallVector<BasicBlock *> ConstantPreds;
for (const auto &VI : PI.second) {		for (const auto &VI : PI.second) {
		Incomings.insert(VI.first);
Updater.AddAvailableValue(VI.first, VI.second);		Updater.AddAvailableValue(VI.first, VI.second);
Dominator.addAndRememberBlock(VI.first);		if (isa<Constant>(VI.second))
		ConstantPreds.push_back(VI.first);
}		}

if (!Dominator.resultIsRememberedBlock())		if (!CachedUndefs) {
Updater.AddAvailableValue(Dominator.result(), Undef);		findUndefBlocks(To, Incomings, UndefBlks);
		CachedUndefs = true;
		}

		for (auto UB : UndefBlks) {
		// If this undef block is dominated by any predecessor(before
		// structurization) of reconstructed PHI with constant incoming value,
		// don't mark the available value as undefined. Setting undef to such
		// block will stop us from getting optimal phi insertion.
		if (any_of(ConstantPreds,
		[&](BasicBlock *CP) { return DT->dominates(CP, UB); }))
		continue;
		Updater.AddAvailableValue(UB, Undef);
		}

for (BasicBlock *FI : From)		for (BasicBlock *FI : From)
Phi->setIncomingValueForBlock(FI, Updater.GetValueAtEndOfBlock(FI));		Phi->setIncomingValueForBlock(FI, Updater.GetValueAtEndOfBlock(FI));
AffectedPhis.push_back(Phi);		AffectedPhis.push_back(Phi);
}		}

DeletedPhis.erase(To);		DeletedPhis.erase(To);
}		}
assert(DeletedPhis.empty());		assert(DeletedPhis.empty());

		sameerdsUnsubmitted Not Done Reply Inline Actions On second thoughts, "this block" contributes an undefined value. That's the whole point of this change, right? sameerds: On second thoughts, "this block" contributes an undefined value. That's the whole point of this…
		ruilingAuthorUnsubmitted Done Reply Inline Actions Yes, the core idea is the block existing before structurization but not the predecessor block does not contribute any value even after structurization. I am thinking about whether I can refine the code to be less confusing. ruiling: Yes, the core idea is the block existing before structurization but not the predecessor block…
AffectedPhis.append(InsertedPhis.begin(), InsertedPhis.end());		AffectedPhis.append(InsertedPhis.begin(), InsertedPhis.end());
		sameerdsUnsubmitted Not Done Reply Inline Actions This is the core idea. But it's not obvious how the code implements this. Would be good to have an explanation of the Stack and the Incomings set. For example, why do we need to erase Current from Incomings? Somewhere in the traversal, the Stack seems to ensure that undefs are added to phis at intermediate Flow blocks ... needs explanation of why it always works. sameerds: This is the core idea. But it's not obvious how the code implements this. Would be good to have…
		ruilingAuthorUnsubmitted Done Reply Inline Actions Sorry I don't quite get your point. The reason we need to erase Current from I ruiling: Sorry I don't quite get your point. The reason we need to erase Current from I
		ruilingAuthorUnsubmitted Done Reply Inline Actions The reason I was erasing Current from Incomings is to try to terminate the traversal loop after finishing all the incoming predecessors. But now I think this maybe not quite necessary. The Stack is just used as traversal stack, no other meaning. ruiling: The reason I was erasing Current from Incomings is to try to terminate the traversal loop after…
		sameerdsUnsubmitted Done Reply Inline Actions What I mean is that the code needs comments explaining how it achieves the goal. There is a stack, so some form of DFS is happening. But it will be good to have an explanation (in the source file itself, and not this review) of why the implementation is correct. This is for future reference. It is not enough to expect that anyone reading the code will "eventually" figure out how it is all working. sameerds: What I mean is that the code needs comments explaining how it achieves the goal. There is a…
}		}

void StructurizeCFG::simplifyAffectedPhis() {		void StructurizeCFG::simplifyAffectedPhis() {
bool Changed;		bool Changed;
do {		do {
Changed = false;		Changed = false;
SimplifyQuery Q(Func->getParent()->getDataLayout());		SimplifyQuery Q(Func->getParent()->getDataLayout());
Q.DT = DT;		Q.DT = DT;
▲ Show 20 Lines • Show All 72 Lines • ▼ Show 20 Lines

/// Create a new flow node and update dominator tree and region info		/// Create a new flow node and update dominator tree and region info
BasicBlock StructurizeCFG::getNextFlow(BasicBlock Dominator) {		BasicBlock StructurizeCFG::getNextFlow(BasicBlock Dominator) {
LLVMContext &Context = Func->getContext();		LLVMContext &Context = Func->getContext();
BasicBlock *Insert = Order.empty() ? ParentRegion->getExit() :		BasicBlock *Insert = Order.empty() ? ParentRegion->getExit() :
Order.back()->getEntry();		Order.back()->getEntry();
BasicBlock *Flow = BasicBlock::Create(Context, FlowBlockName,		BasicBlock *Flow = BasicBlock::Create(Context, FlowBlockName,
Func, Insert);		Func, Insert);
		FlowSet.insert(Flow);
DT->addNewBlock(Flow, Dominator);		DT->addNewBlock(Flow, Dominator);
ParentRegion->getRegionInfo()->setRegionFor(Flow, ParentRegion);		ParentRegion->getRegionInfo()->setRegionFor(Flow, ParentRegion);
return Flow;		return Flow;
}		}

/// Create a new or reuse the previous node as flow node		/// Create a new or reuse the previous node as flow node
BasicBlock *StructurizeCFG::needPrefix(bool NeedEmpty) {		BasicBlock *StructurizeCFG::needPrefix(bool NeedEmpty) {
BasicBlock *Entry = PrevNode->getEntry();		BasicBlock *Entry = PrevNode->getEntry();
▲ Show 20 Lines • Show All 328 Lines • ▼ Show 20 Lines	bool StructurizeCFG::run(Region R, DominatorTree DT) {
Visited.clear();		Visited.clear();
DeletedPhis.clear();		DeletedPhis.clear();
AddedPhis.clear();		AddedPhis.clear();
Predicates.clear();		Predicates.clear();
Conditions.clear();		Conditions.clear();
Loops.clear();		Loops.clear();
LoopPreds.clear();		LoopPreds.clear();
LoopConds.clear();		LoopConds.clear();
		FlowSet.clear();

return true;		return true;
}		}

Pass *llvm::createStructurizeCFGPass(bool SkipUniformRegions) {		Pass *llvm::createStructurizeCFGPass(bool SkipUniformRegions) {
return new StructurizeCFGLegacyPass(SkipUniformRegions);		return new StructurizeCFGLegacyPass(SkipUniformRegions);
}		}

Show All 27 Lines

llvm/test/CodeGen/AMDGPU/multilevel-break.ll

	; NOTE: Assertions have been autogenerated by utils/update_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_test_checks.py
	; RUN: opt -S -mtriple=amdgcn-- -structurizecfg -si-annotate-control-flow < %s \| FileCheck -check-prefix=OPT %s			; RUN: opt -S -mtriple=amdgcn-- -structurizecfg -si-annotate-control-flow < %s \| FileCheck -check-prefix=OPT %s
	; RUN: llc -march=amdgcn -verify-machineinstrs < %s \| FileCheck -check-prefix=GCN %s			; RUN: llc -march=amdgcn -verify-machineinstrs < %s \| FileCheck -check-prefix=GCN %s

	; Ensure two if.break calls, for both the inner and outer loops			; Ensure two if.break calls, for both the inner and outer loops
	; FIXME: duplicate comparison			; FIXME: duplicate comparison
	define amdgpu_vs void @multi_else_break(<4 x float> %vec, i32 %ub, i32 %cont) {			define amdgpu_vs void @multi_else_break(<4 x float> %vec, i32 %ub, i32 %cont) {
	; OPT-LABEL: @multi_else_break(			; OPT-LABEL: @multi_else_break(
	; OPT-NEXT: main_body:			; OPT-NEXT: main_body:
	; OPT-NEXT: br label [[LOOP_OUTER:%.*]]			; OPT-NEXT: br label [[LOOP_OUTER:%.*]]
	; OPT: LOOP.outer:			; OPT: LOOP.outer:
	; OPT-NEXT: [[PHI_BROKEN2:%.]] = phi i64 [ [[TMP10:%.]], [[FLOW1:%.]] ], [ 0, [[MAIN_BODY:%.]] ]			; OPT-NEXT: [[PHI_BROKEN2:%.]] = phi i64 [ [[TMP8:%.]], [[FLOW1:%.]] ], [ 0, [[MAIN_BODY:%.]] ]
	; OPT-NEXT: [[TMP43:%.]] = phi i32 [ 0, [[MAIN_BODY]] ], [ [[TMP4:%.]], [[FLOW1]] ]			; OPT-NEXT: [[TMP43:%.]] = phi i32 [ 0, [[MAIN_BODY]] ], [ [[TMP3:%.]], [[FLOW1]] ]
	; OPT-NEXT: br label [[LOOP:%.*]]			; OPT-NEXT: br label [[LOOP:%.*]]
	; OPT: LOOP:			; OPT: LOOP:
	; OPT-NEXT: [[PHI_BROKEN:%.]] = phi i64 [ [[TMP8:%.]], [[FLOW:%.*]] ], [ 0, [[LOOP_OUTER]] ]			; OPT-NEXT: [[PHI_BROKEN:%.]] = phi i64 [ [[TMP6:%.]], [[FLOW:%.*]] ], [ 0, [[LOOP_OUTER]] ]
	; OPT-NEXT: [[TMP0:%.*]] = phi i32 [ undef, [[LOOP_OUTER]] ], [ [[TMP4]], [[FLOW]] ]			; OPT-NEXT: [[TMP45:%.*]] = phi i32 [ [[TMP43]], [[LOOP_OUTER]] ], [ [[TMP3]], [[FLOW]] ]
	; OPT-NEXT: [[TMP45:%.]] = phi i32 [ [[TMP43]], [[LOOP_OUTER]] ], [ [[TMP5:%.]], [[FLOW]] ]
	; OPT-NEXT: [[TMP48:%.]] = icmp slt i32 [[TMP45]], [[UB:%.]]			; OPT-NEXT: [[TMP48:%.]] = icmp slt i32 [[TMP45]], [[UB:%.]]
	; OPT-NEXT: [[TMP1:%.*]] = call { i1, i64 } @llvm.amdgcn.if.i64(i1 [[TMP48]])			; OPT-NEXT: [[TMP0:%.*]] = call { i1, i64 } @llvm.amdgcn.if.i64(i1 [[TMP48]])
	; OPT-NEXT: [[TMP2:%.*]] = extractvalue { i1, i64 } [[TMP1]], 0			; OPT-NEXT: [[TMP1:%.*]] = extractvalue { i1, i64 } [[TMP0]], 0
	; OPT-NEXT: [[TMP3:%.*]] = extractvalue { i1, i64 } [[TMP1]], 1			; OPT-NEXT: [[TMP2:%.*]] = extractvalue { i1, i64 } [[TMP0]], 1
	; OPT-NEXT: br i1 [[TMP2]], label [[ENDIF:%.*]], label [[FLOW]]			; OPT-NEXT: br i1 [[TMP1]], label [[ENDIF:%.*]], label [[FLOW]]
	; OPT: Flow:			; OPT: Flow:
	; OPT-NEXT: [[TMP4]] = phi i32 [ [[TMP47:%.*]], [[ENDIF]] ], [ [[TMP0]], [[LOOP]] ]			; OPT-NEXT: [[TMP3]] = phi i32 [ [[TMP47:%.*]], [[ENDIF]] ], [ undef, [[LOOP]] ]
	; OPT-NEXT: [[TMP5]] = phi i32 [ [[TMP47]], [[ENDIF]] ], [ undef, [[LOOP]] ]			; OPT-NEXT: [[TMP4:%.]] = phi i1 [ [[TMP51:%.]], [[ENDIF]] ], [ true, [[LOOP]] ]
	; OPT-NEXT: [[TMP6:%.]] = phi i1 [ [[TMP51:%.]], [[ENDIF]] ], [ true, [[LOOP]] ]			; OPT-NEXT: [[TMP5:%.]] = phi i1 [ [[TMP51_INV:%.]], [[ENDIF]] ], [ true, [[LOOP]] ]
	; OPT-NEXT: [[TMP7:%.]] = phi i1 [ [[TMP51_INV:%.]], [[ENDIF]] ], [ true, [[LOOP]] ]			; OPT-NEXT: call void @llvm.amdgcn.end.cf.i64(i64 [[TMP2]])
	; OPT-NEXT: call void @llvm.amdgcn.end.cf.i64(i64 [[TMP3]])			; OPT-NEXT: [[TMP6]] = call i64 @llvm.amdgcn.if.break.i64(i1 [[TMP5]], i64 [[PHI_BROKEN]])
	; OPT-NEXT: [[TMP8]] = call i64 @llvm.amdgcn.if.break.i64(i1 [[TMP7]], i64 [[PHI_BROKEN]])			; OPT-NEXT: [[TMP7:%.*]] = call i1 @llvm.amdgcn.loop.i64(i64 [[TMP6]])
	; OPT-NEXT: [[TMP9:%.*]] = call i1 @llvm.amdgcn.loop.i64(i64 [[TMP8]])			; OPT-NEXT: [[TMP8]] = call i64 @llvm.amdgcn.if.break.i64(i1 [[TMP4]], i64 [[PHI_BROKEN2]])
	; OPT-NEXT: [[TMP10]] = call i64 @llvm.amdgcn.if.break.i64(i1 [[TMP6]], i64 [[PHI_BROKEN2]])			; OPT-NEXT: br i1 [[TMP7]], label [[FLOW1]], label [[LOOP]]
	; OPT-NEXT: br i1 [[TMP9]], label [[FLOW1]], label [[LOOP]]
	; OPT: Flow1:			; OPT: Flow1:
	; OPT-NEXT: call void @llvm.amdgcn.end.cf.i64(i64 [[TMP8]])			; OPT-NEXT: call void @llvm.amdgcn.end.cf.i64(i64 [[TMP6]])
	; OPT-NEXT: [[TMP11:%.*]] = call i1 @llvm.amdgcn.loop.i64(i64 [[TMP10]])			; OPT-NEXT: [[TMP9:%.*]] = call i1 @llvm.amdgcn.loop.i64(i64 [[TMP8]])
	; OPT-NEXT: br i1 [[TMP11]], label [[IF:%.*]], label [[LOOP_OUTER]]			; OPT-NEXT: br i1 [[TMP9]], label [[IF:%.*]], label [[LOOP_OUTER]]
	; OPT: IF:			; OPT: IF:
	; OPT-NEXT: call void @llvm.amdgcn.end.cf.i64(i64 [[TMP10]])			; OPT-NEXT: call void @llvm.amdgcn.end.cf.i64(i64 [[TMP8]])
	; OPT-NEXT: ret void			; OPT-NEXT: ret void
	; OPT: ENDIF:			; OPT: ENDIF:
	; OPT-NEXT: [[TMP47]] = add i32 [[TMP45]], 1			; OPT-NEXT: [[TMP47]] = add i32 [[TMP45]], 1
	; OPT-NEXT: [[TMP51]] = icmp eq i32 [[TMP47]], [[CONT:%.*]]			; OPT-NEXT: [[TMP51]] = icmp eq i32 [[TMP47]], [[CONT:%.*]]
	; OPT-NEXT: [[TMP51_INV]] = xor i1 [[TMP51]], true			; OPT-NEXT: [[TMP51_INV]] = xor i1 [[TMP51]], true
	; OPT-NEXT: br label [[FLOW]]			; OPT-NEXT: br label [[FLOW]]
	;			;
	; GCN-LABEL: multi_else_break:			; GCN-LABEL: multi_else_break:
	▲ Show 20 Lines • Show All 103 Lines • ▼ Show 20 Lines
	; OPT-NEXT: [[TMP7]] = phi i1 [ [[TMP1]], [[FLOW3]] ], [ true, [[NODEBLOCK]] ]			; OPT-NEXT: [[TMP7]] = phi i1 [ [[TMP1]], [[FLOW3]] ], [ true, [[NODEBLOCK]] ]
	; OPT-NEXT: [[TMP8:%.*]] = phi i1 [ false, [[FLOW3]] ], [ true, [[NODEBLOCK]] ]			; OPT-NEXT: [[TMP8:%.*]] = phi i1 [ false, [[FLOW3]] ], [ true, [[NODEBLOCK]] ]
	; OPT-NEXT: br i1 [[TMP8]], label [[LEAFBLOCK:%.*]], label [[FLOW4]]			; OPT-NEXT: br i1 [[TMP8]], label [[LEAFBLOCK:%.*]], label [[FLOW4]]
	; OPT: case1:			; OPT: case1:
	; OPT-NEXT: [[LOAD2:%.]] = load volatile i32, i32 addrspace(1) undef, align 4			; OPT-NEXT: [[LOAD2:%.]] = load volatile i32, i32 addrspace(1) undef, align 4
	; OPT-NEXT: [[CMP2]] = icmp sge i32 [[TMP]], [[LOAD2]]			; OPT-NEXT: [[CMP2]] = icmp sge i32 [[TMP]], [[LOAD2]]
	; OPT-NEXT: br label [[FLOW3]]			; OPT-NEXT: br label [[FLOW3]]
	; OPT: Flow5:			; OPT: Flow5:
	; OPT-NEXT: [[TMP9]] = phi i32 [ [[LSR_IV_NEXT]], [[CASE0]] ], [ [[TMP6]], [[LEAFBLOCK]] ]			; OPT-NEXT: [[TMP9]] = phi i32 [ [[LSR_IV_NEXT]], [[CASE0]] ], [ undef, [[LEAFBLOCK]] ]
	; OPT-NEXT: [[TMP10]] = phi i1 [ [[CMP1]], [[CASE0]] ], [ [[TMP7]], [[LEAFBLOCK]] ]			; OPT-NEXT: [[TMP10]] = phi i1 [ [[CMP1]], [[CASE0]] ], [ [[TMP7]], [[LEAFBLOCK]] ]
	; OPT-NEXT: br label [[FLOW4]]			; OPT-NEXT: br label [[FLOW4]]
	; OPT: bb9:			; OPT: bb9:
	; OPT-NEXT: call void @llvm.amdgcn.end.cf.i64(i64 [[TMP4]])			; OPT-NEXT: call void @llvm.amdgcn.end.cf.i64(i64 [[TMP4]])
	; OPT-NEXT: ret void			; OPT-NEXT: ret void
	;			;
	; GCN-LABEL: multi_if_break_loop:			; GCN-LABEL: multi_if_break_loop:
	; GCN: ; %bb.0: ; %bb			; GCN: ; %bb.0: ; %bb
	▲ Show 20 Lines • Show All 88 Lines • Show Last 20 Lines

llvm/test/CodeGen/AMDGPU/tuple-allocation-failure.ll

	Show First 20 Lines • Show All 216 Lines • ▼ Show 20 Lines
	; GLOBALNESS1-NEXT: v_writelane_b32 v42, s87, 9			; GLOBALNESS1-NEXT: v_writelane_b32 v42, s87, 9
	; GLOBALNESS1-NEXT: s_mov_b32 s32, 0			; GLOBALNESS1-NEXT: s_mov_b32 s32, 0
	; GLOBALNESS1-NEXT: s_branch .LBB1_4			; GLOBALNESS1-NEXT: s_branch .LBB1_4
	; GLOBALNESS1-NEXT: .LBB1_1: ; %bb70.i			; GLOBALNESS1-NEXT: .LBB1_1: ; %bb70.i
	; GLOBALNESS1-NEXT: ; in Loop: Header=BB1_4 Depth=1			; GLOBALNESS1-NEXT: ; in Loop: Header=BB1_4 Depth=1
	; GLOBALNESS1-NEXT: v_readlane_b32 s6, v41, 40			; GLOBALNESS1-NEXT: v_readlane_b32 s6, v41, 40
	; GLOBALNESS1-NEXT: v_readlane_b32 s7, v41, 41			; GLOBALNESS1-NEXT: v_readlane_b32 s7, v41, 41
	; GLOBALNESS1-NEXT: s_andn2_b64 vcc, exec, s[6:7]			; GLOBALNESS1-NEXT: s_andn2_b64 vcc, exec, s[6:7]
	; GLOBALNESS1-NEXT: s_cbranch_vccz .LBB1_29			; GLOBALNESS1-NEXT: s_cbranch_vccz .LBB1_28
	; GLOBALNESS1-NEXT: .LBB1_2: ; %Flow6			; GLOBALNESS1-NEXT: .LBB1_2: ; %Flow6
	; GLOBALNESS1-NEXT: ; in Loop: Header=BB1_4 Depth=1			; GLOBALNESS1-NEXT: ; in Loop: Header=BB1_4 Depth=1
	; GLOBALNESS1-NEXT: s_or_b64 exec, exec, s[4:5]			; GLOBALNESS1-NEXT: s_or_b64 exec, exec, s[4:5]
	; GLOBALNESS1-NEXT: s_mov_b64 s[6:7], 0			; GLOBALNESS1-NEXT: s_mov_b64 s[8:9], 0
				; GLOBALNESS1-NEXT: ; implicit-def: $sgpr4_sgpr5
	; GLOBALNESS1-NEXT: .LBB1_3: ; %Flow19			; GLOBALNESS1-NEXT: .LBB1_3: ; %Flow19
	; GLOBALNESS1-NEXT: ; in Loop: Header=BB1_4 Depth=1			; GLOBALNESS1-NEXT: ; in Loop: Header=BB1_4 Depth=1
	; GLOBALNESS1-NEXT: v_accvgpr_write_b32 a63, v31			; GLOBALNESS1-NEXT: v_accvgpr_write_b32 a63, v31
	; GLOBALNESS1-NEXT: v_readlane_b32 s4, v42, 10			; GLOBALNESS1-NEXT: s_and_b64 vcc, exec, s[8:9]
	; GLOBALNESS1-NEXT: s_and_b64 vcc, exec, s[6:7]
	; GLOBALNESS1-NEXT: v_accvgpr_write_b32 a62, v30			; GLOBALNESS1-NEXT: v_accvgpr_write_b32 a62, v30
	; GLOBALNESS1-NEXT: v_accvgpr_write_b32 a61, v29			; GLOBALNESS1-NEXT: v_accvgpr_write_b32 a61, v29
	; GLOBALNESS1-NEXT: v_accvgpr_write_b32 a60, v28			; GLOBALNESS1-NEXT: v_accvgpr_write_b32 a60, v28
	; GLOBALNESS1-NEXT: v_accvgpr_write_b32 a59, v27			; GLOBALNESS1-NEXT: v_accvgpr_write_b32 a59, v27
	; GLOBALNESS1-NEXT: v_accvgpr_write_b32 a58, v26			; GLOBALNESS1-NEXT: v_accvgpr_write_b32 a58, v26
	; GLOBALNESS1-NEXT: v_accvgpr_write_b32 a57, v25			; GLOBALNESS1-NEXT: v_accvgpr_write_b32 a57, v25
	; GLOBALNESS1-NEXT: v_accvgpr_write_b32 a56, v24			; GLOBALNESS1-NEXT: v_accvgpr_write_b32 a56, v24
	; GLOBALNESS1-NEXT: v_accvgpr_write_b32 a55, v23			; GLOBALNESS1-NEXT: v_accvgpr_write_b32 a55, v23
	Show All 15 Lines
	; GLOBALNESS1-NEXT: v_accvgpr_write_b32 a39, v7			; GLOBALNESS1-NEXT: v_accvgpr_write_b32 a39, v7
	; GLOBALNESS1-NEXT: v_accvgpr_write_b32 a38, v6			; GLOBALNESS1-NEXT: v_accvgpr_write_b32 a38, v6
	; GLOBALNESS1-NEXT: v_accvgpr_write_b32 a37, v5			; GLOBALNESS1-NEXT: v_accvgpr_write_b32 a37, v5
	; GLOBALNESS1-NEXT: v_accvgpr_write_b32 a36, v4			; GLOBALNESS1-NEXT: v_accvgpr_write_b32 a36, v4
	; GLOBALNESS1-NEXT: v_accvgpr_write_b32 a35, v3			; GLOBALNESS1-NEXT: v_accvgpr_write_b32 a35, v3
	; GLOBALNESS1-NEXT: v_accvgpr_write_b32 a34, v2			; GLOBALNESS1-NEXT: v_accvgpr_write_b32 a34, v2
	; GLOBALNESS1-NEXT: v_accvgpr_write_b32 a33, v1			; GLOBALNESS1-NEXT: v_accvgpr_write_b32 a33, v1
	; GLOBALNESS1-NEXT: v_accvgpr_write_b32 a32, v0			; GLOBALNESS1-NEXT: v_accvgpr_write_b32 a32, v0
	; GLOBALNESS1-NEXT: v_readlane_b32 s5, v42, 11			; GLOBALNESS1-NEXT: s_cbranch_vccnz .LBB1_29
	; GLOBALNESS1-NEXT: s_cbranch_vccnz .LBB1_30
	; GLOBALNESS1-NEXT: .LBB1_4: ; %bb5			; GLOBALNESS1-NEXT: .LBB1_4: ; %bb5
	; GLOBALNESS1-NEXT: ; =>This Loop Header: Depth=1			; GLOBALNESS1-NEXT: ; =>This Loop Header: Depth=1
	; GLOBALNESS1-NEXT: ; Child Loop BB1_17 Depth 2			; GLOBALNESS1-NEXT: ; Child Loop BB1_16 Depth 2
	; GLOBALNESS1-NEXT: v_readlane_b32 s60, v41, 0			; GLOBALNESS1-NEXT: v_readlane_b32 s60, v41, 0
	; GLOBALNESS1-NEXT: v_readlane_b32 s61, v41, 1			; GLOBALNESS1-NEXT: v_readlane_b32 s61, v41, 1
	; GLOBALNESS1-NEXT: v_pk_mov_b32 v[0:1], s[60:61], s[60:61] op_sel:[0,1]			; GLOBALNESS1-NEXT: v_pk_mov_b32 v[0:1], s[60:61], s[60:61] op_sel:[0,1]
	; GLOBALNESS1-NEXT: flat_load_dword v40, v[0:1]			; GLOBALNESS1-NEXT: flat_load_dword v40, v[0:1]
	; GLOBALNESS1-NEXT: s_add_u32 s8, s38, 40			; GLOBALNESS1-NEXT: s_add_u32 s8, s38, 40
	; GLOBALNESS1-NEXT: buffer_store_dword v44, off, s[0:3], 0			; GLOBALNESS1-NEXT: buffer_store_dword v44, off, s[0:3], 0
	; GLOBALNESS1-NEXT: flat_load_dword v46, v[0:1]			; GLOBALNESS1-NEXT: flat_load_dword v46, v[0:1]
	; GLOBALNESS1-NEXT: s_addc_u32 s9, s39, 0			; GLOBALNESS1-NEXT: s_addc_u32 s9, s39, 0
	Show All 31 Lines
	; GLOBALNESS1-NEXT: v_readlane_b32 s86, v41, 26			; GLOBALNESS1-NEXT: v_readlane_b32 s86, v41, 26
	; GLOBALNESS1-NEXT: v_readlane_b32 s87, v41, 27			; GLOBALNESS1-NEXT: v_readlane_b32 s87, v41, 27
	; GLOBALNESS1-NEXT: v_readlane_b32 s88, v41, 28			; GLOBALNESS1-NEXT: v_readlane_b32 s88, v41, 28
	; GLOBALNESS1-NEXT: v_readlane_b32 s89, v41, 29			; GLOBALNESS1-NEXT: v_readlane_b32 s89, v41, 29
	; GLOBALNESS1-NEXT: v_readlane_b32 s90, v41, 30			; GLOBALNESS1-NEXT: v_readlane_b32 s90, v41, 30
	; GLOBALNESS1-NEXT: v_readlane_b32 s91, v41, 31			; GLOBALNESS1-NEXT: v_readlane_b32 s91, v41, 31
	; GLOBALNESS1-NEXT: s_waitcnt lgkmcnt(0)			; GLOBALNESS1-NEXT: s_waitcnt lgkmcnt(0)
	; GLOBALNESS1-NEXT: s_swappc_b64 s[30:31], s[52:53]			; GLOBALNESS1-NEXT: s_swappc_b64 s[30:31], s[52:53]
	; GLOBALNESS1-NEXT: ; implicit-def: $sgpr4_sgpr5
	; GLOBALNESS1-NEXT: s_and_b64 vcc, exec, s[54:55]			; GLOBALNESS1-NEXT: s_and_b64 vcc, exec, s[54:55]
	; GLOBALNESS1-NEXT: ; kill: killed $sgpr4_sgpr5			; GLOBALNESS1-NEXT: s_mov_b64 s[6:7], -1
	; GLOBALNESS1-NEXT: s_mov_b64 s[4:5], -1			; GLOBALNESS1-NEXT: ; implicit-def: $sgpr4_sgpr5
	; GLOBALNESS1-NEXT: s_cbranch_vccnz .LBB1_10			; GLOBALNESS1-NEXT: s_cbranch_vccnz .LBB1_9
	; GLOBALNESS1-NEXT: ; %bb.5: ; %NodeBlock			; GLOBALNESS1-NEXT: ; %bb.5: ; %NodeBlock
	; GLOBALNESS1-NEXT: ; in Loop: Header=BB1_4 Depth=1			; GLOBALNESS1-NEXT: ; in Loop: Header=BB1_4 Depth=1
	; GLOBALNESS1-NEXT: s_cmp_lt_i32 s59, 1			; GLOBALNESS1-NEXT: s_cmp_lt_i32 s59, 1
	; GLOBALNESS1-NEXT: s_cbranch_scc1 .LBB1_7			; GLOBALNESS1-NEXT: s_cbranch_scc1 .LBB1_7
	; GLOBALNESS1-NEXT: ; %bb.6: ; %LeafBlock3			; GLOBALNESS1-NEXT: ; %bb.6: ; %LeafBlock3
	; GLOBALNESS1-NEXT: ; in Loop: Header=BB1_4 Depth=1			; GLOBALNESS1-NEXT: ; in Loop: Header=BB1_4 Depth=1
	; GLOBALNESS1-NEXT: s_cmp_lg_u32 s59, 1			; GLOBALNESS1-NEXT: s_cmp_lg_u32 s59, 1
	; GLOBALNESS1-NEXT: s_mov_b64 s[8:9], -1			; GLOBALNESS1-NEXT: s_mov_b64 s[4:5], -1
	; GLOBALNESS1-NEXT: s_cselect_b64 s[4:5], -1, 0			; GLOBALNESS1-NEXT: s_cselect_b64 s[6:7], -1, 0
	; GLOBALNESS1-NEXT: s_cbranch_execz .LBB1_8			; GLOBALNESS1-NEXT: s_cbranch_execz .LBB1_8
	; GLOBALNESS1-NEXT: s_branch .LBB1_9			; GLOBALNESS1-NEXT: s_branch .LBB1_9
	; GLOBALNESS1-NEXT: .LBB1_7: ; in Loop: Header=BB1_4 Depth=1			; GLOBALNESS1-NEXT: .LBB1_7: ; in Loop: Header=BB1_4 Depth=1
	; GLOBALNESS1-NEXT: s_mov_b64 s[4:5], 0			; GLOBALNESS1-NEXT: s_mov_b64 s[6:7], 0
	; GLOBALNESS1-NEXT: ; implicit-def: $sgpr8_sgpr9			; GLOBALNESS1-NEXT: ; implicit-def: $sgpr4_sgpr5
	; GLOBALNESS1-NEXT: .LBB1_8: ; %LeafBlock			; GLOBALNESS1-NEXT: .LBB1_8: ; %LeafBlock
	; GLOBALNESS1-NEXT: ; in Loop: Header=BB1_4 Depth=1			; GLOBALNESS1-NEXT: ; in Loop: Header=BB1_4 Depth=1
	; GLOBALNESS1-NEXT: s_cmp_lg_u32 s59, 0			; GLOBALNESS1-NEXT: s_cmp_lg_u32 s59, 0
	; GLOBALNESS1-NEXT: s_mov_b64 s[8:9], 0			; GLOBALNESS1-NEXT: s_mov_b64 s[4:5], 0
	; GLOBALNESS1-NEXT: s_cselect_b64 s[4:5], -1, 0			; GLOBALNESS1-NEXT: s_cselect_b64 s[6:7], -1, 0
	; GLOBALNESS1-NEXT: .LBB1_9: ; %Flow18			; GLOBALNESS1-NEXT: .LBB1_9: ; %Flow16
	; GLOBALNESS1-NEXT: ; in Loop: Header=BB1_4 Depth=1
	; GLOBALNESS1-NEXT: v_writelane_b32 v42, s8, 10
	; GLOBALNESS1-NEXT: v_writelane_b32 v42, s9, 11
	; GLOBALNESS1-NEXT: .LBB1_10: ; %Flow16
	; GLOBALNESS1-NEXT: ; in Loop: Header=BB1_4 Depth=1			; GLOBALNESS1-NEXT: ; in Loop: Header=BB1_4 Depth=1
	; GLOBALNESS1-NEXT: v_readlane_b32 s68, v41, 0			; GLOBALNESS1-NEXT: v_readlane_b32 s68, v41, 0
	; GLOBALNESS1-NEXT: v_readlane_b32 s69, v41, 1			; GLOBALNESS1-NEXT: v_readlane_b32 s69, v41, 1
	; GLOBALNESS1-NEXT: s_mov_b64 s[56:57], s[68:69]			; GLOBALNESS1-NEXT: s_mov_b64 s[56:57], s[68:69]
	; GLOBALNESS1-NEXT: v_readlane_b32 s70, v41, 2			; GLOBALNESS1-NEXT: v_readlane_b32 s70, v41, 2
	; GLOBALNESS1-NEXT: v_readlane_b32 s71, v41, 3			; GLOBALNESS1-NEXT: v_readlane_b32 s71, v41, 3
	; GLOBALNESS1-NEXT: v_readlane_b32 s72, v41, 4			; GLOBALNESS1-NEXT: v_readlane_b32 s72, v41, 4
	; GLOBALNESS1-NEXT: v_readlane_b32 s73, v41, 5			; GLOBALNESS1-NEXT: v_readlane_b32 s73, v41, 5
	▲ Show 20 Lines • Show All 51 Lines • ▼ Show 20 Lines
	; GLOBALNESS1-NEXT: s_mov_b32 s93, s57			; GLOBALNESS1-NEXT: s_mov_b32 s93, s57
	; GLOBALNESS1-NEXT: s_mov_b32 s94, s57			; GLOBALNESS1-NEXT: s_mov_b32 s94, s57
	; GLOBALNESS1-NEXT: s_mov_b32 s95, s57			; GLOBALNESS1-NEXT: s_mov_b32 s95, s57
	; GLOBALNESS1-NEXT: s_mov_b32 s96, s57			; GLOBALNESS1-NEXT: s_mov_b32 s96, s57
	; GLOBALNESS1-NEXT: s_mov_b32 s97, s57			; GLOBALNESS1-NEXT: s_mov_b32 s97, s57
	; GLOBALNESS1-NEXT: s_mov_b32 s98, s57			; GLOBALNESS1-NEXT: s_mov_b32 s98, s57
	; GLOBALNESS1-NEXT: s_mov_b32 s99, s57			; GLOBALNESS1-NEXT: s_mov_b32 s99, s57
	; GLOBALNESS1-NEXT: v_pk_mov_b32 v[0:1], s[68:69], s[68:69] op_sel:[0,1]			; GLOBALNESS1-NEXT: v_pk_mov_b32 v[0:1], s[68:69], s[68:69] op_sel:[0,1]
	; GLOBALNESS1-NEXT: s_mov_b64 s[6:7], -1			; GLOBALNESS1-NEXT: s_mov_b64 s[8:9], -1
	; GLOBALNESS1-NEXT: s_and_b64 vcc, exec, s[4:5]			; GLOBALNESS1-NEXT: s_and_b64 vcc, exec, s[6:7]
	; GLOBALNESS1-NEXT: v_pk_mov_b32 v[2:3], s[70:71], s[70:71] op_sel:[0,1]			; GLOBALNESS1-NEXT: v_pk_mov_b32 v[2:3], s[70:71], s[70:71] op_sel:[0,1]
	; GLOBALNESS1-NEXT: v_pk_mov_b32 v[4:5], s[72:73], s[72:73] op_sel:[0,1]			; GLOBALNESS1-NEXT: v_pk_mov_b32 v[4:5], s[72:73], s[72:73] op_sel:[0,1]
	; GLOBALNESS1-NEXT: v_pk_mov_b32 v[6:7], s[74:75], s[74:75] op_sel:[0,1]			; GLOBALNESS1-NEXT: v_pk_mov_b32 v[6:7], s[74:75], s[74:75] op_sel:[0,1]
	; GLOBALNESS1-NEXT: v_pk_mov_b32 v[8:9], s[76:77], s[76:77] op_sel:[0,1]			; GLOBALNESS1-NEXT: v_pk_mov_b32 v[8:9], s[76:77], s[76:77] op_sel:[0,1]
	; GLOBALNESS1-NEXT: v_pk_mov_b32 v[10:11], s[78:79], s[78:79] op_sel:[0,1]			; GLOBALNESS1-NEXT: v_pk_mov_b32 v[10:11], s[78:79], s[78:79] op_sel:[0,1]
	; GLOBALNESS1-NEXT: v_pk_mov_b32 v[12:13], s[80:81], s[80:81] op_sel:[0,1]			; GLOBALNESS1-NEXT: v_pk_mov_b32 v[12:13], s[80:81], s[80:81] op_sel:[0,1]
	; GLOBALNESS1-NEXT: v_pk_mov_b32 v[14:15], s[82:83], s[82:83] op_sel:[0,1]			; GLOBALNESS1-NEXT: v_pk_mov_b32 v[14:15], s[82:83], s[82:83] op_sel:[0,1]
	; GLOBALNESS1-NEXT: v_pk_mov_b32 v[16:17], s[84:85], s[84:85] op_sel:[0,1]			; GLOBALNESS1-NEXT: v_pk_mov_b32 v[16:17], s[84:85], s[84:85] op_sel:[0,1]
	; GLOBALNESS1-NEXT: v_pk_mov_b32 v[18:19], s[86:87], s[86:87] op_sel:[0,1]			; GLOBALNESS1-NEXT: v_pk_mov_b32 v[18:19], s[86:87], s[86:87] op_sel:[0,1]
	; GLOBALNESS1-NEXT: v_pk_mov_b32 v[20:21], s[88:89], s[88:89] op_sel:[0,1]			; GLOBALNESS1-NEXT: v_pk_mov_b32 v[20:21], s[88:89], s[88:89] op_sel:[0,1]
	; GLOBALNESS1-NEXT: v_pk_mov_b32 v[22:23], s[90:91], s[90:91] op_sel:[0,1]			; GLOBALNESS1-NEXT: v_pk_mov_b32 v[22:23], s[90:91], s[90:91] op_sel:[0,1]
	; GLOBALNESS1-NEXT: v_pk_mov_b32 v[24:25], s[92:93], s[92:93] op_sel:[0,1]			; GLOBALNESS1-NEXT: v_pk_mov_b32 v[24:25], s[92:93], s[92:93] op_sel:[0,1]
	; GLOBALNESS1-NEXT: v_pk_mov_b32 v[26:27], s[94:95], s[94:95] op_sel:[0,1]			; GLOBALNESS1-NEXT: v_pk_mov_b32 v[26:27], s[94:95], s[94:95] op_sel:[0,1]
	; GLOBALNESS1-NEXT: v_pk_mov_b32 v[28:29], s[96:97], s[96:97] op_sel:[0,1]			; GLOBALNESS1-NEXT: v_pk_mov_b32 v[28:29], s[96:97], s[96:97] op_sel:[0,1]
	; GLOBALNESS1-NEXT: v_pk_mov_b32 v[30:31], s[98:99], s[98:99] op_sel:[0,1]			; GLOBALNESS1-NEXT: v_pk_mov_b32 v[30:31], s[98:99], s[98:99] op_sel:[0,1]
	; GLOBALNESS1-NEXT: s_cbranch_vccz .LBB1_3			; GLOBALNESS1-NEXT: s_cbranch_vccz .LBB1_3
	; GLOBALNESS1-NEXT: ; %bb.11: ; %baz.exit.i			; GLOBALNESS1-NEXT: ; %bb.10: ; %baz.exit.i
	; GLOBALNESS1-NEXT: ; in Loop: Header=BB1_4 Depth=1			; GLOBALNESS1-NEXT: ; in Loop: Header=BB1_4 Depth=1
	; GLOBALNESS1-NEXT: v_pk_mov_b32 v[0:1], 0, 0			; GLOBALNESS1-NEXT: v_pk_mov_b32 v[0:1], 0, 0
	; GLOBALNESS1-NEXT: flat_load_dword v0, v[0:1]			; GLOBALNESS1-NEXT: flat_load_dword v0, v[0:1]
	; GLOBALNESS1-NEXT: v_readlane_b32 s60, v41, 0			; GLOBALNESS1-NEXT: v_readlane_b32 s60, v41, 0
	; GLOBALNESS1-NEXT: v_readlane_b32 s61, v41, 1			; GLOBALNESS1-NEXT: v_readlane_b32 s61, v41, 1
	; GLOBALNESS1-NEXT: v_readlane_b32 s62, v41, 2			; GLOBALNESS1-NEXT: v_readlane_b32 s62, v41, 2
	; GLOBALNESS1-NEXT: v_readlane_b32 s63, v41, 3			; GLOBALNESS1-NEXT: v_readlane_b32 s63, v41, 3
	; GLOBALNESS1-NEXT: v_readlane_b32 s64, v41, 4			; GLOBALNESS1-NEXT: v_readlane_b32 s64, v41, 4
	▲ Show 20 Lines • Show All 122 Lines • ▼ Show 20 Lines
	; GLOBALNESS1-NEXT: v_pk_mov_b32 v[18:19], s[78:79], s[78:79] op_sel:[0,1]			; GLOBALNESS1-NEXT: v_pk_mov_b32 v[18:19], s[78:79], s[78:79] op_sel:[0,1]
	; GLOBALNESS1-NEXT: v_pk_mov_b32 v[20:21], s[80:81], s[80:81] op_sel:[0,1]			; GLOBALNESS1-NEXT: v_pk_mov_b32 v[20:21], s[80:81], s[80:81] op_sel:[0,1]
	; GLOBALNESS1-NEXT: v_pk_mov_b32 v[22:23], s[82:83], s[82:83] op_sel:[0,1]			; GLOBALNESS1-NEXT: v_pk_mov_b32 v[22:23], s[82:83], s[82:83] op_sel:[0,1]
	; GLOBALNESS1-NEXT: v_pk_mov_b32 v[24:25], s[84:85], s[84:85] op_sel:[0,1]			; GLOBALNESS1-NEXT: v_pk_mov_b32 v[24:25], s[84:85], s[84:85] op_sel:[0,1]
	; GLOBALNESS1-NEXT: v_pk_mov_b32 v[26:27], s[86:87], s[86:87] op_sel:[0,1]			; GLOBALNESS1-NEXT: v_pk_mov_b32 v[26:27], s[86:87], s[86:87] op_sel:[0,1]
	; GLOBALNESS1-NEXT: v_pk_mov_b32 v[28:29], s[88:89], s[88:89] op_sel:[0,1]			; GLOBALNESS1-NEXT: v_pk_mov_b32 v[28:29], s[88:89], s[88:89] op_sel:[0,1]
	; GLOBALNESS1-NEXT: v_pk_mov_b32 v[30:31], s[90:91], s[90:91] op_sel:[0,1]			; GLOBALNESS1-NEXT: v_pk_mov_b32 v[30:31], s[90:91], s[90:91] op_sel:[0,1]
	; GLOBALNESS1-NEXT: s_and_saveexec_b64 s[88:89], s[54:55]			; GLOBALNESS1-NEXT: s_and_saveexec_b64 s[88:89], s[54:55]
	; GLOBALNESS1-NEXT: s_cbranch_execz .LBB1_26			; GLOBALNESS1-NEXT: s_cbranch_execz .LBB1_25
	; GLOBALNESS1-NEXT: ; %bb.12: ; %bb33.i			; GLOBALNESS1-NEXT: ; %bb.11: ; %bb33.i
	; GLOBALNESS1-NEXT: ; in Loop: Header=BB1_4 Depth=1			; GLOBALNESS1-NEXT: ; in Loop: Header=BB1_4 Depth=1
	; GLOBALNESS1-NEXT: v_pk_mov_b32 v[2:3], 0, 0			; GLOBALNESS1-NEXT: v_pk_mov_b32 v[2:3], 0, 0
	; GLOBALNESS1-NEXT: global_load_dwordx2 v[0:1], v[2:3], off			; GLOBALNESS1-NEXT: global_load_dwordx2 v[0:1], v[2:3], off
	; GLOBALNESS1-NEXT: v_readlane_b32 s4, v41, 36			; GLOBALNESS1-NEXT: v_readlane_b32 s4, v41, 36
	; GLOBALNESS1-NEXT: v_readlane_b32 s5, v41, 37			; GLOBALNESS1-NEXT: v_readlane_b32 s5, v41, 37
	; GLOBALNESS1-NEXT: s_mov_b32 s91, s59			; GLOBALNESS1-NEXT: s_mov_b32 s91, s59
	; GLOBALNESS1-NEXT: s_andn2_b64 vcc, exec, s[4:5]			; GLOBALNESS1-NEXT: s_andn2_b64 vcc, exec, s[4:5]
	; GLOBALNESS1-NEXT: s_cbranch_vccnz .LBB1_14			; GLOBALNESS1-NEXT: s_cbranch_vccnz .LBB1_13
	; GLOBALNESS1-NEXT: ; %bb.13: ; %bb39.i			; GLOBALNESS1-NEXT: ; %bb.12: ; %bb39.i
	; GLOBALNESS1-NEXT: ; in Loop: Header=BB1_4 Depth=1			; GLOBALNESS1-NEXT: ; in Loop: Header=BB1_4 Depth=1
	; GLOBALNESS1-NEXT: v_mov_b32_e32 v45, v44			; GLOBALNESS1-NEXT: v_mov_b32_e32 v45, v44
	; GLOBALNESS1-NEXT: global_store_dwordx2 v[2:3], v[44:45], off			; GLOBALNESS1-NEXT: global_store_dwordx2 v[2:3], v[44:45], off
	; GLOBALNESS1-NEXT: .LBB1_14: ; %bb44.lr.ph.i			; GLOBALNESS1-NEXT: .LBB1_13: ; %bb44.lr.ph.i
	; GLOBALNESS1-NEXT: ; in Loop: Header=BB1_4 Depth=1			; GLOBALNESS1-NEXT: ; in Loop: Header=BB1_4 Depth=1
	; GLOBALNESS1-NEXT: v_cmp_ne_u32_e32 vcc, 0, v46			; GLOBALNESS1-NEXT: v_cmp_ne_u32_e32 vcc, 0, v46
	; GLOBALNESS1-NEXT: v_cndmask_b32_e32 v2, 0, v40, vcc			; GLOBALNESS1-NEXT: v_cndmask_b32_e32 v2, 0, v40, vcc
	; GLOBALNESS1-NEXT: v_readlane_b32 s62, v41, 32			; GLOBALNESS1-NEXT: v_readlane_b32 s62, v41, 32
	; GLOBALNESS1-NEXT: v_readlane_b32 s64, v41, 34			; GLOBALNESS1-NEXT: v_readlane_b32 s64, v41, 34
	; GLOBALNESS1-NEXT: s_waitcnt vmcnt(0)			; GLOBALNESS1-NEXT: s_waitcnt vmcnt(0)
	; GLOBALNESS1-NEXT: v_cmp_nlt_f64_e64 s[56:57], 0, v[0:1]			; GLOBALNESS1-NEXT: v_cmp_nlt_f64_e64 s[56:57], 0, v[0:1]
	; GLOBALNESS1-NEXT: v_cmp_eq_u32_e64 s[58:59], 0, v2			; GLOBALNESS1-NEXT: v_cmp_eq_u32_e64 s[58:59], 0, v2
	; GLOBALNESS1-NEXT: v_readlane_b32 s63, v41, 33			; GLOBALNESS1-NEXT: v_readlane_b32 s63, v41, 33
	; GLOBALNESS1-NEXT: v_readlane_b32 s65, v41, 35			; GLOBALNESS1-NEXT: v_readlane_b32 s65, v41, 35
	; GLOBALNESS1-NEXT: s_branch .LBB1_17			; GLOBALNESS1-NEXT: s_branch .LBB1_16
	; GLOBALNESS1-NEXT: .LBB1_15: ; %Flow7			; GLOBALNESS1-NEXT: .LBB1_14: ; %Flow7
	; GLOBALNESS1-NEXT: ; in Loop: Header=BB1_17 Depth=2			; GLOBALNESS1-NEXT: ; in Loop: Header=BB1_16 Depth=2
	; GLOBALNESS1-NEXT: s_or_b64 exec, exec, s[4:5]			; GLOBALNESS1-NEXT: s_or_b64 exec, exec, s[4:5]
	; GLOBALNESS1-NEXT: .LBB1_16: ; %bb63.i			; GLOBALNESS1-NEXT: .LBB1_15: ; %bb63.i
	; GLOBALNESS1-NEXT: ; in Loop: Header=BB1_17 Depth=2			; GLOBALNESS1-NEXT: ; in Loop: Header=BB1_16 Depth=2
	; GLOBALNESS1-NEXT: s_andn2_b64 vcc, exec, s[50:51]			; GLOBALNESS1-NEXT: s_andn2_b64 vcc, exec, s[50:51]
	; GLOBALNESS1-NEXT: s_cbranch_vccz .LBB1_25			; GLOBALNESS1-NEXT: s_cbranch_vccz .LBB1_24
	; GLOBALNESS1-NEXT: .LBB1_17: ; %bb44.i			; GLOBALNESS1-NEXT: .LBB1_16: ; %bb44.i
	; GLOBALNESS1-NEXT: ; Parent Loop BB1_4 Depth=1			; GLOBALNESS1-NEXT: ; Parent Loop BB1_4 Depth=1
	; GLOBALNESS1-NEXT: ; => This Inner Loop Header: Depth=2			; GLOBALNESS1-NEXT: ; => This Inner Loop Header: Depth=2
	; GLOBALNESS1-NEXT: s_andn2_b64 vcc, exec, s[100:101]			; GLOBALNESS1-NEXT: s_andn2_b64 vcc, exec, s[100:101]
	; GLOBALNESS1-NEXT: s_cbranch_vccnz .LBB1_16			; GLOBALNESS1-NEXT: s_cbranch_vccnz .LBB1_15
	; GLOBALNESS1-NEXT: ; %bb.18: ; %bb46.i			; GLOBALNESS1-NEXT: ; %bb.17: ; %bb46.i
	; GLOBALNESS1-NEXT: ; in Loop: Header=BB1_17 Depth=2			; GLOBALNESS1-NEXT: ; in Loop: Header=BB1_16 Depth=2
	; GLOBALNESS1-NEXT: s_andn2_b64 vcc, exec, s[46:47]			; GLOBALNESS1-NEXT: s_andn2_b64 vcc, exec, s[46:47]
	; GLOBALNESS1-NEXT: s_cbranch_vccnz .LBB1_16			; GLOBALNESS1-NEXT: s_cbranch_vccnz .LBB1_15
	; GLOBALNESS1-NEXT: ; %bb.19: ; %bb50.i			; GLOBALNESS1-NEXT: ; %bb.18: ; %bb50.i
	; GLOBALNESS1-NEXT: ; in Loop: Header=BB1_17 Depth=2			; GLOBALNESS1-NEXT: ; in Loop: Header=BB1_16 Depth=2
	; GLOBALNESS1-NEXT: s_andn2_b64 vcc, exec, s[62:63]			; GLOBALNESS1-NEXT: s_andn2_b64 vcc, exec, s[62:63]
	; GLOBALNESS1-NEXT: s_cbranch_vccnz .LBB1_22			; GLOBALNESS1-NEXT: s_cbranch_vccnz .LBB1_21
	; GLOBALNESS1-NEXT: ; %bb.20: ; %bb3.i.i			; GLOBALNESS1-NEXT: ; %bb.19: ; %bb3.i.i
	; GLOBALNESS1-NEXT: ; in Loop: Header=BB1_17 Depth=2			; GLOBALNESS1-NEXT: ; in Loop: Header=BB1_16 Depth=2
	; GLOBALNESS1-NEXT: s_andn2_b64 vcc, exec, s[64:65]			; GLOBALNESS1-NEXT: s_andn2_b64 vcc, exec, s[64:65]
	; GLOBALNESS1-NEXT: s_cbranch_vccnz .LBB1_22			; GLOBALNESS1-NEXT: s_cbranch_vccnz .LBB1_21
	; GLOBALNESS1-NEXT: ; %bb.21: ; %bb6.i.i			; GLOBALNESS1-NEXT: ; %bb.20: ; %bb6.i.i
	; GLOBALNESS1-NEXT: ; in Loop: Header=BB1_17 Depth=2			; GLOBALNESS1-NEXT: ; in Loop: Header=BB1_16 Depth=2
	; GLOBALNESS1-NEXT: s_andn2_b64 vcc, exec, s[56:57]			; GLOBALNESS1-NEXT: s_andn2_b64 vcc, exec, s[56:57]
	; GLOBALNESS1-NEXT: .LBB1_22: ; %spam.exit.i			; GLOBALNESS1-NEXT: .LBB1_21: ; %spam.exit.i
	; GLOBALNESS1-NEXT: ; in Loop: Header=BB1_17 Depth=2			; GLOBALNESS1-NEXT: ; in Loop: Header=BB1_16 Depth=2
	; GLOBALNESS1-NEXT: s_andn2_b64 vcc, exec, s[48:49]			; GLOBALNESS1-NEXT: s_andn2_b64 vcc, exec, s[48:49]
	; GLOBALNESS1-NEXT: s_cbranch_vccnz .LBB1_16			; GLOBALNESS1-NEXT: s_cbranch_vccnz .LBB1_15
	; GLOBALNESS1-NEXT: ; %bb.23: ; %bb55.i			; GLOBALNESS1-NEXT: ; %bb.22: ; %bb55.i
	; GLOBALNESS1-NEXT: ; in Loop: Header=BB1_17 Depth=2			; GLOBALNESS1-NEXT: ; in Loop: Header=BB1_16 Depth=2
	; GLOBALNESS1-NEXT: s_add_u32 s60, s38, 40			; GLOBALNESS1-NEXT: s_add_u32 s60, s38, 40
	; GLOBALNESS1-NEXT: s_addc_u32 s61, s39, 0			; GLOBALNESS1-NEXT: s_addc_u32 s61, s39, 0
	; GLOBALNESS1-NEXT: s_mov_b64 s[4:5], s[40:41]			; GLOBALNESS1-NEXT: s_mov_b64 s[4:5], s[40:41]
	; GLOBALNESS1-NEXT: s_mov_b64 s[6:7], s[36:37]			; GLOBALNESS1-NEXT: s_mov_b64 s[6:7], s[36:37]
	; GLOBALNESS1-NEXT: s_mov_b64 s[8:9], s[60:61]			; GLOBALNESS1-NEXT: s_mov_b64 s[8:9], s[60:61]
	; GLOBALNESS1-NEXT: s_mov_b64 s[10:11], s[34:35]			; GLOBALNESS1-NEXT: s_mov_b64 s[10:11], s[34:35]
	; GLOBALNESS1-NEXT: s_mov_b32 s12, s42			; GLOBALNESS1-NEXT: s_mov_b32 s12, s42
	; GLOBALNESS1-NEXT: s_mov_b32 s13, s45			; GLOBALNESS1-NEXT: s_mov_b32 s13, s45
	; GLOBALNESS1-NEXT: s_mov_b32 s14, s44			; GLOBALNESS1-NEXT: s_mov_b32 s14, s44
	; GLOBALNESS1-NEXT: v_mov_b32_e32 v31, v43			; GLOBALNESS1-NEXT: v_mov_b32_e32 v31, v43
	; GLOBALNESS1-NEXT: s_swappc_b64 s[30:31], s[52:53]			; GLOBALNESS1-NEXT: s_swappc_b64 s[30:31], s[52:53]
	; GLOBALNESS1-NEXT: v_pk_mov_b32 v[0:1], 0, 0			; GLOBALNESS1-NEXT: v_pk_mov_b32 v[0:1], 0, 0
	; GLOBALNESS1-NEXT: s_mov_b64 s[4:5], s[40:41]			; GLOBALNESS1-NEXT: s_mov_b64 s[4:5], s[40:41]
	; GLOBALNESS1-NEXT: s_mov_b64 s[6:7], s[36:37]			; GLOBALNESS1-NEXT: s_mov_b64 s[6:7], s[36:37]
	; GLOBALNESS1-NEXT: s_mov_b64 s[8:9], s[60:61]			; GLOBALNESS1-NEXT: s_mov_b64 s[8:9], s[60:61]
	; GLOBALNESS1-NEXT: s_mov_b64 s[10:11], s[34:35]			; GLOBALNESS1-NEXT: s_mov_b64 s[10:11], s[34:35]
	; GLOBALNESS1-NEXT: s_mov_b32 s12, s42			; GLOBALNESS1-NEXT: s_mov_b32 s12, s42
	; GLOBALNESS1-NEXT: s_mov_b32 s13, s45			; GLOBALNESS1-NEXT: s_mov_b32 s13, s45
	; GLOBALNESS1-NEXT: s_mov_b32 s14, s44			; GLOBALNESS1-NEXT: s_mov_b32 s14, s44
	; GLOBALNESS1-NEXT: v_mov_b32_e32 v31, v43			; GLOBALNESS1-NEXT: v_mov_b32_e32 v31, v43
	; GLOBALNESS1-NEXT: global_store_dwordx2 v[0:1], a[32:33], off			; GLOBALNESS1-NEXT: global_store_dwordx2 v[0:1], a[32:33], off
	; GLOBALNESS1-NEXT: s_swappc_b64 s[30:31], s[52:53]			; GLOBALNESS1-NEXT: s_swappc_b64 s[30:31], s[52:53]
	; GLOBALNESS1-NEXT: s_and_saveexec_b64 s[4:5], s[58:59]			; GLOBALNESS1-NEXT: s_and_saveexec_b64 s[4:5], s[58:59]
	; GLOBALNESS1-NEXT: s_cbranch_execz .LBB1_15			; GLOBALNESS1-NEXT: s_cbranch_execz .LBB1_14
	; GLOBALNESS1-NEXT: ; %bb.24: ; %bb62.i			; GLOBALNESS1-NEXT: ; %bb.23: ; %bb62.i
	; GLOBALNESS1-NEXT: ; in Loop: Header=BB1_17 Depth=2			; GLOBALNESS1-NEXT: ; in Loop: Header=BB1_16 Depth=2
	; GLOBALNESS1-NEXT: v_mov_b32_e32 v45, v44			; GLOBALNESS1-NEXT: v_mov_b32_e32 v45, v44
	; GLOBALNESS1-NEXT: v_pk_mov_b32 v[0:1], 0, 0			; GLOBALNESS1-NEXT: v_pk_mov_b32 v[0:1], 0, 0
	; GLOBALNESS1-NEXT: global_store_dwordx2 v[0:1], v[44:45], off			; GLOBALNESS1-NEXT: global_store_dwordx2 v[0:1], v[44:45], off
	; GLOBALNESS1-NEXT: s_branch .LBB1_15			; GLOBALNESS1-NEXT: s_branch .LBB1_14
	; GLOBALNESS1-NEXT: .LBB1_25: ; %Flow14			; GLOBALNESS1-NEXT: .LBB1_24: ; %Flow14
	; GLOBALNESS1-NEXT: ; in Loop: Header=BB1_4 Depth=1			; GLOBALNESS1-NEXT: ; in Loop: Header=BB1_4 Depth=1
	; GLOBALNESS1-NEXT: v_readlane_b32 s56, v41, 0			; GLOBALNESS1-NEXT: v_readlane_b32 s56, v41, 0
	; GLOBALNESS1-NEXT: v_readlane_b32 s57, v41, 1			; GLOBALNESS1-NEXT: v_readlane_b32 s57, v41, 1
	; GLOBALNESS1-NEXT: v_readlane_b32 s68, v41, 12			; GLOBALNESS1-NEXT: v_readlane_b32 s68, v41, 12
	; GLOBALNESS1-NEXT: v_readlane_b32 s69, v41, 13			; GLOBALNESS1-NEXT: v_readlane_b32 s69, v41, 13
	; GLOBALNESS1-NEXT: v_readlane_b32 s70, v41, 14			; GLOBALNESS1-NEXT: v_readlane_b32 s70, v41, 14
	; GLOBALNESS1-NEXT: v_readlane_b32 s71, v41, 15			; GLOBALNESS1-NEXT: v_readlane_b32 s71, v41, 15
	; GLOBALNESS1-NEXT: v_readlane_b32 s72, v41, 16			; GLOBALNESS1-NEXT: v_readlane_b32 s72, v41, 16
	▲ Show 20 Lines • Show All 52 Lines • ▼ Show 20 Lines
	; GLOBALNESS1-NEXT: v_readlane_b32 s60, v41, 4			; GLOBALNESS1-NEXT: v_readlane_b32 s60, v41, 4
	; GLOBALNESS1-NEXT: v_readlane_b32 s61, v41, 5			; GLOBALNESS1-NEXT: v_readlane_b32 s61, v41, 5
	; GLOBALNESS1-NEXT: v_readlane_b32 s62, v41, 6			; GLOBALNESS1-NEXT: v_readlane_b32 s62, v41, 6
	; GLOBALNESS1-NEXT: v_readlane_b32 s63, v41, 7			; GLOBALNESS1-NEXT: v_readlane_b32 s63, v41, 7
	; GLOBALNESS1-NEXT: v_readlane_b32 s64, v41, 8			; GLOBALNESS1-NEXT: v_readlane_b32 s64, v41, 8
	; GLOBALNESS1-NEXT: v_readlane_b32 s65, v41, 9			; GLOBALNESS1-NEXT: v_readlane_b32 s65, v41, 9
	; GLOBALNESS1-NEXT: v_readlane_b32 s66, v41, 10			; GLOBALNESS1-NEXT: v_readlane_b32 s66, v41, 10
	; GLOBALNESS1-NEXT: v_readlane_b32 s67, v41, 11			; GLOBALNESS1-NEXT: v_readlane_b32 s67, v41, 11
	; GLOBALNESS1-NEXT: .LBB1_26: ; %Flow15			; GLOBALNESS1-NEXT: .LBB1_25: ; %Flow15
	; GLOBALNESS1-NEXT: ; in Loop: Header=BB1_4 Depth=1			; GLOBALNESS1-NEXT: ; in Loop: Header=BB1_4 Depth=1
	; GLOBALNESS1-NEXT: s_or_b64 exec, exec, s[88:89]			; GLOBALNESS1-NEXT: s_or_b64 exec, exec, s[88:89]
	; GLOBALNESS1-NEXT: s_and_saveexec_b64 s[4:5], s[54:55]			; GLOBALNESS1-NEXT: s_and_saveexec_b64 s[4:5], s[54:55]
	; GLOBALNESS1-NEXT: s_mov_b64 s[54:55], s[92:93]			; GLOBALNESS1-NEXT: s_mov_b64 s[54:55], s[92:93]
	; GLOBALNESS1-NEXT: s_cbranch_execz .LBB1_2			; GLOBALNESS1-NEXT: s_cbranch_execz .LBB1_2
	; GLOBALNESS1-NEXT: ; %bb.27: ; %bb67.i			; GLOBALNESS1-NEXT: ; %bb.26: ; %bb67.i
	; GLOBALNESS1-NEXT: ; in Loop: Header=BB1_4 Depth=1			; GLOBALNESS1-NEXT: ; in Loop: Header=BB1_4 Depth=1
	; GLOBALNESS1-NEXT: v_readlane_b32 s6, v41, 38			; GLOBALNESS1-NEXT: v_readlane_b32 s6, v41, 38
	; GLOBALNESS1-NEXT: v_readlane_b32 s7, v41, 39			; GLOBALNESS1-NEXT: v_readlane_b32 s7, v41, 39
	; GLOBALNESS1-NEXT: s_andn2_b64 vcc, exec, s[6:7]			; GLOBALNESS1-NEXT: s_andn2_b64 vcc, exec, s[6:7]
	; GLOBALNESS1-NEXT: s_cbranch_vccnz .LBB1_1			; GLOBALNESS1-NEXT: s_cbranch_vccnz .LBB1_1
	; GLOBALNESS1-NEXT: ; %bb.28: ; %bb69.i			; GLOBALNESS1-NEXT: ; %bb.27: ; %bb69.i
	; GLOBALNESS1-NEXT: ; in Loop: Header=BB1_4 Depth=1			; GLOBALNESS1-NEXT: ; in Loop: Header=BB1_4 Depth=1
	; GLOBALNESS1-NEXT: v_mov_b32_e32 v45, v44			; GLOBALNESS1-NEXT: v_mov_b32_e32 v45, v44
	; GLOBALNESS1-NEXT: v_pk_mov_b32 v[32:33], 0, 0			; GLOBALNESS1-NEXT: v_pk_mov_b32 v[32:33], 0, 0
	; GLOBALNESS1-NEXT: global_store_dwordx2 v[32:33], v[44:45], off			; GLOBALNESS1-NEXT: global_store_dwordx2 v[32:33], v[44:45], off
	; GLOBALNESS1-NEXT: s_branch .LBB1_1			; GLOBALNESS1-NEXT: s_branch .LBB1_1
	; GLOBALNESS1-NEXT: .LBB1_29: ; %bb73.i			; GLOBALNESS1-NEXT: .LBB1_28: ; %bb73.i
	; GLOBALNESS1-NEXT: ; in Loop: Header=BB1_4 Depth=1			; GLOBALNESS1-NEXT: ; in Loop: Header=BB1_4 Depth=1
	; GLOBALNESS1-NEXT: v_mov_b32_e32 v45, v44			; GLOBALNESS1-NEXT: v_mov_b32_e32 v45, v44
	; GLOBALNESS1-NEXT: v_pk_mov_b32 v[32:33], 0, 0			; GLOBALNESS1-NEXT: v_pk_mov_b32 v[32:33], 0, 0
	; GLOBALNESS1-NEXT: global_store_dwordx2 v[32:33], v[44:45], off			; GLOBALNESS1-NEXT: global_store_dwordx2 v[32:33], v[44:45], off
	; GLOBALNESS1-NEXT: s_branch .LBB1_2			; GLOBALNESS1-NEXT: s_branch .LBB1_2
	; GLOBALNESS1-NEXT: .LBB1_30: ; %loop.exit.guard			; GLOBALNESS1-NEXT: .LBB1_29: ; %loop.exit.guard
	; GLOBALNESS1-NEXT: s_andn2_b64 vcc, exec, s[4:5]			; GLOBALNESS1-NEXT: s_andn2_b64 vcc, exec, s[4:5]
	; GLOBALNESS1-NEXT: s_mov_b64 s[4:5], -1			; GLOBALNESS1-NEXT: s_mov_b64 s[4:5], -1
	; GLOBALNESS1-NEXT: s_cbranch_vccz .LBB1_32			; GLOBALNESS1-NEXT: s_cbranch_vccz .LBB1_31
	; GLOBALNESS1-NEXT: ; %bb.31: ; %bb7.i.i			; GLOBALNESS1-NEXT: ; %bb.30: ; %bb7.i.i
	; GLOBALNESS1-NEXT: s_add_u32 s8, s38, 40			; GLOBALNESS1-NEXT: s_add_u32 s8, s38, 40
	; GLOBALNESS1-NEXT: s_addc_u32 s9, s39, 0			; GLOBALNESS1-NEXT: s_addc_u32 s9, s39, 0
	; GLOBALNESS1-NEXT: s_mov_b64 s[4:5], s[40:41]			; GLOBALNESS1-NEXT: s_mov_b64 s[4:5], s[40:41]
	; GLOBALNESS1-NEXT: s_mov_b64 s[6:7], s[36:37]			; GLOBALNESS1-NEXT: s_mov_b64 s[6:7], s[36:37]
	; GLOBALNESS1-NEXT: s_mov_b64 s[10:11], s[34:35]			; GLOBALNESS1-NEXT: s_mov_b64 s[10:11], s[34:35]
	; GLOBALNESS1-NEXT: s_mov_b32 s12, s42			; GLOBALNESS1-NEXT: s_mov_b32 s12, s42
	; GLOBALNESS1-NEXT: s_mov_b32 s13, s45			; GLOBALNESS1-NEXT: s_mov_b32 s13, s45
	; GLOBALNESS1-NEXT: s_mov_b32 s14, s44			; GLOBALNESS1-NEXT: s_mov_b32 s14, s44
	; GLOBALNESS1-NEXT: v_mov_b32_e32 v31, v43			; GLOBALNESS1-NEXT: v_mov_b32_e32 v31, v43
	; GLOBALNESS1-NEXT: s_getpc_b64 s[16:17]			; GLOBALNESS1-NEXT: s_getpc_b64 s[16:17]
	; GLOBALNESS1-NEXT: s_add_u32 s16, s16, widget@rel32@lo+4			; GLOBALNESS1-NEXT: s_add_u32 s16, s16, widget@rel32@lo+4
	; GLOBALNESS1-NEXT: s_addc_u32 s17, s17, widget@rel32@hi+12			; GLOBALNESS1-NEXT: s_addc_u32 s17, s17, widget@rel32@hi+12
	; GLOBALNESS1-NEXT: s_swappc_b64 s[30:31], s[16:17]			; GLOBALNESS1-NEXT: s_swappc_b64 s[30:31], s[16:17]
	; GLOBALNESS1-NEXT: s_mov_b64 s[4:5], 0			; GLOBALNESS1-NEXT: s_mov_b64 s[4:5], 0
	; GLOBALNESS1-NEXT: .LBB1_32: ; %Flow			; GLOBALNESS1-NEXT: .LBB1_31: ; %Flow
	; GLOBALNESS1-NEXT: s_andn2_b64 vcc, exec, s[4:5]			; GLOBALNESS1-NEXT: s_andn2_b64 vcc, exec, s[4:5]
	; GLOBALNESS1-NEXT: s_cbranch_vccnz .LBB1_34			; GLOBALNESS1-NEXT: s_cbranch_vccnz .LBB1_33
	; GLOBALNESS1-NEXT: ; %bb.33: ; %bb11.i.i			; GLOBALNESS1-NEXT: ; %bb.32: ; %bb11.i.i
	; GLOBALNESS1-NEXT: s_add_u32 s8, s38, 40			; GLOBALNESS1-NEXT: s_add_u32 s8, s38, 40
	; GLOBALNESS1-NEXT: s_addc_u32 s9, s39, 0			; GLOBALNESS1-NEXT: s_addc_u32 s9, s39, 0
	; GLOBALNESS1-NEXT: s_mov_b64 s[4:5], s[40:41]			; GLOBALNESS1-NEXT: s_mov_b64 s[4:5], s[40:41]
	; GLOBALNESS1-NEXT: s_mov_b64 s[6:7], s[36:37]			; GLOBALNESS1-NEXT: s_mov_b64 s[6:7], s[36:37]
	; GLOBALNESS1-NEXT: s_mov_b64 s[10:11], s[34:35]			; GLOBALNESS1-NEXT: s_mov_b64 s[10:11], s[34:35]
	; GLOBALNESS1-NEXT: s_mov_b32 s12, s42			; GLOBALNESS1-NEXT: s_mov_b32 s12, s42
	; GLOBALNESS1-NEXT: s_mov_b32 s13, s45			; GLOBALNESS1-NEXT: s_mov_b32 s13, s45
	; GLOBALNESS1-NEXT: s_mov_b32 s14, s44			; GLOBALNESS1-NEXT: s_mov_b32 s14, s44
	; GLOBALNESS1-NEXT: v_mov_b32_e32 v31, v43			; GLOBALNESS1-NEXT: v_mov_b32_e32 v31, v43
	; GLOBALNESS1-NEXT: s_getpc_b64 s[16:17]			; GLOBALNESS1-NEXT: s_getpc_b64 s[16:17]
	; GLOBALNESS1-NEXT: s_add_u32 s16, s16, widget@rel32@lo+4			; GLOBALNESS1-NEXT: s_add_u32 s16, s16, widget@rel32@lo+4
	; GLOBALNESS1-NEXT: s_addc_u32 s17, s17, widget@rel32@hi+12			; GLOBALNESS1-NEXT: s_addc_u32 s17, s17, widget@rel32@hi+12
	; GLOBALNESS1-NEXT: s_swappc_b64 s[30:31], s[16:17]			; GLOBALNESS1-NEXT: s_swappc_b64 s[30:31], s[16:17]
	; GLOBALNESS1-NEXT: .LBB1_34: ; %UnifiedUnreachableBlock			; GLOBALNESS1-NEXT: .LBB1_33: ; %UnifiedUnreachableBlock
	;			;
	; GLOBALNESS0-LABEL: kernel:			; GLOBALNESS0-LABEL: kernel:
	; GLOBALNESS0: ; %bb.0: ; %bb			; GLOBALNESS0: ; %bb.0: ; %bb
	; GLOBALNESS0-NEXT: s_load_dwordx4 s[56:59], s[8:9], 0x0			; GLOBALNESS0-NEXT: s_load_dwordx4 s[56:59], s[8:9], 0x0
	; GLOBALNESS0-NEXT: v_mov_b32_e32 v43, v0			; GLOBALNESS0-NEXT: v_mov_b32_e32 v43, v0
	; GLOBALNESS0-NEXT: v_mov_b32_e32 v44, 0			; GLOBALNESS0-NEXT: v_mov_b32_e32 v44, 0
	; GLOBALNESS0-NEXT: v_pk_mov_b32 v[0:1], 0, 0			; GLOBALNESS0-NEXT: v_pk_mov_b32 v[0:1], 0, 0
	; GLOBALNESS0-NEXT: global_store_dword v[0:1], v44, off			; GLOBALNESS0-NEXT: global_store_dword v[0:1], v44, off
	▲ Show 20 Lines • Show All 179 Lines • ▼ Show 20 Lines
	; GLOBALNESS0-NEXT: v_writelane_b32 v42, s87, 9			; GLOBALNESS0-NEXT: v_writelane_b32 v42, s87, 9
	; GLOBALNESS0-NEXT: s_mov_b32 s32, 0			; GLOBALNESS0-NEXT: s_mov_b32 s32, 0
	; GLOBALNESS0-NEXT: s_branch .LBB1_4			; GLOBALNESS0-NEXT: s_branch .LBB1_4
	; GLOBALNESS0-NEXT: .LBB1_1: ; %bb70.i			; GLOBALNESS0-NEXT: .LBB1_1: ; %bb70.i
	; GLOBALNESS0-NEXT: ; in Loop: Header=BB1_4 Depth=1			; GLOBALNESS0-NEXT: ; in Loop: Header=BB1_4 Depth=1
	; GLOBALNESS0-NEXT: v_readlane_b32 s6, v41, 40			; GLOBALNESS0-NEXT: v_readlane_b32 s6, v41, 40
	; GLOBALNESS0-NEXT: v_readlane_b32 s7, v41, 41			; GLOBALNESS0-NEXT: v_readlane_b32 s7, v41, 41
	; GLOBALNESS0-NEXT: s_andn2_b64 vcc, exec, s[6:7]			; GLOBALNESS0-NEXT: s_andn2_b64 vcc, exec, s[6:7]
	; GLOBALNESS0-NEXT: s_cbranch_vccz .LBB1_29			; GLOBALNESS0-NEXT: s_cbranch_vccz .LBB1_28
	; GLOBALNESS0-NEXT: .LBB1_2: ; %Flow6			; GLOBALNESS0-NEXT: .LBB1_2: ; %Flow6
	; GLOBALNESS0-NEXT: ; in Loop: Header=BB1_4 Depth=1			; GLOBALNESS0-NEXT: ; in Loop: Header=BB1_4 Depth=1
	; GLOBALNESS0-NEXT: s_or_b64 exec, exec, s[4:5]			; GLOBALNESS0-NEXT: s_or_b64 exec, exec, s[4:5]
	; GLOBALNESS0-NEXT: s_mov_b64 s[6:7], 0			; GLOBALNESS0-NEXT: s_mov_b64 s[8:9], 0
				; GLOBALNESS0-NEXT: ; implicit-def: $sgpr4_sgpr5
	; GLOBALNESS0-NEXT: .LBB1_3: ; %Flow19			; GLOBALNESS0-NEXT: .LBB1_3: ; %Flow19
	; GLOBALNESS0-NEXT: ; in Loop: Header=BB1_4 Depth=1			; GLOBALNESS0-NEXT: ; in Loop: Header=BB1_4 Depth=1
	; GLOBALNESS0-NEXT: v_accvgpr_write_b32 a63, v31			; GLOBALNESS0-NEXT: v_accvgpr_write_b32 a63, v31
	; GLOBALNESS0-NEXT: v_readlane_b32 s4, v42, 10			; GLOBALNESS0-NEXT: s_and_b64 vcc, exec, s[8:9]
	; GLOBALNESS0-NEXT: s_and_b64 vcc, exec, s[6:7]
	; GLOBALNESS0-NEXT: v_accvgpr_write_b32 a62, v30			; GLOBALNESS0-NEXT: v_accvgpr_write_b32 a62, v30
	; GLOBALNESS0-NEXT: v_accvgpr_write_b32 a61, v29			; GLOBALNESS0-NEXT: v_accvgpr_write_b32 a61, v29
	; GLOBALNESS0-NEXT: v_accvgpr_write_b32 a60, v28			; GLOBALNESS0-NEXT: v_accvgpr_write_b32 a60, v28
	; GLOBALNESS0-NEXT: v_accvgpr_write_b32 a59, v27			; GLOBALNESS0-NEXT: v_accvgpr_write_b32 a59, v27
	; GLOBALNESS0-NEXT: v_accvgpr_write_b32 a58, v26			; GLOBALNESS0-NEXT: v_accvgpr_write_b32 a58, v26
	; GLOBALNESS0-NEXT: v_accvgpr_write_b32 a57, v25			; GLOBALNESS0-NEXT: v_accvgpr_write_b32 a57, v25
	; GLOBALNESS0-NEXT: v_accvgpr_write_b32 a56, v24			; GLOBALNESS0-NEXT: v_accvgpr_write_b32 a56, v24
	; GLOBALNESS0-NEXT: v_accvgpr_write_b32 a55, v23			; GLOBALNESS0-NEXT: v_accvgpr_write_b32 a55, v23
	Show All 15 Lines
	; GLOBALNESS0-NEXT: v_accvgpr_write_b32 a39, v7			; GLOBALNESS0-NEXT: v_accvgpr_write_b32 a39, v7
	; GLOBALNESS0-NEXT: v_accvgpr_write_b32 a38, v6			; GLOBALNESS0-NEXT: v_accvgpr_write_b32 a38, v6
	; GLOBALNESS0-NEXT: v_accvgpr_write_b32 a37, v5			; GLOBALNESS0-NEXT: v_accvgpr_write_b32 a37, v5
	; GLOBALNESS0-NEXT: v_accvgpr_write_b32 a36, v4			; GLOBALNESS0-NEXT: v_accvgpr_write_b32 a36, v4
	; GLOBALNESS0-NEXT: v_accvgpr_write_b32 a35, v3			; GLOBALNESS0-NEXT: v_accvgpr_write_b32 a35, v3
	; GLOBALNESS0-NEXT: v_accvgpr_write_b32 a34, v2			; GLOBALNESS0-NEXT: v_accvgpr_write_b32 a34, v2
	; GLOBALNESS0-NEXT: v_accvgpr_write_b32 a33, v1			; GLOBALNESS0-NEXT: v_accvgpr_write_b32 a33, v1
	; GLOBALNESS0-NEXT: v_accvgpr_write_b32 a32, v0			; GLOBALNESS0-NEXT: v_accvgpr_write_b32 a32, v0
	; GLOBALNESS0-NEXT: v_readlane_b32 s5, v42, 11			; GLOBALNESS0-NEXT: s_cbranch_vccnz .LBB1_29
	; GLOBALNESS0-NEXT: s_cbranch_vccnz .LBB1_30
	; GLOBALNESS0-NEXT: .LBB1_4: ; %bb5			; GLOBALNESS0-NEXT: .LBB1_4: ; %bb5
	; GLOBALNESS0-NEXT: ; =>This Loop Header: Depth=1			; GLOBALNESS0-NEXT: ; =>This Loop Header: Depth=1
	; GLOBALNESS0-NEXT: ; Child Loop BB1_17 Depth 2			; GLOBALNESS0-NEXT: ; Child Loop BB1_16 Depth 2
	; GLOBALNESS0-NEXT: v_readlane_b32 s60, v41, 0			; GLOBALNESS0-NEXT: v_readlane_b32 s60, v41, 0
	; GLOBALNESS0-NEXT: v_readlane_b32 s61, v41, 1			; GLOBALNESS0-NEXT: v_readlane_b32 s61, v41, 1
	; GLOBALNESS0-NEXT: v_pk_mov_b32 v[0:1], s[60:61], s[60:61] op_sel:[0,1]			; GLOBALNESS0-NEXT: v_pk_mov_b32 v[0:1], s[60:61], s[60:61] op_sel:[0,1]
	; GLOBALNESS0-NEXT: flat_load_dword v40, v[0:1]			; GLOBALNESS0-NEXT: flat_load_dword v40, v[0:1]
	; GLOBALNESS0-NEXT: s_add_u32 s8, s38, 40			; GLOBALNESS0-NEXT: s_add_u32 s8, s38, 40
	; GLOBALNESS0-NEXT: buffer_store_dword v44, off, s[0:3], 0			; GLOBALNESS0-NEXT: buffer_store_dword v44, off, s[0:3], 0
	; GLOBALNESS0-NEXT: flat_load_dword v46, v[0:1]			; GLOBALNESS0-NEXT: flat_load_dword v46, v[0:1]
	; GLOBALNESS0-NEXT: s_addc_u32 s9, s39, 0			; GLOBALNESS0-NEXT: s_addc_u32 s9, s39, 0
	Show All 31 Lines
	; GLOBALNESS0-NEXT: v_readlane_b32 s86, v41, 26			; GLOBALNESS0-NEXT: v_readlane_b32 s86, v41, 26
	; GLOBALNESS0-NEXT: v_readlane_b32 s87, v41, 27			; GLOBALNESS0-NEXT: v_readlane_b32 s87, v41, 27
	; GLOBALNESS0-NEXT: v_readlane_b32 s88, v41, 28			; GLOBALNESS0-NEXT: v_readlane_b32 s88, v41, 28
	; GLOBALNESS0-NEXT: v_readlane_b32 s89, v41, 29			; GLOBALNESS0-NEXT: v_readlane_b32 s89, v41, 29
	; GLOBALNESS0-NEXT: v_readlane_b32 s90, v41, 30			; GLOBALNESS0-NEXT: v_readlane_b32 s90, v41, 30
	; GLOBALNESS0-NEXT: v_readlane_b32 s91, v41, 31			; GLOBALNESS0-NEXT: v_readlane_b32 s91, v41, 31
	; GLOBALNESS0-NEXT: s_waitcnt lgkmcnt(0)			; GLOBALNESS0-NEXT: s_waitcnt lgkmcnt(0)
	; GLOBALNESS0-NEXT: s_swappc_b64 s[30:31], s[100:101]			; GLOBALNESS0-NEXT: s_swappc_b64 s[30:31], s[100:101]
	; GLOBALNESS0-NEXT: ; implicit-def: $sgpr4_sgpr5
	; GLOBALNESS0-NEXT: s_and_b64 vcc, exec, s[54:55]			; GLOBALNESS0-NEXT: s_and_b64 vcc, exec, s[54:55]
	; GLOBALNESS0-NEXT: ; kill: killed $sgpr4_sgpr5			; GLOBALNESS0-NEXT: s_mov_b64 s[6:7], -1
	; GLOBALNESS0-NEXT: s_mov_b64 s[4:5], -1			; GLOBALNESS0-NEXT: ; implicit-def: $sgpr4_sgpr5
	; GLOBALNESS0-NEXT: s_cbranch_vccnz .LBB1_10			; GLOBALNESS0-NEXT: s_cbranch_vccnz .LBB1_9
	; GLOBALNESS0-NEXT: ; %bb.5: ; %NodeBlock			; GLOBALNESS0-NEXT: ; %bb.5: ; %NodeBlock
	; GLOBALNESS0-NEXT: ; in Loop: Header=BB1_4 Depth=1			; GLOBALNESS0-NEXT: ; in Loop: Header=BB1_4 Depth=1
	; GLOBALNESS0-NEXT: s_cmp_lt_i32 s59, 1			; GLOBALNESS0-NEXT: s_cmp_lt_i32 s59, 1
	; GLOBALNESS0-NEXT: s_cbranch_scc1 .LBB1_7			; GLOBALNESS0-NEXT: s_cbranch_scc1 .LBB1_7
	; GLOBALNESS0-NEXT: ; %bb.6: ; %LeafBlock3			; GLOBALNESS0-NEXT: ; %bb.6: ; %LeafBlock3
	; GLOBALNESS0-NEXT: ; in Loop: Header=BB1_4 Depth=1			; GLOBALNESS0-NEXT: ; in Loop: Header=BB1_4 Depth=1
	; GLOBALNESS0-NEXT: s_cmp_lg_u32 s59, 1			; GLOBALNESS0-NEXT: s_cmp_lg_u32 s59, 1
	; GLOBALNESS0-NEXT: s_mov_b64 s[8:9], -1			; GLOBALNESS0-NEXT: s_mov_b64 s[4:5], -1
	; GLOBALNESS0-NEXT: s_cselect_b64 s[4:5], -1, 0			; GLOBALNESS0-NEXT: s_cselect_b64 s[6:7], -1, 0
	; GLOBALNESS0-NEXT: s_cbranch_execz .LBB1_8			; GLOBALNESS0-NEXT: s_cbranch_execz .LBB1_8
	; GLOBALNESS0-NEXT: s_branch .LBB1_9			; GLOBALNESS0-NEXT: s_branch .LBB1_9
	; GLOBALNESS0-NEXT: .LBB1_7: ; in Loop: Header=BB1_4 Depth=1			; GLOBALNESS0-NEXT: .LBB1_7: ; in Loop: Header=BB1_4 Depth=1
	; GLOBALNESS0-NEXT: s_mov_b64 s[4:5], 0			; GLOBALNESS0-NEXT: s_mov_b64 s[6:7], 0
	; GLOBALNESS0-NEXT: ; implicit-def: $sgpr8_sgpr9			; GLOBALNESS0-NEXT: ; implicit-def: $sgpr4_sgpr5
	; GLOBALNESS0-NEXT: .LBB1_8: ; %LeafBlock			; GLOBALNESS0-NEXT: .LBB1_8: ; %LeafBlock
	; GLOBALNESS0-NEXT: ; in Loop: Header=BB1_4 Depth=1			; GLOBALNESS0-NEXT: ; in Loop: Header=BB1_4 Depth=1
	; GLOBALNESS0-NEXT: s_cmp_lg_u32 s59, 0			; GLOBALNESS0-NEXT: s_cmp_lg_u32 s59, 0
	; GLOBALNESS0-NEXT: s_mov_b64 s[8:9], 0			; GLOBALNESS0-NEXT: s_mov_b64 s[4:5], 0
	; GLOBALNESS0-NEXT: s_cselect_b64 s[4:5], -1, 0			; GLOBALNESS0-NEXT: s_cselect_b64 s[6:7], -1, 0
	; GLOBALNESS0-NEXT: .LBB1_9: ; %Flow18			; GLOBALNESS0-NEXT: .LBB1_9: ; %Flow16
	; GLOBALNESS0-NEXT: ; in Loop: Header=BB1_4 Depth=1
	; GLOBALNESS0-NEXT: v_writelane_b32 v42, s8, 10
	; GLOBALNESS0-NEXT: v_writelane_b32 v42, s9, 11
	; GLOBALNESS0-NEXT: .LBB1_10: ; %Flow16
	; GLOBALNESS0-NEXT: ; in Loop: Header=BB1_4 Depth=1			; GLOBALNESS0-NEXT: ; in Loop: Header=BB1_4 Depth=1
	; GLOBALNESS0-NEXT: v_readlane_b32 s64, v41, 0			; GLOBALNESS0-NEXT: v_readlane_b32 s64, v41, 0
	; GLOBALNESS0-NEXT: v_readlane_b32 s65, v41, 1			; GLOBALNESS0-NEXT: v_readlane_b32 s65, v41, 1
	; GLOBALNESS0-NEXT: v_readlane_b32 s68, v41, 4			; GLOBALNESS0-NEXT: v_readlane_b32 s68, v41, 4
	; GLOBALNESS0-NEXT: v_readlane_b32 s69, v41, 5			; GLOBALNESS0-NEXT: v_readlane_b32 s69, v41, 5
	; GLOBALNESS0-NEXT: s_mov_b64 s[56:57], s[64:65]			; GLOBALNESS0-NEXT: s_mov_b64 s[56:57], s[64:65]
	; GLOBALNESS0-NEXT: v_readlane_b32 s70, v41, 6			; GLOBALNESS0-NEXT: v_readlane_b32 s70, v41, 6
	; GLOBALNESS0-NEXT: v_readlane_b32 s71, v41, 7			; GLOBALNESS0-NEXT: v_readlane_b32 s71, v41, 7
	▲ Show 20 Lines • Show All 49 Lines • ▼ Show 20 Lines
	; GLOBALNESS0-NEXT: s_mov_b32 s93, s57			; GLOBALNESS0-NEXT: s_mov_b32 s93, s57
	; GLOBALNESS0-NEXT: s_mov_b32 s94, s57			; GLOBALNESS0-NEXT: s_mov_b32 s94, s57
	; GLOBALNESS0-NEXT: s_mov_b32 s95, s57			; GLOBALNESS0-NEXT: s_mov_b32 s95, s57
	; GLOBALNESS0-NEXT: s_mov_b32 s96, s57			; GLOBALNESS0-NEXT: s_mov_b32 s96, s57
	; GLOBALNESS0-NEXT: s_mov_b32 s97, s57			; GLOBALNESS0-NEXT: s_mov_b32 s97, s57
	; GLOBALNESS0-NEXT: s_mov_b32 s98, s57			; GLOBALNESS0-NEXT: s_mov_b32 s98, s57
	; GLOBALNESS0-NEXT: s_mov_b32 s99, s57			; GLOBALNESS0-NEXT: s_mov_b32 s99, s57
	; GLOBALNESS0-NEXT: v_pk_mov_b32 v[0:1], s[68:69], s[68:69] op_sel:[0,1]			; GLOBALNESS0-NEXT: v_pk_mov_b32 v[0:1], s[68:69], s[68:69] op_sel:[0,1]
	; GLOBALNESS0-NEXT: s_mov_b64 s[6:7], -1			; GLOBALNESS0-NEXT: s_mov_b64 s[8:9], -1
	; GLOBALNESS0-NEXT: s_and_b64 vcc, exec, s[4:5]			; GLOBALNESS0-NEXT: s_and_b64 vcc, exec, s[6:7]
	; GLOBALNESS0-NEXT: v_pk_mov_b32 v[2:3], s[70:71], s[70:71] op_sel:[0,1]			; GLOBALNESS0-NEXT: v_pk_mov_b32 v[2:3], s[70:71], s[70:71] op_sel:[0,1]
	; GLOBALNESS0-NEXT: v_pk_mov_b32 v[4:5], s[72:73], s[72:73] op_sel:[0,1]			; GLOBALNESS0-NEXT: v_pk_mov_b32 v[4:5], s[72:73], s[72:73] op_sel:[0,1]
	; GLOBALNESS0-NEXT: v_pk_mov_b32 v[6:7], s[74:75], s[74:75] op_sel:[0,1]			; GLOBALNESS0-NEXT: v_pk_mov_b32 v[6:7], s[74:75], s[74:75] op_sel:[0,1]
	; GLOBALNESS0-NEXT: v_pk_mov_b32 v[8:9], s[76:77], s[76:77] op_sel:[0,1]			; GLOBALNESS0-NEXT: v_pk_mov_b32 v[8:9], s[76:77], s[76:77] op_sel:[0,1]
	; GLOBALNESS0-NEXT: v_pk_mov_b32 v[10:11], s[78:79], s[78:79] op_sel:[0,1]			; GLOBALNESS0-NEXT: v_pk_mov_b32 v[10:11], s[78:79], s[78:79] op_sel:[0,1]
	; GLOBALNESS0-NEXT: v_pk_mov_b32 v[12:13], s[80:81], s[80:81] op_sel:[0,1]			; GLOBALNESS0-NEXT: v_pk_mov_b32 v[12:13], s[80:81], s[80:81] op_sel:[0,1]
	; GLOBALNESS0-NEXT: v_pk_mov_b32 v[14:15], s[82:83], s[82:83] op_sel:[0,1]			; GLOBALNESS0-NEXT: v_pk_mov_b32 v[14:15], s[82:83], s[82:83] op_sel:[0,1]
	; GLOBALNESS0-NEXT: v_pk_mov_b32 v[16:17], s[84:85], s[84:85] op_sel:[0,1]			; GLOBALNESS0-NEXT: v_pk_mov_b32 v[16:17], s[84:85], s[84:85] op_sel:[0,1]
	; GLOBALNESS0-NEXT: v_pk_mov_b32 v[18:19], s[86:87], s[86:87] op_sel:[0,1]			; GLOBALNESS0-NEXT: v_pk_mov_b32 v[18:19], s[86:87], s[86:87] op_sel:[0,1]
	; GLOBALNESS0-NEXT: v_pk_mov_b32 v[20:21], s[88:89], s[88:89] op_sel:[0,1]			; GLOBALNESS0-NEXT: v_pk_mov_b32 v[20:21], s[88:89], s[88:89] op_sel:[0,1]
	; GLOBALNESS0-NEXT: v_pk_mov_b32 v[22:23], s[90:91], s[90:91] op_sel:[0,1]			; GLOBALNESS0-NEXT: v_pk_mov_b32 v[22:23], s[90:91], s[90:91] op_sel:[0,1]
	; GLOBALNESS0-NEXT: v_pk_mov_b32 v[24:25], s[92:93], s[92:93] op_sel:[0,1]			; GLOBALNESS0-NEXT: v_pk_mov_b32 v[24:25], s[92:93], s[92:93] op_sel:[0,1]
	; GLOBALNESS0-NEXT: v_pk_mov_b32 v[26:27], s[94:95], s[94:95] op_sel:[0,1]			; GLOBALNESS0-NEXT: v_pk_mov_b32 v[26:27], s[94:95], s[94:95] op_sel:[0,1]
	; GLOBALNESS0-NEXT: v_pk_mov_b32 v[28:29], s[96:97], s[96:97] op_sel:[0,1]			; GLOBALNESS0-NEXT: v_pk_mov_b32 v[28:29], s[96:97], s[96:97] op_sel:[0,1]
	; GLOBALNESS0-NEXT: v_pk_mov_b32 v[30:31], s[98:99], s[98:99] op_sel:[0,1]			; GLOBALNESS0-NEXT: v_pk_mov_b32 v[30:31], s[98:99], s[98:99] op_sel:[0,1]
	; GLOBALNESS0-NEXT: v_readlane_b32 s66, v41, 2			; GLOBALNESS0-NEXT: v_readlane_b32 s66, v41, 2
	; GLOBALNESS0-NEXT: v_readlane_b32 s67, v41, 3			; GLOBALNESS0-NEXT: v_readlane_b32 s67, v41, 3
	; GLOBALNESS0-NEXT: s_cbranch_vccz .LBB1_3			; GLOBALNESS0-NEXT: s_cbranch_vccz .LBB1_3
	; GLOBALNESS0-NEXT: ; %bb.11: ; %baz.exit.i			; GLOBALNESS0-NEXT: ; %bb.10: ; %baz.exit.i
	; GLOBALNESS0-NEXT: ; in Loop: Header=BB1_4 Depth=1			; GLOBALNESS0-NEXT: ; in Loop: Header=BB1_4 Depth=1
	; GLOBALNESS0-NEXT: v_pk_mov_b32 v[0:1], 0, 0			; GLOBALNESS0-NEXT: v_pk_mov_b32 v[0:1], 0, 0
	; GLOBALNESS0-NEXT: flat_load_dword v0, v[0:1]			; GLOBALNESS0-NEXT: flat_load_dword v0, v[0:1]
	; GLOBALNESS0-NEXT: v_readlane_b32 s60, v41, 0			; GLOBALNESS0-NEXT: v_readlane_b32 s60, v41, 0
	; GLOBALNESS0-NEXT: v_readlane_b32 s61, v41, 1			; GLOBALNESS0-NEXT: v_readlane_b32 s61, v41, 1
	; GLOBALNESS0-NEXT: v_readlane_b32 s62, v41, 2			; GLOBALNESS0-NEXT: v_readlane_b32 s62, v41, 2
	; GLOBALNESS0-NEXT: v_readlane_b32 s63, v41, 3			; GLOBALNESS0-NEXT: v_readlane_b32 s63, v41, 3
	; GLOBALNESS0-NEXT: v_readlane_b32 s64, v41, 4			; GLOBALNESS0-NEXT: v_readlane_b32 s64, v41, 4
	▲ Show 20 Lines • Show All 122 Lines • ▼ Show 20 Lines
	; GLOBALNESS0-NEXT: v_pk_mov_b32 v[18:19], s[78:79], s[78:79] op_sel:[0,1]			; GLOBALNESS0-NEXT: v_pk_mov_b32 v[18:19], s[78:79], s[78:79] op_sel:[0,1]
	; GLOBALNESS0-NEXT: v_pk_mov_b32 v[20:21], s[80:81], s[80:81] op_sel:[0,1]			; GLOBALNESS0-NEXT: v_pk_mov_b32 v[20:21], s[80:81], s[80:81] op_sel:[0,1]
	; GLOBALNESS0-NEXT: v_pk_mov_b32 v[22:23], s[82:83], s[82:83] op_sel:[0,1]			; GLOBALNESS0-NEXT: v_pk_mov_b32 v[22:23], s[82:83], s[82:83] op_sel:[0,1]
	; GLOBALNESS0-NEXT: v_pk_mov_b32 v[24:25], s[84:85], s[84:85] op_sel:[0,1]			; GLOBALNESS0-NEXT: v_pk_mov_b32 v[24:25], s[84:85], s[84:85] op_sel:[0,1]
	; GLOBALNESS0-NEXT: v_pk_mov_b32 v[26:27], s[86:87], s[86:87] op_sel:[0,1]			; GLOBALNESS0-NEXT: v_pk_mov_b32 v[26:27], s[86:87], s[86:87] op_sel:[0,1]
	; GLOBALNESS0-NEXT: v_pk_mov_b32 v[28:29], s[88:89], s[88:89] op_sel:[0,1]			; GLOBALNESS0-NEXT: v_pk_mov_b32 v[28:29], s[88:89], s[88:89] op_sel:[0,1]
	; GLOBALNESS0-NEXT: v_pk_mov_b32 v[30:31], s[90:91], s[90:91] op_sel:[0,1]			; GLOBALNESS0-NEXT: v_pk_mov_b32 v[30:31], s[90:91], s[90:91] op_sel:[0,1]
	; GLOBALNESS0-NEXT: s_and_saveexec_b64 s[88:89], s[54:55]			; GLOBALNESS0-NEXT: s_and_saveexec_b64 s[88:89], s[54:55]
	; GLOBALNESS0-NEXT: s_cbranch_execz .LBB1_26			; GLOBALNESS0-NEXT: s_cbranch_execz .LBB1_25
	; GLOBALNESS0-NEXT: ; %bb.12: ; %bb33.i			; GLOBALNESS0-NEXT: ; %bb.11: ; %bb33.i
	; GLOBALNESS0-NEXT: ; in Loop: Header=BB1_4 Depth=1			; GLOBALNESS0-NEXT: ; in Loop: Header=BB1_4 Depth=1
	; GLOBALNESS0-NEXT: v_pk_mov_b32 v[2:3], 0, 0			; GLOBALNESS0-NEXT: v_pk_mov_b32 v[2:3], 0, 0
	; GLOBALNESS0-NEXT: global_load_dwordx2 v[0:1], v[2:3], off			; GLOBALNESS0-NEXT: global_load_dwordx2 v[0:1], v[2:3], off
	; GLOBALNESS0-NEXT: v_readlane_b32 s4, v41, 36			; GLOBALNESS0-NEXT: v_readlane_b32 s4, v41, 36
	; GLOBALNESS0-NEXT: v_readlane_b32 s5, v41, 37			; GLOBALNESS0-NEXT: v_readlane_b32 s5, v41, 37
	; GLOBALNESS0-NEXT: s_mov_b32 s91, s59			; GLOBALNESS0-NEXT: s_mov_b32 s91, s59
	; GLOBALNESS0-NEXT: s_andn2_b64 vcc, exec, s[4:5]			; GLOBALNESS0-NEXT: s_andn2_b64 vcc, exec, s[4:5]
	; GLOBALNESS0-NEXT: s_cbranch_vccnz .LBB1_14			; GLOBALNESS0-NEXT: s_cbranch_vccnz .LBB1_13
	; GLOBALNESS0-NEXT: ; %bb.13: ; %bb39.i			; GLOBALNESS0-NEXT: ; %bb.12: ; %bb39.i
	; GLOBALNESS0-NEXT: ; in Loop: Header=BB1_4 Depth=1			; GLOBALNESS0-NEXT: ; in Loop: Header=BB1_4 Depth=1
	; GLOBALNESS0-NEXT: v_mov_b32_e32 v45, v44			; GLOBALNESS0-NEXT: v_mov_b32_e32 v45, v44
	; GLOBALNESS0-NEXT: global_store_dwordx2 v[2:3], v[44:45], off			; GLOBALNESS0-NEXT: global_store_dwordx2 v[2:3], v[44:45], off
	; GLOBALNESS0-NEXT: .LBB1_14: ; %bb44.lr.ph.i			; GLOBALNESS0-NEXT: .LBB1_13: ; %bb44.lr.ph.i
	; GLOBALNESS0-NEXT: ; in Loop: Header=BB1_4 Depth=1			; GLOBALNESS0-NEXT: ; in Loop: Header=BB1_4 Depth=1
	; GLOBALNESS0-NEXT: v_cmp_ne_u32_e32 vcc, 0, v46			; GLOBALNESS0-NEXT: v_cmp_ne_u32_e32 vcc, 0, v46
	; GLOBALNESS0-NEXT: v_cndmask_b32_e32 v2, 0, v40, vcc			; GLOBALNESS0-NEXT: v_cndmask_b32_e32 v2, 0, v40, vcc
	; GLOBALNESS0-NEXT: v_readlane_b32 s60, v41, 34			; GLOBALNESS0-NEXT: v_readlane_b32 s60, v41, 34
	; GLOBALNESS0-NEXT: v_readlane_b32 s62, v41, 32			; GLOBALNESS0-NEXT: v_readlane_b32 s62, v41, 32
	; GLOBALNESS0-NEXT: s_waitcnt vmcnt(0)			; GLOBALNESS0-NEXT: s_waitcnt vmcnt(0)
	; GLOBALNESS0-NEXT: v_cmp_nlt_f64_e64 s[56:57], 0, v[0:1]			; GLOBALNESS0-NEXT: v_cmp_nlt_f64_e64 s[56:57], 0, v[0:1]
	; GLOBALNESS0-NEXT: v_cmp_eq_u32_e64 s[58:59], 0, v2			; GLOBALNESS0-NEXT: v_cmp_eq_u32_e64 s[58:59], 0, v2
	; GLOBALNESS0-NEXT: v_readlane_b32 s61, v41, 35			; GLOBALNESS0-NEXT: v_readlane_b32 s61, v41, 35
	; GLOBALNESS0-NEXT: v_readlane_b32 s63, v41, 33			; GLOBALNESS0-NEXT: v_readlane_b32 s63, v41, 33
	; GLOBALNESS0-NEXT: s_branch .LBB1_17			; GLOBALNESS0-NEXT: s_branch .LBB1_16
	; GLOBALNESS0-NEXT: .LBB1_15: ; %Flow7			; GLOBALNESS0-NEXT: .LBB1_14: ; %Flow7
	; GLOBALNESS0-NEXT: ; in Loop: Header=BB1_17 Depth=2			; GLOBALNESS0-NEXT: ; in Loop: Header=BB1_16 Depth=2
	; GLOBALNESS0-NEXT: s_or_b64 exec, exec, s[4:5]			; GLOBALNESS0-NEXT: s_or_b64 exec, exec, s[4:5]
	; GLOBALNESS0-NEXT: .LBB1_16: ; %bb63.i			; GLOBALNESS0-NEXT: .LBB1_15: ; %bb63.i
	; GLOBALNESS0-NEXT: ; in Loop: Header=BB1_17 Depth=2			; GLOBALNESS0-NEXT: ; in Loop: Header=BB1_16 Depth=2
	; GLOBALNESS0-NEXT: s_andn2_b64 vcc, exec, s[52:53]			; GLOBALNESS0-NEXT: s_andn2_b64 vcc, exec, s[52:53]
	; GLOBALNESS0-NEXT: s_cbranch_vccz .LBB1_25			; GLOBALNESS0-NEXT: s_cbranch_vccz .LBB1_24
	; GLOBALNESS0-NEXT: .LBB1_17: ; %bb44.i			; GLOBALNESS0-NEXT: .LBB1_16: ; %bb44.i
	; GLOBALNESS0-NEXT: ; Parent Loop BB1_4 Depth=1			; GLOBALNESS0-NEXT: ; Parent Loop BB1_4 Depth=1
	; GLOBALNESS0-NEXT: ; => This Inner Loop Header: Depth=2			; GLOBALNESS0-NEXT: ; => This Inner Loop Header: Depth=2
	; GLOBALNESS0-NEXT: s_andn2_b64 vcc, exec, s[46:47]			; GLOBALNESS0-NEXT: s_andn2_b64 vcc, exec, s[46:47]
	; GLOBALNESS0-NEXT: s_cbranch_vccnz .LBB1_16			; GLOBALNESS0-NEXT: s_cbranch_vccnz .LBB1_15
	; GLOBALNESS0-NEXT: ; %bb.18: ; %bb46.i			; GLOBALNESS0-NEXT: ; %bb.17: ; %bb46.i
	; GLOBALNESS0-NEXT: ; in Loop: Header=BB1_17 Depth=2			; GLOBALNESS0-NEXT: ; in Loop: Header=BB1_16 Depth=2
	; GLOBALNESS0-NEXT: s_andn2_b64 vcc, exec, s[50:51]			; GLOBALNESS0-NEXT: s_andn2_b64 vcc, exec, s[50:51]
	; GLOBALNESS0-NEXT: s_cbranch_vccnz .LBB1_16			; GLOBALNESS0-NEXT: s_cbranch_vccnz .LBB1_15
	; GLOBALNESS0-NEXT: ; %bb.19: ; %bb50.i			; GLOBALNESS0-NEXT: ; %bb.18: ; %bb50.i
	; GLOBALNESS0-NEXT: ; in Loop: Header=BB1_17 Depth=2			; GLOBALNESS0-NEXT: ; in Loop: Header=BB1_16 Depth=2
	; GLOBALNESS0-NEXT: s_andn2_b64 vcc, exec, s[62:63]			; GLOBALNESS0-NEXT: s_andn2_b64 vcc, exec, s[62:63]
	; GLOBALNESS0-NEXT: s_cbranch_vccnz .LBB1_22			; GLOBALNESS0-NEXT: s_cbranch_vccnz .LBB1_21
	; GLOBALNESS0-NEXT: ; %bb.20: ; %bb3.i.i			; GLOBALNESS0-NEXT: ; %bb.19: ; %bb3.i.i
	; GLOBALNESS0-NEXT: ; in Loop: Header=BB1_17 Depth=2			; GLOBALNESS0-NEXT: ; in Loop: Header=BB1_16 Depth=2
	; GLOBALNESS0-NEXT: s_andn2_b64 vcc, exec, s[60:61]			; GLOBALNESS0-NEXT: s_andn2_b64 vcc, exec, s[60:61]
	; GLOBALNESS0-NEXT: s_cbranch_vccnz .LBB1_22			; GLOBALNESS0-NEXT: s_cbranch_vccnz .LBB1_21
	; GLOBALNESS0-NEXT: ; %bb.21: ; %bb6.i.i			; GLOBALNESS0-NEXT: ; %bb.20: ; %bb6.i.i
	; GLOBALNESS0-NEXT: ; in Loop: Header=BB1_17 Depth=2			; GLOBALNESS0-NEXT: ; in Loop: Header=BB1_16 Depth=2
	; GLOBALNESS0-NEXT: s_andn2_b64 vcc, exec, s[56:57]			; GLOBALNESS0-NEXT: s_andn2_b64 vcc, exec, s[56:57]
	; GLOBALNESS0-NEXT: .LBB1_22: ; %spam.exit.i			; GLOBALNESS0-NEXT: .LBB1_21: ; %spam.exit.i
	; GLOBALNESS0-NEXT: ; in Loop: Header=BB1_17 Depth=2			; GLOBALNESS0-NEXT: ; in Loop: Header=BB1_16 Depth=2
	; GLOBALNESS0-NEXT: s_andn2_b64 vcc, exec, s[48:49]			; GLOBALNESS0-NEXT: s_andn2_b64 vcc, exec, s[48:49]
	; GLOBALNESS0-NEXT: s_cbranch_vccnz .LBB1_16			; GLOBALNESS0-NEXT: s_cbranch_vccnz .LBB1_15
	; GLOBALNESS0-NEXT: ; %bb.23: ; %bb55.i			; GLOBALNESS0-NEXT: ; %bb.22: ; %bb55.i
	; GLOBALNESS0-NEXT: ; in Loop: Header=BB1_17 Depth=2			; GLOBALNESS0-NEXT: ; in Loop: Header=BB1_16 Depth=2
	; GLOBALNESS0-NEXT: s_add_u32 s64, s38, 40			; GLOBALNESS0-NEXT: s_add_u32 s64, s38, 40
	; GLOBALNESS0-NEXT: s_addc_u32 s65, s39, 0			; GLOBALNESS0-NEXT: s_addc_u32 s65, s39, 0
	; GLOBALNESS0-NEXT: s_mov_b64 s[4:5], s[40:41]			; GLOBALNESS0-NEXT: s_mov_b64 s[4:5], s[40:41]
	; GLOBALNESS0-NEXT: s_mov_b64 s[6:7], s[36:37]			; GLOBALNESS0-NEXT: s_mov_b64 s[6:7], s[36:37]
	; GLOBALNESS0-NEXT: s_mov_b64 s[8:9], s[64:65]			; GLOBALNESS0-NEXT: s_mov_b64 s[8:9], s[64:65]
	; GLOBALNESS0-NEXT: s_mov_b64 s[10:11], s[34:35]			; GLOBALNESS0-NEXT: s_mov_b64 s[10:11], s[34:35]
	; GLOBALNESS0-NEXT: s_mov_b32 s12, s42			; GLOBALNESS0-NEXT: s_mov_b32 s12, s42
	; GLOBALNESS0-NEXT: s_mov_b32 s13, s45			; GLOBALNESS0-NEXT: s_mov_b32 s13, s45
	; GLOBALNESS0-NEXT: s_mov_b32 s14, s44			; GLOBALNESS0-NEXT: s_mov_b32 s14, s44
	; GLOBALNESS0-NEXT: v_mov_b32_e32 v31, v43			; GLOBALNESS0-NEXT: v_mov_b32_e32 v31, v43
	; GLOBALNESS0-NEXT: s_swappc_b64 s[30:31], s[100:101]			; GLOBALNESS0-NEXT: s_swappc_b64 s[30:31], s[100:101]
	; GLOBALNESS0-NEXT: v_pk_mov_b32 v[0:1], 0, 0			; GLOBALNESS0-NEXT: v_pk_mov_b32 v[0:1], 0, 0
	; GLOBALNESS0-NEXT: s_mov_b64 s[4:5], s[40:41]			; GLOBALNESS0-NEXT: s_mov_b64 s[4:5], s[40:41]
	; GLOBALNESS0-NEXT: s_mov_b64 s[6:7], s[36:37]			; GLOBALNESS0-NEXT: s_mov_b64 s[6:7], s[36:37]
	; GLOBALNESS0-NEXT: s_mov_b64 s[8:9], s[64:65]			; GLOBALNESS0-NEXT: s_mov_b64 s[8:9], s[64:65]
	; GLOBALNESS0-NEXT: s_mov_b64 s[10:11], s[34:35]			; GLOBALNESS0-NEXT: s_mov_b64 s[10:11], s[34:35]
	; GLOBALNESS0-NEXT: s_mov_b32 s12, s42			; GLOBALNESS0-NEXT: s_mov_b32 s12, s42
	; GLOBALNESS0-NEXT: s_mov_b32 s13, s45			; GLOBALNESS0-NEXT: s_mov_b32 s13, s45
	; GLOBALNESS0-NEXT: s_mov_b32 s14, s44			; GLOBALNESS0-NEXT: s_mov_b32 s14, s44
	; GLOBALNESS0-NEXT: v_mov_b32_e32 v31, v43			; GLOBALNESS0-NEXT: v_mov_b32_e32 v31, v43
	; GLOBALNESS0-NEXT: global_store_dwordx2 v[0:1], a[32:33], off			; GLOBALNESS0-NEXT: global_store_dwordx2 v[0:1], a[32:33], off
	; GLOBALNESS0-NEXT: s_swappc_b64 s[30:31], s[100:101]			; GLOBALNESS0-NEXT: s_swappc_b64 s[30:31], s[100:101]
	; GLOBALNESS0-NEXT: s_and_saveexec_b64 s[4:5], s[58:59]			; GLOBALNESS0-NEXT: s_and_saveexec_b64 s[4:5], s[58:59]
	; GLOBALNESS0-NEXT: s_cbranch_execz .LBB1_15			; GLOBALNESS0-NEXT: s_cbranch_execz .LBB1_14
	; GLOBALNESS0-NEXT: ; %bb.24: ; %bb62.i			; GLOBALNESS0-NEXT: ; %bb.23: ; %bb62.i
	; GLOBALNESS0-NEXT: ; in Loop: Header=BB1_17 Depth=2			; GLOBALNESS0-NEXT: ; in Loop: Header=BB1_16 Depth=2
	; GLOBALNESS0-NEXT: v_mov_b32_e32 v45, v44			; GLOBALNESS0-NEXT: v_mov_b32_e32 v45, v44
	; GLOBALNESS0-NEXT: v_pk_mov_b32 v[0:1], 0, 0			; GLOBALNESS0-NEXT: v_pk_mov_b32 v[0:1], 0, 0
	; GLOBALNESS0-NEXT: global_store_dwordx2 v[0:1], v[44:45], off			; GLOBALNESS0-NEXT: global_store_dwordx2 v[0:1], v[44:45], off
	; GLOBALNESS0-NEXT: s_branch .LBB1_15			; GLOBALNESS0-NEXT: s_branch .LBB1_14
	; GLOBALNESS0-NEXT: .LBB1_25: ; %Flow14			; GLOBALNESS0-NEXT: .LBB1_24: ; %Flow14
	; GLOBALNESS0-NEXT: ; in Loop: Header=BB1_4 Depth=1			; GLOBALNESS0-NEXT: ; in Loop: Header=BB1_4 Depth=1
	; GLOBALNESS0-NEXT: v_readlane_b32 s56, v41, 0			; GLOBALNESS0-NEXT: v_readlane_b32 s56, v41, 0
	; GLOBALNESS0-NEXT: v_readlane_b32 s57, v41, 1			; GLOBALNESS0-NEXT: v_readlane_b32 s57, v41, 1
	; GLOBALNESS0-NEXT: v_readlane_b32 s64, v41, 8			; GLOBALNESS0-NEXT: v_readlane_b32 s64, v41, 8
	; GLOBALNESS0-NEXT: v_readlane_b32 s65, v41, 9			; GLOBALNESS0-NEXT: v_readlane_b32 s65, v41, 9
	; GLOBALNESS0-NEXT: v_readlane_b32 s66, v41, 10			; GLOBALNESS0-NEXT: v_readlane_b32 s66, v41, 10
	; GLOBALNESS0-NEXT: v_readlane_b32 s67, v41, 11			; GLOBALNESS0-NEXT: v_readlane_b32 s67, v41, 11
	; GLOBALNESS0-NEXT: v_readlane_b32 s68, v41, 12			; GLOBALNESS0-NEXT: v_readlane_b32 s68, v41, 12
	▲ Show 20 Lines • Show All 52 Lines • ▼ Show 20 Lines
	; GLOBALNESS0-NEXT: v_pk_mov_b32 v[26:27], s[90:91], s[90:91] op_sel:[0,1]			; GLOBALNESS0-NEXT: v_pk_mov_b32 v[26:27], s[90:91], s[90:91] op_sel:[0,1]
	; GLOBALNESS0-NEXT: v_pk_mov_b32 v[28:29], s[92:93], s[92:93] op_sel:[0,1]			; GLOBALNESS0-NEXT: v_pk_mov_b32 v[28:29], s[92:93], s[92:93] op_sel:[0,1]
	; GLOBALNESS0-NEXT: v_pk_mov_b32 v[30:31], s[94:95], s[94:95] op_sel:[0,1]			; GLOBALNESS0-NEXT: v_pk_mov_b32 v[30:31], s[94:95], s[94:95] op_sel:[0,1]
	; GLOBALNESS0-NEXT: s_mov_b32 s59, s91			; GLOBALNESS0-NEXT: s_mov_b32 s59, s91
	; GLOBALNESS0-NEXT: v_readlane_b32 s60, v41, 4			; GLOBALNESS0-NEXT: v_readlane_b32 s60, v41, 4
	; GLOBALNESS0-NEXT: v_readlane_b32 s61, v41, 5			; GLOBALNESS0-NEXT: v_readlane_b32 s61, v41, 5
	; GLOBALNESS0-NEXT: v_readlane_b32 s62, v41, 6			; GLOBALNESS0-NEXT: v_readlane_b32 s62, v41, 6
	; GLOBALNESS0-NEXT: v_readlane_b32 s63, v41, 7			; GLOBALNESS0-NEXT: v_readlane_b32 s63, v41, 7
	; GLOBALNESS0-NEXT: .LBB1_26: ; %Flow15			; GLOBALNESS0-NEXT: .LBB1_25: ; %Flow15
	; GLOBALNESS0-NEXT: ; in Loop: Header=BB1_4 Depth=1			; GLOBALNESS0-NEXT: ; in Loop: Header=BB1_4 Depth=1
	; GLOBALNESS0-NEXT: s_or_b64 exec, exec, s[88:89]			; GLOBALNESS0-NEXT: s_or_b64 exec, exec, s[88:89]
	; GLOBALNESS0-NEXT: s_and_saveexec_b64 s[4:5], s[54:55]			; GLOBALNESS0-NEXT: s_and_saveexec_b64 s[4:5], s[54:55]
	; GLOBALNESS0-NEXT: s_mov_b64 s[54:55], s[92:93]			; GLOBALNESS0-NEXT: s_mov_b64 s[54:55], s[92:93]
	; GLOBALNESS0-NEXT: s_cbranch_execz .LBB1_2			; GLOBALNESS0-NEXT: s_cbranch_execz .LBB1_2
	; GLOBALNESS0-NEXT: ; %bb.27: ; %bb67.i			; GLOBALNESS0-NEXT: ; %bb.26: ; %bb67.i
	; GLOBALNESS0-NEXT: ; in Loop: Header=BB1_4 Depth=1			; GLOBALNESS0-NEXT: ; in Loop: Header=BB1_4 Depth=1
	; GLOBALNESS0-NEXT: v_readlane_b32 s6, v41, 38			; GLOBALNESS0-NEXT: v_readlane_b32 s6, v41, 38
	; GLOBALNESS0-NEXT: v_readlane_b32 s7, v41, 39			; GLOBALNESS0-NEXT: v_readlane_b32 s7, v41, 39
	; GLOBALNESS0-NEXT: s_andn2_b64 vcc, exec, s[6:7]			; GLOBALNESS0-NEXT: s_andn2_b64 vcc, exec, s[6:7]
	; GLOBALNESS0-NEXT: s_cbranch_vccnz .LBB1_1			; GLOBALNESS0-NEXT: s_cbranch_vccnz .LBB1_1
	; GLOBALNESS0-NEXT: ; %bb.28: ; %bb69.i			; GLOBALNESS0-NEXT: ; %bb.27: ; %bb69.i
	; GLOBALNESS0-NEXT: ; in Loop: Header=BB1_4 Depth=1			; GLOBALNESS0-NEXT: ; in Loop: Header=BB1_4 Depth=1
	; GLOBALNESS0-NEXT: v_mov_b32_e32 v45, v44			; GLOBALNESS0-NEXT: v_mov_b32_e32 v45, v44
	; GLOBALNESS0-NEXT: v_pk_mov_b32 v[32:33], 0, 0			; GLOBALNESS0-NEXT: v_pk_mov_b32 v[32:33], 0, 0
	; GLOBALNESS0-NEXT: global_store_dwordx2 v[32:33], v[44:45], off			; GLOBALNESS0-NEXT: global_store_dwordx2 v[32:33], v[44:45], off
	; GLOBALNESS0-NEXT: s_branch .LBB1_1			; GLOBALNESS0-NEXT: s_branch .LBB1_1
	; GLOBALNESS0-NEXT: .LBB1_29: ; %bb73.i			; GLOBALNESS0-NEXT: .LBB1_28: ; %bb73.i
	; GLOBALNESS0-NEXT: ; in Loop: Header=BB1_4 Depth=1			; GLOBALNESS0-NEXT: ; in Loop: Header=BB1_4 Depth=1
	; GLOBALNESS0-NEXT: v_mov_b32_e32 v45, v44			; GLOBALNESS0-NEXT: v_mov_b32_e32 v45, v44
	; GLOBALNESS0-NEXT: v_pk_mov_b32 v[32:33], 0, 0			; GLOBALNESS0-NEXT: v_pk_mov_b32 v[32:33], 0, 0
	; GLOBALNESS0-NEXT: global_store_dwordx2 v[32:33], v[44:45], off			; GLOBALNESS0-NEXT: global_store_dwordx2 v[32:33], v[44:45], off
	; GLOBALNESS0-NEXT: s_branch .LBB1_2			; GLOBALNESS0-NEXT: s_branch .LBB1_2
	; GLOBALNESS0-NEXT: .LBB1_30: ; %loop.exit.guard			; GLOBALNESS0-NEXT: .LBB1_29: ; %loop.exit.guard
	; GLOBALNESS0-NEXT: s_andn2_b64 vcc, exec, s[4:5]			; GLOBALNESS0-NEXT: s_andn2_b64 vcc, exec, s[4:5]
	; GLOBALNESS0-NEXT: s_mov_b64 s[4:5], -1			; GLOBALNESS0-NEXT: s_mov_b64 s[4:5], -1
	; GLOBALNESS0-NEXT: s_cbranch_vccz .LBB1_32			; GLOBALNESS0-NEXT: s_cbranch_vccz .LBB1_31
	; GLOBALNESS0-NEXT: ; %bb.31: ; %bb7.i.i			; GLOBALNESS0-NEXT: ; %bb.30: ; %bb7.i.i
	; GLOBALNESS0-NEXT: s_add_u32 s8, s38, 40			; GLOBALNESS0-NEXT: s_add_u32 s8, s38, 40
	; GLOBALNESS0-NEXT: s_addc_u32 s9, s39, 0			; GLOBALNESS0-NEXT: s_addc_u32 s9, s39, 0
	; GLOBALNESS0-NEXT: s_mov_b64 s[4:5], s[40:41]			; GLOBALNESS0-NEXT: s_mov_b64 s[4:5], s[40:41]
	; GLOBALNESS0-NEXT: s_mov_b64 s[6:7], s[36:37]			; GLOBALNESS0-NEXT: s_mov_b64 s[6:7], s[36:37]
	; GLOBALNESS0-NEXT: s_mov_b64 s[10:11], s[34:35]			; GLOBALNESS0-NEXT: s_mov_b64 s[10:11], s[34:35]
	; GLOBALNESS0-NEXT: s_mov_b32 s12, s42			; GLOBALNESS0-NEXT: s_mov_b32 s12, s42
	; GLOBALNESS0-NEXT: s_mov_b32 s13, s45			; GLOBALNESS0-NEXT: s_mov_b32 s13, s45
	; GLOBALNESS0-NEXT: s_mov_b32 s14, s44			; GLOBALNESS0-NEXT: s_mov_b32 s14, s44
	; GLOBALNESS0-NEXT: v_mov_b32_e32 v31, v43			; GLOBALNESS0-NEXT: v_mov_b32_e32 v31, v43
	; GLOBALNESS0-NEXT: s_getpc_b64 s[16:17]			; GLOBALNESS0-NEXT: s_getpc_b64 s[16:17]
	; GLOBALNESS0-NEXT: s_add_u32 s16, s16, widget@rel32@lo+4			; GLOBALNESS0-NEXT: s_add_u32 s16, s16, widget@rel32@lo+4
	; GLOBALNESS0-NEXT: s_addc_u32 s17, s17, widget@rel32@hi+12			; GLOBALNESS0-NEXT: s_addc_u32 s17, s17, widget@rel32@hi+12
	; GLOBALNESS0-NEXT: s_swappc_b64 s[30:31], s[16:17]			; GLOBALNESS0-NEXT: s_swappc_b64 s[30:31], s[16:17]
	; GLOBALNESS0-NEXT: s_mov_b64 s[4:5], 0			; GLOBALNESS0-NEXT: s_mov_b64 s[4:5], 0
	; GLOBALNESS0-NEXT: .LBB1_32: ; %Flow			; GLOBALNESS0-NEXT: .LBB1_31: ; %Flow
	; GLOBALNESS0-NEXT: s_andn2_b64 vcc, exec, s[4:5]			; GLOBALNESS0-NEXT: s_andn2_b64 vcc, exec, s[4:5]
	; GLOBALNESS0-NEXT: s_cbranch_vccnz .LBB1_34			; GLOBALNESS0-NEXT: s_cbranch_vccnz .LBB1_33
	; GLOBALNESS0-NEXT: ; %bb.33: ; %bb11.i.i			; GLOBALNESS0-NEXT: ; %bb.32: ; %bb11.i.i
	; GLOBALNESS0-NEXT: s_add_u32 s8, s38, 40			; GLOBALNESS0-NEXT: s_add_u32 s8, s38, 40
	; GLOBALNESS0-NEXT: s_addc_u32 s9, s39, 0			; GLOBALNESS0-NEXT: s_addc_u32 s9, s39, 0
	; GLOBALNESS0-NEXT: s_mov_b64 s[4:5], s[40:41]			; GLOBALNESS0-NEXT: s_mov_b64 s[4:5], s[40:41]
	; GLOBALNESS0-NEXT: s_mov_b64 s[6:7], s[36:37]			; GLOBALNESS0-NEXT: s_mov_b64 s[6:7], s[36:37]
	; GLOBALNESS0-NEXT: s_mov_b64 s[10:11], s[34:35]			; GLOBALNESS0-NEXT: s_mov_b64 s[10:11], s[34:35]
	; GLOBALNESS0-NEXT: s_mov_b32 s12, s42			; GLOBALNESS0-NEXT: s_mov_b32 s12, s42
	; GLOBALNESS0-NEXT: s_mov_b32 s13, s45			; GLOBALNESS0-NEXT: s_mov_b32 s13, s45
	; GLOBALNESS0-NEXT: s_mov_b32 s14, s44			; GLOBALNESS0-NEXT: s_mov_b32 s14, s44
	; GLOBALNESS0-NEXT: v_mov_b32_e32 v31, v43			; GLOBALNESS0-NEXT: v_mov_b32_e32 v31, v43
	; GLOBALNESS0-NEXT: s_getpc_b64 s[16:17]			; GLOBALNESS0-NEXT: s_getpc_b64 s[16:17]
	; GLOBALNESS0-NEXT: s_add_u32 s16, s16, widget@rel32@lo+4			; GLOBALNESS0-NEXT: s_add_u32 s16, s16, widget@rel32@lo+4
	; GLOBALNESS0-NEXT: s_addc_u32 s17, s17, widget@rel32@hi+12			; GLOBALNESS0-NEXT: s_addc_u32 s17, s17, widget@rel32@hi+12
	; GLOBALNESS0-NEXT: s_swappc_b64 s[30:31], s[16:17]			; GLOBALNESS0-NEXT: s_swappc_b64 s[30:31], s[16:17]
	; GLOBALNESS0-NEXT: .LBB1_34: ; %UnifiedUnreachableBlock			; GLOBALNESS0-NEXT: .LBB1_33: ; %UnifiedUnreachableBlock
	bb:			bb:
	store i32 0, i32 addrspace(1)* null, align 4			store i32 0, i32 addrspace(1)* null, align 4
	%tmp4 = load i32, i32 addrspace(1)* %arg1.global, align 4			%tmp4 = load i32, i32 addrspace(1)* %arg1.global, align 4
	br label %bb5			br label %bb5

	bb5: ; preds = %bb5.backedge, %bb			bb5: ; preds = %bb5.backedge, %bb
	%tmp4.i.sroa.0.0 = phi <9 x double> [ undef, %bb ], [ %tmp4.i.sroa.0.1, %bb5.backedge ]			%tmp4.i.sroa.0.0 = phi <9 x double> [ undef, %bb ], [ %tmp4.i.sroa.0.1, %bb5.backedge ]
	%tmp14.1.i = load i32, i32* inttoptr (i64 128 to i32*), align 128			%tmp14.1.i = load i32, i32* inttoptr (i64 128 to i32*), align 128
	▲ Show 20 Lines • Show All 107 Lines • Show Last 20 Lines

llvm/test/CodeGen/AMDGPU/while-break.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc -march=amdgcn -mcpu=gfx1010 -verify-machineinstrs < %s \| FileCheck %s -check-prefix=GCN			; RUN: llc -march=amdgcn -mcpu=gfx1010 -verify-machineinstrs < %s \| FileCheck %s -check-prefix=GCN

	define amdgpu_ps float @while_break(i32 %z, float %v, i32 %x, i32 %y) #0 {			define amdgpu_ps float @while_break(i32 %z, float %v, i32 %x, i32 %y) #0 {
	; GCN-LABEL: while_break:			; GCN-LABEL: while_break:
	; GCN: ; %bb.0: ; %entry			; GCN: ; %bb.0: ; %entry
	; GCN-NEXT: s_mov_b32 s1, -1			; GCN-NEXT: s_mov_b32 s1, -1
	; GCN-NEXT: s_mov_b32 s0, 0			; GCN-NEXT: s_mov_b32 s0, 0
	; GCN-NEXT: s_branch .LBB0_2			; GCN-NEXT: s_branch .LBB0_2
	; GCN-NEXT: .LBB0_1: ; %Flow2			; GCN-NEXT: .LBB0_1: ; %Flow2
	; GCN-NEXT: ; in Loop: Header=BB0_2 Depth=1			; GCN-NEXT: ; in Loop: Header=BB0_2 Depth=1
	; GCN-NEXT: s_or_b32 exec_lo, exec_lo, s4			; GCN-NEXT: s_or_b32 exec_lo, exec_lo, s4
	; GCN-NEXT: v_mov_b32_e32 v1, v5
	; GCN-NEXT: s_and_b32 s2, exec_lo, s3			; GCN-NEXT: s_and_b32 s2, exec_lo, s3
	; GCN-NEXT: s_or_b32 s0, s2, s0			; GCN-NEXT: s_or_b32 s0, s2, s0
	; GCN-NEXT: s_andn2_b32 exec_lo, exec_lo, s0			; GCN-NEXT: s_andn2_b32 exec_lo, exec_lo, s0
	; GCN-NEXT: s_cbranch_execz .LBB0_8			; GCN-NEXT: s_cbranch_execz .LBB0_8
	; GCN-NEXT: .LBB0_2: ; %header			; GCN-NEXT: .LBB0_2: ; %header
	; GCN-NEXT: ; =>This Inner Loop Header: Depth=1			; GCN-NEXT: ; =>This Inner Loop Header: Depth=1
	; GCN-NEXT: s_add_i32 s1, s1, 1			; GCN-NEXT: s_add_i32 s1, s1, 1
	; GCN-NEXT: s_mov_b32 s2, 0			; GCN-NEXT: s_mov_b32 s2, 0
	; GCN-NEXT: v_cmp_ge_i32_e32 vcc_lo, s1, v2			; GCN-NEXT: v_cmp_ge_i32_e32 vcc_lo, s1, v2
	; GCN-NEXT: ; implicit-def: $vgpr4
	; GCN-NEXT: s_and_saveexec_b32 s3, vcc_lo			; GCN-NEXT: s_and_saveexec_b32 s3, vcc_lo
	; GCN-NEXT: s_xor_b32 s3, exec_lo, s3			; GCN-NEXT: s_xor_b32 s3, exec_lo, s3
	; GCN-NEXT: ; %bb.3: ; %else			; GCN-NEXT: ; %bb.3: ; %else
	; GCN-NEXT: ; in Loop: Header=BB0_2 Depth=1			; GCN-NEXT: ; in Loop: Header=BB0_2 Depth=1
	; GCN-NEXT: v_cmp_lt_i32_e32 vcc_lo, s1, v3			; GCN-NEXT: v_cmp_lt_i32_e32 vcc_lo, s1, v3
	; GCN-NEXT: v_mov_b32_e32 v4, v1
	; GCN-NEXT: s_and_b32 s2, vcc_lo, exec_lo			; GCN-NEXT: s_and_b32 s2, vcc_lo, exec_lo
	; GCN-NEXT: ; %bb.4: ; %Flow			; GCN-NEXT: ; %bb.4: ; %Flow
	; GCN-NEXT: ; in Loop: Header=BB0_2 Depth=1			; GCN-NEXT: ; in Loop: Header=BB0_2 Depth=1
	; GCN-NEXT: s_or_saveexec_b32 s3, s3			; GCN-NEXT: s_andn2_saveexec_b32 s3, s3
	; GCN-NEXT: v_mov_b32_e32 v5, v4
	; GCN-NEXT: s_xor_b32 exec_lo, exec_lo, s3
	; GCN-NEXT: ; %bb.5: ; %if			; GCN-NEXT: ; %bb.5: ; %if
	; GCN-NEXT: ; in Loop: Header=BB0_2 Depth=1			; GCN-NEXT: ; in Loop: Header=BB0_2 Depth=1
	; GCN-NEXT: v_add_f32_e32 v5, 1.0, v1			; GCN-NEXT: v_add_f32_e32 v1, 1.0, v1
	; GCN-NEXT: s_or_b32 s2, s2, exec_lo			; GCN-NEXT: s_or_b32 s2, s2, exec_lo
	; GCN-NEXT: ; %bb.6: ; %Flow1			; GCN-NEXT: ; %bb.6: ; %Flow1
	; GCN-NEXT: ; in Loop: Header=BB0_2 Depth=1			; GCN-NEXT: ; in Loop: Header=BB0_2 Depth=1
	; GCN-NEXT: s_or_b32 exec_lo, exec_lo, s3			; GCN-NEXT: s_or_b32 exec_lo, exec_lo, s3
	; GCN-NEXT: s_mov_b32 s3, -1			; GCN-NEXT: s_mov_b32 s3, -1
	; GCN-NEXT: s_and_saveexec_b32 s4, s2			; GCN-NEXT: s_and_saveexec_b32 s4, s2
	; GCN-NEXT: s_cbranch_execz .LBB0_1			; GCN-NEXT: s_cbranch_execz .LBB0_1
	; GCN-NEXT: ; %bb.7: ; %latch			; GCN-NEXT: ; %bb.7: ; %latch
	; GCN-NEXT: ; in Loop: Header=BB0_2 Depth=1			; GCN-NEXT: ; in Loop: Header=BB0_2 Depth=1
	; GCN-NEXT: v_cmp_lt_i32_e32 vcc_lo, s1, v0			; GCN-NEXT: v_cmp_lt_i32_e32 vcc_lo, s1, v0
	; GCN-NEXT: v_mov_b32_e32 v4, v5
	; GCN-NEXT: s_orn2_b32 s3, vcc_lo, exec_lo			; GCN-NEXT: s_orn2_b32 s3, vcc_lo, exec_lo
	; GCN-NEXT: s_branch .LBB0_1			; GCN-NEXT: s_branch .LBB0_1
	; GCN-NEXT: .LBB0_8: ; %end			; GCN-NEXT: .LBB0_8: ; %end
	; GCN-NEXT: s_or_b32 exec_lo, exec_lo, s0			; GCN-NEXT: s_or_b32 exec_lo, exec_lo, s0
	; GCN-NEXT: v_mov_b32_e32 v0, v4			; GCN-NEXT: v_mov_b32_e32 v0, v1
	; GCN-NEXT: ; return to shader part epilog			; GCN-NEXT: ; return to shader part epilog
	entry:			entry:
	br label %header			br label %header

	header:			header:
	%v.1 = phi float [ %v, %entry ], [ %v.2, %latch ]			%v.1 = phi float [ %v, %entry ], [ %v.2, %latch ]
	%ind = phi i32 [ 0, %entry], [ %ind.inc, %latch ]			%ind = phi i32 [ 0, %entry], [ %ind.inc, %latch ]
	%cc = icmp slt i32 %ind, %x			%cc = icmp slt i32 %ind, %x
	▲ Show 20 Lines • Show All 99 Lines • Show Last 20 Lines

llvm/test/Transforms/StructurizeCFG/workarounds/needs-fr-ule.ll

	Show First 20 Lines • Show All 50 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: [[TMP7:%.]] = phi i1 [ false, [[COND_TRUE49]] ], [ [[TMP3]], [[FLOW7:%.]] ]			; CHECK-NEXT: [[TMP7:%.]] = phi i1 [ false, [[COND_TRUE49]] ], [ [[TMP3]], [[FLOW7:%.]] ]
	; CHECK-NEXT: [[TMP8:%.*]] = phi i1 [ false, [[COND_TRUE49]] ], [ [[TMP4]], [[FLOW7]] ]			; CHECK-NEXT: [[TMP8:%.*]] = phi i1 [ false, [[COND_TRUE49]] ], [ [[TMP4]], [[FLOW7]] ]
	; CHECK-NEXT: [[TMP9:%.*]] = phi i1 [ [[PRED4_INV]], [[COND_TRUE49]] ], [ [[TMP5]], [[FLOW7]] ]			; CHECK-NEXT: [[TMP9:%.*]] = phi i1 [ [[PRED4_INV]], [[COND_TRUE49]] ], [ [[TMP5]], [[FLOW7]] ]
	; CHECK-NEXT: br i1 [[TMP9]], label [[WHILE_BODY63:%.]], label [[FLOW9:%.]]			; CHECK-NEXT: br i1 [[TMP9]], label [[WHILE_BODY63:%.]], label [[FLOW9:%.]]
	; CHECK: while.body63:			; CHECK: while.body63:
	; CHECK-NEXT: br i1 [[PRED5_INV]], label [[WHILE_COND47:%.]], label [[FLOW10:%.]]			; CHECK-NEXT: br i1 [[PRED5_INV]], label [[WHILE_COND47:%.]], label [[FLOW10:%.]]
	; CHECK: Flow9:			; CHECK: Flow9:
	; CHECK-NEXT: [[TMP10:%.]] = phi i1 [ [[TMP22:%.]], [[FLOW10]] ], [ undef, [[FLOW8]] ]			; CHECK-NEXT: [[TMP10:%.]] = phi i1 [ [[TMP22:%.]], [[FLOW10]] ], [ undef, [[FLOW8]] ]
	; CHECK-NEXT: [[TMP11:%.*]] = phi i1 [ false, [[FLOW10]] ], [ undef, [[FLOW8]] ]			; CHECK-NEXT: [[TMP11:%.*]] = phi i1 [ false, [[FLOW10]] ], [ undef, [[FLOW8]] ]
	; CHECK-NEXT: [[TMP12:%.*]] = phi i1 [ true, [[FLOW10]] ], [ [[TMP7]], [[FLOW8]] ]			; CHECK-NEXT: [[TMP12:%.*]] = phi i1 [ true, [[FLOW10]] ], [ [[TMP7]], [[FLOW8]] ]
	; CHECK-NEXT: [[TMP13:%.*]] = phi i1 [ false, [[FLOW10]] ], [ [[TMP8]], [[FLOW8]] ]			; CHECK-NEXT: [[TMP13:%.*]] = phi i1 [ false, [[FLOW10]] ], [ [[TMP8]], [[FLOW8]] ]
	sameerdsUnsubmitted Done Reply Inline Actions When the value reaching along a predecessor is a constant literal, do we still need to create the extra PHI in the earlier Flow blocks? In this case, it seems the true/false values are pushed to the predecessor block Flow10. Can this be bad for performance in some case? We can skip it by checking for constants when we add predecessors to the stack. sameerds: When the value reaching along a predecessor is a constant literal, do we still need to create…
	ruilingAuthorUnsubmitted Done Reply Inline Actions I am not sure whether this would regress quality of generated code, but I happened to get an idea to fix the issue. Please check whether this sounds good to you. The backward traversal is done once per basic block. So I have postponed the constant check. ruiling: I am not sure whether this would regress quality of generated code, but I happened to get an…
	; CHECK-NEXT: [[TMP14:%.]] = phi i1 [ [[TMP23:%.]], [[FLOW10]] ], [ true, [[FLOW8]] ]			; CHECK-NEXT: [[TMP14:%.]] = phi i1 [ [[TMP23:%.]], [[FLOW10]] ], [ true, [[FLOW8]] ]
	; CHECK-NEXT: [[DOTINV11:%.*]] = xor i1 [[TMP12]], true			; CHECK-NEXT: [[DOTINV11:%.*]] = xor i1 [[TMP12]], true
	; CHECK-NEXT: [[DOTINV:%.*]] = xor i1 [[TMP13]], true			; CHECK-NEXT: [[DOTINV:%.*]] = xor i1 [[TMP13]], true
	; CHECK-NEXT: br i1 [[TMP14]], label [[LOOP_EXIT_GUARD1:%.*]], label [[IRR_GUARD]]			; CHECK-NEXT: br i1 [[TMP14]], label [[LOOP_EXIT_GUARD1:%.*]], label [[IRR_GUARD]]
	; CHECK: while.cond47:			; CHECK: while.cond47:
	; CHECK-NEXT: br label [[FLOW10]]			; CHECK-NEXT: br label [[FLOW10]]
	; CHECK: cond.end61:			; CHECK: cond.end61:
	; CHECK-NEXT: br label [[FLOW7]]			; CHECK-NEXT: br label [[FLOW7]]
	; CHECK: Flow14:			; CHECK: Flow14:
	; CHECK-NEXT: [[TMP15:%.]] = phi i1 [ [[TMP20:%.]], [[FLOW15:%.]] ], [ [[TMP17:%.]], [[LOOP_EXIT_GUARD1]] ]			; CHECK-NEXT: [[TMP15:%.]] = phi i1 [ [[TMP20:%.]], [[FLOW15:%.*]] ], [ undef, [[LOOP_EXIT_GUARD1]] ]
	; CHECK-NEXT: [[TMP16:%.]] = phi i1 [ [[TMP21:%.]], [[FLOW15]] ], [ [[DOTINV]], [[LOOP_EXIT_GUARD1]] ]			; CHECK-NEXT: [[TMP16:%.]] = phi i1 [ [[TMP21:%.]], [[FLOW15]] ], [ [[DOTINV]], [[LOOP_EXIT_GUARD1]] ]
	; CHECK-NEXT: br label [[FLOW13:%.*]]			; CHECK-NEXT: br label [[FLOW13:%.*]]
	; CHECK: if.then69:			; CHECK: if.then69:
	; CHECK-NEXT: br label [[FLOW15]]			; CHECK-NEXT: br label [[FLOW15]]
	; CHECK: lor.rhs:			; CHECK: lor.rhs:
	; CHECK-NEXT: br label [[FLOW12]]			; CHECK-NEXT: br label [[FLOW12]]
	; CHECK: while.end76:			; CHECK: while.end76:
	; CHECK-NEXT: br label [[FLOW6:%.*]]			; CHECK-NEXT: br label [[FLOW6:%.*]]
	Show All 17 Lines
	; CHECK-NEXT: br label [[FLOW5]]			; CHECK-NEXT: br label [[FLOW5]]
	; CHECK: Flow5:			; CHECK: Flow5:
	; CHECK-NEXT: br label [[FLOW16]]			; CHECK-NEXT: br label [[FLOW16]]
	; CHECK: Flow6:			; CHECK: Flow6:
	; CHECK-NEXT: br label [[FLOW17]]			; CHECK-NEXT: br label [[FLOW17]]
	; CHECK: exit:			; CHECK: exit:
	; CHECK-NEXT: ret void			; CHECK-NEXT: ret void
	; CHECK: Flow12:			; CHECK: Flow12:
	; CHECK-NEXT: [[TMP17]] = phi i1 [ true, [[LOR_RHS]] ], [ undef, [[WHILE_COND]] ]			; CHECK-NEXT: [[TMP17:%.*]] = phi i1 [ true, [[LOR_RHS]] ], [ undef, [[WHILE_COND]] ]
	; CHECK-NEXT: [[TMP18:%.*]] = phi i1 [ false, [[LOR_RHS]] ], [ true, [[WHILE_COND]] ]			; CHECK-NEXT: [[TMP18:%.*]] = phi i1 [ false, [[LOR_RHS]] ], [ true, [[WHILE_COND]] ]
	; CHECK-NEXT: [[TMP19:%.]] = phi i1 [ [[PRED9:%.]], [[LOR_RHS]] ], [ [[PRED3]], [[WHILE_COND]] ]			; CHECK-NEXT: [[TMP19:%.]] = phi i1 [ [[PRED9:%.]], [[LOR_RHS]] ], [ [[PRED3]], [[WHILE_COND]] ]
	; CHECK-NEXT: br i1 [[TMP19]], label [[IRR_GUARD]], label [[FLOW13]]			; CHECK-NEXT: br i1 [[TMP19]], label [[IRR_GUARD]], label [[FLOW13]]
	; CHECK: irr.guard:			; CHECK: irr.guard:
	; CHECK-NEXT: [[GUARD_COND_TRUE49:%.*]] = phi i1 [ [[TMP10]], [[FLOW9]] ], [ [[TMP18]], [[FLOW12]] ]			; CHECK-NEXT: [[GUARD_COND_TRUE49:%.*]] = phi i1 [ [[TMP10]], [[FLOW9]] ], [ [[TMP18]], [[FLOW12]] ]
	; CHECK-NEXT: [[GUARD_COND_TRUE49_INV:%.*]] = xor i1 [[GUARD_COND_TRUE49]], true			; CHECK-NEXT: [[GUARD_COND_TRUE49_INV:%.*]] = xor i1 [[GUARD_COND_TRUE49]], true
	; CHECK-NEXT: br i1 [[GUARD_COND_TRUE49_INV]], label [[COND_END61]], label [[FLOW7]]			; CHECK-NEXT: br i1 [[GUARD_COND_TRUE49_INV]], label [[COND_END61]], label [[FLOW7]]
	; CHECK: Flow15:			; CHECK: Flow15:
	▲ Show 20 Lines • Show All 81 Lines • Show Last 20 Lines

llvm/test/Transforms/StructurizeCFG/workarounds/needs-unified-loop-exits.ll

	Show All 32 Lines
	; CHECK-NEXT: br i1 [[TMP1]], label [[H2:%.]], label [[FLOW4:%.]]			; CHECK-NEXT: br i1 [[TMP1]], label [[H2:%.]], label [[FLOW4:%.]]
	; CHECK: H2:			; CHECK: H2:
	; CHECK-NEXT: br i1 [[PREDH2:%.]], label [[B2:%.]], label [[FLOW:%.*]]			; CHECK-NEXT: br i1 [[PREDH2:%.]], label [[B2:%.]], label [[FLOW:%.*]]
	; CHECK: B2:			; CHECK: B2:
	; CHECK-NEXT: br i1 [[PREDB2_INV]], label [[L2:%.]], label [[FLOW2:%.]]			; CHECK-NEXT: br i1 [[PREDB2_INV]], label [[L2:%.]], label [[FLOW2:%.]]
	; CHECK: Flow:			; CHECK: Flow:
	; CHECK-NEXT: [[TMP2:%.*]] = phi i1 [ false, [[FLOW2]] ], [ undef, [[H2]] ]			; CHECK-NEXT: [[TMP2:%.*]] = phi i1 [ false, [[FLOW2]] ], [ undef, [[H2]] ]
	; CHECK-NEXT: [[TMP3:%.*]] = phi i1 [ false, [[FLOW2]] ], [ true, [[H2]] ]			; CHECK-NEXT: [[TMP3:%.*]] = phi i1 [ false, [[FLOW2]] ], [ true, [[H2]] ]
	; CHECK-NEXT: [[TMP4:%.]] = phi i1 [ [[TMP6:%.]], [[FLOW2]] ], [ true, [[H2]] ]			; CHECK-NEXT: [[TMP4:%.]] = phi i1 [ [[TMP7:%.]], [[FLOW2]] ], [ true, [[H2]] ]
	; CHECK-NEXT: br i1 [[TMP4]], label [[LOOP_EXIT_GUARD1:%.*]], label [[H2]]			; CHECK-NEXT: br i1 [[TMP4]], label [[LOOP_EXIT_GUARD1:%.*]], label [[H2]]
	; CHECK: L2:			; CHECK: L2:
	; CHECK-NEXT: br label [[FLOW2]]			; CHECK-NEXT: br label [[FLOW2]]
	; CHECK: L1:			; CHECK: L1:
	; CHECK-NEXT: br label [[FLOW5:%.*]]			; CHECK-NEXT: br label [[FLOW5:%.*]]
	; CHECK: B1:			; CHECK: B1:
	; CHECK-NEXT: br label [[FLOW3]]			; CHECK-NEXT: br label [[FLOW3]]
	; CHECK: C:			; CHECK: C:
	; CHECK-NEXT: br label [[EXIT:%.*]]			; CHECK-NEXT: br label [[EXIT:%.*]]
	; CHECK: exit:			; CHECK: exit:
	; CHECK-NEXT: ret void			; CHECK-NEXT: ret void
	; CHECK: Flow5:			; CHECK: Flow5:
	; CHECK-NEXT: [[TMP5:%.]] = phi i1 [ false, [[L1:%.]] ], [ true, [[LOOP_EXIT_GUARD1]] ]			; CHECK-NEXT: [[TMP5:%.]] = phi i1 [ undef, [[L1:%.]] ], [ [[TMP2]], [[LOOP_EXIT_GUARD1]] ]
				; CHECK-NEXT: [[TMP6:%.*]] = phi i1 [ false, [[L1]] ], [ true, [[LOOP_EXIT_GUARD1]] ]
	; CHECK-NEXT: br label [[FLOW4]]			; CHECK-NEXT: br label [[FLOW4]]
	; CHECK: loop.exit.guard:			; CHECK: loop.exit.guard:
	; CHECK-NEXT: br i1 [[TMP7:%.]], label [[C:%.]], label [[EXIT]]			; CHECK-NEXT: br i1 [[TMP8:%.]], label [[C:%.]], label [[EXIT]]
	; CHECK: Flow2:			; CHECK: Flow2:
	; CHECK-NEXT: [[TMP6]] = phi i1 [ false, [[L2]] ], [ true, [[B2]] ]			; CHECK-NEXT: [[TMP7]] = phi i1 [ false, [[L2]] ], [ true, [[B2]] ]
	; CHECK-NEXT: br label [[FLOW]]			; CHECK-NEXT: br label [[FLOW]]
	; CHECK: Flow4:			; CHECK: Flow4:
	; CHECK-NEXT: [[TMP7]] = phi i1 [ [[TMP2]], [[FLOW5]] ], [ [[TMP0]], [[FLOW3]] ]			; CHECK-NEXT: [[TMP8]] = phi i1 [ [[TMP5]], [[FLOW5]] ], [ [[TMP0]], [[FLOW3]] ]
	; CHECK-NEXT: [[TMP8:%.*]] = phi i1 [ [[TMP5]], [[FLOW5]] ], [ true, [[FLOW3]] ]			; CHECK-NEXT: [[TMP9:%.*]] = phi i1 [ [[TMP6]], [[FLOW5]] ], [ true, [[FLOW3]] ]
	; CHECK-NEXT: br i1 [[TMP8]], label [[LOOP_EXIT_GUARD:%.*]], label [[H1]]			; CHECK-NEXT: br i1 [[TMP9]], label [[LOOP_EXIT_GUARD:%.*]], label [[H1]]
	; CHECK: loop.exit.guard1:			; CHECK: loop.exit.guard1:
	; CHECK-NEXT: br i1 [[TMP3]], label [[L1]], label [[FLOW5]]			; CHECK-NEXT: br i1 [[TMP3]], label [[L1]], label [[FLOW5]]
	;			;
	entry:			entry:
	br label %H1			br label %H1

	H1: ; preds = %L1, %entry			H1: ; preds = %L1, %entry
	br i1 %PredH1, label %H2, label %B1			br i1 %PredH1, label %H2, label %B1
	▲ Show 20 Lines • Show All 105 Lines • Show Last 20 Lines

This is an archive of the discontinued LLVM Phabricator instance.

StructurizeCFG: Set Undef for non-predecessors in setPhiValues()
ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 462785

llvm/lib/Transforms/Scalar/StructurizeCFG.cpp

llvm/test/CodeGen/AMDGPU/multilevel-break.ll

llvm/test/CodeGen/AMDGPU/tuple-allocation-failure.ll

llvm/test/CodeGen/AMDGPU/while-break.ll

llvm/test/Transforms/StructurizeCFG/workarounds/needs-fr-ule.ll

llvm/test/Transforms/StructurizeCFG/workarounds/needs-unified-loop-exits.ll

This is an archive of the discontinued LLVM Phabricator instance.

StructurizeCFG: Set Undef for non-predecessors in setPhiValues()ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 462785

llvm/lib/Transforms/Scalar/StructurizeCFG.cpp

llvm/test/CodeGen/AMDGPU/multilevel-break.ll

llvm/test/CodeGen/AMDGPU/tuple-allocation-failure.ll

llvm/test/CodeGen/AMDGPU/while-break.ll

llvm/test/Transforms/StructurizeCFG/workarounds/needs-fr-ule.ll

llvm/test/Transforms/StructurizeCFG/workarounds/needs-unified-loop-exits.ll

StructurizeCFG: Set Undef for non-predecessors in setPhiValues()
ClosedPublic