This is an archive of the discontinued LLVM Phabricator instance.

AMDGPU: Always split si_end_cf blocks
AbandonedPublic

Authored by arsenm on Sep 11 2020, 12:35 PM.

Download Raw Diff

Details

Reviewers

nhaehnle
rampitec
critson
alex-t
foad

Summary

Ensure we only put the exec modification in a terminator instruction.

The trickiest part of this was dealing with SI_KILL_CLEANUP, which I
don't fully understand. It tries to preserve it as a terminator and
avoids removing it.

Diff Detail

Event Timeline

arsenm created this revision.Sep 11 2020, 12:35 PM

Herald added a project: Restricted Project. · View Herald TranscriptSep 11 2020, 12:35 PM

Herald added subscribers: kerbowa, hiraditya, t-tye and 5 others. · View Herald Transcript

arsenm requested review of this revision.Sep 11 2020, 12:35 PM

Herald added a subscriber: wdng. · View Herald TranscriptSep 11 2020, 12:35 PM

arsenm added a parent revision: D87542: AMDGPU: Don't sometimes allow instructions before lowered si_end_cf.Sep 11 2020, 12:35 PM

LGTM.

SI_KILL_CLEANUP pseudos are inserted to mark points where control flow merges and hence the exec mask can be evaluated for early termination of a pixel shader.
These early terminations are added by SIInsertSkips which contains the logic for determining if it is safe to early terminate at a given point.

This revision is now accepted and ready to land.Sep 24 2020, 2:08 AM

It's unclear to me what this is trying to achieve. If it is to prevent

bb:
  <-- reload inserted here during live range splitting
  $exec = S_OR_B64 $exec, %other
  ... rest of code ...

... then this change only replaces it by:

bb:
  <-- reload inserted here during live range splitting
  $exec = S_OR_B64_term $exec, %other
  // fallthrough

bb.new:
  ... rest of code ...

The inserted reload code is as incorrect as it was before.

This revision now requires changes to proceed.Sep 30 2020, 7:55 AM

In D87543#2303584, @nhaehnle wrote:
It's unclear to me what this is trying to achieve. If it is to prevent
bb:
  <-- reload inserted here during live range splitting
  $exec = S_OR_B64 $exec, %other
  ... rest of code ...
... then this change only replaces it by:
bb:
  <-- reload inserted here during live range splitting
  $exec = S_OR_B64_term $exec, %other
  // fallthrough

bb.new:
  ... rest of code ...
The inserted reload code is as incorrect as it was before.

I'm not trying to fully solve the live range splitting problem greedy regalloc hits. I'm trying to eliminate the isBasicBlockPrologue concept that fastregalloc trips over when inserting spills at the beginning of the block

I'm not trying to fully solve the live range splitting problem greedy regalloc hits. I'm trying to eliminate the isBasicBlockPrologue concept that fastregalloc trips over when inserting spills at the beginning of the block

What if the concept of a basic block prolog *is* the correct long term solution?

In D87543#2303616, @nhaehnle wrote:

I'm not trying to fully solve the live range splitting problem greedy regalloc hits. I'm trying to eliminate the isBasicBlockPrologue concept that fastregalloc trips over when inserting spills at the beginning of the block

What if the concept of a basic block prolog *is* the correct long term solution?

I don't think it is a well formed concept. The operations the prolog inputs depend on transitively turn into prolog instructions, which generally breaks down.

In D87543#2303595, @arsenm wrote:
In D87543#2303584, @nhaehnle wrote:
It's unclear to me what this is trying to achieve. If it is to prevent
bb:
  <-- reload inserted here during live range splitting
  $exec = S_OR_B64 $exec, %other
  ... rest of code ...
... then this change only replaces it by:
bb:
  <-- reload inserted here during live range splitting
  $exec = S_OR_B64_term $exec, %other
  // fallthrough

bb.new:
  ... rest of code ...
The inserted reload code is as incorrect as it was before.
I'm not trying to fully solve the live range splitting problem greedy regalloc hits. I'm trying to eliminate the isBasicBlockPrologue concept that fastregalloc trips over when inserting spills at the beginning of the block

I still not not see how you can get away without isBasicBlockPrologue. I can see how splitting can help with it, but not without. You can split everything and have S_OR the only instruction, but that does not prevent RA from inserting a reload right before it into the same BB.

New version at D145329

Herald added a project: Restricted Project. · View Herald TranscriptMar 30 2023, 7:13 PM

Herald added subscribers: kosarev, StephenFan. · View Herald Transcript

Revision Contents

Path

Size

llvm/

lib/

Target/

AMDGPU/

SIInstrInfo.cpp

7 lines

SIInstructions.td

4 lines

SILowerControlFlow.cpp

27 lines

test/

CodeGen/

AMDGPU/

GlobalISel/

llvm.amdgcn.div.fmas.ll

10 lines

atomic_optimizations_pixelshader.ll

18 lines

80 lines

52 lines

72 lines

94 lines

transform-block-with-return-to-epilog.ll

10 lines

udiv64.ll

50 lines

urem64.ll

84 lines

Diff 291313

llvm/lib/Target/AMDGPU/SIInstrInfo.cpp

Show First 20 Lines • Show All 2,229 Lines • ▼ Show 20 Lines	bool SIInstrInfo::analyzeBranch(MachineBasicBlock &MBB, MachineBasicBlock *&TBB,
MachineBasicBlock::iterator I = MBB.getFirstTerminator();		MachineBasicBlock::iterator I = MBB.getFirstTerminator();
auto E = MBB.end();		auto E = MBB.end();
if (I == E)		if (I == E)
return false;		return false;

// Skip over the instructions that are artificially terminators for special		// Skip over the instructions that are artificially terminators for special
// exec management.		// exec management.
while (I != E && !I->isBranch() && !I->isReturn() &&		while (I != E && !I->isBranch() && !I->isReturn() &&
I->getOpcode() != AMDGPU::SI_MASK_BRANCH) {		(I->getOpcode() != AMDGPU::SI_MASK_BRANCH &&
		I->getOpcode() != AMDGPU::SI_KILL_CLEANUP)) {
switch (I->getOpcode()) {		switch (I->getOpcode()) {
case AMDGPU::SI_MASK_BRANCH:		case AMDGPU::SI_MASK_BRANCH:
		case AMDGPU::SI_KILL_CLEANUP:
case AMDGPU::S_MOV_B64_term:		case AMDGPU::S_MOV_B64_term:
case AMDGPU::S_XOR_B64_term:		case AMDGPU::S_XOR_B64_term:
case AMDGPU::S_OR_B64_term:		case AMDGPU::S_OR_B64_term:
case AMDGPU::S_ANDN2_B64_term:		case AMDGPU::S_ANDN2_B64_term:
case AMDGPU::S_MOV_B32_term:		case AMDGPU::S_MOV_B32_term:
case AMDGPU::S_XOR_B32_term:		case AMDGPU::S_XOR_B32_term:
case AMDGPU::S_OR_B32_term:		case AMDGPU::S_OR_B32_term:
case AMDGPU::S_ANDN2_B32_term:		case AMDGPU::S_ANDN2_B32_term:
▲ Show 20 Lines • Show All 47 Lines • ▼ Show 20 Lines
unsigned SIInstrInfo::removeBranch(MachineBasicBlock &MBB,		unsigned SIInstrInfo::removeBranch(MachineBasicBlock &MBB,
int *BytesRemoved) const {		int *BytesRemoved) const {
MachineBasicBlock::iterator I = MBB.getFirstTerminator();		MachineBasicBlock::iterator I = MBB.getFirstTerminator();

unsigned Count = 0;		unsigned Count = 0;
unsigned RemovedSize = 0;		unsigned RemovedSize = 0;
while (I != MBB.end()) {		while (I != MBB.end()) {
MachineBasicBlock::iterator Next = std::next(I);		MachineBasicBlock::iterator Next = std::next(I);
if (I->getOpcode() == AMDGPU::SI_MASK_BRANCH) {		if (I->getOpcode() == AMDGPU::SI_MASK_BRANCH \|\|
		I->getOpcode() == AMDGPU::SI_KILL_CLEANUP) {
I = Next;		I = Next;
continue;		continue;
}		}

RemovedSize += getInstSizeInBytes(*I);		RemovedSize += getInstSizeInBytes(*I);
I->eraseFromParent();		I->eraseFromParent();
++Count;		++Count;
I = Next;		I = Next;
▲ Show 20 Lines • Show All 4,969 Lines • Show Last 20 Lines

llvm/lib/Target/AMDGPU/SIInstructions.td

Show First 20 Lines • Show All 375 Lines • ▼ Show 20 Lines	def _TERMINATOR : SPseudoInstSI <(outs), ins> {
let isTerminator = 1;		let isTerminator = 1;
}		}
}		}

defm SI_KILL_I1 : PseudoInstKill <(ins SCSrc_i1:$src, i1imm:$killvalue)>;		defm SI_KILL_I1 : PseudoInstKill <(ins SCSrc_i1:$src, i1imm:$killvalue)>;
defm SI_KILL_F32_COND_IMM : PseudoInstKill <(ins VSrc_b32:$src0, i32imm:$src1, i32imm:$cond)>;		defm SI_KILL_F32_COND_IMM : PseudoInstKill <(ins VSrc_b32:$src0, i32imm:$src1, i32imm:$cond)>;

let Defs = [EXEC] in		let Defs = [EXEC] in
def SI_KILL_CLEANUP : SPseudoInstSI <(outs), (ins)>;		def SI_KILL_CLEANUP : SPseudoInstSI <(outs), (ins)> {
		let isTerminator = 1;
		}

let Defs = [EXEC,VCC] in		let Defs = [EXEC,VCC] in
def SI_ILLEGAL_COPY : SPseudoInstSI <		def SI_ILLEGAL_COPY : SPseudoInstSI <
(outs unknown:$dst), (ins unknown:$src),		(outs unknown:$dst), (ins unknown:$src),
[], " ; illegal copy $src to $dst">;		[], " ; illegal copy $src to $dst">;

} // End Uses = [EXEC], Defs = [EXEC,VCC]		} // End Uses = [EXEC], Defs = [EXEC,VCC]

▲ Show 20 Lines • Show All 2,089 Lines • Show Last 20 Lines

llvm/lib/Target/AMDGPU/SILowerControlFlow.cpp

Show First 20 Lines • Show All 527 Lines • ▼ Show 20 Lines	MachineBasicBlock *SILowerControlFlow::splitBlock(MachineInstr &MI,

return SplitBB;		return SplitBB;
}		}

MachineBasicBlock *SILowerControlFlow::emitEndCf(MachineInstr &MI) {		MachineBasicBlock *SILowerControlFlow::emitEndCf(MachineInstr &MI) {
MachineBasicBlock &MBB = *MI.getParent();		MachineBasicBlock &MBB = *MI.getParent();
const DebugLoc &DL = MI.getDebugLoc();		const DebugLoc &DL = MI.getDebugLoc();

MachineBasicBlock::iterator InsPt = MBB.begin();		MachineBasicBlock::iterator InsPt = MI.getIterator();
		MachineBasicBlock *SplitBB = splitBlock(MI, &MBB, LIS);
// If we have instructions that aren't prolog instructions, split the block
// and emit a terminator instruction. This ensures correct spill placement.
// FIXME: We should unconditionally split the block here.
bool NeedBlockSplit = false;
Register DataReg = MI.getOperand(0).getReg();
for (MachineBasicBlock::iterator I = InsPt, E = MI.getIterator();
I != E; ++I) {
if (I->modifiesRegister(DataReg, TRI)) {
NeedBlockSplit = true;
break;
}
}

unsigned Opcode = OrOpc;
MachineBasicBlock *SplitBB = &MBB;
if (NeedBlockSplit) {
SplitBB = splitBlock(MI, &MBB, LIS);
Opcode = OrTermrOpc;
InsPt = MI;
}

		// Split the block so we can turn this into a terminator.
MachineInstr *NewMI =		MachineInstr *NewMI =
BuildMI(MBB, InsPt, DL, TII->get(Opcode), Exec)		BuildMI(MBB, InsPt, DL, TII->get(OrTermrOpc), Exec)
.addReg(Exec)		.addReg(Exec)
.add(MI.getOperand(0));		.add(MI.getOperand(0));

LoweredEndCf.insert(NewMI);		LoweredEndCf.insert(NewMI);

// If this ends control flow which contains kills (as flagged in emitIf)		// If this ends control flow which contains kills (as flagged in emitIf)
// then insert an SI_KILL_CLEANUP immediately following the exec mask		// then insert an SI_KILL_CLEANUP immediately following the exec mask
// manipulation. This can be lowered to early termination if appropriate.		// manipulation. This can be lowered to early termination if appropriate.
▲ Show 20 Lines • Show All 283 Lines • Show Last 20 Lines

llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.div.fmas.ll

	Show First 20 Lines • Show All 1,067 Lines • ▼ Show 20 Lines
	; GFX10_W32-NEXT: global_store_dword v[0:1], v2, off			; GFX10_W32-NEXT: global_store_dword v[0:1], v2, off
	; GFX10_W32-NEXT: s_endpgm			; GFX10_W32-NEXT: s_endpgm
	;			;
	; GFX10_W64-LABEL: test_div_fmas_f32_i1_phi_vcc:			; GFX10_W64-LABEL: test_div_fmas_f32_i1_phi_vcc:
	; GFX10_W64: ; %bb.0: ; %entry			; GFX10_W64: ; %bb.0: ; %entry
	; GFX10_W64-NEXT: s_load_dwordx2 s[2:3], s[0:1], 0x4c			; GFX10_W64-NEXT: s_load_dwordx2 s[2:3], s[0:1], 0x4c
	; GFX10_W64-NEXT: v_lshlrev_b32_e32 v1, 2, v0			; GFX10_W64-NEXT: v_lshlrev_b32_e32 v1, 2, v0
	; GFX10_W64-NEXT: v_cmp_eq_u32_e32 vcc, 0, v0			; GFX10_W64-NEXT: v_cmp_eq_u32_e32 vcc, 0, v0
	; GFX10_W64-NEXT: s_mov_b32 s6, 0			; GFX10_W64-NEXT: s_mov_b32 s4, 0
	; GFX10_W64-NEXT: s_waitcnt lgkmcnt(0)			; GFX10_W64-NEXT: s_waitcnt lgkmcnt(0)
	; GFX10_W64-NEXT: global_load_dwordx3 v[1:3], v1, s[2:3]			; GFX10_W64-NEXT: global_load_dwordx3 v[1:3], v1, s[2:3]
	; GFX10_W64-NEXT: s_waitcnt_depctr 0xffe3			; GFX10_W64-NEXT: s_waitcnt_depctr 0xffe3
	; GFX10_W64-NEXT: s_load_dwordx2 s[2:3], s[0:1], 0x24			; GFX10_W64-NEXT: s_load_dwordx2 s[2:3], s[0:1], 0x24
	; GFX10_W64-NEXT: s_and_saveexec_b64 s[4:5], vcc			; GFX10_W64-NEXT: s_and_saveexec_b64 s[6:7], vcc
	; GFX10_W64-NEXT: s_cbranch_execz BB13_2			; GFX10_W64-NEXT: s_cbranch_execz BB13_2
	; GFX10_W64-NEXT: ; %bb.1: ; %bb			; GFX10_W64-NEXT: ; %bb.1: ; %bb
	; GFX10_W64-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x74			; GFX10_W64-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x74
	; GFX10_W64-NEXT: s_waitcnt lgkmcnt(0)			; GFX10_W64-NEXT: s_waitcnt lgkmcnt(0)
	; GFX10_W64-NEXT: s_load_dword s0, s[0:1], 0x0			; GFX10_W64-NEXT: s_load_dword s0, s[0:1], 0x0
	; GFX10_W64-NEXT: s_waitcnt lgkmcnt(0)			; GFX10_W64-NEXT: s_waitcnt lgkmcnt(0)
	; GFX10_W64-NEXT: s_cmp_lg_u32 s0, 0			; GFX10_W64-NEXT: s_cmp_lg_u32 s0, 0
	; GFX10_W64-NEXT: s_cselect_b32 s6, 1, 0			; GFX10_W64-NEXT: s_cselect_b32 s4, 1, 0
	; GFX10_W64-NEXT: BB13_2: ; %exit			; GFX10_W64-NEXT: BB13_2: ; %exit
	; GFX10_W64-NEXT: s_or_b64 exec, exec, s[4:5]			; GFX10_W64-NEXT: s_or_b64 exec, exec, s[6:7]
	; GFX10_W64-NEXT: s_and_b32 s0, 1, s6			; GFX10_W64-NEXT: s_and_b32 s0, 1, s4
	; GFX10_W64-NEXT: v_cmp_ne_u32_e64 vcc, 0, s0			; GFX10_W64-NEXT: v_cmp_ne_u32_e64 vcc, 0, s0
	; GFX10_W64-NEXT: s_waitcnt lgkmcnt(0)			; GFX10_W64-NEXT: s_waitcnt lgkmcnt(0)
	; GFX10_W64-NEXT: s_add_u32 s0, s2, 8			; GFX10_W64-NEXT: s_add_u32 s0, s2, 8
	; GFX10_W64-NEXT: s_addc_u32 s1, s3, 0			; GFX10_W64-NEXT: s_addc_u32 s1, s3, 0
	; GFX10_W64-NEXT: s_waitcnt vmcnt(0)			; GFX10_W64-NEXT: s_waitcnt vmcnt(0)
	; GFX10_W64-NEXT: v_div_fmas_f32 v2, v1, v2, v3			; GFX10_W64-NEXT: v_div_fmas_f32 v2, v1, v2, v3
	; GFX10_W64-NEXT: v_mov_b32_e32 v0, s0			; GFX10_W64-NEXT: v_mov_b32_e32 v0, s0
	; GFX10_W64-NEXT: v_mov_b32_e32 v1, s1			; GFX10_W64-NEXT: v_mov_b32_e32 v1, s1
	Show All 33 Lines

llvm/test/CodeGen/AMDGPU/atomic_optimizations_pixelshader.ll

	Show All 30 Lines
	; GFX7-NEXT: v_mul_u32_u24_e64 v1, s12, 5			; GFX7-NEXT: v_mul_u32_u24_e64 v1, s12, 5
	; GFX7-NEXT: buffer_atomic_add v1, off, s[4:7], 0 glc			; GFX7-NEXT: buffer_atomic_add v1, off, s[4:7], 0 glc
	; GFX7-NEXT: BB0_3:			; GFX7-NEXT: BB0_3:
	; GFX7-NEXT: s_or_b64 exec, exec, s[10:11]			; GFX7-NEXT: s_or_b64 exec, exec, s[10:11]
	; GFX7-NEXT: s_waitcnt vmcnt(0)			; GFX7-NEXT: s_waitcnt vmcnt(0)
	; GFX7-NEXT: v_readfirstlane_b32 s4, v1			; GFX7-NEXT: v_readfirstlane_b32 s4, v1
	; GFX7-NEXT: v_mad_u32_u24 v0, v0, 5, s4			; GFX7-NEXT: v_mad_u32_u24 v0, v0, 5, s4
	; GFX7-NEXT: BB0_4: ; %Flow			; GFX7-NEXT: BB0_4: ; %Flow
	; GFX7-NEXT: s_or_b64 exec, exec, s[8:9]
	; GFX7-NEXT: s_wqm_b64 s[4:5], -1			; GFX7-NEXT: s_wqm_b64 s[4:5], -1
				; GFX7-NEXT: s_or_b64 exec, exec, s[8:9]
	; GFX7-NEXT: s_andn2_b64 vcc, exec, s[4:5]			; GFX7-NEXT: s_andn2_b64 vcc, exec, s[4:5]
	; GFX7-NEXT: s_cbranch_vccnz BB0_6			; GFX7-NEXT: s_cbranch_vccnz BB0_6
	; GFX7-NEXT: ; %bb.5: ; %if			; GFX7-NEXT: ; %bb.5: ; %if
	; GFX7-NEXT: buffer_store_dword v0, off, s[0:3], 0			; GFX7-NEXT: buffer_store_dword v0, off, s[0:3], 0
	; GFX7-NEXT: BB0_6: ; %UnifiedReturnBlock			; GFX7-NEXT: BB0_6: ; %UnifiedReturnBlock
	; GFX7-NEXT: s_endpgm			; GFX7-NEXT: s_endpgm
	;			;
	; GFX8-LABEL: add_i32_constant:			; GFX8-LABEL: add_i32_constant:
	Show All 15 Lines
	; GFX8-NEXT: v_mul_u32_u24_e64 v1, s12, 5			; GFX8-NEXT: v_mul_u32_u24_e64 v1, s12, 5
	; GFX8-NEXT: buffer_atomic_add v1, off, s[4:7], 0 glc			; GFX8-NEXT: buffer_atomic_add v1, off, s[4:7], 0 glc
	; GFX8-NEXT: BB0_3:			; GFX8-NEXT: BB0_3:
	; GFX8-NEXT: s_or_b64 exec, exec, s[10:11]			; GFX8-NEXT: s_or_b64 exec, exec, s[10:11]
	; GFX8-NEXT: s_waitcnt vmcnt(0)			; GFX8-NEXT: s_waitcnt vmcnt(0)
	; GFX8-NEXT: v_readfirstlane_b32 s4, v1			; GFX8-NEXT: v_readfirstlane_b32 s4, v1
	; GFX8-NEXT: v_mad_u32_u24 v0, v0, 5, s4			; GFX8-NEXT: v_mad_u32_u24 v0, v0, 5, s4
	; GFX8-NEXT: BB0_4: ; %Flow			; GFX8-NEXT: BB0_4: ; %Flow
	; GFX8-NEXT: s_or_b64 exec, exec, s[8:9]
	; GFX8-NEXT: s_wqm_b64 s[4:5], -1			; GFX8-NEXT: s_wqm_b64 s[4:5], -1
				; GFX8-NEXT: s_or_b64 exec, exec, s[8:9]
	; GFX8-NEXT: s_andn2_b64 vcc, exec, s[4:5]			; GFX8-NEXT: s_andn2_b64 vcc, exec, s[4:5]
	; GFX8-NEXT: s_cbranch_vccnz BB0_6			; GFX8-NEXT: s_cbranch_vccnz BB0_6
	; GFX8-NEXT: ; %bb.5: ; %if			; GFX8-NEXT: ; %bb.5: ; %if
	; GFX8-NEXT: buffer_store_dword v0, off, s[0:3], 0			; GFX8-NEXT: buffer_store_dword v0, off, s[0:3], 0
	; GFX8-NEXT: BB0_6: ; %UnifiedReturnBlock			; GFX8-NEXT: BB0_6: ; %UnifiedReturnBlock
	; GFX8-NEXT: s_endpgm			; GFX8-NEXT: s_endpgm
	;			;
	; GFX9-LABEL: add_i32_constant:			; GFX9-LABEL: add_i32_constant:
	Show All 15 Lines
	; GFX9-NEXT: v_mul_u32_u24_e64 v1, s12, 5			; GFX9-NEXT: v_mul_u32_u24_e64 v1, s12, 5
	; GFX9-NEXT: buffer_atomic_add v1, off, s[4:7], 0 glc			; GFX9-NEXT: buffer_atomic_add v1, off, s[4:7], 0 glc
	; GFX9-NEXT: BB0_3:			; GFX9-NEXT: BB0_3:
	; GFX9-NEXT: s_or_b64 exec, exec, s[10:11]			; GFX9-NEXT: s_or_b64 exec, exec, s[10:11]
	; GFX9-NEXT: s_waitcnt vmcnt(0)			; GFX9-NEXT: s_waitcnt vmcnt(0)
	; GFX9-NEXT: v_readfirstlane_b32 s4, v1			; GFX9-NEXT: v_readfirstlane_b32 s4, v1
	; GFX9-NEXT: v_mad_u32_u24 v0, v0, 5, s4			; GFX9-NEXT: v_mad_u32_u24 v0, v0, 5, s4
	; GFX9-NEXT: BB0_4: ; %Flow			; GFX9-NEXT: BB0_4: ; %Flow
	; GFX9-NEXT: s_or_b64 exec, exec, s[8:9]
	; GFX9-NEXT: s_wqm_b64 s[4:5], -1			; GFX9-NEXT: s_wqm_b64 s[4:5], -1
				; GFX9-NEXT: s_or_b64 exec, exec, s[8:9]
	; GFX9-NEXT: s_andn2_b64 vcc, exec, s[4:5]			; GFX9-NEXT: s_andn2_b64 vcc, exec, s[4:5]
	; GFX9-NEXT: s_cbranch_vccnz BB0_6			; GFX9-NEXT: s_cbranch_vccnz BB0_6
	; GFX9-NEXT: ; %bb.5: ; %if			; GFX9-NEXT: ; %bb.5: ; %if
	; GFX9-NEXT: buffer_store_dword v0, off, s[0:3], 0			; GFX9-NEXT: buffer_store_dword v0, off, s[0:3], 0
	; GFX9-NEXT: BB0_6: ; %UnifiedReturnBlock			; GFX9-NEXT: BB0_6: ; %UnifiedReturnBlock
	; GFX9-NEXT: s_endpgm			; GFX9-NEXT: s_endpgm
	;			;
	; GFX1064-LABEL: add_i32_constant:			; GFX1064-LABEL: add_i32_constant:
	Show All 16 Lines
	; GFX1064-NEXT: buffer_atomic_add v1, off, s[4:7], 0 glc			; GFX1064-NEXT: buffer_atomic_add v1, off, s[4:7], 0 glc
	; GFX1064-NEXT: BB0_3:			; GFX1064-NEXT: BB0_3:
	; GFX1064-NEXT: s_waitcnt_depctr 0xffe3			; GFX1064-NEXT: s_waitcnt_depctr 0xffe3
	; GFX1064-NEXT: s_or_b64 exec, exec, s[30:31]			; GFX1064-NEXT: s_or_b64 exec, exec, s[30:31]
	; GFX1064-NEXT: s_waitcnt vmcnt(0)			; GFX1064-NEXT: s_waitcnt vmcnt(0)
	; GFX1064-NEXT: v_readfirstlane_b32 s4, v1			; GFX1064-NEXT: v_readfirstlane_b32 s4, v1
	; GFX1064-NEXT: v_mad_u32_u24 v0, v0, 5, s4			; GFX1064-NEXT: v_mad_u32_u24 v0, v0, 5, s4
	; GFX1064-NEXT: BB0_4: ; %Flow			; GFX1064-NEXT: BB0_4: ; %Flow
	; GFX1064-NEXT: s_or_b64 exec, exec, s[8:9]
	; GFX1064-NEXT: s_wqm_b64 s[4:5], -1			; GFX1064-NEXT: s_wqm_b64 s[4:5], -1
				; GFX1064-NEXT: s_or_b64 exec, exec, s[8:9]
	; GFX1064-NEXT: s_andn2_b64 vcc, exec, s[4:5]			; GFX1064-NEXT: s_andn2_b64 vcc, exec, s[4:5]
	; GFX1064-NEXT: s_cbranch_vccnz BB0_6			; GFX1064-NEXT: s_cbranch_vccnz BB0_6
	; GFX1064-NEXT: ; %bb.5: ; %if			; GFX1064-NEXT: ; %bb.5: ; %if
	; GFX1064-NEXT: buffer_store_dword v0, off, s[0:3], 0			; GFX1064-NEXT: buffer_store_dword v0, off, s[0:3], 0
	; GFX1064-NEXT: BB0_6: ; %UnifiedReturnBlock			; GFX1064-NEXT: BB0_6: ; %UnifiedReturnBlock
	; GFX1064-NEXT: s_endpgm			; GFX1064-NEXT: s_endpgm
	;			;
	; GFX1032-LABEL: add_i32_constant:			; GFX1032-LABEL: add_i32_constant:
	Show All 16 Lines
	; GFX1032-NEXT: buffer_atomic_add v1, off, s[4:7], 0 glc			; GFX1032-NEXT: buffer_atomic_add v1, off, s[4:7], 0 glc
	; GFX1032-NEXT: BB0_3:			; GFX1032-NEXT: BB0_3:
	; GFX1032-NEXT: s_waitcnt_depctr 0xffe3			; GFX1032-NEXT: s_waitcnt_depctr 0xffe3
	; GFX1032-NEXT: s_or_b32 exec_lo, exec_lo, s9			; GFX1032-NEXT: s_or_b32 exec_lo, exec_lo, s9
	; GFX1032-NEXT: s_waitcnt vmcnt(0)			; GFX1032-NEXT: s_waitcnt vmcnt(0)
	; GFX1032-NEXT: v_readfirstlane_b32 s4, v1			; GFX1032-NEXT: v_readfirstlane_b32 s4, v1
	; GFX1032-NEXT: v_mad_u32_u24 v0, v0, 5, s4			; GFX1032-NEXT: v_mad_u32_u24 v0, v0, 5, s4
	; GFX1032-NEXT: BB0_4: ; %Flow			; GFX1032-NEXT: BB0_4: ; %Flow
	; GFX1032-NEXT: s_or_b32 exec_lo, exec_lo, s8
	; GFX1032-NEXT: s_wqm_b32 s4, -1			; GFX1032-NEXT: s_wqm_b32 s4, -1
				; GFX1032-NEXT: s_or_b32 exec_lo, exec_lo, s8
	; GFX1032-NEXT: s_andn2_b32 vcc_lo, exec_lo, s4			; GFX1032-NEXT: s_andn2_b32 vcc_lo, exec_lo, s4
	; GFX1032-NEXT: s_cbranch_vccnz BB0_6			; GFX1032-NEXT: s_cbranch_vccnz BB0_6
	; GFX1032-NEXT: ; %bb.5: ; %if			; GFX1032-NEXT: ; %bb.5: ; %if
	; GFX1032-NEXT: buffer_store_dword v0, off, s[0:3], 0			; GFX1032-NEXT: buffer_store_dword v0, off, s[0:3], 0
	; GFX1032-NEXT: BB0_6: ; %UnifiedReturnBlock			; GFX1032-NEXT: BB0_6: ; %UnifiedReturnBlock
	; GFX1032-NEXT: s_endpgm			; GFX1032-NEXT: s_endpgm
	entry:			entry:
	%cond1 = call i1 @llvm.amdgcn.wqm.vote(i1 true)			%cond1 = call i1 @llvm.amdgcn.wqm.vote(i1 true)
	▲ Show 20 Lines • Show All 65 Lines • ▼ Show 20 Lines
	; GFX8-NEXT: buffer_atomic_add v0, off, s[4:7], 0 glc			; GFX8-NEXT: buffer_atomic_add v0, off, s[4:7], 0 glc
	; GFX8-NEXT: BB1_3:			; GFX8-NEXT: BB1_3:
	; GFX8-NEXT: s_or_b64 exec, exec, s[10:11]			; GFX8-NEXT: s_or_b64 exec, exec, s[10:11]
	; GFX8-NEXT: s_waitcnt vmcnt(0)			; GFX8-NEXT: s_waitcnt vmcnt(0)
	; GFX8-NEXT: v_readfirstlane_b32 s4, v0			; GFX8-NEXT: v_readfirstlane_b32 s4, v0
	; GFX8-NEXT: v_mov_b32_e32 v0, v1			; GFX8-NEXT: v_mov_b32_e32 v0, v1
	; GFX8-NEXT: v_add_u32_e32 v3, vcc, s4, v0			; GFX8-NEXT: v_add_u32_e32 v3, vcc, s4, v0
	; GFX8-NEXT: BB1_4: ; %Flow			; GFX8-NEXT: BB1_4: ; %Flow
	; GFX8-NEXT: s_or_b64 exec, exec, s[8:9]
	; GFX8-NEXT: s_wqm_b64 s[4:5], -1			; GFX8-NEXT: s_wqm_b64 s[4:5], -1
				; GFX8-NEXT: s_or_b64 exec, exec, s[8:9]
	; GFX8-NEXT: s_andn2_b64 vcc, exec, s[4:5]			; GFX8-NEXT: s_andn2_b64 vcc, exec, s[4:5]
	; GFX8-NEXT: s_cbranch_vccnz BB1_6			; GFX8-NEXT: s_cbranch_vccnz BB1_6
	; GFX8-NEXT: ; %bb.5: ; %if			; GFX8-NEXT: ; %bb.5: ; %if
	; GFX8-NEXT: buffer_store_dword v3, off, s[0:3], 0			; GFX8-NEXT: buffer_store_dword v3, off, s[0:3], 0
	; GFX8-NEXT: BB1_6: ; %UnifiedReturnBlock			; GFX8-NEXT: BB1_6: ; %UnifiedReturnBlock
	; GFX8-NEXT: s_endpgm			; GFX8-NEXT: s_endpgm
	;			;
	; GFX9-LABEL: add_i32_varying:			; GFX9-LABEL: add_i32_varying:
	Show All 39 Lines
	; GFX9-NEXT: buffer_atomic_add v0, off, s[4:7], 0 glc			; GFX9-NEXT: buffer_atomic_add v0, off, s[4:7], 0 glc
	; GFX9-NEXT: BB1_3:			; GFX9-NEXT: BB1_3:
	; GFX9-NEXT: s_or_b64 exec, exec, s[10:11]			; GFX9-NEXT: s_or_b64 exec, exec, s[10:11]
	; GFX9-NEXT: s_waitcnt vmcnt(0)			; GFX9-NEXT: s_waitcnt vmcnt(0)
	; GFX9-NEXT: v_readfirstlane_b32 s4, v0			; GFX9-NEXT: v_readfirstlane_b32 s4, v0
	; GFX9-NEXT: v_mov_b32_e32 v0, v1			; GFX9-NEXT: v_mov_b32_e32 v0, v1
	; GFX9-NEXT: v_add_u32_e32 v3, s4, v0			; GFX9-NEXT: v_add_u32_e32 v3, s4, v0
	; GFX9-NEXT: BB1_4: ; %Flow			; GFX9-NEXT: BB1_4: ; %Flow
	; GFX9-NEXT: s_or_b64 exec, exec, s[8:9]
	; GFX9-NEXT: s_wqm_b64 s[4:5], -1			; GFX9-NEXT: s_wqm_b64 s[4:5], -1
				; GFX9-NEXT: s_or_b64 exec, exec, s[8:9]
	; GFX9-NEXT: s_andn2_b64 vcc, exec, s[4:5]			; GFX9-NEXT: s_andn2_b64 vcc, exec, s[4:5]
	; GFX9-NEXT: s_cbranch_vccnz BB1_6			; GFX9-NEXT: s_cbranch_vccnz BB1_6
	; GFX9-NEXT: ; %bb.5: ; %if			; GFX9-NEXT: ; %bb.5: ; %if
	; GFX9-NEXT: buffer_store_dword v3, off, s[0:3], 0			; GFX9-NEXT: buffer_store_dword v3, off, s[0:3], 0
	; GFX9-NEXT: BB1_6: ; %UnifiedReturnBlock			; GFX9-NEXT: BB1_6: ; %UnifiedReturnBlock
	; GFX9-NEXT: s_endpgm			; GFX9-NEXT: s_endpgm
	;			;
	; GFX1064-LABEL: add_i32_varying:			; GFX1064-LABEL: add_i32_varying:
	▲ Show 20 Lines • Show All 43 Lines • ▼ Show 20 Lines
	; GFX1064-NEXT: BB1_3:			; GFX1064-NEXT: BB1_3:
	; GFX1064-NEXT: s_waitcnt_depctr 0xffe3			; GFX1064-NEXT: s_waitcnt_depctr 0xffe3
	; GFX1064-NEXT: s_or_b64 exec, exec, s[30:31]			; GFX1064-NEXT: s_or_b64 exec, exec, s[30:31]
	; GFX1064-NEXT: s_waitcnt vmcnt(0)			; GFX1064-NEXT: s_waitcnt vmcnt(0)
	; GFX1064-NEXT: v_readfirstlane_b32 s4, v0			; GFX1064-NEXT: v_readfirstlane_b32 s4, v0
	; GFX1064-NEXT: v_mov_b32_e32 v0, v1			; GFX1064-NEXT: v_mov_b32_e32 v0, v1
	; GFX1064-NEXT: v_add_nc_u32_e32 v4, s4, v0			; GFX1064-NEXT: v_add_nc_u32_e32 v4, s4, v0
	; GFX1064-NEXT: BB1_4: ; %Flow			; GFX1064-NEXT: BB1_4: ; %Flow
	; GFX1064-NEXT: s_or_b64 exec, exec, s[8:9]
	; GFX1064-NEXT: s_wqm_b64 s[4:5], -1			; GFX1064-NEXT: s_wqm_b64 s[4:5], -1
				; GFX1064-NEXT: s_or_b64 exec, exec, s[8:9]
	; GFX1064-NEXT: s_andn2_b64 vcc, exec, s[4:5]			; GFX1064-NEXT: s_andn2_b64 vcc, exec, s[4:5]
	; GFX1064-NEXT: s_cbranch_vccnz BB1_6			; GFX1064-NEXT: s_cbranch_vccnz BB1_6
	; GFX1064-NEXT: ; %bb.5: ; %if			; GFX1064-NEXT: ; %bb.5: ; %if
	; GFX1064-NEXT: buffer_store_dword v4, off, s[0:3], 0			; GFX1064-NEXT: buffer_store_dword v4, off, s[0:3], 0
	; GFX1064-NEXT: BB1_6: ; %UnifiedReturnBlock			; GFX1064-NEXT: BB1_6: ; %UnifiedReturnBlock
	; GFX1064-NEXT: s_endpgm			; GFX1064-NEXT: s_endpgm
	;			;
	; GFX1032-LABEL: add_i32_varying:			; GFX1032-LABEL: add_i32_varying:
	Show All 36 Lines
	; GFX1032-NEXT: BB1_3:			; GFX1032-NEXT: BB1_3:
	; GFX1032-NEXT: s_waitcnt_depctr 0xffe3			; GFX1032-NEXT: s_waitcnt_depctr 0xffe3
	; GFX1032-NEXT: s_or_b32 exec_lo, exec_lo, s9			; GFX1032-NEXT: s_or_b32 exec_lo, exec_lo, s9
	; GFX1032-NEXT: s_waitcnt vmcnt(0)			; GFX1032-NEXT: s_waitcnt vmcnt(0)
	; GFX1032-NEXT: v_readfirstlane_b32 s4, v0			; GFX1032-NEXT: v_readfirstlane_b32 s4, v0
	; GFX1032-NEXT: v_mov_b32_e32 v0, v1			; GFX1032-NEXT: v_mov_b32_e32 v0, v1
	; GFX1032-NEXT: v_add_nc_u32_e32 v4, s4, v0			; GFX1032-NEXT: v_add_nc_u32_e32 v4, s4, v0
	; GFX1032-NEXT: BB1_4: ; %Flow			; GFX1032-NEXT: BB1_4: ; %Flow
	; GFX1032-NEXT: s_or_b32 exec_lo, exec_lo, s8
	; GFX1032-NEXT: s_wqm_b32 s4, -1			; GFX1032-NEXT: s_wqm_b32 s4, -1
				; GFX1032-NEXT: s_or_b32 exec_lo, exec_lo, s8
	; GFX1032-NEXT: s_andn2_b32 vcc_lo, exec_lo, s4			; GFX1032-NEXT: s_andn2_b32 vcc_lo, exec_lo, s4
	; GFX1032-NEXT: s_cbranch_vccnz BB1_6			; GFX1032-NEXT: s_cbranch_vccnz BB1_6
	; GFX1032-NEXT: ; %bb.5: ; %if			; GFX1032-NEXT: ; %bb.5: ; %if
	; GFX1032-NEXT: buffer_store_dword v4, off, s[0:3], 0			; GFX1032-NEXT: buffer_store_dword v4, off, s[0:3], 0
	; GFX1032-NEXT: BB1_6: ; %UnifiedReturnBlock			; GFX1032-NEXT: BB1_6: ; %UnifiedReturnBlock
	; GFX1032-NEXT: s_endpgm			; GFX1032-NEXT: s_endpgm
	entry:			entry:
	%cond1 = call i1 @llvm.amdgcn.wqm.vote(i1 true)			%cond1 = call i1 @llvm.amdgcn.wqm.vote(i1 true)
	Show All 11 Lines

llvm/test/CodeGen/AMDGPU/collapse-endcf.mir

Show All 10 Lines	body: \|
; GCN-LABEL: name: simple_nested_if_dbg_value		; GCN-LABEL: name: simple_nested_if_dbg_value
; GCN: bb.0:		; GCN: bb.0:
; GCN: successors: %bb.1(0x40000000), %bb.4(0x40000000)		; GCN: successors: %bb.1(0x40000000), %bb.4(0x40000000)
; GCN: [[COPY:%[0-9]+]]:sreg_64 = COPY $exec, implicit-def $exec		; GCN: [[COPY:%[0-9]+]]:sreg_64 = COPY $exec, implicit-def $exec
; GCN: [[S_AND_B64_:%[0-9]+]]:sreg_64 = S_AND_B64 [[COPY]], undef %1:sreg_64, implicit-def dead $scc		; GCN: [[S_AND_B64_:%[0-9]+]]:sreg_64 = S_AND_B64 [[COPY]], undef %1:sreg_64, implicit-def dead $scc
; GCN: $exec = S_MOV_B64_term killed [[S_AND_B64_]]		; GCN: $exec = S_MOV_B64_term killed [[S_AND_B64_]]
; GCN: S_CBRANCH_EXECZ %bb.4, implicit $exec		; GCN: S_CBRANCH_EXECZ %bb.4, implicit $exec
; GCN: bb.1:		; GCN: bb.1:
; GCN: successors: %bb.2(0x40000000), %bb.4(0x40000000)		; GCN: successors: %bb.2(0x40000000), %bb.5(0x40000000)
; GCN: [[COPY1:%[0-9]+]]:sreg_64 = COPY $exec, implicit-def $exec		; GCN: [[COPY1:%[0-9]+]]:sreg_64 = COPY $exec, implicit-def $exec
; GCN: [[S_AND_B64_1:%[0-9]+]]:sreg_64 = S_AND_B64 [[COPY1]], undef %3:sreg_64, implicit-def dead $scc		; GCN: [[S_AND_B64_1:%[0-9]+]]:sreg_64 = S_AND_B64 [[COPY1]], undef %3:sreg_64, implicit-def dead $scc
; GCN: $exec = S_MOV_B64_term killed [[S_AND_B64_1]]		; GCN: $exec = S_MOV_B64_term killed [[S_AND_B64_1]]
; GCN: S_CBRANCH_EXECZ %bb.4, implicit $exec		; GCN: S_CBRANCH_EXECZ %bb.5, implicit $exec
; GCN: bb.2:		; GCN: bb.2:
		; GCN: successors: %bb.5(0x80000000)
		; GCN: bb.5:
; GCN: successors: %bb.4(0x80000000)		; GCN: successors: %bb.4(0x80000000)
		; GCN: DBG_VALUE
; GCN: bb.4:		; GCN: bb.4:
; GCN: $exec = S_OR_B64 $exec, [[COPY]], implicit-def $scc		; GCN: successors: %bb.6(0x80000000)
; GCN: DBG_VALUE		; GCN: DBG_VALUE
		; GCN: $exec = S_OR_B64_term $exec, [[COPY]], implicit-def $scc
		; GCN: bb.6:
; GCN: S_ENDPGM 0		; GCN: S_ENDPGM 0
bb.0:		bb.0:
successors: %bb.1, %bb.4		successors: %bb.1, %bb.4

%0:sreg_64 = SI_IF undef %1:sreg_64, %bb.4, implicit-def dead $exec, implicit-def dead $scc, implicit $exec		%0:sreg_64 = SI_IF undef %1:sreg_64, %bb.4, implicit-def dead $exec, implicit-def dead $scc, implicit $exec

bb.1:		bb.1:
successors: %bb.2, %bb.3		successors: %bb.2, %bb.3
Show All 33 Lines	body: \|
; GCN: [[S_AND_B64_1:%[0-9]+]]:sreg_64 = S_AND_B64 [[COPY1]], undef %3:sreg_64, implicit-def dead $scc		; GCN: [[S_AND_B64_1:%[0-9]+]]:sreg_64 = S_AND_B64 [[COPY1]], undef %3:sreg_64, implicit-def dead $scc
; GCN: $exec = S_MOV_B64_term killed [[S_AND_B64_1]]		; GCN: $exec = S_MOV_B64_term killed [[S_AND_B64_1]]
; GCN: S_CBRANCH_EXECZ %bb.4, implicit $exec		; GCN: S_CBRANCH_EXECZ %bb.4, implicit $exec
; GCN: bb.2:		; GCN: bb.2:
; GCN: successors: %bb.4(0x80000000)		; GCN: successors: %bb.4(0x80000000)
; GCN: bb.4:		; GCN: bb.4:
; GCN: successors: %bb.5(0x80000000)		; GCN: successors: %bb.5(0x80000000)
; GCN: bb.5:		; GCN: bb.5:
; GCN: $exec = S_OR_B64 $exec, [[COPY]], implicit-def $scc		; GCN: successors: %bb.6(0x80000000)
		; GCN: $exec = S_OR_B64_term $exec, [[COPY]], implicit-def $scc
		; GCN: bb.6:
; GCN: S_ENDPGM 0		; GCN: S_ENDPGM 0
bb.0:		bb.0:
%0:sreg_64 = SI_IF undef %1:sreg_64, %bb.4, implicit-def dead $exec, implicit-def dead $scc, implicit $exec		%0:sreg_64 = SI_IF undef %1:sreg_64, %bb.4, implicit-def dead $exec, implicit-def dead $scc, implicit $exec

bb.1:		bb.1:
successors: %bb.2, %bb.3		successors: %bb.2, %bb.3

%2:sreg_64 = SI_IF undef %3:sreg_64, %bb.3, implicit-def dead $exec, implicit-def dead $scc, implicit $exec		%2:sreg_64 = SI_IF undef %3:sreg_64, %bb.3, implicit-def dead $exec, implicit-def dead $scc, implicit $exec
Show All 32 Lines	body: \|
; GCN: $exec = S_MOV_B64_term killed [[S_AND_B64_1]]		; GCN: $exec = S_MOV_B64_term killed [[S_AND_B64_1]]
; GCN: S_CBRANCH_EXECZ %bb.4, implicit $exec		; GCN: S_CBRANCH_EXECZ %bb.4, implicit $exec
; GCN: bb.2:		; GCN: bb.2:
; GCN: successors: %bb.4(0x80000000)		; GCN: successors: %bb.4(0x80000000)
; GCN: bb.4:		; GCN: bb.4:
; GCN: successors: %bb.5(0x80000000)		; GCN: successors: %bb.5(0x80000000)
; GCN: DBG_VALUE		; GCN: DBG_VALUE
; GCN: bb.5:		; GCN: bb.5:
; GCN: $exec = S_OR_B64 $exec, [[COPY]], implicit-def $scc		; GCN: successors: %bb.6(0x80000000)
		; GCN: $exec = S_OR_B64_term $exec, [[COPY]], implicit-def $scc
		; GCN: bb.6:
; GCN: S_ENDPGM 0		; GCN: S_ENDPGM 0
bb.0:		bb.0:
successors: %bb.1, %bb.4		successors: %bb.1, %bb.4

%0:sreg_64 = SI_IF undef %1:sreg_64, %bb.4, implicit-def dead $exec, implicit-def dead $scc, implicit $exec		%0:sreg_64 = SI_IF undef %1:sreg_64, %bb.4, implicit-def dead $exec, implicit-def dead $scc, implicit $exec

bb.1:		bb.1:
successors: %bb.2, %bb.3		successors: %bb.2, %bb.3
Show All 37 Lines	body: \|
; GCN: bb.2:		; GCN: bb.2:
; GCN: successors: %bb.3(0x80000000)		; GCN: successors: %bb.3(0x80000000)
; GCN: bb.3:		; GCN: bb.3:
; GCN: successors: %bb.4(0x80000000)		; GCN: successors: %bb.4(0x80000000)
; GCN: [[DEF:%[0-9]+]]:sgpr_32 = IMPLICIT_DEF		; GCN: [[DEF:%[0-9]+]]:sgpr_32 = IMPLICIT_DEF
; GCN: [[S_BREV_B32_:%[0-9]+]]:sgpr_32 = S_BREV_B32 [[DEF]]		; GCN: [[S_BREV_B32_:%[0-9]+]]:sgpr_32 = S_BREV_B32 [[DEF]]
; GCN: KILL [[DEF]]		; GCN: KILL [[DEF]]
; GCN: bb.4:		; GCN: bb.4:
; GCN: $exec = S_OR_B64 $exec, [[COPY]], implicit-def $scc		; GCN: successors: %bb.5(0x80000000)
		; GCN: $exec = S_OR_B64_term $exec, [[COPY]], implicit-def $scc
		; GCN: bb.5:
; GCN: S_ENDPGM 0		; GCN: S_ENDPGM 0
bb.0:		bb.0:
successors: %bb.1, %bb.4		successors: %bb.1, %bb.4
liveins: $vgpr0, $sgpr0_sgpr1		liveins: $vgpr0, $sgpr0_sgpr1

%0:sreg_64 = SI_IF undef %1:sreg_64, %bb.4, implicit-def dead $exec, implicit-def dead $scc, implicit $exec		%0:sreg_64 = SI_IF undef %1:sreg_64, %bb.4, implicit-def dead $exec, implicit-def dead $scc, implicit $exec

bb.1:		bb.1:
Show All 26 Lines	body: \|
; GCN-LABEL: name: skip_salu_and_meta_insts_after		; GCN-LABEL: name: skip_salu_and_meta_insts_after
; GCN: bb.0:		; GCN: bb.0:
; GCN: successors: %bb.1(0x40000000), %bb.4(0x40000000)		; GCN: successors: %bb.1(0x40000000), %bb.4(0x40000000)
; GCN: [[COPY:%[0-9]+]]:sreg_64 = COPY $exec, implicit-def $exec		; GCN: [[COPY:%[0-9]+]]:sreg_64 = COPY $exec, implicit-def $exec
; GCN: [[S_AND_B64_:%[0-9]+]]:sreg_64 = S_AND_B64 [[COPY]], undef %1:sreg_64, implicit-def dead $scc		; GCN: [[S_AND_B64_:%[0-9]+]]:sreg_64 = S_AND_B64 [[COPY]], undef %1:sreg_64, implicit-def dead $scc
; GCN: $exec = S_MOV_B64_term killed [[S_AND_B64_]]		; GCN: $exec = S_MOV_B64_term killed [[S_AND_B64_]]
; GCN: S_CBRANCH_EXECZ %bb.4, implicit $exec		; GCN: S_CBRANCH_EXECZ %bb.4, implicit $exec
; GCN: bb.1:		; GCN: bb.1:
; GCN: successors: %bb.2(0x40000000), %bb.3(0x40000000)		; GCN: successors: %bb.2(0x40000000), %bb.5(0x40000000)
; GCN: [[COPY1:%[0-9]+]]:sreg_64 = COPY $exec, implicit-def $exec		; GCN: [[COPY1:%[0-9]+]]:sreg_64 = COPY $exec, implicit-def $exec
; GCN: [[S_AND_B64_1:%[0-9]+]]:sreg_64 = S_AND_B64 [[COPY1]], undef %3:sreg_64, implicit-def dead $scc		; GCN: [[S_AND_B64_1:%[0-9]+]]:sreg_64 = S_AND_B64 [[COPY1]], undef %3:sreg_64, implicit-def dead $scc
; GCN: $exec = S_MOV_B64_term killed [[S_AND_B64_1]]		; GCN: $exec = S_MOV_B64_term killed [[S_AND_B64_1]]
; GCN: S_CBRANCH_EXECZ %bb.3, implicit $exec		; GCN: S_CBRANCH_EXECZ %bb.5, implicit $exec
; GCN: bb.2:		; GCN: bb.2:
; GCN: successors: %bb.3(0x80000000)		; GCN: successors: %bb.5(0x80000000)
; GCN: bb.3:		; GCN: bb.5:
; GCN: successors: %bb.4(0x80000000)		; GCN: successors: %bb.4(0x80000000)
; GCN: [[DEF:%[0-9]+]]:sgpr_32 = IMPLICIT_DEF		; GCN: [[DEF:%[0-9]+]]:sgpr_32 = IMPLICIT_DEF
; GCN: [[S_BREV_B32_:%[0-9]+]]:sgpr_32 = S_BREV_B32 [[DEF]]		; GCN: [[S_BREV_B32_:%[0-9]+]]:sgpr_32 = S_BREV_B32 [[DEF]]
; GCN: KILL [[DEF]]		; GCN: KILL [[DEF]]
; GCN: [[COPY2:%[0-9]+]]:sgpr_32 = COPY [[S_BREV_B32_]]		; GCN: [[COPY2:%[0-9]+]]:sgpr_32 = COPY [[S_BREV_B32_]]
; GCN: bb.4:		; GCN: bb.4:
; GCN: $exec = S_OR_B64 $exec, [[COPY]], implicit-def $scc		; GCN: successors: %bb.6(0x80000000)
		; GCN: $exec = S_OR_B64_term $exec, [[COPY]], implicit-def $scc
		; GCN: bb.6:
; GCN: S_ENDPGM 0		; GCN: S_ENDPGM 0
bb.0:		bb.0:
successors: %bb.1, %bb.4		successors: %bb.1, %bb.4

%0:sreg_64 = SI_IF undef %1:sreg_64, %bb.4, implicit-def dead $exec, implicit-def dead $scc, implicit $exec		%0:sreg_64 = SI_IF undef %1:sreg_64, %bb.4, implicit-def dead $exec, implicit-def dead $scc, implicit $exec

bb.1:		bb.1:
successors: %bb.2, %bb.3		successors: %bb.2, %bb.3
Show All 33 Lines	body: \|
; GCN: successors: %bb.2(0x40000000), %bb.3(0x40000000)		; GCN: successors: %bb.2(0x40000000), %bb.3(0x40000000)
; GCN: [[COPY1:%[0-9]+]]:sreg_64 = COPY $exec, implicit-def $exec		; GCN: [[COPY1:%[0-9]+]]:sreg_64 = COPY $exec, implicit-def $exec
; GCN: [[S_AND_B64_1:%[0-9]+]]:sreg_64 = S_AND_B64 [[COPY1]], undef %3:sreg_64, implicit-def dead $scc		; GCN: [[S_AND_B64_1:%[0-9]+]]:sreg_64 = S_AND_B64 [[COPY1]], undef %3:sreg_64, implicit-def dead $scc
; GCN: $exec = S_MOV_B64_term killed [[S_AND_B64_1]]		; GCN: $exec = S_MOV_B64_term killed [[S_AND_B64_1]]
; GCN: S_CBRANCH_EXECZ %bb.3, implicit $exec		; GCN: S_CBRANCH_EXECZ %bb.3, implicit $exec
; GCN: bb.2:		; GCN: bb.2:
; GCN: successors: %bb.3(0x80000000)		; GCN: successors: %bb.3(0x80000000)
; GCN: bb.3:		; GCN: bb.3:
		; GCN: successors: %bb.5(0x80000000)
		; GCN: $exec = S_OR_B64_term $exec, [[COPY1]], implicit-def $scc
		; GCN: bb.5:
; GCN: successors: %bb.4(0x80000000)		; GCN: successors: %bb.4(0x80000000)
; GCN: $exec = S_OR_B64 $exec, [[COPY1]], implicit-def $scc
; GCN: [[S_BREV_B64_:%[0-9]+]]:sreg_64 = S_BREV_B64 $exec		; GCN: [[S_BREV_B64_:%[0-9]+]]:sreg_64 = S_BREV_B64 $exec
; GCN: bb.4:		; GCN: bb.4:
; GCN: $exec = S_OR_B64 $exec, [[COPY]], implicit-def $scc		; GCN: successors: %bb.6(0x80000000)
		; GCN: $exec = S_OR_B64_term $exec, [[COPY]], implicit-def $scc
		; GCN: bb.6:
; GCN: S_ENDPGM 0		; GCN: S_ENDPGM 0
bb.0:		bb.0:
successors: %bb.1, %bb.4		successors: %bb.1, %bb.4

%0:sreg_64 = SI_IF undef %1:sreg_64, %bb.4, implicit-def dead $exec, implicit-def dead $scc, implicit $exec		%0:sreg_64 = SI_IF undef %1:sreg_64, %bb.4, implicit-def dead $exec, implicit-def dead $scc, implicit $exec

bb.1:		bb.1:
successors: %bb.2, %bb.3		successors: %bb.2, %bb.3
Show All 31 Lines	body: \|
; GCN: [[DEF:%[0-9]+]]:vreg_128 = IMPLICIT_DEF		; GCN: [[DEF:%[0-9]+]]:vreg_128 = IMPLICIT_DEF
; GCN: [[COPY1:%[0-9]+]]:sreg_64 = COPY $exec, implicit-def $exec		; GCN: [[COPY1:%[0-9]+]]:sreg_64 = COPY $exec, implicit-def $exec
; GCN: [[S_AND_B64_1:%[0-9]+]]:sreg_64 = S_AND_B64 [[COPY1]], undef %4:sreg_64, implicit-def dead $scc		; GCN: [[S_AND_B64_1:%[0-9]+]]:sreg_64 = S_AND_B64 [[COPY1]], undef %4:sreg_64, implicit-def dead $scc
; GCN: $exec = S_MOV_B64_term killed [[S_AND_B64_1]]		; GCN: $exec = S_MOV_B64_term killed [[S_AND_B64_1]]
; GCN: S_CBRANCH_EXECZ %bb.3, implicit $exec		; GCN: S_CBRANCH_EXECZ %bb.3, implicit $exec
; GCN: bb.2:		; GCN: bb.2:
; GCN: successors: %bb.3(0x80000000)		; GCN: successors: %bb.3(0x80000000)
; GCN: bb.3:		; GCN: bb.3:
		; GCN: successors: %bb.5(0x80000000)
		; GCN: $exec = S_OR_B64_term $exec, [[COPY1]], implicit-def $scc
		; GCN: bb.5:
; GCN: successors: %bb.4(0x80000000)		; GCN: successors: %bb.4(0x80000000)
; GCN: $exec = S_OR_B64 $exec, [[COPY1]], implicit-def $scc
; GCN: [[COPY2:%[0-9]+]]:vgpr_32 = COPY [[DEF]].sub2		; GCN: [[COPY2:%[0-9]+]]:vgpr_32 = COPY [[DEF]].sub2
; GCN: bb.4:		; GCN: bb.4:
; GCN: $exec = S_OR_B64 $exec, [[COPY]], implicit-def $scc		; GCN: successors: %bb.6(0x80000000)
		; GCN: $exec = S_OR_B64_term $exec, [[COPY]], implicit-def $scc
		; GCN: bb.6:
; GCN: S_ENDPGM 0		; GCN: S_ENDPGM 0
bb.0:		bb.0:
successors: %bb.1, %bb.4		successors: %bb.1, %bb.4

%0:sreg_64 = SI_IF undef %1:sreg_64, %bb.4, implicit-def dead $exec, implicit-def dead $scc, implicit $exec		%0:sreg_64 = SI_IF undef %1:sreg_64, %bb.4, implicit-def dead $exec, implicit-def dead $scc, implicit $exec

bb.1:		bb.1:
successors: %bb.2, %bb.3		successors: %bb.2, %bb.3
Show All 22 Lines	body: \|
; GCN-LABEL: name: simple_nested_if_not_layout_successor		; GCN-LABEL: name: simple_nested_if_not_layout_successor
; GCN: bb.0:		; GCN: bb.0:
; GCN: successors: %bb.1(0x40000000), %bb.4(0x40000000)		; GCN: successors: %bb.1(0x40000000), %bb.4(0x40000000)
; GCN: [[COPY:%[0-9]+]]:sreg_64 = COPY $exec, implicit-def $exec		; GCN: [[COPY:%[0-9]+]]:sreg_64 = COPY $exec, implicit-def $exec
; GCN: [[S_AND_B64_:%[0-9]+]]:sreg_64 = S_AND_B64 [[COPY]], undef %1:sreg_64, implicit-def dead $scc		; GCN: [[S_AND_B64_:%[0-9]+]]:sreg_64 = S_AND_B64 [[COPY]], undef %1:sreg_64, implicit-def dead $scc
; GCN: $exec = S_MOV_B64_term killed [[S_AND_B64_]]		; GCN: $exec = S_MOV_B64_term killed [[S_AND_B64_]]
; GCN: S_CBRANCH_EXECZ %bb.4, implicit $exec		; GCN: S_CBRANCH_EXECZ %bb.4, implicit $exec
; GCN: bb.1:		; GCN: bb.1:
; GCN: successors: %bb.2(0x40000000), %bb.5(0x40000000)		; GCN: successors: %bb.2(0x40000000), %bb.6(0x40000000)
; GCN: [[COPY1:%[0-9]+]]:sreg_64 = COPY $exec, implicit-def $exec		; GCN: [[COPY1:%[0-9]+]]:sreg_64 = COPY $exec, implicit-def $exec
; GCN: [[S_AND_B64_1:%[0-9]+]]:sreg_64 = S_AND_B64 [[COPY1]], undef %3:sreg_64, implicit-def dead $scc		; GCN: [[S_AND_B64_1:%[0-9]+]]:sreg_64 = S_AND_B64 [[COPY1]], undef %3:sreg_64, implicit-def dead $scc
; GCN: $exec = S_MOV_B64_term killed [[S_AND_B64_1]]		; GCN: $exec = S_MOV_B64_term killed [[S_AND_B64_1]]
; GCN: S_CBRANCH_EXECZ %bb.5, implicit $exec		; GCN: S_CBRANCH_EXECZ %bb.6, implicit $exec
; GCN: bb.2:		; GCN: bb.2:
		; GCN: successors: %bb.6(0x80000000)
		; GCN: bb.6:
; GCN: successors: %bb.5(0x80000000)		; GCN: successors: %bb.5(0x80000000)
		; GCN: S_BRANCH %bb.5
		; GCN: bb.4:
		; GCN: successors: %bb.7(0x80000000)
		; GCN: $exec = S_OR_B64_term $exec, [[COPY]], implicit-def $scc
		; GCN: bb.7:
		; GCN: S_ENDPGM 0
; GCN: bb.5:		; GCN: bb.5:
; GCN: successors: %bb.4(0x80000000)		; GCN: successors: %bb.4(0x80000000)
; GCN: S_BRANCH %bb.4		; GCN: S_BRANCH %bb.4
; GCN: bb.4:
; GCN: $exec = S_OR_B64 $exec, [[COPY]], implicit-def $scc
; GCN: S_ENDPGM 0
bb.0:		bb.0:
successors: %bb.1, %bb.4		successors: %bb.1, %bb.4

%0:sreg_64 = SI_IF undef %1:sreg_64, %bb.4, implicit-def dead $exec, implicit-def dead $scc, implicit $exec		%0:sreg_64 = SI_IF undef %1:sreg_64, %bb.4, implicit-def dead $exec, implicit-def dead $scc, implicit $exec

bb.1:		bb.1:
successors: %bb.2, %bb.3		successors: %bb.2, %bb.3

Show All 26 Lines
body: \|		body: \|
; GCN-LABEL: name: resursive_endcf		; GCN-LABEL: name: resursive_endcf
; GCN: bb.0:		; GCN: bb.0:
; GCN: successors: %bb.1(0x80000000)		; GCN: successors: %bb.1(0x80000000)
; GCN: liveins: $vgpr0		; GCN: liveins: $vgpr0
; GCN: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0		; GCN: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
; GCN: [[V_CMP_LT_U32_e64_:%[0-9]+]]:sreg_64 = V_CMP_LT_U32_e64 1, [[COPY]], implicit $exec		; GCN: [[V_CMP_LT_U32_e64_:%[0-9]+]]:sreg_64 = V_CMP_LT_U32_e64 1, [[COPY]], implicit $exec
; GCN: bb.1:		; GCN: bb.1:
		; GCN: successors: %bb.2(0x80000000)
		; GCN: $exec = S_OR_B64_term $exec, [[V_CMP_LT_U32_e64_]], implicit-def $scc
		; GCN: bb.2:
; GCN: successors: %bb.1(0x80000000)		; GCN: successors: %bb.1(0x80000000)
; GCN: $exec = S_OR_B64 $exec, [[V_CMP_LT_U32_e64_]], implicit-def $scc
; GCN: S_BRANCH %bb.1		; GCN: S_BRANCH %bb.1
bb.0:		bb.0:
successors: %bb.1		successors: %bb.1
liveins: $vgpr0		liveins: $vgpr0

%0:vgpr_32 = COPY $vgpr0		%0:vgpr_32 = COPY $vgpr0
%2:sreg_64 = V_CMP_LT_U32_e64 1, %0, implicit $exec		%2:sreg_64 = V_CMP_LT_U32_e64 1, %0, implicit $exec

Show All 34 Lines	body: \|
; GCN: [[COPY1:%[0-9]+]]:sreg_64 = COPY $exec, implicit-def $exec		; GCN: [[COPY1:%[0-9]+]]:sreg_64 = COPY $exec, implicit-def $exec
; GCN: [[S_AND_B64_1:%[0-9]+]]:sreg_64 = S_AND_B64 [[COPY1]], undef %4:sreg_64, implicit-def dead $scc		; GCN: [[S_AND_B64_1:%[0-9]+]]:sreg_64 = S_AND_B64 [[COPY1]], undef %4:sreg_64, implicit-def dead $scc
; GCN: $exec = S_MOV_B64_term killed [[S_AND_B64_1]]		; GCN: $exec = S_MOV_B64_term killed [[S_AND_B64_1]]
; GCN: S_CBRANCH_EXECZ %bb.3, implicit $exec		; GCN: S_CBRANCH_EXECZ %bb.3, implicit $exec
; GCN: bb.4:		; GCN: bb.4:
; GCN: successors: %bb.5(0x80000000)		; GCN: successors: %bb.5(0x80000000)
; GCN: bb.5:		; GCN: bb.5:
; GCN: successors: %bb.6(0x80000000)		; GCN: successors: %bb.6(0x80000000)
; GCN: $exec = S_OR_B64 $exec, [[COPY1]], implicit-def $scc		; GCN: $exec = S_OR_B64_term $exec, [[COPY1]], implicit-def $scc
; GCN: bb.6:		; GCN: bb.6:
; GCN: $exec = S_OR_B64 $exec, [[S_OR_SAVEEXEC_B64_]], implicit-def $scc		; GCN: successors: %bb.7(0x80000000)
		; GCN: $exec = S_OR_B64_term $exec, [[S_OR_SAVEEXEC_B64_]], implicit-def $scc
		; GCN: bb.7:
; GCN: S_ENDPGM 0		; GCN: S_ENDPGM 0
bb.0:		bb.0:
successors: %bb.1, %bb.2		successors: %bb.1, %bb.2

%0:sreg_64 = SI_IF undef %1:sreg_64, %bb.2, implicit-def dead $exec, implicit-def dead $scc, implicit $exec		%0:sreg_64 = SI_IF undef %1:sreg_64, %bb.2, implicit-def dead $exec, implicit-def dead $scc, implicit $exec

bb.1:		bb.1:
successors: %bb.2		successors: %bb.2
Show All 38 Lines	body: \|
; GCN: [[S_AND_B64_:%[0-9]+]]:sreg_64 = S_AND_B64 [[COPY]], undef %1:sreg_64, implicit-def dead $scc		; GCN: [[S_AND_B64_:%[0-9]+]]:sreg_64 = S_AND_B64 [[COPY]], undef %1:sreg_64, implicit-def dead $scc
; GCN: $exec = S_MOV_B64_term killed [[S_AND_B64_]]		; GCN: $exec = S_MOV_B64_term killed [[S_AND_B64_]]
; GCN: S_CBRANCH_EXECZ %bb.3, implicit $exec		; GCN: S_CBRANCH_EXECZ %bb.3, implicit $exec
; GCN: bb.2:		; GCN: bb.2:
; GCN: successors: %bb.6(0x80000000)		; GCN: successors: %bb.6(0x80000000)
; GCN: S_BRANCH %bb.6		; GCN: S_BRANCH %bb.6
; GCN: bb.3:		; GCN: bb.3:
; GCN: successors: %bb.4(0x80000000)		; GCN: successors: %bb.4(0x80000000)
; GCN: $exec = S_OR_B64 $exec, [[COPY]], implicit-def $scc		; GCN: $exec = S_OR_B64_term $exec, [[COPY]], implicit-def $scc
; GCN: bb.4:		; GCN: bb.4:
; GCN: successors: %bb.5(0x80000000)		; GCN: successors: %bb.5(0x80000000)
; GCN: $exec = S_OR_B64 $exec, %2, implicit-def $scc		; GCN: $exec = S_OR_B64_term $exec, %2, implicit-def $scc
; GCN: bb.5:		; GCN: bb.5:
; GCN: successors: %bb.6(0x80000000)		; GCN: successors: %bb.6(0x80000000)
; GCN: bb.6:		; GCN: bb.6:
; GCN: successors: %bb.4(0x40000000), %bb.0(0x40000000)		; GCN: successors: %bb.4(0x40000000), %bb.0(0x40000000)
; GCN: [[COPY1:%[0-9]+]]:sreg_64 = COPY $exec, implicit-def $exec		; GCN: [[COPY1:%[0-9]+]]:sreg_64 = COPY $exec, implicit-def $exec
; GCN: [[S_AND_B64_1:%[0-9]+]]:sreg_64 = S_AND_B64 [[COPY1]], undef %3:sreg_64, implicit-def dead $scc		; GCN: [[S_AND_B64_1:%[0-9]+]]:sreg_64 = S_AND_B64 [[COPY1]], undef %3:sreg_64, implicit-def dead $scc
; GCN: [[S_XOR_B64_:%[0-9]+]]:sreg_64 = S_XOR_B64 [[S_AND_B64_1]], [[COPY1]], implicit-def dead $scc		; GCN: [[S_XOR_B64_:%[0-9]+]]:sreg_64 = S_XOR_B64 [[S_AND_B64_1]], [[COPY1]], implicit-def dead $scc
; GCN: $exec = S_MOV_B64_term killed [[S_AND_B64_1]]		; GCN: $exec = S_MOV_B64_term killed [[S_AND_B64_1]]
Show All 26 Lines

llvm/test/CodeGen/AMDGPU/multilevel-break.ll

	Show First 20 Lines • Show All 45 Lines • ▼ Show 20 Lines
	;			;
	; GCN-LABEL: multi_else_break:			; GCN-LABEL: multi_else_break:
	; GCN: ; %bb.0: ; %main_body			; GCN: ; %bb.0: ; %main_body
	; GCN-NEXT: s_mov_b64 s[0:1], 0			; GCN-NEXT: s_mov_b64 s[0:1], 0
	; GCN-NEXT: v_mov_b32_e32 v0, 0			; GCN-NEXT: v_mov_b32_e32 v0, 0
	; GCN-NEXT: s_branch BB0_2			; GCN-NEXT: s_branch BB0_2
	; GCN-NEXT: BB0_1: ; %loop.exit.guard			; GCN-NEXT: BB0_1: ; %loop.exit.guard
	; GCN-NEXT: ; in Loop: Header=BB0_2 Depth=1			; GCN-NEXT: ; in Loop: Header=BB0_2 Depth=1
	; GCN-NEXT: s_or_b64 exec, exec, s[4:5]			; GCN-NEXT: s_and_b64 s[4:5], exec, s[4:5]
	; GCN-NEXT: s_and_b64 s[2:3], exec, s[2:3]			; GCN-NEXT: s_or_b64 s[0:1], s[4:5], s[0:1]
	; GCN-NEXT: s_or_b64 s[0:1], s[2:3], s[0:1]			; GCN-NEXT: s_or_b64 exec, exec, s[2:3]
	; GCN-NEXT: s_andn2_b64 exec, exec, s[0:1]			; GCN-NEXT: s_andn2_b64 exec, exec, s[0:1]
	; GCN-NEXT: s_cbranch_execz BB0_6			; GCN-NEXT: s_cbranch_execz BB0_6
	; GCN-NEXT: BB0_2: ; %LOOP.outer			; GCN-NEXT: BB0_2: ; %LOOP.outer
	; GCN-NEXT: ; =>This Loop Header: Depth=1			; GCN-NEXT: ; =>This Loop Header: Depth=1
	; GCN-NEXT: ; Child Loop BB0_4 Depth 2			; GCN-NEXT: ; Child Loop BB0_4 Depth 2
	; GCN-NEXT: ; implicit-def: $sgpr6_sgpr7			; GCN-NEXT: ; implicit-def: $sgpr6_sgpr7
	; GCN-NEXT: ; implicit-def: $sgpr2_sgpr3			; GCN-NEXT: ; implicit-def: $sgpr4_sgpr5
	; GCN-NEXT: s_mov_b64 s[4:5], 0			; GCN-NEXT: s_mov_b64 s[2:3], 0
	; GCN-NEXT: s_branch BB0_4			; GCN-NEXT: s_branch BB0_4
	; GCN-NEXT: BB0_3: ; %Flow			; GCN-NEXT: BB0_3: ; %Flow
	; GCN-NEXT: ; in Loop: Header=BB0_4 Depth=2			; GCN-NEXT: ; in Loop: Header=BB0_4 Depth=2
	; GCN-NEXT: s_or_b64 exec, exec, s[8:9]			; GCN-NEXT: s_or_b64 exec, exec, s[8:9]
	; GCN-NEXT: s_and_b64 s[8:9], exec, s[6:7]			; GCN-NEXT: s_and_b64 s[8:9], exec, s[6:7]
	; GCN-NEXT: s_or_b64 s[4:5], s[8:9], s[4:5]			; GCN-NEXT: s_or_b64 s[2:3], s[8:9], s[2:3]
	; GCN-NEXT: s_andn2_b64 exec, exec, s[4:5]			; GCN-NEXT: s_andn2_b64 exec, exec, s[2:3]
	; GCN-NEXT: s_cbranch_execz BB0_1			; GCN-NEXT: s_cbranch_execz BB0_1
	; GCN-NEXT: BB0_4: ; %LOOP			; GCN-NEXT: BB0_4: ; %LOOP
	; GCN-NEXT: ; Parent Loop BB0_2 Depth=1			; GCN-NEXT: ; Parent Loop BB0_2 Depth=1
	; GCN-NEXT: ; => This Inner Loop Header: Depth=2			; GCN-NEXT: ; => This Inner Loop Header: Depth=2
	; GCN-NEXT: v_mov_b32_e32 v1, v0			; GCN-NEXT: v_mov_b32_e32 v1, v0
	; GCN-NEXT: v_add_i32_e32 v0, vcc, 1, v1			; GCN-NEXT: v_add_i32_e32 v0, vcc, 1, v1
	; GCN-NEXT: v_cmp_lt_i32_e32 vcc, v1, v4			; GCN-NEXT: v_cmp_lt_i32_e32 vcc, v1, v4
	; GCN-NEXT: s_or_b64 s[2:3], s[2:3], exec			; GCN-NEXT: s_or_b64 s[4:5], s[4:5], exec
	; GCN-NEXT: s_or_b64 s[6:7], s[6:7], exec			; GCN-NEXT: s_or_b64 s[6:7], s[6:7], exec
	; GCN-NEXT: s_and_saveexec_b64 s[8:9], vcc			; GCN-NEXT: s_and_saveexec_b64 s[8:9], vcc
	; GCN-NEXT: s_cbranch_execz BB0_3			; GCN-NEXT: s_cbranch_execz BB0_3
	; GCN-NEXT: ; %bb.5: ; %ENDIF			; GCN-NEXT: ; %bb.5: ; %ENDIF
	; GCN-NEXT: ; in Loop: Header=BB0_4 Depth=2			; GCN-NEXT: ; in Loop: Header=BB0_4 Depth=2
	; GCN-NEXT: v_cmp_ne_u32_e32 vcc, v5, v0			; GCN-NEXT: v_cmp_ne_u32_e32 vcc, v5, v0
	; GCN-NEXT: s_andn2_b64 s[2:3], s[2:3], exec			; GCN-NEXT: s_andn2_b64 s[4:5], s[4:5], exec
	; GCN-NEXT: s_andn2_b64 s[6:7], s[6:7], exec			; GCN-NEXT: s_andn2_b64 s[6:7], s[6:7], exec
	; GCN-NEXT: s_and_b64 s[10:11], vcc, exec			; GCN-NEXT: s_and_b64 s[10:11], vcc, exec
	; GCN-NEXT: s_or_b64 s[6:7], s[6:7], s[10:11]			; GCN-NEXT: s_or_b64 s[6:7], s[6:7], s[10:11]
	; GCN-NEXT: s_branch BB0_3			; GCN-NEXT: s_branch BB0_3
	; GCN-NEXT: BB0_6: ; %IF			; GCN-NEXT: BB0_6: ; %IF
	; GCN-NEXT: s_endpgm			; GCN-NEXT: s_endpgm
	main_body:			main_body:
	br label %LOOP.outer			br label %LOOP.outer
	▲ Show 20 Lines • Show All 79 Lines • ▼ Show 20 Lines
	; OPT: bb9:			; OPT: bb9:
	; OPT-NEXT: call void @llvm.amdgcn.end.cf.i64(i64 [[TMP16]])			; OPT-NEXT: call void @llvm.amdgcn.end.cf.i64(i64 [[TMP16]])
	; OPT-NEXT: ret void			; OPT-NEXT: ret void
	;			;
	; GCN-LABEL: multi_if_break_loop:			; GCN-LABEL: multi_if_break_loop:
	; GCN: ; %bb.0: ; %bb			; GCN: ; %bb.0: ; %bb
	; GCN-NEXT: s_load_dword s2, s[0:1], 0x9			; GCN-NEXT: s_load_dword s2, s[0:1], 0x9
	; GCN-NEXT: s_mov_b64 s[0:1], 0			; GCN-NEXT: s_mov_b64 s[0:1], 0
	; GCN-NEXT: s_mov_b32 s3, 0xf000			; GCN-NEXT: s_mov_b32 s7, 0xf000
	; GCN-NEXT: s_waitcnt lgkmcnt(0)			; GCN-NEXT: s_waitcnt lgkmcnt(0)
	; GCN-NEXT: v_subrev_i32_e32 v0, vcc, s2, v0			; GCN-NEXT: v_subrev_i32_e32 v0, vcc, s2, v0
	; GCN-NEXT: s_mov_b32 s2, -1			; GCN-NEXT: s_mov_b32 s6, -1
	; GCN-NEXT: ; implicit-def: $sgpr4_sgpr5			; GCN-NEXT: ; implicit-def: $sgpr2_sgpr3
	; GCN-NEXT: s_branch BB1_2			; GCN-NEXT: s_branch BB1_2
	; GCN-NEXT: BB1_1: ; %Flow4			; GCN-NEXT: BB1_1: ; %Flow4
	; GCN-NEXT: ; in Loop: Header=BB1_2 Depth=1			; GCN-NEXT: ; in Loop: Header=BB1_2 Depth=1
	; GCN-NEXT: s_and_b64 s[6:7], exec, s[6:7]			; GCN-NEXT: s_and_b64 s[4:5], exec, s[4:5]
	; GCN-NEXT: s_or_b64 s[0:1], s[6:7], s[0:1]			; GCN-NEXT: s_or_b64 s[0:1], s[4:5], s[0:1]
	; GCN-NEXT: s_andn2_b64 s[4:5], s[4:5], exec			; GCN-NEXT: s_andn2_b64 s[2:3], s[2:3], exec
	; GCN-NEXT: s_and_b64 s[6:7], s[8:9], exec			; GCN-NEXT: s_and_b64 s[4:5], s[8:9], exec
	; GCN-NEXT: s_or_b64 s[4:5], s[4:5], s[6:7]			; GCN-NEXT: s_or_b64 s[2:3], s[2:3], s[4:5]
	; GCN-NEXT: s_andn2_b64 exec, exec, s[0:1]			; GCN-NEXT: s_andn2_b64 exec, exec, s[0:1]
	; GCN-NEXT: s_cbranch_execz BB1_9			; GCN-NEXT: s_cbranch_execz BB1_9
	; GCN-NEXT: BB1_2: ; %bb1			; GCN-NEXT: BB1_2: ; %bb1
	; GCN-NEXT: ; =>This Inner Loop Header: Depth=1			; GCN-NEXT: ; =>This Inner Loop Header: Depth=1
	; GCN-NEXT: buffer_load_dword v1, off, s[0:3], 0			; GCN-NEXT: buffer_load_dword v1, off, s[4:7], 0
	; GCN-NEXT: s_waitcnt vmcnt(0)			; GCN-NEXT: s_waitcnt vmcnt(0)
	; GCN-NEXT: v_cmp_gt_i32_e32 vcc, 1, v1			; GCN-NEXT: v_cmp_gt_i32_e32 vcc, 1, v1
	; GCN-NEXT: s_mov_b64 s[6:7], -1			; GCN-NEXT: s_mov_b64 s[4:5], -1
	; GCN-NEXT: s_and_b64 vcc, exec, vcc			; GCN-NEXT: s_and_b64 vcc, exec, vcc
	; GCN-NEXT: ; implicit-def: $sgpr8_sgpr9			; GCN-NEXT: ; implicit-def: $sgpr8_sgpr9
	; GCN-NEXT: s_mov_b64 s[10:11], -1			; GCN-NEXT: s_mov_b64 s[10:11], -1
	; GCN-NEXT: s_cbranch_vccnz BB1_6			; GCN-NEXT: s_cbranch_vccnz BB1_6
	; GCN-NEXT: ; %bb.3: ; %LeafBlock1			; GCN-NEXT: ; %bb.3: ; %LeafBlock1
	; GCN-NEXT: ; in Loop: Header=BB1_2 Depth=1			; GCN-NEXT: ; in Loop: Header=BB1_2 Depth=1
	; GCN-NEXT: s_mov_b64 s[6:7], -1			; GCN-NEXT: s_mov_b64 s[4:5], -1
	; GCN-NEXT: v_cmp_eq_u32_e32 vcc, 1, v1			; GCN-NEXT: v_cmp_eq_u32_e32 vcc, 1, v1
	; GCN-NEXT: s_and_b64 vcc, exec, vcc			; GCN-NEXT: s_and_b64 vcc, exec, vcc
	; GCN-NEXT: s_mov_b64 s[8:9], -1			; GCN-NEXT: s_mov_b64 s[8:9], -1
	; GCN-NEXT: s_cbranch_vccz BB1_5			; GCN-NEXT: s_cbranch_vccz BB1_5
	; GCN-NEXT: ; %bb.4: ; %case1			; GCN-NEXT: ; %bb.4: ; %case1
	; GCN-NEXT: ; in Loop: Header=BB1_2 Depth=1			; GCN-NEXT: ; in Loop: Header=BB1_2 Depth=1
	; GCN-NEXT: buffer_load_dword v2, off, s[0:3], 0			; GCN-NEXT: buffer_load_dword v2, off, s[4:7], 0
	; GCN-NEXT: s_waitcnt vmcnt(0)			; GCN-NEXT: s_waitcnt vmcnt(0)
	; GCN-NEXT: v_cmp_ge_i32_e32 vcc, v0, v2			; GCN-NEXT: v_cmp_ge_i32_e32 vcc, v0, v2
	; GCN-NEXT: s_mov_b64 s[8:9], 0			; GCN-NEXT: s_mov_b64 s[8:9], 0
	; GCN-NEXT: s_orn2_b64 s[6:7], vcc, exec			; GCN-NEXT: s_orn2_b64 s[4:5], vcc, exec
	; GCN-NEXT: BB1_5: ; %Flow3			; GCN-NEXT: BB1_5: ; %Flow3
	; GCN-NEXT: ; in Loop: Header=BB1_2 Depth=1			; GCN-NEXT: ; in Loop: Header=BB1_2 Depth=1
	; GCN-NEXT: s_mov_b64 s[10:11], 0			; GCN-NEXT: s_mov_b64 s[10:11], 0
	; GCN-NEXT: BB1_6: ; %Flow			; GCN-NEXT: BB1_6: ; %Flow
	; GCN-NEXT: ; in Loop: Header=BB1_2 Depth=1			; GCN-NEXT: ; in Loop: Header=BB1_2 Depth=1
	; GCN-NEXT: s_and_b64 vcc, exec, s[10:11]			; GCN-NEXT: s_and_b64 vcc, exec, s[10:11]
	; GCN-NEXT: s_cbranch_vccz BB1_1			; GCN-NEXT: s_cbranch_vccz BB1_1
	; GCN-NEXT: ; %bb.7: ; %LeafBlock			; GCN-NEXT: ; %bb.7: ; %LeafBlock
	; GCN-NEXT: ; in Loop: Header=BB1_2 Depth=1			; GCN-NEXT: ; in Loop: Header=BB1_2 Depth=1
	; GCN-NEXT: v_cmp_eq_u32_e32 vcc, 0, v1			; GCN-NEXT: v_cmp_eq_u32_e32 vcc, 0, v1
	; GCN-NEXT: s_and_b64 vcc, exec, vcc			; GCN-NEXT: s_and_b64 vcc, exec, vcc
	; GCN-NEXT: s_mov_b64 s[8:9], -1			; GCN-NEXT: s_mov_b64 s[8:9], -1
	; GCN-NEXT: s_cbranch_vccz BB1_1			; GCN-NEXT: s_cbranch_vccz BB1_1
	; GCN-NEXT: ; %bb.8: ; %case0			; GCN-NEXT: ; %bb.8: ; %case0
	; GCN-NEXT: ; in Loop: Header=BB1_2 Depth=1			; GCN-NEXT: ; in Loop: Header=BB1_2 Depth=1
	; GCN-NEXT: buffer_load_dword v1, off, s[0:3], 0			; GCN-NEXT: buffer_load_dword v1, off, s[4:7], 0
	; GCN-NEXT: s_mov_b64 s[8:9], 0			; GCN-NEXT: s_mov_b64 s[8:9], 0
	; GCN-NEXT: s_waitcnt vmcnt(0)			; GCN-NEXT: s_waitcnt vmcnt(0)
	; GCN-NEXT: v_cmp_ge_i32_e32 vcc, v0, v1			; GCN-NEXT: v_cmp_ge_i32_e32 vcc, v0, v1
	; GCN-NEXT: s_andn2_b64 s[6:7], s[6:7], exec			; GCN-NEXT: s_andn2_b64 s[4:5], s[4:5], exec
	; GCN-NEXT: s_and_b64 s[10:11], vcc, exec			; GCN-NEXT: s_and_b64 s[10:11], vcc, exec
	; GCN-NEXT: s_or_b64 s[6:7], s[6:7], s[10:11]			; GCN-NEXT: s_or_b64 s[4:5], s[4:5], s[10:11]
	; GCN-NEXT: s_branch BB1_1			; GCN-NEXT: s_branch BB1_1
	; GCN-NEXT: BB1_9: ; %loop.exit.guard			; GCN-NEXT: BB1_9: ; %loop.exit.guard
	; GCN-NEXT: s_or_b64 exec, exec, s[0:1]			; GCN-NEXT: s_or_b64 exec, exec, s[0:1]
	; GCN-NEXT: s_and_saveexec_b64 s[0:1], s[4:5]			; GCN-NEXT: s_and_saveexec_b64 s[0:1], s[2:3]
	; GCN-NEXT: s_xor_b64 s[0:1], exec, s[0:1]			; GCN-NEXT: s_xor_b64 s[0:1], exec, s[0:1]
	; GCN-NEXT: s_endpgm			; GCN-NEXT: s_endpgm
	bb:			bb:
	%id = call i32 @llvm.amdgcn.workitem.id.x()			%id = call i32 @llvm.amdgcn.workitem.id.x()
	%tmp = sub i32 %id, %arg			%tmp = sub i32 %id, %arg
	br label %bb1			br label %bb1

	bb1:			bb1:
	Show All 27 Lines

llvm/test/CodeGen/AMDGPU/sdiv64.ll

	Show First 20 Lines • Show All 405 Lines • ▼ Show 20 Lines
	; GCN-IR-NEXT: v_ffbh_u32_e32 v7, v3			; GCN-IR-NEXT: v_ffbh_u32_e32 v7, v3
	; GCN-IR-NEXT: v_cmp_eq_u32_e32 vcc, 0, v3			; GCN-IR-NEXT: v_cmp_eq_u32_e32 vcc, 0, v3
	; GCN-IR-NEXT: v_cndmask_b32_e32 v13, v7, v0, vcc			; GCN-IR-NEXT: v_cndmask_b32_e32 v13, v7, v0, vcc
	; GCN-IR-NEXT: v_ffbh_u32_e32 v0, v9			; GCN-IR-NEXT: v_ffbh_u32_e32 v0, v9
	; GCN-IR-NEXT: v_add_i32_e32 v0, vcc, 32, v0			; GCN-IR-NEXT: v_add_i32_e32 v0, vcc, 32, v0
	; GCN-IR-NEXT: v_ffbh_u32_e32 v7, v10			; GCN-IR-NEXT: v_ffbh_u32_e32 v7, v10
	; GCN-IR-NEXT: v_cmp_eq_u32_e32 vcc, 0, v10			; GCN-IR-NEXT: v_cmp_eq_u32_e32 vcc, 0, v10
	; GCN-IR-NEXT: v_cndmask_b32_e32 v14, v7, v0, vcc			; GCN-IR-NEXT: v_cndmask_b32_e32 v14, v7, v0, vcc
	; GCN-IR-NEXT: v_sub_i32_e32 v7, vcc, v13, v14			; GCN-IR-NEXT: v_sub_i32_e32 v11, vcc, v13, v14
	; GCN-IR-NEXT: v_subb_u32_e64 v8, s[4:5], 0, 0, vcc			; GCN-IR-NEXT: v_subb_u32_e64 v12, s[4:5], 0, 0, vcc
	; GCN-IR-NEXT: v_cmp_lt_u64_e32 vcc, 63, v[7:8]			; GCN-IR-NEXT: v_cmp_lt_u64_e32 vcc, 63, v[11:12]
	; GCN-IR-NEXT: v_cmp_ne_u64_e64 s[4:5], 63, v[7:8]			; GCN-IR-NEXT: v_cmp_ne_u64_e64 s[4:5], 63, v[11:12]
	; GCN-IR-NEXT: s_or_b64 s[6:7], s[6:7], vcc			; GCN-IR-NEXT: s_or_b64 s[6:7], s[6:7], vcc
	; GCN-IR-NEXT: s_xor_b64 s[8:9], s[6:7], -1			; GCN-IR-NEXT: s_xor_b64 s[8:9], s[6:7], -1
	; GCN-IR-NEXT: v_mov_b32_e32 v18, 0			; GCN-IR-NEXT: v_mov_b32_e32 v18, 0
	; GCN-IR-NEXT: v_mov_b32_e32 v6, v4			; GCN-IR-NEXT: v_mov_b32_e32 v6, v4
	; GCN-IR-NEXT: v_mov_b32_e32 v1, v5			; GCN-IR-NEXT: v_mov_b32_e32 v1, v5
	; GCN-IR-NEXT: v_cndmask_b32_e64 v12, v10, 0, s[6:7]			; GCN-IR-NEXT: v_cndmask_b32_e64 v7, v10, 0, s[6:7]
	; GCN-IR-NEXT: s_and_b64 s[4:5], s[8:9], s[4:5]			; GCN-IR-NEXT: s_and_b64 s[4:5], s[8:9], s[4:5]
	; GCN-IR-NEXT: v_mov_b32_e32 v15, v18			; GCN-IR-NEXT: v_mov_b32_e32 v15, v18
	; GCN-IR-NEXT: v_cndmask_b32_e64 v0, v9, 0, s[6:7]			; GCN-IR-NEXT: v_cndmask_b32_e64 v0, v9, 0, s[6:7]
	; GCN-IR-NEXT: s_and_saveexec_b64 s[6:7], s[4:5]			; GCN-IR-NEXT: s_and_saveexec_b64 s[6:7], s[4:5]
	; GCN-IR-NEXT: s_cbranch_execz BB1_6			; GCN-IR-NEXT: s_cbranch_execz BB1_6
	; GCN-IR-NEXT: ; %bb.1: ; %udiv-bb1			; GCN-IR-NEXT: ; %bb.1: ; %udiv-bb1
	; GCN-IR-NEXT: v_add_i32_e32 v16, vcc, 1, v7			; GCN-IR-NEXT: v_add_i32_e32 v16, vcc, 1, v11
	; GCN-IR-NEXT: v_addc_u32_e32 v17, vcc, 0, v8, vcc			; GCN-IR-NEXT: v_addc_u32_e32 v17, vcc, 0, v12, vcc
	; GCN-IR-NEXT: v_sub_i32_e64 v0, s[4:5], 63, v7			; GCN-IR-NEXT: v_sub_i32_e64 v0, s[4:5], 63, v11
	; GCN-IR-NEXT: v_cmp_ge_u64_e32 vcc, v[16:17], v[7:8]			; GCN-IR-NEXT: v_cmp_ge_u64_e32 vcc, v[16:17], v[11:12]
	; GCN-IR-NEXT: v_mov_b32_e32 v11, 0			; GCN-IR-NEXT: v_mov_b32_e32 v11, 0
	; GCN-IR-NEXT: v_lshl_b64 v[7:8], v[9:10], v0			; GCN-IR-NEXT: v_lshl_b64 v[7:8], v[9:10], v0
	; GCN-IR-NEXT: s_mov_b64 s[8:9], 0			; GCN-IR-NEXT: s_mov_b64 s[10:11], 0
	; GCN-IR-NEXT: v_mov_b32_e32 v12, 0			; GCN-IR-NEXT: v_mov_b32_e32 v12, 0
	; GCN-IR-NEXT: s_and_saveexec_b64 s[4:5], vcc			; GCN-IR-NEXT: s_and_saveexec_b64 s[4:5], vcc
	; GCN-IR-NEXT: s_xor_b64 s[10:11], exec, s[4:5]			; GCN-IR-NEXT: s_xor_b64 s[8:9], exec, s[4:5]
	; GCN-IR-NEXT: s_cbranch_execz BB1_5			; GCN-IR-NEXT: s_cbranch_execz BB1_5
	; GCN-IR-NEXT: ; %bb.2: ; %udiv-preheader			; GCN-IR-NEXT: ; %bb.2: ; %udiv-preheader
	; GCN-IR-NEXT: v_add_i32_e32 v0, vcc, -1, v2			; GCN-IR-NEXT: v_add_i32_e32 v0, vcc, -1, v2
	; GCN-IR-NEXT: v_lshr_b64 v[16:17], v[9:10], v16			; GCN-IR-NEXT: v_lshr_b64 v[16:17], v[9:10], v16
	; GCN-IR-NEXT: v_addc_u32_e32 v9, vcc, -1, v3, vcc			; GCN-IR-NEXT: v_addc_u32_e32 v9, vcc, -1, v3, vcc
	; GCN-IR-NEXT: v_not_b32_e32 v10, v13			; GCN-IR-NEXT: v_not_b32_e32 v10, v13
	; GCN-IR-NEXT: v_not_b32_e32 v11, v18			; GCN-IR-NEXT: v_not_b32_e32 v11, v18
	; GCN-IR-NEXT: v_add_i32_e32 v13, vcc, v10, v14			; GCN-IR-NEXT: v_add_i32_e32 v13, vcc, v10, v14
	Show All 18 Lines
	; GCN-IR-NEXT: v_mov_b32_e32 v12, 0			; GCN-IR-NEXT: v_mov_b32_e32 v12, 0
	; GCN-IR-NEXT: v_and_b32_e32 v11, 1, v15			; GCN-IR-NEXT: v_and_b32_e32 v11, 1, v15
	; GCN-IR-NEXT: v_and_b32_e32 v20, v15, v3			; GCN-IR-NEXT: v_and_b32_e32 v20, v15, v3
	; GCN-IR-NEXT: v_and_b32_e32 v15, v15, v2			; GCN-IR-NEXT: v_and_b32_e32 v15, v15, v2
	; GCN-IR-NEXT: v_sub_i32_e64 v16, s[4:5], v10, v15			; GCN-IR-NEXT: v_sub_i32_e64 v16, s[4:5], v10, v15
	; GCN-IR-NEXT: v_mov_b32_e32 v14, v19			; GCN-IR-NEXT: v_mov_b32_e32 v14, v19
	; GCN-IR-NEXT: v_mov_b32_e32 v19, v12			; GCN-IR-NEXT: v_mov_b32_e32 v19, v12
	; GCN-IR-NEXT: v_subb_u32_e64 v17, s[4:5], v17, v20, s[4:5]			; GCN-IR-NEXT: v_subb_u32_e64 v17, s[4:5], v17, v20, s[4:5]
	; GCN-IR-NEXT: s_or_b64 s[8:9], vcc, s[8:9]			; GCN-IR-NEXT: s_or_b64 s[10:11], vcc, s[10:11]
	; GCN-IR-NEXT: v_mov_b32_e32 v18, v11			; GCN-IR-NEXT: v_mov_b32_e32 v18, v11
	; GCN-IR-NEXT: s_andn2_b64 exec, exec, s[8:9]			; GCN-IR-NEXT: s_andn2_b64 exec, exec, s[10:11]
	; GCN-IR-NEXT: s_cbranch_execnz BB1_3			; GCN-IR-NEXT: s_cbranch_execnz BB1_3
	; GCN-IR-NEXT: ; %bb.4: ; %Flow			; GCN-IR-NEXT: ; %bb.4: ; %Flow
	; GCN-IR-NEXT: s_or_b64 exec, exec, s[8:9]
	; GCN-IR-NEXT: BB1_5: ; %Flow3
	; GCN-IR-NEXT: s_or_b64 exec, exec, s[10:11]			; GCN-IR-NEXT: s_or_b64 exec, exec, s[10:11]
				; GCN-IR-NEXT: BB1_5: ; %Flow3
				; GCN-IR-NEXT: s_or_b64 exec, exec, s[8:9]
	; GCN-IR-NEXT: v_lshl_b64 v[2:3], v[7:8], 1			; GCN-IR-NEXT: v_lshl_b64 v[2:3], v[7:8], 1
	; GCN-IR-NEXT: v_or_b32_e32 v12, v12, v3			; GCN-IR-NEXT: v_or_b32_e32 v7, v12, v3
	; GCN-IR-NEXT: v_or_b32_e32 v0, v11, v2			; GCN-IR-NEXT: v_or_b32_e32 v0, v11, v2
	; GCN-IR-NEXT: BB1_6: ; %Flow4			; GCN-IR-NEXT: BB1_6: ; %Flow4
	; GCN-IR-NEXT: s_or_b64 exec, exec, s[6:7]			; GCN-IR-NEXT: s_or_b64 exec, exec, s[6:7]
	; GCN-IR-NEXT: v_xor_b32_e32 v2, v5, v4			; GCN-IR-NEXT: v_xor_b32_e32 v2, v5, v4
	; GCN-IR-NEXT: v_xor_b32_e32 v0, v0, v2			; GCN-IR-NEXT: v_xor_b32_e32 v0, v0, v2
	; GCN-IR-NEXT: v_xor_b32_e32 v1, v1, v6			; GCN-IR-NEXT: v_xor_b32_e32 v1, v1, v6
	; GCN-IR-NEXT: v_xor_b32_e32 v3, v12, v1			; GCN-IR-NEXT: v_xor_b32_e32 v3, v7, v1
	; GCN-IR-NEXT: v_sub_i32_e32 v0, vcc, v0, v2			; GCN-IR-NEXT: v_sub_i32_e32 v0, vcc, v0, v2
	; GCN-IR-NEXT: v_subb_u32_e32 v1, vcc, v3, v1, vcc			; GCN-IR-NEXT: v_subb_u32_e32 v1, vcc, v3, v1, vcc
	; GCN-IR-NEXT: s_setpc_b64 s[30:31]			; GCN-IR-NEXT: s_setpc_b64 s[30:31]
	%result = sdiv i64 %x, %y			%result = sdiv i64 %x, %y
	ret i64 %result			ret i64 %result
	}			}

	define amdgpu_kernel void @s_test_sdiv24_64(i64 addrspace(1)* %out, i64 %x, i64 %y) {			define amdgpu_kernel void @s_test_sdiv24_64(i64 addrspace(1)* %out, i64 %x, i64 %y) {
	▲ Show 20 Lines • Show All 1,001 Lines • ▼ Show 20 Lines
	; GCN-IR-NEXT: s_cbranch_execz BB11_6			; GCN-IR-NEXT: s_cbranch_execz BB11_6
	; GCN-IR-NEXT: ; %bb.1: ; %udiv-bb1			; GCN-IR-NEXT: ; %bb.1: ; %udiv-bb1
	; GCN-IR-NEXT: v_add_i32_e32 v8, vcc, 1, v4			; GCN-IR-NEXT: v_add_i32_e32 v8, vcc, 1, v4
	; GCN-IR-NEXT: v_addc_u32_e32 v9, vcc, 0, v5, vcc			; GCN-IR-NEXT: v_addc_u32_e32 v9, vcc, 0, v5, vcc
	; GCN-IR-NEXT: v_cmp_ge_u64_e32 vcc, v[8:9], v[4:5]			; GCN-IR-NEXT: v_cmp_ge_u64_e32 vcc, v[8:9], v[4:5]
	; GCN-IR-NEXT: v_sub_i32_e64 v4, s[4:5], 63, v4			; GCN-IR-NEXT: v_sub_i32_e64 v4, s[4:5], 63, v4
	; GCN-IR-NEXT: v_mov_b32_e32 v6, 0			; GCN-IR-NEXT: v_mov_b32_e32 v6, 0
	; GCN-IR-NEXT: v_lshl_b64 v[4:5], 24, v4			; GCN-IR-NEXT: v_lshl_b64 v[4:5], 24, v4
	; GCN-IR-NEXT: s_mov_b64 s[8:9], 0			; GCN-IR-NEXT: s_mov_b64 s[10:11], 0
	; GCN-IR-NEXT: v_mov_b32_e32 v7, 0			; GCN-IR-NEXT: v_mov_b32_e32 v7, 0
	; GCN-IR-NEXT: s_and_saveexec_b64 s[4:5], vcc			; GCN-IR-NEXT: s_and_saveexec_b64 s[4:5], vcc
	; GCN-IR-NEXT: s_xor_b64 s[10:11], exec, s[4:5]			; GCN-IR-NEXT: s_xor_b64 s[8:9], exec, s[4:5]
	; GCN-IR-NEXT: s_cbranch_execz BB11_5			; GCN-IR-NEXT: s_cbranch_execz BB11_5
	; GCN-IR-NEXT: ; %bb.2: ; %udiv-preheader			; GCN-IR-NEXT: ; %bb.2: ; %udiv-preheader
	; GCN-IR-NEXT: v_lshr_b64 v[12:13], 24, v8			; GCN-IR-NEXT: v_lshr_b64 v[12:13], 24, v8
	; GCN-IR-NEXT: v_add_i32_e32 v8, vcc, -1, v0			; GCN-IR-NEXT: v_add_i32_e32 v8, vcc, -1, v0
	; GCN-IR-NEXT: v_addc_u32_e32 v9, vcc, -1, v1, vcc			; GCN-IR-NEXT: v_addc_u32_e32 v9, vcc, -1, v1, vcc
	; GCN-IR-NEXT: v_sub_i32_e32 v10, vcc, 58, v10			; GCN-IR-NEXT: v_sub_i32_e32 v10, vcc, 58, v10
	; GCN-IR-NEXT: v_mov_b32_e32 v14, 0			; GCN-IR-NEXT: v_mov_b32_e32 v14, 0
	; GCN-IR-NEXT: v_subb_u32_e32 v11, vcc, 0, v11, vcc			; GCN-IR-NEXT: v_subb_u32_e32 v11, vcc, 0, v11, vcc
	Show All 16 Lines
	; GCN-IR-NEXT: v_addc_u32_e32 v15, vcc, 0, v11, vcc			; GCN-IR-NEXT: v_addc_u32_e32 v15, vcc, 0, v11, vcc
	; GCN-IR-NEXT: v_cmp_lt_u64_e32 vcc, v[14:15], v[10:11]			; GCN-IR-NEXT: v_cmp_lt_u64_e32 vcc, v[14:15], v[10:11]
	; GCN-IR-NEXT: v_mov_b32_e32 v10, v14			; GCN-IR-NEXT: v_mov_b32_e32 v10, v14
	; GCN-IR-NEXT: v_mov_b32_e32 v7, 0			; GCN-IR-NEXT: v_mov_b32_e32 v7, 0
	; GCN-IR-NEXT: v_sub_i32_e64 v12, s[4:5], v12, v17			; GCN-IR-NEXT: v_sub_i32_e64 v12, s[4:5], v12, v17
	; GCN-IR-NEXT: v_mov_b32_e32 v11, v15			; GCN-IR-NEXT: v_mov_b32_e32 v11, v15
	; GCN-IR-NEXT: v_mov_b32_e32 v15, v7			; GCN-IR-NEXT: v_mov_b32_e32 v15, v7
	; GCN-IR-NEXT: v_subb_u32_e64 v13, s[4:5], v13, v16, s[4:5]			; GCN-IR-NEXT: v_subb_u32_e64 v13, s[4:5], v13, v16, s[4:5]
	; GCN-IR-NEXT: s_or_b64 s[8:9], vcc, s[8:9]			; GCN-IR-NEXT: s_or_b64 s[10:11], vcc, s[10:11]
	; GCN-IR-NEXT: v_mov_b32_e32 v14, v6			; GCN-IR-NEXT: v_mov_b32_e32 v14, v6
	; GCN-IR-NEXT: s_andn2_b64 exec, exec, s[8:9]			; GCN-IR-NEXT: s_andn2_b64 exec, exec, s[10:11]
	; GCN-IR-NEXT: s_cbranch_execnz BB11_3			; GCN-IR-NEXT: s_cbranch_execnz BB11_3
	; GCN-IR-NEXT: ; %bb.4: ; %Flow			; GCN-IR-NEXT: ; %bb.4: ; %Flow
	; GCN-IR-NEXT: s_or_b64 exec, exec, s[8:9]
	; GCN-IR-NEXT: BB11_5: ; %Flow3
	; GCN-IR-NEXT: s_or_b64 exec, exec, s[10:11]			; GCN-IR-NEXT: s_or_b64 exec, exec, s[10:11]
				; GCN-IR-NEXT: BB11_5: ; %Flow3
				; GCN-IR-NEXT: s_or_b64 exec, exec, s[8:9]
	; GCN-IR-NEXT: v_lshl_b64 v[0:1], v[4:5], 1			; GCN-IR-NEXT: v_lshl_b64 v[0:1], v[4:5], 1
	; GCN-IR-NEXT: v_or_b32_e32 v7, v7, v1			; GCN-IR-NEXT: v_or_b32_e32 v7, v7, v1
	; GCN-IR-NEXT: v_or_b32_e32 v6, v6, v0			; GCN-IR-NEXT: v_or_b32_e32 v6, v6, v0
	; GCN-IR-NEXT: BB11_6: ; %Flow4			; GCN-IR-NEXT: BB11_6: ; %Flow4
	; GCN-IR-NEXT: s_or_b64 exec, exec, s[6:7]			; GCN-IR-NEXT: s_or_b64 exec, exec, s[6:7]
	; GCN-IR-NEXT: v_xor_b32_e32 v0, v6, v2			; GCN-IR-NEXT: v_xor_b32_e32 v0, v6, v2
	; GCN-IR-NEXT: v_xor_b32_e32 v1, v7, v3			; GCN-IR-NEXT: v_xor_b32_e32 v1, v7, v3
	; GCN-IR-NEXT: v_sub_i32_e32 v0, vcc, v0, v2			; GCN-IR-NEXT: v_sub_i32_e32 v0, vcc, v0, v2
	▲ Show 20 Lines • Show All 154 Lines • ▼ Show 20 Lines
	; GCN-IR-NEXT: s_and_b64 s[4:5], s[4:5], vcc			; GCN-IR-NEXT: s_and_b64 s[4:5], s[4:5], vcc
	; GCN-IR-NEXT: s_and_saveexec_b64 s[6:7], s[4:5]			; GCN-IR-NEXT: s_and_saveexec_b64 s[6:7], s[4:5]
	; GCN-IR-NEXT: s_cbranch_execz BB12_6			; GCN-IR-NEXT: s_cbranch_execz BB12_6
	; GCN-IR-NEXT: ; %bb.1: ; %udiv-bb1			; GCN-IR-NEXT: ; %bb.1: ; %udiv-bb1
	; GCN-IR-NEXT: v_add_i32_e32 v8, vcc, 1, v4			; GCN-IR-NEXT: v_add_i32_e32 v8, vcc, 1, v4
	; GCN-IR-NEXT: v_addc_u32_e32 v9, vcc, 0, v5, vcc			; GCN-IR-NEXT: v_addc_u32_e32 v9, vcc, 0, v5, vcc
	; GCN-IR-NEXT: v_cmp_ge_u64_e32 vcc, v[8:9], v[4:5]			; GCN-IR-NEXT: v_cmp_ge_u64_e32 vcc, v[8:9], v[4:5]
	; GCN-IR-NEXT: v_sub_i32_e64 v4, s[4:5], 63, v4			; GCN-IR-NEXT: v_sub_i32_e64 v4, s[4:5], 63, v4
	; GCN-IR-NEXT: v_lshl_b64 v[4:5], s[8:9], v4
	; GCN-IR-NEXT: v_mov_b32_e32 v6, 0			; GCN-IR-NEXT: v_mov_b32_e32 v6, 0
	; GCN-IR-NEXT: s_mov_b64 s[8:9], 0			; GCN-IR-NEXT: v_lshl_b64 v[4:5], s[8:9], v4
				; GCN-IR-NEXT: s_mov_b64 s[10:11], 0
	; GCN-IR-NEXT: v_mov_b32_e32 v7, 0			; GCN-IR-NEXT: v_mov_b32_e32 v7, 0
	; GCN-IR-NEXT: s_and_saveexec_b64 s[4:5], vcc			; GCN-IR-NEXT: s_and_saveexec_b64 s[4:5], vcc
	; GCN-IR-NEXT: s_xor_b64 s[10:11], exec, s[4:5]			; GCN-IR-NEXT: s_xor_b64 s[8:9], exec, s[4:5]
	; GCN-IR-NEXT: s_cbranch_execz BB12_5			; GCN-IR-NEXT: s_cbranch_execz BB12_5
	; GCN-IR-NEXT: ; %bb.2: ; %udiv-preheader			; GCN-IR-NEXT: ; %bb.2: ; %udiv-preheader
	; GCN-IR-NEXT: s_mov_b32 s5, 0			; GCN-IR-NEXT: s_mov_b32 s5, 0
	; GCN-IR-NEXT: s_mov_b32 s4, 0x8000			; GCN-IR-NEXT: s_mov_b32 s4, 0x8000
	; GCN-IR-NEXT: v_lshr_b64 v[12:13], s[4:5], v8			; GCN-IR-NEXT: v_lshr_b64 v[12:13], s[4:5], v8
	; GCN-IR-NEXT: v_add_i32_e32 v8, vcc, -1, v0			; GCN-IR-NEXT: v_add_i32_e32 v8, vcc, -1, v0
	; GCN-IR-NEXT: v_addc_u32_e32 v9, vcc, -1, v1, vcc			; GCN-IR-NEXT: v_addc_u32_e32 v9, vcc, -1, v1, vcc
	; GCN-IR-NEXT: v_sub_i32_e32 v10, vcc, 47, v10			; GCN-IR-NEXT: v_sub_i32_e32 v10, vcc, 47, v10
	Show All 18 Lines
	; GCN-IR-NEXT: v_addc_u32_e32 v15, vcc, 0, v11, vcc			; GCN-IR-NEXT: v_addc_u32_e32 v15, vcc, 0, v11, vcc
	; GCN-IR-NEXT: v_cmp_lt_u64_e32 vcc, v[14:15], v[10:11]			; GCN-IR-NEXT: v_cmp_lt_u64_e32 vcc, v[14:15], v[10:11]
	; GCN-IR-NEXT: v_mov_b32_e32 v10, v14			; GCN-IR-NEXT: v_mov_b32_e32 v10, v14
	; GCN-IR-NEXT: v_mov_b32_e32 v7, 0			; GCN-IR-NEXT: v_mov_b32_e32 v7, 0
	; GCN-IR-NEXT: v_sub_i32_e64 v12, s[4:5], v12, v17			; GCN-IR-NEXT: v_sub_i32_e64 v12, s[4:5], v12, v17
	; GCN-IR-NEXT: v_mov_b32_e32 v11, v15			; GCN-IR-NEXT: v_mov_b32_e32 v11, v15
	; GCN-IR-NEXT: v_mov_b32_e32 v15, v7			; GCN-IR-NEXT: v_mov_b32_e32 v15, v7
	; GCN-IR-NEXT: v_subb_u32_e64 v13, s[4:5], v13, v16, s[4:5]			; GCN-IR-NEXT: v_subb_u32_e64 v13, s[4:5], v13, v16, s[4:5]
	; GCN-IR-NEXT: s_or_b64 s[8:9], vcc, s[8:9]			; GCN-IR-NEXT: s_or_b64 s[10:11], vcc, s[10:11]
	; GCN-IR-NEXT: v_mov_b32_e32 v14, v6			; GCN-IR-NEXT: v_mov_b32_e32 v14, v6
	; GCN-IR-NEXT: s_andn2_b64 exec, exec, s[8:9]			; GCN-IR-NEXT: s_andn2_b64 exec, exec, s[10:11]
	; GCN-IR-NEXT: s_cbranch_execnz BB12_3			; GCN-IR-NEXT: s_cbranch_execnz BB12_3
	; GCN-IR-NEXT: ; %bb.4: ; %Flow			; GCN-IR-NEXT: ; %bb.4: ; %Flow
	; GCN-IR-NEXT: s_or_b64 exec, exec, s[8:9]
	; GCN-IR-NEXT: BB12_5: ; %Flow3
	; GCN-IR-NEXT: s_or_b64 exec, exec, s[10:11]			; GCN-IR-NEXT: s_or_b64 exec, exec, s[10:11]
				; GCN-IR-NEXT: BB12_5: ; %Flow3
				; GCN-IR-NEXT: s_or_b64 exec, exec, s[8:9]
	; GCN-IR-NEXT: v_lshl_b64 v[0:1], v[4:5], 1			; GCN-IR-NEXT: v_lshl_b64 v[0:1], v[4:5], 1
	; GCN-IR-NEXT: v_or_b32_e32 v7, v7, v1			; GCN-IR-NEXT: v_or_b32_e32 v7, v7, v1
	; GCN-IR-NEXT: v_or_b32_e32 v6, v6, v0			; GCN-IR-NEXT: v_or_b32_e32 v6, v6, v0
	; GCN-IR-NEXT: BB12_6: ; %Flow4			; GCN-IR-NEXT: BB12_6: ; %Flow4
	; GCN-IR-NEXT: s_or_b64 exec, exec, s[6:7]			; GCN-IR-NEXT: s_or_b64 exec, exec, s[6:7]
	; GCN-IR-NEXT: v_xor_b32_e32 v0, v6, v2			; GCN-IR-NEXT: v_xor_b32_e32 v0, v6, v2
	; GCN-IR-NEXT: v_xor_b32_e32 v1, v7, v3			; GCN-IR-NEXT: v_xor_b32_e32 v1, v7, v3
	; GCN-IR-NEXT: v_sub_i32_e32 v0, vcc, v0, v2			; GCN-IR-NEXT: v_sub_i32_e32 v0, vcc, v0, v2
	▲ Show 20 Lines • Show All 42 Lines • ▼ Show 20 Lines
	; GCN-IR-NEXT: s_cbranch_execz BB13_6			; GCN-IR-NEXT: s_cbranch_execz BB13_6
	; GCN-IR-NEXT: ; %bb.1: ; %udiv-bb1			; GCN-IR-NEXT: ; %bb.1: ; %udiv-bb1
	; GCN-IR-NEXT: v_add_i32_e32 v9, vcc, 1, v3			; GCN-IR-NEXT: v_add_i32_e32 v9, vcc, 1, v3
	; GCN-IR-NEXT: v_addc_u32_e32 v10, vcc, 0, v4, vcc			; GCN-IR-NEXT: v_addc_u32_e32 v10, vcc, 0, v4, vcc
	; GCN-IR-NEXT: v_cmp_ge_u64_e32 vcc, v[9:10], v[3:4]			; GCN-IR-NEXT: v_cmp_ge_u64_e32 vcc, v[9:10], v[3:4]
	; GCN-IR-NEXT: v_sub_i32_e64 v3, s[4:5], 63, v3			; GCN-IR-NEXT: v_sub_i32_e64 v3, s[4:5], 63, v3
	; GCN-IR-NEXT: v_mov_b32_e32 v5, 0			; GCN-IR-NEXT: v_mov_b32_e32 v5, 0
	; GCN-IR-NEXT: v_lshl_b64 v[3:4], v[7:8], v3			; GCN-IR-NEXT: v_lshl_b64 v[3:4], v[7:8], v3
	; GCN-IR-NEXT: s_mov_b64 s[8:9], 0			; GCN-IR-NEXT: s_mov_b64 s[10:11], 0
	; GCN-IR-NEXT: v_mov_b32_e32 v6, 0			; GCN-IR-NEXT: v_mov_b32_e32 v6, 0
	; GCN-IR-NEXT: s_and_saveexec_b64 s[4:5], vcc			; GCN-IR-NEXT: s_and_saveexec_b64 s[4:5], vcc
	; GCN-IR-NEXT: s_xor_b64 s[10:11], exec, s[4:5]			; GCN-IR-NEXT: s_xor_b64 s[8:9], exec, s[4:5]
	; GCN-IR-NEXT: s_cbranch_execz BB13_5			; GCN-IR-NEXT: s_cbranch_execz BB13_5
	; GCN-IR-NEXT: ; %bb.2: ; %udiv-preheader			; GCN-IR-NEXT: ; %bb.2: ; %udiv-preheader
	; GCN-IR-NEXT: v_lshr_b64 v[9:10], v[7:8], v9			; GCN-IR-NEXT: v_lshr_b64 v[9:10], v[7:8], v9
	; GCN-IR-NEXT: v_add_i32_e32 v7, vcc, 0xffffffcf, v0			; GCN-IR-NEXT: v_add_i32_e32 v7, vcc, 0xffffffcf, v0
	; GCN-IR-NEXT: v_mov_b32_e32 v11, 0			; GCN-IR-NEXT: v_mov_b32_e32 v11, 0
	; GCN-IR-NEXT: v_addc_u32_e64 v8, s[4:5], 0, -1, vcc			; GCN-IR-NEXT: v_addc_u32_e64 v8, s[4:5], 0, -1, vcc
	; GCN-IR-NEXT: v_mov_b32_e32 v12, 0			; GCN-IR-NEXT: v_mov_b32_e32 v12, 0
	; GCN-IR-NEXT: s_movk_i32 s12, 0x7fff			; GCN-IR-NEXT: s_movk_i32 s12, 0x7fff
	Show All 15 Lines
	; GCN-IR-NEXT: v_and_b32_e32 v9, 0x8000, v9			; GCN-IR-NEXT: v_and_b32_e32 v9, 0x8000, v9
	; GCN-IR-NEXT: v_mov_b32_e32 v7, v11			; GCN-IR-NEXT: v_mov_b32_e32 v7, v11
	; GCN-IR-NEXT: v_mov_b32_e32 v6, 0			; GCN-IR-NEXT: v_mov_b32_e32 v6, 0
	; GCN-IR-NEXT: v_mov_b32_e32 v8, v12			; GCN-IR-NEXT: v_mov_b32_e32 v8, v12
	; GCN-IR-NEXT: v_mov_b32_e32 v12, v6			; GCN-IR-NEXT: v_mov_b32_e32 v12, v6
	; GCN-IR-NEXT: v_mov_b32_e32 v13, 0			; GCN-IR-NEXT: v_mov_b32_e32 v13, 0
	; GCN-IR-NEXT: v_sub_i32_e64 v9, s[4:5], v0, v9			; GCN-IR-NEXT: v_sub_i32_e64 v9, s[4:5], v0, v9
	; GCN-IR-NEXT: v_subb_u32_e64 v10, s[4:5], v10, v13, s[4:5]			; GCN-IR-NEXT: v_subb_u32_e64 v10, s[4:5], v10, v13, s[4:5]
	; GCN-IR-NEXT: s_or_b64 s[8:9], vcc, s[8:9]			; GCN-IR-NEXT: s_or_b64 s[10:11], vcc, s[10:11]
	; GCN-IR-NEXT: v_mov_b32_e32 v11, v5			; GCN-IR-NEXT: v_mov_b32_e32 v11, v5
	; GCN-IR-NEXT: s_andn2_b64 exec, exec, s[8:9]			; GCN-IR-NEXT: s_andn2_b64 exec, exec, s[10:11]
	; GCN-IR-NEXT: s_cbranch_execnz BB13_3			; GCN-IR-NEXT: s_cbranch_execnz BB13_3
	; GCN-IR-NEXT: ; %bb.4: ; %Flow			; GCN-IR-NEXT: ; %bb.4: ; %Flow
	; GCN-IR-NEXT: s_or_b64 exec, exec, s[8:9]
	; GCN-IR-NEXT: BB13_5: ; %Flow3
	; GCN-IR-NEXT: s_or_b64 exec, exec, s[10:11]			; GCN-IR-NEXT: s_or_b64 exec, exec, s[10:11]
				; GCN-IR-NEXT: BB13_5: ; %Flow3
				; GCN-IR-NEXT: s_or_b64 exec, exec, s[8:9]
	; GCN-IR-NEXT: v_lshl_b64 v[3:4], v[3:4], 1			; GCN-IR-NEXT: v_lshl_b64 v[3:4], v[3:4], 1
	; GCN-IR-NEXT: v_or_b32_e32 v6, v6, v4			; GCN-IR-NEXT: v_or_b32_e32 v6, v6, v4
	; GCN-IR-NEXT: v_or_b32_e32 v5, v5, v3			; GCN-IR-NEXT: v_or_b32_e32 v5, v5, v3
	; GCN-IR-NEXT: BB13_6: ; %Flow4			; GCN-IR-NEXT: BB13_6: ; %Flow4
	; GCN-IR-NEXT: s_or_b64 exec, exec, s[6:7]			; GCN-IR-NEXT: s_or_b64 exec, exec, s[6:7]
	; GCN-IR-NEXT: v_xor_b32_e32 v0, v5, v2			; GCN-IR-NEXT: v_xor_b32_e32 v0, v5, v2
	; GCN-IR-NEXT: v_xor_b32_e32 v3, v6, v1			; GCN-IR-NEXT: v_xor_b32_e32 v3, v6, v1
	; GCN-IR-NEXT: v_sub_i32_e32 v0, vcc, v0, v2			; GCN-IR-NEXT: v_sub_i32_e32 v0, vcc, v0, v2
	▲ Show 20 Lines • Show All 247 Lines • Show Last 20 Lines

llvm/test/CodeGen/AMDGPU/srem64.ll

	Show First 20 Lines • Show All 396 Lines • ▼ Show 20 Lines
	; GCN-IR-NEXT: v_mov_b32_e32 v2, v4			; GCN-IR-NEXT: v_mov_b32_e32 v2, v4
	; GCN-IR-NEXT: v_mov_b32_e32 v15, v13			; GCN-IR-NEXT: v_mov_b32_e32 v15, v13
	; GCN-IR-NEXT: v_cndmask_b32_e64 v3, v1, 0, s[6:7]			; GCN-IR-NEXT: v_cndmask_b32_e64 v3, v1, 0, s[6:7]
	; GCN-IR-NEXT: s_and_b64 s[4:5], s[8:9], s[4:5]			; GCN-IR-NEXT: s_and_b64 s[4:5], s[8:9], s[4:5]
	; GCN-IR-NEXT: v_cndmask_b32_e64 v9, v0, 0, s[6:7]			; GCN-IR-NEXT: v_cndmask_b32_e64 v9, v0, 0, s[6:7]
	; GCN-IR-NEXT: s_and_saveexec_b64 s[6:7], s[4:5]			; GCN-IR-NEXT: s_and_saveexec_b64 s[6:7], s[4:5]
	; GCN-IR-NEXT: s_cbranch_execz BB1_6			; GCN-IR-NEXT: s_cbranch_execz BB1_6
	; GCN-IR-NEXT: ; %bb.1: ; %udiv-bb1			; GCN-IR-NEXT: ; %bb.1: ; %udiv-bb1
	; GCN-IR-NEXT: v_add_i32_e32 v9, vcc, 1, v7			; GCN-IR-NEXT: v_add_i32_e32 v16, vcc, 1, v7
	; GCN-IR-NEXT: v_addc_u32_e32 v10, vcc, 0, v8, vcc			; GCN-IR-NEXT: v_addc_u32_e32 v17, vcc, 0, v8, vcc
	; GCN-IR-NEXT: v_sub_i32_e64 v3, s[4:5], 63, v7			; GCN-IR-NEXT: v_sub_i32_e64 v3, s[4:5], 63, v7
	; GCN-IR-NEXT: v_cmp_ge_u64_e32 vcc, v[9:10], v[7:8]			; GCN-IR-NEXT: v_cmp_ge_u64_e32 vcc, v[16:17], v[7:8]
	; GCN-IR-NEXT: v_mov_b32_e32 v10, 0			; GCN-IR-NEXT: v_mov_b32_e32 v9, 0
	; GCN-IR-NEXT: v_lshl_b64 v[7:8], v[0:1], v3			; GCN-IR-NEXT: v_lshl_b64 v[7:8], v[0:1], v3
	; GCN-IR-NEXT: s_mov_b64 s[8:9], 0			; GCN-IR-NEXT: s_mov_b64 s[10:11], 0
	; GCN-IR-NEXT: v_mov_b32_e32 v11, 0			; GCN-IR-NEXT: v_mov_b32_e32 v10, 0
	; GCN-IR-NEXT: s_and_saveexec_b64 s[4:5], vcc			; GCN-IR-NEXT: s_and_saveexec_b64 s[4:5], vcc
	; GCN-IR-NEXT: s_xor_b64 s[10:11], exec, s[4:5]			; GCN-IR-NEXT: s_xor_b64 s[8:9], exec, s[4:5]
	; GCN-IR-NEXT: s_cbranch_execz BB1_5			; GCN-IR-NEXT: s_cbranch_execz BB1_5
	; GCN-IR-NEXT: ; %bb.2: ; %udiv-preheader			; GCN-IR-NEXT: ; %bb.2: ; %udiv-preheader
	; GCN-IR-NEXT: v_add_i32_e32 v3, vcc, -1, v5			; GCN-IR-NEXT: v_add_i32_e32 v3, vcc, -1, v5
	; GCN-IR-NEXT: v_lshr_b64 v[16:17], v[0:1], v9			; GCN-IR-NEXT: v_addc_u32_e32 v11, vcc, -1, v6, vcc
	; GCN-IR-NEXT: v_addc_u32_e32 v9, vcc, -1, v6, vcc			; GCN-IR-NEXT: v_not_b32_e32 v9, v12
	; GCN-IR-NEXT: v_not_b32_e32 v10, v12			; GCN-IR-NEXT: v_not_b32_e32 v10, v13
	; GCN-IR-NEXT: v_not_b32_e32 v11, v13			; GCN-IR-NEXT: v_add_i32_e32 v12, vcc, v9, v14
	; GCN-IR-NEXT: v_add_i32_e32 v12, vcc, v10, v14			; GCN-IR-NEXT: v_addc_u32_e32 v13, vcc, v10, v15, vcc
	; GCN-IR-NEXT: v_addc_u32_e32 v13, vcc, v11, v15, vcc
	; GCN-IR-NEXT: v_mov_b32_e32 v14, 0			; GCN-IR-NEXT: v_mov_b32_e32 v14, 0
				; GCN-IR-NEXT: v_lshr_b64 v[16:17], v[0:1], v16
	; GCN-IR-NEXT: v_mov_b32_e32 v15, 0			; GCN-IR-NEXT: v_mov_b32_e32 v15, 0
	; GCN-IR-NEXT: BB1_3: ; %udiv-do-while			; GCN-IR-NEXT: BB1_3: ; %udiv-do-while
	; GCN-IR-NEXT: ; =>This Inner Loop Header: Depth=1			; GCN-IR-NEXT: ; =>This Inner Loop Header: Depth=1
	; GCN-IR-NEXT: v_lshl_b64 v[16:17], v[16:17], 1			; GCN-IR-NEXT: v_lshl_b64 v[16:17], v[16:17], 1
	; GCN-IR-NEXT: v_lshrrev_b32_e32 v10, 31, v8			; GCN-IR-NEXT: v_lshrrev_b32_e32 v9, 31, v8
	; GCN-IR-NEXT: v_or_b32_e32 v16, v16, v10			; GCN-IR-NEXT: v_or_b32_e32 v16, v16, v9
	; GCN-IR-NEXT: v_lshl_b64 v[7:8], v[7:8], 1			; GCN-IR-NEXT: v_lshl_b64 v[7:8], v[7:8], 1
	; GCN-IR-NEXT: v_sub_i32_e32 v10, vcc, v3, v16			; GCN-IR-NEXT: v_sub_i32_e32 v9, vcc, v3, v16
	; GCN-IR-NEXT: v_subb_u32_e32 v10, vcc, v9, v17, vcc			; GCN-IR-NEXT: v_subb_u32_e32 v9, vcc, v11, v17, vcc
	; GCN-IR-NEXT: v_or_b32_e32 v7, v14, v7			; GCN-IR-NEXT: v_or_b32_e32 v7, v14, v7
	; GCN-IR-NEXT: v_ashrrev_i32_e32 v14, 31, v10			; GCN-IR-NEXT: v_ashrrev_i32_e32 v14, 31, v9
	; GCN-IR-NEXT: v_and_b32_e32 v19, v14, v5			; GCN-IR-NEXT: v_and_b32_e32 v19, v14, v5
	; GCN-IR-NEXT: v_and_b32_e32 v10, 1, v14			; GCN-IR-NEXT: v_and_b32_e32 v9, 1, v14
	; GCN-IR-NEXT: v_and_b32_e32 v18, v14, v6			; GCN-IR-NEXT: v_and_b32_e32 v18, v14, v6
	; GCN-IR-NEXT: v_add_i32_e32 v14, vcc, 1, v12			; GCN-IR-NEXT: v_add_i32_e32 v14, vcc, 1, v12
	; GCN-IR-NEXT: v_or_b32_e32 v8, v15, v8			; GCN-IR-NEXT: v_or_b32_e32 v8, v15, v8
	; GCN-IR-NEXT: v_addc_u32_e32 v15, vcc, 0, v13, vcc			; GCN-IR-NEXT: v_addc_u32_e32 v15, vcc, 0, v13, vcc
	; GCN-IR-NEXT: v_cmp_lt_u64_e32 vcc, v[14:15], v[12:13]			; GCN-IR-NEXT: v_cmp_lt_u64_e32 vcc, v[14:15], v[12:13]
	; GCN-IR-NEXT: v_mov_b32_e32 v12, v14			; GCN-IR-NEXT: v_mov_b32_e32 v12, v14
	; GCN-IR-NEXT: v_mov_b32_e32 v11, 0			; GCN-IR-NEXT: v_mov_b32_e32 v10, 0
	; GCN-IR-NEXT: v_sub_i32_e64 v16, s[4:5], v16, v19			; GCN-IR-NEXT: v_sub_i32_e64 v16, s[4:5], v16, v19
	; GCN-IR-NEXT: v_mov_b32_e32 v13, v15			; GCN-IR-NEXT: v_mov_b32_e32 v13, v15
	; GCN-IR-NEXT: v_mov_b32_e32 v15, v11			; GCN-IR-NEXT: v_mov_b32_e32 v15, v10
	; GCN-IR-NEXT: v_subb_u32_e64 v17, s[4:5], v17, v18, s[4:5]			; GCN-IR-NEXT: v_subb_u32_e64 v17, s[4:5], v17, v18, s[4:5]
	; GCN-IR-NEXT: s_or_b64 s[8:9], vcc, s[8:9]			; GCN-IR-NEXT: s_or_b64 s[10:11], vcc, s[10:11]
	; GCN-IR-NEXT: v_mov_b32_e32 v14, v10			; GCN-IR-NEXT: v_mov_b32_e32 v14, v9
	; GCN-IR-NEXT: s_andn2_b64 exec, exec, s[8:9]			; GCN-IR-NEXT: s_andn2_b64 exec, exec, s[10:11]
	; GCN-IR-NEXT: s_cbranch_execnz BB1_3			; GCN-IR-NEXT: s_cbranch_execnz BB1_3
	; GCN-IR-NEXT: ; %bb.4: ; %Flow			; GCN-IR-NEXT: ; %bb.4: ; %Flow
	; GCN-IR-NEXT: s_or_b64 exec, exec, s[8:9]
	; GCN-IR-NEXT: BB1_5: ; %Flow3
	; GCN-IR-NEXT: s_or_b64 exec, exec, s[10:11]			; GCN-IR-NEXT: s_or_b64 exec, exec, s[10:11]
				; GCN-IR-NEXT: BB1_5: ; %Flow3
				; GCN-IR-NEXT: s_or_b64 exec, exec, s[8:9]
	; GCN-IR-NEXT: v_lshl_b64 v[7:8], v[7:8], 1			; GCN-IR-NEXT: v_lshl_b64 v[7:8], v[7:8], 1
	; GCN-IR-NEXT: v_or_b32_e32 v3, v11, v8			; GCN-IR-NEXT: v_or_b32_e32 v3, v10, v8
	; GCN-IR-NEXT: v_or_b32_e32 v9, v10, v7			; GCN-IR-NEXT: v_or_b32_e32 v9, v9, v7
	; GCN-IR-NEXT: BB1_6: ; %Flow4			; GCN-IR-NEXT: BB1_6: ; %Flow4
	; GCN-IR-NEXT: s_or_b64 exec, exec, s[6:7]			; GCN-IR-NEXT: s_or_b64 exec, exec, s[6:7]
	; GCN-IR-NEXT: v_mul_lo_u32 v3, v5, v3			; GCN-IR-NEXT: v_mul_lo_u32 v3, v5, v3
	; GCN-IR-NEXT: v_mul_hi_u32 v7, v5, v9			; GCN-IR-NEXT: v_mul_hi_u32 v7, v5, v9
	; GCN-IR-NEXT: v_mul_lo_u32 v6, v6, v9			; GCN-IR-NEXT: v_mul_lo_u32 v6, v6, v9
	; GCN-IR-NEXT: v_mul_lo_u32 v5, v5, v9			; GCN-IR-NEXT: v_mul_lo_u32 v5, v5, v9
	; GCN-IR-NEXT: v_add_i32_e32 v3, vcc, v7, v3			; GCN-IR-NEXT: v_add_i32_e32 v3, vcc, v7, v3
	; GCN-IR-NEXT: v_add_i32_e32 v3, vcc, v3, v6			; GCN-IR-NEXT: v_add_i32_e32 v3, vcc, v3, v6
	▲ Show 20 Lines • Show All 1,211 Lines • ▼ Show 20 Lines
	; GCN-IR-NEXT: s_cbranch_execz BB11_6			; GCN-IR-NEXT: s_cbranch_execz BB11_6
	; GCN-IR-NEXT: ; %bb.1: ; %udiv-bb1			; GCN-IR-NEXT: ; %bb.1: ; %udiv-bb1
	; GCN-IR-NEXT: v_add_i32_e32 v6, vcc, 1, v3			; GCN-IR-NEXT: v_add_i32_e32 v6, vcc, 1, v3
	; GCN-IR-NEXT: v_addc_u32_e32 v7, vcc, 0, v4, vcc			; GCN-IR-NEXT: v_addc_u32_e32 v7, vcc, 0, v4, vcc
	; GCN-IR-NEXT: v_sub_i32_e64 v2, s[4:5], 63, v3			; GCN-IR-NEXT: v_sub_i32_e64 v2, s[4:5], 63, v3
	; GCN-IR-NEXT: v_cmp_ge_u64_e32 vcc, v[6:7], v[3:4]			; GCN-IR-NEXT: v_cmp_ge_u64_e32 vcc, v[6:7], v[3:4]
	; GCN-IR-NEXT: v_mov_b32_e32 v4, 0			; GCN-IR-NEXT: v_mov_b32_e32 v4, 0
	; GCN-IR-NEXT: v_lshl_b64 v[2:3], 24, v2			; GCN-IR-NEXT: v_lshl_b64 v[2:3], 24, v2
	; GCN-IR-NEXT: s_mov_b64 s[8:9], 0			; GCN-IR-NEXT: s_mov_b64 s[10:11], 0
	; GCN-IR-NEXT: v_mov_b32_e32 v5, 0			; GCN-IR-NEXT: v_mov_b32_e32 v5, 0
	; GCN-IR-NEXT: s_and_saveexec_b64 s[4:5], vcc			; GCN-IR-NEXT: s_and_saveexec_b64 s[4:5], vcc
	; GCN-IR-NEXT: s_xor_b64 s[10:11], exec, s[4:5]			; GCN-IR-NEXT: s_xor_b64 s[8:9], exec, s[4:5]
	; GCN-IR-NEXT: s_cbranch_execz BB11_5			; GCN-IR-NEXT: s_cbranch_execz BB11_5
	; GCN-IR-NEXT: ; %bb.2: ; %udiv-preheader			; GCN-IR-NEXT: ; %bb.2: ; %udiv-preheader
	; GCN-IR-NEXT: v_lshr_b64 v[10:11], 24, v6			; GCN-IR-NEXT: v_lshr_b64 v[10:11], 24, v6
	; GCN-IR-NEXT: v_add_i32_e32 v6, vcc, -1, v0			; GCN-IR-NEXT: v_add_i32_e32 v6, vcc, -1, v0
	; GCN-IR-NEXT: v_addc_u32_e32 v7, vcc, -1, v1, vcc			; GCN-IR-NEXT: v_addc_u32_e32 v7, vcc, -1, v1, vcc
	; GCN-IR-NEXT: v_sub_i32_e32 v8, vcc, 58, v8			; GCN-IR-NEXT: v_sub_i32_e32 v8, vcc, 58, v8
	; GCN-IR-NEXT: v_mov_b32_e32 v12, 0			; GCN-IR-NEXT: v_mov_b32_e32 v12, 0
	; GCN-IR-NEXT: v_subb_u32_e32 v9, vcc, 0, v9, vcc			; GCN-IR-NEXT: v_subb_u32_e32 v9, vcc, 0, v9, vcc
	Show All 16 Lines
	; GCN-IR-NEXT: v_addc_u32_e32 v13, vcc, 0, v9, vcc			; GCN-IR-NEXT: v_addc_u32_e32 v13, vcc, 0, v9, vcc
	; GCN-IR-NEXT: v_cmp_lt_u64_e32 vcc, v[12:13], v[8:9]			; GCN-IR-NEXT: v_cmp_lt_u64_e32 vcc, v[12:13], v[8:9]
	; GCN-IR-NEXT: v_mov_b32_e32 v8, v12			; GCN-IR-NEXT: v_mov_b32_e32 v8, v12
	; GCN-IR-NEXT: v_mov_b32_e32 v5, 0			; GCN-IR-NEXT: v_mov_b32_e32 v5, 0
	; GCN-IR-NEXT: v_sub_i32_e64 v10, s[4:5], v10, v15			; GCN-IR-NEXT: v_sub_i32_e64 v10, s[4:5], v10, v15
	; GCN-IR-NEXT: v_mov_b32_e32 v9, v13			; GCN-IR-NEXT: v_mov_b32_e32 v9, v13
	; GCN-IR-NEXT: v_mov_b32_e32 v13, v5			; GCN-IR-NEXT: v_mov_b32_e32 v13, v5
	; GCN-IR-NEXT: v_subb_u32_e64 v11, s[4:5], v11, v14, s[4:5]			; GCN-IR-NEXT: v_subb_u32_e64 v11, s[4:5], v11, v14, s[4:5]
	; GCN-IR-NEXT: s_or_b64 s[8:9], vcc, s[8:9]			; GCN-IR-NEXT: s_or_b64 s[10:11], vcc, s[10:11]
	; GCN-IR-NEXT: v_mov_b32_e32 v12, v4			; GCN-IR-NEXT: v_mov_b32_e32 v12, v4
	; GCN-IR-NEXT: s_andn2_b64 exec, exec, s[8:9]			; GCN-IR-NEXT: s_andn2_b64 exec, exec, s[10:11]
	; GCN-IR-NEXT: s_cbranch_execnz BB11_3			; GCN-IR-NEXT: s_cbranch_execnz BB11_3
	; GCN-IR-NEXT: ; %bb.4: ; %Flow			; GCN-IR-NEXT: ; %bb.4: ; %Flow
	; GCN-IR-NEXT: s_or_b64 exec, exec, s[8:9]
	; GCN-IR-NEXT: BB11_5: ; %Flow3
	; GCN-IR-NEXT: s_or_b64 exec, exec, s[10:11]			; GCN-IR-NEXT: s_or_b64 exec, exec, s[10:11]
				; GCN-IR-NEXT: BB11_5: ; %Flow3
				; GCN-IR-NEXT: s_or_b64 exec, exec, s[8:9]
	; GCN-IR-NEXT: v_lshl_b64 v[2:3], v[2:3], 1			; GCN-IR-NEXT: v_lshl_b64 v[2:3], v[2:3], 1
	; GCN-IR-NEXT: v_or_b32_e32 v5, v5, v3			; GCN-IR-NEXT: v_or_b32_e32 v5, v5, v3
	; GCN-IR-NEXT: v_or_b32_e32 v2, v4, v2			; GCN-IR-NEXT: v_or_b32_e32 v2, v4, v2
	; GCN-IR-NEXT: BB11_6: ; %Flow4			; GCN-IR-NEXT: BB11_6: ; %Flow4
	; GCN-IR-NEXT: s_or_b64 exec, exec, s[6:7]			; GCN-IR-NEXT: s_or_b64 exec, exec, s[6:7]
	; GCN-IR-NEXT: v_mul_lo_u32 v3, v0, v5			; GCN-IR-NEXT: v_mul_lo_u32 v3, v0, v5
	; GCN-IR-NEXT: v_mul_hi_u32 v4, v0, v2			; GCN-IR-NEXT: v_mul_hi_u32 v4, v0, v2
	; GCN-IR-NEXT: v_mul_lo_u32 v1, v1, v2			; GCN-IR-NEXT: v_mul_lo_u32 v1, v1, v2
	▲ Show 20 Lines • Show All 152 Lines • ▼ Show 20 Lines
	; GCN-IR-NEXT: s_and_b64 s[4:5], s[4:5], vcc			; GCN-IR-NEXT: s_and_b64 s[4:5], s[4:5], vcc
	; GCN-IR-NEXT: s_and_saveexec_b64 s[6:7], s[4:5]			; GCN-IR-NEXT: s_and_saveexec_b64 s[6:7], s[4:5]
	; GCN-IR-NEXT: s_cbranch_execz BB12_6			; GCN-IR-NEXT: s_cbranch_execz BB12_6
	; GCN-IR-NEXT: ; %bb.1: ; %udiv-bb1			; GCN-IR-NEXT: ; %bb.1: ; %udiv-bb1
	; GCN-IR-NEXT: v_add_i32_e32 v6, vcc, 1, v2			; GCN-IR-NEXT: v_add_i32_e32 v6, vcc, 1, v2
	; GCN-IR-NEXT: v_addc_u32_e32 v7, vcc, 0, v3, vcc			; GCN-IR-NEXT: v_addc_u32_e32 v7, vcc, 0, v3, vcc
	; GCN-IR-NEXT: v_cmp_ge_u64_e32 vcc, v[6:7], v[2:3]			; GCN-IR-NEXT: v_cmp_ge_u64_e32 vcc, v[6:7], v[2:3]
	; GCN-IR-NEXT: v_sub_i32_e64 v2, s[4:5], 63, v2			; GCN-IR-NEXT: v_sub_i32_e64 v2, s[4:5], 63, v2
	; GCN-IR-NEXT: v_lshl_b64 v[2:3], s[8:9], v2
	; GCN-IR-NEXT: v_mov_b32_e32 v4, 0			; GCN-IR-NEXT: v_mov_b32_e32 v4, 0
	; GCN-IR-NEXT: s_mov_b64 s[8:9], 0			; GCN-IR-NEXT: v_lshl_b64 v[2:3], s[8:9], v2
				; GCN-IR-NEXT: s_mov_b64 s[10:11], 0
	; GCN-IR-NEXT: v_mov_b32_e32 v5, 0			; GCN-IR-NEXT: v_mov_b32_e32 v5, 0
	; GCN-IR-NEXT: s_and_saveexec_b64 s[4:5], vcc			; GCN-IR-NEXT: s_and_saveexec_b64 s[4:5], vcc
	; GCN-IR-NEXT: s_xor_b64 s[10:11], exec, s[4:5]			; GCN-IR-NEXT: s_xor_b64 s[8:9], exec, s[4:5]
	; GCN-IR-NEXT: s_cbranch_execz BB12_5			; GCN-IR-NEXT: s_cbranch_execz BB12_5
	; GCN-IR-NEXT: ; %bb.2: ; %udiv-preheader			; GCN-IR-NEXT: ; %bb.2: ; %udiv-preheader
	; GCN-IR-NEXT: s_mov_b32 s5, 0			; GCN-IR-NEXT: s_mov_b32 s5, 0
	; GCN-IR-NEXT: s_mov_b32 s4, 0x8000			; GCN-IR-NEXT: s_mov_b32 s4, 0x8000
	; GCN-IR-NEXT: v_lshr_b64 v[10:11], s[4:5], v6			; GCN-IR-NEXT: v_lshr_b64 v[10:11], s[4:5], v6
	; GCN-IR-NEXT: v_add_i32_e32 v6, vcc, -1, v0			; GCN-IR-NEXT: v_add_i32_e32 v6, vcc, -1, v0
	; GCN-IR-NEXT: v_addc_u32_e32 v7, vcc, -1, v1, vcc			; GCN-IR-NEXT: v_addc_u32_e32 v7, vcc, -1, v1, vcc
	; GCN-IR-NEXT: v_sub_i32_e32 v8, vcc, 47, v8			; GCN-IR-NEXT: v_sub_i32_e32 v8, vcc, 47, v8
	Show All 18 Lines
	; GCN-IR-NEXT: v_addc_u32_e32 v13, vcc, 0, v9, vcc			; GCN-IR-NEXT: v_addc_u32_e32 v13, vcc, 0, v9, vcc
	; GCN-IR-NEXT: v_cmp_lt_u64_e32 vcc, v[12:13], v[8:9]			; GCN-IR-NEXT: v_cmp_lt_u64_e32 vcc, v[12:13], v[8:9]
	; GCN-IR-NEXT: v_mov_b32_e32 v8, v12			; GCN-IR-NEXT: v_mov_b32_e32 v8, v12
	; GCN-IR-NEXT: v_mov_b32_e32 v5, 0			; GCN-IR-NEXT: v_mov_b32_e32 v5, 0
	; GCN-IR-NEXT: v_sub_i32_e64 v10, s[4:5], v10, v15			; GCN-IR-NEXT: v_sub_i32_e64 v10, s[4:5], v10, v15
	; GCN-IR-NEXT: v_mov_b32_e32 v9, v13			; GCN-IR-NEXT: v_mov_b32_e32 v9, v13
	; GCN-IR-NEXT: v_mov_b32_e32 v13, v5			; GCN-IR-NEXT: v_mov_b32_e32 v13, v5
	; GCN-IR-NEXT: v_subb_u32_e64 v11, s[4:5], v11, v14, s[4:5]			; GCN-IR-NEXT: v_subb_u32_e64 v11, s[4:5], v11, v14, s[4:5]
	; GCN-IR-NEXT: s_or_b64 s[8:9], vcc, s[8:9]			; GCN-IR-NEXT: s_or_b64 s[10:11], vcc, s[10:11]
	; GCN-IR-NEXT: v_mov_b32_e32 v12, v4			; GCN-IR-NEXT: v_mov_b32_e32 v12, v4
	; GCN-IR-NEXT: s_andn2_b64 exec, exec, s[8:9]			; GCN-IR-NEXT: s_andn2_b64 exec, exec, s[10:11]
	; GCN-IR-NEXT: s_cbranch_execnz BB12_3			; GCN-IR-NEXT: s_cbranch_execnz BB12_3
	; GCN-IR-NEXT: ; %bb.4: ; %Flow			; GCN-IR-NEXT: ; %bb.4: ; %Flow
	; GCN-IR-NEXT: s_or_b64 exec, exec, s[8:9]
	; GCN-IR-NEXT: BB12_5: ; %Flow3
	; GCN-IR-NEXT: s_or_b64 exec, exec, s[10:11]			; GCN-IR-NEXT: s_or_b64 exec, exec, s[10:11]
				; GCN-IR-NEXT: BB12_5: ; %Flow3
				; GCN-IR-NEXT: s_or_b64 exec, exec, s[8:9]
	; GCN-IR-NEXT: v_lshl_b64 v[2:3], v[2:3], 1			; GCN-IR-NEXT: v_lshl_b64 v[2:3], v[2:3], 1
	; GCN-IR-NEXT: v_or_b32_e32 v5, v5, v3			; GCN-IR-NEXT: v_or_b32_e32 v5, v5, v3
	; GCN-IR-NEXT: v_or_b32_e32 v4, v4, v2			; GCN-IR-NEXT: v_or_b32_e32 v4, v4, v2
	; GCN-IR-NEXT: BB12_6: ; %Flow4			; GCN-IR-NEXT: BB12_6: ; %Flow4
	; GCN-IR-NEXT: s_or_b64 exec, exec, s[6:7]			; GCN-IR-NEXT: s_or_b64 exec, exec, s[6:7]
	; GCN-IR-NEXT: v_mul_lo_u32 v2, v0, v5			; GCN-IR-NEXT: v_mul_lo_u32 v2, v0, v5
	; GCN-IR-NEXT: v_mul_hi_u32 v3, v0, v4			; GCN-IR-NEXT: v_mul_hi_u32 v3, v0, v4
	; GCN-IR-NEXT: v_mul_lo_u32 v1, v1, v4			; GCN-IR-NEXT: v_mul_lo_u32 v1, v1, v4
	▲ Show 20 Lines • Show All 48 Lines • ▼ Show 20 Lines
	; GCN-IR-NEXT: s_cbranch_execz BB13_6			; GCN-IR-NEXT: s_cbranch_execz BB13_6
	; GCN-IR-NEXT: ; %bb.1: ; %udiv-bb1			; GCN-IR-NEXT: ; %bb.1: ; %udiv-bb1
	; GCN-IR-NEXT: v_add_i32_e32 v9, vcc, 1, v4			; GCN-IR-NEXT: v_add_i32_e32 v9, vcc, 1, v4
	; GCN-IR-NEXT: v_addc_u32_e32 v10, vcc, 0, v5, vcc			; GCN-IR-NEXT: v_addc_u32_e32 v10, vcc, 0, v5, vcc
	; GCN-IR-NEXT: v_cmp_ge_u64_e32 vcc, v[9:10], v[4:5]			; GCN-IR-NEXT: v_cmp_ge_u64_e32 vcc, v[9:10], v[4:5]
	; GCN-IR-NEXT: v_sub_i32_e64 v4, s[4:5], 63, v4			; GCN-IR-NEXT: v_sub_i32_e64 v4, s[4:5], 63, v4
	; GCN-IR-NEXT: v_mov_b32_e32 v6, 0			; GCN-IR-NEXT: v_mov_b32_e32 v6, 0
	; GCN-IR-NEXT: v_lshl_b64 v[4:5], v[0:1], v4			; GCN-IR-NEXT: v_lshl_b64 v[4:5], v[0:1], v4
	; GCN-IR-NEXT: s_mov_b64 s[8:9], 0			; GCN-IR-NEXT: s_mov_b64 s[10:11], 0
	; GCN-IR-NEXT: v_mov_b32_e32 v7, 0			; GCN-IR-NEXT: v_mov_b32_e32 v7, 0
	; GCN-IR-NEXT: s_and_saveexec_b64 s[4:5], vcc			; GCN-IR-NEXT: s_and_saveexec_b64 s[4:5], vcc
	; GCN-IR-NEXT: s_xor_b64 s[10:11], exec, s[4:5]			; GCN-IR-NEXT: s_xor_b64 s[8:9], exec, s[4:5]
	; GCN-IR-NEXT: s_cbranch_execz BB13_5			; GCN-IR-NEXT: s_cbranch_execz BB13_5
	; GCN-IR-NEXT: ; %bb.2: ; %udiv-preheader			; GCN-IR-NEXT: ; %bb.2: ; %udiv-preheader
	; GCN-IR-NEXT: v_mov_b32_e32 v12, 0			; GCN-IR-NEXT: v_mov_b32_e32 v12, 0
	; GCN-IR-NEXT: v_lshr_b64 v[10:11], v[0:1], v9			; GCN-IR-NEXT: v_lshr_b64 v[10:11], v[0:1], v9
	; GCN-IR-NEXT: v_add_i32_e32 v8, vcc, 0xffffffcf, v8			; GCN-IR-NEXT: v_add_i32_e32 v8, vcc, 0xffffffcf, v8
	; GCN-IR-NEXT: v_addc_u32_e64 v9, s[4:5], 0, -1, vcc			; GCN-IR-NEXT: v_addc_u32_e64 v9, s[4:5], 0, -1, vcc
	; GCN-IR-NEXT: v_mov_b32_e32 v13, 0			; GCN-IR-NEXT: v_mov_b32_e32 v13, 0
	; GCN-IR-NEXT: s_movk_i32 s12, 0x7fff			; GCN-IR-NEXT: s_movk_i32 s12, 0x7fff
	Show All 15 Lines
	; GCN-IR-NEXT: v_cmp_lt_u64_e32 vcc, v[12:13], v[8:9]			; GCN-IR-NEXT: v_cmp_lt_u64_e32 vcc, v[12:13], v[8:9]
	; GCN-IR-NEXT: v_mov_b32_e32 v8, v12			; GCN-IR-NEXT: v_mov_b32_e32 v8, v12
	; GCN-IR-NEXT: v_mov_b32_e32 v7, 0			; GCN-IR-NEXT: v_mov_b32_e32 v7, 0
	; GCN-IR-NEXT: v_mov_b32_e32 v9, v13			; GCN-IR-NEXT: v_mov_b32_e32 v9, v13
	; GCN-IR-NEXT: v_mov_b32_e32 v13, v7			; GCN-IR-NEXT: v_mov_b32_e32 v13, v7
	; GCN-IR-NEXT: v_mov_b32_e32 v15, 0			; GCN-IR-NEXT: v_mov_b32_e32 v15, 0
	; GCN-IR-NEXT: v_sub_i32_e64 v10, s[4:5], v10, v14			; GCN-IR-NEXT: v_sub_i32_e64 v10, s[4:5], v10, v14
	; GCN-IR-NEXT: v_subb_u32_e64 v11, s[4:5], v11, v15, s[4:5]			; GCN-IR-NEXT: v_subb_u32_e64 v11, s[4:5], v11, v15, s[4:5]
	; GCN-IR-NEXT: s_or_b64 s[8:9], vcc, s[8:9]			; GCN-IR-NEXT: s_or_b64 s[10:11], vcc, s[10:11]
	; GCN-IR-NEXT: v_mov_b32_e32 v12, v6			; GCN-IR-NEXT: v_mov_b32_e32 v12, v6
	; GCN-IR-NEXT: s_andn2_b64 exec, exec, s[8:9]			; GCN-IR-NEXT: s_andn2_b64 exec, exec, s[10:11]
	; GCN-IR-NEXT: s_cbranch_execnz BB13_3			; GCN-IR-NEXT: s_cbranch_execnz BB13_3
	; GCN-IR-NEXT: ; %bb.4: ; %Flow			; GCN-IR-NEXT: ; %bb.4: ; %Flow
	; GCN-IR-NEXT: s_or_b64 exec, exec, s[8:9]
	; GCN-IR-NEXT: BB13_5: ; %Flow3
	; GCN-IR-NEXT: s_or_b64 exec, exec, s[10:11]			; GCN-IR-NEXT: s_or_b64 exec, exec, s[10:11]
				; GCN-IR-NEXT: BB13_5: ; %Flow3
				; GCN-IR-NEXT: s_or_b64 exec, exec, s[8:9]
	; GCN-IR-NEXT: v_lshl_b64 v[4:5], v[4:5], 1			; GCN-IR-NEXT: v_lshl_b64 v[4:5], v[4:5], 1
	; GCN-IR-NEXT: v_or_b32_e32 v7, v7, v5			; GCN-IR-NEXT: v_or_b32_e32 v7, v7, v5
	; GCN-IR-NEXT: v_or_b32_e32 v6, v6, v4			; GCN-IR-NEXT: v_or_b32_e32 v6, v6, v4
	; GCN-IR-NEXT: BB13_6: ; %Flow4			; GCN-IR-NEXT: BB13_6: ; %Flow4
	; GCN-IR-NEXT: s_or_b64 exec, exec, s[6:7]			; GCN-IR-NEXT: s_or_b64 exec, exec, s[6:7]
	; GCN-IR-NEXT: v_lshl_b64 v[4:5], v[6:7], 15			; GCN-IR-NEXT: v_lshl_b64 v[4:5], v[6:7], 15
	; GCN-IR-NEXT: v_sub_i32_e32 v0, vcc, v0, v4			; GCN-IR-NEXT: v_sub_i32_e32 v0, vcc, v0, v4
	; GCN-IR-NEXT: v_subb_u32_e32 v1, vcc, v1, v5, vcc			; GCN-IR-NEXT: v_subb_u32_e32 v1, vcc, v1, v5, vcc
	▲ Show 20 Lines • Show All 268 Lines • Show Last 20 Lines

llvm/test/CodeGen/AMDGPU/transform-block-with-return-to-epilog.ll

Show First 20 Lines • Show All 112 Lines • ▼ Show 20 Lines	define amdgpu_ps { <4 x float> } @test_return_to_epilog_with_optimized_kill(float %val) #0 {
; GCN: bb.5.kill0:		; GCN: bb.5.kill0:
; GCN: successors: %bb.6(0x80000000)		; GCN: successors: %bb.6(0x80000000)
; GCN: liveins: $sgpr0_sgpr1		; GCN: liveins: $sgpr0_sgpr1
; GCN: $exec = S_MOV_B64 0		; GCN: $exec = S_MOV_B64 0
; GCN: bb.6.end:		; GCN: bb.6.end:
; GCN: successors: %bb.7(0x40000000), %bb.8(0x40000000)		; GCN: successors: %bb.7(0x40000000), %bb.8(0x40000000)
; GCN: liveins: $sgpr0_sgpr1		; GCN: liveins: $sgpr0_sgpr1
; GCN: $exec = S_OR_B64 $exec, killed renamable $sgpr0_sgpr1, implicit-def $scc		; GCN: $exec = S_OR_B64 $exec, killed renamable $sgpr0_sgpr1, implicit-def $scc
; GCN: S_CBRANCH_EXECZ %bb.7, implicit $exec		; GCN: S_CBRANCH_EXECZ %bb.8, implicit $exec
; GCN: S_BRANCH %bb.8		; GCN: bb.7.end:
; GCN: bb.7:		; GCN: successors: %bb.9(0x80000000)
		; GCN: S_BRANCH %bb.9
		; GCN: bb.8:
; GCN: EXP_DONE 9, undef $vgpr0, undef $vgpr0, undef $vgpr0, undef $vgpr0, 1, 0, 0, implicit $exec		; GCN: EXP_DONE 9, undef $vgpr0, undef $vgpr0, undef $vgpr0, undef $vgpr0, 1, 0, 0, implicit $exec
; GCN: S_ENDPGM 0		; GCN: S_ENDPGM 0
; GCN: bb.8:		; GCN: bb.9:
entry:		entry:
%.i0 = fdiv reassoc nnan nsz arcp contract afn float 1.000000e+00, %val		%.i0 = fdiv reassoc nnan nsz arcp contract afn float 1.000000e+00, %val
%cmp0 = fcmp olt float %.i0, 0.000000e+00		%cmp0 = fcmp olt float %.i0, 0.000000e+00
br i1 %cmp0, label %kill0, label %flow		br i1 %cmp0, label %kill0, label %flow

kill0: ; preds = %entry		kill0: ; preds = %entry
call void @llvm.amdgcn.kill(i1 false)		call void @llvm.amdgcn.kill(i1 false)
br label %end		br label %end
Show All 16 Lines

llvm/test/CodeGen/AMDGPU/udiv64.ll

	Show First 20 Lines • Show All 368 Lines • ▼ Show 20 Lines
	; GCN-IR-NEXT: s_cbranch_execz BB1_6			; GCN-IR-NEXT: s_cbranch_execz BB1_6
	; GCN-IR-NEXT: ; %bb.1: ; %udiv-bb1			; GCN-IR-NEXT: ; %bb.1: ; %udiv-bb1
	; GCN-IR-NEXT: v_add_i32_e32 v12, vcc, 1, v6			; GCN-IR-NEXT: v_add_i32_e32 v12, vcc, 1, v6
	; GCN-IR-NEXT: v_addc_u32_e32 v13, vcc, 0, v7, vcc			; GCN-IR-NEXT: v_addc_u32_e32 v13, vcc, 0, v7, vcc
	; GCN-IR-NEXT: v_sub_i32_e64 v4, s[4:5], 63, v6			; GCN-IR-NEXT: v_sub_i32_e64 v4, s[4:5], 63, v6
	; GCN-IR-NEXT: v_cmp_ge_u64_e32 vcc, v[12:13], v[6:7]			; GCN-IR-NEXT: v_cmp_ge_u64_e32 vcc, v[12:13], v[6:7]
	; GCN-IR-NEXT: v_mov_b32_e32 v6, 0			; GCN-IR-NEXT: v_mov_b32_e32 v6, 0
	; GCN-IR-NEXT: v_lshl_b64 v[4:5], v[0:1], v4			; GCN-IR-NEXT: v_lshl_b64 v[4:5], v[0:1], v4
	; GCN-IR-NEXT: s_mov_b64 s[8:9], 0			; GCN-IR-NEXT: s_mov_b64 s[10:11], 0
	; GCN-IR-NEXT: v_mov_b32_e32 v7, 0			; GCN-IR-NEXT: v_mov_b32_e32 v7, 0
	; GCN-IR-NEXT: s_and_saveexec_b64 s[4:5], vcc			; GCN-IR-NEXT: s_and_saveexec_b64 s[4:5], vcc
	; GCN-IR-NEXT: s_xor_b64 s[10:11], exec, s[4:5]			; GCN-IR-NEXT: s_xor_b64 s[8:9], exec, s[4:5]
	; GCN-IR-NEXT: s_cbranch_execz BB1_5			; GCN-IR-NEXT: s_cbranch_execz BB1_5
	; GCN-IR-NEXT: ; %bb.2: ; %udiv-preheader			; GCN-IR-NEXT: ; %bb.2: ; %udiv-preheader
	; GCN-IR-NEXT: v_lshr_b64 v[12:13], v[0:1], v12			; GCN-IR-NEXT: v_lshr_b64 v[12:13], v[0:1], v12
	; GCN-IR-NEXT: v_add_i32_e32 v0, vcc, -1, v2			; GCN-IR-NEXT: v_add_i32_e32 v0, vcc, -1, v2
	; GCN-IR-NEXT: v_addc_u32_e32 v1, vcc, -1, v3, vcc			; GCN-IR-NEXT: v_addc_u32_e32 v1, vcc, -1, v3, vcc
	; GCN-IR-NEXT: v_not_b32_e32 v6, v8			; GCN-IR-NEXT: v_not_b32_e32 v6, v8
	; GCN-IR-NEXT: v_not_b32_e32 v7, v9			; GCN-IR-NEXT: v_not_b32_e32 v7, v9
	; GCN-IR-NEXT: v_add_i32_e32 v8, vcc, v6, v10			; GCN-IR-NEXT: v_add_i32_e32 v8, vcc, v6, v10
	Show All 18 Lines
	; GCN-IR-NEXT: v_addc_u32_e32 v11, vcc, 0, v9, vcc			; GCN-IR-NEXT: v_addc_u32_e32 v11, vcc, 0, v9, vcc
	; GCN-IR-NEXT: v_cmp_lt_u64_e32 vcc, v[10:11], v[8:9]			; GCN-IR-NEXT: v_cmp_lt_u64_e32 vcc, v[10:11], v[8:9]
	; GCN-IR-NEXT: v_mov_b32_e32 v8, v10			; GCN-IR-NEXT: v_mov_b32_e32 v8, v10
	; GCN-IR-NEXT: v_mov_b32_e32 v7, 0			; GCN-IR-NEXT: v_mov_b32_e32 v7, 0
	; GCN-IR-NEXT: v_sub_i32_e64 v12, s[4:5], v12, v15			; GCN-IR-NEXT: v_sub_i32_e64 v12, s[4:5], v12, v15
	; GCN-IR-NEXT: v_mov_b32_e32 v9, v11			; GCN-IR-NEXT: v_mov_b32_e32 v9, v11
	; GCN-IR-NEXT: v_mov_b32_e32 v11, v7			; GCN-IR-NEXT: v_mov_b32_e32 v11, v7
	; GCN-IR-NEXT: v_subb_u32_e64 v13, s[4:5], v13, v14, s[4:5]			; GCN-IR-NEXT: v_subb_u32_e64 v13, s[4:5], v13, v14, s[4:5]
	; GCN-IR-NEXT: s_or_b64 s[8:9], vcc, s[8:9]			; GCN-IR-NEXT: s_or_b64 s[10:11], vcc, s[10:11]
	; GCN-IR-NEXT: v_mov_b32_e32 v10, v6			; GCN-IR-NEXT: v_mov_b32_e32 v10, v6
	; GCN-IR-NEXT: s_andn2_b64 exec, exec, s[8:9]			; GCN-IR-NEXT: s_andn2_b64 exec, exec, s[10:11]
	; GCN-IR-NEXT: s_cbranch_execnz BB1_3			; GCN-IR-NEXT: s_cbranch_execnz BB1_3
	; GCN-IR-NEXT: ; %bb.4: ; %Flow			; GCN-IR-NEXT: ; %bb.4: ; %Flow
	; GCN-IR-NEXT: s_or_b64 exec, exec, s[8:9]
	; GCN-IR-NEXT: BB1_5: ; %Flow3
	; GCN-IR-NEXT: s_or_b64 exec, exec, s[10:11]			; GCN-IR-NEXT: s_or_b64 exec, exec, s[10:11]
				; GCN-IR-NEXT: BB1_5: ; %Flow3
				; GCN-IR-NEXT: s_or_b64 exec, exec, s[8:9]
	; GCN-IR-NEXT: v_lshl_b64 v[0:1], v[4:5], 1			; GCN-IR-NEXT: v_lshl_b64 v[0:1], v[4:5], 1
	; GCN-IR-NEXT: v_or_b32_e32 v4, v7, v1			; GCN-IR-NEXT: v_or_b32_e32 v4, v7, v1
	; GCN-IR-NEXT: v_or_b32_e32 v5, v6, v0			; GCN-IR-NEXT: v_or_b32_e32 v5, v6, v0
	; GCN-IR-NEXT: BB1_6: ; %Flow4			; GCN-IR-NEXT: BB1_6: ; %Flow4
	; GCN-IR-NEXT: s_or_b64 exec, exec, s[6:7]			; GCN-IR-NEXT: s_or_b64 exec, exec, s[6:7]
	; GCN-IR-NEXT: v_mov_b32_e32 v0, v5			; GCN-IR-NEXT: v_mov_b32_e32 v0, v5
	; GCN-IR-NEXT: v_mov_b32_e32 v1, v4			; GCN-IR-NEXT: v_mov_b32_e32 v1, v4
	; GCN-IR-NEXT: s_setpc_b64 s[30:31]			; GCN-IR-NEXT: s_setpc_b64 s[30:31]
	▲ Show 20 Lines • Show All 835 Lines • ▼ Show 20 Lines
	; GCN-IR-NEXT: s_and_b64 s[4:5], s[4:5], vcc			; GCN-IR-NEXT: s_and_b64 s[4:5], s[4:5], vcc
	; GCN-IR-NEXT: s_and_saveexec_b64 s[6:7], s[4:5]			; GCN-IR-NEXT: s_and_saveexec_b64 s[6:7], s[4:5]
	; GCN-IR-NEXT: s_cbranch_execz BB9_6			; GCN-IR-NEXT: s_cbranch_execz BB9_6
	; GCN-IR-NEXT: ; %bb.1: ; %udiv-bb1			; GCN-IR-NEXT: ; %bb.1: ; %udiv-bb1
	; GCN-IR-NEXT: v_add_i32_e32 v6, vcc, 1, v4			; GCN-IR-NEXT: v_add_i32_e32 v6, vcc, 1, v4
	; GCN-IR-NEXT: v_addc_u32_e32 v7, vcc, 0, v5, vcc			; GCN-IR-NEXT: v_addc_u32_e32 v7, vcc, 0, v5, vcc
	; GCN-IR-NEXT: v_sub_i32_e64 v2, s[4:5], 63, v4			; GCN-IR-NEXT: v_sub_i32_e64 v2, s[4:5], 63, v4
	; GCN-IR-NEXT: v_cmp_ge_u64_e32 vcc, v[6:7], v[4:5]			; GCN-IR-NEXT: v_cmp_ge_u64_e32 vcc, v[6:7], v[4:5]
	; GCN-IR-NEXT: v_lshl_b64 v[2:3], s[8:9], v2
	; GCN-IR-NEXT: v_mov_b32_e32 v4, 0			; GCN-IR-NEXT: v_mov_b32_e32 v4, 0
	; GCN-IR-NEXT: s_mov_b64 s[8:9], 0			; GCN-IR-NEXT: v_lshl_b64 v[2:3], s[8:9], v2
				; GCN-IR-NEXT: s_mov_b64 s[10:11], 0
	; GCN-IR-NEXT: v_mov_b32_e32 v5, 0			; GCN-IR-NEXT: v_mov_b32_e32 v5, 0
	; GCN-IR-NEXT: s_and_saveexec_b64 s[4:5], vcc			; GCN-IR-NEXT: s_and_saveexec_b64 s[4:5], vcc
	; GCN-IR-NEXT: s_xor_b64 s[10:11], exec, s[4:5]			; GCN-IR-NEXT: s_xor_b64 s[8:9], exec, s[4:5]
	; GCN-IR-NEXT: s_cbranch_execz BB9_5			; GCN-IR-NEXT: s_cbranch_execz BB9_5
	; GCN-IR-NEXT: ; %bb.2: ; %udiv-preheader			; GCN-IR-NEXT: ; %bb.2: ; %udiv-preheader
	; GCN-IR-NEXT: s_mov_b32 s5, 0			; GCN-IR-NEXT: s_mov_b32 s5, 0
	; GCN-IR-NEXT: s_mov_b32 s4, 0x8000			; GCN-IR-NEXT: s_mov_b32 s4, 0x8000
	; GCN-IR-NEXT: v_lshr_b64 v[10:11], s[4:5], v6			; GCN-IR-NEXT: v_lshr_b64 v[10:11], s[4:5], v6
	; GCN-IR-NEXT: v_add_i32_e32 v6, vcc, -1, v0			; GCN-IR-NEXT: v_add_i32_e32 v6, vcc, -1, v0
	; GCN-IR-NEXT: v_addc_u32_e32 v7, vcc, -1, v1, vcc			; GCN-IR-NEXT: v_addc_u32_e32 v7, vcc, -1, v1, vcc
	; GCN-IR-NEXT: v_sub_i32_e32 v8, vcc, 47, v8			; GCN-IR-NEXT: v_sub_i32_e32 v8, vcc, 47, v8
	Show All 18 Lines
	; GCN-IR-NEXT: v_addc_u32_e32 v13, vcc, 0, v9, vcc			; GCN-IR-NEXT: v_addc_u32_e32 v13, vcc, 0, v9, vcc
	; GCN-IR-NEXT: v_cmp_lt_u64_e32 vcc, v[12:13], v[8:9]			; GCN-IR-NEXT: v_cmp_lt_u64_e32 vcc, v[12:13], v[8:9]
	; GCN-IR-NEXT: v_mov_b32_e32 v8, v12			; GCN-IR-NEXT: v_mov_b32_e32 v8, v12
	; GCN-IR-NEXT: v_mov_b32_e32 v5, 0			; GCN-IR-NEXT: v_mov_b32_e32 v5, 0
	; GCN-IR-NEXT: v_sub_i32_e64 v10, s[4:5], v10, v15			; GCN-IR-NEXT: v_sub_i32_e64 v10, s[4:5], v10, v15
	; GCN-IR-NEXT: v_mov_b32_e32 v9, v13			; GCN-IR-NEXT: v_mov_b32_e32 v9, v13
	; GCN-IR-NEXT: v_mov_b32_e32 v13, v5			; GCN-IR-NEXT: v_mov_b32_e32 v13, v5
	; GCN-IR-NEXT: v_subb_u32_e64 v11, s[4:5], v11, v14, s[4:5]			; GCN-IR-NEXT: v_subb_u32_e64 v11, s[4:5], v11, v14, s[4:5]
	; GCN-IR-NEXT: s_or_b64 s[8:9], vcc, s[8:9]			; GCN-IR-NEXT: s_or_b64 s[10:11], vcc, s[10:11]
	; GCN-IR-NEXT: v_mov_b32_e32 v12, v4			; GCN-IR-NEXT: v_mov_b32_e32 v12, v4
	; GCN-IR-NEXT: s_andn2_b64 exec, exec, s[8:9]			; GCN-IR-NEXT: s_andn2_b64 exec, exec, s[10:11]
	; GCN-IR-NEXT: s_cbranch_execnz BB9_3			; GCN-IR-NEXT: s_cbranch_execnz BB9_3
	; GCN-IR-NEXT: ; %bb.4: ; %Flow			; GCN-IR-NEXT: ; %bb.4: ; %Flow
	; GCN-IR-NEXT: s_or_b64 exec, exec, s[8:9]
	; GCN-IR-NEXT: BB9_5: ; %Flow3
	; GCN-IR-NEXT: s_or_b64 exec, exec, s[10:11]			; GCN-IR-NEXT: s_or_b64 exec, exec, s[10:11]
				; GCN-IR-NEXT: BB9_5: ; %Flow3
				; GCN-IR-NEXT: s_or_b64 exec, exec, s[8:9]
	; GCN-IR-NEXT: v_lshl_b64 v[0:1], v[2:3], 1			; GCN-IR-NEXT: v_lshl_b64 v[0:1], v[2:3], 1
	; GCN-IR-NEXT: v_or_b32_e32 v3, v5, v1			; GCN-IR-NEXT: v_or_b32_e32 v3, v5, v1
	; GCN-IR-NEXT: v_or_b32_e32 v2, v4, v0			; GCN-IR-NEXT: v_or_b32_e32 v2, v4, v0
	; GCN-IR-NEXT: BB9_6: ; %Flow4			; GCN-IR-NEXT: BB9_6: ; %Flow4
	; GCN-IR-NEXT: s_or_b64 exec, exec, s[6:7]			; GCN-IR-NEXT: s_or_b64 exec, exec, s[6:7]
	; GCN-IR-NEXT: v_mov_b32_e32 v0, v2			; GCN-IR-NEXT: v_mov_b32_e32 v0, v2
	; GCN-IR-NEXT: v_mov_b32_e32 v1, v3			; GCN-IR-NEXT: v_mov_b32_e32 v1, v3
	; GCN-IR-NEXT: s_setpc_b64 s[30:31]			; GCN-IR-NEXT: s_setpc_b64 s[30:31]
	Show All 31 Lines
	; GCN-IR-NEXT: s_cbranch_execz BB10_6			; GCN-IR-NEXT: s_cbranch_execz BB10_6
	; GCN-IR-NEXT: ; %bb.1: ; %udiv-bb1			; GCN-IR-NEXT: ; %bb.1: ; %udiv-bb1
	; GCN-IR-NEXT: v_add_i32_e32 v7, vcc, 1, v4			; GCN-IR-NEXT: v_add_i32_e32 v7, vcc, 1, v4
	; GCN-IR-NEXT: v_addc_u32_e32 v8, vcc, 0, v5, vcc			; GCN-IR-NEXT: v_addc_u32_e32 v8, vcc, 0, v5, vcc
	; GCN-IR-NEXT: v_sub_i32_e64 v2, s[4:5], 63, v4			; GCN-IR-NEXT: v_sub_i32_e64 v2, s[4:5], 63, v4
	; GCN-IR-NEXT: v_cmp_ge_u64_e32 vcc, v[7:8], v[4:5]			; GCN-IR-NEXT: v_cmp_ge_u64_e32 vcc, v[7:8], v[4:5]
	; GCN-IR-NEXT: v_mov_b32_e32 v4, 0			; GCN-IR-NEXT: v_mov_b32_e32 v4, 0
	; GCN-IR-NEXT: v_lshl_b64 v[2:3], v[0:1], v2			; GCN-IR-NEXT: v_lshl_b64 v[2:3], v[0:1], v2
	; GCN-IR-NEXT: s_mov_b64 s[8:9], 0			; GCN-IR-NEXT: s_mov_b64 s[10:11], 0
	; GCN-IR-NEXT: v_mov_b32_e32 v5, 0			; GCN-IR-NEXT: v_mov_b32_e32 v5, 0
	; GCN-IR-NEXT: s_and_saveexec_b64 s[4:5], vcc			; GCN-IR-NEXT: s_and_saveexec_b64 s[4:5], vcc
	; GCN-IR-NEXT: s_xor_b64 s[10:11], exec, s[4:5]			; GCN-IR-NEXT: s_xor_b64 s[8:9], exec, s[4:5]
	; GCN-IR-NEXT: s_cbranch_execz BB10_5			; GCN-IR-NEXT: s_cbranch_execz BB10_5
	; GCN-IR-NEXT: ; %bb.2: ; %udiv-preheader			; GCN-IR-NEXT: ; %bb.2: ; %udiv-preheader
	; GCN-IR-NEXT: v_lshr_b64 v[7:8], v[0:1], v7			; GCN-IR-NEXT: v_lshr_b64 v[7:8], v[0:1], v7
	; GCN-IR-NEXT: v_add_i32_e32 v0, vcc, 0xffffffcf, v6			; GCN-IR-NEXT: v_add_i32_e32 v0, vcc, 0xffffffcf, v6
	; GCN-IR-NEXT: v_mov_b32_e32 v9, 0			; GCN-IR-NEXT: v_mov_b32_e32 v9, 0
	; GCN-IR-NEXT: v_addc_u32_e64 v1, s[4:5], 0, -1, vcc			; GCN-IR-NEXT: v_addc_u32_e64 v1, s[4:5], 0, -1, vcc
	; GCN-IR-NEXT: v_mov_b32_e32 v10, 0			; GCN-IR-NEXT: v_mov_b32_e32 v10, 0
	; GCN-IR-NEXT: s_movk_i32 s12, 0x7fff			; GCN-IR-NEXT: s_movk_i32 s12, 0x7fff
	Show All 15 Lines
	; GCN-IR-NEXT: v_and_b32_e32 v7, 0x8000, v7			; GCN-IR-NEXT: v_and_b32_e32 v7, 0x8000, v7
	; GCN-IR-NEXT: v_mov_b32_e32 v0, v9			; GCN-IR-NEXT: v_mov_b32_e32 v0, v9
	; GCN-IR-NEXT: v_mov_b32_e32 v5, 0			; GCN-IR-NEXT: v_mov_b32_e32 v5, 0
	; GCN-IR-NEXT: v_mov_b32_e32 v1, v10			; GCN-IR-NEXT: v_mov_b32_e32 v1, v10
	; GCN-IR-NEXT: v_mov_b32_e32 v10, v5			; GCN-IR-NEXT: v_mov_b32_e32 v10, v5
	; GCN-IR-NEXT: v_mov_b32_e32 v11, 0			; GCN-IR-NEXT: v_mov_b32_e32 v11, 0
	; GCN-IR-NEXT: v_sub_i32_e64 v7, s[4:5], v6, v7			; GCN-IR-NEXT: v_sub_i32_e64 v7, s[4:5], v6, v7
	; GCN-IR-NEXT: v_subb_u32_e64 v8, s[4:5], v8, v11, s[4:5]			; GCN-IR-NEXT: v_subb_u32_e64 v8, s[4:5], v8, v11, s[4:5]
	; GCN-IR-NEXT: s_or_b64 s[8:9], vcc, s[8:9]			; GCN-IR-NEXT: s_or_b64 s[10:11], vcc, s[10:11]
	; GCN-IR-NEXT: v_mov_b32_e32 v9, v4			; GCN-IR-NEXT: v_mov_b32_e32 v9, v4
	; GCN-IR-NEXT: s_andn2_b64 exec, exec, s[8:9]			; GCN-IR-NEXT: s_andn2_b64 exec, exec, s[10:11]
	; GCN-IR-NEXT: s_cbranch_execnz BB10_3			; GCN-IR-NEXT: s_cbranch_execnz BB10_3
	; GCN-IR-NEXT: ; %bb.4: ; %Flow			; GCN-IR-NEXT: ; %bb.4: ; %Flow
	; GCN-IR-NEXT: s_or_b64 exec, exec, s[8:9]
	; GCN-IR-NEXT: BB10_5: ; %Flow3
	; GCN-IR-NEXT: s_or_b64 exec, exec, s[10:11]			; GCN-IR-NEXT: s_or_b64 exec, exec, s[10:11]
				; GCN-IR-NEXT: BB10_5: ; %Flow3
				; GCN-IR-NEXT: s_or_b64 exec, exec, s[8:9]
	; GCN-IR-NEXT: v_lshl_b64 v[0:1], v[2:3], 1			; GCN-IR-NEXT: v_lshl_b64 v[0:1], v[2:3], 1
	; GCN-IR-NEXT: v_or_b32_e32 v2, v5, v1			; GCN-IR-NEXT: v_or_b32_e32 v2, v5, v1
	; GCN-IR-NEXT: v_or_b32_e32 v3, v4, v0			; GCN-IR-NEXT: v_or_b32_e32 v3, v4, v0
	; GCN-IR-NEXT: BB10_6: ; %Flow4			; GCN-IR-NEXT: BB10_6: ; %Flow4
	; GCN-IR-NEXT: s_or_b64 exec, exec, s[6:7]			; GCN-IR-NEXT: s_or_b64 exec, exec, s[6:7]
	; GCN-IR-NEXT: v_mov_b32_e32 v0, v3			; GCN-IR-NEXT: v_mov_b32_e32 v0, v3
	; GCN-IR-NEXT: v_mov_b32_e32 v1, v2			; GCN-IR-NEXT: v_mov_b32_e32 v1, v2
	; GCN-IR-NEXT: s_setpc_b64 s[30:31]			; GCN-IR-NEXT: s_setpc_b64 s[30:31]
	▲ Show 20 Lines • Show All 318 Lines • ▼ Show 20 Lines
	; GCN-IR-NEXT: s_cbranch_execz BB12_6			; GCN-IR-NEXT: s_cbranch_execz BB12_6
	; GCN-IR-NEXT: ; %bb.1: ; %udiv-bb1			; GCN-IR-NEXT: ; %bb.1: ; %udiv-bb1
	; GCN-IR-NEXT: v_add_i32_e32 v7, vcc, 1, v4			; GCN-IR-NEXT: v_add_i32_e32 v7, vcc, 1, v4
	; GCN-IR-NEXT: v_addc_u32_e32 v8, vcc, 0, v5, vcc			; GCN-IR-NEXT: v_addc_u32_e32 v8, vcc, 0, v5, vcc
	; GCN-IR-NEXT: v_sub_i32_e64 v2, s[4:5], 63, v4			; GCN-IR-NEXT: v_sub_i32_e64 v2, s[4:5], 63, v4
	; GCN-IR-NEXT: v_cmp_ge_u64_e32 vcc, v[7:8], v[4:5]			; GCN-IR-NEXT: v_cmp_ge_u64_e32 vcc, v[7:8], v[4:5]
	; GCN-IR-NEXT: v_mov_b32_e32 v4, 0			; GCN-IR-NEXT: v_mov_b32_e32 v4, 0
	; GCN-IR-NEXT: v_lshl_b64 v[2:3], v[0:1], v2			; GCN-IR-NEXT: v_lshl_b64 v[2:3], v[0:1], v2
	; GCN-IR-NEXT: s_mov_b64 s[8:9], 0			; GCN-IR-NEXT: s_mov_b64 s[10:11], 0
	; GCN-IR-NEXT: v_mov_b32_e32 v5, 0			; GCN-IR-NEXT: v_mov_b32_e32 v5, 0
	; GCN-IR-NEXT: s_and_saveexec_b64 s[4:5], vcc			; GCN-IR-NEXT: s_and_saveexec_b64 s[4:5], vcc
	; GCN-IR-NEXT: s_xor_b64 s[10:11], exec, s[4:5]			; GCN-IR-NEXT: s_xor_b64 s[8:9], exec, s[4:5]
	; GCN-IR-NEXT: s_cbranch_execz BB12_5			; GCN-IR-NEXT: s_cbranch_execz BB12_5
	; GCN-IR-NEXT: ; %bb.2: ; %udiv-preheader			; GCN-IR-NEXT: ; %bb.2: ; %udiv-preheader
	; GCN-IR-NEXT: v_lshr_b64 v[7:8], v[0:1], v7			; GCN-IR-NEXT: v_lshr_b64 v[7:8], v[0:1], v7
	; GCN-IR-NEXT: v_add_i32_e32 v0, vcc, 0xffffffc4, v6			; GCN-IR-NEXT: v_add_i32_e32 v0, vcc, 0xffffffc4, v6
	; GCN-IR-NEXT: v_mov_b32_e32 v9, 0			; GCN-IR-NEXT: v_mov_b32_e32 v9, 0
	; GCN-IR-NEXT: v_addc_u32_e64 v1, s[4:5], 0, -1, vcc			; GCN-IR-NEXT: v_addc_u32_e64 v1, s[4:5], 0, -1, vcc
	; GCN-IR-NEXT: v_mov_b32_e32 v10, 0			; GCN-IR-NEXT: v_mov_b32_e32 v10, 0
	; GCN-IR-NEXT: BB12_3: ; %udiv-do-while			; GCN-IR-NEXT: BB12_3: ; %udiv-do-while
	Show All 13 Lines
	; GCN-IR-NEXT: v_and_b32_e32 v4, 1, v7			; GCN-IR-NEXT: v_and_b32_e32 v4, 1, v7
	; GCN-IR-NEXT: v_and_b32_e32 v7, 24, v7			; GCN-IR-NEXT: v_and_b32_e32 v7, 24, v7
	; GCN-IR-NEXT: v_mov_b32_e32 v0, v9			; GCN-IR-NEXT: v_mov_b32_e32 v0, v9
	; GCN-IR-NEXT: v_mov_b32_e32 v5, 0			; GCN-IR-NEXT: v_mov_b32_e32 v5, 0
	; GCN-IR-NEXT: v_sub_i32_e64 v7, s[4:5], v6, v7			; GCN-IR-NEXT: v_sub_i32_e64 v7, s[4:5], v6, v7
	; GCN-IR-NEXT: v_mov_b32_e32 v1, v10			; GCN-IR-NEXT: v_mov_b32_e32 v1, v10
	; GCN-IR-NEXT: v_mov_b32_e32 v10, v5			; GCN-IR-NEXT: v_mov_b32_e32 v10, v5
	; GCN-IR-NEXT: v_subbrev_u32_e64 v8, s[4:5], 0, v8, s[4:5]			; GCN-IR-NEXT: v_subbrev_u32_e64 v8, s[4:5], 0, v8, s[4:5]
	; GCN-IR-NEXT: s_or_b64 s[8:9], vcc, s[8:9]			; GCN-IR-NEXT: s_or_b64 s[10:11], vcc, s[10:11]
	; GCN-IR-NEXT: v_mov_b32_e32 v9, v4			; GCN-IR-NEXT: v_mov_b32_e32 v9, v4
	; GCN-IR-NEXT: s_andn2_b64 exec, exec, s[8:9]			; GCN-IR-NEXT: s_andn2_b64 exec, exec, s[10:11]
	; GCN-IR-NEXT: s_cbranch_execnz BB12_3			; GCN-IR-NEXT: s_cbranch_execnz BB12_3
	; GCN-IR-NEXT: ; %bb.4: ; %Flow			; GCN-IR-NEXT: ; %bb.4: ; %Flow
	; GCN-IR-NEXT: s_or_b64 exec, exec, s[8:9]
	; GCN-IR-NEXT: BB12_5: ; %Flow3
	; GCN-IR-NEXT: s_or_b64 exec, exec, s[10:11]			; GCN-IR-NEXT: s_or_b64 exec, exec, s[10:11]
				; GCN-IR-NEXT: BB12_5: ; %Flow3
				; GCN-IR-NEXT: s_or_b64 exec, exec, s[8:9]
	; GCN-IR-NEXT: v_lshl_b64 v[0:1], v[2:3], 1			; GCN-IR-NEXT: v_lshl_b64 v[0:1], v[2:3], 1
	; GCN-IR-NEXT: v_or_b32_e32 v2, v5, v1			; GCN-IR-NEXT: v_or_b32_e32 v2, v5, v1
	; GCN-IR-NEXT: v_or_b32_e32 v3, v4, v0			; GCN-IR-NEXT: v_or_b32_e32 v3, v4, v0
	; GCN-IR-NEXT: BB12_6: ; %Flow4			; GCN-IR-NEXT: BB12_6: ; %Flow4
	; GCN-IR-NEXT: s_or_b64 exec, exec, s[6:7]			; GCN-IR-NEXT: s_or_b64 exec, exec, s[6:7]
	; GCN-IR-NEXT: v_mov_b32_e32 v0, v3			; GCN-IR-NEXT: v_mov_b32_e32 v0, v3
	; GCN-IR-NEXT: v_mov_b32_e32 v1, v2			; GCN-IR-NEXT: v_mov_b32_e32 v1, v2
	; GCN-IR-NEXT: s_setpc_b64 s[30:31]			; GCN-IR-NEXT: s_setpc_b64 s[30:31]
	▲ Show 20 Lines • Show All 207 Lines • Show Last 20 Lines

llvm/test/CodeGen/AMDGPU/urem64.ll

	Show First 20 Lines • Show All 371 Lines • ▼ Show 20 Lines
	; GCN-IR-NEXT: s_xor_b64 s[6:7], s[4:5], -1			; GCN-IR-NEXT: s_xor_b64 s[6:7], s[4:5], -1
	; GCN-IR-NEXT: v_mov_b32_e32 v13, v11			; GCN-IR-NEXT: v_mov_b32_e32 v13, v11
	; GCN-IR-NEXT: v_cndmask_b32_e64 v7, v1, 0, s[4:5]			; GCN-IR-NEXT: v_cndmask_b32_e64 v7, v1, 0, s[4:5]
	; GCN-IR-NEXT: v_cndmask_b32_e64 v4, v0, 0, s[4:5]			; GCN-IR-NEXT: v_cndmask_b32_e64 v4, v0, 0, s[4:5]
	; GCN-IR-NEXT: s_and_b64 s[4:5], s[6:7], vcc			; GCN-IR-NEXT: s_and_b64 s[4:5], s[6:7], vcc
	; GCN-IR-NEXT: s_and_saveexec_b64 s[6:7], s[4:5]			; GCN-IR-NEXT: s_and_saveexec_b64 s[6:7], s[4:5]
	; GCN-IR-NEXT: s_cbranch_execz BB1_6			; GCN-IR-NEXT: s_cbranch_execz BB1_6
	; GCN-IR-NEXT: ; %bb.1: ; %udiv-bb1			; GCN-IR-NEXT: ; %bb.1: ; %udiv-bb1
	; GCN-IR-NEXT: v_add_i32_e32 v7, vcc, 1, v5			; GCN-IR-NEXT: v_add_i32_e32 v8, vcc, 1, v5
	; GCN-IR-NEXT: v_addc_u32_e32 v8, vcc, 0, v6, vcc			; GCN-IR-NEXT: v_addc_u32_e32 v9, vcc, 0, v6, vcc
	; GCN-IR-NEXT: v_sub_i32_e64 v4, s[4:5], 63, v5			; GCN-IR-NEXT: v_sub_i32_e64 v4, s[4:5], 63, v5
	; GCN-IR-NEXT: v_cmp_ge_u64_e32 vcc, v[7:8], v[5:6]			; GCN-IR-NEXT: v_cmp_ge_u64_e32 vcc, v[8:9], v[5:6]
	; GCN-IR-NEXT: v_mov_b32_e32 v8, 0			; GCN-IR-NEXT: v_mov_b32_e32 v6, 0
	; GCN-IR-NEXT: v_lshl_b64 v[4:5], v[0:1], v4			; GCN-IR-NEXT: v_lshl_b64 v[4:5], v[0:1], v4
	; GCN-IR-NEXT: s_mov_b64 s[8:9], 0			; GCN-IR-NEXT: s_mov_b64 s[10:11], 0
	; GCN-IR-NEXT: v_mov_b32_e32 v9, 0			; GCN-IR-NEXT: v_mov_b32_e32 v7, 0
	; GCN-IR-NEXT: s_and_saveexec_b64 s[4:5], vcc			; GCN-IR-NEXT: s_and_saveexec_b64 s[4:5], vcc
	; GCN-IR-NEXT: s_xor_b64 s[10:11], exec, s[4:5]			; GCN-IR-NEXT: s_xor_b64 s[8:9], exec, s[4:5]
	; GCN-IR-NEXT: s_cbranch_execz BB1_5			; GCN-IR-NEXT: s_cbranch_execz BB1_5
	; GCN-IR-NEXT: ; %bb.2: ; %udiv-preheader			; GCN-IR-NEXT: ; %bb.2: ; %udiv-preheader
	; GCN-IR-NEXT: v_add_i32_e32 v6, vcc, -1, v2			; GCN-IR-NEXT: v_lshr_b64 v[14:15], v[0:1], v8
	; GCN-IR-NEXT: v_lshr_b64 v[14:15], v[0:1], v7			; GCN-IR-NEXT: v_add_i32_e32 v8, vcc, -1, v2
	; GCN-IR-NEXT: v_addc_u32_e32 v7, vcc, -1, v3, vcc			; GCN-IR-NEXT: v_addc_u32_e32 v9, vcc, -1, v3, vcc
	; GCN-IR-NEXT: v_not_b32_e32 v8, v10			; GCN-IR-NEXT: v_not_b32_e32 v6, v10
	; GCN-IR-NEXT: v_not_b32_e32 v9, v11			; GCN-IR-NEXT: v_not_b32_e32 v7, v11
	; GCN-IR-NEXT: v_add_i32_e32 v10, vcc, v8, v12			; GCN-IR-NEXT: v_add_i32_e32 v10, vcc, v6, v12
	; GCN-IR-NEXT: v_addc_u32_e32 v11, vcc, v9, v13, vcc			; GCN-IR-NEXT: v_addc_u32_e32 v11, vcc, v7, v13, vcc
	; GCN-IR-NEXT: v_mov_b32_e32 v12, 0			; GCN-IR-NEXT: v_mov_b32_e32 v12, 0
	; GCN-IR-NEXT: v_mov_b32_e32 v13, 0			; GCN-IR-NEXT: v_mov_b32_e32 v13, 0
	; GCN-IR-NEXT: BB1_3: ; %udiv-do-while			; GCN-IR-NEXT: BB1_3: ; %udiv-do-while
	; GCN-IR-NEXT: ; =>This Inner Loop Header: Depth=1			; GCN-IR-NEXT: ; =>This Inner Loop Header: Depth=1
	; GCN-IR-NEXT: v_lshl_b64 v[14:15], v[14:15], 1			; GCN-IR-NEXT: v_lshl_b64 v[14:15], v[14:15], 1
	; GCN-IR-NEXT: v_lshrrev_b32_e32 v8, 31, v5			; GCN-IR-NEXT: v_lshrrev_b32_e32 v6, 31, v5
	; GCN-IR-NEXT: v_or_b32_e32 v14, v14, v8			; GCN-IR-NEXT: v_or_b32_e32 v14, v14, v6
	; GCN-IR-NEXT: v_lshl_b64 v[4:5], v[4:5], 1			; GCN-IR-NEXT: v_lshl_b64 v[4:5], v[4:5], 1
	; GCN-IR-NEXT: v_sub_i32_e32 v8, vcc, v6, v14			; GCN-IR-NEXT: v_sub_i32_e32 v6, vcc, v8, v14
	; GCN-IR-NEXT: v_subb_u32_e32 v8, vcc, v7, v15, vcc			; GCN-IR-NEXT: v_subb_u32_e32 v6, vcc, v9, v15, vcc
	; GCN-IR-NEXT: v_or_b32_e32 v4, v12, v4			; GCN-IR-NEXT: v_or_b32_e32 v4, v12, v4
	; GCN-IR-NEXT: v_ashrrev_i32_e32 v12, 31, v8			; GCN-IR-NEXT: v_ashrrev_i32_e32 v12, 31, v6
	; GCN-IR-NEXT: v_and_b32_e32 v17, v12, v2			; GCN-IR-NEXT: v_and_b32_e32 v17, v12, v2
	; GCN-IR-NEXT: v_and_b32_e32 v8, 1, v12			; GCN-IR-NEXT: v_and_b32_e32 v6, 1, v12
	; GCN-IR-NEXT: v_and_b32_e32 v16, v12, v3			; GCN-IR-NEXT: v_and_b32_e32 v16, v12, v3
	; GCN-IR-NEXT: v_add_i32_e32 v12, vcc, 1, v10			; GCN-IR-NEXT: v_add_i32_e32 v12, vcc, 1, v10
	; GCN-IR-NEXT: v_or_b32_e32 v5, v13, v5			; GCN-IR-NEXT: v_or_b32_e32 v5, v13, v5
	; GCN-IR-NEXT: v_addc_u32_e32 v13, vcc, 0, v11, vcc			; GCN-IR-NEXT: v_addc_u32_e32 v13, vcc, 0, v11, vcc
	; GCN-IR-NEXT: v_cmp_lt_u64_e32 vcc, v[12:13], v[10:11]			; GCN-IR-NEXT: v_cmp_lt_u64_e32 vcc, v[12:13], v[10:11]
	; GCN-IR-NEXT: v_mov_b32_e32 v10, v12			; GCN-IR-NEXT: v_mov_b32_e32 v10, v12
	; GCN-IR-NEXT: v_mov_b32_e32 v9, 0			; GCN-IR-NEXT: v_mov_b32_e32 v7, 0
	; GCN-IR-NEXT: v_sub_i32_e64 v14, s[4:5], v14, v17			; GCN-IR-NEXT: v_sub_i32_e64 v14, s[4:5], v14, v17
	; GCN-IR-NEXT: v_mov_b32_e32 v11, v13			; GCN-IR-NEXT: v_mov_b32_e32 v11, v13
	; GCN-IR-NEXT: v_mov_b32_e32 v13, v9			; GCN-IR-NEXT: v_mov_b32_e32 v13, v7
	; GCN-IR-NEXT: v_subb_u32_e64 v15, s[4:5], v15, v16, s[4:5]			; GCN-IR-NEXT: v_subb_u32_e64 v15, s[4:5], v15, v16, s[4:5]
	; GCN-IR-NEXT: s_or_b64 s[8:9], vcc, s[8:9]			; GCN-IR-NEXT: s_or_b64 s[10:11], vcc, s[10:11]
	; GCN-IR-NEXT: v_mov_b32_e32 v12, v8			; GCN-IR-NEXT: v_mov_b32_e32 v12, v6
	; GCN-IR-NEXT: s_andn2_b64 exec, exec, s[8:9]			; GCN-IR-NEXT: s_andn2_b64 exec, exec, s[10:11]
	; GCN-IR-NEXT: s_cbranch_execnz BB1_3			; GCN-IR-NEXT: s_cbranch_execnz BB1_3
	; GCN-IR-NEXT: ; %bb.4: ; %Flow			; GCN-IR-NEXT: ; %bb.4: ; %Flow
	; GCN-IR-NEXT: s_or_b64 exec, exec, s[8:9]
	; GCN-IR-NEXT: BB1_5: ; %Flow3
	; GCN-IR-NEXT: s_or_b64 exec, exec, s[10:11]			; GCN-IR-NEXT: s_or_b64 exec, exec, s[10:11]
				; GCN-IR-NEXT: BB1_5: ; %Flow3
				; GCN-IR-NEXT: s_or_b64 exec, exec, s[8:9]
	; GCN-IR-NEXT: v_lshl_b64 v[4:5], v[4:5], 1			; GCN-IR-NEXT: v_lshl_b64 v[4:5], v[4:5], 1
	; GCN-IR-NEXT: v_or_b32_e32 v7, v9, v5			; GCN-IR-NEXT: v_or_b32_e32 v7, v7, v5
	; GCN-IR-NEXT: v_or_b32_e32 v4, v8, v4			; GCN-IR-NEXT: v_or_b32_e32 v4, v6, v4
	; GCN-IR-NEXT: BB1_6: ; %Flow4			; GCN-IR-NEXT: BB1_6: ; %Flow4
	; GCN-IR-NEXT: s_or_b64 exec, exec, s[6:7]			; GCN-IR-NEXT: s_or_b64 exec, exec, s[6:7]
	; GCN-IR-NEXT: v_mul_lo_u32 v5, v2, v7			; GCN-IR-NEXT: v_mul_lo_u32 v5, v2, v7
	; GCN-IR-NEXT: v_mul_hi_u32 v6, v2, v4			; GCN-IR-NEXT: v_mul_hi_u32 v6, v2, v4
	; GCN-IR-NEXT: v_mul_lo_u32 v3, v3, v4			; GCN-IR-NEXT: v_mul_lo_u32 v3, v3, v4
	; GCN-IR-NEXT: v_mul_lo_u32 v2, v2, v4			; GCN-IR-NEXT: v_mul_lo_u32 v2, v2, v4
	; GCN-IR-NEXT: v_add_i32_e32 v5, vcc, v6, v5			; GCN-IR-NEXT: v_add_i32_e32 v5, vcc, v6, v5
	; GCN-IR-NEXT: v_add_i32_e32 v3, vcc, v5, v3			; GCN-IR-NEXT: v_add_i32_e32 v3, vcc, v5, v3
	▲ Show 20 Lines • Show All 842 Lines • ▼ Show 20 Lines
	; GCN-IR-NEXT: s_and_b64 s[4:5], s[4:5], vcc			; GCN-IR-NEXT: s_and_b64 s[4:5], s[4:5], vcc
	; GCN-IR-NEXT: s_and_saveexec_b64 s[6:7], s[4:5]			; GCN-IR-NEXT: s_and_saveexec_b64 s[6:7], s[4:5]
	; GCN-IR-NEXT: s_cbranch_execz BB8_6			; GCN-IR-NEXT: s_cbranch_execz BB8_6
	; GCN-IR-NEXT: ; %bb.1: ; %udiv-bb1			; GCN-IR-NEXT: ; %bb.1: ; %udiv-bb1
	; GCN-IR-NEXT: v_add_i32_e32 v6, vcc, 1, v2			; GCN-IR-NEXT: v_add_i32_e32 v6, vcc, 1, v2
	; GCN-IR-NEXT: v_addc_u32_e32 v7, vcc, 0, v3, vcc			; GCN-IR-NEXT: v_addc_u32_e32 v7, vcc, 0, v3, vcc
	; GCN-IR-NEXT: v_cmp_ge_u64_e32 vcc, v[6:7], v[2:3]			; GCN-IR-NEXT: v_cmp_ge_u64_e32 vcc, v[6:7], v[2:3]
	; GCN-IR-NEXT: v_sub_i32_e64 v2, s[4:5], 63, v2			; GCN-IR-NEXT: v_sub_i32_e64 v2, s[4:5], 63, v2
	; GCN-IR-NEXT: v_lshl_b64 v[2:3], s[8:9], v2
	; GCN-IR-NEXT: v_mov_b32_e32 v4, 0			; GCN-IR-NEXT: v_mov_b32_e32 v4, 0
	; GCN-IR-NEXT: s_mov_b64 s[8:9], 0			; GCN-IR-NEXT: v_lshl_b64 v[2:3], s[8:9], v2
				; GCN-IR-NEXT: s_mov_b64 s[10:11], 0
	; GCN-IR-NEXT: v_mov_b32_e32 v5, 0			; GCN-IR-NEXT: v_mov_b32_e32 v5, 0
	; GCN-IR-NEXT: s_and_saveexec_b64 s[4:5], vcc			; GCN-IR-NEXT: s_and_saveexec_b64 s[4:5], vcc
	; GCN-IR-NEXT: s_xor_b64 s[10:11], exec, s[4:5]			; GCN-IR-NEXT: s_xor_b64 s[8:9], exec, s[4:5]
	; GCN-IR-NEXT: s_cbranch_execz BB8_5			; GCN-IR-NEXT: s_cbranch_execz BB8_5
	; GCN-IR-NEXT: ; %bb.2: ; %udiv-preheader			; GCN-IR-NEXT: ; %bb.2: ; %udiv-preheader
	; GCN-IR-NEXT: s_mov_b32 s5, 0			; GCN-IR-NEXT: s_mov_b32 s5, 0
	; GCN-IR-NEXT: s_mov_b32 s4, 0x8000			; GCN-IR-NEXT: s_mov_b32 s4, 0x8000
	; GCN-IR-NEXT: v_lshr_b64 v[10:11], s[4:5], v6			; GCN-IR-NEXT: v_lshr_b64 v[10:11], s[4:5], v6
	; GCN-IR-NEXT: v_add_i32_e32 v6, vcc, -1, v0			; GCN-IR-NEXT: v_add_i32_e32 v6, vcc, -1, v0
	; GCN-IR-NEXT: v_addc_u32_e32 v7, vcc, -1, v1, vcc			; GCN-IR-NEXT: v_addc_u32_e32 v7, vcc, -1, v1, vcc
	; GCN-IR-NEXT: v_sub_i32_e32 v8, vcc, 47, v8			; GCN-IR-NEXT: v_sub_i32_e32 v8, vcc, 47, v8
	Show All 18 Lines
	; GCN-IR-NEXT: v_addc_u32_e32 v13, vcc, 0, v9, vcc			; GCN-IR-NEXT: v_addc_u32_e32 v13, vcc, 0, v9, vcc
	; GCN-IR-NEXT: v_cmp_lt_u64_e32 vcc, v[12:13], v[8:9]			; GCN-IR-NEXT: v_cmp_lt_u64_e32 vcc, v[12:13], v[8:9]
	; GCN-IR-NEXT: v_mov_b32_e32 v8, v12			; GCN-IR-NEXT: v_mov_b32_e32 v8, v12
	; GCN-IR-NEXT: v_mov_b32_e32 v5, 0			; GCN-IR-NEXT: v_mov_b32_e32 v5, 0
	; GCN-IR-NEXT: v_sub_i32_e64 v10, s[4:5], v10, v15			; GCN-IR-NEXT: v_sub_i32_e64 v10, s[4:5], v10, v15
	; GCN-IR-NEXT: v_mov_b32_e32 v9, v13			; GCN-IR-NEXT: v_mov_b32_e32 v9, v13
	; GCN-IR-NEXT: v_mov_b32_e32 v13, v5			; GCN-IR-NEXT: v_mov_b32_e32 v13, v5
	; GCN-IR-NEXT: v_subb_u32_e64 v11, s[4:5], v11, v14, s[4:5]			; GCN-IR-NEXT: v_subb_u32_e64 v11, s[4:5], v11, v14, s[4:5]
	; GCN-IR-NEXT: s_or_b64 s[8:9], vcc, s[8:9]			; GCN-IR-NEXT: s_or_b64 s[10:11], vcc, s[10:11]
	; GCN-IR-NEXT: v_mov_b32_e32 v12, v4			; GCN-IR-NEXT: v_mov_b32_e32 v12, v4
	; GCN-IR-NEXT: s_andn2_b64 exec, exec, s[8:9]			; GCN-IR-NEXT: s_andn2_b64 exec, exec, s[10:11]
	; GCN-IR-NEXT: s_cbranch_execnz BB8_3			; GCN-IR-NEXT: s_cbranch_execnz BB8_3
	; GCN-IR-NEXT: ; %bb.4: ; %Flow			; GCN-IR-NEXT: ; %bb.4: ; %Flow
	; GCN-IR-NEXT: s_or_b64 exec, exec, s[8:9]
	; GCN-IR-NEXT: BB8_5: ; %Flow3
	; GCN-IR-NEXT: s_or_b64 exec, exec, s[10:11]			; GCN-IR-NEXT: s_or_b64 exec, exec, s[10:11]
				; GCN-IR-NEXT: BB8_5: ; %Flow3
				; GCN-IR-NEXT: s_or_b64 exec, exec, s[8:9]
	; GCN-IR-NEXT: v_lshl_b64 v[2:3], v[2:3], 1			; GCN-IR-NEXT: v_lshl_b64 v[2:3], v[2:3], 1
	; GCN-IR-NEXT: v_or_b32_e32 v5, v5, v3			; GCN-IR-NEXT: v_or_b32_e32 v5, v5, v3
	; GCN-IR-NEXT: v_or_b32_e32 v4, v4, v2			; GCN-IR-NEXT: v_or_b32_e32 v4, v4, v2
	; GCN-IR-NEXT: BB8_6: ; %Flow4			; GCN-IR-NEXT: BB8_6: ; %Flow4
	; GCN-IR-NEXT: s_or_b64 exec, exec, s[6:7]			; GCN-IR-NEXT: s_or_b64 exec, exec, s[6:7]
	; GCN-IR-NEXT: v_mul_lo_u32 v2, v0, v5			; GCN-IR-NEXT: v_mul_lo_u32 v2, v0, v5
	; GCN-IR-NEXT: v_mul_hi_u32 v3, v0, v4			; GCN-IR-NEXT: v_mul_hi_u32 v3, v0, v4
	; GCN-IR-NEXT: v_mul_lo_u32 v1, v1, v4			; GCN-IR-NEXT: v_mul_lo_u32 v1, v1, v4
	Show All 37 Lines
	; GCN-IR-NEXT: s_cbranch_execz BB9_6			; GCN-IR-NEXT: s_cbranch_execz BB9_6
	; GCN-IR-NEXT: ; %bb.1: ; %udiv-bb1			; GCN-IR-NEXT: ; %bb.1: ; %udiv-bb1
	; GCN-IR-NEXT: v_add_i32_e32 v7, vcc, 1, v2			; GCN-IR-NEXT: v_add_i32_e32 v7, vcc, 1, v2
	; GCN-IR-NEXT: v_addc_u32_e32 v8, vcc, 0, v3, vcc			; GCN-IR-NEXT: v_addc_u32_e32 v8, vcc, 0, v3, vcc
	; GCN-IR-NEXT: v_cmp_ge_u64_e32 vcc, v[7:8], v[2:3]			; GCN-IR-NEXT: v_cmp_ge_u64_e32 vcc, v[7:8], v[2:3]
	; GCN-IR-NEXT: v_sub_i32_e64 v2, s[4:5], 63, v2			; GCN-IR-NEXT: v_sub_i32_e64 v2, s[4:5], 63, v2
	; GCN-IR-NEXT: v_mov_b32_e32 v4, 0			; GCN-IR-NEXT: v_mov_b32_e32 v4, 0
	; GCN-IR-NEXT: v_lshl_b64 v[2:3], v[0:1], v2			; GCN-IR-NEXT: v_lshl_b64 v[2:3], v[0:1], v2
	; GCN-IR-NEXT: s_mov_b64 s[8:9], 0			; GCN-IR-NEXT: s_mov_b64 s[10:11], 0
	; GCN-IR-NEXT: v_mov_b32_e32 v5, 0			; GCN-IR-NEXT: v_mov_b32_e32 v5, 0
	; GCN-IR-NEXT: s_and_saveexec_b64 s[4:5], vcc			; GCN-IR-NEXT: s_and_saveexec_b64 s[4:5], vcc
	; GCN-IR-NEXT: s_xor_b64 s[10:11], exec, s[4:5]			; GCN-IR-NEXT: s_xor_b64 s[8:9], exec, s[4:5]
	; GCN-IR-NEXT: s_cbranch_execz BB9_5			; GCN-IR-NEXT: s_cbranch_execz BB9_5
	; GCN-IR-NEXT: ; %bb.2: ; %udiv-preheader			; GCN-IR-NEXT: ; %bb.2: ; %udiv-preheader
	; GCN-IR-NEXT: v_mov_b32_e32 v10, 0			; GCN-IR-NEXT: v_mov_b32_e32 v10, 0
	; GCN-IR-NEXT: v_lshr_b64 v[8:9], v[0:1], v7			; GCN-IR-NEXT: v_lshr_b64 v[8:9], v[0:1], v7
	; GCN-IR-NEXT: v_add_i32_e32 v6, vcc, 0xffffffcf, v6			; GCN-IR-NEXT: v_add_i32_e32 v6, vcc, 0xffffffcf, v6
	; GCN-IR-NEXT: v_addc_u32_e64 v7, s[4:5], 0, -1, vcc			; GCN-IR-NEXT: v_addc_u32_e64 v7, s[4:5], 0, -1, vcc
	; GCN-IR-NEXT: v_mov_b32_e32 v11, 0			; GCN-IR-NEXT: v_mov_b32_e32 v11, 0
	; GCN-IR-NEXT: s_movk_i32 s12, 0x7fff			; GCN-IR-NEXT: s_movk_i32 s12, 0x7fff
	Show All 15 Lines
	; GCN-IR-NEXT: v_cmp_lt_u64_e32 vcc, v[10:11], v[6:7]			; GCN-IR-NEXT: v_cmp_lt_u64_e32 vcc, v[10:11], v[6:7]
	; GCN-IR-NEXT: v_mov_b32_e32 v6, v10			; GCN-IR-NEXT: v_mov_b32_e32 v6, v10
	; GCN-IR-NEXT: v_mov_b32_e32 v5, 0			; GCN-IR-NEXT: v_mov_b32_e32 v5, 0
	; GCN-IR-NEXT: v_mov_b32_e32 v7, v11			; GCN-IR-NEXT: v_mov_b32_e32 v7, v11
	; GCN-IR-NEXT: v_mov_b32_e32 v11, v5			; GCN-IR-NEXT: v_mov_b32_e32 v11, v5
	; GCN-IR-NEXT: v_mov_b32_e32 v13, 0			; GCN-IR-NEXT: v_mov_b32_e32 v13, 0
	; GCN-IR-NEXT: v_sub_i32_e64 v8, s[4:5], v8, v12			; GCN-IR-NEXT: v_sub_i32_e64 v8, s[4:5], v8, v12
	; GCN-IR-NEXT: v_subb_u32_e64 v9, s[4:5], v9, v13, s[4:5]			; GCN-IR-NEXT: v_subb_u32_e64 v9, s[4:5], v9, v13, s[4:5]
	; GCN-IR-NEXT: s_or_b64 s[8:9], vcc, s[8:9]			; GCN-IR-NEXT: s_or_b64 s[10:11], vcc, s[10:11]
	; GCN-IR-NEXT: v_mov_b32_e32 v10, v4			; GCN-IR-NEXT: v_mov_b32_e32 v10, v4
	; GCN-IR-NEXT: s_andn2_b64 exec, exec, s[8:9]			; GCN-IR-NEXT: s_andn2_b64 exec, exec, s[10:11]
	; GCN-IR-NEXT: s_cbranch_execnz BB9_3			; GCN-IR-NEXT: s_cbranch_execnz BB9_3
	; GCN-IR-NEXT: ; %bb.4: ; %Flow			; GCN-IR-NEXT: ; %bb.4: ; %Flow
	; GCN-IR-NEXT: s_or_b64 exec, exec, s[8:9]
	; GCN-IR-NEXT: BB9_5: ; %Flow3
	; GCN-IR-NEXT: s_or_b64 exec, exec, s[10:11]			; GCN-IR-NEXT: s_or_b64 exec, exec, s[10:11]
				; GCN-IR-NEXT: BB9_5: ; %Flow3
				; GCN-IR-NEXT: s_or_b64 exec, exec, s[8:9]
	; GCN-IR-NEXT: v_lshl_b64 v[2:3], v[2:3], 1			; GCN-IR-NEXT: v_lshl_b64 v[2:3], v[2:3], 1
	; GCN-IR-NEXT: v_or_b32_e32 v5, v5, v3			; GCN-IR-NEXT: v_or_b32_e32 v5, v5, v3
	; GCN-IR-NEXT: v_or_b32_e32 v4, v4, v2			; GCN-IR-NEXT: v_or_b32_e32 v4, v4, v2
	; GCN-IR-NEXT: BB9_6: ; %Flow4			; GCN-IR-NEXT: BB9_6: ; %Flow4
	; GCN-IR-NEXT: s_or_b64 exec, exec, s[6:7]			; GCN-IR-NEXT: s_or_b64 exec, exec, s[6:7]
	; GCN-IR-NEXT: v_lshl_b64 v[2:3], v[4:5], 15			; GCN-IR-NEXT: v_lshl_b64 v[2:3], v[4:5], 15
	; GCN-IR-NEXT: v_sub_i32_e32 v0, vcc, v0, v2			; GCN-IR-NEXT: v_sub_i32_e32 v0, vcc, v0, v2
	; GCN-IR-NEXT: v_subb_u32_e32 v1, vcc, v1, v3, vcc			; GCN-IR-NEXT: v_subb_u32_e32 v1, vcc, v1, v3, vcc
	▲ Show 20 Lines • Show All 228 Lines • Show Last 20 Lines