This is an archive of the discontinued LLVM Phabricator instance.

llvm/test/CodeGen/AMDGPU/GlobalISel/mul-known-bits.i64.ll
53	@tsymalla suggested in my revision to give the test cases more descriptive names.
258	This is a neat approach! Is there a possibility to extend this to `G_MAD` instructions as well? It's trickier since the operands don't have the same indices as for `G_MUL` etc. though.
312	`G_MAD` does not take advantage of the `binop_right_to_zero` rule.
386
432

LGTM

llvm/include/llvm/Target/GlobalISel/Combine.td
349	This looks alright to me, but what is the point in swapping the operands if both of them are constants except making the ISA more readable? For instance: `s_add_i32 s1, 0x1000, 0 => s_add_i32 s1, 0, 0x1000`
llvm/test/CodeGen/AMDGPU/GlobalISel/mul-known-bits.i64.ll
174	Shouldn't this one be eliminated?

foad added inline comments.Jan 5 2023, 3:04 AM

llvm/include/llvm/Target/GlobalISel/Combine.td
349	If both operands are constants then all the opcodes will be constant-folded.
llvm/test/CodeGen/AMDGPU/GlobalISel/mul-known-bits.i64.ll
53	That's fine but I think it should be a separate patch.
174	Why? It's used by the global_store below.
258	There are no generic G_MAD instructions, so I think we would need to add a target-specific combine for target-specific opcodes.
312	Likewise, I think that would need to be a target-specific combine.

tsymalla added inline comments.Jan 5 2023, 3:06 AM

llvm/test/CodeGen/AMDGPU/GlobalISel/mul-known-bits.i64.ll
174	Missed that one.

This revision was landed with ongoing or failed builds.Jan 5 2023, 3:13 AM

Closed by commit rG0d518ae50cba: [GlobalISel] New combine to commute constant operands to the RHS (authored by foad). · Explain Why

This revision was automatically updated to reflect the committed changes.

foad added a commit: rG0d518ae50cba: [GlobalISel] New combine to commute constant operands to the RHS.

foad mentioned this in D140208: [AMDGPU] Improved wide multiplies.Jan 9 2023, 5:35 AM

Revision Contents

Path

Size

llvm/

include/

llvm/

Target/

GlobalISel/

Combine.td

20 lines

test/

CodeGen/

AArch64/

GlobalISel/

combine-add-of-sub.mir

4 lines

combine-shift-immed-mismatch-crash.mir

12 lines

AMDGPU/

GlobalISel/

combine-fold-binop-into-select.mir

2 lines

fshl.ll

56 lines

fshr.ll

56 lines

llvm.amdgcn.sbfe.ll

2 lines

mul-known-bits.i64.ll

32 lines

postlegalizer-combiner-trunc-bitcast-buildvector.mir

8 lines

52 lines

52 lines

36 lines

42 lines

292 lines

Diff 486516

llvm/include/llvm/Target/GlobalISel/Combine.td

Show First 20 Lines • Show All 337 Lines • ▼ Show 20 Lines

def select_to_logical : GICombineRule<		def select_to_logical : GICombineRule<
(defs root:$root, build_fn_matchinfo:$matchinfo),		(defs root:$root, build_fn_matchinfo:$matchinfo),
(match (wip_match_opcode G_SELECT):$root,		(match (wip_match_opcode G_SELECT):$root,
[{ return Helper.matchSelectToLogical(*${root}, ${matchinfo}); }]),		[{ return Helper.matchSelectToLogical(*${root}, ${matchinfo}); }]),
(apply [{ Helper.applyBuildFn(*${root}, ${matchinfo}); }])		(apply [{ Helper.applyBuildFn(*${root}, ${matchinfo}); }])
>;		>;

		// Fold (C op x) -> (x op C)
		// TODO: handle more isCommutable opcodes
		// TODO: handle compares (currently not marked as isCommutable)
		arsenmUnsubmitted Not Done Reply Inline Actions Should also get compares, but that's trickier since you have to swap the predicate arsenm: Should also get compares, but that's trickier since you have to swap the predicate
		def commute_constant_to_rhs : GICombineRule<
		tsymallaUnsubmitted Not Done Reply Inline Actions This looks alright to me, but what is the point in swapping the operands if both of them are constants except making the ISA more readable? For instance: `s_add_i32 s1, 0x1000, 0 => s_add_i32 s1, 0, 0x1000` tsymalla: This looks alright to me, but what is the point in swapping the operands if both of them are…
		foadAuthorUnsubmitted Done Reply Inline Actions If both operands are constants then all the opcodes will be constant-folded. foad: If both operands are constants then all the opcodes will be constant-folded.
		(defs root:$root),
		(match (wip_match_opcode G_ADD, G_MUL, G_AND, G_OR, G_XOR):$root, [{
		return getIConstantVRegVal(${root}->getOperand(1).getReg(), MRI).has_value();
		}]),
		(apply [{
		Observer.changingInstr(*${root});
		Register LHSReg = ${root}->getOperand(1).getReg();
		Register RHSReg = ${root}->getOperand(2).getReg();
		${root}->getOperand(1).setReg(RHSReg);
		${root}->getOperand(2).setReg(LHSReg);
		Observer.changedInstr(*${root});
		arsenmUnsubmitted Not Done Reply Inline Actions Should also get the FP cases arsenm: Should also get the FP cases
		}])
		>;

// Fold x op 0 -> x		// Fold x op 0 -> x
def right_identity_zero: GICombineRule<		def right_identity_zero: GICombineRule<
(defs root:$root),		(defs root:$root),
(match (wip_match_opcode G_SUB, G_ADD, G_OR, G_XOR, G_SHL, G_ASHR, G_LSHR,		(match (wip_match_opcode G_SUB, G_ADD, G_OR, G_XOR, G_SHL, G_ASHR, G_LSHR,
G_PTR_ADD, G_ROTL, G_ROTR):$root,		G_PTR_ADD, G_ROTL, G_ROTR):$root,
[{ return Helper.matchConstantOp(${root}->getOperand(2), 0); }]),		[{ return Helper.matchConstantOp(${root}->getOperand(2), 0); }]),
(apply [{ return Helper.replaceSingleDefInstWithOperand(*${root}, 1); }])		(apply [{ return Helper.replaceSingleDefInstWithOperand(*${root}, 1); }])
>;		>;
▲ Show 20 Lines • Show All 727 Lines • ▼ Show 20 Lines	def all_combines : GICombineGroup<[trivial_combines, insert_vec_elt_combines,
unmerge_zext_to_zext, merge_unmerge, trunc_ext_fold, trunc_shift,		unmerge_zext_to_zext, merge_unmerge, trunc_ext_fold, trunc_shift,
const_combines, xor_of_and_with_same_reg, ptr_add_with_zero,		const_combines, xor_of_and_with_same_reg, ptr_add_with_zero,
shift_immed_chain, shift_of_shifted_logic_chain, load_or_combine,		shift_immed_chain, shift_of_shifted_logic_chain, load_or_combine,
truncstore_merge, div_rem_to_divrem, funnel_shift_combines,		truncstore_merge, div_rem_to_divrem, funnel_shift_combines,
form_bitfield_extract, constant_fold, fabs_fneg_fold,		form_bitfield_extract, constant_fold, fabs_fneg_fold,
intdiv_combines, mulh_combines, redundant_neg_operands,		intdiv_combines, mulh_combines, redundant_neg_operands,
and_or_disjoint_mask, fma_combines, fold_binop_into_select,		and_or_disjoint_mask, fma_combines, fold_binop_into_select,
sub_add_reg, select_to_minmax, redundant_binop_in_equality,		sub_add_reg, select_to_minmax, redundant_binop_in_equality,
fsub_to_fneg]>;		fsub_to_fneg, commute_constant_to_rhs]>;

// A combine group used to for prelegalizer combiners at -O0. The combines in		// A combine group used to for prelegalizer combiners at -O0. The combines in
// this group have been selected based on experiments to balance code size and		// this group have been selected based on experiments to balance code size and
// compile time performance.		// compile time performance.
def optnone_combines : GICombineGroup<[trivial_combines,		def optnone_combines : GICombineGroup<[trivial_combines,
ptr_add_immed_chain, combines_for_extload,		ptr_add_immed_chain, combines_for_extload,
not_cmp_fold, opt_brcond_by_inverting_cond]>;		not_cmp_fold, opt_brcond_by_inverting_cond]>;

llvm/test/CodeGen/AArch64/GlobalISel/combine-add-of-sub.mir

Show First 20 Lines • Show All 157 Lines • ▼ Show 20 Lines	bb.0:
liveins: $w0, $w1		liveins: $w0, $w1
; (x + y) - x -> y		; (x + y) - x -> y
; CHECK-LABEL: name: unique_constants_no_fold		; CHECK-LABEL: name: unique_constants_no_fold
; CHECK: liveins: $w0, $w1		; CHECK: liveins: $w0, $w1
; CHECK-NEXT: {{ $}}		; CHECK-NEXT: {{ $}}
; CHECK-NEXT: %x1:_(s32) = G_CONSTANT i32 1		; CHECK-NEXT: %x1:_(s32) = G_CONSTANT i32 1
; CHECK-NEXT: %x2:_(s32) = G_CONSTANT i32 2		; CHECK-NEXT: %x2:_(s32) = G_CONSTANT i32 2
; CHECK-NEXT: %y:_(s32) = COPY $w1		; CHECK-NEXT: %y:_(s32) = COPY $w1
; CHECK-NEXT: %add:_(s32) = G_ADD %x1, %y		; CHECK-NEXT: %add:_(s32) = G_ADD %y, %x1
; CHECK-NEXT: %sub:_(s32) = G_SUB %add, %x2		; CHECK-NEXT: %sub:_(s32) = G_SUB %add, %x2
; CHECK-NEXT: $w0 = COPY %sub(s32)		; CHECK-NEXT: $w0 = COPY %sub(s32)
; CHECK-NEXT: RET_ReallyLR implicit $w0		; CHECK-NEXT: RET_ReallyLR implicit $w0
%x1:_(s32) = G_CONSTANT i32 1		%x1:_(s32) = G_CONSTANT i32 1
%x2:_(s32) = G_CONSTANT i32 2		%x2:_(s32) = G_CONSTANT i32 2
%y:_(s32) = COPY $w1		%y:_(s32) = COPY $w1
%add:_(s32) = G_ADD %x1, %y		%add:_(s32) = G_ADD %x1, %y
%sub:_(s32) = G_SUB %add, %x2		%sub:_(s32) = G_SUB %add, %x2
▲ Show 20 Lines • Show All 171 Lines • ▼ Show 20 Lines	bb.0:
liveins: $w0, $w1		liveins: $w0, $w1
; x - (y + x) -> 0 - y		; x - (y + x) -> 0 - y
; CHECK-LABEL: name: wrong_constant_neg_no_fold		; CHECK-LABEL: name: wrong_constant_neg_no_fold
; CHECK: liveins: $w0, $w1		; CHECK: liveins: $w0, $w1
; CHECK-NEXT: {{ $}}		; CHECK-NEXT: {{ $}}
; CHECK-NEXT: %x1:_(s32) = G_CONSTANT i32 1		; CHECK-NEXT: %x1:_(s32) = G_CONSTANT i32 1
; CHECK-NEXT: %x2:_(s32) = G_CONSTANT i32 2		; CHECK-NEXT: %x2:_(s32) = G_CONSTANT i32 2
; CHECK-NEXT: %y:_(s32) = COPY $w1		; CHECK-NEXT: %y:_(s32) = COPY $w1
; CHECK-NEXT: %add:_(s32) = G_ADD %x1, %y		; CHECK-NEXT: %add:_(s32) = G_ADD %y, %x1
; CHECK-NEXT: %sub:_(s32) = G_SUB %x2, %add		; CHECK-NEXT: %sub:_(s32) = G_SUB %x2, %add
; CHECK-NEXT: $w0 = COPY %sub(s32)		; CHECK-NEXT: $w0 = COPY %sub(s32)
; CHECK-NEXT: RET_ReallyLR implicit $w0		; CHECK-NEXT: RET_ReallyLR implicit $w0
%x1:_(s32) = G_CONSTANT i32 1		%x1:_(s32) = G_CONSTANT i32 1
%x2:_(s32) = G_CONSTANT i32 2		%x2:_(s32) = G_CONSTANT i32 2
%y:_(s32) = COPY $w1		%y:_(s32) = COPY $w1
%add:_(s32) = G_ADD %x1, %y		%add:_(s32) = G_ADD %x1, %y
%sub:_(s32) = G_SUB %x2, %add		%sub:_(s32) = G_SUB %x2, %add
$w0 = COPY %sub(s32)		$w0 = COPY %sub(s32)
RET_ReallyLR implicit $w0		RET_ReallyLR implicit $w0

llvm/test/CodeGen/AArch64/GlobalISel/combine-shift-immed-mismatch-crash.mir

	# NOTE: Assertions have been autogenerated by utils/update_mir_test_checks.py			# NOTE: Assertions have been autogenerated by utils/update_mir_test_checks.py
	# RUN: llc -run-pass=aarch64-prelegalizer-combiner -verify-machineinstrs -mtriple aarch64-unknown-unknown %s -o - \| FileCheck %s			# RUN: llc -run-pass=aarch64-prelegalizer-combiner -verify-machineinstrs -mtriple aarch64-unknown-unknown %s -o - \| FileCheck %s
	---			---
	name: shift_immed_chain_mismatch_size_crash			name: shift_immed_chain_mismatch_size_crash
	alignment: 4			alignment: 4
	tracksRegLiveness: true			tracksRegLiveness: true
	liveins:			liveins:
	- { reg: '$x0' }			- { reg: '$x0' }
	body: \|			body: \|
	; CHECK-LABEL: name: shift_immed_chain_mismatch_size_crash			; CHECK-LABEL: name: shift_immed_chain_mismatch_size_crash
	; CHECK: bb.0:			; CHECK: bb.0:
	; CHECK: successors: %bb.1(0x40000000), %bb.2(0x40000000)			; CHECK: successors: %bb.1(0x40000000), %bb.2(0x40000000)
	; CHECK: liveins: $x0			; CHECK: liveins: $x0
	; CHECK: [[DEF:%[0-9]+]]:_(s1) = G_IMPLICIT_DEF			; CHECK: [[DEF:%[0-9]+]]:_(s1) = G_IMPLICIT_DEF
	; CHECK: [[DEF1:%[0-9]+]]:_(p0) = G_IMPLICIT_DEF			; CHECK: [[DEF1:%[0-9]+]]:_(p0) = G_IMPLICIT_DEF
	; CHECK: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 16			; CHECK: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 9
	; CHECK: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 9
	; CHECK: G_BRCOND [[DEF]](s1), %bb.2			; CHECK: G_BRCOND [[DEF]](s1), %bb.2
	; CHECK: G_BR %bb.1			; CHECK: G_BR %bb.1
	; CHECK: bb.1:			; CHECK: bb.1:
	; CHECK: successors:			; CHECK: successors:
	; CHECK: bb.2:			; CHECK: bb.2:
	; CHECK: [[LOAD:%[0-9]+]]:_(s32) = G_LOAD [[DEF1]](p0) :: (load (s32) from `ptr undef`, align 8)			; CHECK: [[LOAD:%[0-9]+]]:_(s32) = G_LOAD [[DEF1]](p0) :: (load (s32) from `ptr undef`, align 8)
	; CHECK: [[MUL:%[0-9]+]]:_(s32) = nsw G_MUL [[C]], [[LOAD]]			; CHECK: [[C1:%[0-9]+]]:_(s32) = G_CONSTANT i32 4
	; CHECK: [[MUL1:%[0-9]+]]:_(s32) = nsw G_MUL [[MUL]], [[C1]]			; CHECK: [[SHL:%[0-9]+]]:_(s32) = nsw G_SHL [[LOAD]], [[C1]](s32)
				; CHECK: [[MUL:%[0-9]+]]:_(s32) = nsw G_MUL [[SHL]], [[C]]
	; CHECK: [[C2:%[0-9]+]]:_(s64) = G_CONSTANT i64 2			; CHECK: [[C2:%[0-9]+]]:_(s64) = G_CONSTANT i64 2
	; CHECK: [[SHL:%[0-9]+]]:_(s32) = G_SHL [[MUL1]], [[C2]](s64)			; CHECK: [[SHL1:%[0-9]+]]:_(s32) = G_SHL [[MUL]], [[C2]](s64)
	; CHECK: $w0 = COPY [[SHL]](s32)			; CHECK: $w0 = COPY [[SHL1]](s32)
	; CHECK: RET_ReallyLR implicit $w0			; CHECK: RET_ReallyLR implicit $w0
	bb.1:			bb.1:
	liveins: $x0			liveins: $x0

	%0:_(p0) = COPY $x0			%0:_(p0) = COPY $x0
	%1:_(s1) = G_IMPLICIT_DEF			%1:_(s1) = G_IMPLICIT_DEF
	%3:_(p0) = G_IMPLICIT_DEF			%3:_(p0) = G_IMPLICIT_DEF
	%4:_(s32) = G_CONSTANT i32 16			%4:_(s32) = G_CONSTANT i32 16
	Show All 22 Lines

llvm/test/CodeGen/AMDGPU/GlobalISel/combine-fold-binop-into-select.mir

Show All 40 Lines	bb.0:
; CHECK-NEXT: {{ $}}		; CHECK-NEXT: {{ $}}
; CHECK-NEXT: %reg:_(s32) = COPY $vgpr0		; CHECK-NEXT: %reg:_(s32) = COPY $vgpr0
; CHECK-NEXT: %zero:_(s32) = G_CONSTANT i32 0		; CHECK-NEXT: %zero:_(s32) = G_CONSTANT i32 0
; CHECK-NEXT: %cond:_(s1) = G_ICMP intpred(eq), %reg(s32), %zero		; CHECK-NEXT: %cond:_(s1) = G_ICMP intpred(eq), %reg(s32), %zero
; CHECK-NEXT: %ten:_(s32) = G_CONSTANT i32 10		; CHECK-NEXT: %ten:_(s32) = G_CONSTANT i32 10
; CHECK-NEXT: %twenty:_(s32) = G_CONSTANT i32 20		; CHECK-NEXT: %twenty:_(s32) = G_CONSTANT i32 20
; CHECK-NEXT: %select:_(s32) = G_SELECT %cond(s1), %ten, %twenty		; CHECK-NEXT: %select:_(s32) = G_SELECT %cond(s1), %ten, %twenty
; CHECK-NEXT: %thirty:_(s32) = G_CONSTANT i32 30		; CHECK-NEXT: %thirty:_(s32) = G_CONSTANT i32 30
; CHECK-NEXT: %add:_(s32) = G_ADD %thirty, %select		; CHECK-NEXT: %add:_(s32) = G_ADD %select, %thirty
; CHECK-NEXT: S_ENDPGM 0, implicit %add(s32), implicit %select(s32)		; CHECK-NEXT: S_ENDPGM 0, implicit %add(s32), implicit %select(s32)
%reg:_(s32) = COPY $vgpr0		%reg:_(s32) = COPY $vgpr0
%zero:_(s32) = G_CONSTANT i32 0		%zero:_(s32) = G_CONSTANT i32 0
%cond:_(s1) = G_ICMP intpred(eq), %reg, %zero		%cond:_(s1) = G_ICMP intpred(eq), %reg, %zero
%ten:_(s32) = G_CONSTANT i32 10		%ten:_(s32) = G_CONSTANT i32 10
%twenty:_(s32) = G_CONSTANT i32 20		%twenty:_(s32) = G_CONSTANT i32 20
%select:_(s32) = G_SELECT %cond, %ten, %twenty		%select:_(s32) = G_SELECT %cond, %ten, %twenty
%thirty:_(s32) = G_CONSTANT i32 30		%thirty:_(s32) = G_CONSTANT i32 30
▲ Show 20 Lines • Show All 1,467 Lines • Show Last 20 Lines

llvm/test/CodeGen/AMDGPU/GlobalISel/fshl.ll

This file is larger than 256 KB, so syntax highlighting is disabled by default.

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc -global-isel -mtriple=amdgcn-amd-amdpal -mcpu=tahiti -o - %s \| FileCheck -check-prefixes=GCN,GFX6 %s			; RUN: llc -global-isel -mtriple=amdgcn-amd-amdpal -mcpu=tahiti -o - %s \| FileCheck -check-prefixes=GCN,GFX6 %s
	; RUN: llc -global-isel -mtriple=amdgcn-amd-amdpal -mcpu=fiji -o - %s \| FileCheck -check-prefixes=GCN,GFX8 %s			; RUN: llc -global-isel -mtriple=amdgcn-amd-amdpal -mcpu=fiji -o - %s \| FileCheck -check-prefixes=GCN,GFX8 %s
	; RUN: llc -global-isel -mtriple=amdgcn-amd-amdpal -mcpu=gfx900 -o - %s \| FileCheck -check-prefixes=GCN,GFX9 %s			; RUN: llc -global-isel -mtriple=amdgcn-amd-amdpal -mcpu=gfx900 -o - %s \| FileCheck -check-prefixes=GCN,GFX9 %s
	; RUN: llc -global-isel -mtriple=amdgcn-amd-amdpal -mcpu=gfx1010 -o - %s \| FileCheck -check-prefixes=GCN,GFX10 %s			; RUN: llc -global-isel -mtriple=amdgcn-amd-amdpal -mcpu=gfx1010 -o - %s \| FileCheck -check-prefixes=GCN,GFX10 %s
	; RUN: llc -global-isel -mtriple=amdgcn-amd-amdpal -mcpu=gfx1100 -o - %s \| FileCheck -check-prefixes=GFX11 %s			; RUN: llc -global-isel -mtriple=amdgcn-amd-amdpal -mcpu=gfx1100 -o - %s \| FileCheck -check-prefixes=GFX11 %s

	define amdgpu_ps i7 @s_fshl_i7(i7 inreg %lhs, i7 inreg %rhs, i7 inreg %amt) {			define amdgpu_ps i7 @s_fshl_i7(i7 inreg %lhs, i7 inreg %rhs, i7 inreg %amt) {
	; GFX6-LABEL: s_fshl_i7:			; GFX6-LABEL: s_fshl_i7:
	; GFX6: ; %bb.0:			; GFX6: ; %bb.0:
	; GFX6-NEXT: v_cvt_f32_ubyte0_e32 v0, 7			; GFX6-NEXT: v_cvt_f32_ubyte0_e32 v0, 7
	; GFX6-NEXT: v_rcp_iflag_f32_e32 v0, v0			; GFX6-NEXT: v_rcp_iflag_f32_e32 v0, v0
	; GFX6-NEXT: s_and_b32 s2, s2, 0x7f			; GFX6-NEXT: s_and_b32 s2, s2, 0x7f
	; GFX6-NEXT: s_bfe_u32 s1, s1, 0x60001			; GFX6-NEXT: s_bfe_u32 s1, s1, 0x60001
	; GFX6-NEXT: v_mul_f32_e32 v0, 0x4f7ffffe, v0			; GFX6-NEXT: v_mul_f32_e32 v0, 0x4f7ffffe, v0
	; GFX6-NEXT: v_cvt_u32_f32_e32 v0, v0			; GFX6-NEXT: v_cvt_u32_f32_e32 v0, v0
	; GFX6-NEXT: v_mul_lo_u32 v1, -7, v0			; GFX6-NEXT: v_mul_lo_u32 v1, v0, -7
	; GFX6-NEXT: v_mul_hi_u32 v1, v0, v1			; GFX6-NEXT: v_mul_hi_u32 v1, v0, v1
	; GFX6-NEXT: v_add_i32_e32 v0, vcc, v0, v1			; GFX6-NEXT: v_add_i32_e32 v0, vcc, v0, v1
	; GFX6-NEXT: v_mul_hi_u32 v0, s2, v0			; GFX6-NEXT: v_mul_hi_u32 v0, s2, v0
	; GFX6-NEXT: v_mul_lo_u32 v0, v0, 7			; GFX6-NEXT: v_mul_lo_u32 v0, v0, 7
	; GFX6-NEXT: v_sub_i32_e32 v0, vcc, s2, v0			; GFX6-NEXT: v_sub_i32_e32 v0, vcc, s2, v0
	; GFX6-NEXT: v_subrev_i32_e32 v1, vcc, 7, v0			; GFX6-NEXT: v_subrev_i32_e32 v1, vcc, 7, v0
	; GFX6-NEXT: v_cmp_le_u32_e32 vcc, 7, v0			; GFX6-NEXT: v_cmp_le_u32_e32 vcc, 7, v0
	; GFX6-NEXT: v_cndmask_b32_e32 v0, v0, v1, vcc			; GFX6-NEXT: v_cndmask_b32_e32 v0, v0, v1, vcc
	Show All 14 Lines
	; GFX8-NEXT: v_cvt_f32_ubyte0_e32 v0, 7			; GFX8-NEXT: v_cvt_f32_ubyte0_e32 v0, 7
	; GFX8-NEXT: v_rcp_iflag_f32_e32 v0, v0			; GFX8-NEXT: v_rcp_iflag_f32_e32 v0, v0
	; GFX8-NEXT: s_and_b32 s2, s2, 0x7f			; GFX8-NEXT: s_and_b32 s2, s2, 0x7f
	; GFX8-NEXT: s_and_b32 s1, s1, 0x7f			; GFX8-NEXT: s_and_b32 s1, s1, 0x7f
	; GFX8-NEXT: s_bfe_u32 s1, s1, 0x100000			; GFX8-NEXT: s_bfe_u32 s1, s1, 0x100000
	; GFX8-NEXT: v_mul_f32_e32 v0, 0x4f7ffffe, v0			; GFX8-NEXT: v_mul_f32_e32 v0, 0x4f7ffffe, v0
	; GFX8-NEXT: v_cvt_u32_f32_e32 v0, v0			; GFX8-NEXT: v_cvt_u32_f32_e32 v0, v0
	; GFX8-NEXT: s_lshr_b32 s1, s1, 1			; GFX8-NEXT: s_lshr_b32 s1, s1, 1
	; GFX8-NEXT: v_mul_lo_u32 v1, -7, v0			; GFX8-NEXT: v_mul_lo_u32 v1, v0, -7
	; GFX8-NEXT: v_mul_hi_u32 v1, v0, v1			; GFX8-NEXT: v_mul_hi_u32 v1, v0, v1
	; GFX8-NEXT: v_add_u32_e32 v0, vcc, v0, v1			; GFX8-NEXT: v_add_u32_e32 v0, vcc, v0, v1
	; GFX8-NEXT: v_mul_hi_u32 v0, s2, v0			; GFX8-NEXT: v_mul_hi_u32 v0, s2, v0
	; GFX8-NEXT: v_mul_lo_u32 v0, v0, 7			; GFX8-NEXT: v_mul_lo_u32 v0, v0, 7
	; GFX8-NEXT: v_sub_u32_e32 v0, vcc, s2, v0			; GFX8-NEXT: v_sub_u32_e32 v0, vcc, s2, v0
	; GFX8-NEXT: v_subrev_u32_e32 v1, vcc, 7, v0			; GFX8-NEXT: v_subrev_u32_e32 v1, vcc, 7, v0
	; GFX8-NEXT: v_cmp_le_u32_e32 vcc, 7, v0			; GFX8-NEXT: v_cmp_le_u32_e32 vcc, 7, v0
	; GFX8-NEXT: v_cndmask_b32_e32 v0, v0, v1, vcc			; GFX8-NEXT: v_cndmask_b32_e32 v0, v0, v1, vcc
	Show All 14 Lines
	; GFX9-NEXT: v_cvt_f32_ubyte0_e32 v0, 7			; GFX9-NEXT: v_cvt_f32_ubyte0_e32 v0, 7
	; GFX9-NEXT: v_rcp_iflag_f32_e32 v0, v0			; GFX9-NEXT: v_rcp_iflag_f32_e32 v0, v0
	; GFX9-NEXT: s_and_b32 s2, s2, 0x7f			; GFX9-NEXT: s_and_b32 s2, s2, 0x7f
	; GFX9-NEXT: s_and_b32 s1, s1, 0x7f			; GFX9-NEXT: s_and_b32 s1, s1, 0x7f
	; GFX9-NEXT: s_bfe_u32 s1, s1, 0x100000			; GFX9-NEXT: s_bfe_u32 s1, s1, 0x100000
	; GFX9-NEXT: v_mul_f32_e32 v0, 0x4f7ffffe, v0			; GFX9-NEXT: v_mul_f32_e32 v0, 0x4f7ffffe, v0
	; GFX9-NEXT: v_cvt_u32_f32_e32 v0, v0			; GFX9-NEXT: v_cvt_u32_f32_e32 v0, v0
	; GFX9-NEXT: s_lshr_b32 s1, s1, 1			; GFX9-NEXT: s_lshr_b32 s1, s1, 1
	; GFX9-NEXT: v_mul_lo_u32 v1, -7, v0			; GFX9-NEXT: v_mul_lo_u32 v1, v0, -7
	; GFX9-NEXT: v_mul_hi_u32 v1, v0, v1			; GFX9-NEXT: v_mul_hi_u32 v1, v0, v1
	; GFX9-NEXT: v_add_u32_e32 v0, v0, v1			; GFX9-NEXT: v_add_u32_e32 v0, v0, v1
	; GFX9-NEXT: v_mul_hi_u32 v0, s2, v0			; GFX9-NEXT: v_mul_hi_u32 v0, s2, v0
	; GFX9-NEXT: v_mul_lo_u32 v0, v0, 7			; GFX9-NEXT: v_mul_lo_u32 v0, v0, 7
	; GFX9-NEXT: v_sub_u32_e32 v0, s2, v0			; GFX9-NEXT: v_sub_u32_e32 v0, s2, v0
	; GFX9-NEXT: v_subrev_u32_e32 v1, 7, v0			; GFX9-NEXT: v_subrev_u32_e32 v1, 7, v0
	; GFX9-NEXT: v_cmp_le_u32_e32 vcc, 7, v0			; GFX9-NEXT: v_cmp_le_u32_e32 vcc, 7, v0
	; GFX9-NEXT: v_cndmask_b32_e32 v0, v0, v1, vcc			; GFX9-NEXT: v_cndmask_b32_e32 v0, v0, v1, vcc
	Show All 14 Lines
	; GFX10-NEXT: v_cvt_f32_ubyte0_e32 v0, 7			; GFX10-NEXT: v_cvt_f32_ubyte0_e32 v0, 7
	; GFX10-NEXT: s_and_b32 s2, s2, 0x7f			; GFX10-NEXT: s_and_b32 s2, s2, 0x7f
	; GFX10-NEXT: s_and_b32 s1, s1, 0x7f			; GFX10-NEXT: s_and_b32 s1, s1, 0x7f
	; GFX10-NEXT: s_bfe_u32 s1, s1, 0x100000			; GFX10-NEXT: s_bfe_u32 s1, s1, 0x100000
	; GFX10-NEXT: v_rcp_iflag_f32_e32 v0, v0			; GFX10-NEXT: v_rcp_iflag_f32_e32 v0, v0
	; GFX10-NEXT: s_lshr_b32 s1, s1, 1			; GFX10-NEXT: s_lshr_b32 s1, s1, 1
	; GFX10-NEXT: v_mul_f32_e32 v0, 0x4f7ffffe, v0			; GFX10-NEXT: v_mul_f32_e32 v0, 0x4f7ffffe, v0
	; GFX10-NEXT: v_cvt_u32_f32_e32 v0, v0			; GFX10-NEXT: v_cvt_u32_f32_e32 v0, v0
	; GFX10-NEXT: v_mul_lo_u32 v1, -7, v0			; GFX10-NEXT: v_mul_lo_u32 v1, v0, -7
	; GFX10-NEXT: v_mul_hi_u32 v1, v0, v1			; GFX10-NEXT: v_mul_hi_u32 v1, v0, v1
	; GFX10-NEXT: v_add_nc_u32_e32 v0, v0, v1			; GFX10-NEXT: v_add_nc_u32_e32 v0, v0, v1
	; GFX10-NEXT: v_mul_hi_u32 v0, s2, v0			; GFX10-NEXT: v_mul_hi_u32 v0, s2, v0
	; GFX10-NEXT: v_mul_lo_u32 v0, v0, 7			; GFX10-NEXT: v_mul_lo_u32 v0, v0, 7
	; GFX10-NEXT: v_sub_nc_u32_e32 v0, s2, v0			; GFX10-NEXT: v_sub_nc_u32_e32 v0, s2, v0
	; GFX10-NEXT: v_subrev_nc_u32_e32 v1, 7, v0			; GFX10-NEXT: v_subrev_nc_u32_e32 v1, 7, v0
	; GFX10-NEXT: v_cmp_le_u32_e32 vcc_lo, 7, v0			; GFX10-NEXT: v_cmp_le_u32_e32 vcc_lo, 7, v0
	; GFX10-NEXT: v_cndmask_b32_e32 v0, v0, v1, vcc_lo			; GFX10-NEXT: v_cndmask_b32_e32 v0, v0, v1, vcc_lo
	Show All 17 Lines
	; GFX11-NEXT: s_delay_alu instid0(SALU_CYCLE_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)			; GFX11-NEXT: s_delay_alu instid0(SALU_CYCLE_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
	; GFX11-NEXT: s_bfe_u32 s1, s1, 0x100000			; GFX11-NEXT: s_bfe_u32 s1, s1, 0x100000
	; GFX11-NEXT: v_rcp_iflag_f32_e32 v0, v0			; GFX11-NEXT: v_rcp_iflag_f32_e32 v0, v0
	; GFX11-NEXT: s_lshr_b32 s1, s1, 1			; GFX11-NEXT: s_lshr_b32 s1, s1, 1
	; GFX11-NEXT: s_waitcnt_depctr 0xfff			; GFX11-NEXT: s_waitcnt_depctr 0xfff
	; GFX11-NEXT: v_mul_f32_e32 v0, 0x4f7ffffe, v0			; GFX11-NEXT: v_mul_f32_e32 v0, 0x4f7ffffe, v0
	; GFX11-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)			; GFX11-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
	; GFX11-NEXT: v_cvt_u32_f32_e32 v0, v0			; GFX11-NEXT: v_cvt_u32_f32_e32 v0, v0
	; GFX11-NEXT: v_mul_lo_u32 v1, -7, v0			; GFX11-NEXT: v_mul_lo_u32 v1, v0, -7
	; GFX11-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)			; GFX11-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
	; GFX11-NEXT: v_mul_hi_u32 v1, v0, v1			; GFX11-NEXT: v_mul_hi_u32 v1, v0, v1
	; GFX11-NEXT: v_add_nc_u32_e32 v0, v0, v1			; GFX11-NEXT: v_add_nc_u32_e32 v0, v0, v1
	; GFX11-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)			; GFX11-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
	; GFX11-NEXT: v_mul_hi_u32 v0, s2, v0			; GFX11-NEXT: v_mul_hi_u32 v0, s2, v0
	; GFX11-NEXT: v_mul_lo_u32 v0, v0, 7			; GFX11-NEXT: v_mul_lo_u32 v0, v0, 7
	; GFX11-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)			; GFX11-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
	; GFX11-NEXT: v_sub_nc_u32_e32 v0, s2, v0			; GFX11-NEXT: v_sub_nc_u32_e32 v0, s2, v0
	Show All 25 Lines
	; GFX6: ; %bb.0:			; GFX6: ; %bb.0:
	; GFX6-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)			; GFX6-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
	; GFX6-NEXT: v_cvt_f32_ubyte0_e32 v3, 7			; GFX6-NEXT: v_cvt_f32_ubyte0_e32 v3, 7
	; GFX6-NEXT: v_rcp_iflag_f32_e32 v3, v3			; GFX6-NEXT: v_rcp_iflag_f32_e32 v3, v3
	; GFX6-NEXT: v_and_b32_e32 v2, 0x7f, v2			; GFX6-NEXT: v_and_b32_e32 v2, 0x7f, v2
	; GFX6-NEXT: v_bfe_u32 v1, v1, 1, 6			; GFX6-NEXT: v_bfe_u32 v1, v1, 1, 6
	; GFX6-NEXT: v_mul_f32_e32 v3, 0x4f7ffffe, v3			; GFX6-NEXT: v_mul_f32_e32 v3, 0x4f7ffffe, v3
	; GFX6-NEXT: v_cvt_u32_f32_e32 v3, v3			; GFX6-NEXT: v_cvt_u32_f32_e32 v3, v3
	; GFX6-NEXT: v_mul_lo_u32 v4, -7, v3			; GFX6-NEXT: v_mul_lo_u32 v4, v3, -7
	; GFX6-NEXT: v_mul_hi_u32 v4, v3, v4			; GFX6-NEXT: v_mul_hi_u32 v4, v3, v4
	; GFX6-NEXT: v_add_i32_e32 v3, vcc, v3, v4			; GFX6-NEXT: v_add_i32_e32 v3, vcc, v3, v4
	; GFX6-NEXT: v_mul_hi_u32 v3, v2, v3			; GFX6-NEXT: v_mul_hi_u32 v3, v2, v3
	; GFX6-NEXT: v_mul_lo_u32 v3, v3, 7			; GFX6-NEXT: v_mul_lo_u32 v3, v3, 7
	; GFX6-NEXT: v_sub_i32_e32 v2, vcc, v2, v3			; GFX6-NEXT: v_sub_i32_e32 v2, vcc, v2, v3
	; GFX6-NEXT: v_subrev_i32_e32 v3, vcc, 7, v2			; GFX6-NEXT: v_subrev_i32_e32 v3, vcc, 7, v2
	; GFX6-NEXT: v_cmp_le_u32_e32 vcc, 7, v2			; GFX6-NEXT: v_cmp_le_u32_e32 vcc, 7, v2
	; GFX6-NEXT: v_cndmask_b32_e32 v2, v2, v3, vcc			; GFX6-NEXT: v_cndmask_b32_e32 v2, v2, v3, vcc
	Show All 13 Lines
	; GFX8-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)			; GFX8-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
	; GFX8-NEXT: v_cvt_f32_ubyte0_e32 v3, 7			; GFX8-NEXT: v_cvt_f32_ubyte0_e32 v3, 7
	; GFX8-NEXT: v_rcp_iflag_f32_e32 v3, v3			; GFX8-NEXT: v_rcp_iflag_f32_e32 v3, v3
	; GFX8-NEXT: v_and_b32_e32 v2, 0x7f, v2			; GFX8-NEXT: v_and_b32_e32 v2, 0x7f, v2
	; GFX8-NEXT: v_and_b32_e32 v1, 0x7f, v1			; GFX8-NEXT: v_and_b32_e32 v1, 0x7f, v1
	; GFX8-NEXT: v_lshrrev_b16_e32 v1, 1, v1			; GFX8-NEXT: v_lshrrev_b16_e32 v1, 1, v1
	; GFX8-NEXT: v_mul_f32_e32 v3, 0x4f7ffffe, v3			; GFX8-NEXT: v_mul_f32_e32 v3, 0x4f7ffffe, v3
	; GFX8-NEXT: v_cvt_u32_f32_e32 v3, v3			; GFX8-NEXT: v_cvt_u32_f32_e32 v3, v3
	; GFX8-NEXT: v_mul_lo_u32 v4, -7, v3			; GFX8-NEXT: v_mul_lo_u32 v4, v3, -7
	; GFX8-NEXT: v_mul_hi_u32 v4, v3, v4			; GFX8-NEXT: v_mul_hi_u32 v4, v3, v4
	; GFX8-NEXT: v_add_u32_e32 v3, vcc, v3, v4			; GFX8-NEXT: v_add_u32_e32 v3, vcc, v3, v4
	; GFX8-NEXT: v_mul_hi_u32 v3, v2, v3			; GFX8-NEXT: v_mul_hi_u32 v3, v2, v3
	; GFX8-NEXT: v_mul_lo_u32 v3, v3, 7			; GFX8-NEXT: v_mul_lo_u32 v3, v3, 7
	; GFX8-NEXT: v_sub_u32_e32 v2, vcc, v2, v3			; GFX8-NEXT: v_sub_u32_e32 v2, vcc, v2, v3
	; GFX8-NEXT: v_subrev_u32_e32 v3, vcc, 7, v2			; GFX8-NEXT: v_subrev_u32_e32 v3, vcc, 7, v2
	; GFX8-NEXT: v_cmp_le_u32_e32 vcc, 7, v2			; GFX8-NEXT: v_cmp_le_u32_e32 vcc, 7, v2
	; GFX8-NEXT: v_cndmask_b32_e32 v2, v2, v3, vcc			; GFX8-NEXT: v_cndmask_b32_e32 v2, v2, v3, vcc
	Show All 13 Lines
	; GFX9-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)			; GFX9-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
	; GFX9-NEXT: v_cvt_f32_ubyte0_e32 v3, 7			; GFX9-NEXT: v_cvt_f32_ubyte0_e32 v3, 7
	; GFX9-NEXT: v_rcp_iflag_f32_e32 v3, v3			; GFX9-NEXT: v_rcp_iflag_f32_e32 v3, v3
	; GFX9-NEXT: v_and_b32_e32 v2, 0x7f, v2			; GFX9-NEXT: v_and_b32_e32 v2, 0x7f, v2
	; GFX9-NEXT: v_and_b32_e32 v1, 0x7f, v1			; GFX9-NEXT: v_and_b32_e32 v1, 0x7f, v1
	; GFX9-NEXT: v_lshrrev_b16_e32 v1, 1, v1			; GFX9-NEXT: v_lshrrev_b16_e32 v1, 1, v1
	; GFX9-NEXT: v_mul_f32_e32 v3, 0x4f7ffffe, v3			; GFX9-NEXT: v_mul_f32_e32 v3, 0x4f7ffffe, v3
	; GFX9-NEXT: v_cvt_u32_f32_e32 v3, v3			; GFX9-NEXT: v_cvt_u32_f32_e32 v3, v3
	; GFX9-NEXT: v_mul_lo_u32 v4, -7, v3			; GFX9-NEXT: v_mul_lo_u32 v4, v3, -7
	; GFX9-NEXT: v_mul_hi_u32 v4, v3, v4			; GFX9-NEXT: v_mul_hi_u32 v4, v3, v4
	; GFX9-NEXT: v_add_u32_e32 v3, v3, v4			; GFX9-NEXT: v_add_u32_e32 v3, v3, v4
	; GFX9-NEXT: v_mul_hi_u32 v3, v2, v3			; GFX9-NEXT: v_mul_hi_u32 v3, v2, v3
	; GFX9-NEXT: v_mul_lo_u32 v3, v3, 7			; GFX9-NEXT: v_mul_lo_u32 v3, v3, 7
	; GFX9-NEXT: v_sub_u32_e32 v2, v2, v3			; GFX9-NEXT: v_sub_u32_e32 v2, v2, v3
	; GFX9-NEXT: v_subrev_u32_e32 v3, 7, v2			; GFX9-NEXT: v_subrev_u32_e32 v3, 7, v2
	; GFX9-NEXT: v_cmp_le_u32_e32 vcc, 7, v2			; GFX9-NEXT: v_cmp_le_u32_e32 vcc, 7, v2
	; GFX9-NEXT: v_cndmask_b32_e32 v2, v2, v3, vcc			; GFX9-NEXT: v_cndmask_b32_e32 v2, v2, v3, vcc
	Show All 14 Lines
	; GFX10-NEXT: s_waitcnt_vscnt null, 0x0			; GFX10-NEXT: s_waitcnt_vscnt null, 0x0
	; GFX10-NEXT: v_cvt_f32_ubyte0_e32 v3, 7			; GFX10-NEXT: v_cvt_f32_ubyte0_e32 v3, 7
	; GFX10-NEXT: v_and_b32_e32 v2, 0x7f, v2			; GFX10-NEXT: v_and_b32_e32 v2, 0x7f, v2
	; GFX10-NEXT: v_and_b32_e32 v1, 0x7f, v1			; GFX10-NEXT: v_and_b32_e32 v1, 0x7f, v1
	; GFX10-NEXT: v_rcp_iflag_f32_e32 v3, v3			; GFX10-NEXT: v_rcp_iflag_f32_e32 v3, v3
	; GFX10-NEXT: v_lshrrev_b16 v1, 1, v1			; GFX10-NEXT: v_lshrrev_b16 v1, 1, v1
	; GFX10-NEXT: v_mul_f32_e32 v3, 0x4f7ffffe, v3			; GFX10-NEXT: v_mul_f32_e32 v3, 0x4f7ffffe, v3
	; GFX10-NEXT: v_cvt_u32_f32_e32 v3, v3			; GFX10-NEXT: v_cvt_u32_f32_e32 v3, v3
	; GFX10-NEXT: v_mul_lo_u32 v4, -7, v3			; GFX10-NEXT: v_mul_lo_u32 v4, v3, -7
	; GFX10-NEXT: v_mul_hi_u32 v4, v3, v4			; GFX10-NEXT: v_mul_hi_u32 v4, v3, v4
	; GFX10-NEXT: v_add_nc_u32_e32 v3, v3, v4			; GFX10-NEXT: v_add_nc_u32_e32 v3, v3, v4
	; GFX10-NEXT: v_mul_hi_u32 v3, v2, v3			; GFX10-NEXT: v_mul_hi_u32 v3, v2, v3
	; GFX10-NEXT: v_mul_lo_u32 v3, v3, 7			; GFX10-NEXT: v_mul_lo_u32 v3, v3, 7
	; GFX10-NEXT: v_sub_nc_u32_e32 v2, v2, v3			; GFX10-NEXT: v_sub_nc_u32_e32 v2, v2, v3
	; GFX10-NEXT: v_subrev_nc_u32_e32 v3, 7, v2			; GFX10-NEXT: v_subrev_nc_u32_e32 v3, 7, v2
	; GFX10-NEXT: v_cmp_le_u32_e32 vcc_lo, 7, v2			; GFX10-NEXT: v_cmp_le_u32_e32 vcc_lo, 7, v2
	; GFX10-NEXT: v_cndmask_b32_e32 v2, v2, v3, vcc_lo			; GFX10-NEXT: v_cndmask_b32_e32 v2, v2, v3, vcc_lo
	Show All 17 Lines
	; GFX11-NEXT: v_and_b32_e32 v1, 0x7f, v1			; GFX11-NEXT: v_and_b32_e32 v1, 0x7f, v1
	; GFX11-NEXT: s_delay_alu instid0(VALU_DEP_3) \| instskip(NEXT) \| instid1(VALU_DEP_1)			; GFX11-NEXT: s_delay_alu instid0(VALU_DEP_3) \| instskip(NEXT) \| instid1(VALU_DEP_1)
	; GFX11-NEXT: v_rcp_iflag_f32_e32 v3, v3			; GFX11-NEXT: v_rcp_iflag_f32_e32 v3, v3
	; GFX11-NEXT: v_lshrrev_b16 v1, 1, v1			; GFX11-NEXT: v_lshrrev_b16 v1, 1, v1
	; GFX11-NEXT: s_waitcnt_depctr 0xfff			; GFX11-NEXT: s_waitcnt_depctr 0xfff
	; GFX11-NEXT: v_mul_f32_e32 v3, 0x4f7ffffe, v3			; GFX11-NEXT: v_mul_f32_e32 v3, 0x4f7ffffe, v3
	; GFX11-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)			; GFX11-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
	; GFX11-NEXT: v_cvt_u32_f32_e32 v3, v3			; GFX11-NEXT: v_cvt_u32_f32_e32 v3, v3
	; GFX11-NEXT: v_mul_lo_u32 v4, -7, v3			; GFX11-NEXT: v_mul_lo_u32 v4, v3, -7
	; GFX11-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)			; GFX11-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
	; GFX11-NEXT: v_mul_hi_u32 v4, v3, v4			; GFX11-NEXT: v_mul_hi_u32 v4, v3, v4
	; GFX11-NEXT: v_add_nc_u32_e32 v3, v3, v4			; GFX11-NEXT: v_add_nc_u32_e32 v3, v3, v4
	; GFX11-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)			; GFX11-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
	; GFX11-NEXT: v_mul_hi_u32 v3, v2, v3			; GFX11-NEXT: v_mul_hi_u32 v3, v2, v3
	; GFX11-NEXT: v_mul_lo_u32 v3, v3, 7			; GFX11-NEXT: v_mul_lo_u32 v3, v3, 7
	; GFX11-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)			; GFX11-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
	; GFX11-NEXT: v_sub_nc_u32_e32 v2, v2, v3			; GFX11-NEXT: v_sub_nc_u32_e32 v2, v2, v3
	▲ Show 20 Lines • Show All 1,188 Lines • ▼ Show 20 Lines
	; GFX6: ; %bb.0:			; GFX6: ; %bb.0:
	; GFX6-NEXT: v_cvt_f32_ubyte0_e32 v0, 24			; GFX6-NEXT: v_cvt_f32_ubyte0_e32 v0, 24
	; GFX6-NEXT: v_rcp_iflag_f32_e32 v0, v0			; GFX6-NEXT: v_rcp_iflag_f32_e32 v0, v0
	; GFX6-NEXT: v_mov_b32_e32 v1, 0xffffffe8			; GFX6-NEXT: v_mov_b32_e32 v1, 0xffffffe8
	; GFX6-NEXT: s_and_b32 s2, s2, 0xffffff			; GFX6-NEXT: s_and_b32 s2, s2, 0xffffff
	; GFX6-NEXT: s_bfe_u32 s1, s1, 0x170001			; GFX6-NEXT: s_bfe_u32 s1, s1, 0x170001
	; GFX6-NEXT: v_mul_f32_e32 v0, 0x4f7ffffe, v0			; GFX6-NEXT: v_mul_f32_e32 v0, 0x4f7ffffe, v0
	; GFX6-NEXT: v_cvt_u32_f32_e32 v0, v0			; GFX6-NEXT: v_cvt_u32_f32_e32 v0, v0
	; GFX6-NEXT: v_mul_lo_u32 v1, v1, v0			; GFX6-NEXT: v_mul_lo_u32 v1, v0, v1
	; GFX6-NEXT: v_mul_hi_u32 v1, v0, v1			; GFX6-NEXT: v_mul_hi_u32 v1, v0, v1
	; GFX6-NEXT: v_add_i32_e32 v0, vcc, v0, v1			; GFX6-NEXT: v_add_i32_e32 v0, vcc, v0, v1
	; GFX6-NEXT: v_mul_hi_u32 v0, s2, v0			; GFX6-NEXT: v_mul_hi_u32 v0, s2, v0
	; GFX6-NEXT: v_mul_lo_u32 v0, v0, 24			; GFX6-NEXT: v_mul_lo_u32 v0, v0, 24
	; GFX6-NEXT: v_sub_i32_e32 v0, vcc, s2, v0			; GFX6-NEXT: v_sub_i32_e32 v0, vcc, s2, v0
	; GFX6-NEXT: v_subrev_i32_e32 v1, vcc, 24, v0			; GFX6-NEXT: v_subrev_i32_e32 v1, vcc, 24, v0
	; GFX6-NEXT: v_cmp_le_u32_e32 vcc, 24, v0			; GFX6-NEXT: v_cmp_le_u32_e32 vcc, 24, v0
	; GFX6-NEXT: v_cndmask_b32_e32 v0, v0, v1, vcc			; GFX6-NEXT: v_cndmask_b32_e32 v0, v0, v1, vcc
	Show All 13 Lines
	; GFX8: ; %bb.0:			; GFX8: ; %bb.0:
	; GFX8-NEXT: v_cvt_f32_ubyte0_e32 v0, 24			; GFX8-NEXT: v_cvt_f32_ubyte0_e32 v0, 24
	; GFX8-NEXT: v_rcp_iflag_f32_e32 v0, v0			; GFX8-NEXT: v_rcp_iflag_f32_e32 v0, v0
	; GFX8-NEXT: v_mov_b32_e32 v1, 0xffffffe8			; GFX8-NEXT: v_mov_b32_e32 v1, 0xffffffe8
	; GFX8-NEXT: s_and_b32 s2, s2, 0xffffff			; GFX8-NEXT: s_and_b32 s2, s2, 0xffffff
	; GFX8-NEXT: s_bfe_u32 s1, s1, 0x170001			; GFX8-NEXT: s_bfe_u32 s1, s1, 0x170001
	; GFX8-NEXT: v_mul_f32_e32 v0, 0x4f7ffffe, v0			; GFX8-NEXT: v_mul_f32_e32 v0, 0x4f7ffffe, v0
	; GFX8-NEXT: v_cvt_u32_f32_e32 v0, v0			; GFX8-NEXT: v_cvt_u32_f32_e32 v0, v0
	; GFX8-NEXT: v_mul_lo_u32 v1, v1, v0			; GFX8-NEXT: v_mul_lo_u32 v1, v0, v1
	; GFX8-NEXT: v_mul_hi_u32 v1, v0, v1			; GFX8-NEXT: v_mul_hi_u32 v1, v0, v1
	; GFX8-NEXT: v_add_u32_e32 v0, vcc, v0, v1			; GFX8-NEXT: v_add_u32_e32 v0, vcc, v0, v1
	; GFX8-NEXT: v_mul_hi_u32 v0, s2, v0			; GFX8-NEXT: v_mul_hi_u32 v0, s2, v0
	; GFX8-NEXT: v_mul_lo_u32 v0, v0, 24			; GFX8-NEXT: v_mul_lo_u32 v0, v0, 24
	; GFX8-NEXT: v_sub_u32_e32 v0, vcc, s2, v0			; GFX8-NEXT: v_sub_u32_e32 v0, vcc, s2, v0
	; GFX8-NEXT: v_subrev_u32_e32 v1, vcc, 24, v0			; GFX8-NEXT: v_subrev_u32_e32 v1, vcc, 24, v0
	; GFX8-NEXT: v_cmp_le_u32_e32 vcc, 24, v0			; GFX8-NEXT: v_cmp_le_u32_e32 vcc, 24, v0
	; GFX8-NEXT: v_cndmask_b32_e32 v0, v0, v1, vcc			; GFX8-NEXT: v_cndmask_b32_e32 v0, v0, v1, vcc
	Show All 13 Lines
	; GFX9: ; %bb.0:			; GFX9: ; %bb.0:
	; GFX9-NEXT: v_cvt_f32_ubyte0_e32 v0, 24			; GFX9-NEXT: v_cvt_f32_ubyte0_e32 v0, 24
	; GFX9-NEXT: v_rcp_iflag_f32_e32 v0, v0			; GFX9-NEXT: v_rcp_iflag_f32_e32 v0, v0
	; GFX9-NEXT: v_mov_b32_e32 v1, 0xffffffe8			; GFX9-NEXT: v_mov_b32_e32 v1, 0xffffffe8
	; GFX9-NEXT: s_and_b32 s2, s2, 0xffffff			; GFX9-NEXT: s_and_b32 s2, s2, 0xffffff
	; GFX9-NEXT: s_bfe_u32 s1, s1, 0x170001			; GFX9-NEXT: s_bfe_u32 s1, s1, 0x170001
	; GFX9-NEXT: v_mul_f32_e32 v0, 0x4f7ffffe, v0			; GFX9-NEXT: v_mul_f32_e32 v0, 0x4f7ffffe, v0
	; GFX9-NEXT: v_cvt_u32_f32_e32 v0, v0			; GFX9-NEXT: v_cvt_u32_f32_e32 v0, v0
	; GFX9-NEXT: v_mul_lo_u32 v1, v1, v0			; GFX9-NEXT: v_mul_lo_u32 v1, v0, v1
	; GFX9-NEXT: v_mul_hi_u32 v1, v0, v1			; GFX9-NEXT: v_mul_hi_u32 v1, v0, v1
	; GFX9-NEXT: v_add_u32_e32 v0, v0, v1			; GFX9-NEXT: v_add_u32_e32 v0, v0, v1
	; GFX9-NEXT: v_mul_hi_u32 v0, s2, v0			; GFX9-NEXT: v_mul_hi_u32 v0, s2, v0
	; GFX9-NEXT: v_mul_lo_u32 v0, v0, 24			; GFX9-NEXT: v_mul_lo_u32 v0, v0, 24
	; GFX9-NEXT: v_sub_u32_e32 v0, s2, v0			; GFX9-NEXT: v_sub_u32_e32 v0, s2, v0
	; GFX9-NEXT: v_subrev_u32_e32 v1, 24, v0			; GFX9-NEXT: v_subrev_u32_e32 v1, 24, v0
	; GFX9-NEXT: v_cmp_le_u32_e32 vcc, 24, v0			; GFX9-NEXT: v_cmp_le_u32_e32 vcc, 24, v0
	; GFX9-NEXT: v_cndmask_b32_e32 v0, v0, v1, vcc			; GFX9-NEXT: v_cndmask_b32_e32 v0, v0, v1, vcc
	▲ Show 20 Lines • Show All 83 Lines • ▼ Show 20 Lines
	; GFX6-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)			; GFX6-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
	; GFX6-NEXT: v_cvt_f32_ubyte0_e32 v3, 24			; GFX6-NEXT: v_cvt_f32_ubyte0_e32 v3, 24
	; GFX6-NEXT: v_rcp_iflag_f32_e32 v3, v3			; GFX6-NEXT: v_rcp_iflag_f32_e32 v3, v3
	; GFX6-NEXT: v_mov_b32_e32 v4, 0xffffffe8			; GFX6-NEXT: v_mov_b32_e32 v4, 0xffffffe8
	; GFX6-NEXT: v_and_b32_e32 v2, 0xffffff, v2			; GFX6-NEXT: v_and_b32_e32 v2, 0xffffff, v2
	; GFX6-NEXT: v_bfe_u32 v1, v1, 1, 23			; GFX6-NEXT: v_bfe_u32 v1, v1, 1, 23
	; GFX6-NEXT: v_mul_f32_e32 v3, 0x4f7ffffe, v3			; GFX6-NEXT: v_mul_f32_e32 v3, 0x4f7ffffe, v3
	; GFX6-NEXT: v_cvt_u32_f32_e32 v3, v3			; GFX6-NEXT: v_cvt_u32_f32_e32 v3, v3
	; GFX6-NEXT: v_mul_lo_u32 v4, v4, v3			; GFX6-NEXT: v_mul_lo_u32 v4, v3, v4
	; GFX6-NEXT: v_mul_hi_u32 v4, v3, v4			; GFX6-NEXT: v_mul_hi_u32 v4, v3, v4
	; GFX6-NEXT: v_add_i32_e32 v3, vcc, v3, v4			; GFX6-NEXT: v_add_i32_e32 v3, vcc, v3, v4
	; GFX6-NEXT: v_mul_hi_u32 v3, v2, v3			; GFX6-NEXT: v_mul_hi_u32 v3, v2, v3
	; GFX6-NEXT: v_mul_lo_u32 v3, v3, 24			; GFX6-NEXT: v_mul_lo_u32 v3, v3, 24
	; GFX6-NEXT: v_sub_i32_e32 v2, vcc, v2, v3			; GFX6-NEXT: v_sub_i32_e32 v2, vcc, v2, v3
	; GFX6-NEXT: v_subrev_i32_e32 v3, vcc, 24, v2			; GFX6-NEXT: v_subrev_i32_e32 v3, vcc, 24, v2
	; GFX6-NEXT: v_cmp_le_u32_e32 vcc, 24, v2			; GFX6-NEXT: v_cmp_le_u32_e32 vcc, 24, v2
	; GFX6-NEXT: v_cndmask_b32_e32 v2, v2, v3, vcc			; GFX6-NEXT: v_cndmask_b32_e32 v2, v2, v3, vcc
	Show All 13 Lines
	; GFX8-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)			; GFX8-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
	; GFX8-NEXT: v_cvt_f32_ubyte0_e32 v3, 24			; GFX8-NEXT: v_cvt_f32_ubyte0_e32 v3, 24
	; GFX8-NEXT: v_rcp_iflag_f32_e32 v3, v3			; GFX8-NEXT: v_rcp_iflag_f32_e32 v3, v3
	; GFX8-NEXT: v_mov_b32_e32 v4, 0xffffffe8			; GFX8-NEXT: v_mov_b32_e32 v4, 0xffffffe8
	; GFX8-NEXT: v_and_b32_e32 v2, 0xffffff, v2			; GFX8-NEXT: v_and_b32_e32 v2, 0xffffff, v2
	; GFX8-NEXT: v_bfe_u32 v1, v1, 1, 23			; GFX8-NEXT: v_bfe_u32 v1, v1, 1, 23
	; GFX8-NEXT: v_mul_f32_e32 v3, 0x4f7ffffe, v3			; GFX8-NEXT: v_mul_f32_e32 v3, 0x4f7ffffe, v3
	; GFX8-NEXT: v_cvt_u32_f32_e32 v3, v3			; GFX8-NEXT: v_cvt_u32_f32_e32 v3, v3
	; GFX8-NEXT: v_mul_lo_u32 v4, v4, v3			; GFX8-NEXT: v_mul_lo_u32 v4, v3, v4
	; GFX8-NEXT: v_mul_hi_u32 v4, v3, v4			; GFX8-NEXT: v_mul_hi_u32 v4, v3, v4
	; GFX8-NEXT: v_add_u32_e32 v3, vcc, v3, v4			; GFX8-NEXT: v_add_u32_e32 v3, vcc, v3, v4
	; GFX8-NEXT: v_mul_hi_u32 v3, v2, v3			; GFX8-NEXT: v_mul_hi_u32 v3, v2, v3
	; GFX8-NEXT: v_mul_lo_u32 v3, v3, 24			; GFX8-NEXT: v_mul_lo_u32 v3, v3, 24
	; GFX8-NEXT: v_sub_u32_e32 v2, vcc, v2, v3			; GFX8-NEXT: v_sub_u32_e32 v2, vcc, v2, v3
	; GFX8-NEXT: v_subrev_u32_e32 v3, vcc, 24, v2			; GFX8-NEXT: v_subrev_u32_e32 v3, vcc, 24, v2
	; GFX8-NEXT: v_cmp_le_u32_e32 vcc, 24, v2			; GFX8-NEXT: v_cmp_le_u32_e32 vcc, 24, v2
	; GFX8-NEXT: v_cndmask_b32_e32 v2, v2, v3, vcc			; GFX8-NEXT: v_cndmask_b32_e32 v2, v2, v3, vcc
	Show All 13 Lines
	; GFX9-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)			; GFX9-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
	; GFX9-NEXT: v_cvt_f32_ubyte0_e32 v3, 24			; GFX9-NEXT: v_cvt_f32_ubyte0_e32 v3, 24
	; GFX9-NEXT: v_rcp_iflag_f32_e32 v3, v3			; GFX9-NEXT: v_rcp_iflag_f32_e32 v3, v3
	; GFX9-NEXT: v_mov_b32_e32 v4, 0xffffffe8			; GFX9-NEXT: v_mov_b32_e32 v4, 0xffffffe8
	; GFX9-NEXT: v_and_b32_e32 v2, 0xffffff, v2			; GFX9-NEXT: v_and_b32_e32 v2, 0xffffff, v2
	; GFX9-NEXT: v_bfe_u32 v1, v1, 1, 23			; GFX9-NEXT: v_bfe_u32 v1, v1, 1, 23
	; GFX9-NEXT: v_mul_f32_e32 v3, 0x4f7ffffe, v3			; GFX9-NEXT: v_mul_f32_e32 v3, 0x4f7ffffe, v3
	; GFX9-NEXT: v_cvt_u32_f32_e32 v3, v3			; GFX9-NEXT: v_cvt_u32_f32_e32 v3, v3
	; GFX9-NEXT: v_mul_lo_u32 v4, v4, v3			; GFX9-NEXT: v_mul_lo_u32 v4, v3, v4
	; GFX9-NEXT: v_mul_hi_u32 v4, v3, v4			; GFX9-NEXT: v_mul_hi_u32 v4, v3, v4
	; GFX9-NEXT: v_add_u32_e32 v3, v3, v4			; GFX9-NEXT: v_add_u32_e32 v3, v3, v4
	; GFX9-NEXT: v_mul_hi_u32 v3, v2, v3			; GFX9-NEXT: v_mul_hi_u32 v3, v2, v3
	; GFX9-NEXT: v_mul_lo_u32 v3, v3, 24			; GFX9-NEXT: v_mul_lo_u32 v3, v3, 24
	; GFX9-NEXT: v_sub_u32_e32 v2, v2, v3			; GFX9-NEXT: v_sub_u32_e32 v2, v2, v3
	; GFX9-NEXT: v_subrev_u32_e32 v3, 24, v2			; GFX9-NEXT: v_subrev_u32_e32 v3, 24, v2
	; GFX9-NEXT: v_cmp_le_u32_e32 vcc, 24, v2			; GFX9-NEXT: v_cmp_le_u32_e32 vcc, 24, v2
	; GFX9-NEXT: v_cndmask_b32_e32 v2, v2, v3, vcc			; GFX9-NEXT: v_cndmask_b32_e32 v2, v2, v3, vcc
	▲ Show 20 Lines • Show All 104 Lines • ▼ Show 20 Lines
	; GFX6-NEXT: s_bfe_u32 s1, s1, 0x100000			; GFX6-NEXT: s_bfe_u32 s1, s1, 0x100000
	; GFX6-NEXT: s_lshl_b32 s6, s6, 16			; GFX6-NEXT: s_lshl_b32 s6, s6, 16
	; GFX6-NEXT: v_mov_b32_e32 v1, 0xffffffe8			; GFX6-NEXT: v_mov_b32_e32 v1, 0xffffffe8
	; GFX6-NEXT: s_or_b32 s1, s1, s6			; GFX6-NEXT: s_or_b32 s1, s1, s6
	; GFX6-NEXT: s_lshr_b32 s6, s2, 16			; GFX6-NEXT: s_lshr_b32 s6, s2, 16
	; GFX6-NEXT: s_lshr_b32 s7, s2, 24			; GFX6-NEXT: s_lshr_b32 s7, s2, 24
	; GFX6-NEXT: s_and_b32 s9, s2, 0xff			; GFX6-NEXT: s_and_b32 s9, s2, 0xff
	; GFX6-NEXT: s_bfe_u32 s2, s2, 0x80008			; GFX6-NEXT: s_bfe_u32 s2, s2, 0x80008
	; GFX6-NEXT: v_mul_lo_u32 v2, v1, v0			; GFX6-NEXT: v_mul_lo_u32 v2, v0, v1
	; GFX6-NEXT: s_lshl_b32 s2, s2, 8			; GFX6-NEXT: s_lshl_b32 s2, s2, 8
	; GFX6-NEXT: s_and_b32 s6, s6, 0xff			; GFX6-NEXT: s_and_b32 s6, s6, 0xff
	; GFX6-NEXT: s_or_b32 s2, s9, s2			; GFX6-NEXT: s_or_b32 s2, s9, s2
	; GFX6-NEXT: s_bfe_u32 s6, s6, 0x100000			; GFX6-NEXT: s_bfe_u32 s6, s6, 0x100000
	; GFX6-NEXT: s_lshr_b32 s8, s3, 8			; GFX6-NEXT: s_lshr_b32 s8, s3, 8
	; GFX6-NEXT: s_bfe_u32 s2, s2, 0x100000			; GFX6-NEXT: s_bfe_u32 s2, s2, 0x100000
	; GFX6-NEXT: s_lshl_b32 s6, s6, 16			; GFX6-NEXT: s_lshl_b32 s6, s6, 16
	; GFX6-NEXT: s_and_b32 s3, s3, 0xff			; GFX6-NEXT: s_and_b32 s3, s3, 0xff
	Show All 21 Lines
	; GFX6-NEXT: s_lshl_b32 s6, s6, 16			; GFX6-NEXT: s_lshl_b32 s6, s6, 16
	; GFX6-NEXT: s_or_b32 s4, s4, s6			; GFX6-NEXT: s_or_b32 s4, s4, s6
	; GFX6-NEXT: v_mul_hi_u32 v0, s4, v0			; GFX6-NEXT: v_mul_hi_u32 v0, s4, v0
	; GFX6-NEXT: v_mul_f32_e32 v2, 0x4f7ffffe, v2			; GFX6-NEXT: v_mul_f32_e32 v2, 0x4f7ffffe, v2
	; GFX6-NEXT: v_cvt_u32_f32_e32 v2, v2			; GFX6-NEXT: v_cvt_u32_f32_e32 v2, v2
	; GFX6-NEXT: s_lshr_b32 s8, s5, 8			; GFX6-NEXT: s_lshr_b32 s8, s5, 8
	; GFX6-NEXT: v_mul_lo_u32 v0, v0, 24			; GFX6-NEXT: v_mul_lo_u32 v0, v0, 24
	; GFX6-NEXT: s_and_b32 s5, s5, 0xff			; GFX6-NEXT: s_and_b32 s5, s5, 0xff
	; GFX6-NEXT: v_mul_lo_u32 v1, v1, v2			; GFX6-NEXT: v_mul_lo_u32 v1, v2, v1
	; GFX6-NEXT: s_lshl_b32 s5, s5, 8			; GFX6-NEXT: s_lshl_b32 s5, s5, 8
	; GFX6-NEXT: v_sub_i32_e32 v0, vcc, s4, v0			; GFX6-NEXT: v_sub_i32_e32 v0, vcc, s4, v0
	; GFX6-NEXT: v_subrev_i32_e32 v3, vcc, 24, v0			; GFX6-NEXT: v_subrev_i32_e32 v3, vcc, 24, v0
	; GFX6-NEXT: v_cmp_le_u32_e32 vcc, 24, v0			; GFX6-NEXT: v_cmp_le_u32_e32 vcc, 24, v0
	; GFX6-NEXT: v_mul_hi_u32 v1, v2, v1			; GFX6-NEXT: v_mul_hi_u32 v1, v2, v1
	; GFX6-NEXT: s_and_b32 s6, s8, 0xff			; GFX6-NEXT: s_and_b32 s6, s8, 0xff
	; GFX6-NEXT: v_cndmask_b32_e32 v0, v0, v3, vcc			; GFX6-NEXT: v_cndmask_b32_e32 v0, v0, v3, vcc
	; GFX6-NEXT: s_or_b32 s5, s7, s5			; GFX6-NEXT: s_or_b32 s5, s7, s5
	▲ Show 20 Lines • Show All 79 Lines • ▼ Show 20 Lines
	; GFX8-NEXT: s_lshr_b32 s7, s2, 16			; GFX8-NEXT: s_lshr_b32 s7, s2, 16
	; GFX8-NEXT: s_lshr_b32 s8, s2, 24			; GFX8-NEXT: s_lshr_b32 s8, s2, 24
	; GFX8-NEXT: s_and_b32 s2, s2, 0xff			; GFX8-NEXT: s_and_b32 s2, s2, 0xff
	; GFX8-NEXT: s_lshl_b32 s6, s6, s10			; GFX8-NEXT: s_lshl_b32 s6, s6, s10
	; GFX8-NEXT: s_or_b32 s2, s2, s6			; GFX8-NEXT: s_or_b32 s2, s2, s6
	; GFX8-NEXT: s_and_b32 s6, s7, 0xff			; GFX8-NEXT: s_and_b32 s6, s7, 0xff
	; GFX8-NEXT: v_mov_b32_e32 v1, 0xffffffe8			; GFX8-NEXT: v_mov_b32_e32 v1, 0xffffffe8
	; GFX8-NEXT: s_bfe_u32 s6, s6, 0x100000			; GFX8-NEXT: s_bfe_u32 s6, s6, 0x100000
	; GFX8-NEXT: v_mul_lo_u32 v2, v1, v0			; GFX8-NEXT: v_mul_lo_u32 v2, v0, v1
	; GFX8-NEXT: s_lshr_b32 s9, s3, 8			; GFX8-NEXT: s_lshr_b32 s9, s3, 8
	; GFX8-NEXT: s_bfe_u32 s2, s2, 0x100000			; GFX8-NEXT: s_bfe_u32 s2, s2, 0x100000
	; GFX8-NEXT: s_lshl_b32 s6, s6, 16			; GFX8-NEXT: s_lshl_b32 s6, s6, 16
	; GFX8-NEXT: s_and_b32 s3, s3, 0xff			; GFX8-NEXT: s_and_b32 s3, s3, 0xff
	; GFX8-NEXT: s_or_b32 s2, s2, s6			; GFX8-NEXT: s_or_b32 s2, s2, s6
	; GFX8-NEXT: s_lshl_b32 s3, s3, s10			; GFX8-NEXT: s_lshl_b32 s3, s3, s10
	; GFX8-NEXT: s_and_b32 s6, s9, 0xff			; GFX8-NEXT: s_and_b32 s6, s9, 0xff
	; GFX8-NEXT: s_or_b32 s3, s8, s3			; GFX8-NEXT: s_or_b32 s3, s8, s3
	Show All 18 Lines
	; GFX8-NEXT: s_lshl_b32 s6, s6, 16			; GFX8-NEXT: s_lshl_b32 s6, s6, 16
	; GFX8-NEXT: s_or_b32 s4, s4, s6			; GFX8-NEXT: s_or_b32 s4, s4, s6
	; GFX8-NEXT: v_mul_hi_u32 v0, s4, v0			; GFX8-NEXT: v_mul_hi_u32 v0, s4, v0
	; GFX8-NEXT: v_mul_f32_e32 v2, 0x4f7ffffe, v2			; GFX8-NEXT: v_mul_f32_e32 v2, 0x4f7ffffe, v2
	; GFX8-NEXT: v_cvt_u32_f32_e32 v2, v2			; GFX8-NEXT: v_cvt_u32_f32_e32 v2, v2
	; GFX8-NEXT: s_lshr_b32 s9, s5, 8			; GFX8-NEXT: s_lshr_b32 s9, s5, 8
	; GFX8-NEXT: v_mul_lo_u32 v0, v0, 24			; GFX8-NEXT: v_mul_lo_u32 v0, v0, 24
	; GFX8-NEXT: s_and_b32 s5, s5, 0xff			; GFX8-NEXT: s_and_b32 s5, s5, 0xff
	; GFX8-NEXT: v_mul_lo_u32 v1, v1, v2			; GFX8-NEXT: v_mul_lo_u32 v1, v2, v1
	; GFX8-NEXT: s_lshl_b32 s5, s5, s10			; GFX8-NEXT: s_lshl_b32 s5, s5, s10
	; GFX8-NEXT: v_sub_u32_e32 v0, vcc, s4, v0			; GFX8-NEXT: v_sub_u32_e32 v0, vcc, s4, v0
	; GFX8-NEXT: v_subrev_u32_e32 v3, vcc, 24, v0			; GFX8-NEXT: v_subrev_u32_e32 v3, vcc, 24, v0
	; GFX8-NEXT: v_cmp_le_u32_e32 vcc, 24, v0			; GFX8-NEXT: v_cmp_le_u32_e32 vcc, 24, v0
	; GFX8-NEXT: v_mul_hi_u32 v1, v2, v1			; GFX8-NEXT: v_mul_hi_u32 v1, v2, v1
	; GFX8-NEXT: s_and_b32 s6, s9, 0xff			; GFX8-NEXT: s_and_b32 s6, s9, 0xff
	; GFX8-NEXT: v_cndmask_b32_e32 v0, v0, v3, vcc			; GFX8-NEXT: v_cndmask_b32_e32 v0, v0, v3, vcc
	; GFX8-NEXT: s_or_b32 s5, s8, s5			; GFX8-NEXT: s_or_b32 s5, s8, s5
	▲ Show 20 Lines • Show All 59 Lines • ▼ Show 20 Lines
	; GFX9-NEXT: s_or_b32 s0, s0, s7			; GFX9-NEXT: s_or_b32 s0, s0, s7
	; GFX9-NEXT: s_and_b32 s7, s9, 0xff			; GFX9-NEXT: s_and_b32 s7, s9, 0xff
	; GFX9-NEXT: s_bfe_u32 s7, s7, 0x100000			; GFX9-NEXT: s_bfe_u32 s7, s7, 0x100000
	; GFX9-NEXT: v_mov_b32_e32 v1, 0xffffffe8			; GFX9-NEXT: v_mov_b32_e32 v1, 0xffffffe8
	; GFX9-NEXT: s_lshr_b32 s11, s1, 8			; GFX9-NEXT: s_lshr_b32 s11, s1, 8
	; GFX9-NEXT: s_bfe_u32 s0, s0, 0x100000			; GFX9-NEXT: s_bfe_u32 s0, s0, 0x100000
	; GFX9-NEXT: s_lshl_b32 s7, s7, 16			; GFX9-NEXT: s_lshl_b32 s7, s7, 16
	; GFX9-NEXT: s_and_b32 s1, s1, 0xff			; GFX9-NEXT: s_and_b32 s1, s1, 0xff
	; GFX9-NEXT: v_mul_lo_u32 v2, v1, v0			; GFX9-NEXT: v_mul_lo_u32 v2, v0, v1
	; GFX9-NEXT: s_or_b32 s0, s0, s7			; GFX9-NEXT: s_or_b32 s0, s0, s7
	; GFX9-NEXT: s_lshl_b32 s1, s1, s12			; GFX9-NEXT: s_lshl_b32 s1, s1, s12
	; GFX9-NEXT: s_and_b32 s7, s11, 0xff			; GFX9-NEXT: s_and_b32 s7, s11, 0xff
	; GFX9-NEXT: s_or_b32 s1, s10, s1			; GFX9-NEXT: s_or_b32 s1, s10, s1
	; GFX9-NEXT: s_bfe_u32 s7, s7, 0x100000			; GFX9-NEXT: s_bfe_u32 s7, s7, 0x100000
	; GFX9-NEXT: s_bfe_u32 s1, s1, 0x100000			; GFX9-NEXT: s_bfe_u32 s1, s1, 0x100000
	; GFX9-NEXT: s_lshl_b32 s7, s7, 16			; GFX9-NEXT: s_lshl_b32 s7, s7, 16
	; GFX9-NEXT: s_or_b32 s1, s1, s7			; GFX9-NEXT: s_or_b32 s1, s1, s7
	Show All 30 Lines
	; GFX9-NEXT: s_lshr_b32 s10, s4, 24			; GFX9-NEXT: s_lshr_b32 s10, s4, 24
	; GFX9-NEXT: s_and_b32 s4, s4, 0xff			; GFX9-NEXT: s_and_b32 s4, s4, 0xff
	; GFX9-NEXT: s_lshl_b32 s7, s7, s12			; GFX9-NEXT: s_lshl_b32 s7, s7, s12
	; GFX9-NEXT: s_or_b32 s4, s4, s7			; GFX9-NEXT: s_or_b32 s4, s4, s7
	; GFX9-NEXT: s_and_b32 s7, s9, 0xff			; GFX9-NEXT: s_and_b32 s7, s9, 0xff
	; GFX9-NEXT: s_bfe_u32 s7, s7, 0x100000			; GFX9-NEXT: s_bfe_u32 s7, s7, 0x100000
	; GFX9-NEXT: s_bfe_u32 s4, s4, 0x100000			; GFX9-NEXT: s_bfe_u32 s4, s4, 0x100000
	; GFX9-NEXT: s_lshl_b32 s7, s7, 16			; GFX9-NEXT: s_lshl_b32 s7, s7, 16
	; GFX9-NEXT: v_mul_lo_u32 v1, v1, v2			; GFX9-NEXT: v_mul_lo_u32 v1, v2, v1
	; GFX9-NEXT: s_or_b32 s4, s4, s7			; GFX9-NEXT: s_or_b32 s4, s4, s7
	; GFX9-NEXT: v_mul_hi_u32 v0, s4, v0			; GFX9-NEXT: v_mul_hi_u32 v0, s4, v0
	; GFX9-NEXT: s_lshr_b32 s11, s5, 8			; GFX9-NEXT: s_lshr_b32 s11, s5, 8
	; GFX9-NEXT: s_and_b32 s5, s5, 0xff			; GFX9-NEXT: s_and_b32 s5, s5, 0xff
	; GFX9-NEXT: v_mul_hi_u32 v1, v2, v1			; GFX9-NEXT: v_mul_hi_u32 v1, v2, v1
	; GFX9-NEXT: s_lshl_b32 s5, s5, s12			; GFX9-NEXT: s_lshl_b32 s5, s5, s12
	; GFX9-NEXT: s_and_b32 s7, s11, 0xff			; GFX9-NEXT: s_and_b32 s7, s11, 0xff
	; GFX9-NEXT: s_or_b32 s5, s10, s5			; GFX9-NEXT: s_or_b32 s5, s10, s5
	▲ Show 20 Lines • Show All 322 Lines • ▼ Show 20 Lines
	; GFX6-NEXT: v_mov_b32_e32 v7, 0xffffffe8			; GFX6-NEXT: v_mov_b32_e32 v7, 0xffffffe8
	; GFX6-NEXT: v_cvt_f32_ubyte0_e32 v9, 24			; GFX6-NEXT: v_cvt_f32_ubyte0_e32 v9, 24
	; GFX6-NEXT: v_rcp_iflag_f32_e32 v9, v9			; GFX6-NEXT: v_rcp_iflag_f32_e32 v9, v9
	; GFX6-NEXT: v_mul_f32_e32 v6, 0x4f7ffffe, v6			; GFX6-NEXT: v_mul_f32_e32 v6, 0x4f7ffffe, v6
	; GFX6-NEXT: v_cvt_u32_f32_e32 v6, v6			; GFX6-NEXT: v_cvt_u32_f32_e32 v6, v6
	; GFX6-NEXT: v_and_b32_e32 v4, 0xffffff, v4			; GFX6-NEXT: v_and_b32_e32 v4, 0xffffff, v4
	; GFX6-NEXT: v_and_b32_e32 v5, 0xffffff, v5			; GFX6-NEXT: v_and_b32_e32 v5, 0xffffff, v5
	; GFX6-NEXT: v_bfe_u32 v2, v2, 1, 23			; GFX6-NEXT: v_bfe_u32 v2, v2, 1, 23
	; GFX6-NEXT: v_mul_lo_u32 v8, v7, v6			; GFX6-NEXT: v_mul_lo_u32 v8, v6, v7
	; GFX6-NEXT: v_mul_hi_u32 v8, v6, v8			; GFX6-NEXT: v_mul_hi_u32 v8, v6, v8
	; GFX6-NEXT: v_add_i32_e32 v6, vcc, v6, v8			; GFX6-NEXT: v_add_i32_e32 v6, vcc, v6, v8
	; GFX6-NEXT: v_mul_hi_u32 v6, v4, v6			; GFX6-NEXT: v_mul_hi_u32 v6, v4, v6
	; GFX6-NEXT: v_mul_f32_e32 v8, 0x4f7ffffe, v9			; GFX6-NEXT: v_mul_f32_e32 v8, 0x4f7ffffe, v9
	; GFX6-NEXT: v_cvt_u32_f32_e32 v8, v8			; GFX6-NEXT: v_cvt_u32_f32_e32 v8, v8
	; GFX6-NEXT: v_mul_lo_u32 v6, v6, 24			; GFX6-NEXT: v_mul_lo_u32 v6, v6, 24
	; GFX6-NEXT: v_mul_lo_u32 v7, v7, v8			; GFX6-NEXT: v_mul_lo_u32 v7, v8, v7
	; GFX6-NEXT: v_sub_i32_e32 v4, vcc, v4, v6			; GFX6-NEXT: v_sub_i32_e32 v4, vcc, v4, v6
	; GFX6-NEXT: v_subrev_i32_e32 v6, vcc, 24, v4			; GFX6-NEXT: v_subrev_i32_e32 v6, vcc, 24, v4
	; GFX6-NEXT: v_cmp_le_u32_e32 vcc, 24, v4			; GFX6-NEXT: v_cmp_le_u32_e32 vcc, 24, v4
	; GFX6-NEXT: v_mul_hi_u32 v7, v8, v7			; GFX6-NEXT: v_mul_hi_u32 v7, v8, v7
	; GFX6-NEXT: v_cndmask_b32_e32 v4, v4, v6, vcc			; GFX6-NEXT: v_cndmask_b32_e32 v4, v4, v6, vcc
	; GFX6-NEXT: v_subrev_i32_e32 v6, vcc, 24, v4			; GFX6-NEXT: v_subrev_i32_e32 v6, vcc, 24, v4
	; GFX6-NEXT: v_cmp_le_u32_e32 vcc, 24, v4			; GFX6-NEXT: v_cmp_le_u32_e32 vcc, 24, v4
	; GFX6-NEXT: v_cndmask_b32_e32 v4, v4, v6, vcc			; GFX6-NEXT: v_cndmask_b32_e32 v4, v4, v6, vcc
	Show All 30 Lines
	; GFX8-NEXT: v_mov_b32_e32 v7, 0xffffffe8			; GFX8-NEXT: v_mov_b32_e32 v7, 0xffffffe8
	; GFX8-NEXT: v_cvt_f32_ubyte0_e32 v9, 24			; GFX8-NEXT: v_cvt_f32_ubyte0_e32 v9, 24
	; GFX8-NEXT: v_rcp_iflag_f32_e32 v9, v9			; GFX8-NEXT: v_rcp_iflag_f32_e32 v9, v9
	; GFX8-NEXT: v_mul_f32_e32 v6, 0x4f7ffffe, v6			; GFX8-NEXT: v_mul_f32_e32 v6, 0x4f7ffffe, v6
	; GFX8-NEXT: v_cvt_u32_f32_e32 v6, v6			; GFX8-NEXT: v_cvt_u32_f32_e32 v6, v6
	; GFX8-NEXT: v_and_b32_e32 v4, 0xffffff, v4			; GFX8-NEXT: v_and_b32_e32 v4, 0xffffff, v4
	; GFX8-NEXT: v_and_b32_e32 v5, 0xffffff, v5			; GFX8-NEXT: v_and_b32_e32 v5, 0xffffff, v5
	; GFX8-NEXT: v_bfe_u32 v2, v2, 1, 23			; GFX8-NEXT: v_bfe_u32 v2, v2, 1, 23
	; GFX8-NEXT: v_mul_lo_u32 v8, v7, v6			; GFX8-NEXT: v_mul_lo_u32 v8, v6, v7
	; GFX8-NEXT: v_mul_hi_u32 v8, v6, v8			; GFX8-NEXT: v_mul_hi_u32 v8, v6, v8
	; GFX8-NEXT: v_add_u32_e32 v6, vcc, v6, v8			; GFX8-NEXT: v_add_u32_e32 v6, vcc, v6, v8
	; GFX8-NEXT: v_mul_hi_u32 v6, v4, v6			; GFX8-NEXT: v_mul_hi_u32 v6, v4, v6
	; GFX8-NEXT: v_mul_f32_e32 v8, 0x4f7ffffe, v9			; GFX8-NEXT: v_mul_f32_e32 v8, 0x4f7ffffe, v9
	; GFX8-NEXT: v_cvt_u32_f32_e32 v8, v8			; GFX8-NEXT: v_cvt_u32_f32_e32 v8, v8
	; GFX8-NEXT: v_mul_lo_u32 v6, v6, 24			; GFX8-NEXT: v_mul_lo_u32 v6, v6, 24
	; GFX8-NEXT: v_mul_lo_u32 v7, v7, v8			; GFX8-NEXT: v_mul_lo_u32 v7, v8, v7
	; GFX8-NEXT: v_sub_u32_e32 v4, vcc, v4, v6			; GFX8-NEXT: v_sub_u32_e32 v4, vcc, v4, v6
	; GFX8-NEXT: v_subrev_u32_e32 v6, vcc, 24, v4			; GFX8-NEXT: v_subrev_u32_e32 v6, vcc, 24, v4
	; GFX8-NEXT: v_cmp_le_u32_e32 vcc, 24, v4			; GFX8-NEXT: v_cmp_le_u32_e32 vcc, 24, v4
	; GFX8-NEXT: v_mul_hi_u32 v7, v8, v7			; GFX8-NEXT: v_mul_hi_u32 v7, v8, v7
	; GFX8-NEXT: v_cndmask_b32_e32 v4, v4, v6, vcc			; GFX8-NEXT: v_cndmask_b32_e32 v4, v4, v6, vcc
	; GFX8-NEXT: v_subrev_u32_e32 v6, vcc, 24, v4			; GFX8-NEXT: v_subrev_u32_e32 v6, vcc, 24, v4
	; GFX8-NEXT: v_cmp_le_u32_e32 vcc, 24, v4			; GFX8-NEXT: v_cmp_le_u32_e32 vcc, 24, v4
	; GFX8-NEXT: v_cndmask_b32_e32 v4, v4, v6, vcc			; GFX8-NEXT: v_cndmask_b32_e32 v4, v4, v6, vcc
	Show All 30 Lines
	; GFX9-NEXT: v_mov_b32_e32 v7, 0xffffffe8			; GFX9-NEXT: v_mov_b32_e32 v7, 0xffffffe8
	; GFX9-NEXT: v_cvt_f32_ubyte0_e32 v9, 24			; GFX9-NEXT: v_cvt_f32_ubyte0_e32 v9, 24
	; GFX9-NEXT: v_rcp_iflag_f32_e32 v9, v9			; GFX9-NEXT: v_rcp_iflag_f32_e32 v9, v9
	; GFX9-NEXT: v_mul_f32_e32 v6, 0x4f7ffffe, v6			; GFX9-NEXT: v_mul_f32_e32 v6, 0x4f7ffffe, v6
	; GFX9-NEXT: v_cvt_u32_f32_e32 v6, v6			; GFX9-NEXT: v_cvt_u32_f32_e32 v6, v6
	; GFX9-NEXT: v_and_b32_e32 v4, 0xffffff, v4			; GFX9-NEXT: v_and_b32_e32 v4, 0xffffff, v4
	; GFX9-NEXT: v_mul_f32_e32 v9, 0x4f7ffffe, v9			; GFX9-NEXT: v_mul_f32_e32 v9, 0x4f7ffffe, v9
	; GFX9-NEXT: v_cvt_u32_f32_e32 v9, v9			; GFX9-NEXT: v_cvt_u32_f32_e32 v9, v9
	; GFX9-NEXT: v_mul_lo_u32 v8, v7, v6			; GFX9-NEXT: v_mul_lo_u32 v8, v6, v7
	; GFX9-NEXT: v_and_b32_e32 v5, 0xffffff, v5			; GFX9-NEXT: v_and_b32_e32 v5, 0xffffff, v5
	; GFX9-NEXT: v_bfe_u32 v2, v2, 1, 23			; GFX9-NEXT: v_bfe_u32 v2, v2, 1, 23
	; GFX9-NEXT: v_mul_lo_u32 v7, v7, v9			; GFX9-NEXT: v_mul_lo_u32 v7, v9, v7
	; GFX9-NEXT: v_mul_hi_u32 v8, v6, v8			; GFX9-NEXT: v_mul_hi_u32 v8, v6, v8
	; GFX9-NEXT: v_bfe_u32 v3, v3, 1, 23			; GFX9-NEXT: v_bfe_u32 v3, v3, 1, 23
	; GFX9-NEXT: v_mul_hi_u32 v7, v9, v7			; GFX9-NEXT: v_mul_hi_u32 v7, v9, v7
	; GFX9-NEXT: v_add_u32_e32 v6, v6, v8			; GFX9-NEXT: v_add_u32_e32 v6, v6, v8
	; GFX9-NEXT: v_mul_hi_u32 v6, v4, v6			; GFX9-NEXT: v_mul_hi_u32 v6, v4, v6
	; GFX9-NEXT: v_add_u32_e32 v7, v9, v7			; GFX9-NEXT: v_add_u32_e32 v7, v9, v7
	; GFX9-NEXT: v_mul_lo_u32 v6, v6, 24			; GFX9-NEXT: v_mul_lo_u32 v6, v6, 24
	; GFX9-NEXT: v_sub_u32_e32 v4, v4, v6			; GFX9-NEXT: v_sub_u32_e32 v4, v4, v6
	▲ Show 20 Lines • Show All 5,783 Lines • Show Last 20 Lines

llvm/test/CodeGen/AMDGPU/GlobalISel/fshr.ll

This file is larger than 256 KB, so syntax highlighting is disabled by default.

	Show All 9 Lines
	; GFX6: ; %bb.0:			; GFX6: ; %bb.0:
	; GFX6-NEXT: v_cvt_f32_ubyte0_e32 v0, 7			; GFX6-NEXT: v_cvt_f32_ubyte0_e32 v0, 7
	; GFX6-NEXT: v_rcp_iflag_f32_e32 v0, v0			; GFX6-NEXT: v_rcp_iflag_f32_e32 v0, v0
	; GFX6-NEXT: s_and_b32 s2, s2, 0x7f			; GFX6-NEXT: s_and_b32 s2, s2, 0x7f
	; GFX6-NEXT: s_lshl_b32 s0, s0, 1			; GFX6-NEXT: s_lshl_b32 s0, s0, 1
	; GFX6-NEXT: s_and_b32 s1, s1, 0x7f			; GFX6-NEXT: s_and_b32 s1, s1, 0x7f
	; GFX6-NEXT: v_mul_f32_e32 v0, 0x4f7ffffe, v0			; GFX6-NEXT: v_mul_f32_e32 v0, 0x4f7ffffe, v0
	; GFX6-NEXT: v_cvt_u32_f32_e32 v0, v0			; GFX6-NEXT: v_cvt_u32_f32_e32 v0, v0
	; GFX6-NEXT: v_mul_lo_u32 v1, -7, v0			; GFX6-NEXT: v_mul_lo_u32 v1, v0, -7
	; GFX6-NEXT: v_mul_hi_u32 v1, v0, v1			; GFX6-NEXT: v_mul_hi_u32 v1, v0, v1
	; GFX6-NEXT: v_add_i32_e32 v0, vcc, v0, v1			; GFX6-NEXT: v_add_i32_e32 v0, vcc, v0, v1
	; GFX6-NEXT: v_mul_hi_u32 v0, s2, v0			; GFX6-NEXT: v_mul_hi_u32 v0, s2, v0
	; GFX6-NEXT: v_mul_lo_u32 v0, v0, 7			; GFX6-NEXT: v_mul_lo_u32 v0, v0, 7
	; GFX6-NEXT: v_sub_i32_e32 v0, vcc, s2, v0			; GFX6-NEXT: v_sub_i32_e32 v0, vcc, s2, v0
	; GFX6-NEXT: v_subrev_i32_e32 v1, vcc, 7, v0			; GFX6-NEXT: v_subrev_i32_e32 v1, vcc, 7, v0
	; GFX6-NEXT: v_cmp_le_u32_e32 vcc, 7, v0			; GFX6-NEXT: v_cmp_le_u32_e32 vcc, 7, v0
	; GFX6-NEXT: v_cndmask_b32_e32 v0, v0, v1, vcc			; GFX6-NEXT: v_cndmask_b32_e32 v0, v0, v1, vcc
	Show All 13 Lines
	; GFX8: ; %bb.0:			; GFX8: ; %bb.0:
	; GFX8-NEXT: v_cvt_f32_ubyte0_e32 v0, 7			; GFX8-NEXT: v_cvt_f32_ubyte0_e32 v0, 7
	; GFX8-NEXT: v_rcp_iflag_f32_e32 v0, v0			; GFX8-NEXT: v_rcp_iflag_f32_e32 v0, v0
	; GFX8-NEXT: s_and_b32 s2, s2, 0x7f			; GFX8-NEXT: s_and_b32 s2, s2, 0x7f
	; GFX8-NEXT: s_lshl_b32 s0, s0, 1			; GFX8-NEXT: s_lshl_b32 s0, s0, 1
	; GFX8-NEXT: s_and_b32 s1, s1, 0x7f			; GFX8-NEXT: s_and_b32 s1, s1, 0x7f
	; GFX8-NEXT: v_mul_f32_e32 v0, 0x4f7ffffe, v0			; GFX8-NEXT: v_mul_f32_e32 v0, 0x4f7ffffe, v0
	; GFX8-NEXT: v_cvt_u32_f32_e32 v0, v0			; GFX8-NEXT: v_cvt_u32_f32_e32 v0, v0
	; GFX8-NEXT: v_mul_lo_u32 v1, -7, v0			; GFX8-NEXT: v_mul_lo_u32 v1, v0, -7
	; GFX8-NEXT: v_mul_hi_u32 v1, v0, v1			; GFX8-NEXT: v_mul_hi_u32 v1, v0, v1
	; GFX8-NEXT: v_add_u32_e32 v0, vcc, v0, v1			; GFX8-NEXT: v_add_u32_e32 v0, vcc, v0, v1
	; GFX8-NEXT: v_mul_hi_u32 v0, s2, v0			; GFX8-NEXT: v_mul_hi_u32 v0, s2, v0
	; GFX8-NEXT: v_mul_lo_u32 v0, v0, 7			; GFX8-NEXT: v_mul_lo_u32 v0, v0, 7
	; GFX8-NEXT: v_sub_u32_e32 v0, vcc, s2, v0			; GFX8-NEXT: v_sub_u32_e32 v0, vcc, s2, v0
	; GFX8-NEXT: v_subrev_u32_e32 v1, vcc, 7, v0			; GFX8-NEXT: v_subrev_u32_e32 v1, vcc, 7, v0
	; GFX8-NEXT: v_cmp_le_u32_e32 vcc, 7, v0			; GFX8-NEXT: v_cmp_le_u32_e32 vcc, 7, v0
	; GFX8-NEXT: v_cndmask_b32_e32 v0, v0, v1, vcc			; GFX8-NEXT: v_cndmask_b32_e32 v0, v0, v1, vcc
	Show All 13 Lines
	; GFX9: ; %bb.0:			; GFX9: ; %bb.0:
	; GFX9-NEXT: v_cvt_f32_ubyte0_e32 v0, 7			; GFX9-NEXT: v_cvt_f32_ubyte0_e32 v0, 7
	; GFX9-NEXT: v_rcp_iflag_f32_e32 v0, v0			; GFX9-NEXT: v_rcp_iflag_f32_e32 v0, v0
	; GFX9-NEXT: s_and_b32 s2, s2, 0x7f			; GFX9-NEXT: s_and_b32 s2, s2, 0x7f
	; GFX9-NEXT: s_lshl_b32 s0, s0, 1			; GFX9-NEXT: s_lshl_b32 s0, s0, 1
	; GFX9-NEXT: s_and_b32 s1, s1, 0x7f			; GFX9-NEXT: s_and_b32 s1, s1, 0x7f
	; GFX9-NEXT: v_mul_f32_e32 v0, 0x4f7ffffe, v0			; GFX9-NEXT: v_mul_f32_e32 v0, 0x4f7ffffe, v0
	; GFX9-NEXT: v_cvt_u32_f32_e32 v0, v0			; GFX9-NEXT: v_cvt_u32_f32_e32 v0, v0
	; GFX9-NEXT: v_mul_lo_u32 v1, -7, v0			; GFX9-NEXT: v_mul_lo_u32 v1, v0, -7
	; GFX9-NEXT: v_mul_hi_u32 v1, v0, v1			; GFX9-NEXT: v_mul_hi_u32 v1, v0, v1
	; GFX9-NEXT: v_add_u32_e32 v0, v0, v1			; GFX9-NEXT: v_add_u32_e32 v0, v0, v1
	; GFX9-NEXT: v_mul_hi_u32 v0, s2, v0			; GFX9-NEXT: v_mul_hi_u32 v0, s2, v0
	; GFX9-NEXT: v_mul_lo_u32 v0, v0, 7			; GFX9-NEXT: v_mul_lo_u32 v0, v0, 7
	; GFX9-NEXT: v_sub_u32_e32 v0, s2, v0			; GFX9-NEXT: v_sub_u32_e32 v0, s2, v0
	; GFX9-NEXT: v_subrev_u32_e32 v1, 7, v0			; GFX9-NEXT: v_subrev_u32_e32 v1, 7, v0
	; GFX9-NEXT: v_cmp_le_u32_e32 vcc, 7, v0			; GFX9-NEXT: v_cmp_le_u32_e32 vcc, 7, v0
	; GFX9-NEXT: v_cndmask_b32_e32 v0, v0, v1, vcc			; GFX9-NEXT: v_cndmask_b32_e32 v0, v0, v1, vcc
	Show All 13 Lines
	; GFX10: ; %bb.0:			; GFX10: ; %bb.0:
	; GFX10-NEXT: v_cvt_f32_ubyte0_e32 v0, 7			; GFX10-NEXT: v_cvt_f32_ubyte0_e32 v0, 7
	; GFX10-NEXT: s_and_b32 s2, s2, 0x7f			; GFX10-NEXT: s_and_b32 s2, s2, 0x7f
	; GFX10-NEXT: s_lshl_b32 s0, s0, 1			; GFX10-NEXT: s_lshl_b32 s0, s0, 1
	; GFX10-NEXT: s_and_b32 s1, s1, 0x7f			; GFX10-NEXT: s_and_b32 s1, s1, 0x7f
	; GFX10-NEXT: v_rcp_iflag_f32_e32 v0, v0			; GFX10-NEXT: v_rcp_iflag_f32_e32 v0, v0
	; GFX10-NEXT: v_mul_f32_e32 v0, 0x4f7ffffe, v0			; GFX10-NEXT: v_mul_f32_e32 v0, 0x4f7ffffe, v0
	; GFX10-NEXT: v_cvt_u32_f32_e32 v0, v0			; GFX10-NEXT: v_cvt_u32_f32_e32 v0, v0
	; GFX10-NEXT: v_mul_lo_u32 v1, -7, v0			; GFX10-NEXT: v_mul_lo_u32 v1, v0, -7
	; GFX10-NEXT: v_mul_hi_u32 v1, v0, v1			; GFX10-NEXT: v_mul_hi_u32 v1, v0, v1
	; GFX10-NEXT: v_add_nc_u32_e32 v0, v0, v1			; GFX10-NEXT: v_add_nc_u32_e32 v0, v0, v1
	; GFX10-NEXT: v_mul_hi_u32 v0, s2, v0			; GFX10-NEXT: v_mul_hi_u32 v0, s2, v0
	; GFX10-NEXT: v_mul_lo_u32 v0, v0, 7			; GFX10-NEXT: v_mul_lo_u32 v0, v0, 7
	; GFX10-NEXT: v_sub_nc_u32_e32 v0, s2, v0			; GFX10-NEXT: v_sub_nc_u32_e32 v0, s2, v0
	; GFX10-NEXT: v_subrev_nc_u32_e32 v1, 7, v0			; GFX10-NEXT: v_subrev_nc_u32_e32 v1, 7, v0
	; GFX10-NEXT: v_cmp_le_u32_e32 vcc_lo, 7, v0			; GFX10-NEXT: v_cmp_le_u32_e32 vcc_lo, 7, v0
	; GFX10-NEXT: v_cndmask_b32_e32 v0, v0, v1, vcc_lo			; GFX10-NEXT: v_cndmask_b32_e32 v0, v0, v1, vcc_lo
	Show All 16 Lines
	; GFX11-NEXT: s_lshl_b32 s0, s0, 1			; GFX11-NEXT: s_lshl_b32 s0, s0, 1
	; GFX11-NEXT: s_and_b32 s1, s1, 0x7f			; GFX11-NEXT: s_and_b32 s1, s1, 0x7f
	; GFX11-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(SKIP_2) \| instid1(VALU_DEP_1)			; GFX11-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(SKIP_2) \| instid1(VALU_DEP_1)
	; GFX11-NEXT: v_rcp_iflag_f32_e32 v0, v0			; GFX11-NEXT: v_rcp_iflag_f32_e32 v0, v0
	; GFX11-NEXT: s_waitcnt_depctr 0xfff			; GFX11-NEXT: s_waitcnt_depctr 0xfff
	; GFX11-NEXT: v_mul_f32_e32 v0, 0x4f7ffffe, v0			; GFX11-NEXT: v_mul_f32_e32 v0, 0x4f7ffffe, v0
	; GFX11-NEXT: v_cvt_u32_f32_e32 v0, v0			; GFX11-NEXT: v_cvt_u32_f32_e32 v0, v0
	; GFX11-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)			; GFX11-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
	; GFX11-NEXT: v_mul_lo_u32 v1, -7, v0			; GFX11-NEXT: v_mul_lo_u32 v1, v0, -7
	; GFX11-NEXT: v_mul_hi_u32 v1, v0, v1			; GFX11-NEXT: v_mul_hi_u32 v1, v0, v1
	; GFX11-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)			; GFX11-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
	; GFX11-NEXT: v_add_nc_u32_e32 v0, v0, v1			; GFX11-NEXT: v_add_nc_u32_e32 v0, v0, v1
	; GFX11-NEXT: v_mul_hi_u32 v0, s2, v0			; GFX11-NEXT: v_mul_hi_u32 v0, s2, v0
	; GFX11-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)			; GFX11-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
	; GFX11-NEXT: v_mul_lo_u32 v0, v0, 7			; GFX11-NEXT: v_mul_lo_u32 v0, v0, 7
	; GFX11-NEXT: v_sub_nc_u32_e32 v0, s2, v0			; GFX11-NEXT: v_sub_nc_u32_e32 v0, s2, v0
	; GFX11-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(SKIP_1) \| instid1(VALU_DEP_2)			; GFX11-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(SKIP_1) \| instid1(VALU_DEP_2)
	Show All 25 Lines
	; GFX6-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)			; GFX6-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
	; GFX6-NEXT: v_cvt_f32_ubyte0_e32 v3, 7			; GFX6-NEXT: v_cvt_f32_ubyte0_e32 v3, 7
	; GFX6-NEXT: v_rcp_iflag_f32_e32 v3, v3			; GFX6-NEXT: v_rcp_iflag_f32_e32 v3, v3
	; GFX6-NEXT: v_and_b32_e32 v2, 0x7f, v2			; GFX6-NEXT: v_and_b32_e32 v2, 0x7f, v2
	; GFX6-NEXT: v_lshlrev_b32_e32 v0, 1, v0			; GFX6-NEXT: v_lshlrev_b32_e32 v0, 1, v0
	; GFX6-NEXT: v_and_b32_e32 v1, 0x7f, v1			; GFX6-NEXT: v_and_b32_e32 v1, 0x7f, v1
	; GFX6-NEXT: v_mul_f32_e32 v3, 0x4f7ffffe, v3			; GFX6-NEXT: v_mul_f32_e32 v3, 0x4f7ffffe, v3
	; GFX6-NEXT: v_cvt_u32_f32_e32 v3, v3			; GFX6-NEXT: v_cvt_u32_f32_e32 v3, v3
	; GFX6-NEXT: v_mul_lo_u32 v4, -7, v3			; GFX6-NEXT: v_mul_lo_u32 v4, v3, -7
	; GFX6-NEXT: v_mul_hi_u32 v4, v3, v4			; GFX6-NEXT: v_mul_hi_u32 v4, v3, v4
	; GFX6-NEXT: v_add_i32_e32 v3, vcc, v3, v4			; GFX6-NEXT: v_add_i32_e32 v3, vcc, v3, v4
	; GFX6-NEXT: v_mul_hi_u32 v3, v2, v3			; GFX6-NEXT: v_mul_hi_u32 v3, v2, v3
	; GFX6-NEXT: v_mul_lo_u32 v3, v3, 7			; GFX6-NEXT: v_mul_lo_u32 v3, v3, 7
	; GFX6-NEXT: v_sub_i32_e32 v2, vcc, v2, v3			; GFX6-NEXT: v_sub_i32_e32 v2, vcc, v2, v3
	; GFX6-NEXT: v_subrev_i32_e32 v3, vcc, 7, v2			; GFX6-NEXT: v_subrev_i32_e32 v3, vcc, 7, v2
	; GFX6-NEXT: v_cmp_le_u32_e32 vcc, 7, v2			; GFX6-NEXT: v_cmp_le_u32_e32 vcc, 7, v2
	; GFX6-NEXT: v_cndmask_b32_e32 v2, v2, v3, vcc			; GFX6-NEXT: v_cndmask_b32_e32 v2, v2, v3, vcc
	Show All 13 Lines
	; GFX8-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)			; GFX8-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
	; GFX8-NEXT: v_cvt_f32_ubyte0_e32 v3, 7			; GFX8-NEXT: v_cvt_f32_ubyte0_e32 v3, 7
	; GFX8-NEXT: v_rcp_iflag_f32_e32 v3, v3			; GFX8-NEXT: v_rcp_iflag_f32_e32 v3, v3
	; GFX8-NEXT: v_and_b32_e32 v2, 0x7f, v2			; GFX8-NEXT: v_and_b32_e32 v2, 0x7f, v2
	; GFX8-NEXT: v_lshlrev_b16_e32 v0, 1, v0			; GFX8-NEXT: v_lshlrev_b16_e32 v0, 1, v0
	; GFX8-NEXT: v_and_b32_e32 v1, 0x7f, v1			; GFX8-NEXT: v_and_b32_e32 v1, 0x7f, v1
	; GFX8-NEXT: v_mul_f32_e32 v3, 0x4f7ffffe, v3			; GFX8-NEXT: v_mul_f32_e32 v3, 0x4f7ffffe, v3
	; GFX8-NEXT: v_cvt_u32_f32_e32 v3, v3			; GFX8-NEXT: v_cvt_u32_f32_e32 v3, v3
	; GFX8-NEXT: v_mul_lo_u32 v4, -7, v3			; GFX8-NEXT: v_mul_lo_u32 v4, v3, -7
	; GFX8-NEXT: v_mul_hi_u32 v4, v3, v4			; GFX8-NEXT: v_mul_hi_u32 v4, v3, v4
	; GFX8-NEXT: v_add_u32_e32 v3, vcc, v3, v4			; GFX8-NEXT: v_add_u32_e32 v3, vcc, v3, v4
	; GFX8-NEXT: v_mul_hi_u32 v3, v2, v3			; GFX8-NEXT: v_mul_hi_u32 v3, v2, v3
	; GFX8-NEXT: v_mul_lo_u32 v3, v3, 7			; GFX8-NEXT: v_mul_lo_u32 v3, v3, 7
	; GFX8-NEXT: v_sub_u32_e32 v2, vcc, v2, v3			; GFX8-NEXT: v_sub_u32_e32 v2, vcc, v2, v3
	; GFX8-NEXT: v_subrev_u32_e32 v3, vcc, 7, v2			; GFX8-NEXT: v_subrev_u32_e32 v3, vcc, 7, v2
	; GFX8-NEXT: v_cmp_le_u32_e32 vcc, 7, v2			; GFX8-NEXT: v_cmp_le_u32_e32 vcc, 7, v2
	; GFX8-NEXT: v_cndmask_b32_e32 v2, v2, v3, vcc			; GFX8-NEXT: v_cndmask_b32_e32 v2, v2, v3, vcc
	Show All 13 Lines
	; GFX9-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)			; GFX9-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
	; GFX9-NEXT: v_cvt_f32_ubyte0_e32 v3, 7			; GFX9-NEXT: v_cvt_f32_ubyte0_e32 v3, 7
	; GFX9-NEXT: v_rcp_iflag_f32_e32 v3, v3			; GFX9-NEXT: v_rcp_iflag_f32_e32 v3, v3
	; GFX9-NEXT: v_and_b32_e32 v2, 0x7f, v2			; GFX9-NEXT: v_and_b32_e32 v2, 0x7f, v2
	; GFX9-NEXT: v_lshlrev_b16_e32 v0, 1, v0			; GFX9-NEXT: v_lshlrev_b16_e32 v0, 1, v0
	; GFX9-NEXT: v_and_b32_e32 v1, 0x7f, v1			; GFX9-NEXT: v_and_b32_e32 v1, 0x7f, v1
	; GFX9-NEXT: v_mul_f32_e32 v3, 0x4f7ffffe, v3			; GFX9-NEXT: v_mul_f32_e32 v3, 0x4f7ffffe, v3
	; GFX9-NEXT: v_cvt_u32_f32_e32 v3, v3			; GFX9-NEXT: v_cvt_u32_f32_e32 v3, v3
	; GFX9-NEXT: v_mul_lo_u32 v4, -7, v3			; GFX9-NEXT: v_mul_lo_u32 v4, v3, -7
	; GFX9-NEXT: v_mul_hi_u32 v4, v3, v4			; GFX9-NEXT: v_mul_hi_u32 v4, v3, v4
	; GFX9-NEXT: v_add_u32_e32 v3, v3, v4			; GFX9-NEXT: v_add_u32_e32 v3, v3, v4
	; GFX9-NEXT: v_mul_hi_u32 v3, v2, v3			; GFX9-NEXT: v_mul_hi_u32 v3, v2, v3
	; GFX9-NEXT: v_mul_lo_u32 v3, v3, 7			; GFX9-NEXT: v_mul_lo_u32 v3, v3, 7
	; GFX9-NEXT: v_sub_u32_e32 v2, v2, v3			; GFX9-NEXT: v_sub_u32_e32 v2, v2, v3
	; GFX9-NEXT: v_subrev_u32_e32 v3, 7, v2			; GFX9-NEXT: v_subrev_u32_e32 v3, 7, v2
	; GFX9-NEXT: v_cmp_le_u32_e32 vcc, 7, v2			; GFX9-NEXT: v_cmp_le_u32_e32 vcc, 7, v2
	; GFX9-NEXT: v_cndmask_b32_e32 v2, v2, v3, vcc			; GFX9-NEXT: v_cndmask_b32_e32 v2, v2, v3, vcc
	Show All 14 Lines
	; GFX10-NEXT: s_waitcnt_vscnt null, 0x0			; GFX10-NEXT: s_waitcnt_vscnt null, 0x0
	; GFX10-NEXT: v_cvt_f32_ubyte0_e32 v3, 7			; GFX10-NEXT: v_cvt_f32_ubyte0_e32 v3, 7
	; GFX10-NEXT: v_and_b32_e32 v2, 0x7f, v2			; GFX10-NEXT: v_and_b32_e32 v2, 0x7f, v2
	; GFX10-NEXT: v_lshlrev_b16 v0, 1, v0			; GFX10-NEXT: v_lshlrev_b16 v0, 1, v0
	; GFX10-NEXT: v_and_b32_e32 v1, 0x7f, v1			; GFX10-NEXT: v_and_b32_e32 v1, 0x7f, v1
	; GFX10-NEXT: v_rcp_iflag_f32_e32 v3, v3			; GFX10-NEXT: v_rcp_iflag_f32_e32 v3, v3
	; GFX10-NEXT: v_mul_f32_e32 v3, 0x4f7ffffe, v3			; GFX10-NEXT: v_mul_f32_e32 v3, 0x4f7ffffe, v3
	; GFX10-NEXT: v_cvt_u32_f32_e32 v3, v3			; GFX10-NEXT: v_cvt_u32_f32_e32 v3, v3
	; GFX10-NEXT: v_mul_lo_u32 v4, -7, v3			; GFX10-NEXT: v_mul_lo_u32 v4, v3, -7
	; GFX10-NEXT: v_mul_hi_u32 v4, v3, v4			; GFX10-NEXT: v_mul_hi_u32 v4, v3, v4
	; GFX10-NEXT: v_add_nc_u32_e32 v3, v3, v4			; GFX10-NEXT: v_add_nc_u32_e32 v3, v3, v4
	; GFX10-NEXT: v_mul_hi_u32 v3, v2, v3			; GFX10-NEXT: v_mul_hi_u32 v3, v2, v3
	; GFX10-NEXT: v_mul_lo_u32 v3, v3, 7			; GFX10-NEXT: v_mul_lo_u32 v3, v3, 7
	; GFX10-NEXT: v_sub_nc_u32_e32 v2, v2, v3			; GFX10-NEXT: v_sub_nc_u32_e32 v2, v2, v3
	; GFX10-NEXT: v_subrev_nc_u32_e32 v3, 7, v2			; GFX10-NEXT: v_subrev_nc_u32_e32 v3, 7, v2
	; GFX10-NEXT: v_cmp_le_u32_e32 vcc_lo, 7, v2			; GFX10-NEXT: v_cmp_le_u32_e32 vcc_lo, 7, v2
	; GFX10-NEXT: v_cndmask_b32_e32 v2, v2, v3, vcc_lo			; GFX10-NEXT: v_cndmask_b32_e32 v2, v2, v3, vcc_lo
	Show All 17 Lines
	; GFX11-NEXT: v_lshlrev_b16 v0, 1, v0			; GFX11-NEXT: v_lshlrev_b16 v0, 1, v0
	; GFX11-NEXT: v_and_b32_e32 v1, 0x7f, v1			; GFX11-NEXT: v_and_b32_e32 v1, 0x7f, v1
	; GFX11-NEXT: s_delay_alu instid0(VALU_DEP_4) \| instskip(SKIP_2) \| instid1(VALU_DEP_1)			; GFX11-NEXT: s_delay_alu instid0(VALU_DEP_4) \| instskip(SKIP_2) \| instid1(VALU_DEP_1)
	; GFX11-NEXT: v_rcp_iflag_f32_e32 v3, v3			; GFX11-NEXT: v_rcp_iflag_f32_e32 v3, v3
	; GFX11-NEXT: s_waitcnt_depctr 0xfff			; GFX11-NEXT: s_waitcnt_depctr 0xfff
	; GFX11-NEXT: v_mul_f32_e32 v3, 0x4f7ffffe, v3			; GFX11-NEXT: v_mul_f32_e32 v3, 0x4f7ffffe, v3
	; GFX11-NEXT: v_cvt_u32_f32_e32 v3, v3			; GFX11-NEXT: v_cvt_u32_f32_e32 v3, v3
	; GFX11-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)			; GFX11-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
	; GFX11-NEXT: v_mul_lo_u32 v4, -7, v3			; GFX11-NEXT: v_mul_lo_u32 v4, v3, -7
	; GFX11-NEXT: v_mul_hi_u32 v4, v3, v4			; GFX11-NEXT: v_mul_hi_u32 v4, v3, v4
	; GFX11-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)			; GFX11-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
	; GFX11-NEXT: v_add_nc_u32_e32 v3, v3, v4			; GFX11-NEXT: v_add_nc_u32_e32 v3, v3, v4
	; GFX11-NEXT: v_mul_hi_u32 v3, v2, v3			; GFX11-NEXT: v_mul_hi_u32 v3, v2, v3
	; GFX11-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)			; GFX11-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
	; GFX11-NEXT: v_mul_lo_u32 v3, v3, 7			; GFX11-NEXT: v_mul_lo_u32 v3, v3, 7
	; GFX11-NEXT: v_sub_nc_u32_e32 v2, v2, v3			; GFX11-NEXT: v_sub_nc_u32_e32 v2, v2, v3
	; GFX11-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(SKIP_1) \| instid1(VALU_DEP_2)			; GFX11-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(SKIP_1) \| instid1(VALU_DEP_2)
	▲ Show 20 Lines • Show All 1,191 Lines • ▼ Show 20 Lines
	; GFX6-NEXT: v_cvt_f32_ubyte0_e32 v0, 24			; GFX6-NEXT: v_cvt_f32_ubyte0_e32 v0, 24
	; GFX6-NEXT: v_rcp_iflag_f32_e32 v0, v0			; GFX6-NEXT: v_rcp_iflag_f32_e32 v0, v0
	; GFX6-NEXT: v_mov_b32_e32 v1, 0xffffffe8			; GFX6-NEXT: v_mov_b32_e32 v1, 0xffffffe8
	; GFX6-NEXT: s_and_b32 s2, s2, 0xffffff			; GFX6-NEXT: s_and_b32 s2, s2, 0xffffff
	; GFX6-NEXT: s_lshl_b32 s0, s0, 1			; GFX6-NEXT: s_lshl_b32 s0, s0, 1
	; GFX6-NEXT: v_mul_f32_e32 v0, 0x4f7ffffe, v0			; GFX6-NEXT: v_mul_f32_e32 v0, 0x4f7ffffe, v0
	; GFX6-NEXT: v_cvt_u32_f32_e32 v0, v0			; GFX6-NEXT: v_cvt_u32_f32_e32 v0, v0
	; GFX6-NEXT: s_and_b32 s1, s1, 0xffffff			; GFX6-NEXT: s_and_b32 s1, s1, 0xffffff
	; GFX6-NEXT: v_mul_lo_u32 v1, v1, v0			; GFX6-NEXT: v_mul_lo_u32 v1, v0, v1
	; GFX6-NEXT: v_mul_hi_u32 v1, v0, v1			; GFX6-NEXT: v_mul_hi_u32 v1, v0, v1
	; GFX6-NEXT: v_add_i32_e32 v0, vcc, v0, v1			; GFX6-NEXT: v_add_i32_e32 v0, vcc, v0, v1
	; GFX6-NEXT: v_mul_hi_u32 v0, s2, v0			; GFX6-NEXT: v_mul_hi_u32 v0, s2, v0
	; GFX6-NEXT: v_mul_lo_u32 v0, v0, 24			; GFX6-NEXT: v_mul_lo_u32 v0, v0, 24
	; GFX6-NEXT: v_sub_i32_e32 v0, vcc, s2, v0			; GFX6-NEXT: v_sub_i32_e32 v0, vcc, s2, v0
	; GFX6-NEXT: v_subrev_i32_e32 v1, vcc, 24, v0			; GFX6-NEXT: v_subrev_i32_e32 v1, vcc, 24, v0
	; GFX6-NEXT: v_cmp_le_u32_e32 vcc, 24, v0			; GFX6-NEXT: v_cmp_le_u32_e32 vcc, 24, v0
	; GFX6-NEXT: v_cndmask_b32_e32 v0, v0, v1, vcc			; GFX6-NEXT: v_cndmask_b32_e32 v0, v0, v1, vcc
	Show All 14 Lines
	; GFX8-NEXT: v_cvt_f32_ubyte0_e32 v0, 24			; GFX8-NEXT: v_cvt_f32_ubyte0_e32 v0, 24
	; GFX8-NEXT: v_rcp_iflag_f32_e32 v0, v0			; GFX8-NEXT: v_rcp_iflag_f32_e32 v0, v0
	; GFX8-NEXT: v_mov_b32_e32 v1, 0xffffffe8			; GFX8-NEXT: v_mov_b32_e32 v1, 0xffffffe8
	; GFX8-NEXT: s_and_b32 s2, s2, 0xffffff			; GFX8-NEXT: s_and_b32 s2, s2, 0xffffff
	; GFX8-NEXT: s_lshl_b32 s0, s0, 1			; GFX8-NEXT: s_lshl_b32 s0, s0, 1
	; GFX8-NEXT: v_mul_f32_e32 v0, 0x4f7ffffe, v0			; GFX8-NEXT: v_mul_f32_e32 v0, 0x4f7ffffe, v0
	; GFX8-NEXT: v_cvt_u32_f32_e32 v0, v0			; GFX8-NEXT: v_cvt_u32_f32_e32 v0, v0
	; GFX8-NEXT: s_and_b32 s1, s1, 0xffffff			; GFX8-NEXT: s_and_b32 s1, s1, 0xffffff
	; GFX8-NEXT: v_mul_lo_u32 v1, v1, v0			; GFX8-NEXT: v_mul_lo_u32 v1, v0, v1
	; GFX8-NEXT: v_mul_hi_u32 v1, v0, v1			; GFX8-NEXT: v_mul_hi_u32 v1, v0, v1
	; GFX8-NEXT: v_add_u32_e32 v0, vcc, v0, v1			; GFX8-NEXT: v_add_u32_e32 v0, vcc, v0, v1
	; GFX8-NEXT: v_mul_hi_u32 v0, s2, v0			; GFX8-NEXT: v_mul_hi_u32 v0, s2, v0
	; GFX8-NEXT: v_mul_lo_u32 v0, v0, 24			; GFX8-NEXT: v_mul_lo_u32 v0, v0, 24
	; GFX8-NEXT: v_sub_u32_e32 v0, vcc, s2, v0			; GFX8-NEXT: v_sub_u32_e32 v0, vcc, s2, v0
	; GFX8-NEXT: v_subrev_u32_e32 v1, vcc, 24, v0			; GFX8-NEXT: v_subrev_u32_e32 v1, vcc, 24, v0
	; GFX8-NEXT: v_cmp_le_u32_e32 vcc, 24, v0			; GFX8-NEXT: v_cmp_le_u32_e32 vcc, 24, v0
	; GFX8-NEXT: v_cndmask_b32_e32 v0, v0, v1, vcc			; GFX8-NEXT: v_cndmask_b32_e32 v0, v0, v1, vcc
	Show All 14 Lines
	; GFX9-NEXT: v_cvt_f32_ubyte0_e32 v0, 24			; GFX9-NEXT: v_cvt_f32_ubyte0_e32 v0, 24
	; GFX9-NEXT: v_rcp_iflag_f32_e32 v0, v0			; GFX9-NEXT: v_rcp_iflag_f32_e32 v0, v0
	; GFX9-NEXT: v_mov_b32_e32 v1, 0xffffffe8			; GFX9-NEXT: v_mov_b32_e32 v1, 0xffffffe8
	; GFX9-NEXT: s_and_b32 s2, s2, 0xffffff			; GFX9-NEXT: s_and_b32 s2, s2, 0xffffff
	; GFX9-NEXT: s_and_b32 s1, s1, 0xffffff			; GFX9-NEXT: s_and_b32 s1, s1, 0xffffff
	; GFX9-NEXT: v_mul_f32_e32 v0, 0x4f7ffffe, v0			; GFX9-NEXT: v_mul_f32_e32 v0, 0x4f7ffffe, v0
	; GFX9-NEXT: v_cvt_u32_f32_e32 v0, v0			; GFX9-NEXT: v_cvt_u32_f32_e32 v0, v0
	; GFX9-NEXT: s_lshl_b32 s0, s0, 1			; GFX9-NEXT: s_lshl_b32 s0, s0, 1
	; GFX9-NEXT: v_mul_lo_u32 v1, v1, v0			; GFX9-NEXT: v_mul_lo_u32 v1, v0, v1
	; GFX9-NEXT: v_mul_hi_u32 v1, v0, v1			; GFX9-NEXT: v_mul_hi_u32 v1, v0, v1
	; GFX9-NEXT: v_add_u32_e32 v0, v0, v1			; GFX9-NEXT: v_add_u32_e32 v0, v0, v1
	; GFX9-NEXT: v_mul_hi_u32 v0, s2, v0			; GFX9-NEXT: v_mul_hi_u32 v0, s2, v0
	; GFX9-NEXT: v_mul_lo_u32 v0, v0, 24			; GFX9-NEXT: v_mul_lo_u32 v0, v0, 24
	; GFX9-NEXT: v_sub_u32_e32 v0, s2, v0			; GFX9-NEXT: v_sub_u32_e32 v0, s2, v0
	; GFX9-NEXT: v_subrev_u32_e32 v1, 24, v0			; GFX9-NEXT: v_subrev_u32_e32 v1, 24, v0
	; GFX9-NEXT: v_cmp_le_u32_e32 vcc, 24, v0			; GFX9-NEXT: v_cmp_le_u32_e32 vcc, 24, v0
	; GFX9-NEXT: v_cndmask_b32_e32 v0, v0, v1, vcc			; GFX9-NEXT: v_cndmask_b32_e32 v0, v0, v1, vcc
	▲ Show 20 Lines • Show All 86 Lines • ▼ Show 20 Lines
	; GFX6-NEXT: v_cvt_f32_ubyte0_e32 v3, 24			; GFX6-NEXT: v_cvt_f32_ubyte0_e32 v3, 24
	; GFX6-NEXT: v_rcp_iflag_f32_e32 v3, v3			; GFX6-NEXT: v_rcp_iflag_f32_e32 v3, v3
	; GFX6-NEXT: v_mov_b32_e32 v4, 0xffffffe8			; GFX6-NEXT: v_mov_b32_e32 v4, 0xffffffe8
	; GFX6-NEXT: v_and_b32_e32 v2, 0xffffff, v2			; GFX6-NEXT: v_and_b32_e32 v2, 0xffffff, v2
	; GFX6-NEXT: v_lshlrev_b32_e32 v0, 1, v0			; GFX6-NEXT: v_lshlrev_b32_e32 v0, 1, v0
	; GFX6-NEXT: v_mul_f32_e32 v3, 0x4f7ffffe, v3			; GFX6-NEXT: v_mul_f32_e32 v3, 0x4f7ffffe, v3
	; GFX6-NEXT: v_cvt_u32_f32_e32 v3, v3			; GFX6-NEXT: v_cvt_u32_f32_e32 v3, v3
	; GFX6-NEXT: v_and_b32_e32 v1, 0xffffff, v1			; GFX6-NEXT: v_and_b32_e32 v1, 0xffffff, v1
	; GFX6-NEXT: v_mul_lo_u32 v4, v4, v3			; GFX6-NEXT: v_mul_lo_u32 v4, v3, v4
	; GFX6-NEXT: v_mul_hi_u32 v4, v3, v4			; GFX6-NEXT: v_mul_hi_u32 v4, v3, v4
	; GFX6-NEXT: v_add_i32_e32 v3, vcc, v3, v4			; GFX6-NEXT: v_add_i32_e32 v3, vcc, v3, v4
	; GFX6-NEXT: v_mul_hi_u32 v3, v2, v3			; GFX6-NEXT: v_mul_hi_u32 v3, v2, v3
	; GFX6-NEXT: v_mul_lo_u32 v3, v3, 24			; GFX6-NEXT: v_mul_lo_u32 v3, v3, 24
	; GFX6-NEXT: v_sub_i32_e32 v2, vcc, v2, v3			; GFX6-NEXT: v_sub_i32_e32 v2, vcc, v2, v3
	; GFX6-NEXT: v_subrev_i32_e32 v3, vcc, 24, v2			; GFX6-NEXT: v_subrev_i32_e32 v3, vcc, 24, v2
	; GFX6-NEXT: v_cmp_le_u32_e32 vcc, 24, v2			; GFX6-NEXT: v_cmp_le_u32_e32 vcc, 24, v2
	; GFX6-NEXT: v_cndmask_b32_e32 v2, v2, v3, vcc			; GFX6-NEXT: v_cndmask_b32_e32 v2, v2, v3, vcc
	Show All 14 Lines
	; GFX8-NEXT: v_cvt_f32_ubyte0_e32 v3, 24			; GFX8-NEXT: v_cvt_f32_ubyte0_e32 v3, 24
	; GFX8-NEXT: v_rcp_iflag_f32_e32 v3, v3			; GFX8-NEXT: v_rcp_iflag_f32_e32 v3, v3
	; GFX8-NEXT: v_mov_b32_e32 v4, 0xffffffe8			; GFX8-NEXT: v_mov_b32_e32 v4, 0xffffffe8
	; GFX8-NEXT: v_and_b32_e32 v2, 0xffffff, v2			; GFX8-NEXT: v_and_b32_e32 v2, 0xffffff, v2
	; GFX8-NEXT: v_lshlrev_b32_e32 v0, 1, v0			; GFX8-NEXT: v_lshlrev_b32_e32 v0, 1, v0
	; GFX8-NEXT: v_mul_f32_e32 v3, 0x4f7ffffe, v3			; GFX8-NEXT: v_mul_f32_e32 v3, 0x4f7ffffe, v3
	; GFX8-NEXT: v_cvt_u32_f32_e32 v3, v3			; GFX8-NEXT: v_cvt_u32_f32_e32 v3, v3
	; GFX8-NEXT: v_and_b32_e32 v1, 0xffffff, v1			; GFX8-NEXT: v_and_b32_e32 v1, 0xffffff, v1
	; GFX8-NEXT: v_mul_lo_u32 v4, v4, v3			; GFX8-NEXT: v_mul_lo_u32 v4, v3, v4
	; GFX8-NEXT: v_mul_hi_u32 v4, v3, v4			; GFX8-NEXT: v_mul_hi_u32 v4, v3, v4
	; GFX8-NEXT: v_add_u32_e32 v3, vcc, v3, v4			; GFX8-NEXT: v_add_u32_e32 v3, vcc, v3, v4
	; GFX8-NEXT: v_mul_hi_u32 v3, v2, v3			; GFX8-NEXT: v_mul_hi_u32 v3, v2, v3
	; GFX8-NEXT: v_mul_lo_u32 v3, v3, 24			; GFX8-NEXT: v_mul_lo_u32 v3, v3, 24
	; GFX8-NEXT: v_sub_u32_e32 v2, vcc, v2, v3			; GFX8-NEXT: v_sub_u32_e32 v2, vcc, v2, v3
	; GFX8-NEXT: v_subrev_u32_e32 v3, vcc, 24, v2			; GFX8-NEXT: v_subrev_u32_e32 v3, vcc, 24, v2
	; GFX8-NEXT: v_cmp_le_u32_e32 vcc, 24, v2			; GFX8-NEXT: v_cmp_le_u32_e32 vcc, 24, v2
	; GFX8-NEXT: v_cndmask_b32_e32 v2, v2, v3, vcc			; GFX8-NEXT: v_cndmask_b32_e32 v2, v2, v3, vcc
	Show All 14 Lines
	; GFX9-NEXT: v_cvt_f32_ubyte0_e32 v3, 24			; GFX9-NEXT: v_cvt_f32_ubyte0_e32 v3, 24
	; GFX9-NEXT: v_rcp_iflag_f32_e32 v3, v3			; GFX9-NEXT: v_rcp_iflag_f32_e32 v3, v3
	; GFX9-NEXT: v_mov_b32_e32 v4, 0xffffffe8			; GFX9-NEXT: v_mov_b32_e32 v4, 0xffffffe8
	; GFX9-NEXT: v_and_b32_e32 v2, 0xffffff, v2			; GFX9-NEXT: v_and_b32_e32 v2, 0xffffff, v2
	; GFX9-NEXT: v_and_b32_e32 v1, 0xffffff, v1			; GFX9-NEXT: v_and_b32_e32 v1, 0xffffff, v1
	; GFX9-NEXT: v_mul_f32_e32 v3, 0x4f7ffffe, v3			; GFX9-NEXT: v_mul_f32_e32 v3, 0x4f7ffffe, v3
	; GFX9-NEXT: v_cvt_u32_f32_e32 v3, v3			; GFX9-NEXT: v_cvt_u32_f32_e32 v3, v3
	; GFX9-NEXT: v_lshlrev_b32_e32 v0, 1, v0			; GFX9-NEXT: v_lshlrev_b32_e32 v0, 1, v0
	; GFX9-NEXT: v_mul_lo_u32 v4, v4, v3			; GFX9-NEXT: v_mul_lo_u32 v4, v3, v4
	; GFX9-NEXT: v_mul_hi_u32 v4, v3, v4			; GFX9-NEXT: v_mul_hi_u32 v4, v3, v4
	; GFX9-NEXT: v_add_u32_e32 v3, v3, v4			; GFX9-NEXT: v_add_u32_e32 v3, v3, v4
	; GFX9-NEXT: v_mul_hi_u32 v3, v2, v3			; GFX9-NEXT: v_mul_hi_u32 v3, v2, v3
	; GFX9-NEXT: v_mul_lo_u32 v3, v3, 24			; GFX9-NEXT: v_mul_lo_u32 v3, v3, 24
	; GFX9-NEXT: v_sub_u32_e32 v2, v2, v3			; GFX9-NEXT: v_sub_u32_e32 v2, v2, v3
	; GFX9-NEXT: v_subrev_u32_e32 v3, 24, v2			; GFX9-NEXT: v_subrev_u32_e32 v3, 24, v2
	; GFX9-NEXT: v_cmp_le_u32_e32 vcc, 24, v2			; GFX9-NEXT: v_cmp_le_u32_e32 vcc, 24, v2
	; GFX9-NEXT: v_cndmask_b32_e32 v2, v2, v3, vcc			; GFX9-NEXT: v_cndmask_b32_e32 v2, v2, v3, vcc
	▲ Show 20 Lines • Show All 97 Lines • ▼ Show 20 Lines
	; GFX6-NEXT: v_mov_b32_e32 v1, 0xffffffe8			; GFX6-NEXT: v_mov_b32_e32 v1, 0xffffffe8
	; GFX6-NEXT: s_or_b32 s0, s9, s0			; GFX6-NEXT: s_or_b32 s0, s9, s0
	; GFX6-NEXT: s_or_b32 s1, s7, s1			; GFX6-NEXT: s_or_b32 s1, s7, s1
	; GFX6-NEXT: s_and_b32 s7, s8, 0xff			; GFX6-NEXT: s_and_b32 s7, s8, 0xff
	; GFX6-NEXT: s_lshr_b32 s8, s2, 16			; GFX6-NEXT: s_lshr_b32 s8, s2, 16
	; GFX6-NEXT: s_lshr_b32 s9, s2, 24			; GFX6-NEXT: s_lshr_b32 s9, s2, 24
	; GFX6-NEXT: s_and_b32 s11, s2, 0xff			; GFX6-NEXT: s_and_b32 s11, s2, 0xff
	; GFX6-NEXT: s_bfe_u32 s2, s2, 0x80008			; GFX6-NEXT: s_bfe_u32 s2, s2, 0x80008
	; GFX6-NEXT: v_mul_lo_u32 v2, v1, v0			; GFX6-NEXT: v_mul_lo_u32 v2, v0, v1
	; GFX6-NEXT: s_lshl_b32 s2, s2, 8			; GFX6-NEXT: s_lshl_b32 s2, s2, 8
	; GFX6-NEXT: s_and_b32 s8, s8, 0xff			; GFX6-NEXT: s_and_b32 s8, s8, 0xff
	; GFX6-NEXT: s_or_b32 s2, s11, s2			; GFX6-NEXT: s_or_b32 s2, s11, s2
	; GFX6-NEXT: s_bfe_u32 s8, s8, 0x100000			; GFX6-NEXT: s_bfe_u32 s8, s8, 0x100000
	; GFX6-NEXT: s_lshr_b32 s10, s3, 8			; GFX6-NEXT: s_lshr_b32 s10, s3, 8
	; GFX6-NEXT: s_bfe_u32 s2, s2, 0x100000			; GFX6-NEXT: s_bfe_u32 s2, s2, 0x100000
	; GFX6-NEXT: s_lshl_b32 s8, s8, 16			; GFX6-NEXT: s_lshl_b32 s8, s8, 16
	; GFX6-NEXT: s_and_b32 s3, s3, 0xff			; GFX6-NEXT: s_and_b32 s3, s3, 0xff
	Show All 21 Lines
	; GFX6-NEXT: s_lshl_b32 s8, s8, 16			; GFX6-NEXT: s_lshl_b32 s8, s8, 16
	; GFX6-NEXT: s_or_b32 s4, s4, s8			; GFX6-NEXT: s_or_b32 s4, s4, s8
	; GFX6-NEXT: v_mul_hi_u32 v0, s4, v0			; GFX6-NEXT: v_mul_hi_u32 v0, s4, v0
	; GFX6-NEXT: v_mul_f32_e32 v2, 0x4f7ffffe, v2			; GFX6-NEXT: v_mul_f32_e32 v2, 0x4f7ffffe, v2
	; GFX6-NEXT: v_cvt_u32_f32_e32 v2, v2			; GFX6-NEXT: v_cvt_u32_f32_e32 v2, v2
	; GFX6-NEXT: s_lshr_b32 s10, s5, 8			; GFX6-NEXT: s_lshr_b32 s10, s5, 8
	; GFX6-NEXT: v_mul_lo_u32 v0, v0, 24			; GFX6-NEXT: v_mul_lo_u32 v0, v0, 24
	; GFX6-NEXT: s_and_b32 s5, s5, 0xff			; GFX6-NEXT: s_and_b32 s5, s5, 0xff
	; GFX6-NEXT: v_mul_lo_u32 v1, v1, v2			; GFX6-NEXT: v_mul_lo_u32 v1, v2, v1
	; GFX6-NEXT: s_lshl_b32 s5, s5, 8			; GFX6-NEXT: s_lshl_b32 s5, s5, 8
	; GFX6-NEXT: v_sub_i32_e32 v0, vcc, s4, v0			; GFX6-NEXT: v_sub_i32_e32 v0, vcc, s4, v0
	; GFX6-NEXT: v_subrev_i32_e32 v3, vcc, 24, v0			; GFX6-NEXT: v_subrev_i32_e32 v3, vcc, 24, v0
	; GFX6-NEXT: v_cmp_le_u32_e32 vcc, 24, v0			; GFX6-NEXT: v_cmp_le_u32_e32 vcc, 24, v0
	; GFX6-NEXT: v_mul_hi_u32 v1, v2, v1			; GFX6-NEXT: v_mul_hi_u32 v1, v2, v1
	; GFX6-NEXT: s_and_b32 s8, s10, 0xff			; GFX6-NEXT: s_and_b32 s8, s10, 0xff
	; GFX6-NEXT: v_cndmask_b32_e32 v0, v0, v3, vcc			; GFX6-NEXT: v_cndmask_b32_e32 v0, v0, v3, vcc
	; GFX6-NEXT: s_or_b32 s5, s9, s5			; GFX6-NEXT: s_or_b32 s5, s9, s5
	▲ Show 20 Lines • Show All 80 Lines • ▼ Show 20 Lines
	; GFX8-NEXT: s_lshr_b32 s9, s2, 16			; GFX8-NEXT: s_lshr_b32 s9, s2, 16
	; GFX8-NEXT: s_lshr_b32 s11, s2, 24			; GFX8-NEXT: s_lshr_b32 s11, s2, 24
	; GFX8-NEXT: s_and_b32 s2, s2, 0xff			; GFX8-NEXT: s_and_b32 s2, s2, 0xff
	; GFX8-NEXT: s_lshl_b32 s8, s8, s10			; GFX8-NEXT: s_lshl_b32 s8, s8, s10
	; GFX8-NEXT: s_or_b32 s2, s2, s8			; GFX8-NEXT: s_or_b32 s2, s2, s8
	; GFX8-NEXT: s_and_b32 s8, s9, 0xff			; GFX8-NEXT: s_and_b32 s8, s9, 0xff
	; GFX8-NEXT: v_mov_b32_e32 v1, 0xffffffe8			; GFX8-NEXT: v_mov_b32_e32 v1, 0xffffffe8
	; GFX8-NEXT: s_bfe_u32 s8, s8, 0x100000			; GFX8-NEXT: s_bfe_u32 s8, s8, 0x100000
	; GFX8-NEXT: v_mul_lo_u32 v2, v1, v0			; GFX8-NEXT: v_mul_lo_u32 v2, v0, v1
	; GFX8-NEXT: s_lshr_b32 s12, s3, 8			; GFX8-NEXT: s_lshr_b32 s12, s3, 8
	; GFX8-NEXT: s_bfe_u32 s2, s2, 0x100000			; GFX8-NEXT: s_bfe_u32 s2, s2, 0x100000
	; GFX8-NEXT: s_lshl_b32 s8, s8, 16			; GFX8-NEXT: s_lshl_b32 s8, s8, 16
	; GFX8-NEXT: s_and_b32 s3, s3, 0xff			; GFX8-NEXT: s_and_b32 s3, s3, 0xff
	; GFX8-NEXT: s_or_b32 s2, s2, s8			; GFX8-NEXT: s_or_b32 s2, s2, s8
	; GFX8-NEXT: s_lshl_b32 s3, s3, s10			; GFX8-NEXT: s_lshl_b32 s3, s3, s10
	; GFX8-NEXT: s_and_b32 s8, s12, 0xff			; GFX8-NEXT: s_and_b32 s8, s12, 0xff
	; GFX8-NEXT: s_or_b32 s3, s11, s3			; GFX8-NEXT: s_or_b32 s3, s11, s3
	Show All 18 Lines
	; GFX8-NEXT: s_lshl_b32 s8, s8, 16			; GFX8-NEXT: s_lshl_b32 s8, s8, 16
	; GFX8-NEXT: s_or_b32 s4, s4, s8			; GFX8-NEXT: s_or_b32 s4, s4, s8
	; GFX8-NEXT: v_mul_hi_u32 v0, s4, v0			; GFX8-NEXT: v_mul_hi_u32 v0, s4, v0
	; GFX8-NEXT: v_mul_f32_e32 v2, 0x4f7ffffe, v2			; GFX8-NEXT: v_mul_f32_e32 v2, 0x4f7ffffe, v2
	; GFX8-NEXT: v_cvt_u32_f32_e32 v2, v2			; GFX8-NEXT: v_cvt_u32_f32_e32 v2, v2
	; GFX8-NEXT: s_lshr_b32 s12, s5, 8			; GFX8-NEXT: s_lshr_b32 s12, s5, 8
	; GFX8-NEXT: v_mul_lo_u32 v0, v0, 24			; GFX8-NEXT: v_mul_lo_u32 v0, v0, 24
	; GFX8-NEXT: s_and_b32 s5, s5, 0xff			; GFX8-NEXT: s_and_b32 s5, s5, 0xff
	; GFX8-NEXT: v_mul_lo_u32 v1, v1, v2			; GFX8-NEXT: v_mul_lo_u32 v1, v2, v1
	; GFX8-NEXT: s_lshl_b32 s5, s5, s10			; GFX8-NEXT: s_lshl_b32 s5, s5, s10
	; GFX8-NEXT: v_sub_u32_e32 v0, vcc, s4, v0			; GFX8-NEXT: v_sub_u32_e32 v0, vcc, s4, v0
	; GFX8-NEXT: v_subrev_u32_e32 v3, vcc, 24, v0			; GFX8-NEXT: v_subrev_u32_e32 v3, vcc, 24, v0
	; GFX8-NEXT: v_cmp_le_u32_e32 vcc, 24, v0			; GFX8-NEXT: v_cmp_le_u32_e32 vcc, 24, v0
	; GFX8-NEXT: v_mul_hi_u32 v1, v2, v1			; GFX8-NEXT: v_mul_hi_u32 v1, v2, v1
	; GFX8-NEXT: s_and_b32 s8, s12, 0xff			; GFX8-NEXT: s_and_b32 s8, s12, 0xff
	; GFX8-NEXT: v_cndmask_b32_e32 v0, v0, v3, vcc			; GFX8-NEXT: v_cndmask_b32_e32 v0, v0, v3, vcc
	; GFX8-NEXT: s_or_b32 s5, s11, s5			; GFX8-NEXT: s_or_b32 s5, s11, s5
	▲ Show 20 Lines • Show All 58 Lines • ▼ Show 20 Lines
	; GFX9-NEXT: v_mov_b32_e32 v1, 0xffffffe8			; GFX9-NEXT: v_mov_b32_e32 v1, 0xffffffe8
	; GFX9-NEXT: s_lshr_b32 s11, s1, 8			; GFX9-NEXT: s_lshr_b32 s11, s1, 8
	; GFX9-NEXT: s_bfe_u32 s12, 8, 0x100000			; GFX9-NEXT: s_bfe_u32 s12, 8, 0x100000
	; GFX9-NEXT: v_mul_f32_e32 v0, 0x4f7ffffe, v0			; GFX9-NEXT: v_mul_f32_e32 v0, 0x4f7ffffe, v0
	; GFX9-NEXT: v_cvt_u32_f32_e32 v0, v0			; GFX9-NEXT: v_cvt_u32_f32_e32 v0, v0
	; GFX9-NEXT: s_and_b32 s1, s1, 0xff			; GFX9-NEXT: s_and_b32 s1, s1, 0xff
	; GFX9-NEXT: s_lshr_b32 s7, s0, 8			; GFX9-NEXT: s_lshr_b32 s7, s0, 8
	; GFX9-NEXT: s_lshr_b32 s10, s0, 24			; GFX9-NEXT: s_lshr_b32 s10, s0, 24
	; GFX9-NEXT: v_mul_lo_u32 v2, v1, v0			; GFX9-NEXT: v_mul_lo_u32 v2, v0, v1
	; GFX9-NEXT: s_lshl_b32 s1, s1, s12			; GFX9-NEXT: s_lshl_b32 s1, s1, s12
	; GFX9-NEXT: s_and_b32 s7, s7, 0xff			; GFX9-NEXT: s_and_b32 s7, s7, 0xff
	; GFX9-NEXT: s_or_b32 s1, s10, s1			; GFX9-NEXT: s_or_b32 s1, s10, s1
	; GFX9-NEXT: v_mul_hi_u32 v2, v0, v2			; GFX9-NEXT: v_mul_hi_u32 v2, v0, v2
	; GFX9-NEXT: s_lshr_b32 s10, s2, 8			; GFX9-NEXT: s_lshr_b32 s10, s2, 8
	; GFX9-NEXT: s_lshr_b32 s9, s0, 16			; GFX9-NEXT: s_lshr_b32 s9, s0, 16
	; GFX9-NEXT: s_and_b32 s0, s0, 0xff			; GFX9-NEXT: s_and_b32 s0, s0, 0xff
	; GFX9-NEXT: s_lshl_b32 s7, s7, s12			; GFX9-NEXT: s_lshl_b32 s7, s7, s12
	Show All 29 Lines
	; GFX9-NEXT: s_and_b32 s10, s10, 0xff			; GFX9-NEXT: s_and_b32 s10, s10, 0xff
	; GFX9-NEXT: s_lshr_b32 s11, s4, 16			; GFX9-NEXT: s_lshr_b32 s11, s4, 16
	; GFX9-NEXT: s_lshr_b32 s13, s4, 24			; GFX9-NEXT: s_lshr_b32 s13, s4, 24
	; GFX9-NEXT: s_and_b32 s4, s4, 0xff			; GFX9-NEXT: s_and_b32 s4, s4, 0xff
	; GFX9-NEXT: s_lshl_b32 s10, s10, s12			; GFX9-NEXT: s_lshl_b32 s10, s10, s12
	; GFX9-NEXT: s_or_b32 s4, s4, s10			; GFX9-NEXT: s_or_b32 s4, s4, s10
	; GFX9-NEXT: s_and_b32 s10, s11, 0xff			; GFX9-NEXT: s_and_b32 s10, s11, 0xff
	; GFX9-NEXT: s_bfe_u32 s10, s10, 0x100000			; GFX9-NEXT: s_bfe_u32 s10, s10, 0x100000
	; GFX9-NEXT: v_mul_lo_u32 v1, v1, v2			; GFX9-NEXT: v_mul_lo_u32 v1, v2, v1
	; GFX9-NEXT: s_bfe_u32 s4, s4, 0x100000			; GFX9-NEXT: s_bfe_u32 s4, s4, 0x100000
	; GFX9-NEXT: s_lshl_b32 s10, s10, 16			; GFX9-NEXT: s_lshl_b32 s10, s10, 16
	; GFX9-NEXT: s_or_b32 s4, s4, s10			; GFX9-NEXT: s_or_b32 s4, s4, s10
	; GFX9-NEXT: v_mul_hi_u32 v0, s4, v0			; GFX9-NEXT: v_mul_hi_u32 v0, s4, v0
	; GFX9-NEXT: s_lshr_b32 s14, s5, 8			; GFX9-NEXT: s_lshr_b32 s14, s5, 8
	; GFX9-NEXT: s_and_b32 s5, s5, 0xff			; GFX9-NEXT: s_and_b32 s5, s5, 0xff
	; GFX9-NEXT: v_mul_hi_u32 v1, v2, v1			; GFX9-NEXT: v_mul_hi_u32 v1, v2, v1
	; GFX9-NEXT: s_lshl_b32 s5, s5, s12			; GFX9-NEXT: s_lshl_b32 s5, s5, s12
	▲ Show 20 Lines • Show All 334 Lines • ▼ Show 20 Lines
	; GFX6-NEXT: v_mov_b32_e32 v7, 0xffffffe8			; GFX6-NEXT: v_mov_b32_e32 v7, 0xffffffe8
	; GFX6-NEXT: v_and_b32_e32 v4, 0xffffff, v4			; GFX6-NEXT: v_and_b32_e32 v4, 0xffffff, v4
	; GFX6-NEXT: v_cvt_f32_ubyte0_e32 v9, 24			; GFX6-NEXT: v_cvt_f32_ubyte0_e32 v9, 24
	; GFX6-NEXT: v_mul_f32_e32 v6, 0x4f7ffffe, v6			; GFX6-NEXT: v_mul_f32_e32 v6, 0x4f7ffffe, v6
	; GFX6-NEXT: v_cvt_u32_f32_e32 v6, v6			; GFX6-NEXT: v_cvt_u32_f32_e32 v6, v6
	; GFX6-NEXT: v_and_b32_e32 v5, 0xffffff, v5			; GFX6-NEXT: v_and_b32_e32 v5, 0xffffff, v5
	; GFX6-NEXT: v_lshlrev_b32_e32 v0, 1, v0			; GFX6-NEXT: v_lshlrev_b32_e32 v0, 1, v0
	; GFX6-NEXT: v_and_b32_e32 v2, 0xffffff, v2			; GFX6-NEXT: v_and_b32_e32 v2, 0xffffff, v2
	; GFX6-NEXT: v_mul_lo_u32 v8, v7, v6			; GFX6-NEXT: v_mul_lo_u32 v8, v6, v7
	; GFX6-NEXT: v_lshlrev_b32_e32 v1, 1, v1			; GFX6-NEXT: v_lshlrev_b32_e32 v1, 1, v1
	; GFX6-NEXT: v_and_b32_e32 v3, 0xffffff, v3			; GFX6-NEXT: v_and_b32_e32 v3, 0xffffff, v3
	; GFX6-NEXT: v_mul_hi_u32 v8, v6, v8			; GFX6-NEXT: v_mul_hi_u32 v8, v6, v8
	; GFX6-NEXT: v_add_i32_e32 v6, vcc, v6, v8			; GFX6-NEXT: v_add_i32_e32 v6, vcc, v6, v8
	; GFX6-NEXT: v_mul_hi_u32 v6, v4, v6			; GFX6-NEXT: v_mul_hi_u32 v6, v4, v6
	; GFX6-NEXT: v_rcp_iflag_f32_e32 v8, v9			; GFX6-NEXT: v_rcp_iflag_f32_e32 v8, v9
	; GFX6-NEXT: v_mul_lo_u32 v6, v6, 24			; GFX6-NEXT: v_mul_lo_u32 v6, v6, 24
	; GFX6-NEXT: v_mul_f32_e32 v8, 0x4f7ffffe, v8			; GFX6-NEXT: v_mul_f32_e32 v8, 0x4f7ffffe, v8
	; GFX6-NEXT: v_cvt_u32_f32_e32 v8, v8			; GFX6-NEXT: v_cvt_u32_f32_e32 v8, v8
	; GFX6-NEXT: v_sub_i32_e32 v4, vcc, v4, v6			; GFX6-NEXT: v_sub_i32_e32 v4, vcc, v4, v6
	; GFX6-NEXT: v_subrev_i32_e32 v6, vcc, 24, v4			; GFX6-NEXT: v_subrev_i32_e32 v6, vcc, 24, v4
	; GFX6-NEXT: v_cmp_le_u32_e32 vcc, 24, v4			; GFX6-NEXT: v_cmp_le_u32_e32 vcc, 24, v4
	; GFX6-NEXT: v_cndmask_b32_e32 v4, v4, v6, vcc			; GFX6-NEXT: v_cndmask_b32_e32 v4, v4, v6, vcc
	; GFX6-NEXT: v_subrev_i32_e32 v6, vcc, 24, v4			; GFX6-NEXT: v_subrev_i32_e32 v6, vcc, 24, v4
	; GFX6-NEXT: v_cmp_le_u32_e32 vcc, 24, v4			; GFX6-NEXT: v_cmp_le_u32_e32 vcc, 24, v4
	; GFX6-NEXT: v_cndmask_b32_e32 v4, v4, v6, vcc			; GFX6-NEXT: v_cndmask_b32_e32 v4, v4, v6, vcc
	; GFX6-NEXT: v_mul_lo_u32 v6, v7, v8			; GFX6-NEXT: v_mul_lo_u32 v6, v8, v7
	; GFX6-NEXT: v_sub_i32_e32 v7, vcc, 23, v4			; GFX6-NEXT: v_sub_i32_e32 v7, vcc, 23, v4
	; GFX6-NEXT: v_and_b32_e32 v7, 0xffffff, v7			; GFX6-NEXT: v_and_b32_e32 v7, 0xffffff, v7
	; GFX6-NEXT: v_mul_hi_u32 v6, v8, v6			; GFX6-NEXT: v_mul_hi_u32 v6, v8, v6
	; GFX6-NEXT: v_and_b32_e32 v4, 0xffffff, v4			; GFX6-NEXT: v_and_b32_e32 v4, 0xffffff, v4
	; GFX6-NEXT: v_lshlrev_b32_e32 v0, v7, v0			; GFX6-NEXT: v_lshlrev_b32_e32 v0, v7, v0
	; GFX6-NEXT: v_lshrrev_b32_e32 v2, v4, v2			; GFX6-NEXT: v_lshrrev_b32_e32 v2, v4, v2
	; GFX6-NEXT: v_add_i32_e32 v6, vcc, v8, v6			; GFX6-NEXT: v_add_i32_e32 v6, vcc, v8, v6
	; GFX6-NEXT: v_mul_hi_u32 v6, v5, v6			; GFX6-NEXT: v_mul_hi_u32 v6, v5, v6
	Show All 22 Lines
	; GFX8-NEXT: v_mov_b32_e32 v7, 0xffffffe8			; GFX8-NEXT: v_mov_b32_e32 v7, 0xffffffe8
	; GFX8-NEXT: v_and_b32_e32 v4, 0xffffff, v4			; GFX8-NEXT: v_and_b32_e32 v4, 0xffffff, v4
	; GFX8-NEXT: v_cvt_f32_ubyte0_e32 v9, 24			; GFX8-NEXT: v_cvt_f32_ubyte0_e32 v9, 24
	; GFX8-NEXT: v_mul_f32_e32 v6, 0x4f7ffffe, v6			; GFX8-NEXT: v_mul_f32_e32 v6, 0x4f7ffffe, v6
	; GFX8-NEXT: v_cvt_u32_f32_e32 v6, v6			; GFX8-NEXT: v_cvt_u32_f32_e32 v6, v6
	; GFX8-NEXT: v_and_b32_e32 v5, 0xffffff, v5			; GFX8-NEXT: v_and_b32_e32 v5, 0xffffff, v5
	; GFX8-NEXT: v_lshlrev_b32_e32 v0, 1, v0			; GFX8-NEXT: v_lshlrev_b32_e32 v0, 1, v0
	; GFX8-NEXT: v_and_b32_e32 v2, 0xffffff, v2			; GFX8-NEXT: v_and_b32_e32 v2, 0xffffff, v2
	; GFX8-NEXT: v_mul_lo_u32 v8, v7, v6			; GFX8-NEXT: v_mul_lo_u32 v8, v6, v7
	; GFX8-NEXT: v_lshlrev_b32_e32 v1, 1, v1			; GFX8-NEXT: v_lshlrev_b32_e32 v1, 1, v1
	; GFX8-NEXT: v_and_b32_e32 v3, 0xffffff, v3			; GFX8-NEXT: v_and_b32_e32 v3, 0xffffff, v3
	; GFX8-NEXT: v_mul_hi_u32 v8, v6, v8			; GFX8-NEXT: v_mul_hi_u32 v8, v6, v8
	; GFX8-NEXT: v_add_u32_e32 v6, vcc, v6, v8			; GFX8-NEXT: v_add_u32_e32 v6, vcc, v6, v8
	; GFX8-NEXT: v_mul_hi_u32 v6, v4, v6			; GFX8-NEXT: v_mul_hi_u32 v6, v4, v6
	; GFX8-NEXT: v_rcp_iflag_f32_e32 v8, v9			; GFX8-NEXT: v_rcp_iflag_f32_e32 v8, v9
	; GFX8-NEXT: v_mul_lo_u32 v6, v6, 24			; GFX8-NEXT: v_mul_lo_u32 v6, v6, 24
	; GFX8-NEXT: v_mul_f32_e32 v8, 0x4f7ffffe, v8			; GFX8-NEXT: v_mul_f32_e32 v8, 0x4f7ffffe, v8
	; GFX8-NEXT: v_cvt_u32_f32_e32 v8, v8			; GFX8-NEXT: v_cvt_u32_f32_e32 v8, v8
	; GFX8-NEXT: v_sub_u32_e32 v4, vcc, v4, v6			; GFX8-NEXT: v_sub_u32_e32 v4, vcc, v4, v6
	; GFX8-NEXT: v_subrev_u32_e32 v6, vcc, 24, v4			; GFX8-NEXT: v_subrev_u32_e32 v6, vcc, 24, v4
	; GFX8-NEXT: v_cmp_le_u32_e32 vcc, 24, v4			; GFX8-NEXT: v_cmp_le_u32_e32 vcc, 24, v4
	; GFX8-NEXT: v_cndmask_b32_e32 v4, v4, v6, vcc			; GFX8-NEXT: v_cndmask_b32_e32 v4, v4, v6, vcc
	; GFX8-NEXT: v_subrev_u32_e32 v6, vcc, 24, v4			; GFX8-NEXT: v_subrev_u32_e32 v6, vcc, 24, v4
	; GFX8-NEXT: v_cmp_le_u32_e32 vcc, 24, v4			; GFX8-NEXT: v_cmp_le_u32_e32 vcc, 24, v4
	; GFX8-NEXT: v_cndmask_b32_e32 v4, v4, v6, vcc			; GFX8-NEXT: v_cndmask_b32_e32 v4, v4, v6, vcc
	; GFX8-NEXT: v_mul_lo_u32 v6, v7, v8			; GFX8-NEXT: v_mul_lo_u32 v6, v8, v7
	; GFX8-NEXT: v_sub_u32_e32 v7, vcc, 23, v4			; GFX8-NEXT: v_sub_u32_e32 v7, vcc, 23, v4
	; GFX8-NEXT: v_and_b32_e32 v7, 0xffffff, v7			; GFX8-NEXT: v_and_b32_e32 v7, 0xffffff, v7
	; GFX8-NEXT: v_mul_hi_u32 v6, v8, v6			; GFX8-NEXT: v_mul_hi_u32 v6, v8, v6
	; GFX8-NEXT: v_and_b32_e32 v4, 0xffffff, v4			; GFX8-NEXT: v_and_b32_e32 v4, 0xffffff, v4
	; GFX8-NEXT: v_lshlrev_b32_e32 v0, v7, v0			; GFX8-NEXT: v_lshlrev_b32_e32 v0, v7, v0
	; GFX8-NEXT: v_lshrrev_b32_e32 v2, v4, v2			; GFX8-NEXT: v_lshrrev_b32_e32 v2, v4, v2
	; GFX8-NEXT: v_add_u32_e32 v6, vcc, v8, v6			; GFX8-NEXT: v_add_u32_e32 v6, vcc, v8, v6
	; GFX8-NEXT: v_mul_hi_u32 v6, v5, v6			; GFX8-NEXT: v_mul_hi_u32 v6, v5, v6
	Show All 22 Lines
	; GFX9-NEXT: v_cvt_f32_ubyte0_e32 v9, 24			; GFX9-NEXT: v_cvt_f32_ubyte0_e32 v9, 24
	; GFX9-NEXT: v_rcp_iflag_f32_e32 v9, v9			; GFX9-NEXT: v_rcp_iflag_f32_e32 v9, v9
	; GFX9-NEXT: v_mov_b32_e32 v7, 0xffffffe8			; GFX9-NEXT: v_mov_b32_e32 v7, 0xffffffe8
	; GFX9-NEXT: v_mul_f32_e32 v6, 0x4f7ffffe, v6			; GFX9-NEXT: v_mul_f32_e32 v6, 0x4f7ffffe, v6
	; GFX9-NEXT: v_cvt_u32_f32_e32 v6, v6			; GFX9-NEXT: v_cvt_u32_f32_e32 v6, v6
	; GFX9-NEXT: v_mul_f32_e32 v9, 0x4f7ffffe, v9			; GFX9-NEXT: v_mul_f32_e32 v9, 0x4f7ffffe, v9
	; GFX9-NEXT: v_cvt_u32_f32_e32 v9, v9			; GFX9-NEXT: v_cvt_u32_f32_e32 v9, v9
	; GFX9-NEXT: v_and_b32_e32 v4, 0xffffff, v4			; GFX9-NEXT: v_and_b32_e32 v4, 0xffffff, v4
	; GFX9-NEXT: v_mul_lo_u32 v8, v7, v6			; GFX9-NEXT: v_mul_lo_u32 v8, v6, v7
	; GFX9-NEXT: v_and_b32_e32 v5, 0xffffff, v5			; GFX9-NEXT: v_and_b32_e32 v5, 0xffffff, v5
	; GFX9-NEXT: v_mul_lo_u32 v7, v7, v9			; GFX9-NEXT: v_mul_lo_u32 v7, v9, v7
	; GFX9-NEXT: v_and_b32_e32 v2, 0xffffff, v2			; GFX9-NEXT: v_and_b32_e32 v2, 0xffffff, v2
	; GFX9-NEXT: v_mul_hi_u32 v8, v6, v8			; GFX9-NEXT: v_mul_hi_u32 v8, v6, v8
	; GFX9-NEXT: v_lshlrev_b32_e32 v0, 1, v0			; GFX9-NEXT: v_lshlrev_b32_e32 v0, 1, v0
	; GFX9-NEXT: v_mul_hi_u32 v7, v9, v7			; GFX9-NEXT: v_mul_hi_u32 v7, v9, v7
	; GFX9-NEXT: v_and_b32_e32 v3, 0xffffff, v3			; GFX9-NEXT: v_and_b32_e32 v3, 0xffffff, v3
	; GFX9-NEXT: v_add_u32_e32 v6, v6, v8			; GFX9-NEXT: v_add_u32_e32 v6, v6, v8
	; GFX9-NEXT: v_mul_hi_u32 v6, v4, v6			; GFX9-NEXT: v_mul_hi_u32 v6, v4, v6
	; GFX9-NEXT: v_add_u32_e32 v7, v9, v7			; GFX9-NEXT: v_add_u32_e32 v7, v9, v7
	▲ Show 20 Lines • Show All 5,921 Lines • Show Last 20 Lines

llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.sbfe.ll

	Show First 20 Lines • Show All 672 Lines • ▼ Show 20 Lines
	; GFX6-NEXT: v_rcp_iflag_f32_e32 v0, 2.0			; GFX6-NEXT: v_rcp_iflag_f32_e32 v0, 2.0
	; GFX6-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x0			; GFX6-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x0
	; GFX6-NEXT: v_mul_f32_e32 v0, 0x4f7ffffe, v0			; GFX6-NEXT: v_mul_f32_e32 v0, 0x4f7ffffe, v0
	; GFX6-NEXT: v_cvt_u32_f32_e32 v0, v0			; GFX6-NEXT: v_cvt_u32_f32_e32 v0, v0
	; GFX6-NEXT: s_waitcnt lgkmcnt(0)			; GFX6-NEXT: s_waitcnt lgkmcnt(0)
	; GFX6-NEXT: s_load_dword s0, s[6:7], 0x0			; GFX6-NEXT: s_load_dword s0, s[6:7], 0x0
	; GFX6-NEXT: s_mov_b32 s6, -1			; GFX6-NEXT: s_mov_b32 s6, -1
	; GFX6-NEXT: s_mov_b32 s7, 0xf000			; GFX6-NEXT: s_mov_b32 s7, 0xf000
	; GFX6-NEXT: v_mul_lo_u32 v1, -2, v0			; GFX6-NEXT: v_mul_lo_u32 v1, v0, -2
	; GFX6-NEXT: s_waitcnt lgkmcnt(0)			; GFX6-NEXT: s_waitcnt lgkmcnt(0)
	; GFX6-NEXT: s_bfe_i32 s0, s0, 0x100001			; GFX6-NEXT: s_bfe_i32 s0, s0, 0x100001
	; GFX6-NEXT: s_ashr_i32 s2, s0, 31			; GFX6-NEXT: s_ashr_i32 s2, s0, 31
	; GFX6-NEXT: v_mul_hi_u32 v1, v0, v1			; GFX6-NEXT: v_mul_hi_u32 v1, v0, v1
	; GFX6-NEXT: s_add_i32 s0, s0, s2			; GFX6-NEXT: s_add_i32 s0, s0, s2
	; GFX6-NEXT: s_xor_b32 s0, s0, s2			; GFX6-NEXT: s_xor_b32 s0, s0, s2
	; GFX6-NEXT: v_add_i32_e32 v0, vcc, v0, v1			; GFX6-NEXT: v_add_i32_e32 v0, vcc, v0, v1
	; GFX6-NEXT: v_mul_hi_u32 v0, s0, v0			; GFX6-NEXT: v_mul_hi_u32 v0, s0, v0
	▲ Show 20 Lines • Show All 266 Lines • Show Last 20 Lines

llvm/test/CodeGen/AMDGPU/GlobalISel/mul-known-bits.i64.ll

Show First 20 Lines • Show All 44 Lines • ▼ Show 20 Lines ; GFX11-NEXT: s_endpgm

%a = load i64, ptr addrspace(1) %gep.a %a = load i64, ptr addrspace(1) %gep.a

%b = load i64, ptr addrspace(1) %gep.b %b = load i64, ptr addrspace(1) %gep.b

%mul = mul i64 %a, %b %mul = mul i64 %a, %b

store i64 %mul, ptr addrspace(1) %gep.out store i64 %mul, ptr addrspace(1) %gep.out

ret void ret void

} }

; a 64 bit multiplication where the second argument was zero extended. ; a 64 bit multiplication where the second argument was zero extended.

define amdgpu_kernel void @v_mul_i64_zext_01(ptr addrspace(1) %out, ptr addrspace(1) %aptr, ptr addrspace(1) %bptr) { define amdgpu_kernel void @v_mul_i64_zext_01(ptr addrspace(1) %out, ptr addrspace(1) %aptr, ptr addrspace(1) %bptr) {

OutOfCacheUnsubmitted

Not Done

; a 64 bit multiplication where the second argument was zero extended.

- define amdgpu_kernel void @v_mul_i64_zext_01(ptr addrspace(1) %out, ptr addrspace(1) %aptr, ptr addrspace(1) %bptr) {

+ define amdgpu_kernel void @v_mul_i64_zext_src1(ptr addrspace(1) %out, ptr addrspace(1) %aptr, ptr addrspace(1) %bptr) {

; GFX10-LABEL: v_mul_i64_zext_01:

@tsymalla suggested in my revision to give the test cases more descriptive names.

OutOfCache: @tsymalla suggested in my revision to give the test cases more descriptive names.

foadAuthorUnsubmitted

Done

That's fine but I think it should be a separate patch.

foad: That's fine but I think it should be a separate patch.

; GFX10-LABEL: v_mul_i64_zext_01: ; GFX10-LABEL: v_mul_i64_zext_01:

; GFX10: ; %bb.0: ; GFX10: ; %bb.0:

; GFX10-NEXT: s_clause 0x1 ; GFX10-NEXT: s_clause 0x1

; GFX10-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24 ; GFX10-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24

; GFX10-NEXT: s_load_dwordx2 s[2:3], s[0:1], 0x34 ; GFX10-NEXT: s_load_dwordx2 s[2:3], s[0:1], 0x34

; GFX10-NEXT: v_lshlrev_b32_e32 v2, 3, v0 ; GFX10-NEXT: v_lshlrev_b32_e32 v2, 3, v0

; GFX10-NEXT: v_lshlrev_b32_e32 v3, 2, v0 ; GFX10-NEXT: v_lshlrev_b32_e32 v3, 2, v0

; GFX10-NEXT: s_waitcnt lgkmcnt(0) ; GFX10-NEXT: s_waitcnt lgkmcnt(0)

▲ Show 20 Lines • Show All 45 Lines • ▼ Show 20 Lines

; GFX10-NEXT: s_load_dwordx2 s[2:3], s[0:1], 0x34 ; GFX10-NEXT: s_load_dwordx2 s[2:3], s[0:1], 0x34

; GFX10-NEXT: v_lshlrev_b32_e32 v2, 2, v0 ; GFX10-NEXT: v_lshlrev_b32_e32 v2, 2, v0

; GFX10-NEXT: v_lshlrev_b32_e32 v3, 3, v0 ; GFX10-NEXT: v_lshlrev_b32_e32 v3, 3, v0

; GFX10-NEXT: s_waitcnt lgkmcnt(0) ; GFX10-NEXT: s_waitcnt lgkmcnt(0)

; GFX10-NEXT: global_load_dword v4, v2, s[6:7] ; GFX10-NEXT: global_load_dword v4, v2, s[6:7]

; GFX10-NEXT: global_load_dwordx2 v[0:1], v3, s[2:3] ; GFX10-NEXT: global_load_dwordx2 v[0:1], v3, s[2:3]

; GFX10-NEXT: s_waitcnt vmcnt(0) ; GFX10-NEXT: s_waitcnt vmcnt(0)

; GFX10-NEXT: v_mad_u64_u32 v[2:3], s0, v4, v0, 0 ; GFX10-NEXT: v_mad_u64_u32 v[2:3], s0, v4, v0, 0

; GFX10-NEXT: v_mul_lo_u32 v1, v4, v1 ; GFX10-NEXT: v_mul_lo_u32 v0, v4, v1

; GFX10-NEXT: v_mul_lo_u32 v0, 0, v0 ; GFX10-NEXT: v_add_nc_u32_e32 v3, v3, v0

; GFX10-NEXT: v_add3_u32 v3, v3, v1, v0

; GFX10-NEXT: v_mov_b32_e32 v0, 0 ; GFX10-NEXT: v_mov_b32_e32 v0, 0

; GFX10-NEXT: global_store_dwordx2 v0, v[2:3], s[4:5] ; GFX10-NEXT: global_store_dwordx2 v0, v[2:3], s[4:5]

; GFX10-NEXT: s_endpgm ; GFX10-NEXT: s_endpgm

; ;

; GFX11-LABEL: v_mul_i64_zext_10: ; GFX11-LABEL: v_mul_i64_zext_10:

; GFX11: ; %bb.0: ; GFX11: ; %bb.0:

; GFX11-NEXT: s_clause 0x1 ; GFX11-NEXT: s_clause 0x1

; GFX11-NEXT: s_load_b128 s[4:7], s[0:1], 0x24 ; GFX11-NEXT: s_load_b128 s[4:7], s[0:1], 0x24

; GFX11-NEXT: s_load_b64 s[0:1], s[0:1], 0x34 ; GFX11-NEXT: s_load_b64 s[0:1], s[0:1], 0x34

; GFX11-NEXT: v_lshlrev_b32_e32 v1, 2, v0 ; GFX11-NEXT: v_lshlrev_b32_e32 v1, 2, v0

; GFX11-NEXT: v_lshlrev_b32_e32 v0, 3, v0 ; GFX11-NEXT: v_lshlrev_b32_e32 v0, 3, v0

; GFX11-NEXT: s_waitcnt lgkmcnt(0) ; GFX11-NEXT: s_waitcnt lgkmcnt(0)

; GFX11-NEXT: global_load_b32 v4, v1, s[6:7] ; GFX11-NEXT: global_load_b32 v4, v1, s[6:7]

; GFX11-NEXT: global_load_b64 v[0:1], v0, s[0:1] ; GFX11-NEXT: global_load_b64 v[0:1], v0, s[0:1]

; GFX11-NEXT: s_waitcnt vmcnt(0) ; GFX11-NEXT: s_waitcnt vmcnt(0)

; GFX11-NEXT: v_mad_u64_u32 v[2:3], null, v4, v0, 0 ; GFX11-NEXT: v_mad_u64_u32 v[2:3], null, v4, v0, 0

; GFX11-NEXT: v_mul_lo_u32 v1, v4, v1 ; GFX11-NEXT: v_mul_lo_u32 v0, v4, v1

; GFX11-NEXT: v_mul_lo_u32 v0, 0, v0

; GFX11-NEXT: s_delay_alu instid0(VALU_DEP_1) ; GFX11-NEXT: s_delay_alu instid0(VALU_DEP_1)

; GFX11-NEXT: v_add3_u32 v3, v3, v1, v0 ; GFX11-NEXT: v_dual_mov_b32 v0, 0 :: v_dual_add_nc_u32 v3, v3, v0

; GFX11-NEXT: v_mov_b32_e32 v0, 0

; GFX11-NEXT: global_store_b64 v0, v[2:3], s[4:5] ; GFX11-NEXT: global_store_b64 v0, v[2:3], s[4:5]

; GFX11-NEXT: s_sendmsg sendmsg(MSG_DEALLOC_VGPRS) ; GFX11-NEXT: s_sendmsg sendmsg(MSG_DEALLOC_VGPRS)

; GFX11-NEXT: s_endpgm ; GFX11-NEXT: s_endpgm

%tid = call i32 @llvm.amdgcn.workitem.id.x() %tid = call i32 @llvm.amdgcn.workitem.id.x()

%gep.a = getelementptr inbounds i32, ptr addrspace(1) %aptr, i32 %tid %gep.a = getelementptr inbounds i32, ptr addrspace(1) %aptr, i32 %tid

%gep.b = getelementptr inbounds i64, ptr addrspace(1) %bptr, i32 %tid %gep.b = getelementptr inbounds i64, ptr addrspace(1) %bptr, i32 %tid

%a = load i32, ptr addrspace(1) %gep.a %a = load i32, ptr addrspace(1) %gep.a

%b = load i64, ptr addrspace(1) %gep.b %b = load i64, ptr addrspace(1) %gep.b

Show All 12 Lines

; GFX10-NEXT: s_load_dwordx2 s[2:3], s[0:1], 0x34 ; GFX10-NEXT: s_load_dwordx2 s[2:3], s[0:1], 0x34

; GFX10-NEXT: v_lshlrev_b32_e32 v0, 2, v0 ; GFX10-NEXT: v_lshlrev_b32_e32 v0, 2, v0

; GFX10-NEXT: s_waitcnt lgkmcnt(0) ; GFX10-NEXT: s_waitcnt lgkmcnt(0)

; GFX10-NEXT: s_clause 0x1 ; GFX10-NEXT: s_clause 0x1

; GFX10-NEXT: global_load_dword v1, v0, s[6:7] ; GFX10-NEXT: global_load_dword v1, v0, s[6:7]

; GFX10-NEXT: global_load_dword v2, v0, s[2:3] ; GFX10-NEXT: global_load_dword v2, v0, s[2:3]

; GFX10-NEXT: s_waitcnt vmcnt(0) ; GFX10-NEXT: s_waitcnt vmcnt(0)

; GFX10-NEXT: v_mad_u64_u32 v[0:1], s0, v1, v2, 0 ; GFX10-NEXT: v_mad_u64_u32 v[0:1], s0, v1, v2, 0

; GFX10-NEXT: v_mul_lo_u32 v2, 0, v2

; GFX10-NEXT: v_add_nc_u32_e32 v1, v1, v2

; GFX10-NEXT: v_mov_b32_e32 v2, 0 ; GFX10-NEXT: v_mov_b32_e32 v2, 0

; GFX10-NEXT: global_store_dwordx2 v2, v[0:1], s[4:5] ; GFX10-NEXT: global_store_dwordx2 v2, v[0:1], s[4:5]

; GFX10-NEXT: s_endpgm ; GFX10-NEXT: s_endpgm

; ;

; GFX11-LABEL: v_mul_i64_zext_11: ; GFX11-LABEL: v_mul_i64_zext_11:

; GFX11: ; %bb.0: ; GFX11: ; %bb.0:

; GFX11-NEXT: s_clause 0x1 ; GFX11-NEXT: s_clause 0x1

; GFX11-NEXT: s_load_b128 s[4:7], s[0:1], 0x24 ; GFX11-NEXT: s_load_b128 s[4:7], s[0:1], 0x24

; GFX11-NEXT: s_load_b64 s[0:1], s[0:1], 0x34 ; GFX11-NEXT: s_load_b64 s[0:1], s[0:1], 0x34

; GFX11-NEXT: v_lshlrev_b32_e32 v0, 2, v0 ; GFX11-NEXT: v_lshlrev_b32_e32 v0, 2, v0

; GFX11-NEXT: v_mov_b32_e32 v2, 0

tsymallaUnsubmitted

Not Done

Shouldn't this one be eliminated?

tsymalla: Shouldn't this one be eliminated?

foadAuthorUnsubmitted

Done

Why? It's used by the global_store below.

foad: Why? It's used by the global_store below.

tsymallaUnsubmitted

Not Done

Missed that one.

tsymalla: Missed that one.

; GFX11-NEXT: s_waitcnt lgkmcnt(0) ; GFX11-NEXT: s_waitcnt lgkmcnt(0)

; GFX11-NEXT: s_clause 0x1 ; GFX11-NEXT: s_clause 0x1

; GFX11-NEXT: global_load_b32 v1, v0, s[6:7] ; GFX11-NEXT: global_load_b32 v1, v0, s[6:7]

; GFX11-NEXT: global_load_b32 v2, v0, s[0:1] ; GFX11-NEXT: global_load_b32 v0, v0, s[0:1]

; GFX11-NEXT: s_waitcnt vmcnt(0) ; GFX11-NEXT: s_waitcnt vmcnt(0)

; GFX11-NEXT: v_mad_u64_u32 v[0:1], null, v1, v2, 0 ; GFX11-NEXT: v_mad_u64_u32 v[0:1], null, v1, v0, 0

; GFX11-NEXT: v_mul_lo_u32 v2, 0, v2

; GFX11-NEXT: s_delay_alu instid0(VALU_DEP_1)

; GFX11-NEXT: v_dual_mov_b32 v2, 0 :: v_dual_add_nc_u32 v1, v1, v2

; GFX11-NEXT: global_store_b64 v2, v[0:1], s[4:5] ; GFX11-NEXT: global_store_b64 v2, v[0:1], s[4:5]

; GFX11-NEXT: s_sendmsg sendmsg(MSG_DEALLOC_VGPRS) ; GFX11-NEXT: s_sendmsg sendmsg(MSG_DEALLOC_VGPRS)

; GFX11-NEXT: s_endpgm ; GFX11-NEXT: s_endpgm

%tid = call i32 @llvm.amdgcn.workitem.id.x() %tid = call i32 @llvm.amdgcn.workitem.id.x()

%gep.a = getelementptr inbounds i32, ptr addrspace(1) %aptr, i32 %tid %gep.a = getelementptr inbounds i32, ptr addrspace(1) %aptr, i32 %tid

%gep.b = getelementptr inbounds i32, ptr addrspace(1) %bptr, i32 %tid %gep.b = getelementptr inbounds i32, ptr addrspace(1) %bptr, i32 %tid

%a = load i32, ptr addrspace(1) %gep.a %a = load i32, ptr addrspace(1) %gep.a

%b = load i32, ptr addrspace(1) %gep.b %b = load i32, ptr addrspace(1) %gep.b

Show All 13 Lines

; GFX10-NEXT: s_load_dwordx2 s[2:3], s[0:1], 0x34 ; GFX10-NEXT: s_load_dwordx2 s[2:3], s[0:1], 0x34

; GFX10-NEXT: v_lshlrev_b32_e32 v2, 3, v0 ; GFX10-NEXT: v_lshlrev_b32_e32 v2, 3, v0

; GFX10-NEXT: s_waitcnt lgkmcnt(0) ; GFX10-NEXT: s_waitcnt lgkmcnt(0)

; GFX10-NEXT: s_clause 0x1 ; GFX10-NEXT: s_clause 0x1

; GFX10-NEXT: global_load_dword v4, v2, s[6:7] ; GFX10-NEXT: global_load_dword v4, v2, s[6:7]

; GFX10-NEXT: global_load_dwordx2 v[0:1], v2, s[2:3] ; GFX10-NEXT: global_load_dwordx2 v[0:1], v2, s[2:3]

; GFX10-NEXT: s_waitcnt vmcnt(0) ; GFX10-NEXT: s_waitcnt vmcnt(0)

; GFX10-NEXT: v_mad_u64_u32 v[2:3], s0, v4, v0, 0 ; GFX10-NEXT: v_mad_u64_u32 v[2:3], s0, v4, v0, 0

; GFX10-NEXT: v_mul_lo_u32 v1, v4, v1 ; GFX10-NEXT: v_mul_lo_u32 v0, v4, v1

; GFX10-NEXT: v_mul_lo_u32 v0, 0, v0 ; GFX10-NEXT: v_add_nc_u32_e32 v3, v3, v0

; GFX10-NEXT: v_add3_u32 v3, v3, v1, v0

; GFX10-NEXT: v_mov_b32_e32 v0, 0 ; GFX10-NEXT: v_mov_b32_e32 v0, 0

; GFX10-NEXT: global_store_dwordx2 v0, v[2:3], s[4:5] ; GFX10-NEXT: global_store_dwordx2 v0, v[2:3], s[4:5]

; GFX10-NEXT: s_endpgm ; GFX10-NEXT: s_endpgm

; ;

; GFX11-LABEL: v_mul_i64_and_a_hi: ; GFX11-LABEL: v_mul_i64_and_a_hi:

; GFX11: ; %bb.0: ; GFX11: ; %bb.0:

; GFX11-NEXT: s_clause 0x1 ; GFX11-NEXT: s_clause 0x1

; GFX11-NEXT: s_load_b128 s[4:7], s[0:1], 0x24 ; GFX11-NEXT: s_load_b128 s[4:7], s[0:1], 0x24

; GFX11-NEXT: s_load_b64 s[0:1], s[0:1], 0x34 ; GFX11-NEXT: s_load_b64 s[0:1], s[0:1], 0x34

; GFX11-NEXT: v_lshlrev_b32_e32 v0, 3, v0 ; GFX11-NEXT: v_lshlrev_b32_e32 v0, 3, v0

; GFX11-NEXT: s_waitcnt lgkmcnt(0) ; GFX11-NEXT: s_waitcnt lgkmcnt(0)

; GFX11-NEXT: s_clause 0x1 ; GFX11-NEXT: s_clause 0x1

; GFX11-NEXT: global_load_b32 v4, v0, s[6:7] ; GFX11-NEXT: global_load_b32 v4, v0, s[6:7]

; GFX11-NEXT: global_load_b64 v[0:1], v0, s[0:1] ; GFX11-NEXT: global_load_b64 v[0:1], v0, s[0:1]

; GFX11-NEXT: s_waitcnt vmcnt(0) ; GFX11-NEXT: s_waitcnt vmcnt(0)

; GFX11-NEXT: v_mad_u64_u32 v[2:3], null, v4, v0, 0 ; GFX11-NEXT: v_mad_u64_u32 v[2:3], null, v4, v0, 0

; GFX11-NEXT: v_mul_lo_u32 v1, v4, v1 ; GFX11-NEXT: v_mul_lo_u32 v0, v4, v1

; GFX11-NEXT: v_mul_lo_u32 v0, 0, v0

; GFX11-NEXT: s_delay_alu instid0(VALU_DEP_1) ; GFX11-NEXT: s_delay_alu instid0(VALU_DEP_1)

; GFX11-NEXT: v_add3_u32 v3, v3, v1, v0 ; GFX11-NEXT: v_dual_mov_b32 v0, 0 :: v_dual_add_nc_u32 v3, v3, v0

; GFX11-NEXT: v_mov_b32_e32 v0, 0

; GFX11-NEXT: global_store_b64 v0, v[2:3], s[4:5] ; GFX11-NEXT: global_store_b64 v0, v[2:3], s[4:5]

; GFX11-NEXT: s_sendmsg sendmsg(MSG_DEALLOC_VGPRS) ; GFX11-NEXT: s_sendmsg sendmsg(MSG_DEALLOC_VGPRS)

; GFX11-NEXT: s_endpgm ; GFX11-NEXT: s_endpgm

%tid = call i32 @llvm.amdgcn.workitem.id.x() %tid = call i32 @llvm.amdgcn.workitem.id.x()

%gep.a = getelementptr inbounds i64, ptr addrspace(1) %aptr, i32 %tid %gep.a = getelementptr inbounds i64, ptr addrspace(1) %aptr, i32 %tid

%gep.b = getelementptr inbounds i64, ptr addrspace(1) %bptr, i32 %tid %gep.b = getelementptr inbounds i64, ptr addrspace(1) %bptr, i32 %tid

%a = load i64, ptr addrspace(1) %gep.a %a = load i64, ptr addrspace(1) %gep.a

%b = load i64, ptr addrspace(1) %gep.b %b = load i64, ptr addrspace(1) %gep.b

Show All 11 Lines

; GFX10-NEXT: s_load_dwordx2 s[2:3], s[0:1], 0x34 ; GFX10-NEXT: s_load_dwordx2 s[2:3], s[0:1], 0x34

; GFX10-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24 ; GFX10-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24

; GFX10-NEXT: v_lshlrev_b32_e32 v4, 3, v0 ; GFX10-NEXT: v_lshlrev_b32_e32 v4, 3, v0

; GFX10-NEXT: s_waitcnt lgkmcnt(0) ; GFX10-NEXT: s_waitcnt lgkmcnt(0)

; GFX10-NEXT: s_clause 0x1 ; GFX10-NEXT: s_clause 0x1

; GFX10-NEXT: global_load_dwordx2 v[0:1], v4, s[2:3] ; GFX10-NEXT: global_load_dwordx2 v[0:1], v4, s[2:3]

; GFX10-NEXT: global_load_dwordx2 v[2:3], v4, s[6:7] ; GFX10-NEXT: global_load_dwordx2 v[2:3], v4, s[6:7]

; GFX10-NEXT: s_waitcnt vmcnt(1) ; GFX10-NEXT: s_waitcnt vmcnt(1)

; GFX10-NEXT: v_mad_u64_u32 v[4:5], s0, 0, v0, 0 ; GFX10-NEXT: v_mad_u64_u32 v[4:5], s0, 0, v0, 0

OutOfCacheUnsubmitted

Not Done

This is a neat approach! Is there a possibility to extend this to G_MAD instructions as well? It's trickier since the operands don't have the same indices as for G_MUL etc. though.

OutOfCache: This is a neat approach! Is there a possibility to extend this to `G_MAD` instructions as well?

foadAuthorUnsubmitted

Done

There are no generic G_MAD instructions, so I think we would need to add a target-specific combine for target-specific opcodes.

foad: There are no generic G_MAD instructions, so I think we would need to add a target-specific…

; GFX10-NEXT: v_mul_lo_u32 v1, 0, v1 ; GFX10-NEXT: v_mul_lo_u32 v1, 0, v1

; GFX10-NEXT: s_waitcnt vmcnt(0) ; GFX10-NEXT: s_waitcnt vmcnt(0)

; GFX10-NEXT: v_mul_lo_u32 v0, v3, v0 ; GFX10-NEXT: v_mul_lo_u32 v0, v3, v0

; GFX10-NEXT: v_add3_u32 v5, v5, v1, v0 ; GFX10-NEXT: v_add3_u32 v5, v5, v1, v0

; GFX10-NEXT: v_mov_b32_e32 v0, 0 ; GFX10-NEXT: v_mov_b32_e32 v0, 0

; GFX10-NEXT: global_store_dwordx2 v0, v[4:5], s[4:5] ; GFX10-NEXT: global_store_dwordx2 v0, v[4:5], s[4:5]

; GFX10-NEXT: s_endpgm ; GFX10-NEXT: s_endpgm

; ;

Show All 37 Lines

; GFX10-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24 ; GFX10-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24

; GFX10-NEXT: s_load_dwordx2 s[2:3], s[0:1], 0x34 ; GFX10-NEXT: s_load_dwordx2 s[2:3], s[0:1], 0x34

; GFX10-NEXT: v_lshlrev_b32_e32 v4, 3, v0 ; GFX10-NEXT: v_lshlrev_b32_e32 v4, 3, v0

; GFX10-NEXT: s_waitcnt lgkmcnt(0) ; GFX10-NEXT: s_waitcnt lgkmcnt(0)

; GFX10-NEXT: s_clause 0x1 ; GFX10-NEXT: s_clause 0x1

; GFX10-NEXT: global_load_dwordx2 v[0:1], v4, s[6:7] ; GFX10-NEXT: global_load_dwordx2 v[0:1], v4, s[6:7]

; GFX10-NEXT: global_load_dwordx2 v[2:3], v4, s[2:3] ; GFX10-NEXT: global_load_dwordx2 v[2:3], v4, s[2:3]

; GFX10-NEXT: s_waitcnt vmcnt(1) ; GFX10-NEXT: s_waitcnt vmcnt(1)

; GFX10-NEXT: v_mad_u64_u32 v[4:5], s0, v0, 0, 0 ; GFX10-NEXT: v_mad_u64_u32 v[4:5], s0, v0, 0, 0

OutOfCacheUnsubmitted

Not Done

G_MAD does not take advantage of the binop_right_to_zero rule.

OutOfCache: `G_MAD` does not take advantage of the `binop_right_to_zero` rule.

foadAuthorUnsubmitted

Done

Likewise, I think that would need to be a target-specific combine.

foad: Likewise, I think that would need to be a target-specific combine.

; GFX10-NEXT: s_waitcnt vmcnt(0) ; GFX10-NEXT: s_waitcnt vmcnt(0)

; GFX10-NEXT: v_mul_lo_u32 v0, v0, v3 ; GFX10-NEXT: v_mul_lo_u32 v0, v0, v3

; GFX10-NEXT: v_mul_lo_u32 v1, v1, 0 ; GFX10-NEXT: v_mul_lo_u32 v1, v1, 0

; GFX10-NEXT: v_add3_u32 v5, v5, v0, v1 ; GFX10-NEXT: v_add3_u32 v5, v5, v0, v1

; GFX10-NEXT: v_mov_b32_e32 v0, 0 ; GFX10-NEXT: v_mov_b32_e32 v0, 0

; GFX10-NEXT: global_store_dwordx2 v0, v[4:5], s[4:5] ; GFX10-NEXT: global_store_dwordx2 v0, v[4:5], s[4:5]

; GFX10-NEXT: s_endpgm ; GFX10-NEXT: s_endpgm

; ;

▲ Show 20 Lines • Show All 57 Lines • ▼ Show 20 Lines ; GFX11-NEXT: s_endpgm

%b = load i64, ptr addrspace(1) %gep.b %b = load i64, ptr addrspace(1) %gep.b

%a_and = and i64 %a, u0x0000000000000000 %a_and = and i64 %a, u0x0000000000000000

%mul = mul i64 %a_and, %b %mul = mul i64 %a_and, %b

store i64 %mul, ptr addrspace(1) %out store i64 %mul, ptr addrspace(1) %out

ret void ret void

} }

; 64-bit multiplication, where the first argument is masked before a branch ; 64-bit multiplication, where the first argument is masked before a branch

define amdgpu_kernel void @mul64_and_in_branch(ptr addrspace(1) %out, ptr addrspace(1) %aptr, ptr addrspace(1) %bptr) { define amdgpu_kernel void @mul64_and_in_branch(ptr addrspace(1) %out, ptr addrspace(1) %aptr, ptr addrspace(1) %bptr) {

OutOfCacheUnsubmitted

Not Done

; 64-bit multiplication, where the first argument is masked before a branch

- define amdgpu_kernel void @mul64_and_in_branch(ptr addrspace(1) %out, ptr addrspace(1) %aptr, ptr addrspace(1) %bptr) {

+ define amdgpu_kernel void @v_mul64_and_in_branch(ptr addrspace(1) %out, ptr addrspace(1) %aptr, ptr addrspace(1) %bptr) {

; GFX10-LABEL: mul64_and_in_branch:

OutOfCache:

; GFX10-LABEL: mul64_and_in_branch: ; GFX10-LABEL: mul64_and_in_branch:

; GFX10: ; %bb.0: ; %entry ; GFX10: ; %bb.0: ; %entry

; GFX10-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24 ; GFX10-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24

; GFX10-NEXT: v_mov_b32_e32 v0, 0 ; GFX10-NEXT: v_mov_b32_e32 v0, 0

; GFX10-NEXT: v_mov_b32_e32 v1, 0 ; GFX10-NEXT: v_mov_b32_e32 v1, 0

; GFX10-NEXT: v_mov_b32_e32 v2, 0 ; GFX10-NEXT: v_mov_b32_e32 v2, 0

; GFX10-NEXT: s_waitcnt lgkmcnt(0) ; GFX10-NEXT: s_waitcnt lgkmcnt(0)

; GFX10-NEXT: global_store_dwordx2 v2, v[0:1], s[0:1] ; GFX10-NEXT: global_store_dwordx2 v2, v[0:1], s[0:1]

Show All 29 Lines

endif: endif:

%3 = phi i64 [%1, %if], [%2, %else] %3 = phi i64 [%1, %if], [%2, %else]

store i64 %3, ptr addrspace(1) %out store i64 %3, ptr addrspace(1) %out

ret void ret void

} }

; 64-bit multiplication with both arguments changed in differnt basic blocks. ; 64-bit multiplication with both arguments changed in differnt basic blocks.

define amdgpu_kernel void @mul64_and_in_branch_2(ptr addrspace(1) %out, ptr addrspace(1) %aptr, ptr addrspace(1) %bptr) { define amdgpu_kernel void @mul64_and_in_branch_2(ptr addrspace(1) %out, ptr addrspace(1) %aptr, ptr addrspace(1) %bptr) {

OutOfCacheUnsubmitted

Not Done

; 64-bit multiplication with both arguments changed in differnt basic blocks.

- define amdgpu_kernel void @mul64_and_in_branch_2(ptr addrspace(1) %out, ptr addrspace(1) %aptr, ptr addrspace(1) %bptr) {

+ define amdgpu_kernel void @v_mul64_and_in_branch_2(ptr addrspace(1) %out, ptr addrspace(1) %aptr, ptr addrspace(1) %bptr) {

; GFX10-LABEL: mul64_and_in_branch_2:

OutOfCache:

; GFX10-LABEL: mul64_and_in_branch_2: ; GFX10-LABEL: mul64_and_in_branch_2:

; GFX10: ; %bb.0: ; %entry ; GFX10: ; %bb.0: ; %entry

; GFX10-NEXT: s_clause 0x1 ; GFX10-NEXT: s_clause 0x1

; GFX10-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24 ; GFX10-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x24

; GFX10-NEXT: s_load_dwordx2 s[2:3], s[0:1], 0x34 ; GFX10-NEXT: s_load_dwordx2 s[2:3], s[0:1], 0x34

; GFX10-NEXT: v_lshlrev_b32_e32 v0, 3, v0 ; GFX10-NEXT: v_lshlrev_b32_e32 v0, 3, v0

; GFX10-NEXT: s_waitcnt lgkmcnt(0) ; GFX10-NEXT: s_waitcnt lgkmcnt(0)

; GFX10-NEXT: s_clause 0x1 ; GFX10-NEXT: s_clause 0x1

▲ Show 20 Lines • Show All 89 Lines • Show Last 20 Lines

llvm/test/CodeGen/AMDGPU/GlobalISel/postlegalizer-combiner-trunc-bitcast-buildvector.mir

# NOTE: Assertions have been autogenerated by utils/update_mir_test_checks.py		# NOTE: Assertions have been autogenerated by utils/update_mir_test_checks.py
# RUN: llc -mtriple=amdgcn-amd-amdhsa -mcpu=gfx900 -run-pass=amdgpu-postlegalizer-combiner -verify-machineinstrs -o - %s \| FileCheck %s		# RUN: llc -mtriple=amdgcn-amd-amdhsa -mcpu=gfx900 -run-pass=amdgpu-postlegalizer-combiner -verify-machineinstrs -o - %s \| FileCheck %s

---		---
name: s16_trunc_v2s16_buildvector		name: s16_trunc_v2s16_buildvector
tracksRegLiveness: true		tracksRegLiveness: true
body: \|		body: \|
bb.0:		bb.0:
liveins: $vgpr0, $vgpr1		liveins: $vgpr0, $vgpr1
; CHECK-LABEL: name: s16_trunc_v2s16_buildvector		; CHECK-LABEL: name: s16_trunc_v2s16_buildvector
; CHECK: liveins: $vgpr0, $vgpr1		; CHECK: liveins: $vgpr0, $vgpr1
; CHECK-NEXT: {{ $}}		; CHECK-NEXT: {{ $}}
; CHECK-NEXT: [[COPY:%[0-9]+]]:_(s32) = COPY $vgpr0		; CHECK-NEXT: [[COPY:%[0-9]+]]:_(s32) = COPY $vgpr0
; CHECK-NEXT: [[TRUNC:%[0-9]+]]:_(s16) = G_TRUNC [[COPY]](s32)		; CHECK-NEXT: [[TRUNC:%[0-9]+]]:_(s16) = G_TRUNC [[COPY]](s32)
; CHECK-NEXT: [[C:%[0-9]+]]:_(s16) = G_CONSTANT i16 42		; CHECK-NEXT: [[C:%[0-9]+]]:_(s16) = G_CONSTANT i16 42
; CHECK-NEXT: [[OR:%[0-9]+]]:_(s16) = G_OR [[C]], [[TRUNC]]		; CHECK-NEXT: [[OR:%[0-9]+]]:_(s16) = G_OR [[TRUNC]], [[C]]
; CHECK-NEXT: [[ZEXT:%[0-9]+]]:_(s32) = G_ZEXT [[OR]](s16)		; CHECK-NEXT: [[ZEXT:%[0-9]+]]:_(s32) = G_ZEXT [[OR]](s16)
; CHECK-NEXT: $vgpr0 = COPY [[ZEXT]](s32)		; CHECK-NEXT: $vgpr0 = COPY [[ZEXT]](s32)
%0:_(s32) = COPY $vgpr0		%0:_(s32) = COPY $vgpr0
%1:_(s32) = COPY $vgpr1		%1:_(s32) = COPY $vgpr1
%2:_(s16) = G_TRUNC %0		%2:_(s16) = G_TRUNC %0
%3:_(s16) = G_TRUNC %1		%3:_(s16) = G_TRUNC %1
%4:_(<2 x s16>) = G_BUILD_VECTOR %2, %3		%4:_(<2 x s16>) = G_BUILD_VECTOR %2, %3
%5:_(s32) = G_BITCAST %4		%5:_(s32) = G_BITCAST %4
Show All 18 Lines	bb.0:
; CHECK-NEXT: [[TRUNC:%[0-9]+]]:_(s16) = G_TRUNC [[COPY]](s32)		; CHECK-NEXT: [[TRUNC:%[0-9]+]]:_(s16) = G_TRUNC [[COPY]](s32)
; CHECK-NEXT: [[TRUNC1:%[0-9]+]]:_(s16) = G_TRUNC [[COPY1]](s32)		; CHECK-NEXT: [[TRUNC1:%[0-9]+]]:_(s16) = G_TRUNC [[COPY1]](s32)
; CHECK-NEXT: [[BUILD_VECTOR:%[0-9]+]]:_(<2 x s16>) = G_BUILD_VECTOR [[TRUNC]](s16), [[TRUNC1]](s16)		; CHECK-NEXT: [[BUILD_VECTOR:%[0-9]+]]:_(<2 x s16>) = G_BUILD_VECTOR [[TRUNC]](s16), [[TRUNC1]](s16)
; CHECK-NEXT: [[BITCAST:%[0-9]+]]:_(s32) = G_BITCAST [[BUILD_VECTOR]](<2 x s16>)		; CHECK-NEXT: [[BITCAST:%[0-9]+]]:_(s32) = G_BITCAST [[BUILD_VECTOR]](<2 x s16>)
; CHECK-NEXT: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 8		; CHECK-NEXT: [[C:%[0-9]+]]:_(s32) = G_CONSTANT i32 8
; CHECK-NEXT: [[LSHR:%[0-9]+]]:_(s32) = G_LSHR [[BITCAST]], [[C]](s32)		; CHECK-NEXT: [[LSHR:%[0-9]+]]:_(s32) = G_LSHR [[BITCAST]], [[C]](s32)
; CHECK-NEXT: [[TRUNC2:%[0-9]+]]:_(s16) = G_TRUNC [[LSHR]](s32)		; CHECK-NEXT: [[TRUNC2:%[0-9]+]]:_(s16) = G_TRUNC [[LSHR]](s32)
; CHECK-NEXT: [[C1:%[0-9]+]]:_(s16) = G_CONSTANT i16 42		; CHECK-NEXT: [[C1:%[0-9]+]]:_(s16) = G_CONSTANT i16 42
; CHECK-NEXT: [[OR:%[0-9]+]]:_(s16) = G_OR [[C1]], [[TRUNC2]]		; CHECK-NEXT: [[OR:%[0-9]+]]:_(s16) = G_OR [[TRUNC2]], [[C1]]
; CHECK-NEXT: [[ZEXT:%[0-9]+]]:_(s32) = G_ZEXT [[OR]](s16)		; CHECK-NEXT: [[ZEXT:%[0-9]+]]:_(s32) = G_ZEXT [[OR]](s16)
; CHECK-NEXT: $vgpr0 = COPY [[ZEXT]](s32)		; CHECK-NEXT: $vgpr0 = COPY [[ZEXT]](s32)
%0:_(s32) = COPY $vgpr0		%0:_(s32) = COPY $vgpr0
%1:_(s32) = COPY $vgpr1		%1:_(s32) = COPY $vgpr1
%2:_(s16) = G_TRUNC %0		%2:_(s16) = G_TRUNC %0
%3:_(s16) = G_TRUNC %1		%3:_(s16) = G_TRUNC %1
%4:_(<2 x s16>) = G_BUILD_VECTOR %2, %3		%4:_(<2 x s16>) = G_BUILD_VECTOR %2, %3
%5:_(s32) = G_BITCAST %4		%5:_(s32) = G_BITCAST %4
Show All 13 Lines	body: \|
bb.0:		bb.0:
liveins: $vgpr0, $vgpr1		liveins: $vgpr0, $vgpr1
; CHECK-LABEL: name: s16_trunc_v2s16_buildvector_shift16		; CHECK-LABEL: name: s16_trunc_v2s16_buildvector_shift16
; CHECK: liveins: $vgpr0, $vgpr1		; CHECK: liveins: $vgpr0, $vgpr1
; CHECK-NEXT: {{ $}}		; CHECK-NEXT: {{ $}}
; CHECK-NEXT: [[COPY:%[0-9]+]]:_(s32) = COPY $vgpr1		; CHECK-NEXT: [[COPY:%[0-9]+]]:_(s32) = COPY $vgpr1
; CHECK-NEXT: [[TRUNC:%[0-9]+]]:_(s16) = G_TRUNC [[COPY]](s32)		; CHECK-NEXT: [[TRUNC:%[0-9]+]]:_(s16) = G_TRUNC [[COPY]](s32)
; CHECK-NEXT: [[C:%[0-9]+]]:_(s16) = G_CONSTANT i16 42		; CHECK-NEXT: [[C:%[0-9]+]]:_(s16) = G_CONSTANT i16 42
; CHECK-NEXT: [[OR:%[0-9]+]]:_(s16) = G_OR [[C]], [[TRUNC]]		; CHECK-NEXT: [[OR:%[0-9]+]]:_(s16) = G_OR [[TRUNC]], [[C]]
; CHECK-NEXT: [[ZEXT:%[0-9]+]]:_(s32) = G_ZEXT [[OR]](s16)		; CHECK-NEXT: [[ZEXT:%[0-9]+]]:_(s32) = G_ZEXT [[OR]](s16)
; CHECK-NEXT: $vgpr0 = COPY [[ZEXT]](s32)		; CHECK-NEXT: $vgpr0 = COPY [[ZEXT]](s32)
%0:_(s32) = COPY $vgpr0		%0:_(s32) = COPY $vgpr0
%1:_(s32) = COPY $vgpr1		%1:_(s32) = COPY $vgpr1
%2:_(s16) = G_TRUNC %0		%2:_(s16) = G_TRUNC %0
%3:_(s16) = G_TRUNC %1		%3:_(s16) = G_TRUNC %1
%4:_(<2 x s16>) = G_BUILD_VECTOR %2, %3		%4:_(<2 x s16>) = G_BUILD_VECTOR %2, %3
%5:_(s32) = G_BITCAST %4		%5:_(s32) = G_BITCAST %4
Show All 16 Lines	bb.0:
; CHECK: liveins: $vgpr0, $vgpr1		; CHECK: liveins: $vgpr0, $vgpr1
; CHECK-NEXT: {{ $}}		; CHECK-NEXT: {{ $}}
; CHECK-NEXT: [[COPY:%[0-9]+]]:_(s32) = COPY $vgpr0		; CHECK-NEXT: [[COPY:%[0-9]+]]:_(s32) = COPY $vgpr0
; CHECK-NEXT: [[COPY1:%[0-9]+]]:_(s32) = COPY $vgpr1		; CHECK-NEXT: [[COPY1:%[0-9]+]]:_(s32) = COPY $vgpr1
; CHECK-NEXT: [[BUILD_VECTOR:%[0-9]+]]:_(<2 x s32>) = G_BUILD_VECTOR [[COPY]](s32), [[COPY1]](s32)		; CHECK-NEXT: [[BUILD_VECTOR:%[0-9]+]]:_(<2 x s32>) = G_BUILD_VECTOR [[COPY]](s32), [[COPY1]](s32)
; CHECK-NEXT: [[BITCAST:%[0-9]+]]:_(s64) = G_BITCAST [[BUILD_VECTOR]](<2 x s32>)		; CHECK-NEXT: [[BITCAST:%[0-9]+]]:_(s64) = G_BITCAST [[BUILD_VECTOR]](<2 x s32>)
; CHECK-NEXT: [[TRUNC:%[0-9]+]]:_(s16) = G_TRUNC [[BITCAST]](s64)		; CHECK-NEXT: [[TRUNC:%[0-9]+]]:_(s16) = G_TRUNC [[BITCAST]](s64)
; CHECK-NEXT: [[C:%[0-9]+]]:_(s16) = G_CONSTANT i16 42		; CHECK-NEXT: [[C:%[0-9]+]]:_(s16) = G_CONSTANT i16 42
; CHECK-NEXT: [[OR:%[0-9]+]]:_(s16) = G_OR [[C]], [[TRUNC]]		; CHECK-NEXT: [[OR:%[0-9]+]]:_(s16) = G_OR [[TRUNC]], [[C]]
; CHECK-NEXT: [[ZEXT:%[0-9]+]]:_(s32) = G_ZEXT [[OR]](s16)		; CHECK-NEXT: [[ZEXT:%[0-9]+]]:_(s32) = G_ZEXT [[OR]](s16)
; CHECK-NEXT: $vgpr0 = COPY [[ZEXT]](s32)		; CHECK-NEXT: $vgpr0 = COPY [[ZEXT]](s32)
%0:_(s32) = COPY $vgpr0		%0:_(s32) = COPY $vgpr0
%1:_(s32) = COPY $vgpr1		%1:_(s32) = COPY $vgpr1
%2:_(<2 x s32>) = G_BUILD_VECTOR %0, %1		%2:_(<2 x s32>) = G_BUILD_VECTOR %0, %1
%3:_(s64) = G_BITCAST %2		%3:_(s64) = G_BITCAST %2
%4:_(s16) = G_TRUNC %3		%4:_(s16) = G_TRUNC %3
%5:_(s16) = G_CONSTANT i16 42		%5:_(s16) = G_CONSTANT i16 42
▲ Show 20 Lines • Show All 51 Lines • Show Last 20 Lines

llvm/test/CodeGen/AMDGPU/GlobalISel/sdiv.i32.ll

Show First 20 Lines • Show All 48 Lines • ▼ Show 20 Lines
; CGP-NEXT: v_xor_b32_e32 v0, v0, v2		; CGP-NEXT: v_xor_b32_e32 v0, v0, v2
; CGP-NEXT: v_xor_b32_e32 v1, v1, v3		; CGP-NEXT: v_xor_b32_e32 v1, v1, v3
; CGP-NEXT: v_cvt_f32_u32_e32 v2, v1		; CGP-NEXT: v_cvt_f32_u32_e32 v2, v1
; CGP-NEXT: v_sub_i32_e32 v3, vcc, 0, v1		; CGP-NEXT: v_sub_i32_e32 v3, vcc, 0, v1
; CGP-NEXT: v_rcp_f32_e32 v2, v2		; CGP-NEXT: v_rcp_f32_e32 v2, v2
; CGP-NEXT: v_mul_f32_e32 v2, 0x4f7ffffe, v2		; CGP-NEXT: v_mul_f32_e32 v2, 0x4f7ffffe, v2
; CGP-NEXT: v_cvt_u32_f32_e32 v2, v2		; CGP-NEXT: v_cvt_u32_f32_e32 v2, v2
; CGP-NEXT: v_mul_lo_u32 v3, v3, v2		; CGP-NEXT: v_mul_lo_u32 v3, v3, v2
; CGP-NEXT: v_mul_lo_u32 v5, 0, v3
; CGP-NEXT: v_mul_hi_u32 v3, v2, v3		; CGP-NEXT: v_mul_hi_u32 v3, v2, v3
; CGP-NEXT: v_add_i32_e32 v3, vcc, v5, v3
; CGP-NEXT: v_add_i32_e32 v2, vcc, v2, v3		; CGP-NEXT: v_add_i32_e32 v2, vcc, v2, v3
; CGP-NEXT: v_mul_lo_u32 v3, 0, v2
; CGP-NEXT: v_mul_hi_u32 v2, v0, v2		; CGP-NEXT: v_mul_hi_u32 v2, v0, v2
; CGP-NEXT: v_add_i32_e32 v2, vcc, v3, v2
; CGP-NEXT: v_mul_lo_u32 v3, v2, v1		; CGP-NEXT: v_mul_lo_u32 v3, v2, v1
; CGP-NEXT: v_add_i32_e32 v5, vcc, 1, v2		; CGP-NEXT: v_add_i32_e32 v5, vcc, 1, v2
; CGP-NEXT: v_sub_i32_e32 v0, vcc, v0, v3		; CGP-NEXT: v_sub_i32_e32 v0, vcc, v0, v3
; CGP-NEXT: v_cmp_ge_u32_e32 vcc, v0, v1		; CGP-NEXT: v_cmp_ge_u32_e32 vcc, v0, v1
; CGP-NEXT: v_cndmask_b32_e32 v2, v2, v5, vcc		; CGP-NEXT: v_cndmask_b32_e32 v2, v2, v5, vcc
; CGP-NEXT: v_sub_i32_e64 v3, s[4:5], v0, v1		; CGP-NEXT: v_sub_i32_e64 v3, s[4:5], v0, v1
; CGP-NEXT: v_cndmask_b32_e32 v0, v0, v3, vcc		; CGP-NEXT: v_cndmask_b32_e32 v0, v0, v3, vcc
; CGP-NEXT: v_add_i32_e32 v3, vcc, 1, v2		; CGP-NEXT: v_add_i32_e32 v3, vcc, 1, v2
▲ Show 20 Lines • Show All 53 Lines • ▼ Show 20 Lines
; CGP-NEXT: s_xor_b32 s0, s0, s2		; CGP-NEXT: s_xor_b32 s0, s0, s2
; CGP-NEXT: s_xor_b32 s2, s1, s3		; CGP-NEXT: s_xor_b32 s2, s1, s3
; CGP-NEXT: v_cvt_f32_u32_e32 v0, s2		; CGP-NEXT: v_cvt_f32_u32_e32 v0, s2
; CGP-NEXT: s_sub_i32 s1, 0, s2		; CGP-NEXT: s_sub_i32 s1, 0, s2
; CGP-NEXT: v_rcp_f32_e32 v0, v0		; CGP-NEXT: v_rcp_f32_e32 v0, v0
; CGP-NEXT: v_mul_f32_e32 v0, 0x4f7ffffe, v0		; CGP-NEXT: v_mul_f32_e32 v0, 0x4f7ffffe, v0
; CGP-NEXT: v_cvt_u32_f32_e32 v0, v0		; CGP-NEXT: v_cvt_u32_f32_e32 v0, v0
; CGP-NEXT: v_mul_lo_u32 v1, s1, v0		; CGP-NEXT: v_mul_lo_u32 v1, s1, v0
; CGP-NEXT: v_mul_lo_u32 v2, 0, v1
; CGP-NEXT: v_mul_hi_u32 v1, v0, v1		; CGP-NEXT: v_mul_hi_u32 v1, v0, v1
; CGP-NEXT: v_add_i32_e32 v1, vcc, v2, v1
; CGP-NEXT: v_add_i32_e32 v0, vcc, v0, v1		; CGP-NEXT: v_add_i32_e32 v0, vcc, v0, v1
; CGP-NEXT: v_mul_lo_u32 v1, 0, v0
; CGP-NEXT: v_mul_hi_u32 v0, s0, v0		; CGP-NEXT: v_mul_hi_u32 v0, s0, v0
; CGP-NEXT: v_add_i32_e32 v0, vcc, v1, v0
; CGP-NEXT: v_mul_lo_u32 v1, v0, s2		; CGP-NEXT: v_mul_lo_u32 v1, v0, s2
; CGP-NEXT: v_add_i32_e32 v2, vcc, 1, v0		; CGP-NEXT: v_add_i32_e32 v2, vcc, 1, v0
; CGP-NEXT: v_sub_i32_e32 v1, vcc, s0, v1		; CGP-NEXT: v_sub_i32_e32 v1, vcc, s0, v1
; CGP-NEXT: v_cmp_le_u32_e32 vcc, s2, v1		; CGP-NEXT: v_cmp_le_u32_e32 vcc, s2, v1
; CGP-NEXT: v_cndmask_b32_e32 v0, v0, v2, vcc		; CGP-NEXT: v_cndmask_b32_e32 v0, v0, v2, vcc
; CGP-NEXT: v_subrev_i32_e64 v2, s[0:1], s2, v1		; CGP-NEXT: v_subrev_i32_e64 v2, s[0:1], s2, v1
; CGP-NEXT: v_cndmask_b32_e32 v1, v1, v2, vcc		; CGP-NEXT: v_cndmask_b32_e32 v1, v1, v2, vcc
; CGP-NEXT: v_add_i32_e32 v2, vcc, 1, v0		; CGP-NEXT: v_add_i32_e32 v2, vcc, 1, v0
▲ Show 20 Lines • Show All 94 Lines • ▼ Show 20 Lines
; CGP-NEXT: v_rcp_f32_e32 v4, v4		; CGP-NEXT: v_rcp_f32_e32 v4, v4
; CGP-NEXT: v_rcp_f32_e32 v6, v6		; CGP-NEXT: v_rcp_f32_e32 v6, v6
; CGP-NEXT: v_mul_f32_e32 v4, 0x4f7ffffe, v4		; CGP-NEXT: v_mul_f32_e32 v4, 0x4f7ffffe, v4
; CGP-NEXT: v_mul_f32_e32 v6, 0x4f7ffffe, v6		; CGP-NEXT: v_mul_f32_e32 v6, 0x4f7ffffe, v6
; CGP-NEXT: v_cvt_u32_f32_e32 v4, v4		; CGP-NEXT: v_cvt_u32_f32_e32 v4, v4
; CGP-NEXT: v_cvt_u32_f32_e32 v6, v6		; CGP-NEXT: v_cvt_u32_f32_e32 v6, v6
; CGP-NEXT: v_mul_lo_u32 v5, v5, v4		; CGP-NEXT: v_mul_lo_u32 v5, v5, v4
; CGP-NEXT: v_mul_lo_u32 v7, v7, v6		; CGP-NEXT: v_mul_lo_u32 v7, v7, v6
; CGP-NEXT: v_mul_lo_u32 v10, 0, v5
; CGP-NEXT: v_mul_hi_u32 v5, v4, v5		; CGP-NEXT: v_mul_hi_u32 v5, v4, v5
; CGP-NEXT: v_mul_lo_u32 v11, 0, v7
; CGP-NEXT: v_mul_hi_u32 v7, v6, v7		; CGP-NEXT: v_mul_hi_u32 v7, v6, v7
; CGP-NEXT: v_add_i32_e32 v5, vcc, v10, v5
; CGP-NEXT: v_add_i32_e32 v7, vcc, v11, v7
; CGP-NEXT: v_add_i32_e32 v4, vcc, v4, v5		; CGP-NEXT: v_add_i32_e32 v4, vcc, v4, v5
; CGP-NEXT: v_add_i32_e32 v5, vcc, v6, v7		; CGP-NEXT: v_add_i32_e32 v5, vcc, v6, v7
; CGP-NEXT: v_mul_lo_u32 v6, 0, v4
; CGP-NEXT: v_mul_hi_u32 v4, v0, v4		; CGP-NEXT: v_mul_hi_u32 v4, v0, v4
; CGP-NEXT: v_mul_lo_u32 v7, 0, v5
; CGP-NEXT: v_mul_hi_u32 v5, v1, v5		; CGP-NEXT: v_mul_hi_u32 v5, v1, v5
; CGP-NEXT: v_add_i32_e32 v4, vcc, v6, v4
; CGP-NEXT: v_add_i32_e32 v5, vcc, v7, v5
; CGP-NEXT: v_mul_lo_u32 v6, v4, v2		; CGP-NEXT: v_mul_lo_u32 v6, v4, v2
; CGP-NEXT: v_add_i32_e32 v7, vcc, 1, v4		; CGP-NEXT: v_add_i32_e32 v7, vcc, 1, v4
; CGP-NEXT: v_mul_lo_u32 v10, v5, v3		; CGP-NEXT: v_mul_lo_u32 v10, v5, v3
; CGP-NEXT: v_add_i32_e32 v11, vcc, 1, v5		; CGP-NEXT: v_add_i32_e32 v11, vcc, 1, v5
; CGP-NEXT: v_sub_i32_e32 v0, vcc, v0, v6		; CGP-NEXT: v_sub_i32_e32 v0, vcc, v0, v6
; CGP-NEXT: v_sub_i32_e32 v1, vcc, v1, v10		; CGP-NEXT: v_sub_i32_e32 v1, vcc, v1, v10
; CGP-NEXT: v_cmp_ge_u32_e32 vcc, v0, v2		; CGP-NEXT: v_cmp_ge_u32_e32 vcc, v0, v2
; CGP-NEXT: v_cndmask_b32_e32 v4, v4, v7, vcc		; CGP-NEXT: v_cndmask_b32_e32 v4, v4, v7, vcc
Show All 25 Lines
; CHECK-NEXT: s_movk_i32 s6, 0x1000		; CHECK-NEXT: s_movk_i32 s6, 0x1000
; CHECK-NEXT: v_ashrrev_i32_e32 v1, 31, v0		; CHECK-NEXT: v_ashrrev_i32_e32 v1, 31, v0
; CHECK-NEXT: v_rcp_iflag_f32_e32 v2, 0x45800000		; CHECK-NEXT: v_rcp_iflag_f32_e32 v2, 0x45800000
; CHECK-NEXT: v_mov_b32_e32 v3, 0xfffff000		; CHECK-NEXT: v_mov_b32_e32 v3, 0xfffff000
; CHECK-NEXT: v_add_i32_e32 v0, vcc, v0, v1		; CHECK-NEXT: v_add_i32_e32 v0, vcc, v0, v1
; CHECK-NEXT: v_mul_f32_e32 v2, 0x4f7ffffe, v2		; CHECK-NEXT: v_mul_f32_e32 v2, 0x4f7ffffe, v2
; CHECK-NEXT: v_xor_b32_e32 v0, v0, v1		; CHECK-NEXT: v_xor_b32_e32 v0, v0, v1
; CHECK-NEXT: v_cvt_u32_f32_e32 v2, v2		; CHECK-NEXT: v_cvt_u32_f32_e32 v2, v2
; CHECK-NEXT: v_mul_lo_u32 v3, v3, v2		; CHECK-NEXT: v_mul_lo_u32 v3, v2, v3
; CHECK-NEXT: v_mul_hi_u32 v3, v2, v3		; CHECK-NEXT: v_mul_hi_u32 v3, v2, v3
; CHECK-NEXT: v_add_i32_e32 v2, vcc, v2, v3		; CHECK-NEXT: v_add_i32_e32 v2, vcc, v2, v3
; CHECK-NEXT: v_mul_hi_u32 v2, v0, v2		; CHECK-NEXT: v_mul_hi_u32 v2, v0, v2
; CHECK-NEXT: v_lshlrev_b32_e32 v3, 12, v2		; CHECK-NEXT: v_lshlrev_b32_e32 v3, 12, v2
; CHECK-NEXT: v_add_i32_e32 v4, vcc, 1, v2		; CHECK-NEXT: v_add_i32_e32 v4, vcc, 1, v2
; CHECK-NEXT: v_sub_i32_e32 v0, vcc, v0, v3		; CHECK-NEXT: v_sub_i32_e32 v0, vcc, v0, v3
; CHECK-NEXT: v_cmp_le_u32_e64 s[4:5], s6, v0		; CHECK-NEXT: v_cmp_le_u32_e64 s[4:5], s6, v0
; CHECK-NEXT: v_cndmask_b32_e64 v2, v2, v4, s[4:5]		; CHECK-NEXT: v_cndmask_b32_e64 v2, v2, v4, s[4:5]
Show All 9 Lines	; CHECK-NEXT: s_setpc_b64 s[30:31]
ret i32 %result		ret i32 %result
}		}

define <2 x i32> @v_sdiv_v2i32_pow2k_denom(<2 x i32> %num) {		define <2 x i32> @v_sdiv_v2i32_pow2k_denom(<2 x i32> %num) {
; GISEL-LABEL: v_sdiv_v2i32_pow2k_denom:		; GISEL-LABEL: v_sdiv_v2i32_pow2k_denom:
; GISEL: ; %bb.0:		; GISEL: ; %bb.0:
; GISEL-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)		; GISEL-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
; GISEL-NEXT: v_ashrrev_i32_e32 v2, 31, v0		; GISEL-NEXT: v_ashrrev_i32_e32 v2, 31, v0
; GISEL-NEXT: s_add_i32 s8, 0x1000, 0		; GISEL-NEXT: s_add_i32 s8, 0, 0x1000
; GISEL-NEXT: v_ashrrev_i32_e32 v3, 31, v1		; GISEL-NEXT: v_ashrrev_i32_e32 v3, 31, v1
; GISEL-NEXT: v_add_i32_e32 v0, vcc, v0, v2		; GISEL-NEXT: v_add_i32_e32 v0, vcc, v0, v2
; GISEL-NEXT: v_cvt_f32_u32_e32 v4, s8		; GISEL-NEXT: v_cvt_f32_u32_e32 v4, s8
; GISEL-NEXT: s_sub_i32 s4, 0, s8		; GISEL-NEXT: s_sub_i32 s4, 0, s8
; GISEL-NEXT: v_add_i32_e32 v1, vcc, v1, v3		; GISEL-NEXT: v_add_i32_e32 v1, vcc, v1, v3
; GISEL-NEXT: v_xor_b32_e32 v0, v0, v2		; GISEL-NEXT: v_xor_b32_e32 v0, v0, v2
; GISEL-NEXT: v_rcp_iflag_f32_e32 v4, v4		; GISEL-NEXT: v_rcp_iflag_f32_e32 v4, v4
; GISEL-NEXT: v_xor_b32_e32 v1, v1, v3		; GISEL-NEXT: v_xor_b32_e32 v1, v1, v3
▲ Show 20 Lines • Show All 49 Lines • ▼ Show 20 Lines
; CGP-NEXT: v_add_i32_e32 v0, vcc, v0, v2		; CGP-NEXT: v_add_i32_e32 v0, vcc, v0, v2
; CGP-NEXT: v_mul_f32_e32 v3, 0x4f7ffffe, v3		; CGP-NEXT: v_mul_f32_e32 v3, 0x4f7ffffe, v3
; CGP-NEXT: v_add_i32_e32 v1, vcc, v1, v6		; CGP-NEXT: v_add_i32_e32 v1, vcc, v1, v6
; CGP-NEXT: v_mul_f32_e32 v7, 0x4f7ffffe, v7		; CGP-NEXT: v_mul_f32_e32 v7, 0x4f7ffffe, v7
; CGP-NEXT: v_xor_b32_e32 v0, v0, v2		; CGP-NEXT: v_xor_b32_e32 v0, v0, v2
; CGP-NEXT: v_cvt_u32_f32_e32 v3, v3		; CGP-NEXT: v_cvt_u32_f32_e32 v3, v3
; CGP-NEXT: v_xor_b32_e32 v1, v1, v6		; CGP-NEXT: v_xor_b32_e32 v1, v1, v6
; CGP-NEXT: v_cvt_u32_f32_e32 v7, v7		; CGP-NEXT: v_cvt_u32_f32_e32 v7, v7
; CGP-NEXT: v_mul_lo_u32 v8, s4, v3		; CGP-NEXT: v_mul_lo_u32 v8, v3, s4
; CGP-NEXT: v_mul_lo_u32 v4, v4, v7		; CGP-NEXT: v_mul_lo_u32 v4, v7, v4
; CGP-NEXT: v_mul_hi_u32 v8, v3, v8		; CGP-NEXT: v_mul_hi_u32 v8, v3, v8
; CGP-NEXT: v_mul_hi_u32 v4, v7, v4		; CGP-NEXT: v_mul_hi_u32 v4, v7, v4
; CGP-NEXT: v_add_i32_e32 v3, vcc, v3, v8		; CGP-NEXT: v_add_i32_e32 v3, vcc, v3, v8
; CGP-NEXT: v_add_i32_e32 v4, vcc, v7, v4		; CGP-NEXT: v_add_i32_e32 v4, vcc, v7, v4
; CGP-NEXT: v_mul_hi_u32 v3, v0, v3		; CGP-NEXT: v_mul_hi_u32 v3, v0, v3
; CGP-NEXT: v_mul_hi_u32 v4, v1, v4		; CGP-NEXT: v_mul_hi_u32 v4, v1, v4
; CGP-NEXT: v_lshlrev_b32_e32 v7, 12, v3		; CGP-NEXT: v_lshlrev_b32_e32 v7, 12, v3
; CGP-NEXT: v_add_i32_e32 v8, vcc, 1, v3		; CGP-NEXT: v_add_i32_e32 v8, vcc, 1, v3
Show All 31 Lines
; CHECK-NEXT: s_mov_b32 s6, 0x12d8fb		; CHECK-NEXT: s_mov_b32 s6, 0x12d8fb
; CHECK-NEXT: v_ashrrev_i32_e32 v1, 31, v0		; CHECK-NEXT: v_ashrrev_i32_e32 v1, 31, v0
; CHECK-NEXT: v_rcp_iflag_f32_e32 v2, 0x4996c7d8		; CHECK-NEXT: v_rcp_iflag_f32_e32 v2, 0x4996c7d8
; CHECK-NEXT: v_mov_b32_e32 v3, 0xffed2705		; CHECK-NEXT: v_mov_b32_e32 v3, 0xffed2705
; CHECK-NEXT: v_add_i32_e32 v0, vcc, v0, v1		; CHECK-NEXT: v_add_i32_e32 v0, vcc, v0, v1
; CHECK-NEXT: v_mul_f32_e32 v2, 0x4f7ffffe, v2		; CHECK-NEXT: v_mul_f32_e32 v2, 0x4f7ffffe, v2
; CHECK-NEXT: v_xor_b32_e32 v0, v0, v1		; CHECK-NEXT: v_xor_b32_e32 v0, v0, v1
; CHECK-NEXT: v_cvt_u32_f32_e32 v2, v2		; CHECK-NEXT: v_cvt_u32_f32_e32 v2, v2
; CHECK-NEXT: v_mul_lo_u32 v3, v3, v2		; CHECK-NEXT: v_mul_lo_u32 v3, v2, v3
; CHECK-NEXT: v_mul_hi_u32 v3, v2, v3		; CHECK-NEXT: v_mul_hi_u32 v3, v2, v3
; CHECK-NEXT: v_add_i32_e32 v2, vcc, v2, v3		; CHECK-NEXT: v_add_i32_e32 v2, vcc, v2, v3
; CHECK-NEXT: v_mul_hi_u32 v2, v0, v2		; CHECK-NEXT: v_mul_hi_u32 v2, v0, v2
; CHECK-NEXT: v_mul_lo_u32 v3, v2, s6		; CHECK-NEXT: v_mul_lo_u32 v3, v2, s6
; CHECK-NEXT: v_add_i32_e32 v4, vcc, 1, v2		; CHECK-NEXT: v_add_i32_e32 v4, vcc, 1, v2
; CHECK-NEXT: v_sub_i32_e32 v0, vcc, v0, v3		; CHECK-NEXT: v_sub_i32_e32 v0, vcc, v0, v3
; CHECK-NEXT: v_cmp_le_u32_e64 s[4:5], s6, v0		; CHECK-NEXT: v_cmp_le_u32_e64 s[4:5], s6, v0
; CHECK-NEXT: v_cndmask_b32_e64 v2, v2, v4, s[4:5]		; CHECK-NEXT: v_cndmask_b32_e64 v2, v2, v4, s[4:5]
Show All 9 Lines	; CHECK-NEXT: s_setpc_b64 s[30:31]
ret i32 %result		ret i32 %result
}		}

define <2 x i32> @v_sdiv_v2i32_oddk_denom(<2 x i32> %num) {		define <2 x i32> @v_sdiv_v2i32_oddk_denom(<2 x i32> %num) {
; GISEL-LABEL: v_sdiv_v2i32_oddk_denom:		; GISEL-LABEL: v_sdiv_v2i32_oddk_denom:
; GISEL: ; %bb.0:		; GISEL: ; %bb.0:
; GISEL-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)		; GISEL-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
; GISEL-NEXT: v_ashrrev_i32_e32 v2, 31, v0		; GISEL-NEXT: v_ashrrev_i32_e32 v2, 31, v0
; GISEL-NEXT: s_add_i32 s8, 0x12d8fb, 0		; GISEL-NEXT: s_add_i32 s8, 0, 0x12d8fb
; GISEL-NEXT: v_ashrrev_i32_e32 v3, 31, v1		; GISEL-NEXT: v_ashrrev_i32_e32 v3, 31, v1
; GISEL-NEXT: v_add_i32_e32 v0, vcc, v0, v2		; GISEL-NEXT: v_add_i32_e32 v0, vcc, v0, v2
; GISEL-NEXT: v_cvt_f32_u32_e32 v4, s8		; GISEL-NEXT: v_cvt_f32_u32_e32 v4, s8
; GISEL-NEXT: s_sub_i32 s4, 0, s8		; GISEL-NEXT: s_sub_i32 s4, 0, s8
; GISEL-NEXT: v_add_i32_e32 v1, vcc, v1, v3		; GISEL-NEXT: v_add_i32_e32 v1, vcc, v1, v3
; GISEL-NEXT: v_xor_b32_e32 v0, v0, v2		; GISEL-NEXT: v_xor_b32_e32 v0, v0, v2
; GISEL-NEXT: v_rcp_iflag_f32_e32 v4, v4		; GISEL-NEXT: v_rcp_iflag_f32_e32 v4, v4
; GISEL-NEXT: v_xor_b32_e32 v1, v1, v3		; GISEL-NEXT: v_xor_b32_e32 v1, v1, v3
▲ Show 20 Lines • Show All 49 Lines • ▼ Show 20 Lines
; CGP-NEXT: v_add_i32_e32 v0, vcc, v0, v2		; CGP-NEXT: v_add_i32_e32 v0, vcc, v0, v2
; CGP-NEXT: v_mul_f32_e32 v3, 0x4f7ffffe, v3		; CGP-NEXT: v_mul_f32_e32 v3, 0x4f7ffffe, v3
; CGP-NEXT: v_add_i32_e32 v1, vcc, v1, v6		; CGP-NEXT: v_add_i32_e32 v1, vcc, v1, v6
; CGP-NEXT: v_mul_f32_e32 v7, 0x4f7ffffe, v7		; CGP-NEXT: v_mul_f32_e32 v7, 0x4f7ffffe, v7
; CGP-NEXT: v_xor_b32_e32 v0, v0, v2		; CGP-NEXT: v_xor_b32_e32 v0, v0, v2
; CGP-NEXT: v_cvt_u32_f32_e32 v3, v3		; CGP-NEXT: v_cvt_u32_f32_e32 v3, v3
; CGP-NEXT: v_xor_b32_e32 v1, v1, v6		; CGP-NEXT: v_xor_b32_e32 v1, v1, v6
; CGP-NEXT: v_cvt_u32_f32_e32 v7, v7		; CGP-NEXT: v_cvt_u32_f32_e32 v7, v7
; CGP-NEXT: v_mul_lo_u32 v8, s4, v3		; CGP-NEXT: v_mul_lo_u32 v8, v3, s4
; CGP-NEXT: v_mul_lo_u32 v4, v4, v7		; CGP-NEXT: v_mul_lo_u32 v4, v7, v4
; CGP-NEXT: v_mul_hi_u32 v8, v3, v8		; CGP-NEXT: v_mul_hi_u32 v8, v3, v8
; CGP-NEXT: v_mul_hi_u32 v4, v7, v4		; CGP-NEXT: v_mul_hi_u32 v4, v7, v4
; CGP-NEXT: v_add_i32_e32 v3, vcc, v3, v8		; CGP-NEXT: v_add_i32_e32 v3, vcc, v3, v8
; CGP-NEXT: v_add_i32_e32 v4, vcc, v7, v4		; CGP-NEXT: v_add_i32_e32 v4, vcc, v7, v4
; CGP-NEXT: v_mul_hi_u32 v3, v0, v3		; CGP-NEXT: v_mul_hi_u32 v3, v0, v3
; CGP-NEXT: v_mul_hi_u32 v4, v1, v4		; CGP-NEXT: v_mul_hi_u32 v4, v1, v4
; CGP-NEXT: v_mul_lo_u32 v7, v3, s8		; CGP-NEXT: v_mul_lo_u32 v7, v3, s8
; CGP-NEXT: v_add_i32_e32 v8, vcc, 1, v3		; CGP-NEXT: v_add_i32_e32 v8, vcc, 1, v3
▲ Show 20 Lines • Show All 153 Lines • ▼ Show 20 Lines
; CGP-NEXT: v_rcp_f32_e32 v5, v5		; CGP-NEXT: v_rcp_f32_e32 v5, v5
; CGP-NEXT: v_rcp_f32_e32 v7, v7		; CGP-NEXT: v_rcp_f32_e32 v7, v7
; CGP-NEXT: v_mul_f32_e32 v5, 0x4f7ffffe, v5		; CGP-NEXT: v_mul_f32_e32 v5, 0x4f7ffffe, v5
; CGP-NEXT: v_mul_f32_e32 v7, 0x4f7ffffe, v7		; CGP-NEXT: v_mul_f32_e32 v7, 0x4f7ffffe, v7
; CGP-NEXT: v_cvt_u32_f32_e32 v5, v5		; CGP-NEXT: v_cvt_u32_f32_e32 v5, v5
; CGP-NEXT: v_cvt_u32_f32_e32 v7, v7		; CGP-NEXT: v_cvt_u32_f32_e32 v7, v7
; CGP-NEXT: v_mul_lo_u32 v6, v6, v5		; CGP-NEXT: v_mul_lo_u32 v6, v6, v5
; CGP-NEXT: v_mul_lo_u32 v9, v9, v7		; CGP-NEXT: v_mul_lo_u32 v9, v9, v7
; CGP-NEXT: v_mul_lo_u32 v10, 0, v6
; CGP-NEXT: v_mul_hi_u32 v6, v5, v6		; CGP-NEXT: v_mul_hi_u32 v6, v5, v6
; CGP-NEXT: v_mul_lo_u32 v11, 0, v9
; CGP-NEXT: v_mul_hi_u32 v9, v7, v9		; CGP-NEXT: v_mul_hi_u32 v9, v7, v9
; CGP-NEXT: v_add_i32_e32 v6, vcc, v10, v6
; CGP-NEXT: v_add_i32_e32 v9, vcc, v11, v9
; CGP-NEXT: v_add_i32_e32 v5, vcc, v5, v6		; CGP-NEXT: v_add_i32_e32 v5, vcc, v5, v6
; CGP-NEXT: v_add_i32_e32 v6, vcc, v7, v9		; CGP-NEXT: v_add_i32_e32 v6, vcc, v7, v9
; CGP-NEXT: v_mul_lo_u32 v7, 0, v5
; CGP-NEXT: v_mul_hi_u32 v5, v0, v5		; CGP-NEXT: v_mul_hi_u32 v5, v0, v5
; CGP-NEXT: v_mul_lo_u32 v9, 0, v6
; CGP-NEXT: v_mul_hi_u32 v6, v1, v6		; CGP-NEXT: v_mul_hi_u32 v6, v1, v6
; CGP-NEXT: v_add_i32_e32 v5, vcc, v7, v5
; CGP-NEXT: v_add_i32_e32 v6, vcc, v9, v6
; CGP-NEXT: v_mul_lo_u32 v7, v5, v2		; CGP-NEXT: v_mul_lo_u32 v7, v5, v2
; CGP-NEXT: v_add_i32_e32 v9, vcc, 1, v5		; CGP-NEXT: v_add_i32_e32 v9, vcc, 1, v5
; CGP-NEXT: v_mul_lo_u32 v10, v6, v3		; CGP-NEXT: v_mul_lo_u32 v10, v6, v3
; CGP-NEXT: v_add_i32_e32 v11, vcc, 1, v6		; CGP-NEXT: v_add_i32_e32 v11, vcc, 1, v6
; CGP-NEXT: v_sub_i32_e32 v0, vcc, v0, v7		; CGP-NEXT: v_sub_i32_e32 v0, vcc, v0, v7
; CGP-NEXT: v_sub_i32_e32 v1, vcc, v1, v10		; CGP-NEXT: v_sub_i32_e32 v1, vcc, v1, v10
; CGP-NEXT: v_cmp_ge_u32_e32 vcc, v0, v2		; CGP-NEXT: v_cmp_ge_u32_e32 vcc, v0, v2
; CGP-NEXT: v_cndmask_b32_e32 v5, v5, v9, vcc		; CGP-NEXT: v_cndmask_b32_e32 v5, v5, v9, vcc
▲ Show 20 Lines • Show All 61 Lines • ▼ Show 20 Lines
; CGP-NEXT: v_and_b32_e32 v0, 0xffffff, v0		; CGP-NEXT: v_and_b32_e32 v0, 0xffffff, v0
; CGP-NEXT: v_and_b32_e32 v1, 0xffffff, v1		; CGP-NEXT: v_and_b32_e32 v1, 0xffffff, v1
; CGP-NEXT: v_cvt_f32_u32_e32 v2, v1		; CGP-NEXT: v_cvt_f32_u32_e32 v2, v1
; CGP-NEXT: v_sub_i32_e32 v3, vcc, 0, v1		; CGP-NEXT: v_sub_i32_e32 v3, vcc, 0, v1
; CGP-NEXT: v_rcp_f32_e32 v2, v2		; CGP-NEXT: v_rcp_f32_e32 v2, v2
; CGP-NEXT: v_mul_f32_e32 v2, 0x4f7ffffe, v2		; CGP-NEXT: v_mul_f32_e32 v2, 0x4f7ffffe, v2
; CGP-NEXT: v_cvt_u32_f32_e32 v2, v2		; CGP-NEXT: v_cvt_u32_f32_e32 v2, v2
; CGP-NEXT: v_mul_lo_u32 v3, v3, v2		; CGP-NEXT: v_mul_lo_u32 v3, v3, v2
; CGP-NEXT: v_mul_lo_u32 v4, 0, v3
; CGP-NEXT: v_mul_hi_u32 v3, v2, v3		; CGP-NEXT: v_mul_hi_u32 v3, v2, v3
; CGP-NEXT: v_add_i32_e32 v3, vcc, v4, v3
; CGP-NEXT: v_add_i32_e32 v2, vcc, v2, v3		; CGP-NEXT: v_add_i32_e32 v2, vcc, v2, v3
; CGP-NEXT: v_mul_lo_u32 v3, 0, v2
; CGP-NEXT: v_mul_hi_u32 v2, v0, v2		; CGP-NEXT: v_mul_hi_u32 v2, v0, v2
; CGP-NEXT: v_add_i32_e32 v2, vcc, v3, v2
; CGP-NEXT: v_mul_lo_u32 v3, v2, v1		; CGP-NEXT: v_mul_lo_u32 v3, v2, v1
; CGP-NEXT: v_add_i32_e32 v4, vcc, 1, v2		; CGP-NEXT: v_add_i32_e32 v4, vcc, 1, v2
; CGP-NEXT: v_sub_i32_e32 v0, vcc, v0, v3		; CGP-NEXT: v_sub_i32_e32 v0, vcc, v0, v3
; CGP-NEXT: v_cmp_ge_u32_e32 vcc, v0, v1		; CGP-NEXT: v_cmp_ge_u32_e32 vcc, v0, v1
; CGP-NEXT: v_cndmask_b32_e32 v2, v2, v4, vcc		; CGP-NEXT: v_cndmask_b32_e32 v2, v2, v4, vcc
; CGP-NEXT: v_sub_i32_e64 v3, s[4:5], v0, v1		; CGP-NEXT: v_sub_i32_e64 v3, s[4:5], v0, v1
; CGP-NEXT: v_cndmask_b32_e32 v0, v0, v3, vcc		; CGP-NEXT: v_cndmask_b32_e32 v0, v0, v3, vcc
; CGP-NEXT: v_add_i32_e32 v3, vcc, 1, v2		; CGP-NEXT: v_add_i32_e32 v3, vcc, 1, v2
▲ Show 20 Lines • Show All 86 Lines • ▼ Show 20 Lines
; CGP-NEXT: v_rcp_f32_e32 v4, v4		; CGP-NEXT: v_rcp_f32_e32 v4, v4
; CGP-NEXT: v_rcp_f32_e32 v6, v6		; CGP-NEXT: v_rcp_f32_e32 v6, v6
; CGP-NEXT: v_mul_f32_e32 v4, 0x4f7ffffe, v4		; CGP-NEXT: v_mul_f32_e32 v4, 0x4f7ffffe, v4
; CGP-NEXT: v_mul_f32_e32 v6, 0x4f7ffffe, v6		; CGP-NEXT: v_mul_f32_e32 v6, 0x4f7ffffe, v6
; CGP-NEXT: v_cvt_u32_f32_e32 v4, v4		; CGP-NEXT: v_cvt_u32_f32_e32 v4, v4
; CGP-NEXT: v_cvt_u32_f32_e32 v6, v6		; CGP-NEXT: v_cvt_u32_f32_e32 v6, v6
; CGP-NEXT: v_mul_lo_u32 v5, v5, v4		; CGP-NEXT: v_mul_lo_u32 v5, v5, v4
; CGP-NEXT: v_mul_lo_u32 v7, v7, v6		; CGP-NEXT: v_mul_lo_u32 v7, v7, v6
; CGP-NEXT: v_mul_lo_u32 v8, 0, v5
; CGP-NEXT: v_mul_hi_u32 v5, v4, v5		; CGP-NEXT: v_mul_hi_u32 v5, v4, v5
; CGP-NEXT: v_mul_lo_u32 v9, 0, v7
; CGP-NEXT: v_mul_hi_u32 v7, v6, v7		; CGP-NEXT: v_mul_hi_u32 v7, v6, v7
; CGP-NEXT: v_add_i32_e32 v5, vcc, v8, v5
; CGP-NEXT: v_add_i32_e32 v7, vcc, v9, v7
; CGP-NEXT: v_add_i32_e32 v4, vcc, v4, v5		; CGP-NEXT: v_add_i32_e32 v4, vcc, v4, v5
; CGP-NEXT: v_add_i32_e32 v5, vcc, v6, v7		; CGP-NEXT: v_add_i32_e32 v5, vcc, v6, v7
; CGP-NEXT: v_mul_lo_u32 v6, 0, v4
; CGP-NEXT: v_mul_hi_u32 v4, v0, v4		; CGP-NEXT: v_mul_hi_u32 v4, v0, v4
; CGP-NEXT: v_mul_lo_u32 v7, 0, v5
; CGP-NEXT: v_mul_hi_u32 v5, v1, v5		; CGP-NEXT: v_mul_hi_u32 v5, v1, v5
; CGP-NEXT: v_add_i32_e32 v4, vcc, v6, v4
; CGP-NEXT: v_add_i32_e32 v5, vcc, v7, v5
; CGP-NEXT: v_mul_lo_u32 v6, v4, v2		; CGP-NEXT: v_mul_lo_u32 v6, v4, v2
; CGP-NEXT: v_add_i32_e32 v7, vcc, 1, v4		; CGP-NEXT: v_add_i32_e32 v7, vcc, 1, v4
; CGP-NEXT: v_mul_lo_u32 v8, v5, v3		; CGP-NEXT: v_mul_lo_u32 v8, v5, v3
; CGP-NEXT: v_add_i32_e32 v9, vcc, 1, v5		; CGP-NEXT: v_add_i32_e32 v9, vcc, 1, v5
; CGP-NEXT: v_sub_i32_e32 v0, vcc, v0, v6		; CGP-NEXT: v_sub_i32_e32 v0, vcc, v0, v6
; CGP-NEXT: v_sub_i32_e32 v1, vcc, v1, v8		; CGP-NEXT: v_sub_i32_e32 v1, vcc, v1, v8
; CGP-NEXT: v_cmp_ge_u32_e32 vcc, v0, v2		; CGP-NEXT: v_cmp_ge_u32_e32 vcc, v0, v2
; CGP-NEXT: v_cndmask_b32_e32 v4, v4, v7, vcc		; CGP-NEXT: v_cndmask_b32_e32 v4, v4, v7, vcc
Show All 18 Lines

llvm/test/CodeGen/AMDGPU/GlobalISel/srem.i32.ll

	Show First 20 Lines • Show All 44 Lines • ▼ Show 20 Lines
	; CGP-NEXT: v_xor_b32_e32 v0, v0, v2			; CGP-NEXT: v_xor_b32_e32 v0, v0, v2
	; CGP-NEXT: v_xor_b32_e32 v1, v1, v3			; CGP-NEXT: v_xor_b32_e32 v1, v1, v3
	; CGP-NEXT: v_cvt_f32_u32_e32 v3, v1			; CGP-NEXT: v_cvt_f32_u32_e32 v3, v1
	; CGP-NEXT: v_sub_i32_e32 v4, vcc, 0, v1			; CGP-NEXT: v_sub_i32_e32 v4, vcc, 0, v1
	; CGP-NEXT: v_rcp_f32_e32 v3, v3			; CGP-NEXT: v_rcp_f32_e32 v3, v3
	; CGP-NEXT: v_mul_f32_e32 v3, 0x4f7ffffe, v3			; CGP-NEXT: v_mul_f32_e32 v3, 0x4f7ffffe, v3
	; CGP-NEXT: v_cvt_u32_f32_e32 v3, v3			; CGP-NEXT: v_cvt_u32_f32_e32 v3, v3
	; CGP-NEXT: v_mul_lo_u32 v4, v4, v3			; CGP-NEXT: v_mul_lo_u32 v4, v4, v3
	; CGP-NEXT: v_mul_lo_u32 v5, 0, v4
	; CGP-NEXT: v_mul_hi_u32 v4, v3, v4			; CGP-NEXT: v_mul_hi_u32 v4, v3, v4
	; CGP-NEXT: v_add_i32_e32 v4, vcc, v5, v4
	; CGP-NEXT: v_add_i32_e32 v3, vcc, v3, v4			; CGP-NEXT: v_add_i32_e32 v3, vcc, v3, v4
	; CGP-NEXT: v_mul_lo_u32 v4, 0, v3
	; CGP-NEXT: v_mul_hi_u32 v3, v0, v3			; CGP-NEXT: v_mul_hi_u32 v3, v0, v3
	; CGP-NEXT: v_add_i32_e32 v3, vcc, v4, v3
	; CGP-NEXT: v_mul_lo_u32 v3, v3, v1			; CGP-NEXT: v_mul_lo_u32 v3, v3, v1
	; CGP-NEXT: v_sub_i32_e32 v0, vcc, v0, v3			; CGP-NEXT: v_sub_i32_e32 v0, vcc, v0, v3
	; CGP-NEXT: v_sub_i32_e32 v3, vcc, v0, v1			; CGP-NEXT: v_sub_i32_e32 v3, vcc, v0, v1
	; CGP-NEXT: v_cmp_ge_u32_e32 vcc, v0, v1			; CGP-NEXT: v_cmp_ge_u32_e32 vcc, v0, v1
	; CGP-NEXT: v_cndmask_b32_e32 v0, v0, v3, vcc			; CGP-NEXT: v_cndmask_b32_e32 v0, v0, v3, vcc
	; CGP-NEXT: v_sub_i32_e32 v3, vcc, v0, v1			; CGP-NEXT: v_sub_i32_e32 v3, vcc, v0, v1
	; CGP-NEXT: v_cmp_ge_u32_e32 vcc, v0, v1			; CGP-NEXT: v_cmp_ge_u32_e32 vcc, v0, v1
	; CGP-NEXT: v_cndmask_b32_e32 v0, v0, v3, vcc			; CGP-NEXT: v_cndmask_b32_e32 v0, v0, v3, vcc
	▲ Show 20 Lines • Show All 47 Lines • ▼ Show 20 Lines
	; CGP-NEXT: s_xor_b32 s0, s0, s2			; CGP-NEXT: s_xor_b32 s0, s0, s2
	; CGP-NEXT: s_xor_b32 s1, s1, s3			; CGP-NEXT: s_xor_b32 s1, s1, s3
	; CGP-NEXT: v_cvt_f32_u32_e32 v0, s1			; CGP-NEXT: v_cvt_f32_u32_e32 v0, s1
	; CGP-NEXT: s_sub_i32 s3, 0, s1			; CGP-NEXT: s_sub_i32 s3, 0, s1
	; CGP-NEXT: v_rcp_f32_e32 v0, v0			; CGP-NEXT: v_rcp_f32_e32 v0, v0
	; CGP-NEXT: v_mul_f32_e32 v0, 0x4f7ffffe, v0			; CGP-NEXT: v_mul_f32_e32 v0, 0x4f7ffffe, v0
	; CGP-NEXT: v_cvt_u32_f32_e32 v0, v0			; CGP-NEXT: v_cvt_u32_f32_e32 v0, v0
	; CGP-NEXT: v_mul_lo_u32 v1, s3, v0			; CGP-NEXT: v_mul_lo_u32 v1, s3, v0
	; CGP-NEXT: v_mul_lo_u32 v2, 0, v1
	; CGP-NEXT: v_mul_hi_u32 v1, v0, v1			; CGP-NEXT: v_mul_hi_u32 v1, v0, v1
	; CGP-NEXT: v_add_i32_e32 v1, vcc, v2, v1
	; CGP-NEXT: v_add_i32_e32 v0, vcc, v0, v1			; CGP-NEXT: v_add_i32_e32 v0, vcc, v0, v1
	; CGP-NEXT: v_mul_lo_u32 v1, 0, v0
	; CGP-NEXT: v_mul_hi_u32 v0, s0, v0			; CGP-NEXT: v_mul_hi_u32 v0, s0, v0
	; CGP-NEXT: v_add_i32_e32 v0, vcc, v1, v0
	; CGP-NEXT: v_mul_lo_u32 v0, v0, s1			; CGP-NEXT: v_mul_lo_u32 v0, v0, s1
	; CGP-NEXT: v_sub_i32_e32 v0, vcc, s0, v0			; CGP-NEXT: v_sub_i32_e32 v0, vcc, s0, v0
	; CGP-NEXT: v_subrev_i32_e32 v1, vcc, s1, v0			; CGP-NEXT: v_subrev_i32_e32 v1, vcc, s1, v0
	; CGP-NEXT: v_cmp_le_u32_e32 vcc, s1, v0			; CGP-NEXT: v_cmp_le_u32_e32 vcc, s1, v0
	; CGP-NEXT: v_cndmask_b32_e32 v0, v0, v1, vcc			; CGP-NEXT: v_cndmask_b32_e32 v0, v0, v1, vcc
	; CGP-NEXT: v_subrev_i32_e32 v1, vcc, s1, v0			; CGP-NEXT: v_subrev_i32_e32 v1, vcc, s1, v0
	; CGP-NEXT: v_cmp_le_u32_e32 vcc, s1, v0			; CGP-NEXT: v_cmp_le_u32_e32 vcc, s1, v0
	; CGP-NEXT: v_cndmask_b32_e32 v0, v0, v1, vcc			; CGP-NEXT: v_cndmask_b32_e32 v0, v0, v1, vcc
	▲ Show 20 Lines • Show All 84 Lines • ▼ Show 20 Lines
	; CGP-NEXT: v_rcp_f32_e32 v5, v5			; CGP-NEXT: v_rcp_f32_e32 v5, v5
	; CGP-NEXT: v_rcp_f32_e32 v8, v8			; CGP-NEXT: v_rcp_f32_e32 v8, v8
	; CGP-NEXT: v_mul_f32_e32 v5, 0x4f7ffffe, v5			; CGP-NEXT: v_mul_f32_e32 v5, 0x4f7ffffe, v5
	; CGP-NEXT: v_mul_f32_e32 v8, 0x4f7ffffe, v8			; CGP-NEXT: v_mul_f32_e32 v8, 0x4f7ffffe, v8
	; CGP-NEXT: v_cvt_u32_f32_e32 v5, v5			; CGP-NEXT: v_cvt_u32_f32_e32 v5, v5
	; CGP-NEXT: v_cvt_u32_f32_e32 v8, v8			; CGP-NEXT: v_cvt_u32_f32_e32 v8, v8
	; CGP-NEXT: v_mul_lo_u32 v7, v7, v5			; CGP-NEXT: v_mul_lo_u32 v7, v7, v5
	; CGP-NEXT: v_mul_lo_u32 v9, v9, v8			; CGP-NEXT: v_mul_lo_u32 v9, v9, v8
	; CGP-NEXT: v_mul_lo_u32 v10, 0, v7
	; CGP-NEXT: v_mul_hi_u32 v7, v5, v7			; CGP-NEXT: v_mul_hi_u32 v7, v5, v7
	; CGP-NEXT: v_mul_lo_u32 v11, 0, v9
	; CGP-NEXT: v_mul_hi_u32 v9, v8, v9			; CGP-NEXT: v_mul_hi_u32 v9, v8, v9
	; CGP-NEXT: v_add_i32_e32 v7, vcc, v10, v7
	; CGP-NEXT: v_add_i32_e32 v9, vcc, v11, v9
	; CGP-NEXT: v_add_i32_e32 v5, vcc, v5, v7			; CGP-NEXT: v_add_i32_e32 v5, vcc, v5, v7
	; CGP-NEXT: v_add_i32_e32 v7, vcc, v8, v9			; CGP-NEXT: v_add_i32_e32 v7, vcc, v8, v9
	; CGP-NEXT: v_mul_lo_u32 v8, 0, v5
	; CGP-NEXT: v_mul_hi_u32 v5, v0, v5			; CGP-NEXT: v_mul_hi_u32 v5, v0, v5
	; CGP-NEXT: v_mul_lo_u32 v9, 0, v7
	; CGP-NEXT: v_mul_hi_u32 v7, v1, v7			; CGP-NEXT: v_mul_hi_u32 v7, v1, v7
	; CGP-NEXT: v_add_i32_e32 v5, vcc, v8, v5
	; CGP-NEXT: v_add_i32_e32 v7, vcc, v9, v7
	; CGP-NEXT: v_mul_lo_u32 v5, v5, v2			; CGP-NEXT: v_mul_lo_u32 v5, v5, v2
	; CGP-NEXT: v_mul_lo_u32 v7, v7, v3			; CGP-NEXT: v_mul_lo_u32 v7, v7, v3
	; CGP-NEXT: v_sub_i32_e32 v0, vcc, v0, v5			; CGP-NEXT: v_sub_i32_e32 v0, vcc, v0, v5
	; CGP-NEXT: v_sub_i32_e32 v1, vcc, v1, v7			; CGP-NEXT: v_sub_i32_e32 v1, vcc, v1, v7
	; CGP-NEXT: v_sub_i32_e32 v5, vcc, v0, v2			; CGP-NEXT: v_sub_i32_e32 v5, vcc, v0, v2
	; CGP-NEXT: v_sub_i32_e32 v7, vcc, v1, v3			; CGP-NEXT: v_sub_i32_e32 v7, vcc, v1, v3
	; CGP-NEXT: v_cmp_ge_u32_e32 vcc, v0, v2			; CGP-NEXT: v_cmp_ge_u32_e32 vcc, v0, v2
	; CGP-NEXT: v_cndmask_b32_e32 v0, v0, v5, vcc			; CGP-NEXT: v_cndmask_b32_e32 v0, v0, v5, vcc
	Show All 21 Lines
	; CHECK-NEXT: s_movk_i32 s4, 0x1000			; CHECK-NEXT: s_movk_i32 s4, 0x1000
	; CHECK-NEXT: v_ashrrev_i32_e32 v1, 31, v0			; CHECK-NEXT: v_ashrrev_i32_e32 v1, 31, v0
	; CHECK-NEXT: v_rcp_iflag_f32_e32 v2, 0x45800000			; CHECK-NEXT: v_rcp_iflag_f32_e32 v2, 0x45800000
	; CHECK-NEXT: v_mov_b32_e32 v3, 0xfffff000			; CHECK-NEXT: v_mov_b32_e32 v3, 0xfffff000
	; CHECK-NEXT: v_add_i32_e32 v0, vcc, v0, v1			; CHECK-NEXT: v_add_i32_e32 v0, vcc, v0, v1
	; CHECK-NEXT: v_mul_f32_e32 v2, 0x4f7ffffe, v2			; CHECK-NEXT: v_mul_f32_e32 v2, 0x4f7ffffe, v2
	; CHECK-NEXT: v_xor_b32_e32 v0, v0, v1			; CHECK-NEXT: v_xor_b32_e32 v0, v0, v1
	; CHECK-NEXT: v_cvt_u32_f32_e32 v2, v2			; CHECK-NEXT: v_cvt_u32_f32_e32 v2, v2
	; CHECK-NEXT: v_mul_lo_u32 v3, v3, v2			; CHECK-NEXT: v_mul_lo_u32 v3, v2, v3
	; CHECK-NEXT: v_mul_hi_u32 v3, v2, v3			; CHECK-NEXT: v_mul_hi_u32 v3, v2, v3
	; CHECK-NEXT: v_add_i32_e32 v2, vcc, v2, v3			; CHECK-NEXT: v_add_i32_e32 v2, vcc, v2, v3
	; CHECK-NEXT: v_mul_hi_u32 v2, v0, v2			; CHECK-NEXT: v_mul_hi_u32 v2, v0, v2
	; CHECK-NEXT: v_lshlrev_b32_e32 v2, 12, v2			; CHECK-NEXT: v_lshlrev_b32_e32 v2, 12, v2
	; CHECK-NEXT: v_sub_i32_e32 v0, vcc, v0, v2			; CHECK-NEXT: v_sub_i32_e32 v0, vcc, v0, v2
	; CHECK-NEXT: v_subrev_i32_e32 v2, vcc, s4, v0			; CHECK-NEXT: v_subrev_i32_e32 v2, vcc, s4, v0
	; CHECK-NEXT: v_cmp_le_u32_e32 vcc, s4, v0			; CHECK-NEXT: v_cmp_le_u32_e32 vcc, s4, v0
	; CHECK-NEXT: v_cndmask_b32_e32 v0, v0, v2, vcc			; CHECK-NEXT: v_cndmask_b32_e32 v0, v0, v2, vcc
	; CHECK-NEXT: v_subrev_i32_e32 v2, vcc, s4, v0			; CHECK-NEXT: v_subrev_i32_e32 v2, vcc, s4, v0
	; CHECK-NEXT: v_cmp_le_u32_e32 vcc, s4, v0			; CHECK-NEXT: v_cmp_le_u32_e32 vcc, s4, v0
	; CHECK-NEXT: v_cndmask_b32_e32 v0, v0, v2, vcc			; CHECK-NEXT: v_cndmask_b32_e32 v0, v0, v2, vcc
	; CHECK-NEXT: v_xor_b32_e32 v0, v0, v1			; CHECK-NEXT: v_xor_b32_e32 v0, v0, v1
	; CHECK-NEXT: v_sub_i32_e32 v0, vcc, v0, v1			; CHECK-NEXT: v_sub_i32_e32 v0, vcc, v0, v1
	; CHECK-NEXT: s_setpc_b64 s[30:31]			; CHECK-NEXT: s_setpc_b64 s[30:31]
	%result = srem i32 %num, 4096			%result = srem i32 %num, 4096
	ret i32 %result			ret i32 %result
	}			}

	define <2 x i32> @v_srem_v2i32_pow2k_denom(<2 x i32> %num) {			define <2 x i32> @v_srem_v2i32_pow2k_denom(<2 x i32> %num) {
	; GISEL-LABEL: v_srem_v2i32_pow2k_denom:			; GISEL-LABEL: v_srem_v2i32_pow2k_denom:
	; GISEL: ; %bb.0:			; GISEL: ; %bb.0:
	; GISEL-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)			; GISEL-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
	; GISEL-NEXT: v_ashrrev_i32_e32 v2, 31, v0			; GISEL-NEXT: v_ashrrev_i32_e32 v2, 31, v0
	; GISEL-NEXT: s_add_i32 s4, 0x1000, 0			; GISEL-NEXT: s_add_i32 s4, 0, 0x1000
	; GISEL-NEXT: v_ashrrev_i32_e32 v3, 31, v1			; GISEL-NEXT: v_ashrrev_i32_e32 v3, 31, v1
	; GISEL-NEXT: v_add_i32_e32 v0, vcc, v0, v2			; GISEL-NEXT: v_add_i32_e32 v0, vcc, v0, v2
	; GISEL-NEXT: v_cvt_f32_u32_e32 v4, s4			; GISEL-NEXT: v_cvt_f32_u32_e32 v4, s4
	; GISEL-NEXT: s_sub_i32 s5, 0, s4			; GISEL-NEXT: s_sub_i32 s5, 0, s4
	; GISEL-NEXT: v_add_i32_e32 v1, vcc, v1, v3			; GISEL-NEXT: v_add_i32_e32 v1, vcc, v1, v3
	; GISEL-NEXT: v_xor_b32_e32 v0, v0, v2			; GISEL-NEXT: v_xor_b32_e32 v0, v0, v2
	; GISEL-NEXT: v_rcp_iflag_f32_e32 v4, v4			; GISEL-NEXT: v_rcp_iflag_f32_e32 v4, v4
	; GISEL-NEXT: v_xor_b32_e32 v1, v1, v3			; GISEL-NEXT: v_xor_b32_e32 v1, v1, v3
	▲ Show 20 Lines • Show All 45 Lines • ▼ Show 20 Lines
	; CGP-NEXT: v_add_i32_e32 v0, vcc, v0, v2			; CGP-NEXT: v_add_i32_e32 v0, vcc, v0, v2
	; CGP-NEXT: v_mul_f32_e32 v3, 0x4f7ffffe, v3			; CGP-NEXT: v_mul_f32_e32 v3, 0x4f7ffffe, v3
	; CGP-NEXT: v_add_i32_e32 v1, vcc, v1, v6			; CGP-NEXT: v_add_i32_e32 v1, vcc, v1, v6
	; CGP-NEXT: v_mul_f32_e32 v7, 0x4f7ffffe, v7			; CGP-NEXT: v_mul_f32_e32 v7, 0x4f7ffffe, v7
	; CGP-NEXT: v_xor_b32_e32 v0, v0, v2			; CGP-NEXT: v_xor_b32_e32 v0, v0, v2
	; CGP-NEXT: v_cvt_u32_f32_e32 v3, v3			; CGP-NEXT: v_cvt_u32_f32_e32 v3, v3
	; CGP-NEXT: v_xor_b32_e32 v1, v1, v6			; CGP-NEXT: v_xor_b32_e32 v1, v1, v6
	; CGP-NEXT: v_cvt_u32_f32_e32 v7, v7			; CGP-NEXT: v_cvt_u32_f32_e32 v7, v7
	; CGP-NEXT: v_mul_lo_u32 v8, s5, v3			; CGP-NEXT: v_mul_lo_u32 v8, v3, s5
	; CGP-NEXT: v_mul_lo_u32 v4, v4, v7			; CGP-NEXT: v_mul_lo_u32 v4, v7, v4
	; CGP-NEXT: v_mul_hi_u32 v8, v3, v8			; CGP-NEXT: v_mul_hi_u32 v8, v3, v8
	; CGP-NEXT: v_mul_hi_u32 v4, v7, v4			; CGP-NEXT: v_mul_hi_u32 v4, v7, v4
	; CGP-NEXT: v_add_i32_e32 v3, vcc, v3, v8			; CGP-NEXT: v_add_i32_e32 v3, vcc, v3, v8
	; CGP-NEXT: v_add_i32_e32 v4, vcc, v7, v4			; CGP-NEXT: v_add_i32_e32 v4, vcc, v7, v4
	; CGP-NEXT: v_mul_hi_u32 v3, v0, v3			; CGP-NEXT: v_mul_hi_u32 v3, v0, v3
	; CGP-NEXT: v_mul_hi_u32 v4, v1, v4			; CGP-NEXT: v_mul_hi_u32 v4, v1, v4
	; CGP-NEXT: v_lshlrev_b32_e32 v3, 12, v3			; CGP-NEXT: v_lshlrev_b32_e32 v3, 12, v3
	; CGP-NEXT: v_lshlrev_b32_e32 v4, 12, v4			; CGP-NEXT: v_lshlrev_b32_e32 v4, 12, v4
	Show All 27 Lines
	; CHECK-NEXT: s_mov_b32 s4, 0x12d8fb			; CHECK-NEXT: s_mov_b32 s4, 0x12d8fb
	; CHECK-NEXT: v_ashrrev_i32_e32 v1, 31, v0			; CHECK-NEXT: v_ashrrev_i32_e32 v1, 31, v0
	; CHECK-NEXT: v_rcp_iflag_f32_e32 v2, 0x4996c7d8			; CHECK-NEXT: v_rcp_iflag_f32_e32 v2, 0x4996c7d8
	; CHECK-NEXT: v_mov_b32_e32 v3, 0xffed2705			; CHECK-NEXT: v_mov_b32_e32 v3, 0xffed2705
	; CHECK-NEXT: v_add_i32_e32 v0, vcc, v0, v1			; CHECK-NEXT: v_add_i32_e32 v0, vcc, v0, v1
	; CHECK-NEXT: v_mul_f32_e32 v2, 0x4f7ffffe, v2			; CHECK-NEXT: v_mul_f32_e32 v2, 0x4f7ffffe, v2
	; CHECK-NEXT: v_xor_b32_e32 v0, v0, v1			; CHECK-NEXT: v_xor_b32_e32 v0, v0, v1
	; CHECK-NEXT: v_cvt_u32_f32_e32 v2, v2			; CHECK-NEXT: v_cvt_u32_f32_e32 v2, v2
	; CHECK-NEXT: v_mul_lo_u32 v3, v3, v2			; CHECK-NEXT: v_mul_lo_u32 v3, v2, v3
	; CHECK-NEXT: v_mul_hi_u32 v3, v2, v3			; CHECK-NEXT: v_mul_hi_u32 v3, v2, v3
	; CHECK-NEXT: v_add_i32_e32 v2, vcc, v2, v3			; CHECK-NEXT: v_add_i32_e32 v2, vcc, v2, v3
	; CHECK-NEXT: v_mul_hi_u32 v2, v0, v2			; CHECK-NEXT: v_mul_hi_u32 v2, v0, v2
	; CHECK-NEXT: v_mul_lo_u32 v2, v2, s4			; CHECK-NEXT: v_mul_lo_u32 v2, v2, s4
	; CHECK-NEXT: v_sub_i32_e32 v0, vcc, v0, v2			; CHECK-NEXT: v_sub_i32_e32 v0, vcc, v0, v2
	; CHECK-NEXT: v_subrev_i32_e32 v2, vcc, s4, v0			; CHECK-NEXT: v_subrev_i32_e32 v2, vcc, s4, v0
	; CHECK-NEXT: v_cmp_le_u32_e32 vcc, s4, v0			; CHECK-NEXT: v_cmp_le_u32_e32 vcc, s4, v0
	; CHECK-NEXT: v_cndmask_b32_e32 v0, v0, v2, vcc			; CHECK-NEXT: v_cndmask_b32_e32 v0, v0, v2, vcc
	; CHECK-NEXT: v_subrev_i32_e32 v2, vcc, s4, v0			; CHECK-NEXT: v_subrev_i32_e32 v2, vcc, s4, v0
	; CHECK-NEXT: v_cmp_le_u32_e32 vcc, s4, v0			; CHECK-NEXT: v_cmp_le_u32_e32 vcc, s4, v0
	; CHECK-NEXT: v_cndmask_b32_e32 v0, v0, v2, vcc			; CHECK-NEXT: v_cndmask_b32_e32 v0, v0, v2, vcc
	; CHECK-NEXT: v_xor_b32_e32 v0, v0, v1			; CHECK-NEXT: v_xor_b32_e32 v0, v0, v1
	; CHECK-NEXT: v_sub_i32_e32 v0, vcc, v0, v1			; CHECK-NEXT: v_sub_i32_e32 v0, vcc, v0, v1
	; CHECK-NEXT: s_setpc_b64 s[30:31]			; CHECK-NEXT: s_setpc_b64 s[30:31]
	%result = srem i32 %num, 1235195			%result = srem i32 %num, 1235195
	ret i32 %result			ret i32 %result
	}			}

	define <2 x i32> @v_srem_v2i32_oddk_denom(<2 x i32> %num) {			define <2 x i32> @v_srem_v2i32_oddk_denom(<2 x i32> %num) {
	; GISEL-LABEL: v_srem_v2i32_oddk_denom:			; GISEL-LABEL: v_srem_v2i32_oddk_denom:
	; GISEL: ; %bb.0:			; GISEL: ; %bb.0:
	; GISEL-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)			; GISEL-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
	; GISEL-NEXT: v_ashrrev_i32_e32 v2, 31, v0			; GISEL-NEXT: v_ashrrev_i32_e32 v2, 31, v0
	; GISEL-NEXT: s_add_i32 s4, 0x12d8fb, 0			; GISEL-NEXT: s_add_i32 s4, 0, 0x12d8fb
	; GISEL-NEXT: v_ashrrev_i32_e32 v3, 31, v1			; GISEL-NEXT: v_ashrrev_i32_e32 v3, 31, v1
	; GISEL-NEXT: v_add_i32_e32 v0, vcc, v0, v2			; GISEL-NEXT: v_add_i32_e32 v0, vcc, v0, v2
	; GISEL-NEXT: v_cvt_f32_u32_e32 v4, s4			; GISEL-NEXT: v_cvt_f32_u32_e32 v4, s4
	; GISEL-NEXT: s_sub_i32 s5, 0, s4			; GISEL-NEXT: s_sub_i32 s5, 0, s4
	; GISEL-NEXT: v_add_i32_e32 v1, vcc, v1, v3			; GISEL-NEXT: v_add_i32_e32 v1, vcc, v1, v3
	; GISEL-NEXT: v_xor_b32_e32 v0, v0, v2			; GISEL-NEXT: v_xor_b32_e32 v0, v0, v2
	; GISEL-NEXT: v_rcp_iflag_f32_e32 v4, v4			; GISEL-NEXT: v_rcp_iflag_f32_e32 v4, v4
	; GISEL-NEXT: v_xor_b32_e32 v1, v1, v3			; GISEL-NEXT: v_xor_b32_e32 v1, v1, v3
	▲ Show 20 Lines • Show All 45 Lines • ▼ Show 20 Lines
	; CGP-NEXT: v_add_i32_e32 v0, vcc, v0, v2			; CGP-NEXT: v_add_i32_e32 v0, vcc, v0, v2
	; CGP-NEXT: v_mul_f32_e32 v3, 0x4f7ffffe, v3			; CGP-NEXT: v_mul_f32_e32 v3, 0x4f7ffffe, v3
	; CGP-NEXT: v_add_i32_e32 v1, vcc, v1, v6			; CGP-NEXT: v_add_i32_e32 v1, vcc, v1, v6
	; CGP-NEXT: v_mul_f32_e32 v7, 0x4f7ffffe, v7			; CGP-NEXT: v_mul_f32_e32 v7, 0x4f7ffffe, v7
	; CGP-NEXT: v_xor_b32_e32 v0, v0, v2			; CGP-NEXT: v_xor_b32_e32 v0, v0, v2
	; CGP-NEXT: v_cvt_u32_f32_e32 v3, v3			; CGP-NEXT: v_cvt_u32_f32_e32 v3, v3
	; CGP-NEXT: v_xor_b32_e32 v1, v1, v6			; CGP-NEXT: v_xor_b32_e32 v1, v1, v6
	; CGP-NEXT: v_cvt_u32_f32_e32 v7, v7			; CGP-NEXT: v_cvt_u32_f32_e32 v7, v7
	; CGP-NEXT: v_mul_lo_u32 v8, s5, v3			; CGP-NEXT: v_mul_lo_u32 v8, v3, s5
	; CGP-NEXT: v_mul_lo_u32 v4, v4, v7			; CGP-NEXT: v_mul_lo_u32 v4, v7, v4
	; CGP-NEXT: v_mul_hi_u32 v8, v3, v8			; CGP-NEXT: v_mul_hi_u32 v8, v3, v8
	; CGP-NEXT: v_mul_hi_u32 v4, v7, v4			; CGP-NEXT: v_mul_hi_u32 v4, v7, v4
	; CGP-NEXT: v_add_i32_e32 v3, vcc, v3, v8			; CGP-NEXT: v_add_i32_e32 v3, vcc, v3, v8
	; CGP-NEXT: v_add_i32_e32 v4, vcc, v7, v4			; CGP-NEXT: v_add_i32_e32 v4, vcc, v7, v4
	; CGP-NEXT: v_mul_hi_u32 v3, v0, v3			; CGP-NEXT: v_mul_hi_u32 v3, v0, v3
	; CGP-NEXT: v_mul_hi_u32 v4, v1, v4			; CGP-NEXT: v_mul_hi_u32 v4, v1, v4
	; CGP-NEXT: v_mul_lo_u32 v3, v3, s4			; CGP-NEXT: v_mul_lo_u32 v3, v3, s4
	; CGP-NEXT: v_mul_lo_u32 v4, v4, s4			; CGP-NEXT: v_mul_lo_u32 v4, v4, s4
	▲ Show 20 Lines • Show All 138 Lines • ▼ Show 20 Lines
	; CGP-NEXT: v_rcp_f32_e32 v6, v6			; CGP-NEXT: v_rcp_f32_e32 v6, v6
	; CGP-NEXT: v_rcp_f32_e32 v8, v8			; CGP-NEXT: v_rcp_f32_e32 v8, v8
	; CGP-NEXT: v_mul_f32_e32 v6, 0x4f7ffffe, v6			; CGP-NEXT: v_mul_f32_e32 v6, 0x4f7ffffe, v6
	; CGP-NEXT: v_mul_f32_e32 v8, 0x4f7ffffe, v8			; CGP-NEXT: v_mul_f32_e32 v8, 0x4f7ffffe, v8
	; CGP-NEXT: v_cvt_u32_f32_e32 v6, v6			; CGP-NEXT: v_cvt_u32_f32_e32 v6, v6
	; CGP-NEXT: v_cvt_u32_f32_e32 v8, v8			; CGP-NEXT: v_cvt_u32_f32_e32 v8, v8
	; CGP-NEXT: v_mul_lo_u32 v7, v7, v6			; CGP-NEXT: v_mul_lo_u32 v7, v7, v6
	; CGP-NEXT: v_mul_lo_u32 v9, v9, v8			; CGP-NEXT: v_mul_lo_u32 v9, v9, v8
	; CGP-NEXT: v_mul_lo_u32 v10, 0, v7
	; CGP-NEXT: v_mul_hi_u32 v7, v6, v7			; CGP-NEXT: v_mul_hi_u32 v7, v6, v7
	; CGP-NEXT: v_mul_lo_u32 v11, 0, v9
	; CGP-NEXT: v_mul_hi_u32 v9, v8, v9			; CGP-NEXT: v_mul_hi_u32 v9, v8, v9
	; CGP-NEXT: v_add_i32_e32 v7, vcc, v10, v7
	; CGP-NEXT: v_add_i32_e32 v9, vcc, v11, v9
	; CGP-NEXT: v_add_i32_e32 v6, vcc, v6, v7			; CGP-NEXT: v_add_i32_e32 v6, vcc, v6, v7
	; CGP-NEXT: v_add_i32_e32 v7, vcc, v8, v9			; CGP-NEXT: v_add_i32_e32 v7, vcc, v8, v9
	; CGP-NEXT: v_mul_lo_u32 v8, 0, v6
	; CGP-NEXT: v_mul_hi_u32 v6, v0, v6			; CGP-NEXT: v_mul_hi_u32 v6, v0, v6
	; CGP-NEXT: v_mul_lo_u32 v9, 0, v7
	; CGP-NEXT: v_mul_hi_u32 v7, v1, v7			; CGP-NEXT: v_mul_hi_u32 v7, v1, v7
	; CGP-NEXT: v_add_i32_e32 v6, vcc, v8, v6
	; CGP-NEXT: v_add_i32_e32 v7, vcc, v9, v7
	; CGP-NEXT: v_mul_lo_u32 v6, v6, v2			; CGP-NEXT: v_mul_lo_u32 v6, v6, v2
	; CGP-NEXT: v_mul_lo_u32 v7, v7, v3			; CGP-NEXT: v_mul_lo_u32 v7, v7, v3
	; CGP-NEXT: v_sub_i32_e32 v0, vcc, v0, v6			; CGP-NEXT: v_sub_i32_e32 v0, vcc, v0, v6
	; CGP-NEXT: v_sub_i32_e32 v1, vcc, v1, v7			; CGP-NEXT: v_sub_i32_e32 v1, vcc, v1, v7
	; CGP-NEXT: v_sub_i32_e32 v6, vcc, v0, v2			; CGP-NEXT: v_sub_i32_e32 v6, vcc, v0, v2
	; CGP-NEXT: v_sub_i32_e32 v7, vcc, v1, v3			; CGP-NEXT: v_sub_i32_e32 v7, vcc, v1, v3
	; CGP-NEXT: v_cmp_ge_u32_e32 vcc, v0, v2			; CGP-NEXT: v_cmp_ge_u32_e32 vcc, v0, v2
	; CGP-NEXT: v_cndmask_b32_e32 v0, v0, v6, vcc			; CGP-NEXT: v_cndmask_b32_e32 v0, v0, v6, vcc
	▲ Show 20 Lines • Show All 54 Lines • ▼ Show 20 Lines
	; CGP-NEXT: v_and_b32_e32 v0, 0xffffff, v0			; CGP-NEXT: v_and_b32_e32 v0, 0xffffff, v0
	; CGP-NEXT: v_and_b32_e32 v1, 0xffffff, v1			; CGP-NEXT: v_and_b32_e32 v1, 0xffffff, v1
	; CGP-NEXT: v_cvt_f32_u32_e32 v2, v1			; CGP-NEXT: v_cvt_f32_u32_e32 v2, v1
	; CGP-NEXT: v_sub_i32_e32 v3, vcc, 0, v1			; CGP-NEXT: v_sub_i32_e32 v3, vcc, 0, v1
	; CGP-NEXT: v_rcp_f32_e32 v2, v2			; CGP-NEXT: v_rcp_f32_e32 v2, v2
	; CGP-NEXT: v_mul_f32_e32 v2, 0x4f7ffffe, v2			; CGP-NEXT: v_mul_f32_e32 v2, 0x4f7ffffe, v2
	; CGP-NEXT: v_cvt_u32_f32_e32 v2, v2			; CGP-NEXT: v_cvt_u32_f32_e32 v2, v2
	; CGP-NEXT: v_mul_lo_u32 v3, v3, v2			; CGP-NEXT: v_mul_lo_u32 v3, v3, v2
	; CGP-NEXT: v_mul_lo_u32 v4, 0, v3
	; CGP-NEXT: v_mul_hi_u32 v3, v2, v3			; CGP-NEXT: v_mul_hi_u32 v3, v2, v3
	; CGP-NEXT: v_add_i32_e32 v3, vcc, v4, v3
	; CGP-NEXT: v_add_i32_e32 v2, vcc, v2, v3			; CGP-NEXT: v_add_i32_e32 v2, vcc, v2, v3
	; CGP-NEXT: v_mul_lo_u32 v3, 0, v2
	; CGP-NEXT: v_mul_hi_u32 v2, v0, v2			; CGP-NEXT: v_mul_hi_u32 v2, v0, v2
	; CGP-NEXT: v_add_i32_e32 v2, vcc, v3, v2
	; CGP-NEXT: v_mul_lo_u32 v2, v2, v1			; CGP-NEXT: v_mul_lo_u32 v2, v2, v1
	; CGP-NEXT: v_sub_i32_e32 v0, vcc, v0, v2			; CGP-NEXT: v_sub_i32_e32 v0, vcc, v0, v2
	; CGP-NEXT: v_sub_i32_e32 v2, vcc, v0, v1			; CGP-NEXT: v_sub_i32_e32 v2, vcc, v0, v1
	; CGP-NEXT: v_cmp_ge_u32_e32 vcc, v0, v1			; CGP-NEXT: v_cmp_ge_u32_e32 vcc, v0, v1
	; CGP-NEXT: v_cndmask_b32_e32 v0, v0, v2, vcc			; CGP-NEXT: v_cndmask_b32_e32 v0, v0, v2, vcc
	; CGP-NEXT: v_sub_i32_e32 v2, vcc, v0, v1			; CGP-NEXT: v_sub_i32_e32 v2, vcc, v0, v1
	; CGP-NEXT: v_cmp_ge_u32_e32 vcc, v0, v1			; CGP-NEXT: v_cmp_ge_u32_e32 vcc, v0, v1
	; CGP-NEXT: v_cndmask_b32_e32 v0, v0, v2, vcc			; CGP-NEXT: v_cndmask_b32_e32 v0, v0, v2, vcc
	▲ Show 20 Lines • Show All 78 Lines • ▼ Show 20 Lines
	; CGP-NEXT: v_rcp_f32_e32 v4, v4			; CGP-NEXT: v_rcp_f32_e32 v4, v4
	; CGP-NEXT: v_rcp_f32_e32 v6, v6			; CGP-NEXT: v_rcp_f32_e32 v6, v6
	; CGP-NEXT: v_mul_f32_e32 v4, 0x4f7ffffe, v4			; CGP-NEXT: v_mul_f32_e32 v4, 0x4f7ffffe, v4
	; CGP-NEXT: v_mul_f32_e32 v6, 0x4f7ffffe, v6			; CGP-NEXT: v_mul_f32_e32 v6, 0x4f7ffffe, v6
	; CGP-NEXT: v_cvt_u32_f32_e32 v4, v4			; CGP-NEXT: v_cvt_u32_f32_e32 v4, v4
	; CGP-NEXT: v_cvt_u32_f32_e32 v6, v6			; CGP-NEXT: v_cvt_u32_f32_e32 v6, v6
	; CGP-NEXT: v_mul_lo_u32 v5, v5, v4			; CGP-NEXT: v_mul_lo_u32 v5, v5, v4
	; CGP-NEXT: v_mul_lo_u32 v7, v7, v6			; CGP-NEXT: v_mul_lo_u32 v7, v7, v6
	; CGP-NEXT: v_mul_lo_u32 v8, 0, v5
	; CGP-NEXT: v_mul_hi_u32 v5, v4, v5			; CGP-NEXT: v_mul_hi_u32 v5, v4, v5
	; CGP-NEXT: v_mul_lo_u32 v9, 0, v7
	; CGP-NEXT: v_mul_hi_u32 v7, v6, v7			; CGP-NEXT: v_mul_hi_u32 v7, v6, v7
	; CGP-NEXT: v_add_i32_e32 v5, vcc, v8, v5
	; CGP-NEXT: v_add_i32_e32 v7, vcc, v9, v7
	; CGP-NEXT: v_add_i32_e32 v4, vcc, v4, v5			; CGP-NEXT: v_add_i32_e32 v4, vcc, v4, v5
	; CGP-NEXT: v_add_i32_e32 v5, vcc, v6, v7			; CGP-NEXT: v_add_i32_e32 v5, vcc, v6, v7
	; CGP-NEXT: v_mul_lo_u32 v6, 0, v4
	; CGP-NEXT: v_mul_hi_u32 v4, v0, v4			; CGP-NEXT: v_mul_hi_u32 v4, v0, v4
	; CGP-NEXT: v_mul_lo_u32 v7, 0, v5
	; CGP-NEXT: v_mul_hi_u32 v5, v1, v5			; CGP-NEXT: v_mul_hi_u32 v5, v1, v5
	; CGP-NEXT: v_add_i32_e32 v4, vcc, v6, v4
	; CGP-NEXT: v_add_i32_e32 v5, vcc, v7, v5
	; CGP-NEXT: v_mul_lo_u32 v4, v4, v2			; CGP-NEXT: v_mul_lo_u32 v4, v4, v2
	; CGP-NEXT: v_mul_lo_u32 v5, v5, v3			; CGP-NEXT: v_mul_lo_u32 v5, v5, v3
	; CGP-NEXT: v_sub_i32_e32 v0, vcc, v0, v4			; CGP-NEXT: v_sub_i32_e32 v0, vcc, v0, v4
	; CGP-NEXT: v_sub_i32_e32 v1, vcc, v1, v5			; CGP-NEXT: v_sub_i32_e32 v1, vcc, v1, v5
	; CGP-NEXT: v_sub_i32_e32 v4, vcc, v0, v2			; CGP-NEXT: v_sub_i32_e32 v4, vcc, v0, v2
	; CGP-NEXT: v_sub_i32_e32 v5, vcc, v1, v3			; CGP-NEXT: v_sub_i32_e32 v5, vcc, v1, v3
	; CGP-NEXT: v_cmp_ge_u32_e32 vcc, v0, v2			; CGP-NEXT: v_cmp_ge_u32_e32 vcc, v0, v2
	; CGP-NEXT: v_cndmask_b32_e32 v0, v0, v4, vcc			; CGP-NEXT: v_cndmask_b32_e32 v0, v0, v4, vcc
	Show All 14 Lines

llvm/test/CodeGen/AMDGPU/GlobalISel/udiv.i32.ll

	Show All 32 Lines
	; CGP: ; %bb.0:			; CGP: ; %bb.0:
	; CGP-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)			; CGP-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
	; CGP-NEXT: v_cvt_f32_u32_e32 v2, v1			; CGP-NEXT: v_cvt_f32_u32_e32 v2, v1
	; CGP-NEXT: v_sub_i32_e32 v3, vcc, 0, v1			; CGP-NEXT: v_sub_i32_e32 v3, vcc, 0, v1
	; CGP-NEXT: v_rcp_f32_e32 v2, v2			; CGP-NEXT: v_rcp_f32_e32 v2, v2
	; CGP-NEXT: v_mul_f32_e32 v2, 0x4f7ffffe, v2			; CGP-NEXT: v_mul_f32_e32 v2, 0x4f7ffffe, v2
	; CGP-NEXT: v_cvt_u32_f32_e32 v2, v2			; CGP-NEXT: v_cvt_u32_f32_e32 v2, v2
	; CGP-NEXT: v_mul_lo_u32 v3, v3, v2			; CGP-NEXT: v_mul_lo_u32 v3, v3, v2
	; CGP-NEXT: v_mul_lo_u32 v4, 0, v3
	; CGP-NEXT: v_mul_hi_u32 v3, v2, v3			; CGP-NEXT: v_mul_hi_u32 v3, v2, v3
	; CGP-NEXT: v_add_i32_e32 v3, vcc, v4, v3
	; CGP-NEXT: v_add_i32_e32 v2, vcc, v2, v3			; CGP-NEXT: v_add_i32_e32 v2, vcc, v2, v3
	; CGP-NEXT: v_mul_lo_u32 v3, 0, v2
	; CGP-NEXT: v_mul_hi_u32 v2, v0, v2			; CGP-NEXT: v_mul_hi_u32 v2, v0, v2
	; CGP-NEXT: v_add_i32_e32 v2, vcc, v3, v2
	; CGP-NEXT: v_mul_lo_u32 v3, v2, v1			; CGP-NEXT: v_mul_lo_u32 v3, v2, v1
	; CGP-NEXT: v_add_i32_e32 v4, vcc, 1, v2			; CGP-NEXT: v_add_i32_e32 v4, vcc, 1, v2
	; CGP-NEXT: v_sub_i32_e32 v0, vcc, v0, v3			; CGP-NEXT: v_sub_i32_e32 v0, vcc, v0, v3
	; CGP-NEXT: v_cmp_ge_u32_e32 vcc, v0, v1			; CGP-NEXT: v_cmp_ge_u32_e32 vcc, v0, v1
	; CGP-NEXT: v_cndmask_b32_e32 v2, v2, v4, vcc			; CGP-NEXT: v_cndmask_b32_e32 v2, v2, v4, vcc
	; CGP-NEXT: v_sub_i32_e64 v3, s[4:5], v0, v1			; CGP-NEXT: v_sub_i32_e64 v3, s[4:5], v0, v1
	; CGP-NEXT: v_cndmask_b32_e32 v0, v0, v3, vcc			; CGP-NEXT: v_cndmask_b32_e32 v0, v0, v3, vcc
	; CGP-NEXT: v_add_i32_e32 v3, vcc, 1, v2			; CGP-NEXT: v_add_i32_e32 v3, vcc, 1, v2
	Show All 35 Lines
	; CGP-LABEL: s_udiv_i32:			; CGP-LABEL: s_udiv_i32:
	; CGP: ; %bb.0:			; CGP: ; %bb.0:
	; CGP-NEXT: v_cvt_f32_u32_e32 v0, s1			; CGP-NEXT: v_cvt_f32_u32_e32 v0, s1
	; CGP-NEXT: s_sub_i32 s2, 0, s1			; CGP-NEXT: s_sub_i32 s2, 0, s1
	; CGP-NEXT: v_rcp_f32_e32 v0, v0			; CGP-NEXT: v_rcp_f32_e32 v0, v0
	; CGP-NEXT: v_mul_f32_e32 v0, 0x4f7ffffe, v0			; CGP-NEXT: v_mul_f32_e32 v0, 0x4f7ffffe, v0
	; CGP-NEXT: v_cvt_u32_f32_e32 v0, v0			; CGP-NEXT: v_cvt_u32_f32_e32 v0, v0
	; CGP-NEXT: v_mul_lo_u32 v1, s2, v0			; CGP-NEXT: v_mul_lo_u32 v1, s2, v0
	; CGP-NEXT: v_mul_lo_u32 v2, 0, v1
	; CGP-NEXT: v_mul_hi_u32 v1, v0, v1			; CGP-NEXT: v_mul_hi_u32 v1, v0, v1
	; CGP-NEXT: v_add_i32_e32 v1, vcc, v2, v1
	; CGP-NEXT: v_add_i32_e32 v0, vcc, v0, v1			; CGP-NEXT: v_add_i32_e32 v0, vcc, v0, v1
	; CGP-NEXT: v_mul_lo_u32 v1, 0, v0
	; CGP-NEXT: v_mul_hi_u32 v0, s0, v0			; CGP-NEXT: v_mul_hi_u32 v0, s0, v0
	; CGP-NEXT: v_add_i32_e32 v0, vcc, v1, v0
	; CGP-NEXT: v_mul_lo_u32 v1, v0, s1			; CGP-NEXT: v_mul_lo_u32 v1, v0, s1
	; CGP-NEXT: v_add_i32_e32 v2, vcc, 1, v0			; CGP-NEXT: v_add_i32_e32 v2, vcc, 1, v0
	; CGP-NEXT: v_sub_i32_e32 v1, vcc, s0, v1			; CGP-NEXT: v_sub_i32_e32 v1, vcc, s0, v1
	; CGP-NEXT: v_cmp_le_u32_e32 vcc, s1, v1			; CGP-NEXT: v_cmp_le_u32_e32 vcc, s1, v1
	; CGP-NEXT: v_cndmask_b32_e32 v0, v0, v2, vcc			; CGP-NEXT: v_cndmask_b32_e32 v0, v0, v2, vcc
	; CGP-NEXT: v_subrev_i32_e64 v2, s[2:3], s1, v1			; CGP-NEXT: v_subrev_i32_e64 v2, s[2:3], s1, v1
	; CGP-NEXT: v_cndmask_b32_e32 v1, v1, v2, vcc			; CGP-NEXT: v_cndmask_b32_e32 v1, v1, v2, vcc
	; CGP-NEXT: v_add_i32_e32 v2, vcc, 1, v0			; CGP-NEXT: v_add_i32_e32 v2, vcc, 1, v0
	▲ Show 20 Lines • Show All 60 Lines • ▼ Show 20 Lines
	; CGP-NEXT: v_rcp_f32_e32 v4, v4			; CGP-NEXT: v_rcp_f32_e32 v4, v4
	; CGP-NEXT: v_rcp_f32_e32 v6, v6			; CGP-NEXT: v_rcp_f32_e32 v6, v6
	; CGP-NEXT: v_mul_f32_e32 v4, 0x4f7ffffe, v4			; CGP-NEXT: v_mul_f32_e32 v4, 0x4f7ffffe, v4
	; CGP-NEXT: v_mul_f32_e32 v6, 0x4f7ffffe, v6			; CGP-NEXT: v_mul_f32_e32 v6, 0x4f7ffffe, v6
	; CGP-NEXT: v_cvt_u32_f32_e32 v4, v4			; CGP-NEXT: v_cvt_u32_f32_e32 v4, v4
	; CGP-NEXT: v_cvt_u32_f32_e32 v6, v6			; CGP-NEXT: v_cvt_u32_f32_e32 v6, v6
	; CGP-NEXT: v_mul_lo_u32 v5, v5, v4			; CGP-NEXT: v_mul_lo_u32 v5, v5, v4
	; CGP-NEXT: v_mul_lo_u32 v7, v7, v6			; CGP-NEXT: v_mul_lo_u32 v7, v7, v6
	; CGP-NEXT: v_mul_lo_u32 v8, 0, v5
	; CGP-NEXT: v_mul_hi_u32 v5, v4, v5			; CGP-NEXT: v_mul_hi_u32 v5, v4, v5
	; CGP-NEXT: v_mul_lo_u32 v9, 0, v7
	; CGP-NEXT: v_mul_hi_u32 v7, v6, v7			; CGP-NEXT: v_mul_hi_u32 v7, v6, v7
	; CGP-NEXT: v_add_i32_e32 v5, vcc, v8, v5
	; CGP-NEXT: v_add_i32_e32 v7, vcc, v9, v7
	; CGP-NEXT: v_add_i32_e32 v4, vcc, v4, v5			; CGP-NEXT: v_add_i32_e32 v4, vcc, v4, v5
	; CGP-NEXT: v_add_i32_e32 v5, vcc, v6, v7			; CGP-NEXT: v_add_i32_e32 v5, vcc, v6, v7
	; CGP-NEXT: v_mul_lo_u32 v6, 0, v4
	; CGP-NEXT: v_mul_hi_u32 v4, v0, v4			; CGP-NEXT: v_mul_hi_u32 v4, v0, v4
	; CGP-NEXT: v_mul_lo_u32 v7, 0, v5
	; CGP-NEXT: v_mul_hi_u32 v5, v1, v5			; CGP-NEXT: v_mul_hi_u32 v5, v1, v5
	; CGP-NEXT: v_add_i32_e32 v4, vcc, v6, v4
	; CGP-NEXT: v_add_i32_e32 v5, vcc, v7, v5
	; CGP-NEXT: v_mul_lo_u32 v6, v4, v2			; CGP-NEXT: v_mul_lo_u32 v6, v4, v2
	; CGP-NEXT: v_add_i32_e32 v7, vcc, 1, v4			; CGP-NEXT: v_add_i32_e32 v7, vcc, 1, v4
	; CGP-NEXT: v_mul_lo_u32 v8, v5, v3			; CGP-NEXT: v_mul_lo_u32 v8, v5, v3
	; CGP-NEXT: v_add_i32_e32 v9, vcc, 1, v5			; CGP-NEXT: v_add_i32_e32 v9, vcc, 1, v5
	; CGP-NEXT: v_sub_i32_e32 v0, vcc, v0, v6			; CGP-NEXT: v_sub_i32_e32 v0, vcc, v0, v6
	; CGP-NEXT: v_sub_i32_e32 v1, vcc, v1, v8			; CGP-NEXT: v_sub_i32_e32 v1, vcc, v1, v8
	; CGP-NEXT: v_cmp_ge_u32_e32 vcc, v0, v2			; CGP-NEXT: v_cmp_ge_u32_e32 vcc, v0, v2
	; CGP-NEXT: v_cndmask_b32_e32 v4, v4, v7, vcc			; CGP-NEXT: v_cndmask_b32_e32 v4, v4, v7, vcc
	▲ Show 20 Lines • Show All 158 Lines • ▼ Show 20 Lines
	; CGP-NEXT: v_rcp_f32_e32 v4, v4			; CGP-NEXT: v_rcp_f32_e32 v4, v4
	; CGP-NEXT: v_rcp_f32_e32 v6, v6			; CGP-NEXT: v_rcp_f32_e32 v6, v6
	; CGP-NEXT: v_mul_f32_e32 v4, 0x4f7ffffe, v4			; CGP-NEXT: v_mul_f32_e32 v4, 0x4f7ffffe, v4
	; CGP-NEXT: v_mul_f32_e32 v6, 0x4f7ffffe, v6			; CGP-NEXT: v_mul_f32_e32 v6, 0x4f7ffffe, v6
	; CGP-NEXT: v_cvt_u32_f32_e32 v4, v4			; CGP-NEXT: v_cvt_u32_f32_e32 v4, v4
	; CGP-NEXT: v_cvt_u32_f32_e32 v6, v6			; CGP-NEXT: v_cvt_u32_f32_e32 v6, v6
	; CGP-NEXT: v_mul_lo_u32 v5, v5, v4			; CGP-NEXT: v_mul_lo_u32 v5, v5, v4
	; CGP-NEXT: v_mul_lo_u32 v7, v7, v6			; CGP-NEXT: v_mul_lo_u32 v7, v7, v6
	; CGP-NEXT: v_mul_lo_u32 v8, 0, v5
	; CGP-NEXT: v_mul_hi_u32 v5, v4, v5			; CGP-NEXT: v_mul_hi_u32 v5, v4, v5
	; CGP-NEXT: v_mul_lo_u32 v9, 0, v7
	; CGP-NEXT: v_mul_hi_u32 v7, v6, v7			; CGP-NEXT: v_mul_hi_u32 v7, v6, v7
	; CGP-NEXT: v_add_i32_e32 v5, vcc, v8, v5
	; CGP-NEXT: v_add_i32_e32 v7, vcc, v9, v7
	; CGP-NEXT: v_add_i32_e32 v4, vcc, v4, v5			; CGP-NEXT: v_add_i32_e32 v4, vcc, v4, v5
	; CGP-NEXT: v_add_i32_e32 v5, vcc, v6, v7			; CGP-NEXT: v_add_i32_e32 v5, vcc, v6, v7
	; CGP-NEXT: v_mul_lo_u32 v6, 0, v4
	; CGP-NEXT: v_mul_hi_u32 v4, v0, v4			; CGP-NEXT: v_mul_hi_u32 v4, v0, v4
	; CGP-NEXT: v_mul_lo_u32 v7, 0, v5
	; CGP-NEXT: v_mul_hi_u32 v5, v1, v5			; CGP-NEXT: v_mul_hi_u32 v5, v1, v5
	; CGP-NEXT: v_add_i32_e32 v4, vcc, v6, v4
	; CGP-NEXT: v_add_i32_e32 v5, vcc, v7, v5
	; CGP-NEXT: v_mul_lo_u32 v6, v4, v2			; CGP-NEXT: v_mul_lo_u32 v6, v4, v2
	; CGP-NEXT: v_add_i32_e32 v7, vcc, 1, v4			; CGP-NEXT: v_add_i32_e32 v7, vcc, 1, v4
	; CGP-NEXT: v_mul_lo_u32 v8, v5, v3			; CGP-NEXT: v_mul_lo_u32 v8, v5, v3
	; CGP-NEXT: v_add_i32_e32 v9, vcc, 1, v5			; CGP-NEXT: v_add_i32_e32 v9, vcc, 1, v5
	; CGP-NEXT: v_sub_i32_e32 v0, vcc, v0, v6			; CGP-NEXT: v_sub_i32_e32 v0, vcc, v0, v6
	; CGP-NEXT: v_sub_i32_e32 v1, vcc, v1, v8			; CGP-NEXT: v_sub_i32_e32 v1, vcc, v1, v8
	; CGP-NEXT: v_cmp_ge_u32_e32 vcc, v0, v2			; CGP-NEXT: v_cmp_ge_u32_e32 vcc, v0, v2
	; CGP-NEXT: v_cndmask_b32_e32 v4, v4, v7, vcc			; CGP-NEXT: v_cndmask_b32_e32 v4, v4, v7, vcc
	▲ Show 20 Lines • Show All 48 Lines • ▼ Show 20 Lines
	; CGP-NEXT: v_and_b32_e32 v0, 0xffffff, v0			; CGP-NEXT: v_and_b32_e32 v0, 0xffffff, v0
	; CGP-NEXT: v_and_b32_e32 v1, 0xffffff, v1			; CGP-NEXT: v_and_b32_e32 v1, 0xffffff, v1
	; CGP-NEXT: v_cvt_f32_u32_e32 v2, v1			; CGP-NEXT: v_cvt_f32_u32_e32 v2, v1
	; CGP-NEXT: v_sub_i32_e32 v3, vcc, 0, v1			; CGP-NEXT: v_sub_i32_e32 v3, vcc, 0, v1
	; CGP-NEXT: v_rcp_f32_e32 v2, v2			; CGP-NEXT: v_rcp_f32_e32 v2, v2
	; CGP-NEXT: v_mul_f32_e32 v2, 0x4f7ffffe, v2			; CGP-NEXT: v_mul_f32_e32 v2, 0x4f7ffffe, v2
	; CGP-NEXT: v_cvt_u32_f32_e32 v2, v2			; CGP-NEXT: v_cvt_u32_f32_e32 v2, v2
	; CGP-NEXT: v_mul_lo_u32 v3, v3, v2			; CGP-NEXT: v_mul_lo_u32 v3, v3, v2
	; CGP-NEXT: v_mul_lo_u32 v4, 0, v3
	; CGP-NEXT: v_mul_hi_u32 v3, v2, v3			; CGP-NEXT: v_mul_hi_u32 v3, v2, v3
	; CGP-NEXT: v_add_i32_e32 v3, vcc, v4, v3
	; CGP-NEXT: v_add_i32_e32 v2, vcc, v2, v3			; CGP-NEXT: v_add_i32_e32 v2, vcc, v2, v3
	; CGP-NEXT: v_mul_lo_u32 v3, 0, v2
	; CGP-NEXT: v_mul_hi_u32 v2, v0, v2			; CGP-NEXT: v_mul_hi_u32 v2, v0, v2
	; CGP-NEXT: v_add_i32_e32 v2, vcc, v3, v2
	; CGP-NEXT: v_mul_lo_u32 v3, v2, v1			; CGP-NEXT: v_mul_lo_u32 v3, v2, v1
	; CGP-NEXT: v_add_i32_e32 v4, vcc, 1, v2			; CGP-NEXT: v_add_i32_e32 v4, vcc, 1, v2
	; CGP-NEXT: v_sub_i32_e32 v0, vcc, v0, v3			; CGP-NEXT: v_sub_i32_e32 v0, vcc, v0, v3
	; CGP-NEXT: v_cmp_ge_u32_e32 vcc, v0, v1			; CGP-NEXT: v_cmp_ge_u32_e32 vcc, v0, v1
	; CGP-NEXT: v_cndmask_b32_e32 v2, v2, v4, vcc			; CGP-NEXT: v_cndmask_b32_e32 v2, v2, v4, vcc
	; CGP-NEXT: v_sub_i32_e64 v3, s[4:5], v0, v1			; CGP-NEXT: v_sub_i32_e64 v3, s[4:5], v0, v1
	; CGP-NEXT: v_cndmask_b32_e32 v0, v0, v3, vcc			; CGP-NEXT: v_cndmask_b32_e32 v0, v0, v3, vcc
	; CGP-NEXT: v_add_i32_e32 v3, vcc, 1, v2			; CGP-NEXT: v_add_i32_e32 v3, vcc, 1, v2
	▲ Show 20 Lines • Show All 68 Lines • ▼ Show 20 Lines
	; CGP-NEXT: v_rcp_f32_e32 v4, v4			; CGP-NEXT: v_rcp_f32_e32 v4, v4
	; CGP-NEXT: v_rcp_f32_e32 v6, v6			; CGP-NEXT: v_rcp_f32_e32 v6, v6
	; CGP-NEXT: v_mul_f32_e32 v4, 0x4f7ffffe, v4			; CGP-NEXT: v_mul_f32_e32 v4, 0x4f7ffffe, v4
	; CGP-NEXT: v_mul_f32_e32 v6, 0x4f7ffffe, v6			; CGP-NEXT: v_mul_f32_e32 v6, 0x4f7ffffe, v6
	; CGP-NEXT: v_cvt_u32_f32_e32 v4, v4			; CGP-NEXT: v_cvt_u32_f32_e32 v4, v4
	; CGP-NEXT: v_cvt_u32_f32_e32 v6, v6			; CGP-NEXT: v_cvt_u32_f32_e32 v6, v6
	; CGP-NEXT: v_mul_lo_u32 v5, v5, v4			; CGP-NEXT: v_mul_lo_u32 v5, v5, v4
	; CGP-NEXT: v_mul_lo_u32 v7, v7, v6			; CGP-NEXT: v_mul_lo_u32 v7, v7, v6
	; CGP-NEXT: v_mul_lo_u32 v8, 0, v5
	; CGP-NEXT: v_mul_hi_u32 v5, v4, v5			; CGP-NEXT: v_mul_hi_u32 v5, v4, v5
	; CGP-NEXT: v_mul_lo_u32 v9, 0, v7
	; CGP-NEXT: v_mul_hi_u32 v7, v6, v7			; CGP-NEXT: v_mul_hi_u32 v7, v6, v7
	; CGP-NEXT: v_add_i32_e32 v5, vcc, v8, v5
	; CGP-NEXT: v_add_i32_e32 v7, vcc, v9, v7
	; CGP-NEXT: v_add_i32_e32 v4, vcc, v4, v5			; CGP-NEXT: v_add_i32_e32 v4, vcc, v4, v5
	; CGP-NEXT: v_add_i32_e32 v5, vcc, v6, v7			; CGP-NEXT: v_add_i32_e32 v5, vcc, v6, v7
	; CGP-NEXT: v_mul_lo_u32 v6, 0, v4
	; CGP-NEXT: v_mul_hi_u32 v4, v0, v4			; CGP-NEXT: v_mul_hi_u32 v4, v0, v4
	; CGP-NEXT: v_mul_lo_u32 v7, 0, v5
	; CGP-NEXT: v_mul_hi_u32 v5, v1, v5			; CGP-NEXT: v_mul_hi_u32 v5, v1, v5
	; CGP-NEXT: v_add_i32_e32 v4, vcc, v6, v4
	; CGP-NEXT: v_add_i32_e32 v5, vcc, v7, v5
	; CGP-NEXT: v_mul_lo_u32 v6, v4, v2			; CGP-NEXT: v_mul_lo_u32 v6, v4, v2
	; CGP-NEXT: v_add_i32_e32 v7, vcc, 1, v4			; CGP-NEXT: v_add_i32_e32 v7, vcc, 1, v4
	; CGP-NEXT: v_mul_lo_u32 v8, v5, v3			; CGP-NEXT: v_mul_lo_u32 v8, v5, v3
	; CGP-NEXT: v_add_i32_e32 v9, vcc, 1, v5			; CGP-NEXT: v_add_i32_e32 v9, vcc, 1, v5
	; CGP-NEXT: v_sub_i32_e32 v0, vcc, v0, v6			; CGP-NEXT: v_sub_i32_e32 v0, vcc, v0, v6
	; CGP-NEXT: v_sub_i32_e32 v1, vcc, v1, v8			; CGP-NEXT: v_sub_i32_e32 v1, vcc, v1, v8
	; CGP-NEXT: v_cmp_ge_u32_e32 vcc, v0, v2			; CGP-NEXT: v_cmp_ge_u32_e32 vcc, v0, v2
	; CGP-NEXT: v_cndmask_b32_e32 v4, v4, v7, vcc			; CGP-NEXT: v_cndmask_b32_e32 v4, v4, v7, vcc
	Show All 18 Lines

llvm/test/CodeGen/AMDGPU/GlobalISel/urem.i32.ll

	Show All 30 Lines
	; CGP: ; %bb.0:			; CGP: ; %bb.0:
	; CGP-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)			; CGP-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
	; CGP-NEXT: v_cvt_f32_u32_e32 v2, v1			; CGP-NEXT: v_cvt_f32_u32_e32 v2, v1
	; CGP-NEXT: v_sub_i32_e32 v3, vcc, 0, v1			; CGP-NEXT: v_sub_i32_e32 v3, vcc, 0, v1
	; CGP-NEXT: v_rcp_f32_e32 v2, v2			; CGP-NEXT: v_rcp_f32_e32 v2, v2
	; CGP-NEXT: v_mul_f32_e32 v2, 0x4f7ffffe, v2			; CGP-NEXT: v_mul_f32_e32 v2, 0x4f7ffffe, v2
	; CGP-NEXT: v_cvt_u32_f32_e32 v2, v2			; CGP-NEXT: v_cvt_u32_f32_e32 v2, v2
	; CGP-NEXT: v_mul_lo_u32 v3, v3, v2			; CGP-NEXT: v_mul_lo_u32 v3, v3, v2
	; CGP-NEXT: v_mul_lo_u32 v4, 0, v3
	; CGP-NEXT: v_mul_hi_u32 v3, v2, v3			; CGP-NEXT: v_mul_hi_u32 v3, v2, v3
	; CGP-NEXT: v_add_i32_e32 v3, vcc, v4, v3
	; CGP-NEXT: v_add_i32_e32 v2, vcc, v2, v3			; CGP-NEXT: v_add_i32_e32 v2, vcc, v2, v3
	; CGP-NEXT: v_mul_lo_u32 v3, 0, v2
	; CGP-NEXT: v_mul_hi_u32 v2, v0, v2			; CGP-NEXT: v_mul_hi_u32 v2, v0, v2
	; CGP-NEXT: v_add_i32_e32 v2, vcc, v3, v2
	; CGP-NEXT: v_mul_lo_u32 v2, v2, v1			; CGP-NEXT: v_mul_lo_u32 v2, v2, v1
	; CGP-NEXT: v_sub_i32_e32 v0, vcc, v0, v2			; CGP-NEXT: v_sub_i32_e32 v0, vcc, v0, v2
	; CGP-NEXT: v_sub_i32_e32 v2, vcc, v0, v1			; CGP-NEXT: v_sub_i32_e32 v2, vcc, v0, v1
	; CGP-NEXT: v_cmp_ge_u32_e32 vcc, v0, v1			; CGP-NEXT: v_cmp_ge_u32_e32 vcc, v0, v1
	; CGP-NEXT: v_cndmask_b32_e32 v0, v0, v2, vcc			; CGP-NEXT: v_cndmask_b32_e32 v0, v0, v2, vcc
	; CGP-NEXT: v_sub_i32_e32 v2, vcc, v0, v1			; CGP-NEXT: v_sub_i32_e32 v2, vcc, v0, v1
	; CGP-NEXT: v_cmp_ge_u32_e32 vcc, v0, v1			; CGP-NEXT: v_cmp_ge_u32_e32 vcc, v0, v1
	; CGP-NEXT: v_cndmask_b32_e32 v0, v0, v2, vcc			; CGP-NEXT: v_cndmask_b32_e32 v0, v0, v2, vcc
	Show All 31 Lines
	; CGP-LABEL: s_urem_i32:			; CGP-LABEL: s_urem_i32:
	; CGP: ; %bb.0:			; CGP: ; %bb.0:
	; CGP-NEXT: v_cvt_f32_u32_e32 v0, s1			; CGP-NEXT: v_cvt_f32_u32_e32 v0, s1
	; CGP-NEXT: s_sub_i32 s2, 0, s1			; CGP-NEXT: s_sub_i32 s2, 0, s1
	; CGP-NEXT: v_rcp_f32_e32 v0, v0			; CGP-NEXT: v_rcp_f32_e32 v0, v0
	; CGP-NEXT: v_mul_f32_e32 v0, 0x4f7ffffe, v0			; CGP-NEXT: v_mul_f32_e32 v0, 0x4f7ffffe, v0
	; CGP-NEXT: v_cvt_u32_f32_e32 v0, v0			; CGP-NEXT: v_cvt_u32_f32_e32 v0, v0
	; CGP-NEXT: v_mul_lo_u32 v1, s2, v0			; CGP-NEXT: v_mul_lo_u32 v1, s2, v0
	; CGP-NEXT: v_mul_lo_u32 v2, 0, v1
	; CGP-NEXT: v_mul_hi_u32 v1, v0, v1			; CGP-NEXT: v_mul_hi_u32 v1, v0, v1
	; CGP-NEXT: v_add_i32_e32 v1, vcc, v2, v1
	; CGP-NEXT: v_add_i32_e32 v0, vcc, v0, v1			; CGP-NEXT: v_add_i32_e32 v0, vcc, v0, v1
	; CGP-NEXT: v_mul_lo_u32 v1, 0, v0
	; CGP-NEXT: v_mul_hi_u32 v0, s0, v0			; CGP-NEXT: v_mul_hi_u32 v0, s0, v0
	; CGP-NEXT: v_add_i32_e32 v0, vcc, v1, v0
	; CGP-NEXT: v_mul_lo_u32 v0, v0, s1			; CGP-NEXT: v_mul_lo_u32 v0, v0, s1
	; CGP-NEXT: v_sub_i32_e32 v0, vcc, s0, v0			; CGP-NEXT: v_sub_i32_e32 v0, vcc, s0, v0
	; CGP-NEXT: v_subrev_i32_e32 v1, vcc, s1, v0			; CGP-NEXT: v_subrev_i32_e32 v1, vcc, s1, v0
	; CGP-NEXT: v_cmp_le_u32_e32 vcc, s1, v0			; CGP-NEXT: v_cmp_le_u32_e32 vcc, s1, v0
	; CGP-NEXT: v_cndmask_b32_e32 v0, v0, v1, vcc			; CGP-NEXT: v_cndmask_b32_e32 v0, v0, v1, vcc
	; CGP-NEXT: v_subrev_i32_e32 v1, vcc, s1, v0			; CGP-NEXT: v_subrev_i32_e32 v1, vcc, s1, v0
	; CGP-NEXT: v_cmp_le_u32_e32 vcc, s1, v0			; CGP-NEXT: v_cmp_le_u32_e32 vcc, s1, v0
	; CGP-NEXT: v_cndmask_b32_e32 v0, v0, v1, vcc			; CGP-NEXT: v_cndmask_b32_e32 v0, v0, v1, vcc
	▲ Show 20 Lines • Show All 54 Lines • ▼ Show 20 Lines
	; CGP-NEXT: v_rcp_f32_e32 v4, v4			; CGP-NEXT: v_rcp_f32_e32 v4, v4
	; CGP-NEXT: v_rcp_f32_e32 v6, v6			; CGP-NEXT: v_rcp_f32_e32 v6, v6
	; CGP-NEXT: v_mul_f32_e32 v4, 0x4f7ffffe, v4			; CGP-NEXT: v_mul_f32_e32 v4, 0x4f7ffffe, v4
	; CGP-NEXT: v_mul_f32_e32 v6, 0x4f7ffffe, v6			; CGP-NEXT: v_mul_f32_e32 v6, 0x4f7ffffe, v6
	; CGP-NEXT: v_cvt_u32_f32_e32 v4, v4			; CGP-NEXT: v_cvt_u32_f32_e32 v4, v4
	; CGP-NEXT: v_cvt_u32_f32_e32 v6, v6			; CGP-NEXT: v_cvt_u32_f32_e32 v6, v6
	; CGP-NEXT: v_mul_lo_u32 v5, v5, v4			; CGP-NEXT: v_mul_lo_u32 v5, v5, v4
	; CGP-NEXT: v_mul_lo_u32 v7, v7, v6			; CGP-NEXT: v_mul_lo_u32 v7, v7, v6
	; CGP-NEXT: v_mul_lo_u32 v8, 0, v5
	; CGP-NEXT: v_mul_hi_u32 v5, v4, v5			; CGP-NEXT: v_mul_hi_u32 v5, v4, v5
	; CGP-NEXT: v_mul_lo_u32 v9, 0, v7
	; CGP-NEXT: v_mul_hi_u32 v7, v6, v7			; CGP-NEXT: v_mul_hi_u32 v7, v6, v7
	; CGP-NEXT: v_add_i32_e32 v5, vcc, v8, v5
	; CGP-NEXT: v_add_i32_e32 v7, vcc, v9, v7
	; CGP-NEXT: v_add_i32_e32 v4, vcc, v4, v5			; CGP-NEXT: v_add_i32_e32 v4, vcc, v4, v5
	; CGP-NEXT: v_add_i32_e32 v5, vcc, v6, v7			; CGP-NEXT: v_add_i32_e32 v5, vcc, v6, v7
	; CGP-NEXT: v_mul_lo_u32 v6, 0, v4
	; CGP-NEXT: v_mul_hi_u32 v4, v0, v4			; CGP-NEXT: v_mul_hi_u32 v4, v0, v4
	; CGP-NEXT: v_mul_lo_u32 v7, 0, v5
	; CGP-NEXT: v_mul_hi_u32 v5, v1, v5			; CGP-NEXT: v_mul_hi_u32 v5, v1, v5
	; CGP-NEXT: v_add_i32_e32 v4, vcc, v6, v4
	; CGP-NEXT: v_add_i32_e32 v5, vcc, v7, v5
	; CGP-NEXT: v_mul_lo_u32 v4, v4, v2			; CGP-NEXT: v_mul_lo_u32 v4, v4, v2
	; CGP-NEXT: v_mul_lo_u32 v5, v5, v3			; CGP-NEXT: v_mul_lo_u32 v5, v5, v3
	; CGP-NEXT: v_sub_i32_e32 v0, vcc, v0, v4			; CGP-NEXT: v_sub_i32_e32 v0, vcc, v0, v4
	; CGP-NEXT: v_sub_i32_e32 v1, vcc, v1, v5			; CGP-NEXT: v_sub_i32_e32 v1, vcc, v1, v5
	; CGP-NEXT: v_sub_i32_e32 v4, vcc, v0, v2			; CGP-NEXT: v_sub_i32_e32 v4, vcc, v0, v2
	; CGP-NEXT: v_sub_i32_e32 v5, vcc, v1, v3			; CGP-NEXT: v_sub_i32_e32 v5, vcc, v1, v3
	; CGP-NEXT: v_cmp_ge_u32_e32 vcc, v0, v2			; CGP-NEXT: v_cmp_ge_u32_e32 vcc, v0, v2
	; CGP-NEXT: v_cndmask_b32_e32 v0, v0, v4, vcc			; CGP-NEXT: v_cndmask_b32_e32 v0, v0, v4, vcc
	Show All 35 Lines
	; CHECK-LABEL: v_urem_i32_oddk_denom:			; CHECK-LABEL: v_urem_i32_oddk_denom:
	; CHECK: ; %bb.0:			; CHECK: ; %bb.0:
	; CHECK-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)			; CHECK-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
	; CHECK-NEXT: s_mov_b32 s4, 0x12d8fb			; CHECK-NEXT: s_mov_b32 s4, 0x12d8fb
	; CHECK-NEXT: v_rcp_iflag_f32_e32 v1, 0x4996c7d8			; CHECK-NEXT: v_rcp_iflag_f32_e32 v1, 0x4996c7d8
	; CHECK-NEXT: v_mov_b32_e32 v2, 0xffed2705			; CHECK-NEXT: v_mov_b32_e32 v2, 0xffed2705
	; CHECK-NEXT: v_mul_f32_e32 v1, 0x4f7ffffe, v1			; CHECK-NEXT: v_mul_f32_e32 v1, 0x4f7ffffe, v1
	; CHECK-NEXT: v_cvt_u32_f32_e32 v1, v1			; CHECK-NEXT: v_cvt_u32_f32_e32 v1, v1
	; CHECK-NEXT: v_mul_lo_u32 v2, v2, v1			; CHECK-NEXT: v_mul_lo_u32 v2, v1, v2
	; CHECK-NEXT: v_mul_hi_u32 v2, v1, v2			; CHECK-NEXT: v_mul_hi_u32 v2, v1, v2
	; CHECK-NEXT: v_add_i32_e32 v1, vcc, v1, v2			; CHECK-NEXT: v_add_i32_e32 v1, vcc, v1, v2
	; CHECK-NEXT: v_mul_hi_u32 v1, v0, v1			; CHECK-NEXT: v_mul_hi_u32 v1, v0, v1
	; CHECK-NEXT: v_mul_lo_u32 v1, v1, s4			; CHECK-NEXT: v_mul_lo_u32 v1, v1, s4
	; CHECK-NEXT: v_sub_i32_e32 v0, vcc, v0, v1			; CHECK-NEXT: v_sub_i32_e32 v0, vcc, v0, v1
	; CHECK-NEXT: v_subrev_i32_e32 v1, vcc, s4, v0			; CHECK-NEXT: v_subrev_i32_e32 v1, vcc, s4, v0
	; CHECK-NEXT: v_cmp_le_u32_e32 vcc, s4, v0			; CHECK-NEXT: v_cmp_le_u32_e32 vcc, s4, v0
	; CHECK-NEXT: v_cndmask_b32_e32 v0, v0, v1, vcc			; CHECK-NEXT: v_cndmask_b32_e32 v0, v0, v1, vcc
	Show All 11 Lines
	; GISEL-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)			; GISEL-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
	; GISEL-NEXT: s_mov_b32 s4, 0x12d8fb			; GISEL-NEXT: s_mov_b32 s4, 0x12d8fb
	; GISEL-NEXT: v_mov_b32_e32 v2, 0x12d8fb			; GISEL-NEXT: v_mov_b32_e32 v2, 0x12d8fb
	; GISEL-NEXT: v_cvt_f32_u32_e32 v3, 0x12d8fb			; GISEL-NEXT: v_cvt_f32_u32_e32 v3, 0x12d8fb
	; GISEL-NEXT: v_mov_b32_e32 v4, 0xffed2705			; GISEL-NEXT: v_mov_b32_e32 v4, 0xffed2705
	; GISEL-NEXT: v_rcp_iflag_f32_e32 v3, v3			; GISEL-NEXT: v_rcp_iflag_f32_e32 v3, v3
	; GISEL-NEXT: v_mul_f32_e32 v3, 0x4f7ffffe, v3			; GISEL-NEXT: v_mul_f32_e32 v3, 0x4f7ffffe, v3
	; GISEL-NEXT: v_cvt_u32_f32_e32 v3, v3			; GISEL-NEXT: v_cvt_u32_f32_e32 v3, v3
	; GISEL-NEXT: v_mul_lo_u32 v4, v4, v3			; GISEL-NEXT: v_mul_lo_u32 v4, v3, v4
	; GISEL-NEXT: v_mul_hi_u32 v4, v3, v4			; GISEL-NEXT: v_mul_hi_u32 v4, v3, v4
	; GISEL-NEXT: v_add_i32_e32 v3, vcc, v3, v4			; GISEL-NEXT: v_add_i32_e32 v3, vcc, v3, v4
	; GISEL-NEXT: v_mul_hi_u32 v4, v0, v3			; GISEL-NEXT: v_mul_hi_u32 v4, v0, v3
	; GISEL-NEXT: v_mul_hi_u32 v3, v1, v3			; GISEL-NEXT: v_mul_hi_u32 v3, v1, v3
	; GISEL-NEXT: v_mul_lo_u32 v4, v4, s4			; GISEL-NEXT: v_mul_lo_u32 v4, v4, s4
	; GISEL-NEXT: v_mul_lo_u32 v3, v3, v2			; GISEL-NEXT: v_mul_lo_u32 v3, v3, v2
	; GISEL-NEXT: v_sub_i32_e32 v0, vcc, v0, v4			; GISEL-NEXT: v_sub_i32_e32 v0, vcc, v0, v4
	; GISEL-NEXT: v_sub_i32_e32 v1, vcc, v1, v3			; GISEL-NEXT: v_sub_i32_e32 v1, vcc, v1, v3
	Show All 14 Lines
	; CGP-LABEL: v_urem_v2i32_oddk_denom:			; CGP-LABEL: v_urem_v2i32_oddk_denom:
	; CGP: ; %bb.0:			; CGP: ; %bb.0:
	; CGP-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)			; CGP-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
	; CGP-NEXT: s_mov_b32 s4, 0x12d8fb			; CGP-NEXT: s_mov_b32 s4, 0x12d8fb
	; CGP-NEXT: v_rcp_iflag_f32_e32 v2, 0x4996c7d8			; CGP-NEXT: v_rcp_iflag_f32_e32 v2, 0x4996c7d8
	; CGP-NEXT: s_mov_b32 s5, 0xffed2705			; CGP-NEXT: s_mov_b32 s5, 0xffed2705
	; CGP-NEXT: v_mul_f32_e32 v2, 0x4f7ffffe, v2			; CGP-NEXT: v_mul_f32_e32 v2, 0x4f7ffffe, v2
	; CGP-NEXT: v_cvt_u32_f32_e32 v2, v2			; CGP-NEXT: v_cvt_u32_f32_e32 v2, v2
	; CGP-NEXT: v_mul_lo_u32 v3, s5, v2			; CGP-NEXT: v_mul_lo_u32 v3, v2, s5
	; CGP-NEXT: v_mul_hi_u32 v3, v2, v3			; CGP-NEXT: v_mul_hi_u32 v3, v2, v3
	; CGP-NEXT: v_add_i32_e32 v2, vcc, v2, v3			; CGP-NEXT: v_add_i32_e32 v2, vcc, v2, v3
	; CGP-NEXT: v_mul_hi_u32 v3, v0, v2			; CGP-NEXT: v_mul_hi_u32 v3, v0, v2
	; CGP-NEXT: v_mul_hi_u32 v2, v1, v2			; CGP-NEXT: v_mul_hi_u32 v2, v1, v2
	; CGP-NEXT: v_mul_lo_u32 v3, v3, s4			; CGP-NEXT: v_mul_lo_u32 v3, v3, s4
	; CGP-NEXT: v_mul_lo_u32 v2, v2, s4			; CGP-NEXT: v_mul_lo_u32 v2, v2, s4
	; CGP-NEXT: v_sub_i32_e32 v0, vcc, v0, v3			; CGP-NEXT: v_sub_i32_e32 v0, vcc, v0, v3
	; CGP-NEXT: v_sub_i32_e32 v1, vcc, v1, v2			; CGP-NEXT: v_sub_i32_e32 v1, vcc, v1, v2
	▲ Show 20 Lines • Show All 96 Lines • ▼ Show 20 Lines
	; CGP-NEXT: v_rcp_f32_e32 v4, v4			; CGP-NEXT: v_rcp_f32_e32 v4, v4
	; CGP-NEXT: v_rcp_f32_e32 v6, v6			; CGP-NEXT: v_rcp_f32_e32 v6, v6
	; CGP-NEXT: v_mul_f32_e32 v4, 0x4f7ffffe, v4			; CGP-NEXT: v_mul_f32_e32 v4, 0x4f7ffffe, v4
	; CGP-NEXT: v_mul_f32_e32 v6, 0x4f7ffffe, v6			; CGP-NEXT: v_mul_f32_e32 v6, 0x4f7ffffe, v6
	; CGP-NEXT: v_cvt_u32_f32_e32 v4, v4			; CGP-NEXT: v_cvt_u32_f32_e32 v4, v4
	; CGP-NEXT: v_cvt_u32_f32_e32 v6, v6			; CGP-NEXT: v_cvt_u32_f32_e32 v6, v6
	; CGP-NEXT: v_mul_lo_u32 v5, v5, v4			; CGP-NEXT: v_mul_lo_u32 v5, v5, v4
	; CGP-NEXT: v_mul_lo_u32 v7, v7, v6			; CGP-NEXT: v_mul_lo_u32 v7, v7, v6
	; CGP-NEXT: v_mul_lo_u32 v8, 0, v5
	; CGP-NEXT: v_mul_hi_u32 v5, v4, v5			; CGP-NEXT: v_mul_hi_u32 v5, v4, v5
	; CGP-NEXT: v_mul_lo_u32 v9, 0, v7
	; CGP-NEXT: v_mul_hi_u32 v7, v6, v7			; CGP-NEXT: v_mul_hi_u32 v7, v6, v7
	; CGP-NEXT: v_add_i32_e32 v5, vcc, v8, v5
	; CGP-NEXT: v_add_i32_e32 v7, vcc, v9, v7
	; CGP-NEXT: v_add_i32_e32 v4, vcc, v4, v5			; CGP-NEXT: v_add_i32_e32 v4, vcc, v4, v5
	; CGP-NEXT: v_add_i32_e32 v5, vcc, v6, v7			; CGP-NEXT: v_add_i32_e32 v5, vcc, v6, v7
	; CGP-NEXT: v_mul_lo_u32 v6, 0, v4
	; CGP-NEXT: v_mul_hi_u32 v4, v0, v4			; CGP-NEXT: v_mul_hi_u32 v4, v0, v4
	; CGP-NEXT: v_mul_lo_u32 v7, 0, v5
	; CGP-NEXT: v_mul_hi_u32 v5, v1, v5			; CGP-NEXT: v_mul_hi_u32 v5, v1, v5
	; CGP-NEXT: v_add_i32_e32 v4, vcc, v6, v4
	; CGP-NEXT: v_add_i32_e32 v5, vcc, v7, v5
	; CGP-NEXT: v_mul_lo_u32 v4, v4, v2			; CGP-NEXT: v_mul_lo_u32 v4, v4, v2
	; CGP-NEXT: v_mul_lo_u32 v5, v5, v3			; CGP-NEXT: v_mul_lo_u32 v5, v5, v3
	; CGP-NEXT: v_sub_i32_e32 v0, vcc, v0, v4			; CGP-NEXT: v_sub_i32_e32 v0, vcc, v0, v4
	; CGP-NEXT: v_sub_i32_e32 v1, vcc, v1, v5			; CGP-NEXT: v_sub_i32_e32 v1, vcc, v1, v5
	; CGP-NEXT: v_sub_i32_e32 v4, vcc, v0, v2			; CGP-NEXT: v_sub_i32_e32 v4, vcc, v0, v2
	; CGP-NEXT: v_sub_i32_e32 v5, vcc, v1, v3			; CGP-NEXT: v_sub_i32_e32 v5, vcc, v1, v3
	; CGP-NEXT: v_cmp_ge_u32_e32 vcc, v0, v2			; CGP-NEXT: v_cmp_ge_u32_e32 vcc, v0, v2
	; CGP-NEXT: v_cndmask_b32_e32 v0, v0, v4, vcc			; CGP-NEXT: v_cndmask_b32_e32 v0, v0, v4, vcc
	▲ Show 20 Lines • Show All 42 Lines • ▼ Show 20 Lines
	; CGP-NEXT: v_and_b32_e32 v0, 0xffffff, v0			; CGP-NEXT: v_and_b32_e32 v0, 0xffffff, v0
	; CGP-NEXT: v_and_b32_e32 v1, 0xffffff, v1			; CGP-NEXT: v_and_b32_e32 v1, 0xffffff, v1
	; CGP-NEXT: v_cvt_f32_u32_e32 v2, v1			; CGP-NEXT: v_cvt_f32_u32_e32 v2, v1
	; CGP-NEXT: v_sub_i32_e32 v3, vcc, 0, v1			; CGP-NEXT: v_sub_i32_e32 v3, vcc, 0, v1
	; CGP-NEXT: v_rcp_f32_e32 v2, v2			; CGP-NEXT: v_rcp_f32_e32 v2, v2
	; CGP-NEXT: v_mul_f32_e32 v2, 0x4f7ffffe, v2			; CGP-NEXT: v_mul_f32_e32 v2, 0x4f7ffffe, v2
	; CGP-NEXT: v_cvt_u32_f32_e32 v2, v2			; CGP-NEXT: v_cvt_u32_f32_e32 v2, v2
	; CGP-NEXT: v_mul_lo_u32 v3, v3, v2			; CGP-NEXT: v_mul_lo_u32 v3, v3, v2
	; CGP-NEXT: v_mul_lo_u32 v4, 0, v3
	; CGP-NEXT: v_mul_hi_u32 v3, v2, v3			; CGP-NEXT: v_mul_hi_u32 v3, v2, v3
	; CGP-NEXT: v_add_i32_e32 v3, vcc, v4, v3
	; CGP-NEXT: v_add_i32_e32 v2, vcc, v2, v3			; CGP-NEXT: v_add_i32_e32 v2, vcc, v2, v3
	; CGP-NEXT: v_mul_lo_u32 v3, 0, v2
	; CGP-NEXT: v_mul_hi_u32 v2, v0, v2			; CGP-NEXT: v_mul_hi_u32 v2, v0, v2
	; CGP-NEXT: v_add_i32_e32 v2, vcc, v3, v2
	; CGP-NEXT: v_mul_lo_u32 v2, v2, v1			; CGP-NEXT: v_mul_lo_u32 v2, v2, v1
	; CGP-NEXT: v_sub_i32_e32 v0, vcc, v0, v2			; CGP-NEXT: v_sub_i32_e32 v0, vcc, v0, v2
	; CGP-NEXT: v_sub_i32_e32 v2, vcc, v0, v1			; CGP-NEXT: v_sub_i32_e32 v2, vcc, v0, v1
	; CGP-NEXT: v_cmp_ge_u32_e32 vcc, v0, v1			; CGP-NEXT: v_cmp_ge_u32_e32 vcc, v0, v1
	; CGP-NEXT: v_cndmask_b32_e32 v0, v0, v2, vcc			; CGP-NEXT: v_cndmask_b32_e32 v0, v0, v2, vcc
	; CGP-NEXT: v_sub_i32_e32 v2, vcc, v0, v1			; CGP-NEXT: v_sub_i32_e32 v2, vcc, v0, v1
	; CGP-NEXT: v_cmp_ge_u32_e32 vcc, v0, v1			; CGP-NEXT: v_cmp_ge_u32_e32 vcc, v0, v1
	; CGP-NEXT: v_cndmask_b32_e32 v0, v0, v2, vcc			; CGP-NEXT: v_cndmask_b32_e32 v0, v0, v2, vcc
	▲ Show 20 Lines • Show All 62 Lines • ▼ Show 20 Lines
	; CGP-NEXT: v_rcp_f32_e32 v4, v4			; CGP-NEXT: v_rcp_f32_e32 v4, v4
	; CGP-NEXT: v_rcp_f32_e32 v6, v6			; CGP-NEXT: v_rcp_f32_e32 v6, v6
	; CGP-NEXT: v_mul_f32_e32 v4, 0x4f7ffffe, v4			; CGP-NEXT: v_mul_f32_e32 v4, 0x4f7ffffe, v4
	; CGP-NEXT: v_mul_f32_e32 v6, 0x4f7ffffe, v6			; CGP-NEXT: v_mul_f32_e32 v6, 0x4f7ffffe, v6
	; CGP-NEXT: v_cvt_u32_f32_e32 v4, v4			; CGP-NEXT: v_cvt_u32_f32_e32 v4, v4
	; CGP-NEXT: v_cvt_u32_f32_e32 v6, v6			; CGP-NEXT: v_cvt_u32_f32_e32 v6, v6
	; CGP-NEXT: v_mul_lo_u32 v5, v5, v4			; CGP-NEXT: v_mul_lo_u32 v5, v5, v4
	; CGP-NEXT: v_mul_lo_u32 v7, v7, v6			; CGP-NEXT: v_mul_lo_u32 v7, v7, v6
	; CGP-NEXT: v_mul_lo_u32 v8, 0, v5
	; CGP-NEXT: v_mul_hi_u32 v5, v4, v5			; CGP-NEXT: v_mul_hi_u32 v5, v4, v5
	; CGP-NEXT: v_mul_lo_u32 v9, 0, v7
	; CGP-NEXT: v_mul_hi_u32 v7, v6, v7			; CGP-NEXT: v_mul_hi_u32 v7, v6, v7
	; CGP-NEXT: v_add_i32_e32 v5, vcc, v8, v5
	; CGP-NEXT: v_add_i32_e32 v7, vcc, v9, v7
	; CGP-NEXT: v_add_i32_e32 v4, vcc, v4, v5			; CGP-NEXT: v_add_i32_e32 v4, vcc, v4, v5
	; CGP-NEXT: v_add_i32_e32 v5, vcc, v6, v7			; CGP-NEXT: v_add_i32_e32 v5, vcc, v6, v7
	; CGP-NEXT: v_mul_lo_u32 v6, 0, v4
	; CGP-NEXT: v_mul_hi_u32 v4, v0, v4			; CGP-NEXT: v_mul_hi_u32 v4, v0, v4
	; CGP-NEXT: v_mul_lo_u32 v7, 0, v5
	; CGP-NEXT: v_mul_hi_u32 v5, v1, v5			; CGP-NEXT: v_mul_hi_u32 v5, v1, v5
	; CGP-NEXT: v_add_i32_e32 v4, vcc, v6, v4
	; CGP-NEXT: v_add_i32_e32 v5, vcc, v7, v5
	; CGP-NEXT: v_mul_lo_u32 v4, v4, v2			; CGP-NEXT: v_mul_lo_u32 v4, v4, v2
	; CGP-NEXT: v_mul_lo_u32 v5, v5, v3			; CGP-NEXT: v_mul_lo_u32 v5, v5, v3
	; CGP-NEXT: v_sub_i32_e32 v0, vcc, v0, v4			; CGP-NEXT: v_sub_i32_e32 v0, vcc, v0, v4
	; CGP-NEXT: v_sub_i32_e32 v1, vcc, v1, v5			; CGP-NEXT: v_sub_i32_e32 v1, vcc, v1, v5
	; CGP-NEXT: v_sub_i32_e32 v4, vcc, v0, v2			; CGP-NEXT: v_sub_i32_e32 v4, vcc, v0, v2
	; CGP-NEXT: v_sub_i32_e32 v5, vcc, v1, v3			; CGP-NEXT: v_sub_i32_e32 v5, vcc, v1, v3
	; CGP-NEXT: v_cmp_ge_u32_e32 vcc, v0, v2			; CGP-NEXT: v_cmp_ge_u32_e32 vcc, v0, v2
	; CGP-NEXT: v_cndmask_b32_e32 v0, v0, v4, vcc			; CGP-NEXT: v_cndmask_b32_e32 v0, v0, v4, vcc
	Show All 14 Lines

llvm/test/CodeGen/AMDGPU/GlobalISel/urem.i64.ll

	Show First 20 Lines • Show All 979 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: v_mov_b32_e32 v5, s7			; CHECK-NEXT: v_mov_b32_e32 v5, s7
	; CHECK-NEXT: v_rcp_iflag_f32_e32 v3, v3			; CHECK-NEXT: v_rcp_iflag_f32_e32 v3, v3
	; CHECK-NEXT: v_mul_f32_e32 v3, 0x5f7ffffc, v3			; CHECK-NEXT: v_mul_f32_e32 v3, 0x5f7ffffc, v3
	; CHECK-NEXT: v_mul_f32_e32 v6, 0x2f800000, v3			; CHECK-NEXT: v_mul_f32_e32 v6, 0x2f800000, v3
	; CHECK-NEXT: v_trunc_f32_e32 v6, v6			; CHECK-NEXT: v_trunc_f32_e32 v6, v6
	; CHECK-NEXT: v_mac_f32_e32 v3, 0xcf800000, v6			; CHECK-NEXT: v_mac_f32_e32 v3, 0xcf800000, v6
	; CHECK-NEXT: v_cvt_u32_f32_e32 v6, v6			; CHECK-NEXT: v_cvt_u32_f32_e32 v6, v6
	; CHECK-NEXT: v_cvt_u32_f32_e32 v3, v3			; CHECK-NEXT: v_cvt_u32_f32_e32 v3, v3
	; CHECK-NEXT: v_mul_lo_u32 v7, s5, v6			; CHECK-NEXT: v_mul_lo_u32 v7, v6, s5
	; CHECK-NEXT: v_mul_lo_u32 v8, s5, v3			; CHECK-NEXT: v_mul_lo_u32 v8, v3, s5
	; CHECK-NEXT: v_mul_lo_u32 v9, -1, v3			; CHECK-NEXT: v_mul_hi_u32 v9, s5, v3
	; CHECK-NEXT: v_mul_hi_u32 v10, s5, v3			; CHECK-NEXT: v_sub_i32_e32 v7, vcc, v7, v3
	; CHECK-NEXT: v_add_i32_e32 v7, vcc, v9, v7			; CHECK-NEXT: v_add_i32_e32 v7, vcc, v7, v9
	; CHECK-NEXT: v_mul_lo_u32 v9, v6, v8			; CHECK-NEXT: v_mul_lo_u32 v9, v6, v8
	; CHECK-NEXT: v_mul_hi_u32 v11, v3, v8			; CHECK-NEXT: v_mul_hi_u32 v10, v3, v8
	; CHECK-NEXT: v_mul_hi_u32 v8, v6, v8			; CHECK-NEXT: v_mul_hi_u32 v8, v6, v8
	; CHECK-NEXT: v_add_i32_e32 v7, vcc, v7, v10			; CHECK-NEXT: v_mul_lo_u32 v11, v3, v7
	; CHECK-NEXT: v_mul_lo_u32 v10, v3, v7
	; CHECK-NEXT: v_mul_lo_u32 v12, v6, v7			; CHECK-NEXT: v_mul_lo_u32 v12, v6, v7
	; CHECK-NEXT: v_mul_hi_u32 v13, v3, v7			; CHECK-NEXT: v_mul_hi_u32 v13, v3, v7
	; CHECK-NEXT: v_mul_hi_u32 v7, v6, v7			; CHECK-NEXT: v_mul_hi_u32 v7, v6, v7
	; CHECK-NEXT: v_add_i32_e32 v9, vcc, v9, v10			; CHECK-NEXT: v_add_i32_e32 v9, vcc, v9, v11
	; CHECK-NEXT: v_cndmask_b32_e64 v10, 0, 1, vcc			; CHECK-NEXT: v_cndmask_b32_e64 v11, 0, 1, vcc
	; CHECK-NEXT: v_add_i32_e32 v8, vcc, v12, v8			; CHECK-NEXT: v_add_i32_e32 v8, vcc, v12, v8
	; CHECK-NEXT: v_cndmask_b32_e64 v12, 0, 1, vcc			; CHECK-NEXT: v_cndmask_b32_e64 v12, 0, 1, vcc
	; CHECK-NEXT: v_add_i32_e32 v9, vcc, v9, v11			; CHECK-NEXT: v_add_i32_e32 v9, vcc, v9, v10
	; CHECK-NEXT: v_cndmask_b32_e64 v9, 0, 1, vcc			; CHECK-NEXT: v_cndmask_b32_e64 v9, 0, 1, vcc
	; CHECK-NEXT: v_add_i32_e32 v8, vcc, v8, v13			; CHECK-NEXT: v_add_i32_e32 v8, vcc, v8, v13
	; CHECK-NEXT: v_cndmask_b32_e64 v11, 0, 1, vcc			; CHECK-NEXT: v_cndmask_b32_e64 v10, 0, 1, vcc
	; CHECK-NEXT: v_add_i32_e32 v9, vcc, v10, v9			; CHECK-NEXT: v_add_i32_e32 v9, vcc, v11, v9
	; CHECK-NEXT: v_add_i32_e32 v10, vcc, v12, v11			; CHECK-NEXT: v_add_i32_e32 v10, vcc, v12, v10
	; CHECK-NEXT: v_add_i32_e32 v8, vcc, v8, v9			; CHECK-NEXT: v_add_i32_e32 v8, vcc, v8, v9
	; CHECK-NEXT: v_cndmask_b32_e64 v9, 0, 1, vcc			; CHECK-NEXT: v_cndmask_b32_e64 v9, 0, 1, vcc
	; CHECK-NEXT: v_add_i32_e32 v9, vcc, v10, v9			; CHECK-NEXT: v_add_i32_e32 v9, vcc, v10, v9
	; CHECK-NEXT: v_add_i32_e32 v7, vcc, v7, v9			; CHECK-NEXT: v_add_i32_e32 v7, vcc, v7, v9
	; CHECK-NEXT: v_add_i32_e32 v3, vcc, v3, v8			; CHECK-NEXT: v_add_i32_e32 v3, vcc, v3, v8
	; CHECK-NEXT: v_addc_u32_e32 v6, vcc, v6, v7, vcc			; CHECK-NEXT: v_addc_u32_e32 v6, vcc, v6, v7, vcc
	; CHECK-NEXT: v_mul_lo_u32 v7, s5, v3			; CHECK-NEXT: v_mul_lo_u32 v7, v3, s5
	; CHECK-NEXT: v_mul_lo_u32 v8, -1, v3			; CHECK-NEXT: v_mul_hi_u32 v8, s5, v3
	; CHECK-NEXT: v_mul_hi_u32 v9, s5, v3			; CHECK-NEXT: v_mul_lo_u32 v9, v6, s5
	; CHECK-NEXT: v_mul_lo_u32 v10, s5, v6			; CHECK-NEXT: v_mul_lo_u32 v10, v6, v7
	; CHECK-NEXT: v_mul_lo_u32 v11, v6, v7			; CHECK-NEXT: v_mul_hi_u32 v11, v3, v7
	; CHECK-NEXT: v_mul_hi_u32 v12, v3, v7
	; CHECK-NEXT: v_mul_hi_u32 v7, v6, v7			; CHECK-NEXT: v_mul_hi_u32 v7, v6, v7
	; CHECK-NEXT: v_add_i32_e32 v8, vcc, v8, v10			; CHECK-NEXT: v_sub_i32_e32 v9, vcc, v9, v3
	; CHECK-NEXT: v_add_i32_e32 v8, vcc, v8, v9			; CHECK-NEXT: v_add_i32_e32 v8, vcc, v9, v8
	; CHECK-NEXT: v_mul_lo_u32 v9, v3, v8			; CHECK-NEXT: v_mul_lo_u32 v9, v3, v8
	; CHECK-NEXT: v_mul_lo_u32 v10, v6, v8			; CHECK-NEXT: v_mul_lo_u32 v12, v6, v8
	; CHECK-NEXT: v_mul_hi_u32 v13, v3, v8			; CHECK-NEXT: v_mul_hi_u32 v13, v3, v8
	; CHECK-NEXT: v_mul_hi_u32 v8, v6, v8			; CHECK-NEXT: v_mul_hi_u32 v8, v6, v8
	; CHECK-NEXT: v_add_i32_e32 v9, vcc, v11, v9			; CHECK-NEXT: v_add_i32_e32 v9, vcc, v10, v9
	; CHECK-NEXT: v_cndmask_b32_e64 v11, 0, 1, vcc
	; CHECK-NEXT: v_add_i32_e32 v7, vcc, v10, v7
	; CHECK-NEXT: v_cndmask_b32_e64 v10, 0, 1, vcc			; CHECK-NEXT: v_cndmask_b32_e64 v10, 0, 1, vcc
	; CHECK-NEXT: v_add_i32_e32 v9, vcc, v9, v12			; CHECK-NEXT: v_add_i32_e32 v7, vcc, v12, v7
				; CHECK-NEXT: v_cndmask_b32_e64 v12, 0, 1, vcc
				; CHECK-NEXT: v_add_i32_e32 v9, vcc, v9, v11
	; CHECK-NEXT: v_cndmask_b32_e64 v9, 0, 1, vcc			; CHECK-NEXT: v_cndmask_b32_e64 v9, 0, 1, vcc
	; CHECK-NEXT: v_add_i32_e32 v7, vcc, v7, v13			; CHECK-NEXT: v_add_i32_e32 v7, vcc, v7, v13
	; CHECK-NEXT: v_cndmask_b32_e64 v12, 0, 1, vcc			; CHECK-NEXT: v_cndmask_b32_e64 v11, 0, 1, vcc
	; CHECK-NEXT: v_add_i32_e32 v9, vcc, v11, v9			; CHECK-NEXT: v_add_i32_e32 v9, vcc, v10, v9
	; CHECK-NEXT: v_add_i32_e32 v10, vcc, v10, v12			; CHECK-NEXT: v_add_i32_e32 v10, vcc, v12, v11
	; CHECK-NEXT: v_add_i32_e32 v7, vcc, v7, v9			; CHECK-NEXT: v_add_i32_e32 v7, vcc, v7, v9
	; CHECK-NEXT: v_cndmask_b32_e64 v9, 0, 1, vcc			; CHECK-NEXT: v_cndmask_b32_e64 v9, 0, 1, vcc
	; CHECK-NEXT: v_add_i32_e32 v9, vcc, v10, v9			; CHECK-NEXT: v_add_i32_e32 v9, vcc, v10, v9
	; CHECK-NEXT: v_add_i32_e32 v8, vcc, v8, v9			; CHECK-NEXT: v_add_i32_e32 v8, vcc, v8, v9
	; CHECK-NEXT: v_add_i32_e32 v3, vcc, v3, v7			; CHECK-NEXT: v_add_i32_e32 v3, vcc, v3, v7
	; CHECK-NEXT: v_addc_u32_e32 v6, vcc, v6, v8, vcc			; CHECK-NEXT: v_addc_u32_e32 v6, vcc, v6, v8, vcc
	; CHECK-NEXT: v_mul_lo_u32 v7, v1, v3			; CHECK-NEXT: v_mul_lo_u32 v7, v1, v3
	; CHECK-NEXT: v_mul_hi_u32 v8, v0, v3			; CHECK-NEXT: v_mul_hi_u32 v8, v0, v3
	Show All 10 Lines
	; CHECK-NEXT: v_cndmask_b32_e64 v7, 0, 1, vcc			; CHECK-NEXT: v_cndmask_b32_e64 v7, 0, 1, vcc
	; CHECK-NEXT: v_add_i32_e32 v3, vcc, v3, v11			; CHECK-NEXT: v_add_i32_e32 v3, vcc, v3, v11
	; CHECK-NEXT: v_cndmask_b32_e64 v8, 0, 1, vcc			; CHECK-NEXT: v_cndmask_b32_e64 v8, 0, 1, vcc
	; CHECK-NEXT: v_add_i32_e32 v7, vcc, v9, v7			; CHECK-NEXT: v_add_i32_e32 v7, vcc, v9, v7
	; CHECK-NEXT: v_add_i32_e32 v8, vcc, v10, v8			; CHECK-NEXT: v_add_i32_e32 v8, vcc, v10, v8
	; CHECK-NEXT: v_add_i32_e32 v3, vcc, v3, v7			; CHECK-NEXT: v_add_i32_e32 v3, vcc, v3, v7
	; CHECK-NEXT: v_cndmask_b32_e64 v7, 0, 1, vcc			; CHECK-NEXT: v_cndmask_b32_e64 v7, 0, 1, vcc
	; CHECK-NEXT: v_add_i32_e32 v7, vcc, v8, v7			; CHECK-NEXT: v_add_i32_e32 v7, vcc, v8, v7
	; CHECK-NEXT: v_mul_lo_u32 v8, s4, v3			; CHECK-NEXT: v_mul_lo_u32 v8, v3, s4
	; CHECK-NEXT: v_mul_lo_u32 v9, 0, v3
	; CHECK-NEXT: v_mul_hi_u32 v3, s4, v3			; CHECK-NEXT: v_mul_hi_u32 v3, s4, v3
	; CHECK-NEXT: v_add_i32_e32 v6, vcc, v6, v7			; CHECK-NEXT: v_add_i32_e32 v6, vcc, v6, v7
	; CHECK-NEXT: v_mul_lo_u32 v6, s4, v6			; CHECK-NEXT: v_mul_lo_u32 v6, v6, s4
	; CHECK-NEXT: v_add_i32_e32 v6, vcc, v9, v6
	; CHECK-NEXT: v_add_i32_e32 v3, vcc, v6, v3			; CHECK-NEXT: v_add_i32_e32 v3, vcc, v6, v3
	; CHECK-NEXT: v_sub_i32_e32 v0, vcc, v0, v8			; CHECK-NEXT: v_sub_i32_e32 v0, vcc, v0, v8
	; CHECK-NEXT: v_subb_u32_e64 v6, s[4:5], v1, v3, vcc			; CHECK-NEXT: v_subb_u32_e64 v6, s[4:5], v1, v3, vcc
	; CHECK-NEXT: v_sub_i32_e64 v1, s[4:5], v1, v3			; CHECK-NEXT: v_sub_i32_e64 v1, s[4:5], v1, v3
	; CHECK-NEXT: v_cmp_ge_u32_e64 s[4:5], v0, v2			; CHECK-NEXT: v_cmp_ge_u32_e64 s[4:5], v0, v2
	; CHECK-NEXT: v_cndmask_b32_e64 v3, 0, -1, s[4:5]			; CHECK-NEXT: v_cndmask_b32_e64 v3, 0, -1, s[4:5]
	; CHECK-NEXT: v_cmp_eq_u32_e64 s[4:5], 0, v6			; CHECK-NEXT: v_cmp_eq_u32_e64 s[4:5], 0, v6
	; CHECK-NEXT: v_cndmask_b32_e64 v3, v4, v3, s[4:5]			; CHECK-NEXT: v_cndmask_b32_e64 v3, v4, v3, s[4:5]
	▲ Show 20 Lines • Show All 203 Lines • ▼ Show 20 Lines
	; GISEL-NEXT: v_add_i32_e32 v14, vcc, v14, v17			; GISEL-NEXT: v_add_i32_e32 v14, vcc, v14, v17
	; GISEL-NEXT: v_add_i32_e32 v12, vcc, v12, v16			; GISEL-NEXT: v_add_i32_e32 v12, vcc, v12, v16
	; GISEL-NEXT: v_add_i32_e32 v11, vcc, v13, v11			; GISEL-NEXT: v_add_i32_e32 v11, vcc, v13, v11
	; GISEL-NEXT: v_add_i32_e32 v8, vcc, v8, v15			; GISEL-NEXT: v_add_i32_e32 v8, vcc, v8, v15
	; GISEL-NEXT: v_cndmask_b32_e64 v13, 0, 1, vcc			; GISEL-NEXT: v_cndmask_b32_e64 v13, 0, 1, vcc
	; GISEL-NEXT: v_add_i32_e32 v7, vcc, v7, v12			; GISEL-NEXT: v_add_i32_e32 v7, vcc, v7, v12
	; GISEL-NEXT: v_cndmask_b32_e64 v12, 0, 1, vcc			; GISEL-NEXT: v_cndmask_b32_e64 v12, 0, 1, vcc
	; GISEL-NEXT: v_add_i32_e32 v13, vcc, v14, v13			; GISEL-NEXT: v_add_i32_e32 v13, vcc, v14, v13
	; GISEL-NEXT: v_mul_lo_u32 v14, s8, v8			; GISEL-NEXT: v_mul_lo_u32 v14, v8, s8
	; GISEL-NEXT: v_mul_lo_u32 v15, 0, v8
	; GISEL-NEXT: v_mul_hi_u32 v8, s8, v8			; GISEL-NEXT: v_mul_hi_u32 v8, s8, v8
	; GISEL-NEXT: v_add_i32_e32 v11, vcc, v11, v12			; GISEL-NEXT: v_add_i32_e32 v11, vcc, v11, v12
	; GISEL-NEXT: v_mul_lo_u32 v12, s8, v7			; GISEL-NEXT: v_mul_lo_u32 v12, v7, s8
	; GISEL-NEXT: v_mul_lo_u32 v16, 0, v7
	; GISEL-NEXT: v_mul_hi_u32 v7, s8, v7			; GISEL-NEXT: v_mul_hi_u32 v7, s8, v7
	; GISEL-NEXT: v_add_i32_e32 v9, vcc, v9, v13			; GISEL-NEXT: v_add_i32_e32 v9, vcc, v9, v13
	; GISEL-NEXT: v_add_i32_e32 v10, vcc, v10, v11			; GISEL-NEXT: v_add_i32_e32 v10, vcc, v10, v11
	; GISEL-NEXT: v_mul_lo_u32 v9, s8, v9			; GISEL-NEXT: v_mul_lo_u32 v9, v9, s8
	; GISEL-NEXT: v_mul_lo_u32 v10, s8, v10			; GISEL-NEXT: v_mul_lo_u32 v10, v10, s8
	; GISEL-NEXT: v_add_i32_e32 v9, vcc, v15, v9
	; GISEL-NEXT: v_add_i32_e32 v10, vcc, v16, v10
	; GISEL-NEXT: v_add_i32_e32 v8, vcc, v9, v8			; GISEL-NEXT: v_add_i32_e32 v8, vcc, v9, v8
	; GISEL-NEXT: v_add_i32_e32 v7, vcc, v10, v7			; GISEL-NEXT: v_add_i32_e32 v7, vcc, v10, v7
	; GISEL-NEXT: v_sub_i32_e32 v0, vcc, v0, v14			; GISEL-NEXT: v_sub_i32_e32 v0, vcc, v0, v14
	; GISEL-NEXT: v_subb_u32_e64 v9, s[4:5], v1, v8, vcc			; GISEL-NEXT: v_subb_u32_e64 v9, s[4:5], v1, v8, vcc
	; GISEL-NEXT: v_sub_i32_e64 v1, s[4:5], v1, v8			; GISEL-NEXT: v_sub_i32_e64 v1, s[4:5], v1, v8
	; GISEL-NEXT: v_cmp_ge_u32_e64 s[4:5], v0, v4			; GISEL-NEXT: v_cmp_ge_u32_e64 s[4:5], v0, v4
	; GISEL-NEXT: v_cndmask_b32_e64 v8, 0, -1, s[4:5]			; GISEL-NEXT: v_cndmask_b32_e64 v8, 0, -1, s[4:5]
	; GISEL-NEXT: v_sub_i32_e64 v2, s[4:5], v2, v12			; GISEL-NEXT: v_sub_i32_e64 v2, s[4:5], v2, v12
	▲ Show 20 Lines • Show All 63 Lines • ▼ Show 20 Lines
	; CGP-NEXT: v_mul_f32_e32 v10, 0x2f800000, v7			; CGP-NEXT: v_mul_f32_e32 v10, 0x2f800000, v7
	; CGP-NEXT: v_trunc_f32_e32 v8, v8			; CGP-NEXT: v_trunc_f32_e32 v8, v8
	; CGP-NEXT: v_trunc_f32_e32 v10, v10			; CGP-NEXT: v_trunc_f32_e32 v10, v10
	; CGP-NEXT: v_mac_f32_e32 v5, 0xcf800000, v8			; CGP-NEXT: v_mac_f32_e32 v5, 0xcf800000, v8
	; CGP-NEXT: v_cvt_u32_f32_e32 v8, v8			; CGP-NEXT: v_cvt_u32_f32_e32 v8, v8
	; CGP-NEXT: v_mac_f32_e32 v7, 0xcf800000, v10			; CGP-NEXT: v_mac_f32_e32 v7, 0xcf800000, v10
	; CGP-NEXT: v_cvt_u32_f32_e32 v10, v10			; CGP-NEXT: v_cvt_u32_f32_e32 v10, v10
	; CGP-NEXT: v_cvt_u32_f32_e32 v5, v5			; CGP-NEXT: v_cvt_u32_f32_e32 v5, v5
	; CGP-NEXT: v_mul_lo_u32 v11, s6, v8			; CGP-NEXT: v_mul_lo_u32 v11, v8, s6
	; CGP-NEXT: v_cvt_u32_f32_e32 v7, v7			; CGP-NEXT: v_cvt_u32_f32_e32 v7, v7
	; CGP-NEXT: v_mul_lo_u32 v12, s6, v10			; CGP-NEXT: v_mul_lo_u32 v12, v10, s6
	; CGP-NEXT: v_mul_lo_u32 v13, s6, v5			; CGP-NEXT: v_mul_lo_u32 v13, v5, s6
	; CGP-NEXT: v_mul_lo_u32 v14, -1, v5			; CGP-NEXT: v_mul_hi_u32 v14, s6, v5
	; CGP-NEXT: v_mul_hi_u32 v15, s6, v5			; CGP-NEXT: v_sub_i32_e32 v11, vcc, v11, v5
	; CGP-NEXT: v_mul_lo_u32 v16, s6, v7			; CGP-NEXT: v_mul_lo_u32 v15, v7, s6
	; CGP-NEXT: v_mul_lo_u32 v17, -1, v7			; CGP-NEXT: v_mul_hi_u32 v16, s6, v7
	; CGP-NEXT: v_mul_hi_u32 v18, s6, v7			; CGP-NEXT: v_sub_i32_e32 v12, vcc, v12, v7
	; CGP-NEXT: v_add_i32_e32 v11, vcc, v14, v11			; CGP-NEXT: v_add_i32_e32 v11, vcc, v11, v14
	; CGP-NEXT: v_mul_lo_u32 v14, v8, v13			; CGP-NEXT: v_mul_lo_u32 v14, v8, v13
	; CGP-NEXT: v_mul_hi_u32 v19, v5, v13			; CGP-NEXT: v_mul_hi_u32 v17, v5, v13
	; CGP-NEXT: v_mul_hi_u32 v13, v8, v13			; CGP-NEXT: v_mul_hi_u32 v13, v8, v13
	; CGP-NEXT: v_add_i32_e32 v12, vcc, v17, v12			; CGP-NEXT: v_add_i32_e32 v12, vcc, v12, v16
	; CGP-NEXT: v_mul_lo_u32 v17, v10, v16			; CGP-NEXT: v_mul_lo_u32 v16, v10, v15
	; CGP-NEXT: v_add_i32_e32 v11, vcc, v11, v15			; CGP-NEXT: v_mul_hi_u32 v18, v7, v15
	; CGP-NEXT: v_mul_hi_u32 v15, v7, v16			; CGP-NEXT: v_mul_hi_u32 v15, v10, v15
	; CGP-NEXT: v_mul_hi_u32 v16, v10, v16			; CGP-NEXT: v_mul_lo_u32 v19, v7, v12
	; CGP-NEXT: v_add_i32_e32 v12, vcc, v12, v18			; CGP-NEXT: v_add_i32_e32 v16, vcc, v16, v19
	; CGP-NEXT: v_mul_lo_u32 v18, v7, v12			; CGP-NEXT: v_cndmask_b32_e64 v19, 0, 1, vcc
	; CGP-NEXT: v_add_i32_e32 v17, vcc, v17, v18			; CGP-NEXT: v_add_i32_e32 v16, vcc, v16, v18
	; CGP-NEXT: v_cndmask_b32_e64 v18, 0, 1, vcc			; CGP-NEXT: v_mul_lo_u32 v16, v5, v11
	; CGP-NEXT: v_add_i32_e32 v15, vcc, v17, v15			; CGP-NEXT: v_mul_lo_u32 v18, v8, v11
	; CGP-NEXT: v_mul_lo_u32 v15, v5, v11			; CGP-NEXT: v_add_i32_e64 v14, s[4:5], v14, v16
	; CGP-NEXT: v_mul_lo_u32 v17, v8, v11			; CGP-NEXT: v_cndmask_b32_e64 v16, 0, 1, s[4:5]
	; CGP-NEXT: v_add_i32_e64 v14, s[4:5], v14, v15			; CGP-NEXT: v_add_i32_e64 v14, s[4:5], v14, v17
	; CGP-NEXT: v_cndmask_b32_e64 v15, 0, 1, s[4:5]
	; CGP-NEXT: v_add_i32_e64 v14, s[4:5], v14, v19
	; CGP-NEXT: v_mul_hi_u32 v14, v5, v11			; CGP-NEXT: v_mul_hi_u32 v14, v5, v11
	; CGP-NEXT: v_mul_hi_u32 v11, v8, v11			; CGP-NEXT: v_mul_hi_u32 v11, v8, v11
	; CGP-NEXT: v_cndmask_b32_e64 v19, 0, 1, s[4:5]
	; CGP-NEXT: v_add_i32_e64 v15, s[4:5], v15, v19
	; CGP-NEXT: v_mul_lo_u32 v19, v10, v12
	; CGP-NEXT: v_add_i32_e64 v13, s[4:5], v17, v13
	; CGP-NEXT: v_cndmask_b32_e64 v17, 0, 1, s[4:5]			; CGP-NEXT: v_cndmask_b32_e64 v17, 0, 1, s[4:5]
				; CGP-NEXT: v_add_i32_e64 v16, s[4:5], v16, v17
				; CGP-NEXT: v_mul_lo_u32 v17, v10, v12
				; CGP-NEXT: v_add_i32_e64 v13, s[4:5], v18, v13
				; CGP-NEXT: v_cndmask_b32_e64 v18, 0, 1, s[4:5]
	; CGP-NEXT: v_add_i32_e64 v13, s[4:5], v13, v14			; CGP-NEXT: v_add_i32_e64 v13, s[4:5], v13, v14
	; CGP-NEXT: v_cndmask_b32_e64 v14, 0, 1, s[4:5]			; CGP-NEXT: v_cndmask_b32_e64 v14, 0, 1, s[4:5]
	; CGP-NEXT: v_add_i32_e64 v14, s[4:5], v17, v14			; CGP-NEXT: v_add_i32_e64 v14, s[4:5], v18, v14
	; CGP-NEXT: v_cndmask_b32_e64 v17, 0, 1, vcc
	; CGP-NEXT: v_add_i32_e32 v17, vcc, v18, v17
	; CGP-NEXT: v_mul_hi_u32 v18, v7, v12
	; CGP-NEXT: v_mul_hi_u32 v12, v10, v12
	; CGP-NEXT: v_add_i32_e32 v16, vcc, v19, v16
	; CGP-NEXT: v_cndmask_b32_e64 v19, 0, 1, vcc
	; CGP-NEXT: v_add_i32_e32 v16, vcc, v16, v18
	; CGP-NEXT: v_cndmask_b32_e64 v18, 0, 1, vcc			; CGP-NEXT: v_cndmask_b32_e64 v18, 0, 1, vcc
	; CGP-NEXT: v_add_i32_e32 v18, vcc, v19, v18			; CGP-NEXT: v_add_i32_e32 v18, vcc, v19, v18
	; CGP-NEXT: v_add_i32_e32 v13, vcc, v13, v15			; CGP-NEXT: v_mul_hi_u32 v19, v7, v12
	; CGP-NEXT: v_cndmask_b32_e64 v15, 0, 1, vcc			; CGP-NEXT: v_mul_hi_u32 v12, v10, v12
	; CGP-NEXT: v_add_i32_e32 v16, vcc, v16, v17			; CGP-NEXT: v_add_i32_e32 v15, vcc, v17, v15
	; CGP-NEXT: v_cndmask_b32_e64 v17, 0, 1, vcc			; CGP-NEXT: v_cndmask_b32_e64 v17, 0, 1, vcc
	; CGP-NEXT: v_add_i32_e32 v14, vcc, v14, v15			; CGP-NEXT: v_add_i32_e32 v15, vcc, v15, v19
	; CGP-NEXT: v_add_i32_e32 v15, vcc, v18, v17			; CGP-NEXT: v_cndmask_b32_e64 v19, 0, 1, vcc
				; CGP-NEXT: v_add_i32_e32 v17, vcc, v17, v19
				; CGP-NEXT: v_add_i32_e32 v13, vcc, v13, v16
				; CGP-NEXT: v_cndmask_b32_e64 v16, 0, 1, vcc
				; CGP-NEXT: v_add_i32_e32 v15, vcc, v15, v18
				; CGP-NEXT: v_cndmask_b32_e64 v18, 0, 1, vcc
				; CGP-NEXT: v_add_i32_e32 v14, vcc, v14, v16
				; CGP-NEXT: v_add_i32_e32 v16, vcc, v17, v18
	; CGP-NEXT: v_add_i32_e32 v11, vcc, v11, v14			; CGP-NEXT: v_add_i32_e32 v11, vcc, v11, v14
	; CGP-NEXT: v_add_i32_e32 v12, vcc, v12, v15			; CGP-NEXT: v_add_i32_e32 v12, vcc, v12, v16
	; CGP-NEXT: v_add_i32_e32 v5, vcc, v5, v13			; CGP-NEXT: v_add_i32_e32 v5, vcc, v5, v13
	; CGP-NEXT: v_addc_u32_e32 v8, vcc, v8, v11, vcc			; CGP-NEXT: v_addc_u32_e32 v8, vcc, v8, v11, vcc
	; CGP-NEXT: v_mul_lo_u32 v11, s6, v5			; CGP-NEXT: v_mul_lo_u32 v11, v5, s6
	; CGP-NEXT: v_mul_lo_u32 v13, -1, v5			; CGP-NEXT: v_mul_hi_u32 v13, s6, v5
	; CGP-NEXT: v_mul_hi_u32 v14, s6, v5			; CGP-NEXT: v_add_i32_e32 v7, vcc, v7, v15
	; CGP-NEXT: v_add_i32_e32 v7, vcc, v7, v16
	; CGP-NEXT: v_addc_u32_e32 v10, vcc, v10, v12, vcc			; CGP-NEXT: v_addc_u32_e32 v10, vcc, v10, v12, vcc
	; CGP-NEXT: v_mul_lo_u32 v12, s6, v7			; CGP-NEXT: v_mul_lo_u32 v12, v7, s6
	; CGP-NEXT: v_mul_lo_u32 v15, -1, v7			; CGP-NEXT: v_mul_hi_u32 v14, s6, v7
	; CGP-NEXT: v_mul_hi_u32 v16, s6, v7			; CGP-NEXT: v_mul_lo_u32 v15, v8, s6
	; CGP-NEXT: v_mul_lo_u32 v17, s6, v8			; CGP-NEXT: v_mul_lo_u32 v16, v8, v11
	; CGP-NEXT: v_mul_lo_u32 v18, v8, v11			; CGP-NEXT: v_mul_hi_u32 v17, v5, v11
	; CGP-NEXT: v_mul_hi_u32 v19, v5, v11
	; CGP-NEXT: v_mul_hi_u32 v11, v8, v11			; CGP-NEXT: v_mul_hi_u32 v11, v8, v11
	; CGP-NEXT: v_add_i32_e32 v13, vcc, v13, v17			; CGP-NEXT: v_mul_lo_u32 v18, v10, s6
	; CGP-NEXT: v_mul_lo_u32 v17, s6, v10			; CGP-NEXT: v_mul_lo_u32 v19, v10, v12
	; CGP-NEXT: v_add_i32_e32 v15, vcc, v15, v17			; CGP-NEXT: v_sub_i32_e32 v15, vcc, v15, v5
	; CGP-NEXT: v_mul_lo_u32 v17, v10, v12			; CGP-NEXT: v_add_i32_e32 v13, vcc, v15, v13
	; CGP-NEXT: v_add_i32_e32 v13, vcc, v13, v14			; CGP-NEXT: v_mul_hi_u32 v15, v7, v12
	; CGP-NEXT: v_mul_hi_u32 v14, v7, v12
	; CGP-NEXT: v_mul_hi_u32 v12, v10, v12			; CGP-NEXT: v_mul_hi_u32 v12, v10, v12
	; CGP-NEXT: v_add_i32_e32 v15, vcc, v15, v16			; CGP-NEXT: v_sub_i32_e32 v18, vcc, v18, v7
	; CGP-NEXT: v_mul_lo_u32 v16, v7, v15			; CGP-NEXT: v_add_i32_e32 v14, vcc, v18, v14
	; CGP-NEXT: v_add_i32_e32 v16, vcc, v17, v16			; CGP-NEXT: v_mul_lo_u32 v18, v7, v14
	; CGP-NEXT: v_cndmask_b32_e64 v17, 0, 1, vcc			; CGP-NEXT: v_add_i32_e32 v18, vcc, v19, v18
	; CGP-NEXT: v_add_i32_e32 v14, vcc, v16, v14
	; CGP-NEXT: v_mul_lo_u32 v14, v5, v13
	; CGP-NEXT: v_mul_lo_u32 v16, v8, v13
	; CGP-NEXT: v_add_i32_e64 v14, s[4:5], v18, v14
	; CGP-NEXT: v_cndmask_b32_e64 v18, 0, 1, s[4:5]
	; CGP-NEXT: v_add_i32_e64 v14, s[4:5], v14, v19
	; CGP-NEXT: v_mul_hi_u32 v14, v5, v13
	; CGP-NEXT: v_cndmask_b32_e64 v19, 0, 1, s[4:5]
	; CGP-NEXT: v_add_i32_e64 v18, s[4:5], v18, v19
	; CGP-NEXT: v_mul_lo_u32 v19, v10, v15
	; CGP-NEXT: v_add_i32_e64 v11, s[4:5], v16, v11
	; CGP-NEXT: v_cndmask_b32_e64 v16, 0, 1, s[4:5]
	; CGP-NEXT: v_add_i32_e64 v11, s[4:5], v11, v14
	; CGP-NEXT: v_cndmask_b32_e64 v14, 0, 1, s[4:5]
	; CGP-NEXT: v_add_i32_e64 v14, s[4:5], v16, v14
	; CGP-NEXT: v_cndmask_b32_e64 v16, 0, 1, vcc
	; CGP-NEXT: v_add_i32_e32 v16, vcc, v17, v16
	; CGP-NEXT: v_mul_hi_u32 v17, v7, v15
	; CGP-NEXT: v_add_i32_e32 v12, vcc, v19, v12
	; CGP-NEXT: v_cndmask_b32_e64 v19, 0, 1, vcc			; CGP-NEXT: v_cndmask_b32_e64 v19, 0, 1, vcc
	; CGP-NEXT: v_add_i32_e32 v12, vcc, v12, v17			; CGP-NEXT: v_add_i32_e32 v15, vcc, v18, v15
				; CGP-NEXT: v_mul_lo_u32 v15, v5, v13
				; CGP-NEXT: v_mul_lo_u32 v18, v8, v13
				; CGP-NEXT: v_add_i32_e64 v15, s[4:5], v16, v15
				; CGP-NEXT: v_cndmask_b32_e64 v16, 0, 1, s[4:5]
				; CGP-NEXT: v_add_i32_e64 v15, s[4:5], v15, v17
				; CGP-NEXT: v_mul_hi_u32 v15, v5, v13
				; CGP-NEXT: v_cndmask_b32_e64 v17, 0, 1, s[4:5]
				; CGP-NEXT: v_add_i32_e64 v16, s[4:5], v16, v17
				; CGP-NEXT: v_mul_lo_u32 v17, v10, v14
				; CGP-NEXT: v_add_i32_e64 v11, s[4:5], v18, v11
				; CGP-NEXT: v_cndmask_b32_e64 v18, 0, 1, s[4:5]
				; CGP-NEXT: v_add_i32_e64 v11, s[4:5], v11, v15
				; CGP-NEXT: v_cndmask_b32_e64 v15, 0, 1, s[4:5]
				; CGP-NEXT: v_add_i32_e64 v15, s[4:5], v18, v15
				; CGP-NEXT: v_cndmask_b32_e64 v18, 0, 1, vcc
				; CGP-NEXT: v_add_i32_e32 v18, vcc, v19, v18
				; CGP-NEXT: v_mul_hi_u32 v19, v7, v14
				; CGP-NEXT: v_add_i32_e32 v12, vcc, v17, v12
	; CGP-NEXT: v_cndmask_b32_e64 v17, 0, 1, vcc			; CGP-NEXT: v_cndmask_b32_e64 v17, 0, 1, vcc
	; CGP-NEXT: v_add_i32_e32 v17, vcc, v19, v17			; CGP-NEXT: v_add_i32_e32 v12, vcc, v12, v19
				; CGP-NEXT: v_cndmask_b32_e64 v19, 0, 1, vcc
				; CGP-NEXT: v_add_i32_e32 v17, vcc, v17, v19
	; CGP-NEXT: v_mov_b32_e32 v19, s7			; CGP-NEXT: v_mov_b32_e32 v19, s7
	; CGP-NEXT: v_add_i32_e32 v11, vcc, v11, v18			; CGP-NEXT: v_add_i32_e32 v11, vcc, v11, v16
	; CGP-NEXT: v_cndmask_b32_e64 v18, 0, 1, vcc
	; CGP-NEXT: v_add_i32_e32 v14, vcc, v14, v18
	; CGP-NEXT: v_mov_b32_e32 v18, s9
	; CGP-NEXT: v_mul_hi_u32 v13, v8, v13
	; CGP-NEXT: v_mul_hi_u32 v15, v10, v15
	; CGP-NEXT: v_add_i32_e32 v12, vcc, v12, v16
	; CGP-NEXT: v_cndmask_b32_e64 v16, 0, 1, vcc			; CGP-NEXT: v_cndmask_b32_e64 v16, 0, 1, vcc
	; CGP-NEXT: v_add_i32_e32 v16, vcc, v17, v16			; CGP-NEXT: v_add_i32_e32 v15, vcc, v15, v16
	; CGP-NEXT: v_add_i32_e32 v13, vcc, v13, v14			; CGP-NEXT: v_mov_b32_e32 v16, s9
	; CGP-NEXT: v_add_i32_e32 v14, vcc, v15, v16			; CGP-NEXT: v_mul_hi_u32 v13, v8, v13
				; CGP-NEXT: v_mul_hi_u32 v14, v10, v14
				; CGP-NEXT: v_add_i32_e32 v12, vcc, v12, v18
				; CGP-NEXT: v_cndmask_b32_e64 v18, 0, 1, vcc
				; CGP-NEXT: v_add_i32_e32 v17, vcc, v17, v18
				; CGP-NEXT: v_add_i32_e32 v13, vcc, v13, v15
				; CGP-NEXT: v_add_i32_e32 v14, vcc, v14, v17
	; CGP-NEXT: v_add_i32_e32 v5, vcc, v5, v11			; CGP-NEXT: v_add_i32_e32 v5, vcc, v5, v11
	; CGP-NEXT: v_addc_u32_e32 v8, vcc, v8, v13, vcc			; CGP-NEXT: v_addc_u32_e32 v8, vcc, v8, v13, vcc
	; CGP-NEXT: v_mul_lo_u32 v11, v1, v5			; CGP-NEXT: v_mul_lo_u32 v11, v1, v5
	; CGP-NEXT: v_mul_hi_u32 v13, v0, v5			; CGP-NEXT: v_mul_hi_u32 v13, v0, v5
	; CGP-NEXT: v_mul_hi_u32 v5, v1, v5			; CGP-NEXT: v_mul_hi_u32 v5, v1, v5
	; CGP-NEXT: v_add_i32_e32 v7, vcc, v7, v12			; CGP-NEXT: v_add_i32_e32 v7, vcc, v7, v12
	; CGP-NEXT: v_addc_u32_e32 v10, vcc, v10, v14, vcc			; CGP-NEXT: v_addc_u32_e32 v10, vcc, v10, v14, vcc
	; CGP-NEXT: v_mul_lo_u32 v12, v3, v7			; CGP-NEXT: v_mul_lo_u32 v12, v3, v7
	; CGP-NEXT: v_mul_hi_u32 v14, v2, v7			; CGP-NEXT: v_mul_hi_u32 v14, v2, v7
	; CGP-NEXT: v_mul_hi_u32 v7, v3, v7			; CGP-NEXT: v_mul_hi_u32 v7, v3, v7
	; CGP-NEXT: v_mul_lo_u32 v15, v0, v8			; CGP-NEXT: v_mul_lo_u32 v15, v0, v8
	; CGP-NEXT: v_mul_lo_u32 v16, v1, v8			; CGP-NEXT: v_mul_lo_u32 v17, v1, v8
	; CGP-NEXT: v_mul_hi_u32 v17, v0, v8			; CGP-NEXT: v_mul_hi_u32 v18, v0, v8
	; CGP-NEXT: v_mul_hi_u32 v8, v1, v8			; CGP-NEXT: v_mul_hi_u32 v8, v1, v8
	; CGP-NEXT: v_add_i32_e32 v11, vcc, v11, v15			; CGP-NEXT: v_add_i32_e32 v11, vcc, v11, v15
	; CGP-NEXT: v_cndmask_b32_e64 v15, 0, 1, vcc			; CGP-NEXT: v_cndmask_b32_e64 v15, 0, 1, vcc
	; CGP-NEXT: v_add_i32_e32 v11, vcc, v11, v13			; CGP-NEXT: v_add_i32_e32 v11, vcc, v11, v13
	; CGP-NEXT: v_mul_lo_u32 v11, v2, v10			; CGP-NEXT: v_mul_lo_u32 v11, v2, v10
	; CGP-NEXT: v_mul_lo_u32 v13, v3, v10			; CGP-NEXT: v_mul_lo_u32 v13, v3, v10
	; CGP-NEXT: v_add_i32_e64 v11, s[4:5], v12, v11			; CGP-NEXT: v_add_i32_e64 v11, s[4:5], v12, v11
	; CGP-NEXT: v_cndmask_b32_e64 v12, 0, 1, s[4:5]			; CGP-NEXT: v_cndmask_b32_e64 v12, 0, 1, s[4:5]
	; CGP-NEXT: v_add_i32_e64 v11, s[4:5], v11, v14			; CGP-NEXT: v_add_i32_e64 v11, s[4:5], v11, v14
	; CGP-NEXT: v_mul_hi_u32 v11, v2, v10			; CGP-NEXT: v_mul_hi_u32 v11, v2, v10
	; CGP-NEXT: v_mul_hi_u32 v10, v3, v10			; CGP-NEXT: v_mul_hi_u32 v10, v3, v10
	; CGP-NEXT: v_add_i32_e64 v5, s[6:7], v16, v5			; CGP-NEXT: v_add_i32_e64 v5, s[6:7], v17, v5
	; CGP-NEXT: v_cndmask_b32_e64 v14, 0, 1, s[6:7]			; CGP-NEXT: v_cndmask_b32_e64 v14, 0, 1, s[6:7]
	; CGP-NEXT: v_add_i32_e64 v7, s[6:7], v13, v7			; CGP-NEXT: v_add_i32_e64 v7, s[6:7], v13, v7
	; CGP-NEXT: v_cndmask_b32_e64 v13, 0, 1, s[6:7]			; CGP-NEXT: v_cndmask_b32_e64 v13, 0, 1, s[6:7]
	; CGP-NEXT: v_cndmask_b32_e64 v16, 0, 1, vcc
	; CGP-NEXT: v_add_i32_e32 v5, vcc, v5, v17
	; CGP-NEXT: v_cndmask_b32_e64 v17, 0, 1, vcc			; CGP-NEXT: v_cndmask_b32_e64 v17, 0, 1, vcc
	; CGP-NEXT: v_add_i32_e32 v15, vcc, v15, v16			; CGP-NEXT: v_add_i32_e32 v5, vcc, v5, v18
	; CGP-NEXT: v_cndmask_b32_e64 v16, 0, 1, s[4:5]			; CGP-NEXT: v_cndmask_b32_e64 v18, 0, 1, vcc
				; CGP-NEXT: v_add_i32_e32 v15, vcc, v15, v17
				; CGP-NEXT: v_cndmask_b32_e64 v17, 0, 1, s[4:5]
	; CGP-NEXT: v_add_i32_e32 v7, vcc, v7, v11			; CGP-NEXT: v_add_i32_e32 v7, vcc, v7, v11
	; CGP-NEXT: v_cndmask_b32_e64 v11, 0, 1, vcc			; CGP-NEXT: v_cndmask_b32_e64 v11, 0, 1, vcc
	; CGP-NEXT: v_add_i32_e32 v14, vcc, v14, v17			; CGP-NEXT: v_add_i32_e32 v14, vcc, v14, v18
	; CGP-NEXT: v_add_i32_e32 v12, vcc, v12, v16			; CGP-NEXT: v_add_i32_e32 v12, vcc, v12, v17
	; CGP-NEXT: v_add_i32_e32 v11, vcc, v13, v11			; CGP-NEXT: v_add_i32_e32 v11, vcc, v13, v11
	; CGP-NEXT: v_add_i32_e32 v5, vcc, v5, v15			; CGP-NEXT: v_add_i32_e32 v5, vcc, v5, v15
	; CGP-NEXT: v_cndmask_b32_e64 v13, 0, 1, vcc			; CGP-NEXT: v_cndmask_b32_e64 v13, 0, 1, vcc
	; CGP-NEXT: v_add_i32_e32 v7, vcc, v7, v12			; CGP-NEXT: v_add_i32_e32 v7, vcc, v7, v12
	; CGP-NEXT: v_cndmask_b32_e64 v12, 0, 1, vcc			; CGP-NEXT: v_cndmask_b32_e64 v12, 0, 1, vcc
	; CGP-NEXT: v_add_i32_e32 v13, vcc, v14, v13			; CGP-NEXT: v_add_i32_e32 v13, vcc, v14, v13
	; CGP-NEXT: v_mul_lo_u32 v14, s8, v5			; CGP-NEXT: v_mul_lo_u32 v14, v5, s8
	; CGP-NEXT: v_mul_lo_u32 v15, 0, v5
	; CGP-NEXT: v_mul_hi_u32 v5, s8, v5			; CGP-NEXT: v_mul_hi_u32 v5, s8, v5
	; CGP-NEXT: v_add_i32_e32 v11, vcc, v11, v12			; CGP-NEXT: v_add_i32_e32 v11, vcc, v11, v12
	; CGP-NEXT: v_mul_lo_u32 v12, s8, v7			; CGP-NEXT: v_mul_lo_u32 v12, v7, s8
	; CGP-NEXT: v_mul_lo_u32 v16, 0, v7
	; CGP-NEXT: v_mul_hi_u32 v7, s8, v7			; CGP-NEXT: v_mul_hi_u32 v7, s8, v7
	; CGP-NEXT: v_add_i32_e32 v8, vcc, v8, v13			; CGP-NEXT: v_add_i32_e32 v8, vcc, v8, v13
	; CGP-NEXT: v_add_i32_e32 v10, vcc, v10, v11			; CGP-NEXT: v_add_i32_e32 v10, vcc, v10, v11
	; CGP-NEXT: v_mul_lo_u32 v8, s8, v8			; CGP-NEXT: v_mul_lo_u32 v8, v8, s8
	; CGP-NEXT: v_mul_lo_u32 v10, s8, v10			; CGP-NEXT: v_mul_lo_u32 v10, v10, s8
	; CGP-NEXT: v_add_i32_e32 v8, vcc, v15, v8
	; CGP-NEXT: v_add_i32_e32 v10, vcc, v16, v10
	; CGP-NEXT: v_add_i32_e32 v5, vcc, v8, v5			; CGP-NEXT: v_add_i32_e32 v5, vcc, v8, v5
	; CGP-NEXT: v_add_i32_e32 v7, vcc, v10, v7			; CGP-NEXT: v_add_i32_e32 v7, vcc, v10, v7
	; CGP-NEXT: v_sub_i32_e32 v0, vcc, v0, v14			; CGP-NEXT: v_sub_i32_e32 v0, vcc, v0, v14
	; CGP-NEXT: v_subb_u32_e64 v8, s[4:5], v1, v5, vcc			; CGP-NEXT: v_subb_u32_e64 v8, s[4:5], v1, v5, vcc
	; CGP-NEXT: v_sub_i32_e64 v1, s[4:5], v1, v5			; CGP-NEXT: v_sub_i32_e64 v1, s[4:5], v1, v5
	; CGP-NEXT: v_cmp_ge_u32_e64 s[4:5], v0, v4			; CGP-NEXT: v_cmp_ge_u32_e64 s[4:5], v0, v4
	; CGP-NEXT: v_cndmask_b32_e64 v5, 0, -1, s[4:5]			; CGP-NEXT: v_cndmask_b32_e64 v5, 0, -1, s[4:5]
	; CGP-NEXT: v_sub_i32_e64 v2, s[4:5], v2, v12			; CGP-NEXT: v_sub_i32_e64 v2, s[4:5], v2, v12
	Show All 15 Lines
	; CGP-NEXT: v_subbrev_u32_e32 v3, vcc, 0, v3, vcc			; CGP-NEXT: v_subbrev_u32_e32 v3, vcc, 0, v3, vcc
	; CGP-NEXT: v_cmp_ge_u32_e32 vcc, v12, v4			; CGP-NEXT: v_cmp_ge_u32_e32 vcc, v12, v4
	; CGP-NEXT: v_cndmask_b32_e64 v13, 0, -1, vcc			; CGP-NEXT: v_cndmask_b32_e64 v13, 0, -1, vcc
	; CGP-NEXT: v_cmp_eq_u32_e32 vcc, 0, v1			; CGP-NEXT: v_cmp_eq_u32_e32 vcc, 0, v1
	; CGP-NEXT: v_cndmask_b32_e32 v9, v9, v11, vcc			; CGP-NEXT: v_cndmask_b32_e32 v9, v9, v11, vcc
	; CGP-NEXT: v_sub_i32_e32 v11, vcc, v7, v4			; CGP-NEXT: v_sub_i32_e32 v11, vcc, v7, v4
	; CGP-NEXT: v_subbrev_u32_e32 v14, vcc, 0, v1, vcc			; CGP-NEXT: v_subbrev_u32_e32 v14, vcc, 0, v1, vcc
	; CGP-NEXT: v_cmp_eq_u32_e32 vcc, 0, v3			; CGP-NEXT: v_cmp_eq_u32_e32 vcc, 0, v3
	; CGP-NEXT: v_cndmask_b32_e32 v13, v18, v13, vcc			; CGP-NEXT: v_cndmask_b32_e32 v13, v16, v13, vcc
	; CGP-NEXT: v_sub_i32_e32 v4, vcc, v12, v4			; CGP-NEXT: v_sub_i32_e32 v4, vcc, v12, v4
	; CGP-NEXT: v_subbrev_u32_e32 v15, vcc, 0, v3, vcc			; CGP-NEXT: v_subbrev_u32_e32 v15, vcc, 0, v3, vcc
	; CGP-NEXT: v_cmp_ne_u32_e32 vcc, 0, v9			; CGP-NEXT: v_cmp_ne_u32_e32 vcc, 0, v9
	; CGP-NEXT: v_cndmask_b32_e32 v7, v7, v11, vcc			; CGP-NEXT: v_cndmask_b32_e32 v7, v7, v11, vcc
	; CGP-NEXT: v_cmp_ne_u32_e64 s[4:5], 0, v13			; CGP-NEXT: v_cmp_ne_u32_e64 s[4:5], 0, v13
	; CGP-NEXT: v_cndmask_b32_e64 v4, v12, v4, s[4:5]			; CGP-NEXT: v_cndmask_b32_e64 v4, v12, v4, s[4:5]
	; CGP-NEXT: v_cndmask_b32_e32 v1, v1, v14, vcc			; CGP-NEXT: v_cndmask_b32_e32 v1, v1, v14, vcc
	; CGP-NEXT: v_cmp_ne_u32_e32 vcc, 0, v5			; CGP-NEXT: v_cmp_ne_u32_e32 vcc, 0, v5
	▲ Show 20 Lines • Show All 1,129 Lines • Show Last 20 Lines

This is an archive of the discontinued LLVM Phabricator instance.

[GlobalISel] New combine to commute constant operands to the RHSClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 486516

llvm/include/llvm/Target/GlobalISel/Combine.td

llvm/test/CodeGen/AArch64/GlobalISel/combine-add-of-sub.mir

llvm/test/CodeGen/AArch64/GlobalISel/combine-shift-immed-mismatch-crash.mir

llvm/test/CodeGen/AMDGPU/GlobalISel/combine-fold-binop-into-select.mir

llvm/test/CodeGen/AMDGPU/GlobalISel/fshl.ll

llvm/test/CodeGen/AMDGPU/GlobalISel/fshr.ll

llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.sbfe.ll

llvm/test/CodeGen/AMDGPU/GlobalISel/mul-known-bits.i64.ll

llvm/test/CodeGen/AMDGPU/GlobalISel/postlegalizer-combiner-trunc-bitcast-buildvector.mir

llvm/test/CodeGen/AMDGPU/GlobalISel/sdiv.i32.ll

llvm/test/CodeGen/AMDGPU/GlobalISel/srem.i32.ll

llvm/test/CodeGen/AMDGPU/GlobalISel/udiv.i32.ll

llvm/test/CodeGen/AMDGPU/GlobalISel/urem.i32.ll

llvm/test/CodeGen/AMDGPU/GlobalISel/urem.i64.ll

[GlobalISel] New combine to commute constant operands to the RHS
ClosedPublic