Diff 248898

llvm/lib/CodeGen/GlobalISel/Localizer.cpp

Show First 20 Lines • Show All 80 Lines • ▼ Show 20 Lines	for (auto RI = MBB.rbegin(), RE = MBB.rend(); RI != RE; ++RI) {
for (auto MOIt = MRI->use_begin(Reg), MOItEnd = MRI->use_end();		for (auto MOIt = MRI->use_begin(Reg), MOItEnd = MRI->use_end();
MOIt != MOItEnd;) {		MOIt != MOItEnd;) {
MachineOperand &MOUse = *MOIt++;		MachineOperand &MOUse = *MOIt++;
// Check if the use is already local.		// Check if the use is already local.
MachineBasicBlock *InsertMBB;		MachineBasicBlock *InsertMBB;
LLVM_DEBUG(MachineInstr &MIUse = *MOUse.getParent();		LLVM_DEBUG(MachineInstr &MIUse = *MOUse.getParent();
dbgs() << "Checking use: " << MIUse		dbgs() << "Checking use: " << MIUse
<< " #Opd: " << MIUse.getOperandNo(&MOUse) << '\n');		<< " #Opd: " << MIUse.getOperandNo(&MOUse) << '\n');
if (isLocalUse(MOUse, MI, InsertMBB))		if (isLocalUse(MOUse, MI, InsertMBB)) {
		// Even if we're in the same block, if the block is very large we could
		// still have many long live ranges. Try to do intra-block localization
		// too.
		LocalizedInstrs.insert(&MI);
continue;		continue;
		}
LLVM_DEBUG(dbgs() << "Fixing non-local use\n");		LLVM_DEBUG(dbgs() << "Fixing non-local use\n");
Changed = true;		Changed = true;
auto MBBAndReg = std::make_pair(InsertMBB, Reg);		auto MBBAndReg = std::make_pair(InsertMBB, Reg);
auto NewVRegIt = MBBWithLocalDef.find(MBBAndReg);		auto NewVRegIt = MBBWithLocalDef.find(MBBAndReg);
if (NewVRegIt == MBBWithLocalDef.end()) {		if (NewVRegIt == MBBWithLocalDef.end()) {
// Create the localized instruction.		// Create the localized instruction.
MachineInstr *LocalizedMI = MF.CloneMachineInstr(&MI);		MachineInstr *LocalizedMI = MF.CloneMachineInstr(&MI);
LocalizedInstrs.insert(LocalizedMI);		LocalizedInstrs.insert(LocalizedMI);
▲ Show 20 Lines • Show All 84 Lines • Show Last 20 Lines

llvm/test/CodeGen/AArch64/GlobalISel/localizer-arm64-tti.ll

	Show All 13 Lines
	; Some of the instructions in entry block are dead after this pass so don't			; Some of the instructions in entry block are dead after this pass so don't
	; strictly need to be checked for.			; strictly need to be checked for.

	define i32 @foo() {			define i32 @foo() {
	; CHECK-LABEL: name: foo			; CHECK-LABEL: name: foo
	; CHECK: bb.1.entry:			; CHECK: bb.1.entry:
	; CHECK: successors: %bb.2(0x40000000), %bb.3(0x40000000)			; CHECK: successors: %bb.2(0x40000000), %bb.3(0x40000000)
	; CHECK: [[GV:%[0-9]+]]:gpr(p0) = G_GLOBAL_VALUE @var1			; CHECK: [[GV:%[0-9]+]]:gpr(p0) = G_GLOBAL_VALUE @var1
	; CHECK: [[C:%[0-9]+]]:gpr(s32) = G_CONSTANT i32 1			; CHECK: [[C:%[0-9]+]]:gpr(s32) = G_CONSTANT i32 2
	; CHECK: [[C1:%[0-9]+]]:gpr(s32) = G_CONSTANT i32 2
	; CHECK: [[GV1:%[0-9]+]]:gpr(p0) = G_GLOBAL_VALUE @var2			; CHECK: [[GV1:%[0-9]+]]:gpr(p0) = G_GLOBAL_VALUE @var2
	; CHECK: [[C2:%[0-9]+]]:gpr(s32) = G_CONSTANT i32 3			; CHECK: [[C1:%[0-9]+]]:gpr(s32) = G_CONSTANT i32 3
	; CHECK: [[GV2:%[0-9]+]]:gpr(p0) = G_GLOBAL_VALUE @var3			; CHECK: [[GV2:%[0-9]+]]:gpr(p0) = G_GLOBAL_VALUE @var3
	; CHECK: [[C3:%[0-9]+]]:gpr(s32) = G_CONSTANT i32 0			; CHECK: [[C2:%[0-9]+]]:gpr(s32) = G_CONSTANT i32 0
	; CHECK: [[LOAD:%[0-9]+]]:gpr(s32) = G_LOAD [[GV]](p0) :: (dereferenceable load 4 from @var1)			; CHECK: [[LOAD:%[0-9]+]]:gpr(s32) = G_LOAD [[GV]](p0) :: (dereferenceable load 4 from @var1)
	; CHECK: [[ICMP:%[0-9]+]]:gpr(s32) = G_ICMP intpred(ne), [[LOAD]](s32), [[C]]			; CHECK: [[C3:%[0-9]+]]:gpr(s32) = G_CONSTANT i32 1
				; CHECK: [[ICMP:%[0-9]+]]:gpr(s32) = G_ICMP intpred(ne), [[LOAD]](s32), [[C3]]
	; CHECK: [[TRUNC:%[0-9]+]]:gpr(s1) = G_TRUNC [[ICMP]](s32)			; CHECK: [[TRUNC:%[0-9]+]]:gpr(s1) = G_TRUNC [[ICMP]](s32)
	; CHECK: G_BRCOND [[TRUNC]](s1), %bb.3			; CHECK: G_BRCOND [[TRUNC]](s1), %bb.3
	; CHECK: bb.2.if.then:			; CHECK: bb.2.if.then:
	; CHECK: successors: %bb.3(0x80000000)			; CHECK: successors: %bb.3(0x80000000)
	; CHECK: [[GV3:%[0-9]+]]:gpr(p0) = G_GLOBAL_VALUE @var2			; CHECK: [[GV3:%[0-9]+]]:gpr(p0) = G_GLOBAL_VALUE @var2
	; CHECK: [[C4:%[0-9]+]]:gpr(s32) = G_CONSTANT i32 2			; CHECK: [[C4:%[0-9]+]]:gpr(s32) = G_CONSTANT i32 2
	; CHECK: G_STORE [[C4]](s32), [[GV3]](p0) :: (store 4 into @var2)			; CHECK: G_STORE [[C4]](s32), [[GV3]](p0) :: (store 4 into @var2)
	; CHECK: [[C5:%[0-9]+]]:gpr(s32) = G_CONSTANT i32 3			; CHECK: [[C5:%[0-9]+]]:gpr(s32) = G_CONSTANT i32 3
	Show All 24 Lines

llvm/test/CodeGen/AArch64/GlobalISel/localizer.mir

Show All 33 Lines	if.then:
store i32 3, i32* @var1, align 4		store i32 3, i32* @var1, align 4
br label %if.end		br label %if.end

if.end:		if.end:
ret i32 0		ret i32 0
}		}

define void @test_inttoptr() { ret void }		define void @test_inttoptr() { ret void }
		define void @many_local_use_intra_block() { ret void }

...		...

---		---
name: local_use		name: local_use
legalized: true		legalized: true
regBankSelected: true		regBankSelected: true
body: \|		body: \|
▲ Show 20 Lines • Show All 280 Lines • ▼ Show 20 Lines
name: intrablock_with_globalvalue		name: intrablock_with_globalvalue
legalized: true		legalized: true
regBankSelected: true		regBankSelected: true
tracksRegLiveness: true		tracksRegLiveness: true
body: \|		body: \|
; CHECK-LABEL: name: intrablock_with_globalvalue		; CHECK-LABEL: name: intrablock_with_globalvalue
; CHECK: bb.0.entry:		; CHECK: bb.0.entry:
; CHECK: successors: %bb.1(0x40000000), %bb.2(0x40000000)		; CHECK: successors: %bb.1(0x40000000), %bb.2(0x40000000)
; CHECK: [[GV:%[0-9]+]]:gpr(p0) = G_GLOBAL_VALUE @var1		; CHECK: [[C:%[0-9]+]]:gpr(s32) = G_CONSTANT i32 2
; CHECK: [[C:%[0-9]+]]:gpr(s32) = G_CONSTANT i32 1		; CHECK: [[GV:%[0-9]+]]:gpr(p0) = G_GLOBAL_VALUE @var2
; CHECK: [[C1:%[0-9]+]]:gpr(s32) = G_CONSTANT i32 2		; CHECK: [[C1:%[0-9]+]]:gpr(s32) = G_CONSTANT i32 3
; CHECK: [[GV1:%[0-9]+]]:gpr(p0) = G_GLOBAL_VALUE @var2		; CHECK: [[GV1:%[0-9]+]]:gpr(p0) = G_GLOBAL_VALUE @var3
; CHECK: [[C2:%[0-9]+]]:gpr(s32) = G_CONSTANT i32 3		; CHECK: [[C2:%[0-9]+]]:gpr(s32) = G_CONSTANT i32 0
; CHECK: [[GV2:%[0-9]+]]:gpr(p0) = G_GLOBAL_VALUE @var3		; CHECK: [[GV2:%[0-9]+]]:gpr(p0) = G_GLOBAL_VALUE @var1
; CHECK: [[C3:%[0-9]+]]:gpr(s32) = G_CONSTANT i32 0		; CHECK: [[LOAD:%[0-9]+]]:gpr(s32) = G_LOAD [[GV2]](p0) :: (load 4 from @var1)
; CHECK: [[LOAD:%[0-9]+]]:gpr(s32) = G_LOAD [[GV]](p0) :: (load 4 from @var1)		; CHECK: [[C3:%[0-9]+]]:gpr(s32) = G_CONSTANT i32 1
; CHECK: [[ICMP:%[0-9]+]]:gpr(s32) = G_ICMP intpred(eq), [[LOAD]](s32), [[C]]		; CHECK: [[ICMP:%[0-9]+]]:gpr(s32) = G_ICMP intpred(eq), [[LOAD]](s32), [[C3]]
; CHECK: [[TRUNC:%[0-9]+]]:gpr(s1) = G_TRUNC [[ICMP]](s32)		; CHECK: [[TRUNC:%[0-9]+]]:gpr(s1) = G_TRUNC [[ICMP]](s32)
; CHECK: G_BRCOND [[TRUNC]](s1), %bb.1		; CHECK: G_BRCOND [[TRUNC]](s1), %bb.1
; CHECK: G_BR %bb.2		; CHECK: G_BR %bb.2
; CHECK: bb.1.if.then:		; CHECK: bb.1.if.then:
; CHECK: successors: %bb.2(0x80000000)		; CHECK: successors: %bb.2(0x80000000)
; CHECK: [[GV3:%[0-9]+]]:gpr(p0) = G_GLOBAL_VALUE @var2		; CHECK: [[GV3:%[0-9]+]]:gpr(p0) = G_GLOBAL_VALUE @var2
; CHECK: [[C4:%[0-9]+]]:gpr(s32) = G_CONSTANT i32 2		; CHECK: [[C4:%[0-9]+]]:gpr(s32) = G_CONSTANT i32 2
; CHECK: G_STORE [[C4]](s32), [[GV3]](p0) :: (store 4 into @var2)		; CHECK: G_STORE [[C4]](s32), [[GV3]](p0) :: (store 4 into @var2)
▲ Show 20 Lines • Show All 43 Lines • ▼ Show 20 Lines
tracksRegLiveness: true		tracksRegLiveness: true
body: \|		body: \|
; CHECK-LABEL: name: test_inttoptr		; CHECK-LABEL: name: test_inttoptr
; CHECK: bb.0:		; CHECK: bb.0:
; CHECK: successors: %bb.1(0x40000000), %bb.2(0x40000000)		; CHECK: successors: %bb.1(0x40000000), %bb.2(0x40000000)
; CHECK: liveins: $w0, $x1		; CHECK: liveins: $w0, $x1
; CHECK: [[COPY:%[0-9]+]]:gpr(s32) = COPY $w0		; CHECK: [[COPY:%[0-9]+]]:gpr(s32) = COPY $w0
; CHECK: [[COPY1:%[0-9]+]]:gpr(p0) = COPY $x1		; CHECK: [[COPY1:%[0-9]+]]:gpr(p0) = COPY $x1
; CHECK: [[C:%[0-9]+]]:gpr(s64) = G_CONSTANT i64 128		; CHECK: [[C:%[0-9]+]]:gpr(s64) = G_CONSTANT i64 0
; CHECK: [[C1:%[0-9]+]]:gpr(s32) = G_CONSTANT i32 0		; CHECK: [[INTTOPTR:%[0-9]+]]:gpr(p0) = G_INTTOPTR [[C]](s64)
; CHECK: [[C2:%[0-9]+]]:gpr(s64) = G_CONSTANT i64 0		; CHECK: [[C1:%[0-9]+]]:gpr(s64) = G_CONSTANT i64 128
; CHECK: [[INTTOPTR:%[0-9]+]]:gpr(p0) = G_INTTOPTR [[C2]](s64)		; CHECK: [[INTTOPTR1:%[0-9]+]]:gpr(p0) = G_INTTOPTR [[C1]](s64)
; CHECK: [[INTTOPTR1:%[0-9]+]]:gpr(p0) = G_INTTOPTR [[C]](s64)		; CHECK: [[C2:%[0-9]+]]:gpr(s32) = G_CONSTANT i32 0
; CHECK: [[ICMP:%[0-9]+]]:gpr(s32) = G_ICMP intpred(eq), [[COPY]](s32), [[C1]]		; CHECK: [[ICMP:%[0-9]+]]:gpr(s32) = G_ICMP intpred(eq), [[COPY]](s32), [[C2]]
; CHECK: [[TRUNC:%[0-9]+]]:gpr(s1) = G_TRUNC [[ICMP]](s32)		; CHECK: [[TRUNC:%[0-9]+]]:gpr(s1) = G_TRUNC [[ICMP]](s32)
; CHECK: G_BRCOND [[TRUNC]](s1), %bb.1		; CHECK: G_BRCOND [[TRUNC]](s1), %bb.1
; CHECK: G_BR %bb.2		; CHECK: G_BR %bb.2
; CHECK: bb.1:		; CHECK: bb.1:
; CHECK: [[ADD:%[0-9]+]]:gpr(s32) = G_ADD [[COPY]], [[COPY]]		; CHECK: [[ADD:%[0-9]+]]:gpr(s32) = G_ADD [[COPY]], [[COPY]]
; CHECK: G_STORE [[ADD]](s32), [[COPY1]](p0) :: (store 4)		; CHECK: G_STORE [[ADD]](s32), [[COPY1]](p0) :: (store 4)
; CHECK: [[C3:%[0-9]+]]:gpr(s64) = G_CONSTANT i64 128		; CHECK: [[C3:%[0-9]+]]:gpr(s64) = G_CONSTANT i64 128
; CHECK: [[INTTOPTR2:%[0-9]+]]:gpr(p0) = G_INTTOPTR [[C3]](s64)		; CHECK: [[INTTOPTR2:%[0-9]+]]:gpr(p0) = G_INTTOPTR [[C3]](s64)
Show All 25 Lines	bb.2:
$x0 = COPY %3(p0)		$x0 = COPY %3(p0)
RET_ReallyLR implicit $x0		RET_ReallyLR implicit $x0

bb.3:		bb.3:
$x0 = COPY %6(p0)		$x0 = COPY %6(p0)
RET_ReallyLR implicit $x0		RET_ReallyLR implicit $x0

...		...

		---
		name: many_local_use_intra_block
		legalized: true
		regBankSelected: true
		body: \|
		bb.0:
		; CHECK-LABEL: name: many_local_use_intra_block
		; CHECK: [[C:%[0-9]+]]:gpr(s32) = G_CONSTANT i32 1
		; CHECK: [[ADD:%[0-9]+]]:gpr(s32) = G_ADD [[C]], [[C]]
		; CHECK: [[ADD1:%[0-9]+]]:gpr(s32) = G_ADD [[C]], [[C]]
		; CHECK: [[ADD2:%[0-9]+]]:gpr(s32) = G_ADD [[C]], [[C]]
		; CHECK: [[ADD3:%[0-9]+]]:gpr(s32) = G_ADD [[C]], [[C]]
		; CHECK: [[ADD4:%[0-9]+]]:gpr(s32) = G_ADD [[C]], [[C]]
		; CHECK: [[C1:%[0-9]+]]:gpr(s32) = G_CONSTANT i32 2
		; CHECK: [[ADD5:%[0-9]+]]:gpr(s32) = G_ADD [[C1]], [[C1]]
		%0:gpr(s32) = G_CONSTANT i32 1
		%1:gpr(s32) = G_CONSTANT i32 2
		%2:gpr(s32) = G_ADD %0, %0
		%3:gpr(s32) = G_ADD %0, %0
		%4:gpr(s32) = G_ADD %0, %0
		%5:gpr(s32) = G_ADD %0, %0
		%6:gpr(s32) = G_ADD %0, %0
		%7:gpr(s32) = G_ADD %1, %1
		...

llvm/test/CodeGen/AArch64/GlobalISel/swifterror.ll

; RUN: llc -verify-machineinstrs -frame-pointer=all -global-isel < %s -mtriple=aarch64-apple-ios -disable-post-ra \| FileCheck %s		; RUN: llc -verify-machineinstrs -frame-pointer=all -global-isel < %s -mtriple=aarch64-apple-ios -disable-post-ra \| FileCheck %s

declare i8* @malloc(i64)		declare i8* @malloc(i64)
declare void @free(i8*)		declare void @free(i8*)
%swift_error = type {i64, i8}		%swift_error = type {i64, i8}

; This tests the basic usage of a swifterror parameter. "foo" is the function		; This tests the basic usage of a swifterror parameter. "foo" is the function
; that takes a swifterror parameter and "caller" is the caller of "foo".		; that takes a swifterror parameter and "caller" is the caller of "foo".
define float @foo(%swift_error** swifterror %error_ptr_ref) {		define float @foo(%swift_error** swifterror %error_ptr_ref) {
; CHECK-LABEL: foo:		; CHECK-LABEL: foo:
; CHECK: mov [[ID:w[0-9]+]], #1
; CHECK: mov w0, #16		; CHECK: mov w0, #16
; CHECK: malloc		; CHECK: malloc
		; CHECK: mov [[ID:w[0-9]+]], #1
; CHECK: strb [[ID]], [x0, #8]		; CHECK: strb [[ID]], [x0, #8]
; CHECK: mov x21, x0		; CHECK: mov x21, x0
; CHECK-NOT: x21		; CHECK-NOT: x21

entry:		entry:
%call = call i8* @malloc(i64 16)		%call = call i8* @malloc(i64 16)
%call.0 = bitcast i8* %call to %swift_error*		%call.0 = bitcast i8* %call to %swift_error*
store %swift_error* %call.0, %swift_error** %error_ptr_ref		store %swift_error* %call.0, %swift_error** %error_ptr_ref
▲ Show 20 Lines • Show All 137 Lines • ▼ Show 20 Lines

%struct.S = type { i32, i32, i32, i32, i32, i32 }		%struct.S = type { i32, i32, i32, i32, i32, i32 }

; "foo_sret" is a function that takes a swifterror parameter, it also has a sret		; "foo_sret" is a function that takes a swifterror parameter, it also has a sret
; parameter.		; parameter.
define void @foo_sret(%struct.S* sret %agg.result, i32 %val1, %swift_error** swifterror %error_ptr_ref) {		define void @foo_sret(%struct.S* sret %agg.result, i32 %val1, %swift_error** swifterror %error_ptr_ref) {
; CHECK-LABEL: foo_sret:		; CHECK-LABEL: foo_sret:
; CHECK: mov [[SRET:x[0-9]+]], x8		; CHECK: mov [[SRET:x[0-9]+]], x8
; CHECK: mov [[ID:w[0-9]+]], #1
; CHECK: mov w0, #16		; CHECK: mov w0, #16
; CHECK: malloc		; CHECK: malloc
		; CHECK: mov [[ID:w[0-9]+]], #1
; CHECK: strb [[ID]], [x0, #8]		; CHECK: strb [[ID]], [x0, #8]
; CHECK: str w{{.}}, [{{.}}[[SRET]], #4]		; CHECK: str w{{.}}, [{{.}}[[SRET]], #4]
; CHECK: mov x21, x0		; CHECK: mov x21, x0
; CHECK-NOT: x21		; CHECK-NOT: x21

entry:		entry:
%call = call i8* @malloc(i64 16)		%call = call i8* @malloc(i64 16)
%call.0 = bitcast i8* %call to %swift_error*		%call.0 = bitcast i8* %call to %swift_error*
Show All 37 Lines	handler:
ret float 1.0		ret float 1.0
}		}

; "foo_vararg" is a function that takes a swifterror parameter, it also has		; "foo_vararg" is a function that takes a swifterror parameter, it also has
; variable number of arguments.		; variable number of arguments.
declare void @llvm.va_start(i8*) nounwind		declare void @llvm.va_start(i8*) nounwind
define float @foo_vararg(%swift_error** swifterror %error_ptr_ref, ...) {		define float @foo_vararg(%swift_error** swifterror %error_ptr_ref, ...) {
; CHECK-LABEL: foo_vararg:		; CHECK-LABEL: foo_vararg:
; CHECK-DAG: mov [[ID:w[0-9]+]], #1
; CHECK: mov w0, #16		; CHECK: mov w0, #16
; CHECK: malloc		; CHECK: malloc
		; CHECK-DAG: mov [[ID:w[0-9]+]], #1
; CHECK-DAG: strb [[ID]], [x0, #8]		; CHECK-DAG: strb [[ID]], [x0, #8]

; First vararg		; First vararg
; CHECK: ldr {{w[0-9]+}}, [x[[ARG1:[0-9]+]]], #8		; CHECK: ldr {{w[0-9]+}}, [x[[ARG1:[0-9]+]]], #8
; Second vararg		; Second vararg
; CHECK: ldr {{w[0-9]+}}, [x[[ARG1]]], #8		; CHECK: ldr {{w[0-9]+}}, [x[[ARG1]]], #8
; Third vararg		; Third vararg
; CHECK: ldr {{w[0-9]+}}, [x[[ARG1]]], #8		; CHECK: ldr {{w[0-9]+}}, [x[[ARG1]]], #8
▲ Show 20 Lines • Show All 282 Lines • Show Last 20 Lines

llvm/test/CodeGen/AArch64/GlobalISel/translate-constant-dag.ll

	; NOTE: Assertions have been autogenerated by utils/update_mir_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_mir_test_checks.py
	; RUN: llc -mtriple aarch64 -O0 -stop-after=instruction-select -global-isel -verify-machineinstrs %s -o - 2>&1 \| FileCheck %s			; RUN: llc -mtriple aarch64 -O0 -stop-after=instruction-select -global-isel -verify-machineinstrs %s -o - 2>&1 \| FileCheck %s

	%dag = type { { { i8, { i8 } }, { { i8, { i8 } }, { i8 } } }, { { i8, { i8 } }, { i8 } } }			%dag = type { { { i8, { i8 } }, { { i8, { i8 } }, { i8 } } }, { { i8, { i8 } }, { i8 } } }

	define void @test_const(%dag* %dst) {			define void @test_const(%dag* %dst) {
	; CHECK-LABEL: name: test_const			; CHECK-LABEL: name: test_const
	; CHECK: bb.1.entry:			; CHECK: bb.1.entry:
	; CHECK: liveins: $x0			; CHECK: liveins: $x0
	; CHECK: [[COPY:%[0-9]+]]:gpr64sp = COPY $x0			; CHECK: [[COPY:%[0-9]+]]:gpr64sp = COPY $x0
	; CHECK: [[MOVi32imm:%[0-9]+]]:gpr32 = MOVi32imm 10			; CHECK: [[MOVi32imm:%[0-9]+]]:gpr32 = MOVi32imm 10
	; CHECK: [[MOVi32imm1:%[0-9]+]]:gpr32 = MOVi32imm 20
	; CHECK: [[MOVi32imm2:%[0-9]+]]:gpr32 = MOVi32imm 50
	; CHECK: STRBBui [[MOVi32imm]], [[COPY]], 0 :: (store 1 into %ir.dst)			; CHECK: STRBBui [[MOVi32imm]], [[COPY]], 0 :: (store 1 into %ir.dst)
				; CHECK: [[MOVi32imm1:%[0-9]+]]:gpr32 = MOVi32imm 20
	; CHECK: STRBBui [[MOVi32imm1]], [[COPY]], 1 :: (store 1 into %ir.dst + 1)			; CHECK: STRBBui [[MOVi32imm1]], [[COPY]], 1 :: (store 1 into %ir.dst + 1)
	; CHECK: STRBBui [[MOVi32imm]], [[COPY]], 2 :: (store 1 into %ir.dst + 2)			; CHECK: STRBBui [[MOVi32imm]], [[COPY]], 2 :: (store 1 into %ir.dst + 2)
	; CHECK: STRBBui [[MOVi32imm1]], [[COPY]], 3 :: (store 1 into %ir.dst + 3)			; CHECK: STRBBui [[MOVi32imm1]], [[COPY]], 3 :: (store 1 into %ir.dst + 3)
				; CHECK: [[MOVi32imm2:%[0-9]+]]:gpr32 = MOVi32imm 50
	; CHECK: STRBBui [[MOVi32imm2]], [[COPY]], 4 :: (store 1 into %ir.dst + 4)			; CHECK: STRBBui [[MOVi32imm2]], [[COPY]], 4 :: (store 1 into %ir.dst + 4)
	; CHECK: STRBBui [[MOVi32imm]], [[COPY]], 5 :: (store 1 into %ir.dst + 5)			; CHECK: STRBBui [[MOVi32imm]], [[COPY]], 5 :: (store 1 into %ir.dst + 5)
	; CHECK: STRBBui [[MOVi32imm1]], [[COPY]], 6 :: (store 1 into %ir.dst + 6)			; CHECK: STRBBui [[MOVi32imm1]], [[COPY]], 6 :: (store 1 into %ir.dst + 6)
	; CHECK: STRBBui [[MOVi32imm1]], [[COPY]], 7 :: (store 1 into %ir.dst + 7)			; CHECK: STRBBui [[MOVi32imm1]], [[COPY]], 7 :: (store 1 into %ir.dst + 7)
	; CHECK: STRBBui [[MOVi32imm]], [[COPY]], 0 :: (store 1 into %ir.dst)			; CHECK: STRBBui [[MOVi32imm]], [[COPY]], 0 :: (store 1 into %ir.dst)
	; CHECK: STRBBui [[MOVi32imm1]], [[COPY]], 1 :: (store 1 into %ir.dst + 1)			; CHECK: STRBBui [[MOVi32imm1]], [[COPY]], 1 :: (store 1 into %ir.dst + 1)
	; CHECK: STRBBui [[MOVi32imm]], [[COPY]], 2 :: (store 1 into %ir.dst + 2)			; CHECK: STRBBui [[MOVi32imm]], [[COPY]], 2 :: (store 1 into %ir.dst + 2)
	; CHECK: STRBBui [[MOVi32imm1]], [[COPY]], 3 :: (store 1 into %ir.dst + 3)			; CHECK: STRBBui [[MOVi32imm1]], [[COPY]], 3 :: (store 1 into %ir.dst + 3)
	▲ Show 20 Lines • Show All 72 Lines • Show Last 20 Lines

llvm/test/CodeGen/AArch64/tail-call.ll

	Show First 20 Lines • Show All 115 Lines • ▼ Show 20 Lines
	declare { [2 x float] } @get_vec2()			declare { [2 x float] } @get_vec2()

	define { [3 x float] } @test_add_elem() {			define { [3 x float] } @test_add_elem() {
	; SDAG-LABEL: test_add_elem:			; SDAG-LABEL: test_add_elem:
	; SDAG: bl get_vec2			; SDAG: bl get_vec2
	; SDAG: fmov s2, #1.0			; SDAG: fmov s2, #1.0
	; SDAG: ret			; SDAG: ret
	; GISEL-LABEL: test_add_elem:			; GISEL-LABEL: test_add_elem:
	; GISEL: fmov s8, #1.00000000			; GISEL: str x30, [sp, #-16]!
	; GISEL: bl get_vec2			; GISEL: bl get_vec2
	; GISEL: ldr x30, [sp, #8]			; GISEL: fmov s2, #1.0
	; GISEL: mov v2.16b, v8.16b			; GISEL: ldr x30, [sp], #16
	; GISEL: ldr d8, [sp], #16
	; GISEL: ret			; GISEL: ret

	%call = tail call { [2 x float] } @get_vec2()			%call = tail call { [2 x float] } @get_vec2()
	%arr = extractvalue { [2 x float] } %call, 0			%arr = extractvalue { [2 x float] } %call, 0
	%arr.0 = extractvalue [2 x float] %arr, 0			%arr.0 = extractvalue [2 x float] %arr, 0
	%arr.1 = extractvalue [2 x float] %arr, 1			%arr.1 = extractvalue [2 x float] %arr, 1

	%res.0 = insertvalue { [3 x float] } undef, float %arr.0, 0, 0			%res.0 = insertvalue { [3 x float] } undef, float %arr.0, 0, 0
	Show All 23 Lines

llvm/test/CodeGen/AArch64/tiny_model.ll

	Show First 20 Lines • Show All 54 Lines • ▼ Show 20 Lines
	; CHECK: // %bb.0: // %entry			; CHECK: // %bb.0: // %entry
	; CHECK-NEXT: adr x8, ptr			; CHECK-NEXT: adr x8, ptr
	; CHECK-NEXT: adr x9, dst			; CHECK-NEXT: adr x9, dst
	; CHECK-NEXT: str x9, [x8]			; CHECK-NEXT: str x9, [x8]
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	;			;
	; CHECK-GLOBISEL-LABEL: foo2:			; CHECK-GLOBISEL-LABEL: foo2:
	; CHECK-GLOBISEL: // %bb.0: // %entry			; CHECK-GLOBISEL: // %bb.0: // %entry
	; CHECK-GLOBISEL-NEXT: adr x8, dst			; CHECK-GLOBISEL-NEXT: adr x8, ptr
	; CHECK-GLOBISEL-NEXT: adr x9, ptr			; CHECK-GLOBISEL-NEXT: adr x9, dst
	; CHECK-GLOBISEL-NEXT: str x8, [x9]			; CHECK-GLOBISEL-NEXT: str x9, [x8]
	; CHECK-GLOBISEL-NEXT: ret			; CHECK-GLOBISEL-NEXT: ret
	;			;
	; CHECK-PIC-LABEL: foo2:			; CHECK-PIC-LABEL: foo2:
	; CHECK-PIC: // %bb.0: // %entry			; CHECK-PIC: // %bb.0: // %entry
	; CHECK-PIC-NEXT: ldr x8, :got:ptr			; CHECK-PIC-NEXT: ldr x8, :got:ptr
	; CHECK-PIC-NEXT: ldr x9, :got:dst			; CHECK-PIC-NEXT: ldr x9, :got:dst
	; CHECK-PIC-NEXT: str x9, [x8]			; CHECK-PIC-NEXT: str x9, [x8]
	; CHECK-PIC-NEXT: ret			; CHECK-PIC-NEXT: ret
	;			;
	; CHECK-PIC-GLOBISEL-LABEL: foo2:			; CHECK-PIC-GLOBISEL-LABEL: foo2:
	; CHECK-PIC-GLOBISEL: // %bb.0: // %entry			; CHECK-PIC-GLOBISEL: // %bb.0: // %entry
	; CHECK-PIC-GLOBISEL-NEXT: ldr x8, :got:dst			; CHECK-PIC-GLOBISEL-NEXT: ldr x8, :got:ptr
	; CHECK-PIC-GLOBISEL-NEXT: ldr x9, :got:ptr			; CHECK-PIC-GLOBISEL-NEXT: ldr x9, :got:dst
	; CHECK-PIC-GLOBISEL-NEXT: str x8, [x9]			; CHECK-PIC-GLOBISEL-NEXT: str x9, [x8]
	; CHECK-PIC-GLOBISEL-NEXT: ret			; CHECK-PIC-GLOBISEL-NEXT: ret
	entry:			entry:
	store i8* getelementptr inbounds ([65536 x i8], [65536 x i8]* @dst, i64 0, i64 0), i8** @ptr, align 8			store i8* getelementptr inbounds ([65536 x i8], [65536 x i8]* @dst, i64 0, i64 0), i8** @ptr, align 8
	ret void			ret void
	}			}

	define void @foo3() {			define void @foo3() {
	; FIXME: Needn't adr ptr			; FIXME: Needn't adr ptr
	▲ Show 20 Lines • Show All 86 Lines • ▼ Show 20 Lines
	; CHECK: // %bb.0: // %entry			; CHECK: // %bb.0: // %entry
	; CHECK-NEXT: adr x8, lptr			; CHECK-NEXT: adr x8, lptr
	; CHECK-NEXT: adr x9, ldst			; CHECK-NEXT: adr x9, ldst
	; CHECK-NEXT: str x9, [x8]			; CHECK-NEXT: str x9, [x8]
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	;			;
	; CHECK-GLOBISEL-LABEL: bar2:			; CHECK-GLOBISEL-LABEL: bar2:
	; CHECK-GLOBISEL: // %bb.0: // %entry			; CHECK-GLOBISEL: // %bb.0: // %entry
	; CHECK-GLOBISEL-NEXT: adr x8, ldst			; CHECK-GLOBISEL-NEXT: adr x8, lptr
	; CHECK-GLOBISEL-NEXT: adr x9, lptr			; CHECK-GLOBISEL-NEXT: adr x9, ldst
	; CHECK-GLOBISEL-NEXT: str x8, [x9]			; CHECK-GLOBISEL-NEXT: str x9, [x8]
	; CHECK-GLOBISEL-NEXT: ret			; CHECK-GLOBISEL-NEXT: ret
	;			;
	; CHECK-PIC-LABEL: bar2:			; CHECK-PIC-LABEL: bar2:
	; CHECK-PIC: // %bb.0: // %entry			; CHECK-PIC: // %bb.0: // %entry
	; CHECK-PIC-NEXT: adr x8, lptr			; CHECK-PIC-NEXT: adr x8, lptr
	; CHECK-PIC-NEXT: adr x9, ldst			; CHECK-PIC-NEXT: adr x9, ldst
	; CHECK-PIC-NEXT: str x9, [x8]			; CHECK-PIC-NEXT: str x9, [x8]
	; CHECK-PIC-NEXT: ret			; CHECK-PIC-NEXT: ret
	;			;
	; CHECK-PIC-GLOBISEL-LABEL: bar2:			; CHECK-PIC-GLOBISEL-LABEL: bar2:
	; CHECK-PIC-GLOBISEL: // %bb.0: // %entry			; CHECK-PIC-GLOBISEL: // %bb.0: // %entry
	; CHECK-PIC-GLOBISEL-NEXT: adr x8, ldst			; CHECK-PIC-GLOBISEL-NEXT: adr x8, lptr
	; CHECK-PIC-GLOBISEL-NEXT: adr x9, lptr			; CHECK-PIC-GLOBISEL-NEXT: adr x9, ldst
	; CHECK-PIC-GLOBISEL-NEXT: str x8, [x9]			; CHECK-PIC-GLOBISEL-NEXT: str x9, [x8]
	; CHECK-PIC-GLOBISEL-NEXT: ret			; CHECK-PIC-GLOBISEL-NEXT: ret
	entry:			entry:
	store i8* @ldst, i8** @lptr, align 8			store i8* @ldst, i8** @lptr, align 8
	ret void			ret void
	}			}

	define void @bar3() {			define void @bar3() {
	; FIXME: Needn't adr lptr			; FIXME: Needn't adr lptr
	▲ Show 20 Lines • Show All 85 Lines • ▼ Show 20 Lines
	; CHECK: // %bb.0: // %entry			; CHECK: // %bb.0: // %entry
	; CHECK-NEXT: adr x8, lptr			; CHECK-NEXT: adr x8, lptr
	; CHECK-NEXT: adr x9, lbdst			; CHECK-NEXT: adr x9, lbdst
	; CHECK-NEXT: str x9, [x8]			; CHECK-NEXT: str x9, [x8]
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	;			;
	; CHECK-GLOBISEL-LABEL: baz2:			; CHECK-GLOBISEL-LABEL: baz2:
	; CHECK-GLOBISEL: // %bb.0: // %entry			; CHECK-GLOBISEL: // %bb.0: // %entry
	; CHECK-GLOBISEL-NEXT: adr x8, lbdst			; CHECK-GLOBISEL-NEXT: adr x8, lptr
	; CHECK-GLOBISEL-NEXT: adr x9, lptr			; CHECK-GLOBISEL-NEXT: adr x9, lbdst
	; CHECK-GLOBISEL-NEXT: str x8, [x9]			; CHECK-GLOBISEL-NEXT: str x9, [x8]
	; CHECK-GLOBISEL-NEXT: ret			; CHECK-GLOBISEL-NEXT: ret
	;			;
	; CHECK-PIC-LABEL: baz2:			; CHECK-PIC-LABEL: baz2:
	; CHECK-PIC: // %bb.0: // %entry			; CHECK-PIC: // %bb.0: // %entry
	; CHECK-PIC-NEXT: adr x8, lptr			; CHECK-PIC-NEXT: adr x8, lptr
	; CHECK-PIC-NEXT: adr x9, lbdst			; CHECK-PIC-NEXT: adr x9, lbdst
	; CHECK-PIC-NEXT: str x9, [x8]			; CHECK-PIC-NEXT: str x9, [x8]
	; CHECK-PIC-NEXT: ret			; CHECK-PIC-NEXT: ret
	;			;
	; CHECK-PIC-GLOBISEL-LABEL: baz2:			; CHECK-PIC-GLOBISEL-LABEL: baz2:
	; CHECK-PIC-GLOBISEL: // %bb.0: // %entry			; CHECK-PIC-GLOBISEL: // %bb.0: // %entry
	; CHECK-PIC-GLOBISEL-NEXT: adr x8, lbdst			; CHECK-PIC-GLOBISEL-NEXT: adr x8, lptr
	; CHECK-PIC-GLOBISEL-NEXT: adr x9, lptr			; CHECK-PIC-GLOBISEL-NEXT: adr x9, lbdst
	; CHECK-PIC-GLOBISEL-NEXT: str x8, [x9]			; CHECK-PIC-GLOBISEL-NEXT: str x9, [x8]
	; CHECK-PIC-GLOBISEL-NEXT: ret			; CHECK-PIC-GLOBISEL-NEXT: ret
	entry:			entry:
	store i8* getelementptr inbounds ([65536 x i8], [65536 x i8]* @lbdst, i64 0, i64 0), i8** @lptr, align 8			store i8* getelementptr inbounds ([65536 x i8], [65536 x i8]* @lbdst, i64 0, i64 0), i8** @lptr, align 8
	ret void			ret void
	}			}

	define void @baz3() {			define void @baz3() {
	; FIXME: Needn't adr lptr			; FIXME: Needn't adr lptr
	▲ Show 20 Lines • Show All 92 Lines • Show Last 20 Lines

llvm/test/CodeGen/AMDGPU/GlobalISel/constant-bus-restriction.ll

	Show First 20 Lines • Show All 194 Lines • ▼ Show 20 Lines
	}			}

	define amdgpu_ps float @fcmp_s_s(float inreg %src0, float inreg %src1) {			define amdgpu_ps float @fcmp_s_s(float inreg %src0, float inreg %src1) {
	; GFX9-LABEL: name: fcmp_s_s			; GFX9-LABEL: name: fcmp_s_s
	; GFX9: bb.1 (%ir-block.0):			; GFX9: bb.1 (%ir-block.0):
	; GFX9: liveins: $sgpr2, $sgpr3			; GFX9: liveins: $sgpr2, $sgpr3
	; GFX9: [[COPY:%[0-9]+]]:sgpr(s32) = COPY $sgpr2			; GFX9: [[COPY:%[0-9]+]]:sgpr(s32) = COPY $sgpr2
	; GFX9: [[COPY1:%[0-9]+]]:sgpr(s32) = COPY $sgpr3			; GFX9: [[COPY1:%[0-9]+]]:sgpr(s32) = COPY $sgpr3
	; GFX9: [[C:%[0-9]+]]:sgpr(s32) = G_FCONSTANT float 1.000000e+00
	; GFX9: [[C1:%[0-9]+]]:sgpr(s32) = G_FCONSTANT float 0.000000e+00
	; GFX9: [[COPY2:%[0-9]+]]:vgpr(s32) = COPY [[COPY1]](s32)			; GFX9: [[COPY2:%[0-9]+]]:vgpr(s32) = COPY [[COPY1]](s32)
	; GFX9: [[FCMP:%[0-9]+]]:vcc(s1) = G_FCMP floatpred(oeq), [[COPY]](s32), [[COPY2]]			; GFX9: [[FCMP:%[0-9]+]]:vcc(s1) = G_FCMP floatpred(oeq), [[COPY]](s32), [[COPY2]]
	; GFX9: [[COPY3:%[0-9]+]]:vgpr(s32) = COPY [[C]](s32)			; GFX9: [[C:%[0-9]+]]:sgpr(s32) = G_FCONSTANT float 0.000000e+00
	; GFX9: [[COPY4:%[0-9]+]]:vgpr(s32) = COPY [[C1]](s32)			; GFX9: [[C1:%[0-9]+]]:sgpr(s32) = G_FCONSTANT float 1.000000e+00
				; GFX9: [[COPY3:%[0-9]+]]:vgpr(s32) = COPY [[C1]](s32)
				; GFX9: [[COPY4:%[0-9]+]]:vgpr(s32) = COPY [[C]](s32)
	; GFX9: [[SELECT:%[0-9]+]]:vgpr(s32) = G_SELECT [[FCMP]](s1), [[COPY3]], [[COPY4]]			; GFX9: [[SELECT:%[0-9]+]]:vgpr(s32) = G_SELECT [[FCMP]](s1), [[COPY3]], [[COPY4]]
	; GFX9: $vgpr0 = COPY [[SELECT]](s32)			; GFX9: $vgpr0 = COPY [[SELECT]](s32)
	; GFX9: SI_RETURN_TO_EPILOG implicit $vgpr0			; GFX9: SI_RETURN_TO_EPILOG implicit $vgpr0
	; GFX10-LABEL: name: fcmp_s_s			; GFX10-LABEL: name: fcmp_s_s
	; GFX10: bb.1 (%ir-block.0):			; GFX10: bb.1 (%ir-block.0):
	; GFX10: liveins: $sgpr2, $sgpr3			; GFX10: liveins: $sgpr2, $sgpr3
	; GFX10: [[COPY:%[0-9]+]]:sgpr(s32) = COPY $sgpr2			; GFX10: [[COPY:%[0-9]+]]:sgpr(s32) = COPY $sgpr2
	; GFX10: [[COPY1:%[0-9]+]]:sgpr(s32) = COPY $sgpr3			; GFX10: [[COPY1:%[0-9]+]]:sgpr(s32) = COPY $sgpr3
	; GFX10: [[C:%[0-9]+]]:sgpr(s32) = G_FCONSTANT float 1.000000e+00
	; GFX10: [[C1:%[0-9]+]]:sgpr(s32) = G_FCONSTANT float 0.000000e+00
	; GFX10: [[COPY2:%[0-9]+]]:vgpr(s32) = COPY [[COPY1]](s32)			; GFX10: [[COPY2:%[0-9]+]]:vgpr(s32) = COPY [[COPY1]](s32)
	; GFX10: [[FCMP:%[0-9]+]]:vcc(s1) = G_FCMP floatpred(oeq), [[COPY]](s32), [[COPY2]]			; GFX10: [[FCMP:%[0-9]+]]:vcc(s1) = G_FCMP floatpred(oeq), [[COPY]](s32), [[COPY2]]
	; GFX10: [[COPY3:%[0-9]+]]:vgpr(s32) = COPY [[C]](s32)			; GFX10: [[C:%[0-9]+]]:sgpr(s32) = G_FCONSTANT float 0.000000e+00
	; GFX10: [[COPY4:%[0-9]+]]:vgpr(s32) = COPY [[C1]](s32)			; GFX10: [[C1:%[0-9]+]]:sgpr(s32) = G_FCONSTANT float 1.000000e+00
				; GFX10: [[COPY3:%[0-9]+]]:vgpr(s32) = COPY [[C1]](s32)
				; GFX10: [[COPY4:%[0-9]+]]:vgpr(s32) = COPY [[C]](s32)
	; GFX10: [[SELECT:%[0-9]+]]:vgpr(s32) = G_SELECT [[FCMP]](s1), [[COPY3]], [[COPY4]]			; GFX10: [[SELECT:%[0-9]+]]:vgpr(s32) = G_SELECT [[FCMP]](s1), [[COPY3]], [[COPY4]]
	; GFX10: $vgpr0 = COPY [[SELECT]](s32)			; GFX10: $vgpr0 = COPY [[SELECT]](s32)
	; GFX10: SI_RETURN_TO_EPILOG implicit $vgpr0			; GFX10: SI_RETURN_TO_EPILOG implicit $vgpr0
	%cmp = fcmp oeq float %src0, %src1			%cmp = fcmp oeq float %src0, %src1
	%result = select i1 %cmp, float 1.0, float 0.0			%result = select i1 %cmp, float 1.0, float 0.0
	ret float %result			ret float %result
	}			}

	▲ Show 20 Lines • Show All 100 Lines • ▼ Show 20 Lines
	}			}

	define amdgpu_ps float @class_s_s(float inreg %src0, i32 inreg %src1) {			define amdgpu_ps float @class_s_s(float inreg %src0, i32 inreg %src1) {
	; GFX9-LABEL: name: class_s_s			; GFX9-LABEL: name: class_s_s
	; GFX9: bb.1 (%ir-block.0):			; GFX9: bb.1 (%ir-block.0):
	; GFX9: liveins: $sgpr2, $sgpr3			; GFX9: liveins: $sgpr2, $sgpr3
	; GFX9: [[COPY:%[0-9]+]]:sgpr(s32) = COPY $sgpr2			; GFX9: [[COPY:%[0-9]+]]:sgpr(s32) = COPY $sgpr2
	; GFX9: [[COPY1:%[0-9]+]]:sgpr(s32) = COPY $sgpr3			; GFX9: [[COPY1:%[0-9]+]]:sgpr(s32) = COPY $sgpr3
	; GFX9: [[C:%[0-9]+]]:sgpr(s32) = G_FCONSTANT float 1.000000e+00
	; GFX9: [[C1:%[0-9]+]]:sgpr(s32) = G_FCONSTANT float 0.000000e+00
	; GFX9: [[COPY2:%[0-9]+]]:vgpr(s32) = COPY [[COPY]](s32)			; GFX9: [[COPY2:%[0-9]+]]:vgpr(s32) = COPY [[COPY]](s32)
	; GFX9: [[COPY3:%[0-9]+]]:vgpr(s32) = COPY [[COPY1]](s32)			; GFX9: [[COPY3:%[0-9]+]]:vgpr(s32) = COPY [[COPY1]](s32)
	; GFX9: [[INT:%[0-9]+]]:vcc(s1) = G_INTRINSIC intrinsic(@llvm.amdgcn.class), [[COPY2]](s32), [[COPY3]](s32)			; GFX9: [[INT:%[0-9]+]]:vcc(s1) = G_INTRINSIC intrinsic(@llvm.amdgcn.class), [[COPY2]](s32), [[COPY3]](s32)
	; GFX9: [[COPY4:%[0-9]+]]:vgpr(s32) = COPY [[C]](s32)			; GFX9: [[C:%[0-9]+]]:sgpr(s32) = G_FCONSTANT float 0.000000e+00
	; GFX9: [[COPY5:%[0-9]+]]:vgpr(s32) = COPY [[C1]](s32)			; GFX9: [[C1:%[0-9]+]]:sgpr(s32) = G_FCONSTANT float 1.000000e+00
				; GFX9: [[COPY4:%[0-9]+]]:vgpr(s32) = COPY [[C1]](s32)
				; GFX9: [[COPY5:%[0-9]+]]:vgpr(s32) = COPY [[C]](s32)
	; GFX9: [[SELECT:%[0-9]+]]:vgpr(s32) = G_SELECT [[INT]](s1), [[COPY4]], [[COPY5]]			; GFX9: [[SELECT:%[0-9]+]]:vgpr(s32) = G_SELECT [[INT]](s1), [[COPY4]], [[COPY5]]
	; GFX9: $vgpr0 = COPY [[SELECT]](s32)			; GFX9: $vgpr0 = COPY [[SELECT]](s32)
	; GFX9: SI_RETURN_TO_EPILOG implicit $vgpr0			; GFX9: SI_RETURN_TO_EPILOG implicit $vgpr0
	; GFX10-LABEL: name: class_s_s			; GFX10-LABEL: name: class_s_s
	; GFX10: bb.1 (%ir-block.0):			; GFX10: bb.1 (%ir-block.0):
	; GFX10: liveins: $sgpr2, $sgpr3			; GFX10: liveins: $sgpr2, $sgpr3
	; GFX10: [[COPY:%[0-9]+]]:sgpr(s32) = COPY $sgpr2			; GFX10: [[COPY:%[0-9]+]]:sgpr(s32) = COPY $sgpr2
	; GFX10: [[COPY1:%[0-9]+]]:sgpr(s32) = COPY $sgpr3			; GFX10: [[COPY1:%[0-9]+]]:sgpr(s32) = COPY $sgpr3
	; GFX10: [[C:%[0-9]+]]:sgpr(s32) = G_FCONSTANT float 1.000000e+00
	; GFX10: [[C1:%[0-9]+]]:sgpr(s32) = G_FCONSTANT float 0.000000e+00
	; GFX10: [[COPY2:%[0-9]+]]:vgpr(s32) = COPY [[COPY]](s32)			; GFX10: [[COPY2:%[0-9]+]]:vgpr(s32) = COPY [[COPY]](s32)
	; GFX10: [[COPY3:%[0-9]+]]:vgpr(s32) = COPY [[COPY1]](s32)			; GFX10: [[COPY3:%[0-9]+]]:vgpr(s32) = COPY [[COPY1]](s32)
	; GFX10: [[INT:%[0-9]+]]:vcc(s1) = G_INTRINSIC intrinsic(@llvm.amdgcn.class), [[COPY2]](s32), [[COPY3]](s32)			; GFX10: [[INT:%[0-9]+]]:vcc(s1) = G_INTRINSIC intrinsic(@llvm.amdgcn.class), [[COPY2]](s32), [[COPY3]](s32)
	; GFX10: [[COPY4:%[0-9]+]]:vgpr(s32) = COPY [[C]](s32)			; GFX10: [[C:%[0-9]+]]:sgpr(s32) = G_FCONSTANT float 0.000000e+00
	; GFX10: [[COPY5:%[0-9]+]]:vgpr(s32) = COPY [[C1]](s32)			; GFX10: [[C1:%[0-9]+]]:sgpr(s32) = G_FCONSTANT float 1.000000e+00
				; GFX10: [[COPY4:%[0-9]+]]:vgpr(s32) = COPY [[C1]](s32)
				; GFX10: [[COPY5:%[0-9]+]]:vgpr(s32) = COPY [[C]](s32)
	; GFX10: [[SELECT:%[0-9]+]]:vgpr(s32) = G_SELECT [[INT]](s1), [[COPY4]], [[COPY5]]			; GFX10: [[SELECT:%[0-9]+]]:vgpr(s32) = G_SELECT [[INT]](s1), [[COPY4]], [[COPY5]]
	; GFX10: $vgpr0 = COPY [[SELECT]](s32)			; GFX10: $vgpr0 = COPY [[SELECT]](s32)
	; GFX10: SI_RETURN_TO_EPILOG implicit $vgpr0			; GFX10: SI_RETURN_TO_EPILOG implicit $vgpr0
	%class = call i1 @llvm.amdgcn.class.f32(float %src0, i32 %src1)			%class = call i1 @llvm.amdgcn.class.f32(float %src0, i32 %src1)
	%result = select i1 %class, float 1.0, float 0.0			%result = select i1 %class, float 1.0, float 0.0
	ret float %result			ret float %result
	}			}

	▲ Show 20 Lines • Show All 59 Lines • Show Last 20 Lines

llvm/test/CodeGen/AMDGPU/GlobalISel/extractelement.ll

; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py		; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
; RUN: llc -global-isel -mtriple=amdgcn-mesa-mesa3d -mcpu=gfx900 -verify-machineinstrs < %s \| FileCheck -check-prefix=GPRIDX %s		; RUN: llc -global-isel -mtriple=amdgcn-mesa-mesa3d -mcpu=gfx900 -verify-machineinstrs < %s \| FileCheck -check-prefix=GPRIDX %s
; RUN: llc -global-isel -mtriple=amdgcn-mesa-mesa3d -mcpu=fiji -verify-machineinstrs < %s \| FileCheck -check-prefix=MOVREL %s		; RUN: llc -global-isel -mtriple=amdgcn-mesa-mesa3d -mcpu=fiji -verify-machineinstrs < %s \| FileCheck -check-prefix=MOVREL %s

define float @dyn_extract_v8f32_const_s_v(i32 %sel) {		define float @dyn_extract_v8f32_const_s_v(i32 %sel) {
; GPRIDX-LABEL: dyn_extract_v8f32_const_s_v:		; GPRIDX-LABEL: dyn_extract_v8f32_const_s_v:
; GPRIDX: ; %bb.0: ; %entry		; GPRIDX: ; %bb.0: ; %entry
; GPRIDX-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)		; GPRIDX-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
; GPRIDX-NEXT: s_mov_b32 s4, 1.0
; GPRIDX-NEXT: s_mov_b32 s5, 2.0
; GPRIDX-NEXT: s_mov_b32 s6, 0x40400000
; GPRIDX-NEXT: s_mov_b32 s7, 4.0
; GPRIDX-NEXT: s_mov_b32 s8, 0x40a00000
; GPRIDX-NEXT: s_mov_b32 s9, 0x40c00000
; GPRIDX-NEXT: s_mov_b32 s10, 0x40e00000
; GPRIDX-NEXT: s_mov_b32 s11, 0x41000000		; GPRIDX-NEXT: s_mov_b32 s11, 0x41000000
		; GPRIDX-NEXT: s_mov_b32 s10, 0x40e00000
		; GPRIDX-NEXT: s_mov_b32 s9, 0x40c00000
		; GPRIDX-NEXT: s_mov_b32 s8, 0x40a00000
		; GPRIDX-NEXT: s_mov_b32 s7, 4.0
		; GPRIDX-NEXT: s_mov_b32 s6, 0x40400000
		; GPRIDX-NEXT: s_mov_b32 s5, 2.0
		; GPRIDX-NEXT: s_mov_b32 s4, 1.0
; GPRIDX-NEXT: s_mov_b64 s[12:13], exec		; GPRIDX-NEXT: s_mov_b64 s[12:13], exec
; GPRIDX-NEXT: BB0_1: ; =>This Inner Loop Header: Depth=1		; GPRIDX-NEXT: BB0_1: ; =>This Inner Loop Header: Depth=1
; GPRIDX-NEXT: v_readfirstlane_b32 s14, v0		; GPRIDX-NEXT: v_readfirstlane_b32 s14, v0
; GPRIDX-NEXT: s_mov_b32 m0, s14		; GPRIDX-NEXT: s_mov_b32 m0, s14
; GPRIDX-NEXT: v_cmp_eq_u32_e32 vcc, s14, v0		; GPRIDX-NEXT: v_cmp_eq_u32_e32 vcc, s14, v0
; GPRIDX-NEXT: s_movrels_b32 s14, s4		; GPRIDX-NEXT: s_movrels_b32 s14, s4
; GPRIDX-NEXT: v_mov_b32_e32 v1, s14		; GPRIDX-NEXT: v_mov_b32_e32 v1, s14
; GPRIDX-NEXT: s_and_saveexec_b64 vcc, vcc		; GPRIDX-NEXT: s_and_saveexec_b64 vcc, vcc
; GPRIDX-NEXT: s_xor_b64 exec, exec, vcc		; GPRIDX-NEXT: s_xor_b64 exec, exec, vcc
; GPRIDX-NEXT: s_cbranch_execnz BB0_1		; GPRIDX-NEXT: s_cbranch_execnz BB0_1
; GPRIDX-NEXT: ; %bb.2:		; GPRIDX-NEXT: ; %bb.2:
; GPRIDX-NEXT: s_mov_b64 exec, s[12:13]		; GPRIDX-NEXT: s_mov_b64 exec, s[12:13]
; GPRIDX-NEXT: v_mov_b32_e32 v0, v1		; GPRIDX-NEXT: v_mov_b32_e32 v0, v1
; GPRIDX-NEXT: s_setpc_b64 s[30:31]		; GPRIDX-NEXT: s_setpc_b64 s[30:31]
;		;
; MOVREL-LABEL: dyn_extract_v8f32_const_s_v:		; MOVREL-LABEL: dyn_extract_v8f32_const_s_v:
; MOVREL: ; %bb.0: ; %entry		; MOVREL: ; %bb.0: ; %entry
; MOVREL-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)		; MOVREL-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
; MOVREL-NEXT: s_mov_b32 s4, 1.0
; MOVREL-NEXT: s_mov_b32 s5, 2.0
; MOVREL-NEXT: s_mov_b32 s6, 0x40400000
; MOVREL-NEXT: s_mov_b32 s7, 4.0
; MOVREL-NEXT: s_mov_b32 s8, 0x40a00000
; MOVREL-NEXT: s_mov_b32 s9, 0x40c00000
; MOVREL-NEXT: s_mov_b32 s10, 0x40e00000
; MOVREL-NEXT: s_mov_b32 s11, 0x41000000		; MOVREL-NEXT: s_mov_b32 s11, 0x41000000
		; MOVREL-NEXT: s_mov_b32 s10, 0x40e00000
		; MOVREL-NEXT: s_mov_b32 s9, 0x40c00000
		; MOVREL-NEXT: s_mov_b32 s8, 0x40a00000
		; MOVREL-NEXT: s_mov_b32 s7, 4.0
		; MOVREL-NEXT: s_mov_b32 s6, 0x40400000
		; MOVREL-NEXT: s_mov_b32 s5, 2.0
		; MOVREL-NEXT: s_mov_b32 s4, 1.0
; MOVREL-NEXT: s_mov_b64 s[12:13], exec		; MOVREL-NEXT: s_mov_b64 s[12:13], exec
; MOVREL-NEXT: BB0_1: ; =>This Inner Loop Header: Depth=1		; MOVREL-NEXT: BB0_1: ; =>This Inner Loop Header: Depth=1
; MOVREL-NEXT: v_readfirstlane_b32 s14, v0		; MOVREL-NEXT: v_readfirstlane_b32 s14, v0
; MOVREL-NEXT: s_mov_b32 m0, s14		; MOVREL-NEXT: s_mov_b32 m0, s14
; MOVREL-NEXT: v_cmp_eq_u32_e32 vcc, s14, v0		; MOVREL-NEXT: v_cmp_eq_u32_e32 vcc, s14, v0
; MOVREL-NEXT: s_movrels_b32 s14, s4		; MOVREL-NEXT: s_movrels_b32 s14, s4
; MOVREL-NEXT: v_mov_b32_e32 v1, s14		; MOVREL-NEXT: v_mov_b32_e32 v1, s14
; MOVREL-NEXT: s_and_saveexec_b64 vcc, vcc		; MOVREL-NEXT: s_and_saveexec_b64 vcc, vcc
; MOVREL-NEXT: s_xor_b64 exec, exec, vcc		; MOVREL-NEXT: s_xor_b64 exec, exec, vcc
; MOVREL-NEXT: s_cbranch_execnz BB0_1		; MOVREL-NEXT: s_cbranch_execnz BB0_1
; MOVREL-NEXT: ; %bb.2:		; MOVREL-NEXT: ; %bb.2:
; MOVREL-NEXT: s_mov_b64 exec, s[12:13]		; MOVREL-NEXT: s_mov_b64 exec, s[12:13]
; MOVREL-NEXT: v_mov_b32_e32 v0, v1		; MOVREL-NEXT: v_mov_b32_e32 v0, v1
; MOVREL-NEXT: s_setpc_b64 s[30:31]		; MOVREL-NEXT: s_setpc_b64 s[30:31]
entry:		entry:
%ext = extractelement <8 x float> <float 1.0, float 2.0, float 3.0, float 4.0, float 5.0, float 6.0, float 7.0, float 8.0>, i32 %sel		%ext = extractelement <8 x float> <float 1.0, float 2.0, float 3.0, float 4.0, float 5.0, float 6.0, float 7.0, float 8.0>, i32 %sel
ret float %ext		ret float %ext
}		}

define amdgpu_ps float @dyn_extract_v8f32_const_s_s(i32 inreg %sel) {		define amdgpu_ps float @dyn_extract_v8f32_const_s_s(i32 inreg %sel) {
; GPRIDX-LABEL: dyn_extract_v8f32_const_s_s:		; GPRIDX-LABEL: dyn_extract_v8f32_const_s_s:
; GPRIDX: ; %bb.0: ; %entry		; GPRIDX: ; %bb.0: ; %entry
; GPRIDX-NEXT: s_mov_b32 s4, 1.0		; GPRIDX-NEXT: s_mov_b32 s4, 1.0
; GPRIDX-NEXT: s_mov_b32 m0, s2		; GPRIDX-NEXT: s_mov_b32 m0, s2
; GPRIDX-NEXT: s_mov_b32 s5, 2.0
; GPRIDX-NEXT: s_mov_b32 s6, 0x40400000
; GPRIDX-NEXT: s_mov_b32 s7, 4.0
; GPRIDX-NEXT: s_mov_b32 s8, 0x40a00000
; GPRIDX-NEXT: s_mov_b32 s9, 0x40c00000
; GPRIDX-NEXT: s_mov_b32 s10, 0x40e00000
; GPRIDX-NEXT: s_mov_b32 s11, 0x41000000		; GPRIDX-NEXT: s_mov_b32 s11, 0x41000000
		; GPRIDX-NEXT: s_mov_b32 s10, 0x40e00000
		; GPRIDX-NEXT: s_mov_b32 s9, 0x40c00000
		; GPRIDX-NEXT: s_mov_b32 s8, 0x40a00000
		; GPRIDX-NEXT: s_mov_b32 s7, 4.0
		; GPRIDX-NEXT: s_mov_b32 s6, 0x40400000
		; GPRIDX-NEXT: s_mov_b32 s5, 2.0
; GPRIDX-NEXT: s_movrels_b32 s0, s4		; GPRIDX-NEXT: s_movrels_b32 s0, s4
; GPRIDX-NEXT: v_mov_b32_e32 v0, s0		; GPRIDX-NEXT: v_mov_b32_e32 v0, s0
; GPRIDX-NEXT: ; return to shader part epilog		; GPRIDX-NEXT: ; return to shader part epilog
;		;
; MOVREL-LABEL: dyn_extract_v8f32_const_s_s:		; MOVREL-LABEL: dyn_extract_v8f32_const_s_s:
; MOVREL: ; %bb.0: ; %entry		; MOVREL: ; %bb.0: ; %entry
; MOVREL-NEXT: s_mov_b32 s4, 1.0		; MOVREL-NEXT: s_mov_b32 s4, 1.0
; MOVREL-NEXT: s_mov_b32 m0, s2		; MOVREL-NEXT: s_mov_b32 m0, s2
; MOVREL-NEXT: s_mov_b32 s5, 2.0
; MOVREL-NEXT: s_mov_b32 s6, 0x40400000
; MOVREL-NEXT: s_mov_b32 s7, 4.0
; MOVREL-NEXT: s_mov_b32 s8, 0x40a00000
; MOVREL-NEXT: s_mov_b32 s9, 0x40c00000
; MOVREL-NEXT: s_mov_b32 s10, 0x40e00000
; MOVREL-NEXT: s_mov_b32 s11, 0x41000000		; MOVREL-NEXT: s_mov_b32 s11, 0x41000000
		; MOVREL-NEXT: s_mov_b32 s10, 0x40e00000
		; MOVREL-NEXT: s_mov_b32 s9, 0x40c00000
		; MOVREL-NEXT: s_mov_b32 s8, 0x40a00000
		; MOVREL-NEXT: s_mov_b32 s7, 4.0
		; MOVREL-NEXT: s_mov_b32 s6, 0x40400000
		; MOVREL-NEXT: s_mov_b32 s5, 2.0
; MOVREL-NEXT: s_movrels_b32 s0, s4		; MOVREL-NEXT: s_movrels_b32 s0, s4
; MOVREL-NEXT: v_mov_b32_e32 v0, s0		; MOVREL-NEXT: v_mov_b32_e32 v0, s0
; MOVREL-NEXT: ; return to shader part epilog		; MOVREL-NEXT: ; return to shader part epilog
entry:		entry:
%ext = extractelement <8 x float> <float 1.0, float 2.0, float 3.0, float 4.0, float 5.0, float 6.0, float 7.0, float 8.0>, i32 %sel		%ext = extractelement <8 x float> <float 1.0, float 2.0, float 3.0, float 4.0, float 5.0, float 6.0, float 7.0, float 8.0>, i32 %sel
ret float %ext		ret float %ext
}		}

▲ Show 20 Lines • Show All 144 Lines • ▼ Show 20 Lines	entry:
%ext = extractelement <8 x float> %vec, i32 %sel		%ext = extractelement <8 x float> %vec, i32 %sel
ret float %ext		ret float %ext
}		}

define i64 @dyn_extract_v8i64_const_s_v(i32 %sel) {		define i64 @dyn_extract_v8i64_const_s_v(i32 %sel) {
; GPRIDX-LABEL: dyn_extract_v8i64_const_s_v:		; GPRIDX-LABEL: dyn_extract_v8i64_const_s_v:
; GPRIDX: ; %bb.0: ; %entry		; GPRIDX: ; %bb.0: ; %entry
; GPRIDX-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)		; GPRIDX-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
; GPRIDX-NEXT: s_mov_b64 s[4:5], 1
; GPRIDX-NEXT: s_mov_b64 s[6:7], 2
; GPRIDX-NEXT: s_mov_b64 s[8:9], 3
; GPRIDX-NEXT: s_mov_b64 s[10:11], 4
; GPRIDX-NEXT: s_mov_b64 s[12:13], 5
; GPRIDX-NEXT: s_mov_b64 s[14:15], 6
; GPRIDX-NEXT: s_mov_b64 s[16:17], 7
; GPRIDX-NEXT: s_mov_b64 s[18:19], 8		; GPRIDX-NEXT: s_mov_b64 s[18:19], 8
		; GPRIDX-NEXT: s_mov_b64 s[16:17], 7
		; GPRIDX-NEXT: s_mov_b64 s[14:15], 6
		; GPRIDX-NEXT: s_mov_b64 s[12:13], 5
		; GPRIDX-NEXT: s_mov_b64 s[10:11], 4
		; GPRIDX-NEXT: s_mov_b64 s[8:9], 3
		; GPRIDX-NEXT: s_mov_b64 s[6:7], 2
		; GPRIDX-NEXT: s_mov_b64 s[4:5], 1
; GPRIDX-NEXT: s_mov_b64 s[20:21], exec		; GPRIDX-NEXT: s_mov_b64 s[20:21], exec
; GPRIDX-NEXT: BB6_1: ; =>This Inner Loop Header: Depth=1		; GPRIDX-NEXT: BB6_1: ; =>This Inner Loop Header: Depth=1
; GPRIDX-NEXT: v_readfirstlane_b32 s22, v0		; GPRIDX-NEXT: v_readfirstlane_b32 s22, v0
; GPRIDX-NEXT: s_lshl_b32 m0, s22, 1		; GPRIDX-NEXT: s_lshl_b32 m0, s22, 1
; GPRIDX-NEXT: v_cmp_eq_u32_e32 vcc, s22, v0		; GPRIDX-NEXT: v_cmp_eq_u32_e32 vcc, s22, v0
; GPRIDX-NEXT: s_movrels_b32 s22, s4		; GPRIDX-NEXT: s_movrels_b32 s22, s4
; GPRIDX-NEXT: s_movrels_b32 s23, s5		; GPRIDX-NEXT: s_movrels_b32 s23, s5
; GPRIDX-NEXT: s_and_saveexec_b64 vcc, vcc		; GPRIDX-NEXT: s_and_saveexec_b64 vcc, vcc
; GPRIDX-NEXT: s_xor_b64 exec, exec, vcc		; GPRIDX-NEXT: s_xor_b64 exec, exec, vcc
; GPRIDX-NEXT: s_cbranch_execnz BB6_1		; GPRIDX-NEXT: s_cbranch_execnz BB6_1
; GPRIDX-NEXT: ; %bb.2:		; GPRIDX-NEXT: ; %bb.2:
; GPRIDX-NEXT: s_mov_b64 exec, s[20:21]		; GPRIDX-NEXT: s_mov_b64 exec, s[20:21]
; GPRIDX-NEXT: v_mov_b32_e32 v0, s22		; GPRIDX-NEXT: v_mov_b32_e32 v0, s22
; GPRIDX-NEXT: v_mov_b32_e32 v1, s23		; GPRIDX-NEXT: v_mov_b32_e32 v1, s23
; GPRIDX-NEXT: s_setpc_b64 s[30:31]		; GPRIDX-NEXT: s_setpc_b64 s[30:31]
;		;
; MOVREL-LABEL: dyn_extract_v8i64_const_s_v:		; MOVREL-LABEL: dyn_extract_v8i64_const_s_v:
; MOVREL: ; %bb.0: ; %entry		; MOVREL: ; %bb.0: ; %entry
; MOVREL-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)		; MOVREL-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
; MOVREL-NEXT: s_mov_b64 s[4:5], 1
; MOVREL-NEXT: s_mov_b64 s[6:7], 2
; MOVREL-NEXT: s_mov_b64 s[8:9], 3
; MOVREL-NEXT: s_mov_b64 s[10:11], 4
; MOVREL-NEXT: s_mov_b64 s[12:13], 5
; MOVREL-NEXT: s_mov_b64 s[14:15], 6
; MOVREL-NEXT: s_mov_b64 s[16:17], 7
; MOVREL-NEXT: s_mov_b64 s[18:19], 8		; MOVREL-NEXT: s_mov_b64 s[18:19], 8
		; MOVREL-NEXT: s_mov_b64 s[16:17], 7
		; MOVREL-NEXT: s_mov_b64 s[14:15], 6
		; MOVREL-NEXT: s_mov_b64 s[12:13], 5
		; MOVREL-NEXT: s_mov_b64 s[10:11], 4
		; MOVREL-NEXT: s_mov_b64 s[8:9], 3
		; MOVREL-NEXT: s_mov_b64 s[6:7], 2
		; MOVREL-NEXT: s_mov_b64 s[4:5], 1
; MOVREL-NEXT: s_mov_b64 s[20:21], exec		; MOVREL-NEXT: s_mov_b64 s[20:21], exec
; MOVREL-NEXT: BB6_1: ; =>This Inner Loop Header: Depth=1		; MOVREL-NEXT: BB6_1: ; =>This Inner Loop Header: Depth=1
; MOVREL-NEXT: v_readfirstlane_b32 s22, v0		; MOVREL-NEXT: v_readfirstlane_b32 s22, v0
; MOVREL-NEXT: s_lshl_b32 m0, s22, 1		; MOVREL-NEXT: s_lshl_b32 m0, s22, 1
; MOVREL-NEXT: v_cmp_eq_u32_e32 vcc, s22, v0		; MOVREL-NEXT: v_cmp_eq_u32_e32 vcc, s22, v0
; MOVREL-NEXT: s_movrels_b32 s22, s4		; MOVREL-NEXT: s_movrels_b32 s22, s4
; MOVREL-NEXT: s_movrels_b32 s23, s5		; MOVREL-NEXT: s_movrels_b32 s23, s5
; MOVREL-NEXT: s_and_saveexec_b64 vcc, vcc		; MOVREL-NEXT: s_and_saveexec_b64 vcc, vcc
Show All 9 Lines	entry:
ret i64 %ext		ret i64 %ext
}		}

define amdgpu_ps void @dyn_extract_v8i64_const_s_s(i32 inreg %sel) {		define amdgpu_ps void @dyn_extract_v8i64_const_s_s(i32 inreg %sel) {
; GPRIDX-LABEL: dyn_extract_v8i64_const_s_s:		; GPRIDX-LABEL: dyn_extract_v8i64_const_s_s:
; GPRIDX: ; %bb.0: ; %entry		; GPRIDX: ; %bb.0: ; %entry
; GPRIDX-NEXT: s_mov_b64 s[4:5], 1		; GPRIDX-NEXT: s_mov_b64 s[4:5], 1
; GPRIDX-NEXT: s_mov_b32 m0, s2		; GPRIDX-NEXT: s_mov_b32 m0, s2
; GPRIDX-NEXT: s_mov_b64 s[6:7], 2
; GPRIDX-NEXT: s_mov_b64 s[8:9], 3
; GPRIDX-NEXT: s_mov_b64 s[10:11], 4
; GPRIDX-NEXT: s_mov_b64 s[12:13], 5
; GPRIDX-NEXT: s_mov_b64 s[14:15], 6
; GPRIDX-NEXT: s_mov_b64 s[16:17], 7
; GPRIDX-NEXT: s_mov_b64 s[18:19], 8		; GPRIDX-NEXT: s_mov_b64 s[18:19], 8
		; GPRIDX-NEXT: s_mov_b64 s[16:17], 7
		; GPRIDX-NEXT: s_mov_b64 s[14:15], 6
		; GPRIDX-NEXT: s_mov_b64 s[12:13], 5
		; GPRIDX-NEXT: s_mov_b64 s[10:11], 4
		; GPRIDX-NEXT: s_mov_b64 s[8:9], 3
		; GPRIDX-NEXT: s_mov_b64 s[6:7], 2
; GPRIDX-NEXT: s_movrels_b64 s[0:1], s[4:5]		; GPRIDX-NEXT: s_movrels_b64 s[0:1], s[4:5]
; GPRIDX-NEXT: v_mov_b32_e32 v0, s0		; GPRIDX-NEXT: v_mov_b32_e32 v0, s0
; GPRIDX-NEXT: v_mov_b32_e32 v1, s1		; GPRIDX-NEXT: v_mov_b32_e32 v1, s1
; GPRIDX-NEXT: global_store_dwordx2 v[0:1], v[0:1], off		; GPRIDX-NEXT: global_store_dwordx2 v[0:1], v[0:1], off
; GPRIDX-NEXT: s_endpgm		; GPRIDX-NEXT: s_endpgm
;		;
; MOVREL-LABEL: dyn_extract_v8i64_const_s_s:		; MOVREL-LABEL: dyn_extract_v8i64_const_s_s:
; MOVREL: ; %bb.0: ; %entry		; MOVREL: ; %bb.0: ; %entry
; MOVREL-NEXT: s_mov_b64 s[4:5], 1		; MOVREL-NEXT: s_mov_b64 s[4:5], 1
; MOVREL-NEXT: s_mov_b32 m0, s2		; MOVREL-NEXT: s_mov_b32 m0, s2
; MOVREL-NEXT: s_mov_b64 s[6:7], 2
; MOVREL-NEXT: s_mov_b64 s[8:9], 3
; MOVREL-NEXT: s_mov_b64 s[10:11], 4
; MOVREL-NEXT: s_mov_b64 s[12:13], 5
; MOVREL-NEXT: s_mov_b64 s[14:15], 6
; MOVREL-NEXT: s_mov_b64 s[16:17], 7
; MOVREL-NEXT: s_mov_b64 s[18:19], 8		; MOVREL-NEXT: s_mov_b64 s[18:19], 8
		; MOVREL-NEXT: s_mov_b64 s[16:17], 7
		; MOVREL-NEXT: s_mov_b64 s[14:15], 6
		; MOVREL-NEXT: s_mov_b64 s[12:13], 5
		; MOVREL-NEXT: s_mov_b64 s[10:11], 4
		; MOVREL-NEXT: s_mov_b64 s[8:9], 3
		; MOVREL-NEXT: s_mov_b64 s[6:7], 2
; MOVREL-NEXT: s_movrels_b64 s[0:1], s[4:5]		; MOVREL-NEXT: s_movrels_b64 s[0:1], s[4:5]
; MOVREL-NEXT: v_mov_b32_e32 v0, s0		; MOVREL-NEXT: v_mov_b32_e32 v0, s0
; MOVREL-NEXT: v_mov_b32_e32 v1, s1		; MOVREL-NEXT: v_mov_b32_e32 v1, s1
; MOVREL-NEXT: flat_store_dwordx2 v[0:1], v[0:1]		; MOVREL-NEXT: flat_store_dwordx2 v[0:1], v[0:1]
; MOVREL-NEXT: s_endpgm		; MOVREL-NEXT: s_endpgm
entry:		entry:
%ext = extractelement <8 x i64> <i64 1, i64 2, i64 3, i64 4, i64 5, i64 6, i64 7, i64 8>, i32 %sel		%ext = extractelement <8 x i64> <i64 1, i64 2, i64 3, i64 4, i64 5, i64 6, i64 7, i64 8>, i32 %sel
store i64 %ext, i64 addrspace(1)* undef		store i64 %ext, i64 addrspace(1)* undef
▲ Show 20 Lines • Show All 917 Lines • Show Last 20 Lines

llvm/test/CodeGen/AMDGPU/GlobalISel/insertelement.ll

Show First 20 Lines • Show All 75 Lines • ▼ Show 20 Lines	entry:
ret <8 x i8 addrspace(3)*> %insert		ret <8 x i8 addrspace(3)*> %insert
}		}

define <8 x float> @dyn_insertelement_v8f32_const_s_v_v(float %val, i32 %idx) {		define <8 x float> @dyn_insertelement_v8f32_const_s_v_v(float %val, i32 %idx) {
; GPRIDX-LABEL: dyn_insertelement_v8f32_const_s_v_v:		; GPRIDX-LABEL: dyn_insertelement_v8f32_const_s_v_v:
; GPRIDX: ; %bb.0: ; %entry		; GPRIDX: ; %bb.0: ; %entry
; GPRIDX-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)		; GPRIDX-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
; GPRIDX-NEXT: s_mov_b32 s11, 0x41000000		; GPRIDX-NEXT: s_mov_b32 s11, 0x41000000
; GPRIDX-NEXT: s_mov_b32 s4, 1.0
; GPRIDX-NEXT: s_mov_b32 s5, 2.0
; GPRIDX-NEXT: s_mov_b32 s6, 0x40400000
; GPRIDX-NEXT: s_mov_b32 s7, 4.0
; GPRIDX-NEXT: s_mov_b32 s8, 0x40a00000
; GPRIDX-NEXT: s_mov_b32 s9, 0x40c00000
; GPRIDX-NEXT: s_mov_b32 s10, 0x40e00000		; GPRIDX-NEXT: s_mov_b32 s10, 0x40e00000
		; GPRIDX-NEXT: s_mov_b32 s9, 0x40c00000
		; GPRIDX-NEXT: s_mov_b32 s8, 0x40a00000
		; GPRIDX-NEXT: s_mov_b32 s7, 4.0
		; GPRIDX-NEXT: s_mov_b32 s6, 0x40400000
		; GPRIDX-NEXT: s_mov_b32 s5, 2.0
		; GPRIDX-NEXT: s_mov_b32 s4, 1.0
; GPRIDX-NEXT: v_mov_b32_e32 v17, s11		; GPRIDX-NEXT: v_mov_b32_e32 v17, s11
; GPRIDX-NEXT: v_mov_b32_e32 v16, s10		; GPRIDX-NEXT: v_mov_b32_e32 v16, s10
; GPRIDX-NEXT: v_mov_b32_e32 v15, s9		; GPRIDX-NEXT: v_mov_b32_e32 v15, s9
; GPRIDX-NEXT: v_mov_b32_e32 v14, s8		; GPRIDX-NEXT: v_mov_b32_e32 v14, s8
; GPRIDX-NEXT: v_mov_b32_e32 v13, s7		; GPRIDX-NEXT: v_mov_b32_e32 v13, s7
; GPRIDX-NEXT: v_mov_b32_e32 v12, s6		; GPRIDX-NEXT: v_mov_b32_e32 v12, s6
; GPRIDX-NEXT: v_mov_b32_e32 v11, s5		; GPRIDX-NEXT: v_mov_b32_e32 v11, s5
; GPRIDX-NEXT: v_mov_b32_e32 v10, s4		; GPRIDX-NEXT: v_mov_b32_e32 v10, s4
Show All 27 Lines
; GPRIDX-NEXT: v_mov_b32_e32 v7, v9		; GPRIDX-NEXT: v_mov_b32_e32 v7, v9
; GPRIDX-NEXT: s_setpc_b64 s[30:31]		; GPRIDX-NEXT: s_setpc_b64 s[30:31]
;		;
; MOVREL-LABEL: dyn_insertelement_v8f32_const_s_v_v:		; MOVREL-LABEL: dyn_insertelement_v8f32_const_s_v_v:
; MOVREL: ; %bb.0: ; %entry		; MOVREL: ; %bb.0: ; %entry
; MOVREL-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)		; MOVREL-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
; MOVREL-NEXT: s_waitcnt_vscnt null, 0x0		; MOVREL-NEXT: s_waitcnt_vscnt null, 0x0
; MOVREL-NEXT: s_mov_b32 s11, 0x41000000		; MOVREL-NEXT: s_mov_b32 s11, 0x41000000
; MOVREL-NEXT: s_mov_b32 s4, 1.0
; MOVREL-NEXT: s_mov_b32 s5, 2.0
; MOVREL-NEXT: s_mov_b32 s6, 0x40400000
; MOVREL-NEXT: s_mov_b32 s7, 4.0
; MOVREL-NEXT: s_mov_b32 s8, 0x40a00000
; MOVREL-NEXT: s_mov_b32 s9, 0x40c00000
; MOVREL-NEXT: s_mov_b32 s10, 0x40e00000		; MOVREL-NEXT: s_mov_b32 s10, 0x40e00000
		; MOVREL-NEXT: s_mov_b32 s9, 0x40c00000
		; MOVREL-NEXT: s_mov_b32 s8, 0x40a00000
		; MOVREL-NEXT: s_mov_b32 s7, 4.0
		; MOVREL-NEXT: s_mov_b32 s6, 0x40400000
		; MOVREL-NEXT: s_mov_b32 s5, 2.0
		; MOVREL-NEXT: s_mov_b32 s4, 1.0
; MOVREL-NEXT: v_mov_b32_e32 v17, s11		; MOVREL-NEXT: v_mov_b32_e32 v17, s11
; MOVREL-NEXT: v_mov_b32_e32 v13, s7
; MOVREL-NEXT: v_mov_b32_e32 v14, s8
; MOVREL-NEXT: v_mov_b32_e32 v15, s9
; MOVREL-NEXT: v_mov_b32_e32 v16, s10		; MOVREL-NEXT: v_mov_b32_e32 v16, s10
		; MOVREL-NEXT: v_mov_b32_e32 v15, s9
		; MOVREL-NEXT: v_mov_b32_e32 v14, s8
		; MOVREL-NEXT: v_mov_b32_e32 v13, s7
; MOVREL-NEXT: v_mov_b32_e32 v12, s6		; MOVREL-NEXT: v_mov_b32_e32 v12, s6
; MOVREL-NEXT: v_mov_b32_e32 v11, s5		; MOVREL-NEXT: v_mov_b32_e32 v11, s5
; MOVREL-NEXT: v_mov_b32_e32 v10, s4		; MOVREL-NEXT: v_mov_b32_e32 v10, s4
; MOVREL-NEXT: s_mov_b32 s4, exec_lo		; MOVREL-NEXT: s_mov_b32 s4, exec_lo
; MOVREL-NEXT: ; implicit-def: $vcc_hi		; MOVREL-NEXT: ; implicit-def: $vcc_hi
; MOVREL-NEXT: BB2_1: ; =>This Inner Loop Header: Depth=1		; MOVREL-NEXT: BB2_1: ; =>This Inner Loop Header: Depth=1
; MOVREL-NEXT: v_readfirstlane_b32 s5, v1		; MOVREL-NEXT: v_readfirstlane_b32 s5, v1
; MOVREL-NEXT: v_mov_b32_e32 v2, v10		; MOVREL-NEXT: v_mov_b32_e32 v2, v10
▲ Show 20 Lines • Show All 566 Lines • ▼ Show 20 Lines	entry:
%insert = insertelement <8 x i8 addrspace(1)> %vec, i8 addrspace(1) %val, i32 %idx		%insert = insertelement <8 x i8 addrspace(1)> %vec, i8 addrspace(1) %val, i32 %idx
ret <8 x i8 addrspace(1)*> %insert		ret <8 x i8 addrspace(1)*> %insert
}		}

define void @dyn_insertelement_v8f64_const_s_v_v(double %val, i32 %idx) {		define void @dyn_insertelement_v8f64_const_s_v_v(double %val, i32 %idx) {
; GPRIDX-LABEL: dyn_insertelement_v8f64_const_s_v_v:		; GPRIDX-LABEL: dyn_insertelement_v8f64_const_s_v_v:
; GPRIDX: ; %bb.0: ; %entry		; GPRIDX: ; %bb.0: ; %entry
; GPRIDX-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)		; GPRIDX-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
; GPRIDX-NEXT: s_mov_b32 s8, 0		; GPRIDX-NEXT: s_mov_b32 s18, 0
; GPRIDX-NEXT: s_mov_b32 s19, 0x40200000		; GPRIDX-NEXT: s_mov_b32 s19, 0x40200000
; GPRIDX-NEXT: buffer_store_dword v32, off, s[0:3], s32 offset:8 ; 4-byte Folded Spill		; GPRIDX-NEXT: buffer_store_dword v32, off, s[0:3], s32 offset:8 ; 4-byte Folded Spill
; GPRIDX-NEXT: buffer_store_dword v33, off, s[0:3], s32 offset:4 ; 4-byte Folded Spill		; GPRIDX-NEXT: buffer_store_dword v33, off, s[0:3], s32 offset:4 ; 4-byte Folded Spill
; GPRIDX-NEXT: buffer_store_dword v34, off, s[0:3], s32 ; 4-byte Folded Spill		; GPRIDX-NEXT: buffer_store_dword v34, off, s[0:3], s32 ; 4-byte Folded Spill
; GPRIDX-NEXT: s_mov_b64 s[4:5], 1.0
; GPRIDX-NEXT: s_mov_b64 s[6:7], 2.0
; GPRIDX-NEXT: s_mov_b32 s9, 0x40080000
; GPRIDX-NEXT: s_mov_b64 s[10:11], 4.0
; GPRIDX-NEXT: s_mov_b32 s13, 0x40140000
; GPRIDX-NEXT: s_mov_b32 s12, s8
; GPRIDX-NEXT: s_mov_b32 s15, 0x40180000
; GPRIDX-NEXT: s_mov_b32 s14, s8
; GPRIDX-NEXT: s_mov_b32 s17, 0x401c0000		; GPRIDX-NEXT: s_mov_b32 s17, 0x401c0000
; GPRIDX-NEXT: s_mov_b32 s16, s8		; GPRIDX-NEXT: s_mov_b32 s16, s18
; GPRIDX-NEXT: s_mov_b32 s18, s8		; GPRIDX-NEXT: s_mov_b32 s15, 0x40180000
		; GPRIDX-NEXT: s_mov_b32 s14, s18
		; GPRIDX-NEXT: s_mov_b32 s13, 0x40140000
		; GPRIDX-NEXT: s_mov_b32 s12, s18
		; GPRIDX-NEXT: s_mov_b64 s[10:11], 4.0
		; GPRIDX-NEXT: s_mov_b32 s9, 0x40080000
		; GPRIDX-NEXT: s_mov_b32 s8, s18
		; GPRIDX-NEXT: s_mov_b64 s[6:7], 2.0
		; GPRIDX-NEXT: s_mov_b64 s[4:5], 1.0
; GPRIDX-NEXT: v_mov_b32_e32 v34, s19		; GPRIDX-NEXT: v_mov_b32_e32 v34, s19
; GPRIDX-NEXT: v_mov_b32_e32 v33, s18		; GPRIDX-NEXT: v_mov_b32_e32 v33, s18
; GPRIDX-NEXT: v_mov_b32_e32 v32, s17		; GPRIDX-NEXT: v_mov_b32_e32 v32, s17
; GPRIDX-NEXT: v_mov_b32_e32 v31, s16		; GPRIDX-NEXT: v_mov_b32_e32 v31, s16
; GPRIDX-NEXT: v_mov_b32_e32 v30, s15		; GPRIDX-NEXT: v_mov_b32_e32 v30, s15
; GPRIDX-NEXT: v_mov_b32_e32 v29, s14		; GPRIDX-NEXT: v_mov_b32_e32 v29, s14
; GPRIDX-NEXT: v_mov_b32_e32 v28, s13		; GPRIDX-NEXT: v_mov_b32_e32 v28, s13
; GPRIDX-NEXT: v_mov_b32_e32 v27, s12		; GPRIDX-NEXT: v_mov_b32_e32 v27, s12
▲ Show 20 Lines • Show All 46 Lines • ▼ Show 20 Lines
; GPRIDX-NEXT: buffer_load_dword v32, off, s[0:3], s32 offset:8 ; 4-byte Folded Reload		; GPRIDX-NEXT: buffer_load_dword v32, off, s[0:3], s32 offset:8 ; 4-byte Folded Reload
; GPRIDX-NEXT: s_waitcnt vmcnt(0)		; GPRIDX-NEXT: s_waitcnt vmcnt(0)
; GPRIDX-NEXT: s_setpc_b64 s[30:31]		; GPRIDX-NEXT: s_setpc_b64 s[30:31]
;		;
; MOVREL-LABEL: dyn_insertelement_v8f64_const_s_v_v:		; MOVREL-LABEL: dyn_insertelement_v8f64_const_s_v_v:
; MOVREL: ; %bb.0: ; %entry		; MOVREL: ; %bb.0: ; %entry
; MOVREL-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)		; MOVREL-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
; MOVREL-NEXT: s_waitcnt_vscnt null, 0x0		; MOVREL-NEXT: s_waitcnt_vscnt null, 0x0
; MOVREL-NEXT: s_mov_b32 s8, 0		; MOVREL-NEXT: s_mov_b32 s18, 0
; MOVREL-NEXT: s_mov_b32 s19, 0x40200000		; MOVREL-NEXT: s_mov_b32 s19, 0x40200000
; MOVREL-NEXT: s_mov_b64 s[4:5], 1.0
; MOVREL-NEXT: s_mov_b64 s[6:7], 2.0
; MOVREL-NEXT: s_mov_b32 s9, 0x40080000
; MOVREL-NEXT: s_mov_b64 s[10:11], 4.0
; MOVREL-NEXT: s_mov_b32 s13, 0x40140000
; MOVREL-NEXT: s_mov_b32 s12, s8
; MOVREL-NEXT: s_mov_b32 s15, 0x40180000
; MOVREL-NEXT: s_mov_b32 s14, s8
; MOVREL-NEXT: s_mov_b32 s17, 0x401c0000		; MOVREL-NEXT: s_mov_b32 s17, 0x401c0000
; MOVREL-NEXT: s_mov_b32 s16, s8		; MOVREL-NEXT: s_mov_b32 s15, 0x40180000
; MOVREL-NEXT: s_mov_b32 s18, s8		; MOVREL-NEXT: s_mov_b32 s13, 0x40140000
		; MOVREL-NEXT: s_mov_b32 s16, s18
		; MOVREL-NEXT: s_mov_b32 s14, s18
		; MOVREL-NEXT: s_mov_b32 s12, s18
		; MOVREL-NEXT: s_mov_b64 s[10:11], 4.0
		; MOVREL-NEXT: s_mov_b32 s9, 0x40080000
		; MOVREL-NEXT: s_mov_b32 s8, s18
		; MOVREL-NEXT: s_mov_b64 s[6:7], 2.0
		; MOVREL-NEXT: s_mov_b64 s[4:5], 1.0
; MOVREL-NEXT: buffer_store_dword v32, off, s[0:3], s32 offset:8 ; 4-byte Folded Spill		; MOVREL-NEXT: buffer_store_dword v32, off, s[0:3], s32 offset:8 ; 4-byte Folded Spill
; MOVREL-NEXT: buffer_store_dword v33, off, s[0:3], s32 offset:4 ; 4-byte Folded Spill		; MOVREL-NEXT: buffer_store_dword v33, off, s[0:3], s32 offset:4 ; 4-byte Folded Spill
; MOVREL-NEXT: buffer_store_dword v34, off, s[0:3], s32 ; 4-byte Folded Spill		; MOVREL-NEXT: buffer_store_dword v34, off, s[0:3], s32 ; 4-byte Folded Spill
; MOVREL-NEXT: v_mov_b32_e32 v34, s19		; MOVREL-NEXT: v_mov_b32_e32 v34, s19
		; MOVREL-NEXT: v_mov_b32_e32 v33, s18
; MOVREL-NEXT: v_mov_b32_e32 v32, s17		; MOVREL-NEXT: v_mov_b32_e32 v32, s17
; MOVREL-NEXT: v_mov_b32_e32 v31, s16		; MOVREL-NEXT: v_mov_b32_e32 v31, s16
; MOVREL-NEXT: v_mov_b32_e32 v33, s18
; MOVREL-NEXT: v_mov_b32_e32 v30, s15		; MOVREL-NEXT: v_mov_b32_e32 v30, s15
; MOVREL-NEXT: v_mov_b32_e32 v29, s14		; MOVREL-NEXT: v_mov_b32_e32 v29, s14
; MOVREL-NEXT: v_mov_b32_e32 v28, s13		; MOVREL-NEXT: v_mov_b32_e32 v28, s13
; MOVREL-NEXT: v_mov_b32_e32 v27, s12		; MOVREL-NEXT: v_mov_b32_e32 v27, s12
; MOVREL-NEXT: v_mov_b32_e32 v26, s11		; MOVREL-NEXT: v_mov_b32_e32 v26, s11
; MOVREL-NEXT: v_mov_b32_e32 v25, s10		; MOVREL-NEXT: v_mov_b32_e32 v25, s10
; MOVREL-NEXT: v_mov_b32_e32 v24, s9		; MOVREL-NEXT: v_mov_b32_e32 v24, s9
; MOVREL-NEXT: v_mov_b32_e32 v23, s8		; MOVREL-NEXT: v_mov_b32_e32 v23, s8
▲ Show 20 Lines • Show All 1,361 Lines • Show Last 20 Lines

llvm/test/CodeGen/AMDGPU/GlobalISel/mubuf-global.ll

Show First 20 Lines • Show All 197 Lines • ▼ Show 20 Lines	; GFX7-NEXT: s_endpgm
store i32 0, i32 addrspace(1)* %gep		store i32 0, i32 addrspace(1)* %gep
ret void		ret void
}		}

define amdgpu_ps void @mubuf_store_vgpr_ptr_offset4294967297(i32 addrspace(1)* %ptr) {		define amdgpu_ps void @mubuf_store_vgpr_ptr_offset4294967297(i32 addrspace(1)* %ptr) {
; GFX6-LABEL: mubuf_store_vgpr_ptr_offset4294967297:		; GFX6-LABEL: mubuf_store_vgpr_ptr_offset4294967297:
; GFX6: ; %bb.0:		; GFX6: ; %bb.0:
; GFX6-NEXT: s_mov_b32 s0, 4		; GFX6-NEXT: s_mov_b32 s0, 4
; GFX6-NEXT: s_mov_b32 s2, 0
; GFX6-NEXT: s_mov_b32 s1, s0		; GFX6-NEXT: s_mov_b32 s1, s0
		; GFX6-NEXT: s_mov_b32 s2, 0
; GFX6-NEXT: v_mov_b32_e32 v2, 0		; GFX6-NEXT: v_mov_b32_e32 v2, 0
; GFX6-NEXT: s_mov_b32 s3, 0xf000		; GFX6-NEXT: s_mov_b32 s3, 0xf000
; GFX6-NEXT: buffer_store_dword v2, v[0:1], s[0:3], 0 addr64		; GFX6-NEXT: buffer_store_dword v2, v[0:1], s[0:3], 0 addr64
; GFX6-NEXT: s_endpgm		; GFX6-NEXT: s_endpgm
;		;
; GFX7-LABEL: mubuf_store_vgpr_ptr_offset4294967297:		; GFX7-LABEL: mubuf_store_vgpr_ptr_offset4294967297:
; GFX7: ; %bb.0:		; GFX7: ; %bb.0:
; GFX7-NEXT: s_mov_b32 s0, 4		; GFX7-NEXT: s_mov_b32 s0, 4
; GFX7-NEXT: s_mov_b32 s2, 0
; GFX7-NEXT: s_mov_b32 s1, s0		; GFX7-NEXT: s_mov_b32 s1, s0
		; GFX7-NEXT: s_mov_b32 s2, 0
; GFX7-NEXT: v_mov_b32_e32 v2, 0		; GFX7-NEXT: v_mov_b32_e32 v2, 0
; GFX7-NEXT: s_mov_b32 s3, 0xf000		; GFX7-NEXT: s_mov_b32 s3, 0xf000
; GFX7-NEXT: buffer_store_dword v2, v[0:1], s[0:3], 0 addr64		; GFX7-NEXT: buffer_store_dword v2, v[0:1], s[0:3], 0 addr64
; GFX7-NEXT: s_endpgm		; GFX7-NEXT: s_endpgm
%gep = getelementptr i32, i32 addrspace(1)* %ptr, i64 4294967297		%gep = getelementptr i32, i32 addrspace(1)* %ptr, i64 4294967297
store i32 0, i32 addrspace(1)* %gep		store i32 0, i32 addrspace(1)* %gep
ret void		ret void
}		}
Show All 21 Lines	; GFX7-NEXT: s_endpgm
%gep = getelementptr i32, i32 addrspace(1)* %ptr, i64 4096		%gep = getelementptr i32, i32 addrspace(1)* %ptr, i64 4096
store i32 0, i32 addrspace(1)* %gep		store i32 0, i32 addrspace(1)* %gep
ret void		ret void
}		}

define amdgpu_ps void @mubuf_store_sgpr_ptr_sgpr_offset(i32 addrspace(1)* inreg %ptr, i32 inreg %soffset) {		define amdgpu_ps void @mubuf_store_sgpr_ptr_sgpr_offset(i32 addrspace(1)* inreg %ptr, i32 inreg %soffset) {
; GFX6-LABEL: mubuf_store_sgpr_ptr_sgpr_offset:		; GFX6-LABEL: mubuf_store_sgpr_ptr_sgpr_offset:
; GFX6: ; %bb.0:		; GFX6: ; %bb.0:
; GFX6-NEXT: s_bfe_i64 s[4:5], s[4:5], 0x200000
; GFX6-NEXT: s_lshl_b64 s[4:5], s[4:5], 2
; GFX6-NEXT: v_mov_b32_e32 v0, s4
; GFX6-NEXT: s_mov_b32 s0, s2		; GFX6-NEXT: s_mov_b32 s0, s2
; GFX6-NEXT: s_mov_b32 s1, s3		; GFX6-NEXT: s_mov_b32 s1, s3
		; GFX6-NEXT: s_bfe_i64 s[2:3], s[4:5], 0x200000
		; GFX6-NEXT: s_lshl_b64 s[4:5], s[2:3], 2
		; GFX6-NEXT: v_mov_b32_e32 v0, s4
; GFX6-NEXT: s_mov_b32 s2, 0		; GFX6-NEXT: s_mov_b32 s2, 0
; GFX6-NEXT: v_mov_b32_e32 v2, 0		; GFX6-NEXT: v_mov_b32_e32 v2, 0
; GFX6-NEXT: s_mov_b32 s3, 0xf000		; GFX6-NEXT: s_mov_b32 s3, 0xf000
; GFX6-NEXT: v_mov_b32_e32 v1, s5		; GFX6-NEXT: v_mov_b32_e32 v1, s5
; GFX6-NEXT: buffer_store_dword v2, v[0:1], s[0:3], 0 addr64		; GFX6-NEXT: buffer_store_dword v2, v[0:1], s[0:3], 0 addr64
; GFX6-NEXT: s_endpgm		; GFX6-NEXT: s_endpgm
;		;
; GFX7-LABEL: mubuf_store_sgpr_ptr_sgpr_offset:		; GFX7-LABEL: mubuf_store_sgpr_ptr_sgpr_offset:
; GFX7: ; %bb.0:		; GFX7: ; %bb.0:
; GFX7-NEXT: s_bfe_i64 s[4:5], s[4:5], 0x200000
; GFX7-NEXT: s_lshl_b64 s[4:5], s[4:5], 2
; GFX7-NEXT: v_mov_b32_e32 v0, s4
; GFX7-NEXT: s_mov_b32 s0, s2		; GFX7-NEXT: s_mov_b32 s0, s2
; GFX7-NEXT: s_mov_b32 s1, s3		; GFX7-NEXT: s_mov_b32 s1, s3
		; GFX7-NEXT: s_bfe_i64 s[2:3], s[4:5], 0x200000
		; GFX7-NEXT: s_lshl_b64 s[4:5], s[2:3], 2
		; GFX7-NEXT: v_mov_b32_e32 v0, s4
; GFX7-NEXT: s_mov_b32 s2, 0		; GFX7-NEXT: s_mov_b32 s2, 0
; GFX7-NEXT: v_mov_b32_e32 v2, 0		; GFX7-NEXT: v_mov_b32_e32 v2, 0
; GFX7-NEXT: s_mov_b32 s3, 0xf000		; GFX7-NEXT: s_mov_b32 s3, 0xf000
; GFX7-NEXT: v_mov_b32_e32 v1, s5		; GFX7-NEXT: v_mov_b32_e32 v1, s5
; GFX7-NEXT: buffer_store_dword v2, v[0:1], s[0:3], 0 addr64		; GFX7-NEXT: buffer_store_dword v2, v[0:1], s[0:3], 0 addr64
; GFX7-NEXT: s_endpgm		; GFX7-NEXT: s_endpgm
%gep = getelementptr i32, i32 addrspace(1)* %ptr, i32 %soffset		%gep = getelementptr i32, i32 addrspace(1)* %ptr, i32 %soffset
store i32 0, i32 addrspace(1)* %gep		store i32 0, i32 addrspace(1)* %gep
ret void		ret void
}		}

define amdgpu_ps void @mubuf_store_vgpr_ptr_sgpr_offset(i32 addrspace(1)* %ptr, i32 inreg %soffset) {		define amdgpu_ps void @mubuf_store_vgpr_ptr_sgpr_offset(i32 addrspace(1)* %ptr, i32 inreg %soffset) {
; GFX6-LABEL: mubuf_store_vgpr_ptr_sgpr_offset:		; GFX6-LABEL: mubuf_store_vgpr_ptr_sgpr_offset:
; GFX6: ; %bb.0:		; GFX6: ; %bb.0:
; GFX6-NEXT: s_bfe_i64 s[0:1], s[2:3], 0x200000		; GFX6-NEXT: s_bfe_i64 s[0:1], s[2:3], 0x200000
; GFX6-NEXT: s_mov_b32 s6, 0		; GFX6-NEXT: s_lshl_b64 s[0:1], s[0:1], 2
; GFX6-NEXT: s_lshl_b64 s[4:5], s[0:1], 2		; GFX6-NEXT: s_mov_b32 s2, 0
; GFX6-NEXT: v_mov_b32_e32 v2, 0		; GFX6-NEXT: v_mov_b32_e32 v2, 0
; GFX6-NEXT: s_mov_b32 s7, 0xf000		; GFX6-NEXT: s_mov_b32 s3, 0xf000
; GFX6-NEXT: buffer_store_dword v2, v[0:1], s[4:7], 0 addr64		; GFX6-NEXT: buffer_store_dword v2, v[0:1], s[0:3], 0 addr64
; GFX6-NEXT: s_endpgm		; GFX6-NEXT: s_endpgm
;		;
; GFX7-LABEL: mubuf_store_vgpr_ptr_sgpr_offset:		; GFX7-LABEL: mubuf_store_vgpr_ptr_sgpr_offset:
; GFX7: ; %bb.0:		; GFX7: ; %bb.0:
; GFX7-NEXT: s_bfe_i64 s[0:1], s[2:3], 0x200000		; GFX7-NEXT: s_bfe_i64 s[0:1], s[2:3], 0x200000
; GFX7-NEXT: s_mov_b32 s6, 0		; GFX7-NEXT: s_lshl_b64 s[0:1], s[0:1], 2
; GFX7-NEXT: s_lshl_b64 s[4:5], s[0:1], 2		; GFX7-NEXT: s_mov_b32 s2, 0
; GFX7-NEXT: v_mov_b32_e32 v2, 0		; GFX7-NEXT: v_mov_b32_e32 v2, 0
; GFX7-NEXT: s_mov_b32 s7, 0xf000		; GFX7-NEXT: s_mov_b32 s3, 0xf000
; GFX7-NEXT: buffer_store_dword v2, v[0:1], s[4:7], 0 addr64		; GFX7-NEXT: buffer_store_dword v2, v[0:1], s[0:3], 0 addr64
; GFX7-NEXT: s_endpgm		; GFX7-NEXT: s_endpgm
%gep = getelementptr i32, i32 addrspace(1)* %ptr, i32 %soffset		%gep = getelementptr i32, i32 addrspace(1)* %ptr, i32 %soffset
store i32 0, i32 addrspace(1)* %gep		store i32 0, i32 addrspace(1)* %gep
ret void		ret void
}		}

define amdgpu_ps void @mubuf_store_vgpr_ptr_sgpr_offset_offset256(i32 addrspace(1)* %ptr, i32 inreg %soffset) {		define amdgpu_ps void @mubuf_store_vgpr_ptr_sgpr_offset_offset256(i32 addrspace(1)* %ptr, i32 inreg %soffset) {
; GFX6-LABEL: mubuf_store_vgpr_ptr_sgpr_offset_offset256:		; GFX6-LABEL: mubuf_store_vgpr_ptr_sgpr_offset_offset256:
; GFX6: ; %bb.0:		; GFX6: ; %bb.0:
; GFX6-NEXT: s_bfe_i64 s[0:1], s[2:3], 0x200000		; GFX6-NEXT: s_bfe_i64 s[0:1], s[2:3], 0x200000
; GFX6-NEXT: s_mov_b32 s6, 0		; GFX6-NEXT: s_lshl_b64 s[0:1], s[0:1], 2
; GFX6-NEXT: s_lshl_b64 s[4:5], s[0:1], 2		; GFX6-NEXT: s_mov_b32 s2, 0
; GFX6-NEXT: v_mov_b32_e32 v2, 0		; GFX6-NEXT: v_mov_b32_e32 v2, 0
; GFX6-NEXT: s_mov_b32 s7, 0xf000		; GFX6-NEXT: s_mov_b32 s3, 0xf000
; GFX6-NEXT: buffer_store_dword v2, v[0:1], s[4:7], 0 addr64 offset:1024		; GFX6-NEXT: buffer_store_dword v2, v[0:1], s[0:3], 0 addr64 offset:1024
; GFX6-NEXT: s_endpgm		; GFX6-NEXT: s_endpgm
;		;
; GFX7-LABEL: mubuf_store_vgpr_ptr_sgpr_offset_offset256:		; GFX7-LABEL: mubuf_store_vgpr_ptr_sgpr_offset_offset256:
; GFX7: ; %bb.0:		; GFX7: ; %bb.0:
; GFX7-NEXT: s_bfe_i64 s[0:1], s[2:3], 0x200000		; GFX7-NEXT: s_bfe_i64 s[0:1], s[2:3], 0x200000
; GFX7-NEXT: s_mov_b32 s6, 0		; GFX7-NEXT: s_lshl_b64 s[0:1], s[0:1], 2
; GFX7-NEXT: s_lshl_b64 s[4:5], s[0:1], 2		; GFX7-NEXT: s_mov_b32 s2, 0
; GFX7-NEXT: v_mov_b32_e32 v2, 0		; GFX7-NEXT: v_mov_b32_e32 v2, 0
; GFX7-NEXT: s_mov_b32 s7, 0xf000		; GFX7-NEXT: s_mov_b32 s3, 0xf000
; GFX7-NEXT: buffer_store_dword v2, v[0:1], s[4:7], 0 addr64 offset:1024		; GFX7-NEXT: buffer_store_dword v2, v[0:1], s[0:3], 0 addr64 offset:1024
; GFX7-NEXT: s_endpgm		; GFX7-NEXT: s_endpgm
%gep0 = getelementptr i32, i32 addrspace(1)* %ptr, i32 %soffset		%gep0 = getelementptr i32, i32 addrspace(1)* %ptr, i32 %soffset
%gep1 = getelementptr i32, i32 addrspace(1)* %gep0, i32 256		%gep1 = getelementptr i32, i32 addrspace(1)* %gep0, i32 256
store i32 0, i32 addrspace(1)* %gep1		store i32 0, i32 addrspace(1)* %gep1
ret void		ret void
}		}

define amdgpu_ps void @mubuf_store_vgpr_ptr_sgpr_offset256_offset(i32 addrspace(1)* %ptr, i32 inreg %soffset) {		define amdgpu_ps void @mubuf_store_vgpr_ptr_sgpr_offset256_offset(i32 addrspace(1)* %ptr, i32 inreg %soffset) {
▲ Show 20 Lines • Show All 93 Lines • ▼ Show 20 Lines	; GFX7-NEXT: s_endpgm
%gep1 = getelementptr i32, i32 addrspace(1)* %gep0, i32 4095		%gep1 = getelementptr i32, i32 addrspace(1)* %gep0, i32 4095
store i32 0, i32 addrspace(1)* %gep1		store i32 0, i32 addrspace(1)* %gep1
ret void		ret void
}		}
define amdgpu_ps void @mubuf_store_sgpr_ptr_offset4095_vgpr_offset(i32 addrspace(1)* inreg %ptr, i32 %voffset) {		define amdgpu_ps void @mubuf_store_sgpr_ptr_offset4095_vgpr_offset(i32 addrspace(1)* inreg %ptr, i32 %voffset) {
; GFX6-LABEL: mubuf_store_sgpr_ptr_offset4095_vgpr_offset:		; GFX6-LABEL: mubuf_store_sgpr_ptr_offset4095_vgpr_offset:
; GFX6: ; %bb.0:		; GFX6: ; %bb.0:
; GFX6-NEXT: v_ashrrev_i32_e32 v1, 31, v0		; GFX6-NEXT: v_ashrrev_i32_e32 v1, 31, v0
; GFX6-NEXT: s_add_u32 s4, s2, 0x3ffc		; GFX6-NEXT: s_add_u32 s0, s2, 0x3ffc
; GFX6-NEXT: v_lshl_b64 v[0:1], v[0:1], 2		; GFX6-NEXT: v_lshl_b64 v[0:1], v[0:1], 2
; GFX6-NEXT: s_mov_b32 s6, 0		; GFX6-NEXT: s_addc_u32 s1, s3, 0
; GFX6-NEXT: s_addc_u32 s5, s3, 0		; GFX6-NEXT: s_mov_b32 s2, 0
; GFX6-NEXT: v_mov_b32_e32 v2, 0		; GFX6-NEXT: v_mov_b32_e32 v2, 0
; GFX6-NEXT: s_mov_b32 s7, 0xf000		; GFX6-NEXT: s_mov_b32 s3, 0xf000
; GFX6-NEXT: buffer_store_dword v2, v[0:1], s[4:7], 0 addr64		; GFX6-NEXT: buffer_store_dword v2, v[0:1], s[0:3], 0 addr64
; GFX6-NEXT: s_endpgm		; GFX6-NEXT: s_endpgm
;		;
; GFX7-LABEL: mubuf_store_sgpr_ptr_offset4095_vgpr_offset:		; GFX7-LABEL: mubuf_store_sgpr_ptr_offset4095_vgpr_offset:
; GFX7: ; %bb.0:		; GFX7: ; %bb.0:
; GFX7-NEXT: v_ashrrev_i32_e32 v1, 31, v0		; GFX7-NEXT: v_ashrrev_i32_e32 v1, 31, v0
; GFX7-NEXT: s_add_u32 s4, s2, 0x3ffc		; GFX7-NEXT: s_add_u32 s0, s2, 0x3ffc
; GFX7-NEXT: v_lshl_b64 v[0:1], v[0:1], 2		; GFX7-NEXT: v_lshl_b64 v[0:1], v[0:1], 2
; GFX7-NEXT: s_mov_b32 s6, 0		; GFX7-NEXT: s_addc_u32 s1, s3, 0
; GFX7-NEXT: s_addc_u32 s5, s3, 0		; GFX7-NEXT: s_mov_b32 s2, 0
; GFX7-NEXT: v_mov_b32_e32 v2, 0		; GFX7-NEXT: v_mov_b32_e32 v2, 0
; GFX7-NEXT: s_mov_b32 s7, 0xf000		; GFX7-NEXT: s_mov_b32 s3, 0xf000
; GFX7-NEXT: buffer_store_dword v2, v[0:1], s[4:7], 0 addr64		; GFX7-NEXT: buffer_store_dword v2, v[0:1], s[0:3], 0 addr64
; GFX7-NEXT: s_endpgm		; GFX7-NEXT: s_endpgm
%gep0 = getelementptr i32, i32 addrspace(1)* %ptr, i32 4095		%gep0 = getelementptr i32, i32 addrspace(1)* %ptr, i32 4095
%gep1 = getelementptr i32, i32 addrspace(1)* %gep0, i32 %voffset		%gep1 = getelementptr i32, i32 addrspace(1)* %gep0, i32 %voffset
store i32 0, i32 addrspace(1)* %gep1		store i32 0, i32 addrspace(1)* %gep1
ret void		ret void
}		}

define amdgpu_ps float @mubuf_load_sgpr_ptr(float addrspace(1)* inreg %ptr) {		define amdgpu_ps float @mubuf_load_sgpr_ptr(float addrspace(1)* inreg %ptr) {
▲ Show 20 Lines • Show All 833 Lines • Show Last 20 Lines

llvm/test/CodeGen/AMDGPU/GlobalISel/regbankselect-amdgcn.s.buffer.load.ll

Show First 20 Lines • Show All 1,460 Lines • ▼ Show 20 Lines	define amdgpu_ps float @s_buffer_load_f32_offset_add_vgpr_sgpr_imm(<4 x i32> inreg %rsrc, i32 %offset.v, i32 inreg %offset.s) {
; CHECK: liveins: $sgpr2, $sgpr3, $sgpr4, $sgpr5, $sgpr6, $vgpr0		; CHECK: liveins: $sgpr2, $sgpr3, $sgpr4, $sgpr5, $sgpr6, $vgpr0
; CHECK: [[COPY:%[0-9]+]]:sgpr(s32) = COPY $sgpr2		; CHECK: [[COPY:%[0-9]+]]:sgpr(s32) = COPY $sgpr2
; CHECK: [[COPY1:%[0-9]+]]:sgpr(s32) = COPY $sgpr3		; CHECK: [[COPY1:%[0-9]+]]:sgpr(s32) = COPY $sgpr3
; CHECK: [[COPY2:%[0-9]+]]:sgpr(s32) = COPY $sgpr4		; CHECK: [[COPY2:%[0-9]+]]:sgpr(s32) = COPY $sgpr4
; CHECK: [[COPY3:%[0-9]+]]:sgpr(s32) = COPY $sgpr5		; CHECK: [[COPY3:%[0-9]+]]:sgpr(s32) = COPY $sgpr5
; CHECK: [[COPY4:%[0-9]+]]:vgpr(s32) = COPY $vgpr0		; CHECK: [[COPY4:%[0-9]+]]:vgpr(s32) = COPY $vgpr0
; CHECK: [[COPY5:%[0-9]+]]:sgpr(s32) = COPY $sgpr6		; CHECK: [[COPY5:%[0-9]+]]:sgpr(s32) = COPY $sgpr6
; CHECK: [[BUILD_VECTOR:%[0-9]+]]:sgpr(<4 x s32>) = G_BUILD_VECTOR [[COPY]](s32), [[COPY1]](s32), [[COPY2]](s32), [[COPY3]](s32)		; CHECK: [[BUILD_VECTOR:%[0-9]+]]:sgpr(<4 x s32>) = G_BUILD_VECTOR [[COPY]](s32), [[COPY1]](s32), [[COPY2]](s32), [[COPY3]](s32)
; CHECK: [[C:%[0-9]+]]:sgpr(s32) = G_CONSTANT i32 1024
; CHECK: [[COPY6:%[0-9]+]]:vgpr(s32) = COPY [[COPY5]](s32)		; CHECK: [[COPY6:%[0-9]+]]:vgpr(s32) = COPY [[COPY5]](s32)
; CHECK: [[ADD:%[0-9]+]]:vgpr(s32) = G_ADD [[COPY4]], [[COPY6]]		; CHECK: [[ADD:%[0-9]+]]:vgpr(s32) = G_ADD [[COPY4]], [[COPY6]]
		; CHECK: [[C:%[0-9]+]]:sgpr(s32) = G_CONSTANT i32 1024
; CHECK: [[COPY7:%[0-9]+]]:vgpr(s32) = COPY [[C]](s32)		; CHECK: [[COPY7:%[0-9]+]]:vgpr(s32) = COPY [[C]](s32)
; CHECK: [[ADD1:%[0-9]+]]:vgpr(s32) = G_ADD [[ADD]], [[COPY7]]		; CHECK: [[ADD1:%[0-9]+]]:vgpr(s32) = G_ADD [[ADD]], [[COPY7]]
; CHECK: [[C1:%[0-9]+]]:sgpr(s32) = G_CONSTANT i32 0		; CHECK: [[C1:%[0-9]+]]:sgpr(s32) = G_CONSTANT i32 0
; CHECK: [[C2:%[0-9]+]]:vgpr(s32) = G_CONSTANT i32 0		; CHECK: [[C2:%[0-9]+]]:vgpr(s32) = G_CONSTANT i32 0
; CHECK: [[AMDGPU_BUFFER_LOAD:%[0-9]+]]:vgpr(s32) = G_AMDGPU_BUFFER_LOAD [[BUILD_VECTOR]](<4 x s32>), [[C2]](s32), [[ADD]], [[C1]], 1024, 0, 0 :: (dereferenceable invariant load 4)		; CHECK: [[AMDGPU_BUFFER_LOAD:%[0-9]+]]:vgpr(s32) = G_AMDGPU_BUFFER_LOAD [[BUILD_VECTOR]](<4 x s32>), [[C2]](s32), [[ADD]], [[C1]], 1024, 0, 0 :: (dereferenceable invariant load 4)
; CHECK: $vgpr0 = COPY [[AMDGPU_BUFFER_LOAD]](s32)		; CHECK: $vgpr0 = COPY [[AMDGPU_BUFFER_LOAD]](s32)
; CHECK: SI_RETURN_TO_EPILOG implicit $vgpr0		; CHECK: SI_RETURN_TO_EPILOG implicit $vgpr0
%offset.base = add i32 %offset.v, %offset.s		%offset.base = add i32 %offset.v, %offset.s
%offset = add i32 %offset.base, 1024		%offset = add i32 %offset.base, 1024
%val = call float @llvm.amdgcn.s.buffer.load.f32(<4 x i32> %rsrc, i32 %offset, i32 0)		%val = call float @llvm.amdgcn.s.buffer.load.f32(<4 x i32> %rsrc, i32 %offset, i32 0)
ret float %val		ret float %val
}		}

define amdgpu_ps float @s_buffer_load_f32_offset_add_sgpr_vgpr_imm(<4 x i32> inreg %rsrc, i32 %offset.v, i32 inreg %offset.s) {		define amdgpu_ps float @s_buffer_load_f32_offset_add_sgpr_vgpr_imm(<4 x i32> inreg %rsrc, i32 %offset.v, i32 inreg %offset.s) {
; CHECK-LABEL: name: s_buffer_load_f32_offset_add_sgpr_vgpr_imm		; CHECK-LABEL: name: s_buffer_load_f32_offset_add_sgpr_vgpr_imm
; CHECK: bb.1 (%ir-block.0):		; CHECK: bb.1 (%ir-block.0):
; CHECK: liveins: $sgpr2, $sgpr3, $sgpr4, $sgpr5, $sgpr6, $vgpr0		; CHECK: liveins: $sgpr2, $sgpr3, $sgpr4, $sgpr5, $sgpr6, $vgpr0
; CHECK: [[COPY:%[0-9]+]]:sgpr(s32) = COPY $sgpr2		; CHECK: [[COPY:%[0-9]+]]:sgpr(s32) = COPY $sgpr2
; CHECK: [[COPY1:%[0-9]+]]:sgpr(s32) = COPY $sgpr3		; CHECK: [[COPY1:%[0-9]+]]:sgpr(s32) = COPY $sgpr3
; CHECK: [[COPY2:%[0-9]+]]:sgpr(s32) = COPY $sgpr4		; CHECK: [[COPY2:%[0-9]+]]:sgpr(s32) = COPY $sgpr4
; CHECK: [[COPY3:%[0-9]+]]:sgpr(s32) = COPY $sgpr5		; CHECK: [[COPY3:%[0-9]+]]:sgpr(s32) = COPY $sgpr5
; CHECK: [[COPY4:%[0-9]+]]:vgpr(s32) = COPY $vgpr0		; CHECK: [[COPY4:%[0-9]+]]:vgpr(s32) = COPY $vgpr0
; CHECK: [[COPY5:%[0-9]+]]:sgpr(s32) = COPY $sgpr6		; CHECK: [[COPY5:%[0-9]+]]:sgpr(s32) = COPY $sgpr6
; CHECK: [[BUILD_VECTOR:%[0-9]+]]:sgpr(<4 x s32>) = G_BUILD_VECTOR [[COPY]](s32), [[COPY1]](s32), [[COPY2]](s32), [[COPY3]](s32)		; CHECK: [[BUILD_VECTOR:%[0-9]+]]:sgpr(<4 x s32>) = G_BUILD_VECTOR [[COPY]](s32), [[COPY1]](s32), [[COPY2]](s32), [[COPY3]](s32)
; CHECK: [[C:%[0-9]+]]:sgpr(s32) = G_CONSTANT i32 1024
; CHECK: [[COPY6:%[0-9]+]]:vgpr(s32) = COPY [[COPY5]](s32)		; CHECK: [[COPY6:%[0-9]+]]:vgpr(s32) = COPY [[COPY5]](s32)
; CHECK: [[ADD:%[0-9]+]]:vgpr(s32) = G_ADD [[COPY6]], [[COPY4]]		; CHECK: [[ADD:%[0-9]+]]:vgpr(s32) = G_ADD [[COPY6]], [[COPY4]]
		; CHECK: [[C:%[0-9]+]]:sgpr(s32) = G_CONSTANT i32 1024
; CHECK: [[COPY7:%[0-9]+]]:vgpr(s32) = COPY [[C]](s32)		; CHECK: [[COPY7:%[0-9]+]]:vgpr(s32) = COPY [[C]](s32)
; CHECK: [[ADD1:%[0-9]+]]:vgpr(s32) = G_ADD [[ADD]], [[COPY7]]		; CHECK: [[ADD1:%[0-9]+]]:vgpr(s32) = G_ADD [[ADD]], [[COPY7]]
; CHECK: [[C1:%[0-9]+]]:sgpr(s32) = G_CONSTANT i32 0		; CHECK: [[C1:%[0-9]+]]:sgpr(s32) = G_CONSTANT i32 0
; CHECK: [[C2:%[0-9]+]]:vgpr(s32) = G_CONSTANT i32 0		; CHECK: [[C2:%[0-9]+]]:vgpr(s32) = G_CONSTANT i32 0
; CHECK: [[AMDGPU_BUFFER_LOAD:%[0-9]+]]:vgpr(s32) = G_AMDGPU_BUFFER_LOAD [[BUILD_VECTOR]](<4 x s32>), [[C2]](s32), [[ADD]], [[C1]], 1024, 0, 0 :: (dereferenceable invariant load 4)		; CHECK: [[AMDGPU_BUFFER_LOAD:%[0-9]+]]:vgpr(s32) = G_AMDGPU_BUFFER_LOAD [[BUILD_VECTOR]](<4 x s32>), [[C2]](s32), [[ADD]], [[C1]], 1024, 0, 0 :: (dereferenceable invariant load 4)
; CHECK: $vgpr0 = COPY [[AMDGPU_BUFFER_LOAD]](s32)		; CHECK: $vgpr0 = COPY [[AMDGPU_BUFFER_LOAD]](s32)
; CHECK: SI_RETURN_TO_EPILOG implicit $vgpr0		; CHECK: SI_RETURN_TO_EPILOG implicit $vgpr0
%offset.base = add i32 %offset.s, %offset.v		%offset.base = add i32 %offset.s, %offset.v
▲ Show 20 Lines • Show All 83 Lines • Show Last 20 Lines

This is an archive of the discontinued LLVM Phabricator instance.

[GlobalISel][Localizer] Enable intra-block localization of already-local uses.
ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 248898

llvm/lib/CodeGen/GlobalISel/Localizer.cpp

llvm/test/CodeGen/AArch64/GlobalISel/localizer-arm64-tti.ll

llvm/test/CodeGen/AArch64/GlobalISel/localizer.mir

llvm/test/CodeGen/AArch64/GlobalISel/swifterror.ll

llvm/test/CodeGen/AArch64/GlobalISel/translate-constant-dag.ll

llvm/test/CodeGen/AArch64/tail-call.ll

llvm/test/CodeGen/AArch64/tiny_model.ll

llvm/test/CodeGen/AMDGPU/GlobalISel/constant-bus-restriction.ll

llvm/test/CodeGen/AMDGPU/GlobalISel/extractelement.ll

llvm/test/CodeGen/AMDGPU/GlobalISel/insertelement.ll

llvm/test/CodeGen/AMDGPU/GlobalISel/mubuf-global.ll

llvm/test/CodeGen/AMDGPU/GlobalISel/regbankselect-amdgcn.s.buffer.load.ll

This is an archive of the discontinued LLVM Phabricator instance.

[GlobalISel][Localizer] Enable intra-block localization of already-local uses.ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 248898

llvm/lib/CodeGen/GlobalISel/Localizer.cpp

llvm/test/CodeGen/AArch64/GlobalISel/localizer-arm64-tti.ll

llvm/test/CodeGen/AArch64/GlobalISel/localizer.mir

llvm/test/CodeGen/AArch64/GlobalISel/swifterror.ll

llvm/test/CodeGen/AArch64/GlobalISel/translate-constant-dag.ll

llvm/test/CodeGen/AArch64/tail-call.ll

llvm/test/CodeGen/AArch64/tiny_model.ll

llvm/test/CodeGen/AMDGPU/GlobalISel/constant-bus-restriction.ll

llvm/test/CodeGen/AMDGPU/GlobalISel/extractelement.ll

llvm/test/CodeGen/AMDGPU/GlobalISel/insertelement.ll

llvm/test/CodeGen/AMDGPU/GlobalISel/mubuf-global.ll

llvm/test/CodeGen/AMDGPU/GlobalISel/regbankselect-amdgcn.s.buffer.load.ll

[GlobalISel][Localizer] Enable intra-block localization of already-local uses.
ClosedPublic