This is an archive of the discontinued LLVM Phabricator instance.

Paths

Table of Contentst

-
llvm/
-
include/llvm/IR/
-
llvm/
-
IR/
-
IntrinsicsAMDGPU.td
-
lib/
-
IR/
-
AutoUpgrade.cpp
-
Target/AMDGPU/
-
AMDGPU/
-
AMDGPUISelLowering.cpp
-
AMDGPULegalizerInfo.h
-
AMDGPULegalizerInfo.cpp
-
SIISelLowering.h
-
SIISelLowering.cpp
-
test/
-
Analysis/
-
DivergenceAnalysis/AMDGPU/
-
AMDGPU/
-
llvm.amdgcn.buffer.atomic.ll
-
LegacyDivergenceAnalysis/AMDGPU/
-
AMDGPU/
-
llvm.amdgcn.buffer.atomic.ll
-
Bitcode/
-
upgrade-amdgpu-amdgcn-buffer-intrinsics.ll
-
CodeGen/
-
AMDGPU/
-
GlobalISel/
-
atomic_optimizations_mul_one.ll
-
buffer-atomic-fadd.f32-no-rtn.ll
-
buffer-atomic-fadd.f32-rtn.ll
-
buffer-atomic-fadd.f64.ll
-
buffer-atomic-fadd.v2f16-no-rtn.ll
-
buffer-atomic-fadd.v2f16-rtn.ll
-
buffer-schedule.ll
-
fp64-atomics-gfx90a.ll
-
legalize-llvm.amdgcn.s.buffer.load.mir
-
llvm.amdgcn.raw.buffer.atomic.add.ll
-
llvm.amdgcn.raw.buffer.atomic.cmpswap.ll
-
llvm.amdgcn.raw.buffer.atomic.fadd-with-ret.ll
-
llvm.amdgcn.raw.buffer.atomic.fadd.ll
-
llvm.amdgcn.raw.buffer.load.format.f16.ll
-
llvm.amdgcn.raw.buffer.load.format.ll
-
llvm.amdgcn.raw.buffer.load.ll
-
llvm.amdgcn.raw.buffer.store.format.f16.ll
-
llvm.amdgcn.raw.buffer.store.format.f32.ll
-
llvm.amdgcn.raw.buffer.store.ll
-
llvm.amdgcn.raw.tbuffer.load.f16.ll
-
llvm.amdgcn.raw.tbuffer.load.ll
-
llvm.amdgcn.raw.tbuffer.store.f16.ll
-
llvm.amdgcn.raw.tbuffer.store.i8.ll
-
llvm.amdgcn.raw.tbuffer.store.ll
-
llvm.amdgcn.s.buffer.load.ll
-
llvm.amdgcn.set.inactive.ll
-
llvm.amdgcn.struct.buffer.atomic.add.ll
-
llvm.amdgcn.struct.buffer.atomic.cmpswap.ll
-
llvm.amdgcn.struct.buffer.atomic.fadd-with-ret.ll
-
llvm.amdgcn.struct.buffer.atomic.fadd.ll
-
llvm.amdgcn.struct.buffer.load.format.f16.ll
-
llvm.amdgcn.struct.buffer.load.format.ll
-
llvm.amdgcn.struct.buffer.load.ll
-
llvm.amdgcn.struct.buffer.store.format.f16.ll
-
llvm.amdgcn.struct.buffer.store.format.f32.ll
-
llvm.amdgcn.struct.buffer.store.ll
-
llvm.amdgcn.struct.tbuffer.load.f16.ll
-
llvm.amdgcn.struct.tbuffer.load.ll
-
merge-buffer-stores.ll
-
regbankselect-amdgcn.raw.buffer.load.ll
-
regbankselect-amdgcn.s.buffer.load.ll
-
regbankselect-amdgcn.struct.buffer.load.ll
-
regbankselect-amdgcn.struct.buffer.store.ll
-
unsupported-load.ll
-
unsupported-ptr-add.ll
-
amdgcn-load-offset-from-reg.ll
-
amdgcn.bitcast.ll
-
amdpal.ll
-
atomic-optimizer-strict-wqm.ll
-
atomic_optimizations_buffer.ll
-
atomic_optimizations_pixelshader.ll
-
atomic_optimizations_raw_buffer.ll
-
atomic_optimizations_struct_buffer.ll
-
bitcast-v4f16-v4i16.ll
-
buffer-atomic-fadd.f32-no-rtn.ll
-
buffer-atomic-fadd.f32-rtn.ll
-
buffer-atomic-fadd.f64.ll
-
buffer-atomic-fadd.v2f16-no-rtn.ll
-
buffer-atomic-fadd.v2f16-rtn.ll
-
buffer-intrinsics-mmo-offsets.ll
-
buffer-rsrc-ptr-ops.ll
-
buffer-schedule.ll
-
bug-vopc-commute.ll
-
cc-sgpr-limit.ll
-
cc-sgpr-over-limit.ll
-
combine-add-zext-xor.ll
-
constant-address-space-32bit.ll
-
copy_to_scc.ll
-
dag-divergence-atomic.ll
-
dagcombine-fma-fmad.ll
-
else.ll
-
extract_subvector_vec4_vec3.ll
-
fail-select-buffer-atomic-fadd.ll
-
fix-wwm-vgpr-copy.ll
-
fp-min-max-buffer-atomics.ll
-
fp64-atomics-gfx90a.ll
-
fp64-min-max-buffer-atomics.ll
-
gfx90a-enc.ll
-
i1-copy-from-loop.ll
-
llvm.amdgcn.atomic.csub.ll
-
llvm.amdgcn.atomic.fadd.gfx90a.ll
-
llvm.amdgcn.atomic.fadd.ll
-
llvm.amdgcn.buffer.atomic.ll
-
llvm.amdgcn.buffer.load.dwordx3.ll
-
llvm.amdgcn.buffer.load.format.d16.ll
-
llvm.amdgcn.buffer.load.format.ll
-
llvm.amdgcn.buffer.load.ll
-
llvm.amdgcn.buffer.store.dwordx3.ll
-
llvm.amdgcn.buffer.store.format.d16.ll
-
llvm.amdgcn.buffer.store.format.ll
-
llvm.amdgcn.buffer.store.ll
-
llvm.amdgcn.exp.ll
-
llvm.amdgcn.lds.direct.load.ll
-
llvm.amdgcn.lds.param.load.ll
-
llvm.amdgcn.raw.buffer.atomic.fadd.ll
-
llvm.amdgcn.raw.buffer.atomic.ll
-
llvm.amdgcn.raw.buffer.load.format.d16.ll
-
llvm.amdgcn.raw.buffer.load.format.ll
-
llvm.amdgcn.raw.buffer.load.lds.ll
-
llvm.amdgcn.raw.buffer.load.ll
-
llvm.amdgcn.raw.buffer.store.format.d16.ll
-
llvm.amdgcn.raw.buffer.store.format.ll
-
llvm.amdgcn.raw.buffer.store.ll
-
llvm.amdgcn.raw.tbuffer.load.d16.ll
-
llvm.amdgcn.raw.tbuffer.load.ll
-
llvm.amdgcn.raw.tbuffer.store.d16.ll
-
llvm.amdgcn.raw.tbuffer.store.ll
-
llvm.amdgcn.s.buffer.load.ll
-
llvm.amdgcn.set.inactive.ll
-
llvm.amdgcn.softwqm.ll
-
llvm.amdgcn.struct.buffer.atomic.fadd.ll
-
llvm.amdgcn.struct.buffer.atomic.ll
-
llvm.amdgcn.struct.buffer.load.format.d16.ll
-
llvm.amdgcn.struct.buffer.load.format.ll
-
llvm.amdgcn.struct.buffer.load.format.v3f16.ll
-
llvm.amdgcn.struct.buffer.load.lds.ll
-
llvm.amdgcn.struct.buffer.load.ll
-
llvm.amdgcn.struct.buffer.store.format.d16.ll
-
llvm.amdgcn.struct.buffer.store.format.ll
-
llvm.amdgcn.struct.buffer.store.ll
-
llvm.amdgcn.struct.tbuffer.load.d16.ll
-
llvm.amdgcn.struct.tbuffer.load.ll
-
llvm.amdgcn.struct.tbuffer.store.d16.ll
-
llvm.amdgcn.struct.tbuffer.store.ll
-
llvm.amdgcn.tbuffer.load.d16.ll
-
llvm.amdgcn.tbuffer.load.dwordx3.ll
-
llvm.amdgcn.tbuffer.load.ll
-
llvm.amdgcn.tbuffer.store.d16.ll
-
llvm.amdgcn.tbuffer.store.dwordx3.ll
-
llvm.amdgcn.tbuffer.store.ll
-
load-local-redundant-copies.ll
-
loop_exit_with_xor.ll
-
lower-work-group-id-intrinsics.ll
-
merge-store-crash.ll
-
merge-store-usedef.ll
-
mubuf-legalize-operands.ll
-
mubuf-shader-vgpr.ll
-
mubuf.ll
-
scheduler-subrange-crash.ll
-
set-inactive-wwm-overwrite.ll
-
set-wave-priority.ll
-
sgpr-copy.ll
-
si-annotate-cf-kill.ll
-
si-scheduler-exports.ll
-
si-scheduler.ll
-
si-sgpr-spill.ll
-
si-spill-cf.ll
-
si-triv-disjoint-mem-access.ll
-
smrd-gfx10.ll
-
smrd.ll
-
split-smrd.ll
-
splitkit-getsubrangeformask.ll
-
uniform-branch-intrinsic-cond.ll
-
vgpr-descriptor-waterfall-loop-idom-update.ll
-
vgpr-spill-emergency-stack-slot.ll
-
vopc_dpp.ll
-
wait.ll
-
wave32.ll
-
wqm.ll
-
wwm-reserved-spill.ll
-
wwm-reserved.ll
-
MIR/AMDGPU/
-
AMDGPU/
-
custom-pseudo-source-values.ll
-
Transforms/
-
EarlyCSE/AMDGPU/
-
AMDGPU/
-
intrinsics.ll
-
InstCombine/AMDGPU/
-
AMDGPU/
-
amdgcn-demanded-vector-elts-inseltpoison.ll
-
amdgcn-demanded-vector-elts.ll
-
LICM/AMDGPU/
-
AMDGPU/
-
buffer-rsrc-ptrs.ll
-
SROA/
-
sroa-common-type-fail-promotion.ll
-
StructurizeCFG/
-
rebuild-ssa-infinite-loop-inseltpoison.ll
-
rebuild-ssa-infinite-loop.ll
-
Verifier/AMDGPU/
-
AMDGPU/
-
intrinsic-immarg.ll

Differential D146761

[AMDGPU] Make buffer intrinsics pointer-valued
AbandonedPublic

Authored by krzysz00 on Mar 23 2023, 2:38 PM.

Download Raw Diff

Details

Reviewers

arsenm
nhaehnle

Group Reviewers

Restricted Project

Summary

( See
https://discourse.llvm.org/t/representing-buffer-descriptors-in-the-amdgpu-target-call-for-suggestions/68798
for some of the context )

Currently, the intrinsics for operating on AMDGPU's buffer descriptors
take the descriptor as a <4 x i32> value. This is problematic, in that
these intrinsics cannot be analyzed like the load/store/atomic
operations they are, which weakens our ability to perform compiler
optimizations and blocks the address space 7 work done elsewhere.
Therefore, this commit:

Changes all intrinsics that take a 128-bit buffer resource (V#) to

take a ptr addrspace(8) instead.

Updates the definitions of those intrinsics to indicate that they

only operate on memory related to their arguments.

Updates Global ISel and SelectionDAG to, early in their operation,

lower these address space 8 pointers (which are 128-bit scalars) to
<4 x i32> vectors. This must be done because the definitions of the
resource instructions themselves (and all the code for reasoning about
them) expects a <4 x i32> value, and this cannot be changed because
assigning a register class to i128 values would cause breakages in our
SelectionDAG usage.

- Specifically, in GlobalISel, we use G_UNMERGE/G_BUIlD_VECTOR and VECTOR_EXTRACT_ELEMENT/G_MERGE in the non-vector case, and G_{INTTOPTR,PTRTOINT} and G_BITCAST in the complex case, as we have found this produces better codegen
- In SelectionDAG, we simply use a bitcast We have found that these produce better-looking codegen.
Update some of the creation of MachineMemOperands to keep a

reference to the original buffer descriptor. Designing a
PseudoSourceValue that also holds the original index/offset/... values
is future work.

Define auto-upgrade from the old intrinscic forms to the new ones

that performs the transformation

%v = call T @llvm.amdgcn.*buffer*(...a, <4 x i32> %rsrc, ...b)

>

%.rsrc.int = bitcast <4 x i32> %rsrc to i128
%.rsrc.ptr = inttoptr i128 %.rsrc.int to ptr addrspace(8)
%v = call T @llvm.amdgcn.*buffer*(...a, ptr addrspace(8) %.rsrc.ptr, ...b)

Tests have been updated to the new intrinsic forms.
The test changes, generally, fall into

Changing the declarations of buffer intrinsics to their new forms
Updating MIR tests to account for the new types or for additional

COPY instructions that are temporarily introduced by the new
legalizations

Occasional drifts of a movk to the other side of a buffer operation
Changes to the behavior of loading a ptr addrspace(8) from an undef

location, which can now act like [???0, ???1, ???0, ???1] : <4 x i32>
instead of [??? 0, ???1, ???2, ???3] : <4 x i32>. These were often
avoided by removing such loads and replacing them with loads from the
relevant null pointer.

One of the unrelated changes, caused by the legalizaiton not being
idempotent, is llvm/test/CodeGen/AMDGPU/dagcombine-fma-fmad.ll 's lack
of a mad, which is, per discussion, fine.

This patch does not appear to affect the final generated code, except
for the introduction of additional moves at O0 in some cases.

Depends on D145441

Diff Detail

Repository: rG LLVM Github Monorepo

Unit TestsFailed

	Time	Test
	250 ms	x64 debian > MLIR.Target/LLVMIR::rocdl.mlir

Event Timeline

krzysz00 created this revision.Mar 23 2023, 2:38 PM

Herald added a project: Restricted Project. · View Herald TranscriptMar 23 2023, 2:38 PM

Herald added subscribers: kosarev, foad, kerbowa and 11 others. · View Herald Transcript

krzysz00 requested review of this revision.Mar 23 2023, 2:38 PM

Herald added a project: Restricted Project. · View Herald TranscriptMar 23 2023, 2:38 PM

Herald added subscribers: llvm-commits, wdng. · View Herald Transcript

krzysz00 added a child revision: D146762: [Verifier] Ban GEP, load, store of addrspace(8) on AMDGPU.Mar 23 2023, 2:40 PM

krzysz00 added reviewers: arsenm, nhaehnle, Restricted Project.Mar 23 2023, 2:44 PM

Harbormaster completed remote builds in B221424: Diff 507888.Mar 23 2023, 3:15 PM

Add basic cest for alias analysis on buffer intrinsics

Herald added a subscriber: asbirlea. · View Herald TranscriptMar 24 2023, 11:42 AM

Add tests for constructing buffer descriptors from integers

Harbormaster completed remote builds in B221661: Diff 508185.Mar 24 2023, 12:36 PM

While here, update amdgcn.s.buffer.load to have the correct memory
effects (namely, a read from its argument).

Can you split this part out into its own patch? It sounds more straightforward and less controversial than the rest.

krzysz00 mentioned this in D147245: [AMDGPU] Make amdgcn.s.buffer.load a memory-reading intrinsic.Mar 30 2023, 10:19 AM

Factor out s.buffer.load memory effect change to earlier patch, rebase

Harbormaster completed remote builds in B222809: Diff 509762.Mar 30 2023, 12:49 PM

Abandoning because this'll break backwards compatibility as currently implemented.

Large Diff

This large diff affects 180 files. Files without inline comments have been collapsed. Expand All Files

Revision Contents

Path

Size

llvm/

include/

llvm/

IR/

IntrinsicsAMDGPU.td

254 lines

lib/

IR/

AutoUpgrade.cpp

284 lines

Target/

AMDGPU/

AMDGPUISelLowering.cpp

6 lines

AMDGPULegalizerInfo.h

9 lines

AMDGPULegalizerInfo.cpp

283 lines

SIISelLowering.h

6 lines

SIISelLowering.cpp

377 lines

test/

Analysis/

DivergenceAnalysis/

AMDGPU/

llvm.amdgcn.buffer.atomic.ll

212 lines

LegacyDivergenceAnalysis/

AMDGPU/

llvm.amdgcn.buffer.atomic.ll

66 lines

Bitcode/

upgrade-amdgpu-amdgcn-buffer-intrinsics.ll

3194 lines

CodeGen/

AMDGPU/

GlobalISel/

atomic_optimizations_mul_one.ll

69 lines

buffer-atomic-fadd.f32-no-rtn.ll

52 lines

buffer-atomic-fadd.f32-rtn.ll

52 lines

buffer-atomic-fadd.f64.ll

68 lines

buffer-atomic-fadd.v2f16-no-rtn.ll

52 lines

buffer-atomic-fadd.v2f16-rtn.ll

36 lines

buffer-schedule.ll

12 lines

fp64-atomics-gfx90a.ll

84 lines

legalize-llvm.amdgcn.s.buffer.load.mir

136 lines

llvm.amdgcn.raw.buffer.atomic.add.ll

68 lines

llvm.amdgcn.raw.buffer.atomic.cmpswap.ll

52 lines

llvm.amdgcn.raw.buffer.atomic.fadd-with-ret.ll

14 lines

llvm.amdgcn.raw.buffer.atomic.fadd.ll

124 lines

llvm.amdgcn.raw.buffer.load.format.f16.ll

72 lines

llvm.amdgcn.raw.buffer.load.format.ll

56 lines

llvm.amdgcn.raw.buffer.load.ll

304 lines

llvm.amdgcn.raw.buffer.store.format.f16.ll

178 lines

llvm.amdgcn.raw.buffer.store.format.f32.ll

132 lines

llvm.amdgcn.raw.buffer.store.ll

296 lines

llvm.amdgcn.raw.tbuffer.load.f16.ll

108 lines

llvm.amdgcn.raw.tbuffer.load.ll

80 lines

llvm.amdgcn.raw.tbuffer.store.f16.ll

136 lines

llvm.amdgcn.raw.tbuffer.store.i8.ll

50 lines

llvm.amdgcn.raw.tbuffer.store.ll

208 lines

llvm.amdgcn.s.buffer.load.ll

986 lines

llvm.amdgcn.set.inactive.ll

6 lines

llvm.amdgcn.struct.buffer.atomic.add.ll

60 lines

llvm.amdgcn.struct.buffer.atomic.cmpswap.ll

44 lines

llvm.amdgcn.struct.buffer.atomic.fadd-with-ret.ll

14 lines

llvm.amdgcn.struct.buffer.atomic.fadd.ll

124 lines

llvm.amdgcn.struct.buffer.load.format.f16.ll

86 lines

llvm.amdgcn.struct.buffer.load.format.ll

120 lines

llvm.amdgcn.struct.buffer.load.ll

152 lines

llvm.amdgcn.struct.buffer.store.format.f16.ll

78 lines

llvm.amdgcn.struct.buffer.store.format.f32.ll

58 lines

llvm.amdgcn.struct.buffer.store.ll

104 lines

llvm.amdgcn.struct.tbuffer.load.f16.ll

84 lines

llvm.amdgcn.struct.tbuffer.load.ll

64 lines

merge-buffer-stores.ll

22 lines

regbankselect-amdgcn.raw.buffer.load.ll

48 lines

regbankselect-amdgcn.s.buffer.load.ll

770 lines

regbankselect-amdgcn.struct.buffer.load.ll

48 lines

regbankselect-amdgcn.struct.buffer.store.ll

48 lines

unsupported-load.ll

9 lines

unsupported-ptr-add.ll

14 lines

amdgcn-load-offset-from-reg.ll

54 lines

amdgcn.bitcast.ll

4 lines

amdpal.ll

4 lines

atomic-optimizer-strict-wqm.ll

4 lines

atomic_optimizations_buffer.ll

42 lines

atomic_optimizations_pixelshader.ll

16 lines

atomic_optimizations_raw_buffer.ll

36 lines

atomic_optimizations_struct_buffer.ll

44 lines

bitcast-v4f16-v4i16.ll

10 lines

buffer-atomic-fadd.f32-no-rtn.ll

104 lines

buffer-atomic-fadd.f32-rtn.ll

104 lines

buffer-atomic-fadd.f64.ll

184 lines

buffer-atomic-fadd.v2f16-no-rtn.ll

104 lines

buffer-atomic-fadd.v2f16-rtn.ll

62 lines

buffer-intrinsics-mmo-offsets.ll

545 lines

buffer-rsrc-ptr-ops.ll

113 lines

buffer-schedule.ll

48 lines

bug-vopc-commute.ll

6 lines

cc-sgpr-limit.ll

6 lines

cc-sgpr-over-limit.ll

2 lines

combine-add-zext-xor.ll

14 lines

constant-address-space-32bit.ll

6 lines

copy_to_scc.ll

6 lines

dag-divergence-atomic.ll

96 lines

dagcombine-fma-fmad.ll

28 lines

else.ll

4 lines

extract_subvector_vec4_vec3.ll

8 lines

fail-select-buffer-atomic-fadd.ll

6 lines

fix-wwm-vgpr-copy.ll

10 lines

fp-min-max-buffer-atomics.ll

28 lines

fp64-atomics-gfx90a.ll

98 lines

fp64-min-max-buffer-atomics.ll

28 lines

gfx90a-enc.ll

14 lines

i1-copy-from-loop.ll

6 lines

llvm.amdgcn.atomic.csub.ll

10 lines

llvm.amdgcn.atomic.fadd.gfx90a.ll

20 lines

llvm.amdgcn.atomic.fadd.ll

20 lines

llvm.amdgcn.buffer.atomic.ll

132 lines

llvm.amdgcn.buffer.load.dwordx3.ll

32 lines

llvm.amdgcn.buffer.load.format.d16.ll

24 lines

llvm.amdgcn.buffer.load.format.ll

60 lines

llvm.amdgcn.buffer.load.ll

188 lines

llvm.amdgcn.buffer.store.dwordx3.ll

32 lines

llvm.amdgcn.buffer.store.format.d16.ll

24 lines

llvm.amdgcn.buffer.store.format.ll

52 lines

llvm.amdgcn.buffer.store.ll

158 lines

llvm.amdgcn.exp.ll

4 lines

llvm.amdgcn.lds.direct.load.ll

16 lines

llvm.amdgcn.lds.param.load.ll

16 lines

llvm.amdgcn.raw.buffer.atomic.fadd.ll

24 lines

llvm.amdgcn.raw.buffer.atomic.ll

80 lines

llvm.amdgcn.raw.buffer.load.format.d16.ll

24 lines

llvm.amdgcn.raw.buffer.load.format.ll

42 lines

llvm.amdgcn.raw.buffer.load.lds.ll

38 lines

llvm.amdgcn.raw.buffer.load.ll

240 lines

llvm.amdgcn.raw.buffer.store.format.d16.ll

24 lines

llvm.amdgcn.raw.buffer.store.format.ll

40 lines

llvm.amdgcn.raw.buffer.store.ll

202 lines

llvm.amdgcn.raw.tbuffer.load.d16.ll

24 lines

llvm.amdgcn.raw.tbuffer.load.ll

66 lines

llvm.amdgcn.raw.tbuffer.store.d16.ll

24 lines

llvm.amdgcn.raw.tbuffer.store.ll

58 lines

llvm.amdgcn.s.buffer.load.ll

158 lines

llvm.amdgcn.set.inactive.ll

6 lines

llvm.amdgcn.softwqm.ll

50 lines

llvm.amdgcn.struct.buffer.atomic.fadd.ll

20 lines

llvm.amdgcn.struct.buffer.atomic.ll

88 lines

llvm.amdgcn.struct.buffer.load.format.d16.ll

30 lines

llvm.amdgcn.struct.buffer.load.format.ll

128 lines

llvm.amdgcn.struct.buffer.load.format.v3f16.ll

6 lines

llvm.amdgcn.struct.buffer.load.lds.ll

38 lines

llvm.amdgcn.struct.buffer.load.ll

126 lines

llvm.amdgcn.struct.buffer.store.format.d16.ll

30 lines

llvm.amdgcn.struct.buffer.store.format.ll

58 lines

llvm.amdgcn.struct.buffer.store.ll

114 lines

llvm.amdgcn.struct.tbuffer.load.d16.ll

24 lines

llvm.amdgcn.struct.tbuffer.load.ll

74 lines

llvm.amdgcn.struct.tbuffer.store.d16.ll

24 lines

llvm.amdgcn.struct.tbuffer.store.ll

76 lines

llvm.amdgcn.tbuffer.load.d16.ll

24 lines

llvm.amdgcn.tbuffer.load.dwordx3.ll

18 lines

llvm.amdgcn.tbuffer.load.ll

54 lines

llvm.amdgcn.tbuffer.store.d16.ll

24 lines

llvm.amdgcn.tbuffer.store.dwordx3.ll

18 lines

llvm.amdgcn.tbuffer.store.ll

56 lines

load-local-redundant-copies.ll

24 lines

loop_exit_with_xor.ll

8 lines

lower-work-group-id-intrinsics.ll

4 lines

merge-store-crash.ll

4 lines

merge-store-usedef.ll

4 lines

mubuf-legalize-operands.ll

246 lines

mubuf-shader-vgpr.ll

20 lines

mubuf.ll

18 lines

scheduler-subrange-crash.ll

30 lines

set-inactive-wwm-overwrite.ll

14 lines

set-wave-priority.ll

38 lines

sgpr-copy.ll

60 lines

si-annotate-cf-kill.ll

18 lines

si-scheduler-exports.ll

4 lines

si-scheduler.ll

6 lines

si-sgpr-spill.ll

288 lines

si-spill-cf.ll

136 lines

si-triv-disjoint-mem-access.ll

4 lines

smrd-gfx10.ll

18 lines

smrd.ll

218 lines

split-smrd.ll

4 lines

splitkit-getsubrangeformask.ll

397 lines

uniform-branch-intrinsic-cond.ll

6 lines

vgpr-descriptor-waterfall-loop-idom-update.ll

10 lines

vgpr-spill-emergency-stack-slot.ll

17 lines

4 lines

22 lines

10 lines

182 lines

wwm-reserved-spill.ll

199 lines

wwm-reserved.ll

80 lines

MIR/

AMDGPU/

custom-pseudo-source-values.ll

14 lines

Transforms/

EarlyCSE/

AMDGPU/

intrinsics.ll

28 lines

InstCombine/

AMDGPU/

amdgcn-demanded-vector-elts-inseltpoison.ll

1706 lines

amdgcn-demanded-vector-elts.ll

1706 lines

LICM/

AMDGPU/

buffer-rsrc-ptrs.ll

222 lines

SROA/

sroa-common-type-fail-promotion.ll

2 lines

StructurizeCFG/

rebuild-ssa-infinite-loop-inseltpoison.ll

4 lines

rebuild-ssa-infinite-loop.ll

4 lines

Verifier/

AMDGPU/

intrinsic-immarg.ll

82 lines

This is an archive of the discontinued LLVM Phabricator instance.

[AMDGPU] Make buffer intrinsics pointer-valuedAbandonedPublic

Details

>

Diff Detail

Unit TestsFailed

Event Timeline

Large Diff

Revision Contents

Diff 509762

llvm/include/llvm/IR/IntrinsicsAMDGPU.td

llvm/lib/IR/AutoUpgrade.cpp

llvm/lib/Target/AMDGPU/AMDGPUISelLowering.cpp

llvm/lib/Target/AMDGPU/AMDGPULegalizerInfo.h

llvm/lib/Target/AMDGPU/AMDGPULegalizerInfo.cpp

llvm/lib/Target/AMDGPU/SIISelLowering.h

llvm/lib/Target/AMDGPU/SIISelLowering.cpp

llvm/test/Analysis/DivergenceAnalysis/AMDGPU/llvm.amdgcn.buffer.atomic.ll

llvm/test/Analysis/LegacyDivergenceAnalysis/AMDGPU/llvm.amdgcn.buffer.atomic.ll

llvm/test/Bitcode/upgrade-amdgpu-amdgcn-buffer-intrinsics.ll

llvm/test/CodeGen/AMDGPU/GlobalISel/atomic_optimizations_mul_one.ll

llvm/test/CodeGen/AMDGPU/GlobalISel/buffer-atomic-fadd.f32-no-rtn.ll

llvm/test/CodeGen/AMDGPU/GlobalISel/buffer-atomic-fadd.f32-rtn.ll

llvm/test/CodeGen/AMDGPU/GlobalISel/buffer-atomic-fadd.f64.ll

llvm/test/CodeGen/AMDGPU/GlobalISel/buffer-atomic-fadd.v2f16-no-rtn.ll

llvm/test/CodeGen/AMDGPU/GlobalISel/buffer-atomic-fadd.v2f16-rtn.ll

llvm/test/CodeGen/AMDGPU/GlobalISel/buffer-schedule.ll

llvm/test/CodeGen/AMDGPU/GlobalISel/fp64-atomics-gfx90a.ll

llvm/test/CodeGen/AMDGPU/GlobalISel/legalize-llvm.amdgcn.s.buffer.load.mir

llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.raw.buffer.atomic.add.ll

llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.raw.buffer.atomic.cmpswap.ll

llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.raw.buffer.atomic.fadd-with-ret.ll

llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.raw.buffer.atomic.fadd.ll

llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.raw.buffer.load.format.f16.ll

llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.raw.buffer.load.format.ll

llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.raw.buffer.load.ll

llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.raw.buffer.store.format.f16.ll

llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.raw.buffer.store.format.f32.ll

llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.raw.buffer.store.ll

llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.raw.tbuffer.load.f16.ll

llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.raw.tbuffer.load.ll

llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.raw.tbuffer.store.f16.ll

llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.raw.tbuffer.store.i8.ll

llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.raw.tbuffer.store.ll

llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.s.buffer.load.ll

llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.set.inactive.ll

llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.struct.buffer.atomic.add.ll

llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.struct.buffer.atomic.cmpswap.ll

llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.struct.buffer.atomic.fadd-with-ret.ll

llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.struct.buffer.atomic.fadd.ll

llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.struct.buffer.load.format.f16.ll

llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.struct.buffer.load.format.ll

llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.struct.buffer.load.ll

llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.struct.buffer.store.format.f16.ll

llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.struct.buffer.store.format.f32.ll

llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.struct.buffer.store.ll

llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.struct.tbuffer.load.f16.ll

llvm/test/CodeGen/AMDGPU/GlobalISel/llvm.amdgcn.struct.tbuffer.load.ll

llvm/test/CodeGen/AMDGPU/GlobalISel/merge-buffer-stores.ll

llvm/test/CodeGen/AMDGPU/GlobalISel/regbankselect-amdgcn.raw.buffer.load.ll

llvm/test/CodeGen/AMDGPU/GlobalISel/regbankselect-amdgcn.s.buffer.load.ll

llvm/test/CodeGen/AMDGPU/GlobalISel/regbankselect-amdgcn.struct.buffer.load.ll

llvm/test/CodeGen/AMDGPU/GlobalISel/regbankselect-amdgcn.struct.buffer.store.ll

llvm/test/CodeGen/AMDGPU/GlobalISel/unsupported-load.ll

llvm/test/CodeGen/AMDGPU/GlobalISel/unsupported-ptr-add.ll

llvm/test/CodeGen/AMDGPU/amdgcn-load-offset-from-reg.ll

llvm/test/CodeGen/AMDGPU/amdgcn.bitcast.ll

llvm/test/CodeGen/AMDGPU/amdpal.ll

llvm/test/CodeGen/AMDGPU/atomic-optimizer-strict-wqm.ll

llvm/test/CodeGen/AMDGPU/atomic_optimizations_buffer.ll

llvm/test/CodeGen/AMDGPU/atomic_optimizations_pixelshader.ll

llvm/test/CodeGen/AMDGPU/atomic_optimizations_raw_buffer.ll

llvm/test/CodeGen/AMDGPU/atomic_optimizations_struct_buffer.ll

llvm/test/CodeGen/AMDGPU/bitcast-v4f16-v4i16.ll

llvm/test/CodeGen/AMDGPU/buffer-atomic-fadd.f32-no-rtn.ll

llvm/test/CodeGen/AMDGPU/buffer-atomic-fadd.f32-rtn.ll

llvm/test/CodeGen/AMDGPU/buffer-atomic-fadd.f64.ll

llvm/test/CodeGen/AMDGPU/buffer-atomic-fadd.v2f16-no-rtn.ll

llvm/test/CodeGen/AMDGPU/buffer-atomic-fadd.v2f16-rtn.ll

llvm/test/CodeGen/AMDGPU/buffer-intrinsics-mmo-offsets.ll

[AMDGPU] Make buffer intrinsics pointer-valued
AbandonedPublic