This is an archive of the discontinued LLVM Phabricator instance.

[AMDGPU] Split FeatureAtomicFaddInsts feature. NFC.
AbandonedPublic

Authored by foad on Mar 8 2022, 9:47 AM.

Download Raw Diff

Details

Reviewers

rampitec
Joe_Nash
b-sumner

Summary

Split the feature into separate FeatureAtomicFaddNoRtnInsts and
FeatureAtomicFaddRtnInsts features. Previously isGFX90A was used as a
proxy for the latter.

Diff Detail

Repository: rG LLVM Github Monorepo

Unit TestsFailed

	Time	Test
	60,080 ms	x64 debian > MLIR.Examples/standalone::test.toy
	60,060 ms	x64 debian > libFuzzer.libFuzzer::fuzzer-leak.test
	60,760 ms	x64 debian > libFuzzer.libFuzzer::keep-seed.test
	60,220 ms	x64 debian > libFuzzer.libFuzzer::large.test
	60,040 ms	x64 debian > libFuzzer.libFuzzer::out-of-process-fuzz.test
		View Full Test Results (6 Failed)

Event Timeline

foad created this revision.Mar 8 2022, 9:47 AM

Herald added a project: Restricted Project. · View Herald TranscriptMar 8 2022, 9:47 AM

Herald added subscribers: kerbowa, hiraditya, t-tye and 7 others. · View Herald Transcript

foad requested review of this revision.Mar 8 2022, 9:47 AM

Herald added a project: Restricted Project. · View Herald TranscriptMar 8 2022, 9:47 AM

Herald added subscribers: llvm-commits, wdng. · View Herald Transcript

I do not think this is as simple as this. The support matrix of atomics would require much more individual bits as gfx940 adds new variants.

It is also synchronized with clang buitin features and then device library feature use.

Harbormaster completed remote builds in B153187: Diff 413850.Mar 8 2022, 10:52 AM

I do not think this is as simple as this.

Is there something wrong with the patch? Really all it is doing is:

Setting two predicates on an instruction, like HasAtomicFaddInsts and isGFX940Plus, instead of using compound predicates like HasAtomicFaddInstsGFX940. The hope here is to avoid an N^2 explosion of named predicates.
Using HasAtomicFaddNoRtnInsts instead of isGFX90APlus in a couple of places where it makes things more symmetrical.

I could even split this into two separate patches.

llvm/lib/Target/AMDGPU/FLATInstructions.td
812	Here I switched to using HasAtomicFaddRtnInsts for symmetry with the HasAtomicFaddNoRtnInsts block just above.
1633–1634	Here I'm only setting the SubtargetPredicate, because I can relying on the Real instruction inheriting the Pseudo instruction's OtherPredicates to pick up the HasAtomicFaddInsts part of the condition.

Please check with Brian he does not use atomic-fadd-insts in the library.

llvm/lib/Target/AMDGPU/BUFInstructions.td
2547	Why is this predicate dropped?
llvm/lib/Target/AMDGPU/FLATInstructions.td
1601–1602	GFX8?

foad added inline comments.Mar 9 2022, 5:15 AM

llvm/lib/Target/AMDGPU/BUFInstructions.td
2547	Real instructions copy OtherPredicates from their pseudo, and the pseudos already have the right OtherPredicates = [HasAtomicFaddXXXInsts].
llvm/lib/Target/AMDGPU/FLATInstructions.td
1601–1602	Yeah, I agree this looks strange. I can clean it up if you like. I think we get away with it because these instructions also pick up OtherPredicates = [HasAtomicFaddXXXInsts] from their pseudos, and those features are never set on GFX8.

foad added inline comments.Mar 9 2022, 6:22 AM

llvm/lib/Target/AMDGPU/FLATInstructions.td
1601–1602	I can replace this with isGFX908orGFX90A. I think it makes the patch cleaner, but it causes test/CodeGen/AMDGPU/global-atomics-fp-wrong-subtarget.ll to fail because it does this: ; Make sure we can encode and don't fail on functions which have ; instructions not actually supported by the subtarget. I have no idea why it does that, or whether this is still required to work for some reason, but at least the current version of this patch preserves this behaviour.

Really all it is doing is:

Setting two predicates on an instruction, like HasAtomicFaddInsts and isGFX940Plus, instead of using compound predicates like HasAtomicFaddInstsGFX940. The hope here is to avoid an N^2 explosion of named predicates.

Using HasAtomicFaddNoRtnInsts instead of isGFX90APlus in a couple of places where it makes things more symmetrical.

I could even split this into two separate patches.

D121289 is a simpler patch that just does #1. Hopefully this avoids the concern about changing feature names.

foad mentioned this in D121289: [AMDGPU] Remove HasAtomicFaddInstsGFX90X and HasAtomicFaddInstsGFX940.Mar 9 2022, 7:06 AM

rampitec added inline comments.Mar 9 2022, 9:57 AM

llvm/lib/Target/AMDGPU/FLATInstructions.td
1601–1602	@arsenm I think that was your comment and test. Can you elaborate?

Rebase on D121289.

In D121229#3370441, @foad wrote:

Rebase on D121289.

I rebased it just for the record. I may end up abandoning this patch.

Harbormaster completed remote builds in B153386: Diff 414142.Mar 9 2022, 10:50 AM

Superseded by D124538.

Herald added subscribers: kosarev, jsilvanus. · View Herald TranscriptJul 7 2022, 6:53 AM

Revision Contents

Path

Size

llvm/

lib/

Target/

AMDGPU/

AMDGPU.td

29 lines

AMDGPULegalizerInfo.cpp

2 lines

3 lines

14 lines

15 lines

9 lines

2 lines

test/

CodeGen/

AMDGPU/

global-atomics-fp-wrong-subtarget.ll

2 lines

global-atomics-fp.ll

2 lines

llvm.amdgcn.atomic.fadd.ll

2 lines

Diff 414142

llvm/lib/Target/AMDGPU/AMDGPU.td

Show First 20 Lines • Show All 560 Lines • ▼ Show 20 Lines
>;		>;

def FeaturePkFmacF16Inst : SubtargetFeature<"pk-fmac-f16-inst",		def FeaturePkFmacF16Inst : SubtargetFeature<"pk-fmac-f16-inst",
"HasPkFmacF16Inst",		"HasPkFmacF16Inst",
"true",		"true",
"Has v_pk_fmac_f16 instruction"		"Has v_pk_fmac_f16 instruction"
>;		>;

def FeatureAtomicFaddInsts : SubtargetFeature<"atomic-fadd-insts",		def FeatureAtomicFaddNoRtnInsts : SubtargetFeature<"atomic-fadd-no-rtn-insts",
"HasAtomicFaddInsts",		"HasAtomicFaddNoRtnInsts",
"true",		"true",
"Has buffer_atomic_add_f32, buffer_atomic_pk_add_f16, global_atomic_add_f32, "		"Has buffer_atomic_add_f32, buffer_atomic_pk_add_f16, global_atomic_add_f32, "
"global_atomic_pk_add_f16 instructions",		"global_atomic_pk_add_f16 instructions that don't return original value",
		[FeatureFlatGlobalInsts]
		>;

		def FeatureAtomicFaddRtnInsts : SubtargetFeature<"atomic-fadd-rtn-insts",
		"HasAtomicFaddRtnInsts",
		"true",
		"Has buffer_atomic_add_f32, buffer_atomic_pk_add_f16, global_atomic_add_f32, "
		"global_atomic_pk_add_f16 instructions that return original value",
[FeatureFlatGlobalInsts]		[FeatureFlatGlobalInsts]
>;		>;

def FeatureSupportsSRAMECC : SubtargetFeature<"sramecc-support",		def FeatureSupportsSRAMECC : SubtargetFeature<"sramecc-support",
"SupportsSRAMECC",		"SupportsSRAMECC",
"true",		"true",
"Hardware supports SRAMECC"		"Hardware supports SRAMECC"
>;		>;
▲ Show 20 Lines • Show All 407 Lines • ▼ Show 20 Lines	def FeatureISAVersion9_0_8 : FeatureSet<
FeatureDot2Insts,		FeatureDot2Insts,
FeatureDot3Insts,		FeatureDot3Insts,
FeatureDot4Insts,		FeatureDot4Insts,
FeatureDot5Insts,		FeatureDot5Insts,
FeatureDot6Insts,		FeatureDot6Insts,
FeatureDot7Insts,		FeatureDot7Insts,
FeatureMAIInsts,		FeatureMAIInsts,
FeaturePkFmacF16Inst,		FeaturePkFmacF16Inst,
FeatureAtomicFaddInsts,		FeatureAtomicFaddNoRtnInsts,
FeatureSupportsSRAMECC,		FeatureSupportsSRAMECC,
FeatureMFMAInlineLiteralBug,		FeatureMFMAInlineLiteralBug,
FeatureImageGather4D16Bug]>;		FeatureImageGather4D16Bug]>;

def FeatureISAVersion9_0_9 : FeatureSet<		def FeatureISAVersion9_0_9 : FeatureSet<
[FeatureGFX9,		[FeatureGFX9,
FeatureMadMixInsts,		FeatureMadMixInsts,
FeatureLDSBankCount32,		FeatureLDSBankCount32,
Show All 15 Lines	def FeatureISAVersion9_0_A : FeatureSet<
FeatureDot4Insts,		FeatureDot4Insts,
FeatureDot5Insts,		FeatureDot5Insts,
FeatureDot6Insts,		FeatureDot6Insts,
FeatureDot7Insts,		FeatureDot7Insts,
Feature64BitDPP,		Feature64BitDPP,
FeaturePackedFP32Ops,		FeaturePackedFP32Ops,
FeatureMAIInsts,		FeatureMAIInsts,
FeaturePkFmacF16Inst,		FeaturePkFmacF16Inst,
FeatureAtomicFaddInsts,		FeatureAtomicFaddNoRtnInsts,
		FeatureAtomicFaddRtnInsts,
FeatureImageInsts,		FeatureImageInsts,
FeatureMadMacF32Insts,		FeatureMadMacF32Insts,
FeatureSupportsSRAMECC,		FeatureSupportsSRAMECC,
FeaturePackedTID,		FeaturePackedTID,
FullRate64Ops,		FullRate64Ops,
FeatureBackOffBarrier]>;		FeatureBackOffBarrier]>;

def FeatureISAVersion9_0_C : FeatureSet<		def FeatureISAVersion9_0_C : FeatureSet<
Show All 19 Lines	def FeatureISAVersion9_4_0 : FeatureSet<
FeatureDot4Insts,		FeatureDot4Insts,
FeatureDot5Insts,		FeatureDot5Insts,
FeatureDot6Insts,		FeatureDot6Insts,
FeatureDot7Insts,		FeatureDot7Insts,
Feature64BitDPP,		Feature64BitDPP,
FeaturePackedFP32Ops,		FeaturePackedFP32Ops,
FeatureMAIInsts,		FeatureMAIInsts,
FeaturePkFmacF16Inst,		FeaturePkFmacF16Inst,
FeatureAtomicFaddInsts,		FeatureAtomicFaddNoRtnInsts,
		FeatureAtomicFaddRtnInsts,
FeatureSupportsSRAMECC,		FeatureSupportsSRAMECC,
FeaturePackedTID,		FeaturePackedTID,
FeatureArchitectedFlatScratch,		FeatureArchitectedFlatScratch,
FullRate64Ops,		FullRate64Ops,
FeatureBackOffBarrier]>;		FeatureBackOffBarrier]>;

// TODO: Organize more features into groups.		// TODO: Organize more features into groups.
def FeatureGroup {		def FeatureGroup {
▲ Show 20 Lines • Show All 476 Lines • ▼ Show 20 Lines	def HasPkFmacF16Inst : Predicate<"Subtarget->hasPkFmacF16Inst()">,
AssemblerPredicate<(all_of FeaturePkFmacF16Inst)>;		AssemblerPredicate<(all_of FeaturePkFmacF16Inst)>;

def HasMadMacF32Insts : Predicate<"Subtarget->hasMadMacF32Insts()">,		def HasMadMacF32Insts : Predicate<"Subtarget->hasMadMacF32Insts()">,
AssemblerPredicate<(all_of FeatureMadMacF32Insts)>;		AssemblerPredicate<(all_of FeatureMadMacF32Insts)>;

def HasFmaLegacy32 : Predicate<"Subtarget->hasGFX10_3Insts()">,		def HasFmaLegacy32 : Predicate<"Subtarget->hasGFX10_3Insts()">,
AssemblerPredicate<(any_of FeatureGFX10_3Insts)>;		AssemblerPredicate<(any_of FeatureGFX10_3Insts)>;

def HasAtomicFaddInsts : Predicate<"Subtarget->hasAtomicFaddInsts()">,		def HasAtomicFaddNoRtnInsts : Predicate<"Subtarget->hasAtomicFaddNoRtnInsts()">,
AssemblerPredicate<(all_of FeatureAtomicFaddInsts)>;		AssemblerPredicate<(all_of FeatureAtomicFaddNoRtnInsts)>;

		def HasAtomicFaddRtnInsts : Predicate<"Subtarget->hasAtomicFaddRtnInsts()">,
		AssemblerPredicate<(all_of FeatureAtomicFaddRtnInsts)>;

def HasDsSrc2Insts : Predicate<"!Subtarget->hasDsSrc2Insts()">,		def HasDsSrc2Insts : Predicate<"!Subtarget->hasDsSrc2Insts()">,
AssemblerPredicate<(all_of FeatureDsSrc2Insts)>;		AssemblerPredicate<(all_of FeatureDsSrc2Insts)>;

def EnableLateCFGStructurize : Predicate<		def EnableLateCFGStructurize : Predicate<
"EnableLateStructurizeCFG">;		"EnableLateStructurizeCFG">;

def EnableFlatScratch : Predicate<"Subtarget->enableFlatScratch()">;		def EnableFlatScratch : Predicate<"Subtarget->enableFlatScratch()">;
Show All 16 Lines

llvm/lib/Target/AMDGPU/AMDGPULegalizerInfo.cpp

Show First 20 Lines • Show All 1,294 Lines • ▼ Show 20 Lines	AMDGPULegalizerInfo::AMDGPULegalizerInfo(const GCNSubtarget &ST_,
auto &Atomic = getActionDefinitionsBuilder(G_ATOMICRMW_FADD);		auto &Atomic = getActionDefinitionsBuilder(G_ATOMICRMW_FADD);
if (ST.hasLDSFPAtomicAdd()) {		if (ST.hasLDSFPAtomicAdd()) {
Atomic.legalFor({{S32, LocalPtr}, {S32, RegionPtr}});		Atomic.legalFor({{S32, LocalPtr}, {S32, RegionPtr}});
if (ST.hasGFX90AInsts())		if (ST.hasGFX90AInsts())
Atomic.legalFor({{S64, LocalPtr}});		Atomic.legalFor({{S64, LocalPtr}});
if (ST.hasGFX940Insts())		if (ST.hasGFX940Insts())
Atomic.legalFor({{V2S16, LocalPtr}});		Atomic.legalFor({{V2S16, LocalPtr}});
}		}
if (ST.hasAtomicFaddInsts())		if (ST.hasAtomicFaddNoRtnInsts())
Atomic.legalFor({{S32, GlobalPtr}});		Atomic.legalFor({{S32, GlobalPtr}});

if (ST.hasGFX90AInsts()) {		if (ST.hasGFX90AInsts()) {
// These are legal with some caveats, and should have undergone expansion in		// These are legal with some caveats, and should have undergone expansion in
// the IR in most situations		// the IR in most situations
// TODO: Move atomic expansion into legalizer		// TODO: Move atomic expansion into legalizer
// TODO: Also supports <2 x f16>		// TODO: Also supports <2 x f16>
Atomic.legalFor({		Atomic.legalFor({
▲ Show 20 Lines • Show All 3,928 Lines • Show Last 20 Lines

llvm/lib/Target/AMDGPU/AMDGPUSubtarget.cpp

Show First 20 Lines • Show All 253 Lines • ▼ Show 20 Lines	GCNSubtarget::GCNSubtarget(const Triple &TT, StringRef GPU, StringRef FS,
HasDot2Insts(false),		HasDot2Insts(false),
HasDot3Insts(false),		HasDot3Insts(false),
HasDot4Insts(false),		HasDot4Insts(false),
HasDot5Insts(false),		HasDot5Insts(false),
HasDot6Insts(false),		HasDot6Insts(false),
HasDot7Insts(false),		HasDot7Insts(false),
HasMAIInsts(false),		HasMAIInsts(false),
HasPkFmacF16Inst(false),		HasPkFmacF16Inst(false),
HasAtomicFaddInsts(false),		HasAtomicFaddNoRtnInsts(false),
		HasAtomicFaddRtnInsts(false),
SupportsSRAMECC(false),		SupportsSRAMECC(false),
EnableSRAMECC(false),		EnableSRAMECC(false),
HasNoSdstCMPX(false),		HasNoSdstCMPX(false),
HasVscnt(false),		HasVscnt(false),
HasGetWaveIdInst(false),		HasGetWaveIdInst(false),
HasSMemTimeInst(false),		HasSMemTimeInst(false),
HasShaderCyclesRegister(false),		HasShaderCyclesRegister(false),
HasVOP3Literal(false),		HasVOP3Literal(false),
▲ Show 20 Lines • Show All 848 Lines • Show Last 20 Lines

llvm/lib/Target/AMDGPU/BUFInstructions.td

Show First 20 Lines • Show All 1,103 Lines • ▼ Show 20 Lines	defm BUFFER_STORE_FORMAT_D16_HI_X : MUBUF_Pseudo_Stores <
"buffer_store_format_d16_hi_x", i32		"buffer_store_format_d16_hi_x", i32
>;		>;

} // End HasD16LoadStore		} // End HasD16LoadStore

def BUFFER_WBINVL1 : MUBUF_Invalidate <"buffer_wbinvl1",		def BUFFER_WBINVL1 : MUBUF_Invalidate <"buffer_wbinvl1",
int_amdgcn_buffer_wbinvl1>;		int_amdgcn_buffer_wbinvl1>;

let SubtargetPredicate = HasAtomicFaddInsts in {		let OtherPredicates = [HasAtomicFaddNoRtnInsts] in {
defm BUFFER_ATOMIC_ADD_F32 : MUBUF_Pseudo_Atomics_NO_RTN <		defm BUFFER_ATOMIC_ADD_F32 : MUBUF_Pseudo_Atomics_NO_RTN <
"buffer_atomic_add_f32", VGPR_32, f32		"buffer_atomic_add_f32", VGPR_32, f32
>;		>;
defm BUFFER_ATOMIC_PK_ADD_F16 : MUBUF_Pseudo_Atomics_NO_RTN <		defm BUFFER_ATOMIC_PK_ADD_F16 : MUBUF_Pseudo_Atomics_NO_RTN <
"buffer_atomic_pk_add_f16", VGPR_32, v2f16		"buffer_atomic_pk_add_f16", VGPR_32, v2f16
>;		>;

let OtherPredicates = [isGFX90APlus] in {		let OtherPredicates = [HasAtomicFaddRtnInsts] in {
defm BUFFER_ATOMIC_ADD_F32 : MUBUF_Pseudo_Atomics_RTN <		defm BUFFER_ATOMIC_ADD_F32 : MUBUF_Pseudo_Atomics_RTN <
"buffer_atomic_add_f32", VGPR_32, f32, atomic_load_fadd_global_32		"buffer_atomic_add_f32", VGPR_32, f32, atomic_load_fadd_global_32
>;		>;
defm BUFFER_ATOMIC_PK_ADD_F16 : MUBUF_Pseudo_Atomics_RTN <		defm BUFFER_ATOMIC_PK_ADD_F16 : MUBUF_Pseudo_Atomics_RTN <
"buffer_atomic_pk_add_f16", VGPR_32, v2f16, atomic_load_fadd_v2f16_global_32		"buffer_atomic_pk_add_f16", VGPR_32, v2f16, atomic_load_fadd_v2f16_global_32
>;		>;
}		}
} // End SubtargetPredicate = HasAtomicFaddInsts		} // End SubtargetPredicate = HasAtomicFaddInsts
▲ Show 20 Lines • Show All 399 Lines • ▼ Show 20 Lines	(NoUseBufferAtomic<name, vt> vt:$vdata_in, v4i32:$rsrc, i32:$vindex,
timm:$cachepolicy, timm),		timm:$cachepolicy, timm),
(!cast<MUBUF_Pseudo>(opcode # _BOTHEN)		(!cast<MUBUF_Pseudo>(opcode # _BOTHEN)
getVregSrcForVT<vt>.ret:$vdata_in,		getVregSrcForVT<vt>.ret:$vdata_in,
(REG_SEQUENCE VReg_64, VGPR_32:$vindex, sub0, VGPR_32:$voffset, sub1),		(REG_SEQUENCE VReg_64, VGPR_32:$vindex, sub0, VGPR_32:$voffset, sub1),
SReg_128:$rsrc, SCSrc_b32:$soffset, (as_i16timm $offset), $cachepolicy)		SReg_128:$rsrc, SCSrc_b32:$soffset, (as_i16timm $offset), $cachepolicy)
>;		>;
}		}

let SubtargetPredicate = HasAtomicFaddInsts in {		let SubtargetPredicate = HasAtomicFaddNoRtnInsts in {
defm : BufferAtomicPatterns_NO_RTN<SIbuffer_atomic_fadd, f32, "BUFFER_ATOMIC_ADD_F32">;		defm : BufferAtomicPatterns_NO_RTN<SIbuffer_atomic_fadd, f32, "BUFFER_ATOMIC_ADD_F32">;
defm : BufferAtomicPatterns_NO_RTN<SIbuffer_atomic_fadd, v2f16, "BUFFER_ATOMIC_PK_ADD_F16">;		defm : BufferAtomicPatterns_NO_RTN<SIbuffer_atomic_fadd, v2f16, "BUFFER_ATOMIC_PK_ADD_F16">;
}		}

let SubtargetPredicate = isGFX90APlus in {		let SubtargetPredicate = HasAtomicFaddRtnInsts in {
defm : SIBufferAtomicPat<"SIbuffer_atomic_fadd", f32, "BUFFER_ATOMIC_ADD_F32">;		defm : SIBufferAtomicPat<"SIbuffer_atomic_fadd", f32, "BUFFER_ATOMIC_ADD_F32">;
defm : SIBufferAtomicPat<"SIbuffer_atomic_fadd", v2f16, "BUFFER_ATOMIC_PK_ADD_F16">;		defm : SIBufferAtomicPat<"SIbuffer_atomic_fadd", v2f16, "BUFFER_ATOMIC_PK_ADD_F16">;
		}

		let SubtargetPredicate = isGFX90APlus in {
defm : SIBufferAtomicPat<"SIbuffer_atomic_fadd", f64, "BUFFER_ATOMIC_ADD_F64">;		defm : SIBufferAtomicPat<"SIbuffer_atomic_fadd", f64, "BUFFER_ATOMIC_ADD_F64">;
defm : SIBufferAtomicPat<"SIbuffer_atomic_fmin", f64, "BUFFER_ATOMIC_MIN_F64">;		defm : SIBufferAtomicPat<"SIbuffer_atomic_fmin", f64, "BUFFER_ATOMIC_MIN_F64">;
defm : SIBufferAtomicPat<"SIbuffer_atomic_fmax", f64, "BUFFER_ATOMIC_MAX_F64">;		defm : SIBufferAtomicPat<"SIbuffer_atomic_fmax", f64, "BUFFER_ATOMIC_MAX_F64">;
} // End SubtargetPredicate = isGFX90APlus		} // End SubtargetPredicate = isGFX90APlus

foreach RtnMode = ["ret", "noret"] in {		foreach RtnMode = ["ret", "noret"] in {

defvar Op = !cast<SDPatternOperator>(SIbuffer_atomic_cmpswap # "_" # RtnMode);		defvar Op = !cast<SDPatternOperator>(SIbuffer_atomic_cmpswap # "_" # RtnMode);
▲ Show 20 Lines • Show All 986 Lines • ▼ Show 20 Lines

defm BUFFER_STORE_LDS_DWORD : MUBUF_Real_vi_gfx90a <0x3d, BUFFER_STORE_LDS_DWORD>;		defm BUFFER_STORE_LDS_DWORD : MUBUF_Real_vi_gfx90a <0x3d, BUFFER_STORE_LDS_DWORD>;

let AssemblerPredicate = isGFX8GFX9 in {		let AssemblerPredicate = isGFX8GFX9 in {
def BUFFER_WBINVL1_vi : MUBUF_Real_vi <0x3e, BUFFER_WBINVL1>;		def BUFFER_WBINVL1_vi : MUBUF_Real_vi <0x3e, BUFFER_WBINVL1>;
def BUFFER_WBINVL1_VOL_vi : MUBUF_Real_vi <0x3f, BUFFER_WBINVL1_VOL>;		def BUFFER_WBINVL1_VOL_vi : MUBUF_Real_vi <0x3f, BUFFER_WBINVL1_VOL>;
} // End AssemblerPredicate = isGFX8GFX9		} // End AssemblerPredicate = isGFX8GFX9

let SubtargetPredicate = HasAtomicFaddInsts in {
rampitecUnsubmitted Not Done Reply Inline Actions Why is this predicate dropped? rampitec: Why is this predicate dropped?
foadAuthorUnsubmitted Done Reply Inline Actions Real instructions copy OtherPredicates from their pseudo, and the pseudos already have the right OtherPredicates = [HasAtomicFaddXXXInsts]. foad: Real instructions copy OtherPredicates from their pseudo, and the pseudos already have the…

defm BUFFER_ATOMIC_ADD_F32 : MUBUF_Real_Atomic_vi <0x4d>;		defm BUFFER_ATOMIC_ADD_F32 : MUBUF_Real_Atomic_vi <0x4d>;
defm BUFFER_ATOMIC_PK_ADD_F16 : MUBUF_Real_Atomic_vi <0x4e>;		defm BUFFER_ATOMIC_PK_ADD_F16 : MUBUF_Real_Atomic_vi <0x4e>;

} // End SubtargetPredicate = HasAtomicFaddInsts

let SubtargetPredicate = isGFX90APlus in {		let SubtargetPredicate = isGFX90APlus in {
defm BUFFER_ATOMIC_ADD_F64 : MUBUF_Real_Atomic_vi<0x4f>;		defm BUFFER_ATOMIC_ADD_F64 : MUBUF_Real_Atomic_vi<0x4f>;
defm BUFFER_ATOMIC_MIN_F64 : MUBUF_Real_Atomic_vi<0x50>;		defm BUFFER_ATOMIC_MIN_F64 : MUBUF_Real_Atomic_vi<0x50>;
defm BUFFER_ATOMIC_MAX_F64 : MUBUF_Real_Atomic_vi<0x51>;		defm BUFFER_ATOMIC_MAX_F64 : MUBUF_Real_Atomic_vi<0x51>;
} // End SubtargetPredicate = isGFX90APlus, AssemblerPredicate = isGFX90APlus		} // End SubtargetPredicate = isGFX90APlus, AssemblerPredicate = isGFX90APlus

def BUFFER_WBL2_gfx90a : MUBUF_Real_gfx90a<0x28, BUFFER_WBL2> {		def BUFFER_WBL2_gfx90a : MUBUF_Real_gfx90a<0x28, BUFFER_WBL2> {
}		}
▲ Show 20 Lines • Show All 152 Lines • Show Last 20 Lines

llvm/lib/Target/AMDGPU/FLATInstructions.td

Show First 20 Lines • Show All 794 Lines • ▼ Show 20 Lines	defm GLOBAL_ATOMIC_FCMPSWAP_X2 :
FLAT_Global_Atomic_Pseudo<"global_atomic_fcmpswap_x2", VReg_64, f64, null_frag, v2f64, VReg_128>;		FLAT_Global_Atomic_Pseudo<"global_atomic_fcmpswap_x2", VReg_64, f64, null_frag, v2f64, VReg_128>;
defm GLOBAL_ATOMIC_FMIN_X2 :		defm GLOBAL_ATOMIC_FMIN_X2 :
FLAT_Global_Atomic_Pseudo<"global_atomic_fmin_x2", VReg_64, f64, int_amdgcn_global_atomic_fmin>;		FLAT_Global_Atomic_Pseudo<"global_atomic_fmin_x2", VReg_64, f64, int_amdgcn_global_atomic_fmin>;
defm GLOBAL_ATOMIC_FMAX_X2 :		defm GLOBAL_ATOMIC_FMAX_X2 :
FLAT_Global_Atomic_Pseudo<"global_atomic_fmax_x2", VReg_64, f64, int_amdgcn_global_atomic_fmax>;		FLAT_Global_Atomic_Pseudo<"global_atomic_fmax_x2", VReg_64, f64, int_amdgcn_global_atomic_fmax>;
} // End SubtargetPredicate = isGFX10Plus, is_flat_global = 1		} // End SubtargetPredicate = isGFX10Plus, is_flat_global = 1

let is_flat_global = 1 in {		let is_flat_global = 1 in {
let OtherPredicates = [HasAtomicFaddInsts] in {		let OtherPredicates = [HasAtomicFaddNoRtnInsts] in {
defm GLOBAL_ATOMIC_ADD_F32 : FLAT_Global_Atomic_Pseudo_NO_RTN <		defm GLOBAL_ATOMIC_ADD_F32 : FLAT_Global_Atomic_Pseudo_NO_RTN <
"global_atomic_add_f32", VGPR_32, f32		"global_atomic_add_f32", VGPR_32, f32
>;		>;
defm GLOBAL_ATOMIC_PK_ADD_F16 : FLAT_Global_Atomic_Pseudo_NO_RTN <		defm GLOBAL_ATOMIC_PK_ADD_F16 : FLAT_Global_Atomic_Pseudo_NO_RTN <
"global_atomic_pk_add_f16", VGPR_32, v2f16		"global_atomic_pk_add_f16", VGPR_32, v2f16
>;		>;
} // End OtherPredicates = [HasAtomicFaddInsts]		} // End OtherPredicates = [HasAtomicFaddNoRtnInsts]

let OtherPredicates = [isGFX90APlus] in {		let OtherPredicates = [HasAtomicFaddRtnInsts] in {
		foadAuthorUnsubmitted Done Reply Inline Actions Here I switched to using HasAtomicFaddRtnInsts for symmetry with the HasAtomicFaddNoRtnInsts block just above. foad: Here I switched to using HasAtomicFaddRtnInsts for symmetry with the HasAtomicFaddNoRtnInsts…
defm GLOBAL_ATOMIC_ADD_F32 : FLAT_Global_Atomic_Pseudo_RTN <		defm GLOBAL_ATOMIC_ADD_F32 : FLAT_Global_Atomic_Pseudo_RTN <
"global_atomic_add_f32", VGPR_32, f32, int_amdgcn_global_atomic_fadd		"global_atomic_add_f32", VGPR_32, f32, int_amdgcn_global_atomic_fadd
>;		>;
defm GLOBAL_ATOMIC_PK_ADD_F16 : FLAT_Global_Atomic_Pseudo_RTN <		defm GLOBAL_ATOMIC_PK_ADD_F16 : FLAT_Global_Atomic_Pseudo_RTN <
"global_atomic_pk_add_f16", VGPR_32, v2f16, int_amdgcn_global_atomic_fadd		"global_atomic_pk_add_f16", VGPR_32, v2f16, int_amdgcn_global_atomic_fadd
>;		>;
} // End OtherPredicates = [isGFX90APlus]		} // End OtherPredicates = [HasAtomicFaddRtnInsts]
} // End is_flat_global = 1		} // End is_flat_global = 1

//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//
// Flat Patterns		// Flat Patterns
//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//

// Patterns for global loads with no offset.		// Patterns for global loads with no offset.
class FlatLoadPat <FLAT_Pseudo inst, SDPatternOperator node, ValueType vt> : GCNPat <		class FlatLoadPat <FLAT_Pseudo inst, SDPatternOperator node, ValueType vt> : GCNPat <
▲ Show 20 Lines • Show All 435 Lines • ▼ Show 20 Lines

let OtherPredicates = [isGFX10Plus] in {		let OtherPredicates = [isGFX10Plus] in {
defm : GlobalFLATAtomicPats <"GLOBAL_ATOMIC_FMIN", "atomic_load_fmin_global", f32>;		defm : GlobalFLATAtomicPats <"GLOBAL_ATOMIC_FMIN", "atomic_load_fmin_global", f32>;
defm : GlobalFLATAtomicPats <"GLOBAL_ATOMIC_FMAX", "atomic_load_fmax_global", f32>;		defm : GlobalFLATAtomicPats <"GLOBAL_ATOMIC_FMAX", "atomic_load_fmax_global", f32>;
defm : GlobalFLATAtomicPats <"GLOBAL_ATOMIC_FMIN_X2", "atomic_load_fmin_global", f64>;		defm : GlobalFLATAtomicPats <"GLOBAL_ATOMIC_FMIN_X2", "atomic_load_fmin_global", f64>;
defm : GlobalFLATAtomicPats <"GLOBAL_ATOMIC_FMAX_X2", "atomic_load_fmax_global", f64>;		defm : GlobalFLATAtomicPats <"GLOBAL_ATOMIC_FMAX_X2", "atomic_load_fmax_global", f64>;
}		}

let OtherPredicates = [HasAtomicFaddInsts] in {		let OtherPredicates = [HasAtomicFaddNoRtnInsts] in {
defm : GlobalFLATNoRtnAtomicPats <GLOBAL_ATOMIC_ADD_F32, atomic_load_fadd_global_noret_32, f32>;		defm : GlobalFLATNoRtnAtomicPats <GLOBAL_ATOMIC_ADD_F32, atomic_load_fadd_global_noret_32, f32>;
defm : GlobalFLATNoRtnAtomicPats <GLOBAL_ATOMIC_PK_ADD_F16, atomic_load_fadd_v2f16_global_noret_32, v2f16>;		defm : GlobalFLATNoRtnAtomicPats <GLOBAL_ATOMIC_PK_ADD_F16, atomic_load_fadd_v2f16_global_noret_32, v2f16>;
}		}

let OtherPredicates = [isGFX90APlus] in {		let OtherPredicates = [HasAtomicFaddRtnInsts] in {
defm : GlobalFLATAtomicPats <"GLOBAL_ATOMIC_ADD_F32", "atomic_load_fadd_global", f32>;		defm : GlobalFLATAtomicPats <"GLOBAL_ATOMIC_ADD_F32", "atomic_load_fadd_global", f32>;
defm : GlobalFLATAtomicPats <"GLOBAL_ATOMIC_PK_ADD_F16", "atomic_load_fadd_v2f16_global", v2f16>;		defm : GlobalFLATAtomicPats <"GLOBAL_ATOMIC_PK_ADD_F16", "atomic_load_fadd_v2f16_global", v2f16>;
		}

		let OtherPredicates = [isGFX90APlus] in {
defm : GlobalFLATAtomicPats <"GLOBAL_ATOMIC_ADD_F64", "atomic_load_fadd_global", f64>;		defm : GlobalFLATAtomicPats <"GLOBAL_ATOMIC_ADD_F64", "atomic_load_fadd_global", f64>;
defm : GlobalFLATAtomicPats <"GLOBAL_ATOMIC_MIN_F64", "atomic_load_fmin_global", f64>;		defm : GlobalFLATAtomicPats <"GLOBAL_ATOMIC_MIN_F64", "atomic_load_fmin_global", f64>;
defm : GlobalFLATAtomicPats <"GLOBAL_ATOMIC_MAX_F64", "atomic_load_fmax_global", f64>;		defm : GlobalFLATAtomicPats <"GLOBAL_ATOMIC_MAX_F64", "atomic_load_fmax_global", f64>;
def : FlatSignedAtomicPat <FLAT_ATOMIC_ADD_F64_RTN, atomic_load_fadd_flat_ret_64, f64>;		def : FlatSignedAtomicPat <FLAT_ATOMIC_ADD_F64_RTN, atomic_load_fadd_flat_ret_64, f64>;
def : FlatSignedAtomicPat <FLAT_ATOMIC_ADD_F64, atomic_load_fadd_flat_noret_64, f64>;		def : FlatSignedAtomicPat <FLAT_ATOMIC_ADD_F64, atomic_load_fadd_flat_noret_64, f64>;
def : FlatSignedAtomicPat <FLAT_ATOMIC_MIN_F64_RTN, atomic_load_fmin_flat_ret_64, f64>;		def : FlatSignedAtomicPat <FLAT_ATOMIC_MIN_F64_RTN, atomic_load_fmin_flat_ret_64, f64>;
def : FlatSignedAtomicPat <FLAT_ATOMIC_MIN_F64, atomic_load_fmin_flat_noret_64, f64>;		def : FlatSignedAtomicPat <FLAT_ATOMIC_MIN_F64, atomic_load_fmin_flat_noret_64, f64>;
def : FlatSignedAtomicPat <FLAT_ATOMIC_MAX_F64_RTN, atomic_load_fmax_flat_ret_64, f64>;		def : FlatSignedAtomicPat <FLAT_ATOMIC_MAX_F64_RTN, atomic_load_fmax_flat_ret_64, f64>;
▲ Show 20 Lines • Show All 303 Lines • ▼ Show 20 Lines
defm SCRATCH_LOAD_SHORT_D16 : FLAT_Real_AllAddr_vi <0x24>;		defm SCRATCH_LOAD_SHORT_D16 : FLAT_Real_AllAddr_vi <0x24>;
defm SCRATCH_LOAD_SHORT_D16_HI : FLAT_Real_AllAddr_vi <0x25>;		defm SCRATCH_LOAD_SHORT_D16_HI : FLAT_Real_AllAddr_vi <0x25>;
defm SCRATCH_STORE_SHORT : FLAT_Real_AllAddr_vi <0x1a>;		defm SCRATCH_STORE_SHORT : FLAT_Real_AllAddr_vi <0x1a>;
defm SCRATCH_STORE_SHORT_D16_HI : FLAT_Real_AllAddr_vi <0x1b>;		defm SCRATCH_STORE_SHORT_D16_HI : FLAT_Real_AllAddr_vi <0x1b>;
defm SCRATCH_STORE_DWORD : FLAT_Real_AllAddr_vi <0x1c>;		defm SCRATCH_STORE_DWORD : FLAT_Real_AllAddr_vi <0x1c>;
defm SCRATCH_STORE_DWORDX2 : FLAT_Real_AllAddr_vi <0x1d>;		defm SCRATCH_STORE_DWORDX2 : FLAT_Real_AllAddr_vi <0x1d>;
defm SCRATCH_STORE_DWORDX3 : FLAT_Real_AllAddr_vi <0x1e>;		defm SCRATCH_STORE_DWORDX3 : FLAT_Real_AllAddr_vi <0x1e>;
defm SCRATCH_STORE_DWORDX4 : FLAT_Real_AllAddr_vi <0x1f>;		defm SCRATCH_STORE_DWORDX4 : FLAT_Real_AllAddr_vi <0x1f>;

let SubtargetPredicate = isGFX8GFX9NotGFX940 in {		let SubtargetPredicate = isGFX8GFX9NotGFX940 in {
		rampitecUnsubmitted Not Done Reply Inline Actions GFX8? rampitec: GFX8?
		foadAuthorUnsubmitted Done Reply Inline Actions Yeah, I agree this looks strange. I can clean it up if you like. I think we get away with it because these instructions also pick up OtherPredicates = [HasAtomicFaddXXXInsts] from their pseudos, and those features are never set on GFX8. foad: Yeah, I agree this looks strange. I can clean it up if you like. I think we get away with it…
		foadAuthorUnsubmitted Done Reply Inline Actions I can replace this with isGFX908orGFX90A. I think it makes the patch cleaner, but it causes test/CodeGen/AMDGPU/global-atomics-fp-wrong-subtarget.ll to fail because it does this: ; Make sure we can encode and don't fail on functions which have ; instructions not actually supported by the subtarget. I have no idea why it does that, or whether this is still required to work for some reason, but at least the current version of this patch preserves this behaviour. foad: I can replace this with isGFX908orGFX90A. I think it makes the patch cleaner, but it causes…
		rampitecUnsubmitted Not Done Reply Inline Actions @arsenm I think that was your comment and test. Can you elaborate? rampitec: @arsenm I think that was your comment and test. Can you elaborate?
// These instructions are encoded differently on gfx90* and gfx940.		// These instructions are encoded differently on gfx90* and gfx940.
defm GLOBAL_ATOMIC_ADD_F32 : FLAT_Global_Real_Atomics_vi <0x04d, 0>;		defm GLOBAL_ATOMIC_ADD_F32 : FLAT_Global_Real_Atomics_vi <0x04d, 0>;
defm GLOBAL_ATOMIC_PK_ADD_F16 : FLAT_Global_Real_Atomics_vi <0x04e, 0>;		defm GLOBAL_ATOMIC_PK_ADD_F16 : FLAT_Global_Real_Atomics_vi <0x04e, 0>;
}		}

let SubtargetPredicate = isGFX90AOnly in {		let SubtargetPredicate = isGFX90AOnly in {
defm FLAT_ATOMIC_ADD_F64 : FLAT_Real_Atomics_vi<0x4f, FLAT_ATOMIC_ADD_F64, 0>;		defm FLAT_ATOMIC_ADD_F64 : FLAT_Real_Atomics_vi<0x4f, FLAT_ATOMIC_ADD_F64, 0>;
defm FLAT_ATOMIC_MIN_F64 : FLAT_Real_Atomics_vi<0x50, FLAT_ATOMIC_MIN_F64, 0>;		defm FLAT_ATOMIC_MIN_F64 : FLAT_Real_Atomics_vi<0x50, FLAT_ATOMIC_MIN_F64, 0>;
Show All 14 Lines
}		}

multiclass FLAT_Global_Real_Atomics_gfx940<bits<7> op> :		multiclass FLAT_Global_Real_Atomics_gfx940<bits<7> op> :
FLAT_Real_AllAddr_gfx940<op> {		FLAT_Real_AllAddr_gfx940<op> {
def _RTN_gfx940 : FLAT_Real_gfx940 <op, !cast<FLAT_Pseudo>(NAME#"_RTN")>;		def _RTN_gfx940 : FLAT_Real_gfx940 <op, !cast<FLAT_Pseudo>(NAME#"_RTN")>;
def _SADDR_RTN_gfx940 : FLAT_Real_gfx940 <op, !cast<FLAT_Pseudo>(NAME#"_SADDR_RTN")>;		def _SADDR_RTN_gfx940 : FLAT_Real_gfx940 <op, !cast<FLAT_Pseudo>(NAME#"_SADDR_RTN")>;
}		}

let SubtargetPredicate = isGFX940Plus in {		let SubtargetPredicate = isGFX940Plus in {
// These instructions are encoded differently on gfx90* and gfx940.		// These instructions are encoded differently on gfx90* and gfx940.
		foadAuthorUnsubmitted Done Reply Inline Actions Here I'm only setting the SubtargetPredicate, because I can relying on the Real instruction inheriting the Pseudo instruction's OtherPredicates to pick up the HasAtomicFaddInsts part of the condition. foad: Here I'm only setting the SubtargetPredicate, because I can relying on the Real instruction…
defm GLOBAL_ATOMIC_ADD_F32 : FLAT_Global_Real_Atomics_gfx940 <0x04d>;		defm GLOBAL_ATOMIC_ADD_F32 : FLAT_Global_Real_Atomics_gfx940 <0x04d>;
defm GLOBAL_ATOMIC_PK_ADD_F16 : FLAT_Global_Real_Atomics_gfx940 <0x04e>;		defm GLOBAL_ATOMIC_PK_ADD_F16 : FLAT_Global_Real_Atomics_gfx940 <0x04e>;

defm FLAT_ATOMIC_ADD_F64 : FLAT_Real_Atomics_gfx940<0x4f, FLAT_ATOMIC_ADD_F64>;		defm FLAT_ATOMIC_ADD_F64 : FLAT_Real_Atomics_gfx940<0x4f, FLAT_ATOMIC_ADD_F64>;
defm FLAT_ATOMIC_MIN_F64 : FLAT_Real_Atomics_gfx940<0x50, FLAT_ATOMIC_MIN_F64>;		defm FLAT_ATOMIC_MIN_F64 : FLAT_Real_Atomics_gfx940<0x50, FLAT_ATOMIC_MIN_F64>;
defm FLAT_ATOMIC_MAX_F64 : FLAT_Real_Atomics_gfx940<0x51, FLAT_ATOMIC_MAX_F64>;		defm FLAT_ATOMIC_MAX_F64 : FLAT_Real_Atomics_gfx940<0x51, FLAT_ATOMIC_MAX_F64>;
defm GLOBAL_ATOMIC_ADD_F64 : FLAT_Global_Real_Atomics_gfx940<0x4f>;		defm GLOBAL_ATOMIC_ADD_F64 : FLAT_Global_Real_Atomics_gfx940<0x4f>;
defm GLOBAL_ATOMIC_MIN_F64 : FLAT_Global_Real_Atomics_gfx940<0x50>;		defm GLOBAL_ATOMIC_MIN_F64 : FLAT_Global_Real_Atomics_gfx940<0x50>;
▲ Show 20 Lines • Show All 212 Lines • Show Last 20 Lines

llvm/lib/Target/AMDGPU/GCNSubtarget.h

Show First 20 Lines • Show All 138 Lines • ▼ Show 20 Lines	protected:
bool HasDot2Insts;		bool HasDot2Insts;
bool HasDot3Insts;		bool HasDot3Insts;
bool HasDot4Insts;		bool HasDot4Insts;
bool HasDot5Insts;		bool HasDot5Insts;
bool HasDot6Insts;		bool HasDot6Insts;
bool HasDot7Insts;		bool HasDot7Insts;
bool HasMAIInsts;		bool HasMAIInsts;
bool HasPkFmacF16Inst;		bool HasPkFmacF16Inst;
bool HasAtomicFaddInsts;		bool HasAtomicFaddNoRtnInsts;
		bool HasAtomicFaddRtnInsts;
bool SupportsSRAMECC;		bool SupportsSRAMECC;

// This should not be used directly. 'TargetID' tracks the dynamic settings		// This should not be used directly. 'TargetID' tracks the dynamic settings
// for SRAMECC.		// for SRAMECC.
bool EnableSRAMECC;		bool EnableSRAMECC;

bool HasNoSdstCMPX;		bool HasNoSdstCMPX;
bool HasVscnt;		bool HasVscnt;
▲ Show 20 Lines • Show All 552 Lines • ▼ Show 20 Lines	public:
bool hasMAIInsts() const {		bool hasMAIInsts() const {
return HasMAIInsts;		return HasMAIInsts;
}		}

bool hasPkFmacF16Inst() const {		bool hasPkFmacF16Inst() const {
return HasPkFmacF16Inst;		return HasPkFmacF16Inst;
}		}

bool hasAtomicFaddInsts() const {		bool hasAtomicFaddNoRtnInsts() const { return HasAtomicFaddNoRtnInsts; }
return HasAtomicFaddInsts;
}		bool hasAtomicFaddRtnInsts() const { return HasAtomicFaddRtnInsts; }

bool hasNoSdstCMPX() const {		bool hasNoSdstCMPX() const {
return HasNoSdstCMPX;		return HasNoSdstCMPX;
}		}

bool hasVscnt() const {		bool hasVscnt() const {
return HasVscnt;		return HasVscnt;
}		}
▲ Show 20 Lines • Show All 473 Lines • Show Last 20 Lines

llvm/lib/Target/AMDGPU/SIISelLowering.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 12,403 Lines • ▼ Show 20 Lines	if (Ty->isHalfTy())
return AtomicExpansionKind::None;		return AtomicExpansionKind::None;

if (!Ty->isFloatTy() && (!Subtarget->hasGFX90AInsts() \|\| !Ty->isDoubleTy()))		if (!Ty->isFloatTy() && (!Subtarget->hasGFX90AInsts() \|\| !Ty->isDoubleTy()))
return AtomicExpansionKind::CmpXChg;		return AtomicExpansionKind::CmpXChg;

unsigned AS = RMW->getPointerAddressSpace();		unsigned AS = RMW->getPointerAddressSpace();

if ((AS == AMDGPUAS::GLOBAL_ADDRESS \|\| AS == AMDGPUAS::FLAT_ADDRESS) &&		if ((AS == AMDGPUAS::GLOBAL_ADDRESS \|\| AS == AMDGPUAS::FLAT_ADDRESS) &&
Subtarget->hasAtomicFaddInsts()) {		Subtarget->hasAtomicFaddNoRtnInsts()) {
if (Subtarget->hasGFX940Insts())		if (Subtarget->hasGFX940Insts())
return AtomicExpansionKind::None;		return AtomicExpansionKind::None;

// The amdgpu-unsafe-fp-atomics attribute enables generation of unsafe		// The amdgpu-unsafe-fp-atomics attribute enables generation of unsafe
// floating point atomic instructions. May generate more efficient code,		// floating point atomic instructions. May generate more efficient code,
// but may not respect rounding and denormal modes, and may give incorrect		// but may not respect rounding and denormal modes, and may give incorrect
// results for certain memory destinations.		// results for certain memory destinations.
if (RMW->getFunction()		if (RMW->getFunction()
▲ Show 20 Lines • Show All 190 Lines • Show Last 20 Lines

llvm/test/CodeGen/AMDGPU/global-atomics-fp-wrong-subtarget.ll

	Show All 17 Lines
	; GCN-NEXT: global_atomic_add_f32 v0, v1, s[0:1]			; GCN-NEXT: global_atomic_add_f32 v0, v1, s[0:1]
	; GCN-NEXT: s_waitcnt vmcnt(0)			; GCN-NEXT: s_waitcnt vmcnt(0)
	; GCN-NEXT: buffer_wbinvl1_vol			; GCN-NEXT: buffer_wbinvl1_vol
	; GCN-NEXT: s_endpgm			; GCN-NEXT: s_endpgm
	%result = atomicrmw fadd float addrspace(1)* %ptr, float 4.0 syncscope("agent") seq_cst			%result = atomicrmw fadd float addrspace(1)* %ptr, float 4.0 syncscope("agent") seq_cst
	ret void			ret void
	}			}

	attributes #0 = { "denormal-fp-math-f32"="preserve-sign,preserve-sign" "target-features"="+atomic-fadd-insts" "amdgpu-unsafe-fp-atomics"="true" }			attributes #0 = { "denormal-fp-math-f32"="preserve-sign,preserve-sign" "target-features"="+atomic-fadd-no-rtn-insts,+atomic-fadd-rtn-insts" "amdgpu-unsafe-fp-atomics"="true" }

llvm/test/CodeGen/AMDGPU/global-atomics-fp.ll

	Show First 20 Lines • Show All 794 Lines • ▼ Show 20 Lines
	; GFX10-NEXT: ; %bb.2: ; %atomicrmw.end			; GFX10-NEXT: ; %bb.2: ; %atomicrmw.end
	; GFX10-NEXT: s_endpgm			; GFX10-NEXT: s_endpgm
	%load = load float, float addrspace(4)* %arg			%load = load float, float addrspace(4)* %arg
	%v = atomicrmw fadd float* %load, float 1.0 syncscope("agent-one-as") monotonic, align 4			%v = atomicrmw fadd float* %load, float 1.0 syncscope("agent-one-as") monotonic, align 4
	ret void			ret void
	}			}

	attributes #0 = { "denormal-fp-math-f32"="preserve-sign,preserve-sign" "amdgpu-unsafe-fp-atomics"="true" }			attributes #0 = { "denormal-fp-math-f32"="preserve-sign,preserve-sign" "amdgpu-unsafe-fp-atomics"="true" }
	attributes #1 = { "denormal-fp-math-f32"="preserve-sign,preserve-sign" "target-cpu"="gfx803" "target-features"="+atomic-fadd-insts" "amdgpu-unsafe-fp-atomics"="true" }			attributes #1 = { "denormal-fp-math-f32"="preserve-sign,preserve-sign" "target-cpu"="gfx803" "target-features"="+atomic-fadd-no-rtn-insts,+atomic-fadd-rtn-insts" "amdgpu-unsafe-fp-atomics"="true" }
	attributes #2 = { "amdgpu-unsafe-fp-atomics"="true" }			attributes #2 = { "amdgpu-unsafe-fp-atomics"="true" }

llvm/test/CodeGen/AMDGPU/llvm.amdgcn.atomic.fadd.ll

	Show First 20 Lines • Show All 93 Lines • ▼ Show 20 Lines
	; the feature set.			; the feature set.
	; GCN-LABEL: {{^}}global_atomic_fadd_f32_wrong_subtarget:			; GCN-LABEL: {{^}}global_atomic_fadd_f32_wrong_subtarget:
	; GCN: global_atomic_add_f32 v{{[0-9]+}}, v{{[0-9]+}}, s{{\[[0-9]+:[0-9]+\]$}}			; GCN: global_atomic_add_f32 v{{[0-9]+}}, v{{[0-9]+}}, s{{\[[0-9]+:[0-9]+\]$}}
	define amdgpu_kernel void @global_atomic_fadd_f32_wrong_subtarget(float addrspace(1)* %ptr, float %data) #0 {			define amdgpu_kernel void @global_atomic_fadd_f32_wrong_subtarget(float addrspace(1)* %ptr, float %data) #0 {
	%ret = call float @llvm.amdgcn.global.atomic.fadd.f32.p1f32.f32(float addrspace(1)* %ptr, float %data)			%ret = call float @llvm.amdgcn.global.atomic.fadd.f32.p1f32.f32(float addrspace(1)* %ptr, float %data)
	ret void			ret void
	}			}

	attributes #0 = { "target-cpu"="gfx803" "target-features"="+atomic-fadd-insts" }			attributes #0 = { "target-cpu"="gfx803" "target-features"="+atomic-fadd-no-rtn-insts,+atomic-fadd-rtn-insts" }

This is an archive of the discontinued LLVM Phabricator instance.

[AMDGPU] Split FeatureAtomicFaddInsts feature. NFC.AbandonedPublic

Details

Diff Detail

Unit TestsFailed

Event Timeline

Revision Contents

Diff 414142

llvm/lib/Target/AMDGPU/AMDGPU.td

llvm/lib/Target/AMDGPU/AMDGPULegalizerInfo.cpp

llvm/lib/Target/AMDGPU/AMDGPUSubtarget.cpp

llvm/lib/Target/AMDGPU/BUFInstructions.td

llvm/lib/Target/AMDGPU/FLATInstructions.td

llvm/lib/Target/AMDGPU/GCNSubtarget.h

llvm/lib/Target/AMDGPU/SIISelLowering.cpp

llvm/test/CodeGen/AMDGPU/global-atomics-fp-wrong-subtarget.ll

llvm/test/CodeGen/AMDGPU/global-atomics-fp.ll

llvm/test/CodeGen/AMDGPU/llvm.amdgcn.atomic.fadd.ll

[AMDGPU] Split FeatureAtomicFaddInsts feature. NFC.
AbandonedPublic