This is an archive of the discontinued LLVM Phabricator instance.

Paths

Table of Contentst

-
llvm/
-
lib/Target/AMDGPU/
-
Target/
-
AMDGPU/
7/13
AMDGPUAttributor.cpp
-
AMDGPUSubtarget.h
-
AMDGPUSubtarget.cpp
-
GCNSubtarget.h
-
test/CodeGen/AMDGPU/
-
CodeGen/
-
AMDGPU/
-
addrspacecast-constantexpr.ll
-
annotate-existing-abi-attributes.ll
-
annotate-kernel-features-hsa-call.ll
-
annotate-kernel-features-hsa.ll
-
direct-indirect-call.ll
-
duplicate-attribute-indirect.ll
-
propagate-flat-work-group-size.ll
-
propagate-waves-per-eu.ll
-
simple-indirect-call.ll
-
uniform-work-group-attribute-missing.ll
-
uniform-work-group-multistep.ll
-
uniform-work-group-nested-function-calls.ll
-
uniform-work-group-prevent-attribute-propagation.ll
-
uniform-work-group-recursion-test.ll
-
uniform-work-group-test.ll

Differential D115559

AMDGPU: Propagate amdgpu-waves-per-eu with attributor
ClosedPublic

Authored by arsenm on Dec 10 2021, 3:46 PM.

Download Raw Diff

Details

Reviewers

rampitec
jdoerfert
kzhuravl
t-tye
yaxunl
uenoku
sstefan1
baziotis
nhaehnle

Summary

This will do a value range merging down the callgraph, unlike the
current pass which can only propagate values to undecorated functions
from a kernel.

This one is a bit weird due to the interaction with the implied range
from amdgpu-flat-workgroup-size. At the default group range of 1,1024,
the minimum implied bounds is 4 so this ends up introducing the
attribute on undecorated functions. We could probably simplify this by
ignoring it and propagating the raw values. The subtarget interaction
and the interaction with amdgpu-flat-workgroup-size only really clamp
invalid values (plus the lower bound doesn't seem to do anything as
far as I can tell anyway).

Diff Detail

Event Timeline

arsenm created this revision.Dec 10 2021, 3:46 PM

Herald added a reviewer: uenoku. · View Herald TranscriptDec 10 2021, 3:46 PM

Herald added subscribers: foad, okura, kuter and 7 others. · View Herald Transcript

arsenm requested review of this revision.Dec 10 2021, 3:46 PM

Herald added a reviewer: sstefan1. · View Herald TranscriptDec 10 2021, 3:46 PM

Herald added a reviewer: baziotis. · View Herald Transcript

Herald added a project: Restricted Project. · View Herald Transcript

Herald added a subscriber: wdng. · View Herald Transcript

arsenm added a child revision: D115562: AMDGPU: Remove amdgpu-waves-per-eu support in old attribute pass.Dec 10 2021, 4:19 PM

Harbormaster completed remote builds in B138751: Diff 393613.Dec 10 2021, 4:23 PM

I don't understand all the update logic but from an Attributor standpoint there are only two things that should be addressed.

llvm/lib/Target/AMDGPU/AMDGPUAttributor.cpp
680	Somewhat surprising you intersect the known range with an assumed result, if that is on purpose probably worth a comment explaining why this is reasonable.
714	It is important to return "CHANGED" here.

Return indicatePessimisticFixpoint result

llvm/lib/Target/AMDGPU/AMDGPUAttributor.cpp
680	I'm confused by your surprise. This is the initialize, so the assumed state doesn't mean anything? All the other IntegerRangeState attributes start out with intersectKnown in initialize()

Harbormaster completed remote builds in B139656: Diff 394857.Dec 16 2021, 6:59 AM

jdoerfert added inline comments.Dec 23 2021, 9:00 AM

llvm/lib/Target/AMDGPU/AMDGPUAttributor.cpp
680	So, at this point you move something assumed by another AA into something known by this. However, we don't know the other AAs assumed state is valid yet. Only after the fixpoint is reached it is known to hold. So what other AAs do (I hope) is use IR information to setup the known state. Here we might end up assuming the best for the FlatWorkGroupSize (line 674) then making it to something known in 683, before the values are tightened during the fixpoint iteration causing the known set to be not actually valid anymore. Generally, assumed information should only flow into known information if a fixpoint is reached (at which point the assumed information becomes the known one anyway). Before that, assumed should flow into assumed only and known can flow in either. Does that make some sense?

arsenm mentioned this in D138443: [AMDGPU] Fix GCNSubtarget::getMinNumVGPRs, add unit test to check consistency between GCNSubtarget's getMinNumVGPRs, getMaxNumVGPRs and getOccupancyWithNumVGPRs..Nov 22 2022, 6:44 AM

Make flat work group interaction work by querying the correct thing.

I can convince myself the merged ranges make sense but I'm not sure, particularly on the lower bound

Herald added a project: Restricted Project. · View Herald TranscriptJun 3 2023, 5:33 PM

arsenm added a reviewer: nhaehnle.Jun 3 2023, 5:33 PM

Harbormaster completed remote builds in B236424: Diff 528169.Jun 3 2023, 5:34 PM

arsenm updated this revision to Diff 528172.Jun 3 2023, 6:08 PM

Harbormaster completed remote builds in B236427: Diff 528172.Jun 3 2023, 6:08 PM

There is actually an assumption propagation AA in the Attributor already https://github.com/llvm/llvm-project/blob/main/llvm/lib/Transforms/IPO/AttributorAttributes.cpp#L11609. I don't know if that's relevant to what the AMDGPUAttributor wants to do however.

In D115559#4396025, @jhuber6 wrote:

There is actually an assumption propagation AA in the Attributor already https://github.com/llvm/llvm-project/blob/main/llvm/lib/Transforms/IPO/AttributorAttributes.cpp#L11609. I don't know if that's relevant to what the AMDGPUAttributor wants to do however.

Don't see how assumes are involved. There isn't a way to introspect waves-per-eu

In D115559#4407258, @arsenm wrote:

In D115559#4396025, @jhuber6 wrote:

There is actually an assumption propagation AA in the Attributor already https://github.com/llvm/llvm-project/blob/main/llvm/lib/Transforms/IPO/AttributorAttributes.cpp#L11609. I don't know if that's relevant to what the AMDGPUAttributor wants to do however.

Don't see how assumes are involved. There isn't a way to introspect waves-per-eu

I was just wondering out loud if you could model this as "assume one thread" and then treat it the same way in the backend.

ping

LG, I left some notes and nits below.

llvm/lib/Target/AMDGPU/AMDGPUAttributor.cpp
526	Docs: Base class to derive different size ranges.
536–538	Nit: I doubt you need these. StateWrapper should provide them, IIRC.
541	FWIW, we should be able to track how often we manifested, hence improved, the ranges. I think that would be good to have.
559	Can you add a TODO in this class. The functionality it offers should be in some helper header. Effectively it does call site -> callee lookups and clamping. We have similar helpers in AttributorAttributes.cpp, but not this one. At some point we should move them all out into a header...
582	Nit: You don't need a list with 8 slots, `{ Attr }` probably works just as well.
661	Nit: Probably better to only redirect one level up (`AAAMDSizeRangeAttribute::isValidState()`) FWIW: Empty should mean it's dead/misconfigured, no?

This revision is now accepted and ready to land.Jun 14 2023, 10:06 AM

arsenm marked 2 inline comments as done.Jun 15 2023, 10:07 AM

arsenm added inline comments.

llvm/lib/Target/AMDGPU/AMDGPUAttributor.cpp
536–538	They're already here so I'll try to delete separately
541	It looks like you're supposed to implement this with macros private to AttributorAttributes

arsenm added inline comments.Jun 15 2023, 10:13 AM

llvm/lib/Target/AMDGPU/AMDGPUAttributor.cpp
661	This was one of the struggles I forgot about. I didn't find a better way to express the valid bounds for this to infer. By default it covers 0, -1, which exceeds the maximum of 10 and it produces broken attributes

b9c6d9e6c3b9fab632d2ee33ecce899fadcee456

arsenm mentioned this in D110107: AMDGPU: Propagate amdgpu-waves-per-eu.Jun 22 2023, 3:11 AM

Revision Contents

Path

Size

llvm/

lib/

Target/

AMDGPU/

198 lines

3 lines

20 lines

3 lines

test/

CodeGen/

AMDGPU/

addrspacecast-constantexpr.ll

3 lines

annotate-existing-abi-attributes.ll

20 lines

annotate-kernel-features-hsa-call.ll

78 lines

annotate-kernel-features-hsa.ll

3 lines

direct-indirect-call.ll

4 lines

duplicate-attribute-indirect.ll

2 lines

propagate-flat-work-group-size.ll

6 lines

propagate-waves-per-eu.ll

289 lines

simple-indirect-call.ll

2 lines

uniform-work-group-attribute-missing.ll

5 lines

uniform-work-group-multistep.ll

11 lines

uniform-work-group-nested-function-calls.ll

2 lines

uniform-work-group-prevent-attribute-propagation.ll

5 lines

uniform-work-group-recursion-test.ll

6 lines

uniform-work-group-test.ll

5 lines

Diff 393613

llvm/lib/Target/AMDGPU/AMDGPUAttributor.cpp

Show First 20 Lines • Show All 145 Lines • ▼ Show 20 Lines public:

} }

std::pair<unsigned, unsigned> std::pair<unsigned, unsigned>

getMaximumFlatWorkGroupRange(const Function &F) { getMaximumFlatWorkGroupRange(const Function &F) {

const GCNSubtarget &ST = TM.getSubtarget<GCNSubtarget>(F); const GCNSubtarget &ST = TM.getSubtarget<GCNSubtarget>(F);

return {ST.getMinFlatWorkGroupSize(), ST.getMaxFlatWorkGroupSize()}; return {ST.getMinFlatWorkGroupSize(), ST.getMaxFlatWorkGroupSize()};

} }

std::pair<unsigned, unsigned>

getWavesPerEU(const Function &F,

std::pair<unsigned, unsigned> FlatWorkGroupSize) {

const GCNSubtarget &ST = TM.getSubtarget<GCNSubtarget>(F);

return ST.getWavesPerEU(F, FlatWorkGroupSize);

}

std::pair<unsigned, unsigned>

getEffectiveWavesPerEU(const Function &F,

std::pair<unsigned, unsigned> WavesPerEU,

std::pair<unsigned, unsigned> FlatWorkGroupSize) {

const GCNSubtarget &ST = TM.getSubtarget<GCNSubtarget>(F);

return ST.getEffectiveWavesPerEU(WavesPerEU, FlatWorkGroupSize);

}

unsigned getMaxWavesPerEU(const Function &F) {

const GCNSubtarget &ST = TM.getSubtarget<GCNSubtarget>(F);

return ST.getMaxWavesPerEU();

}

private: private:

/// Check if the ConstantExpr \p CE requires queue ptr attribute. /// Check if the ConstantExpr \p CE requires queue ptr attribute.

static bool visitConstExpr(const ConstantExpr *CE) { static bool visitConstExpr(const ConstantExpr *CE) {

if (CE->getOpcode() == Instruction::AddrSpaceCast) { if (CE->getOpcode() == Instruction::AddrSpaceCast) {

unsigned SrcAS = CE->getOperand(0)->getType()->getPointerAddressSpace(); unsigned SrcAS = CE->getOperand(0)->getType()->getPointerAddressSpace();

return castRequiresQueuePtr(SrcAS); return castRequiresQueuePtr(SrcAS);

} }

return false; return false;

▲ Show 20 Lines • Show All 336 Lines • ▼ Show 20 Lines

AAAMDAttributes &AAAMDAttributes::createForPosition(const IRPosition &IRP, AAAMDAttributes &AAAMDAttributes::createForPosition(const IRPosition &IRP,

Attributor &A) { Attributor &A) {

if (IRP.getPositionKind() == IRPosition::IRP_FUNCTION) if (IRP.getPositionKind() == IRPosition::IRP_FUNCTION)

return *new (A.Allocator) AAAMDAttributesFunction(IRP, A); return *new (A.Allocator) AAAMDAttributesFunction(IRP, A);

llvm_unreachable("AAAMDAttributes is only valid for function position"); llvm_unreachable("AAAMDAttributes is only valid for function position");

} }

/// Propagate amdgpu-flat-work-group-size attribute. struct AAAMDSizeRangeAttribute

jdoerfertUnsubmitted

Not Done

Docs: Base class to derive different size ranges.

jdoerfert: Docs: Base class to derive different size ranges.

struct AAAMDFlatWorkGroupSize

: public StateWrapper<IntegerRangeState, AbstractAttribute, uint32_t> { : public StateWrapper<IntegerRangeState, AbstractAttribute, uint32_t> {

using Base = StateWrapper<IntegerRangeState, AbstractAttribute, uint32_t>; using Base = StateWrapper<IntegerRangeState, AbstractAttribute, uint32_t>;

AAAMDFlatWorkGroupSize(const IRPosition &IRP, Attributor &A)

: Base(IRP, 32) {} StringRef AttrName;

AAAMDSizeRangeAttribute(const IRPosition &IRP, Attributor &A,

StringRef AttrName)

: Base(IRP, 32), AttrName(AttrName) {}

/// See AbstractAttribute::getState(...). /// See AbstractAttribute::getState(...).

IntegerRangeState &getState() override { return *this; } IntegerRangeState &getState() override { return *this; }

const IntegerRangeState &getState() const override { return *this; } const IntegerRangeState &getState() const override { return *this; }

jdoerfertUnsubmitted

Not Done

Nit: I doubt you need these. StateWrapper should provide them, IIRC.

jdoerfert: Nit: I doubt you need these. StateWrapper should provide them, IIRC.

arsenmAuthorUnsubmitted

Done

They're already here so I'll try to delete separately

arsenm: They're already here so I'll try to delete separately

void initialize(Attributor &A) override { /// See AbstractAttribute::trackStatistics()

Function *F = getAssociatedFunction(); void trackStatistics() const override {}

jdoerfertUnsubmitted

Not Done

FWIW, we should be able to track how often we manifested, hence improved, the ranges. I think that would be good to have.

jdoerfert: FWIW, we should be able to track how often we manifested, hence improved, the ranges. I think…

arsenmAuthorUnsubmitted

Done

It looks like you're supposed to implement this with macros private to AttributorAttributes

arsenm: It looks like you're supposed to implement this with macros private to AttributorAttributes

auto &InfoCache = static_cast<AMDGPUInformationCache &>(A.getInfoCache());

unsigned MinGroupSize, MaxGroupSize;

std::tie(MinGroupSize, MaxGroupSize) = InfoCache.getFlatWorkGroupSizes(*F);

intersectKnown(

ConstantRange(APInt(32, MinGroupSize), APInt(32, MaxGroupSize + 1)));

}

ChangeStatus updateImpl(Attributor &A) override { template <class AttributeImpl>

Lint: Pre-merge checks

clang-format: please reformat the code

-  template <class AttributeImpl>
-  ChangeStatus updateImplImpl(Attributor &A) {
+  template <class AttributeImpl> ChangeStatus updateImplImpl(Attributor &A) {

Lint: Pre-merge checks: clang-format: please reformat the code ``` - template <class AttributeImpl> - ChangeStatus…

ChangeStatus updateImplImpl(Attributor &A) {

ChangeStatus Change = ChangeStatus::UNCHANGED; ChangeStatus Change = ChangeStatus::UNCHANGED;

auto CheckCallSite = [&](AbstractCallSite CS) { auto CheckCallSite = [&](AbstractCallSite CS) {

Function *Caller = CS.getInstruction()->getFunction(); Function *Caller = CS.getInstruction()->getFunction();

LLVM_DEBUG(dbgs() << "[AAAMDFlatWorkGroupSize] Call " << Caller->getName() LLVM_DEBUG(dbgs() << '[' << getName() << "] Call " << Caller->getName()

<< "->" << getAssociatedFunction()->getName() << '\n'); << "->" << getAssociatedFunction()->getName() << '\n');

const auto &CallerInfo = A.getAAFor<AAAMDFlatWorkGroupSize>( const auto &CallerInfo = A.getAAFor<AttributeImpl>(

*this, IRPosition::function(*Caller), DepClassTy::REQUIRED); *this, IRPosition::function(*Caller), DepClassTy::REQUIRED);

Change |= Change |=

clampStateAndIndicateChange(this->getState(), CallerInfo.getState()); clampStateAndIndicateChange(this->getState(), CallerInfo.getState());

return true; return true;

}; };

jdoerfertUnsubmitted

Done

Can you add a TODO in this class. The functionality it offers should be in some helper header. Effectively it does call site -> callee lookups and clamping. We have similar helpers in AttributorAttributes.cpp, but not this one. At some point we should move them all out into a header...

jdoerfert: Can you add a TODO in this class. The functionality it offers should be in some helper header.

bool AllCallSitesKnown = true; bool AllCallSitesKnown = true;

if (!A.checkForAllCallSites(CheckCallSite, *this, true, AllCallSitesKnown)) if (!A.checkForAllCallSites(CheckCallSite, *this, true, AllCallSitesKnown))

return indicatePessimisticFixpoint(); return indicatePessimisticFixpoint();

return Change; return Change;

} }

ChangeStatus manifest(Attributor &A) override { ChangeStatus emitAttributeIfNotDefault(Attributor &A, unsigned Min,

SmallVector<Attribute, 8> AttrList; unsigned Max) {

Function *F = getAssociatedFunction();

LLVMContext &Ctx = F->getContext();

auto &InfoCache = static_cast<AMDGPUInformationCache &>(A.getInfoCache());

unsigned Min, Max;

std::tie(Min, Max) = InfoCache.getMaximumFlatWorkGroupRange(*F);

// Don't add the attribute if it's the implied default. // Don't add the attribute if it's the implied default.

if (getAssumed().getLower() == Min && getAssumed().getUpper() - 1 == Max) if (getAssumed().getLower() == Min && getAssumed().getUpper() - 1 == Max)

return ChangeStatus::UNCHANGED; return ChangeStatus::UNCHANGED;

Function *F = getAssociatedFunction();

LLVMContext &Ctx = F->getContext();

SmallVector<Attribute, 8> AttrList;

SmallString<10> Buffer; SmallString<10> Buffer;

raw_svector_ostream OS(Buffer); raw_svector_ostream OS(Buffer);

OS << getAssumed().getLower() << ',' << getAssumed().getUpper() - 1; OS << getAssumed().getLower() << ',' << getAssumed().getUpper() - 1;

AttrList.push_back( AttrList.push_back(Attribute::get(Ctx, AttrName, OS.str()));

Attribute::get(Ctx, "amdgpu-flat-work-group-size", OS.str()));

return IRAttributeManifest::manifestAttrs(A, getIRPosition(), AttrList, return IRAttributeManifest::manifestAttrs(A, getIRPosition(), AttrList,

jdoerfertUnsubmitted

Done

Nit: You don't need a list with 8 slots, { Attr } probably works just as well.

jdoerfert: Nit: You don't need a list with 8 slots, `{ Attr }` probably works just as well.

/* ForceReplace */ true); /* ForceReplace */ true);

} }

const std::string getAsStr() const override { const std::string getAsStr() const override {

std::string Str; std::string Str;

raw_string_ostream OS(Str); raw_string_ostream OS(Str);

OS << "AMDFlatWorkGroupSize["; OS << getName() << '[';

OS << getAssumed().getLower() << ',' << getAssumed().getUpper() - 1; OS << getAssumed().getLower() << ',' << getAssumed().getUpper() - 1;

OS << ']'; OS << ']';

return OS.str(); return OS.str();

} }

};

/// See AbstractAttribute::trackStatistics() /// Propagate amdgpu-flat-work-group-size attribute.

void trackStatistics() const override {} struct AAAMDFlatWorkGroupSize : public AAAMDSizeRangeAttribute {

AAAMDFlatWorkGroupSize(const IRPosition &IRP, Attributor &A)

: AAAMDSizeRangeAttribute(IRP, A, "amdgpu-flat-work-group-size") {}

Lint: Pre-merge checks

clang-format: please reformat the code

-    : AAAMDSizeRangeAttribute(IRP, A, "amdgpu-flat-work-group-size") {}
+      : AAAMDSizeRangeAttribute(IRP, A, "amdgpu-flat-work-group-size") {}

Lint: Pre-merge checks: clang-format: please reformat the code ``` - : AAAMDSizeRangeAttribute(IRP, A, "amdgpu-flat…

void initialize(Attributor &A) override {

Function *F = getAssociatedFunction();

auto &InfoCache = static_cast<AMDGPUInformationCache &>(A.getInfoCache());

unsigned MinGroupSize, MaxGroupSize;

std::tie(MinGroupSize, MaxGroupSize) = InfoCache.getFlatWorkGroupSizes(*F);

intersectKnown(

ConstantRange(APInt(32, MinGroupSize), APInt(32, MaxGroupSize + 1)));

}

ChangeStatus updateImpl(Attributor &A) override {

return updateImplImpl<AAAMDFlatWorkGroupSize>(A);

}

/// Create an abstract attribute view for the position \p IRP. /// Create an abstract attribute view for the position \p IRP.

static AAAMDFlatWorkGroupSize &createForPosition(const IRPosition &IRP, static AAAMDFlatWorkGroupSize &createForPosition(const IRPosition &IRP,

Attributor &A); Attributor &A);

ChangeStatus manifest(Attributor &A) override {

Function *F = getAssociatedFunction();

auto &InfoCache = static_cast<AMDGPUInformationCache &>(A.getInfoCache());

unsigned Min, Max;

std::tie(Min, Max) = InfoCache.getMaximumFlatWorkGroupRange(*F);

return emitAttributeIfNotDefault(A, Min, Max);

}

/// See AbstractAttribute::getName() /// See AbstractAttribute::getName()

const std::string getName() const override { const std::string getName() const override {

return "AAAMDFlatWorkGroupSize"; return "AAAMDFlatWorkGroupSize";

} }

/// See AbstractAttribute::getIdAddr() /// See AbstractAttribute::getIdAddr()

const char *getIdAddr() const override { return &ID; } const char *getIdAddr() const override { return &ID; }

Show All 13 Lines

AAAMDFlatWorkGroupSize::createForPosition(const IRPosition &IRP, AAAMDFlatWorkGroupSize::createForPosition(const IRPosition &IRP,

Attributor &A) { Attributor &A) {

if (IRP.getPositionKind() == IRPosition::IRP_FUNCTION) if (IRP.getPositionKind() == IRPosition::IRP_FUNCTION)

return *new (A.Allocator) AAAMDFlatWorkGroupSize(IRP, A); return *new (A.Allocator) AAAMDFlatWorkGroupSize(IRP, A);

llvm_unreachable( llvm_unreachable(

"AAAMDFlatWorkGroupSize is only valid for function position"); "AAAMDFlatWorkGroupSize is only valid for function position");

} }

/// Propagate amdgpu-waves-per-eu attribute.

struct AAAMDWavesPerEU : public AAAMDSizeRangeAttribute {

AAAMDWavesPerEU(const IRPosition &IRP, Attributor &A)

: AAAMDSizeRangeAttribute(IRP, A, "amdgpu-waves-per-eu") {}

bool isValidState() const override {

return !Assumed.isEmptySet() && IntegerRangeState::isValidState();

jdoerfertUnsubmitted

Not Done

Nit: Probably better to only redirect one level up (AAAMDSizeRangeAttribute::isValidState())

FWIW:
Empty should mean it's dead/misconfigured, no?

jdoerfert: Nit: Probably better to only redirect one level up (`AAAMDSizeRangeAttribute::isValidState()`)…

arsenmAuthorUnsubmitted

Done

This was one of the struggles I forgot about. I didn't find a better way to express the valid bounds for this to infer. By default it covers 0, -1, which exceeds the maximum of 10 and it produces broken attributes

arsenm: This was one of the struggles I forgot about. I didn't find a better way to express the valid…

}

void initialize(Attributor &A) override {

Function *F = getAssociatedFunction();

const AAAMDFlatWorkGroupSize &FlatWorkGroupSize =

A.getAAFor<AAAMDFlatWorkGroupSize>(*this, IRPosition::function(*F),

DepClassTy::REQUIRED);

const auto &AssumedFlatWorkGroup = FlatWorkGroupSize.getAssumed();

auto &InfoCache = static_cast<AMDGPUInformationCache &>(A.getInfoCache());

unsigned Min, Max;

std::tie(Min, Max) = InfoCache.getWavesPerEU(

*F, {AssumedFlatWorkGroup.getLower().getZExtValue(),

AssumedFlatWorkGroup.getUpper().getZExtValue() - 1});

ConstantRange Range(APInt(32, Min), APInt(32, Max + 1));

intersectKnown(Range);

jdoerfertUnsubmitted

Not Done

Somewhat surprising you intersect the known range with an assumed result, if that is on purpose probably worth a comment explaining why this is reasonable.

jdoerfert: Somewhat surprising you intersect the known range with an assumed result, if that is on purpose…

arsenmAuthorUnsubmitted

Done

I'm confused by your surprise. This is the initialize, so the assumed state doesn't mean anything? All the other IntegerRangeState attributes start out with intersectKnown in initialize()

arsenm: I'm confused by your surprise. This is the initialize, so the assumed state doesn't mean…

jdoerfertUnsubmitted

Not Done

So, at this point you move something assumed by another AA into something known by this. However, we don't know the other AAs assumed state is valid yet. Only after the fixpoint is reached it is known to hold. So what other AAs do (I hope) is use IR information to setup the known state. Here we might end up assuming the best for the FlatWorkGroupSize (line 674) then making it to something known in 683, before the values are tightened during the fixpoint iteration causing the known set to be not actually valid anymore. Generally, assumed information should only flow into known information if a fixpoint is reached (at which point the assumed information becomes the known one anyway). Before that, assumed should flow into assumed only and known can flow in either.

Does that make some sense?

jdoerfert: So, at this point you move something assumed by another AA into something known by this.

}

ChangeStatus updateImpl(Attributor &A) override {

auto &InfoCache = static_cast<AMDGPUInformationCache &>(A.getInfoCache());

ChangeStatus Change = ChangeStatus::UNCHANGED;

auto CheckCallSite = [&](AbstractCallSite CS) {

Function *Caller = CS.getInstruction()->getFunction();

LLVM_DEBUG(dbgs() << '[' << getName() << "] Call " << Caller->getName()

<< "->" << getAssociatedFunction()->getName() << '\n');

const auto &CallerInfo = A.getAAFor<AAAMDWavesPerEU>(

*this, IRPosition::function(*Caller), DepClassTy::REQUIRED);

const auto &CallerGroupSize = A.getAAFor<AAAMDFlatWorkGroupSize>(

*this, IRPosition::function(*Caller), DepClassTy::REQUIRED);

unsigned Min, Max;

std::tie(Min, Max) = InfoCache.getEffectiveWavesPerEU(

*Caller,

Lint: Pre-merge checks

clang-format: please reformat the code

-        *Caller,
-        {CallerInfo.getAssumed().getLower().getZExtValue(),
-         CallerInfo.getAssumed().getUpper().getZExtValue() - 1},
-        {CallerGroupSize.getAssumed().getLower().getZExtValue(),
-         CallerGroupSize.getAssumed().getUpper().getZExtValue() - 1});
+          *Caller,
+          {CallerInfo.getAssumed().getLower().getZExtValue(),
+           CallerInfo.getAssumed().getUpper().getZExtValue() - 1},
+          {CallerGroupSize.getAssumed().getLower().getZExtValue(),
+           CallerGroupSize.getAssumed().getUpper().getZExtValue() - 1});

Lint: Pre-merge checks: clang-format: please reformat the code ``` - *Caller, - {CallerInfo.getAssumed().

{CallerInfo.getAssumed().getLower().getZExtValue(),

CallerInfo.getAssumed().getUpper().getZExtValue() - 1},

{CallerGroupSize.getAssumed().getLower().getZExtValue(),

CallerGroupSize.getAssumed().getUpper().getZExtValue() - 1});

ConstantRange CallerRange(APInt(32, Min), APInt(32, Max + 1));

IntegerRangeState CallerRangeState(CallerRange);

Change |=

Lint: Pre-merge checks

clang-format: please reformat the code

-      Change |=
-        clampStateAndIndicateChange(this->getState(), CallerRangeState);
+      Change |= clampStateAndIndicateChange(this->getState(), CallerRangeState);

Lint: Pre-merge checks: clang-format: please reformat the code ``` - Change |=…

clampStateAndIndicateChange(this->getState(), CallerRangeState);

return true;

};

bool AllCallSitesKnown = true;

if (!A.checkForAllCallSites(CheckCallSite, *this, true, AllCallSitesKnown))

indicatePessimisticFixpoint();

jdoerfertUnsubmitted

Done

if (!A.checkForAllCallSites(CheckCallSite, *this, true, AllCallSitesKnown))

- indicatePessimisticFixpoint();

+ return indicatePessimisticFixpoint();

return Change;

It is important to return "CHANGED" here.

jdoerfert: It is important to return "CHANGED" here.

return Change;

}

/// Create an abstract attribute view for the position \p IRP.

static AAAMDWavesPerEU &createForPosition(const IRPosition &IRP,

Attributor &A);

ChangeStatus manifest(Attributor &A) override {

Function *F = getAssociatedFunction();

auto &InfoCache = static_cast<AMDGPUInformationCache &>(A.getInfoCache());

unsigned Max = InfoCache.getMaxWavesPerEU(*F);

return emitAttributeIfNotDefault(A, 1, Max);

}

/// See AbstractAttribute::getName()

const std::string getName() const override { return "AAAMDWavesPerEU"; }

/// See AbstractAttribute::getIdAddr()

const char *getIdAddr() const override { return &ID; }

/// This function should return true if the type of the \p AA is

/// AAAMDWavesPerEU

static bool classof(const AbstractAttribute *AA) {

return (AA->getIdAddr() == &ID);

}

/// Unique ID (due to the unique address)

static const char ID;

};

const char AAAMDWavesPerEU::ID = 0;

AAAMDWavesPerEU &AAAMDWavesPerEU::createForPosition(const IRPosition &IRP,

Attributor &A) {

if (IRP.getPositionKind() == IRPosition::IRP_FUNCTION)

return *new (A.Allocator) AAAMDWavesPerEU(IRP, A);

llvm_unreachable("AAAMDWavesPerEU is only valid for function position");

}

class AMDGPUAttributor : public ModulePass { class AMDGPUAttributor : public ModulePass {

public: public:

AMDGPUAttributor() : ModulePass(ID) {} AMDGPUAttributor() : ModulePass(ID) {}

/// doInitialization - Virtual method overridden by subclasses to do /// doInitialization - Virtual method overridden by subclasses to do

/// any necessary initialization before any pass is run. /// any necessary initialization before any pass is run.

bool doInitialization(Module &) override { bool doInitialization(Module &) override {

auto *TPC = getAnalysisIfAvailable<TargetPassConfig>(); auto *TPC = getAnalysisIfAvailable<TargetPassConfig>();

Show All 12 Lines for (Function &F : M) {

Functions.insert(&F); Functions.insert(&F);

} }

CallGraphUpdater CGUpdater; CallGraphUpdater CGUpdater;

BumpPtrAllocator Allocator; BumpPtrAllocator Allocator;

AMDGPUInformationCache InfoCache(M, AG, Allocator, nullptr, *TM); AMDGPUInformationCache InfoCache(M, AG, Allocator, nullptr, *TM);

DenseSet<const char *> Allowed( DenseSet<const char *> Allowed(

{&AAAMDAttributes::ID, &AAUniformWorkGroupSize::ID, {&AAAMDAttributes::ID, &AAUniformWorkGroupSize::ID,

&AAAMDFlatWorkGroupSize::ID, &AACallEdges::ID}); &AAAMDFlatWorkGroupSize::ID, &AAAMDWavesPerEU::ID, &AACallEdges::ID});

Attributor A(Functions, InfoCache, CGUpdater, &Allowed); Attributor A(Functions, InfoCache, CGUpdater, &Allowed);

for (Function &F : M) { for (Function &F : M) {

if (!F.isIntrinsic()) { if (!F.isIntrinsic()) {

A.getOrCreateAAFor<AAAMDAttributes>(IRPosition::function(F)); A.getOrCreateAAFor<AAAMDAttributes>(IRPosition::function(F));

A.getOrCreateAAFor<AAUniformWorkGroupSize>(IRPosition::function(F)); A.getOrCreateAAFor<AAUniformWorkGroupSize>(IRPosition::function(F));

if (!AMDGPU::isEntryFunctionCC(F.getCallingConv())) { if (!AMDGPU::isEntryFunctionCC(F.getCallingConv())) {

A.getOrCreateAAFor<AAAMDFlatWorkGroupSize>(IRPosition::function(F)); A.getOrCreateAAFor<AAAMDFlatWorkGroupSize>(IRPosition::function(F));

A.getOrCreateAAFor<AAAMDWavesPerEU>(IRPosition::function(F));

} }

ChangeStatus Change = A.run(); ChangeStatus Change = A.run();

return Change == ChangeStatus::CHANGED; return Change == ChangeStatus::CHANGED;

} }

Show All 10 Lines

llvm/lib/Target/AMDGPU/AMDGPUSubtarget.h

Show First 20 Lines • Show All 97 Lines • ▼ Show 20 Lines	public:
}		}

/// Overload which uses the specified values for the flat work group sizes,		/// Overload which uses the specified values for the flat work group sizes,
/// rather than querying the function itself. \p FlatWorkGroupSizes Should		/// rather than querying the function itself. \p FlatWorkGroupSizes Should
/// correspond to the function's value for getFlatWorkGroupSizes.		/// correspond to the function's value for getFlatWorkGroupSizes.
std::pair<unsigned, unsigned>		std::pair<unsigned, unsigned>
getWavesPerEU(const Function &F,		getWavesPerEU(const Function &F,
std::pair<unsigned, unsigned> FlatWorkGroupSizes) const;		std::pair<unsigned, unsigned> FlatWorkGroupSizes) const;
		std::pair<unsigned, unsigned>
		Lint: Pre-merge checks Inline Actions clang-format: please reformat the code - std::pair<unsigned, unsigned> - getEffectiveWavesPerEU(std::pair<unsigned, unsigned> WavesPerEU, - std::pair<unsigned, unsigned> FlatWorkGroupSizes) const; + std::pair<unsigned, unsigned> getEffectiveWavesPerEU( + std::pair<unsigned, unsigned> WavesPerEU, + std::pair<unsigned, unsigned> FlatWorkGroupSizes) const; Lint: Pre-merge checks: clang-format: please reformat the code ``` - std::pair<unsigned, unsigned>…
		getEffectiveWavesPerEU(std::pair<unsigned, unsigned> WavesPerEU,
		std::pair<unsigned, unsigned> FlatWorkGroupSizes) const;

/// Return the amount of LDS that can be used that will not restrict the		/// Return the amount of LDS that can be used that will not restrict the
/// occupancy lower than WaveCount.		/// occupancy lower than WaveCount.
unsigned getMaxLocalMemSizeWithWaveCount(unsigned WaveCount,		unsigned getMaxLocalMemSizeWithWaveCount(unsigned WaveCount,
const Function &) const;		const Function &) const;

/// Inverse of getMaxLocalMemWithWaveCount. Return the maximum wavecount if		/// Inverse of getMaxLocalMemWithWaveCount. Return the maximum wavecount if
/// the given LDS memory size is the only constraint.		/// the given LDS memory size is the only constraint.
▲ Show 20 Lines • Show All 150 Lines • Show Last 20 Lines

llvm/lib/Target/AMDGPU/AMDGPUSubtarget.cpp

Show First 20 Lines • Show All 526 Lines • ▼ Show 20 Lines	std::pair<unsigned, unsigned> AMDGPUSubtarget::getFlatWorkGroupSizes(
if (Requested.first < getMinFlatWorkGroupSize())		if (Requested.first < getMinFlatWorkGroupSize())
return Default;		return Default;
if (Requested.second > getMaxFlatWorkGroupSize())		if (Requested.second > getMaxFlatWorkGroupSize())
return Default;		return Default;

return Requested;		return Requested;
}		}

std::pair<unsigned, unsigned> AMDGPUSubtarget::getWavesPerEU(		std::pair<unsigned, unsigned> AMDGPUSubtarget::getEffectiveWavesPerEU(
const Function &F, std::pair<unsigned, unsigned> FlatWorkGroupSizes) const {		std::pair<unsigned, unsigned> Requested,
		Lint: Pre-merge checks Inline Actions clang-format: please reformat the code - std::pair<unsigned, unsigned> Requested, - std::pair<unsigned, unsigned> FlatWorkGroupSizes) const { + std::pair<unsigned, unsigned> Requested, + std::pair<unsigned, unsigned> FlatWorkGroupSizes) const { Lint: Pre-merge checks: clang-format: please reformat the code ``` - std::pair<unsigned, unsigned> Requested, - std…
		std::pair<unsigned, unsigned> FlatWorkGroupSizes) const {
// Default minimum/maximum number of waves per execution unit.		// Default minimum/maximum number of waves per execution unit.
std::pair<unsigned, unsigned> Default(1, getMaxWavesPerEU());		std::pair<unsigned, unsigned> Default(1, getMaxWavesPerEU());

// If minimum/maximum flat work group sizes were explicitly requested using		// If minimum/maximum flat work group sizes were explicitly requested using
// "amdgpu-flat-work-group-size" attribute, then set default minimum/maximum		// "amdgpu-flat-work-group-size" attribute, then set default minimum/maximum
// number of waves per execution unit to values implied by requested		// number of waves per execution unit to values implied by requested
// minimum/maximum flat work group sizes.		// minimum/maximum flat work group sizes.
unsigned MinImpliedByFlatWorkGroupSize =		unsigned MinImpliedByFlatWorkGroupSize =
getWavesPerEUForWorkGroup(FlatWorkGroupSizes.second);		getWavesPerEUForWorkGroup(FlatWorkGroupSizes.second);
Default.first = MinImpliedByFlatWorkGroupSize;		Default.first = MinImpliedByFlatWorkGroupSize;

// Requested minimum/maximum number of waves per execution unit.
std::pair<unsigned, unsigned> Requested = AMDGPU::getIntegerPairAttribute(
F, "amdgpu-waves-per-eu", Default, true);

// Make sure requested minimum is less than requested maximum.		// Make sure requested minimum is less than requested maximum.
if (Requested.second && Requested.first > Requested.second)		if (Requested.second && Requested.first > Requested.second)
return Default;		return Default;

// Make sure requested values do not violate subtarget's specifications.		// Make sure requested values do not violate subtarget's specifications.
if (Requested.first < getMinWavesPerEU() \|\|		if (Requested.first < getMinWavesPerEU() \|\|
Requested.second > getMaxWavesPerEU())		Requested.second > getMaxWavesPerEU())
return Default;		return Default;

// Make sure requested values are compatible with values implied by requested		// Make sure requested values are compatible with values implied by requested
// minimum/maximum flat work group sizes.		// minimum/maximum flat work group sizes.
if (Requested.first < MinImpliedByFlatWorkGroupSize)		if (Requested.first < MinImpliedByFlatWorkGroupSize)
return Default;		return Default;

return Requested;		return Requested;
}		}

		std::pair<unsigned, unsigned> AMDGPUSubtarget::getWavesPerEU(
		const Function &F, std::pair<unsigned, unsigned> FlatWorkGroupSizes) const {
		// Default minimum/maximum number of waves per execution unit.
		std::pair<unsigned, unsigned> Default(1, getMaxWavesPerEU());

		// Requested minimum/maximum number of waves per execution unit.
		std::pair<unsigned, unsigned> Requested = AMDGPU::getIntegerPairAttribute(
		Lint: Pre-merge checks Inline Actions clang-format: please reformat the code - std::pair<unsigned, unsigned> Requested = AMDGPU::getIntegerPairAttribute( - F, "amdgpu-waves-per-eu", Default, true); + std::pair<unsigned, unsigned> Requested = + AMDGPU::getIntegerPairAttribute(F, "amdgpu-waves-per-eu", Default, true); Lint: Pre-merge checks: clang-format: please reformat the code ``` - std::pair<unsigned, unsigned> Requested = AMDGPU…
		F, "amdgpu-waves-per-eu", Default, true);
		return getEffectiveWavesPerEU(Requested, FlatWorkGroupSizes);
		}

static unsigned getReqdWorkGroupSize(const Function &Kernel, unsigned Dim) {		static unsigned getReqdWorkGroupSize(const Function &Kernel, unsigned Dim) {
auto Node = Kernel.getMetadata("reqd_work_group_size");		auto Node = Kernel.getMetadata("reqd_work_group_size");
if (Node && Node->getNumOperands() == 3)		if (Node && Node->getNumOperands() == 3)
return mdconst::extract<ConstantInt>(Node->getOperand(Dim))->getZExtValue();		return mdconst::extract<ConstantInt>(Node->getOperand(Dim))->getZExtValue();
return std::numeric_limits<unsigned>::max();		return std::numeric_limits<unsigned>::max();
}		}

bool AMDGPUSubtarget::isMesaKernel(const Function &F) const {		bool AMDGPUSubtarget::isMesaKernel(const Function &F) const {
▲ Show 20 Lines • Show All 558 Lines • Show Last 20 Lines

llvm/lib/Target/AMDGPU/GCNSubtarget.h

	Show All 24 Lines
	#include "AMDGPUGenSubtargetInfo.inc"			#include "AMDGPUGenSubtargetInfo.inc"

	namespace llvm {			namespace llvm {

	class GCNTargetMachine;			class GCNTargetMachine;

	class GCNSubtarget final : public AMDGPUGenSubtargetInfo,			class GCNSubtarget final : public AMDGPUGenSubtargetInfo,
	public AMDGPUSubtarget {			public AMDGPUSubtarget {
				public:
	using AMDGPUSubtarget::getMaxWavesPerEU;			using AMDGPUSubtarget::getMaxWavesPerEU;

	public:
	// Following 2 enums are documented at:			// Following 2 enums are documented at:
	// - https://llvm.org/docs/AMDGPUUsage.html#trap-handler-abi			// - https://llvm.org/docs/AMDGPUUsage.html#trap-handler-abi
	enum class TrapHandlerAbi {			enum class TrapHandlerAbi {
	NONE = 0x00,			NONE = 0x00,
	AMDHSA = 0x01,			AMDHSA = 0x01,
	};			};

	enum class TrapID {			enum class TrapID {
	▲ Show 20 Lines • Show All 1,133 Lines • Show Last 20 Lines

llvm/test/CodeGen/AMDGPU/addrspacecast-constantexpr.ll

	Show First 20 Lines • Show All 211 Lines • ▼ Show 20 Lines
	}			}

	define i32 addrspace(3)* @ret_constant_cast_group_gv_gep_to_flat_to_group() #1 {			define i32 addrspace(3)* @ret_constant_cast_group_gv_gep_to_flat_to_group() #1 {
	; AKF_HSA-LABEL: define {{[^@]+}}@ret_constant_cast_group_gv_gep_to_flat_to_group			; AKF_HSA-LABEL: define {{[^@]+}}@ret_constant_cast_group_gv_gep_to_flat_to_group
	; AKF_HSA-SAME: () #[[ATTR1]] {			; AKF_HSA-SAME: () #[[ATTR1]] {
	; AKF_HSA-NEXT: ret i32 addrspace(3)* addrspacecast (i32 addrspace(4)* getelementptr ([256 x i32], [256 x i32] addrspace(4)* addrspacecast ([256 x i32] addrspace(3)* @lds.arr to [256 x i32] addrspace(4)), i64 0, i64 8) to i32 addrspace(3))			; AKF_HSA-NEXT: ret i32 addrspace(3)* addrspacecast (i32 addrspace(4)* getelementptr ([256 x i32], [256 x i32] addrspace(4)* addrspacecast ([256 x i32] addrspace(3)* @lds.arr to [256 x i32] addrspace(4)), i64 0, i64 8) to i32 addrspace(3))
	;			;
	; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@ret_constant_cast_group_gv_gep_to_flat_to_group			; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@ret_constant_cast_group_gv_gep_to_flat_to_group
	; ATTRIBUTOR_HSA-SAME: () #[[ATTR2]] {			; ATTRIBUTOR_HSA-SAME: () #[[ATTR3:[0-9]+]] {
	; ATTRIBUTOR_HSA-NEXT: ret i32 addrspace(3)* addrspacecast (i32 addrspace(4)* getelementptr ([256 x i32], [256 x i32] addrspace(4)* addrspacecast ([256 x i32] addrspace(3)* @lds.arr to [256 x i32] addrspace(4)), i64 0, i64 8) to i32 addrspace(3))			; ATTRIBUTOR_HSA-NEXT: ret i32 addrspace(3)* addrspacecast (i32 addrspace(4)* getelementptr ([256 x i32], [256 x i32] addrspace(4)* addrspacecast ([256 x i32] addrspace(3)* @lds.arr to [256 x i32] addrspace(4)), i64 0, i64 8) to i32 addrspace(3))
	;			;
	ret i32 addrspace(3)* addrspacecast (i32 addrspace(4)* getelementptr ([256 x i32], [256 x i32] addrspace(4)* addrspacecast ([256 x i32] addrspace(3)* @lds.arr to [256 x i32] addrspace(4)), i64 0, i64 8) to i32 addrspace(3))			ret i32 addrspace(3)* addrspacecast (i32 addrspace(4)* getelementptr ([256 x i32], [256 x i32] addrspace(4)* addrspacecast ([256 x i32] addrspace(3)* @lds.arr to [256 x i32] addrspace(4)), i64 0, i64 8) to i32 addrspace(3))
	}			}

	attributes #0 = { argmemonly nounwind }			attributes #0 = { argmemonly nounwind }
	attributes #1 = { nounwind }			attributes #1 = { nounwind }
	;.			;.
	; AKF_HSA: attributes #[[ATTR0:[0-9]+]] = { argmemonly nofree nounwind willreturn }			; AKF_HSA: attributes #[[ATTR0:[0-9]+]] = { argmemonly nofree nounwind willreturn }
	; AKF_HSA: attributes #[[ATTR1]] = { nounwind }			; AKF_HSA: attributes #[[ATTR1]] = { nounwind }
	;.			;.
	; ATTRIBUTOR_HSA: attributes #[[ATTR0:[0-9]+]] = { argmemonly nofree nounwind willreturn }			; ATTRIBUTOR_HSA: attributes #[[ATTR0:[0-9]+]] = { argmemonly nofree nounwind willreturn }
	; ATTRIBUTOR_HSA: attributes #[[ATTR1]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR1]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }
	; ATTRIBUTOR_HSA: attributes #[[ATTR2]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR2]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }
				; ATTRIBUTOR_HSA: attributes #[[ATTR3]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
	;.			;.

llvm/test/CodeGen/AMDGPU/annotate-existing-abi-attributes.ll

	Show First 20 Lines • Show All 111 Lines • ▼ Show 20 Lines
	; CHECK-SAME: () #[[ATTR9:[0-9]+]] {			; CHECK-SAME: () #[[ATTR9:[0-9]+]] {
	; CHECK-NEXT: call void @marked_no_dispatch_id()			; CHECK-NEXT: call void @marked_no_dispatch_id()
	; CHECK-NEXT: ret void			; CHECK-NEXT: ret void
	;			;
	call void @marked_no_dispatch_id()			call void @marked_no_dispatch_id()
	ret void			ret void
	}			}
	;.			;.
	; CHECK: attributes #[[ATTR0]] = { "amdgpu-no-workitem-id-x" "uniform-work-group-size"="false" }			; CHECK: attributes #[[ATTR0]] = { "amdgpu-no-workitem-id-x" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
	; CHECK: attributes #[[ATTR1]] = { "amdgpu-no-workitem-id-y" "uniform-work-group-size"="false" }			; CHECK: attributes #[[ATTR1]] = { "amdgpu-no-workitem-id-y" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
	; CHECK: attributes #[[ATTR2]] = { "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }			; CHECK: attributes #[[ATTR2]] = { "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
	; CHECK: attributes #[[ATTR3]] = { "amdgpu-no-workgroup-id-x" "uniform-work-group-size"="false" }			; CHECK: attributes #[[ATTR3]] = { "amdgpu-no-workgroup-id-x" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
	; CHECK: attributes #[[ATTR4]] = { "amdgpu-no-workgroup-id-y" "uniform-work-group-size"="false" }			; CHECK: attributes #[[ATTR4]] = { "amdgpu-no-workgroup-id-y" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
	; CHECK: attributes #[[ATTR5]] = { "amdgpu-no-workgroup-id-z" "uniform-work-group-size"="false" }			; CHECK: attributes #[[ATTR5]] = { "amdgpu-no-workgroup-id-z" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
	; CHECK: attributes #[[ATTR6]] = { "amdgpu-no-dispatch-ptr" "uniform-work-group-size"="false" }			; CHECK: attributes #[[ATTR6]] = { "amdgpu-no-dispatch-ptr" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
	; CHECK: attributes #[[ATTR7]] = { "amdgpu-no-queue-ptr" "uniform-work-group-size"="false" }			; CHECK: attributes #[[ATTR7]] = { "amdgpu-no-queue-ptr" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
	; CHECK: attributes #[[ATTR8]] = { "amdgpu-no-implicitarg-ptr" "uniform-work-group-size"="false" }			; CHECK: attributes #[[ATTR8]] = { "amdgpu-no-implicitarg-ptr" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
	; CHECK: attributes #[[ATTR9]] = { "amdgpu-no-dispatch-id" "uniform-work-group-size"="false" }			; CHECK: attributes #[[ATTR9]] = { "amdgpu-no-dispatch-id" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
	;.			;.

llvm/test/CodeGen/AMDGPU/annotate-kernel-features-hsa-call.ll

	Show First 20 Lines • Show All 605 Lines • ▼ Show 20 Lines
	define void @use_implicitarg_ptr() #1 {			define void @use_implicitarg_ptr() #1 {
	; AKF_HSA-LABEL: define {{[^@]+}}@use_implicitarg_ptr			; AKF_HSA-LABEL: define {{[^@]+}}@use_implicitarg_ptr
	; AKF_HSA-SAME: () #[[ATTR1]] {			; AKF_HSA-SAME: () #[[ATTR1]] {
	; AKF_HSA-NEXT: [[IMPLICITARG_PTR:%.]] = call i8 addrspace(4) @llvm.amdgcn.implicitarg.ptr()			; AKF_HSA-NEXT: [[IMPLICITARG_PTR:%.]] = call i8 addrspace(4) @llvm.amdgcn.implicitarg.ptr()
	; AKF_HSA-NEXT: store volatile i8 addrspace(4)* [[IMPLICITARG_PTR]], i8 addrspace(4)* addrspace(1)* undef, align 8			; AKF_HSA-NEXT: store volatile i8 addrspace(4)* [[IMPLICITARG_PTR]], i8 addrspace(4)* addrspace(1)* undef, align 8
	; AKF_HSA-NEXT: ret void			; AKF_HSA-NEXT: ret void
	;			;
	; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@use_implicitarg_ptr			; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@use_implicitarg_ptr
	; ATTRIBUTOR_HSA-SAME: () #[[ATTR14]] {			; ATTRIBUTOR_HSA-SAME: () #[[ATTR15:[0-9]+]] {
	; ATTRIBUTOR_HSA-NEXT: [[IMPLICITARG_PTR:%.]] = call i8 addrspace(4) @llvm.amdgcn.implicitarg.ptr()			; ATTRIBUTOR_HSA-NEXT: [[IMPLICITARG_PTR:%.]] = call i8 addrspace(4) @llvm.amdgcn.implicitarg.ptr()
	; ATTRIBUTOR_HSA-NEXT: store volatile i8 addrspace(4)* [[IMPLICITARG_PTR]], i8 addrspace(4)* addrspace(1)* undef, align 8			; ATTRIBUTOR_HSA-NEXT: store volatile i8 addrspace(4)* [[IMPLICITARG_PTR]], i8 addrspace(4)* addrspace(1)* undef, align 8
	; ATTRIBUTOR_HSA-NEXT: ret void			; ATTRIBUTOR_HSA-NEXT: ret void
	;			;
	%implicitarg.ptr = call i8 addrspace(4)* @llvm.amdgcn.implicitarg.ptr()			%implicitarg.ptr = call i8 addrspace(4)* @llvm.amdgcn.implicitarg.ptr()
	store volatile i8 addrspace(4)* %implicitarg.ptr, i8 addrspace(4)* addrspace(1)* undef			store volatile i8 addrspace(4)* %implicitarg.ptr, i8 addrspace(4)* addrspace(1)* undef
	ret void			ret void
	}			}

	define void @func_indirect_use_implicitarg_ptr() #1 {			define void @func_indirect_use_implicitarg_ptr() #1 {
	; AKF_HSA-LABEL: define {{[^@]+}}@func_indirect_use_implicitarg_ptr			; AKF_HSA-LABEL: define {{[^@]+}}@func_indirect_use_implicitarg_ptr
	; AKF_HSA-SAME: () #[[ATTR1]] {			; AKF_HSA-SAME: () #[[ATTR1]] {
	; AKF_HSA-NEXT: call void @use_implicitarg_ptr()			; AKF_HSA-NEXT: call void @use_implicitarg_ptr()
	; AKF_HSA-NEXT: ret void			; AKF_HSA-NEXT: ret void
	;			;
	; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@func_indirect_use_implicitarg_ptr			; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@func_indirect_use_implicitarg_ptr
	; ATTRIBUTOR_HSA-SAME: () #[[ATTR14]] {			; ATTRIBUTOR_HSA-SAME: () #[[ATTR15]] {
	; ATTRIBUTOR_HSA-NEXT: call void @use_implicitarg_ptr()			; ATTRIBUTOR_HSA-NEXT: call void @use_implicitarg_ptr()
	; ATTRIBUTOR_HSA-NEXT: ret void			; ATTRIBUTOR_HSA-NEXT: ret void
	;			;
	call void @use_implicitarg_ptr()			call void @use_implicitarg_ptr()
	ret void			ret void
	}			}

	declare void @external.func() #3			declare void @external.func() #3

	; This function gets deleted.			; This function gets deleted.
	define internal void @defined.func() #3 {			define internal void @defined.func() #3 {
	; AKF_HSA-LABEL: define {{[^@]+}}@defined.func			; AKF_HSA-LABEL: define {{[^@]+}}@defined.func
	; AKF_HSA-SAME: () #[[ATTR3:[0-9]+]] {			; AKF_HSA-SAME: () #[[ATTR3:[0-9]+]] {
	; AKF_HSA-NEXT: ret void			; AKF_HSA-NEXT: ret void
	;			;
	; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@defined.func			; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@defined.func
	; ATTRIBUTOR_HSA-SAME: () #[[ATTR16:[0-9]+]] {			; ATTRIBUTOR_HSA-SAME: () #[[ATTR17:[0-9]+]] {
	; ATTRIBUTOR_HSA-NEXT: ret void			; ATTRIBUTOR_HSA-NEXT: ret void
	;			;
	ret void			ret void
	}			}

	define void @func_call_external() #3 {			define void @func_call_external() #3 {
	; AKF_HSA-LABEL: define {{[^@]+}}@func_call_external			; AKF_HSA-LABEL: define {{[^@]+}}@func_call_external
	; AKF_HSA-SAME: () #[[ATTR3]] {			; AKF_HSA-SAME: () #[[ATTR3]] {
	; AKF_HSA-NEXT: call void @external.func()			; AKF_HSA-NEXT: call void @external.func()
	; AKF_HSA-NEXT: ret void			; AKF_HSA-NEXT: ret void
	;			;
	; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@func_call_external			; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@func_call_external
	; ATTRIBUTOR_HSA-SAME: () #[[ATTR15:[0-9]+]] {			; ATTRIBUTOR_HSA-SAME: () #[[ATTR16:[0-9]+]] {
	; ATTRIBUTOR_HSA-NEXT: call void @external.func()			; ATTRIBUTOR_HSA-NEXT: call void @external.func()
	; ATTRIBUTOR_HSA-NEXT: ret void			; ATTRIBUTOR_HSA-NEXT: ret void
	;			;
	call void @external.func()			call void @external.func()
	ret void			ret void
	}			}

	define void @func_call_defined() #3 {			define void @func_call_defined() #3 {
	; AKF_HSA-LABEL: define {{[^@]+}}@func_call_defined			; AKF_HSA-LABEL: define {{[^@]+}}@func_call_defined
	; AKF_HSA-SAME: () #[[ATTR3]] {			; AKF_HSA-SAME: () #[[ATTR3]] {
	; AKF_HSA-NEXT: call void @defined.func()			; AKF_HSA-NEXT: call void @defined.func()
	; AKF_HSA-NEXT: ret void			; AKF_HSA-NEXT: ret void
	;			;
	; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@func_call_defined			; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@func_call_defined
	; ATTRIBUTOR_HSA-SAME: () #[[ATTR16]] {			; ATTRIBUTOR_HSA-SAME: () #[[ATTR17]] {
	; ATTRIBUTOR_HSA-NEXT: call void @defined.func()			; ATTRIBUTOR_HSA-NEXT: call void @defined.func()
	; ATTRIBUTOR_HSA-NEXT: ret void			; ATTRIBUTOR_HSA-NEXT: ret void
	;			;
	call void @defined.func()			call void @defined.func()
	ret void			ret void
	}			}
	define void @func_call_asm() #3 {			define void @func_call_asm() #3 {
	; AKF_HSA-LABEL: define {{[^@]+}}@func_call_asm			; AKF_HSA-LABEL: define {{[^@]+}}@func_call_asm
	; AKF_HSA-SAME: () #[[ATTR3]] {			; AKF_HSA-SAME: () #[[ATTR3]] {
	; AKF_HSA-NEXT: call void asm sideeffect "", ""() #[[ATTR3]]			; AKF_HSA-NEXT: call void asm sideeffect "", ""() #[[ATTR3]]
	; AKF_HSA-NEXT: ret void			; AKF_HSA-NEXT: ret void
	;			;
	; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@func_call_asm			; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@func_call_asm
	; ATTRIBUTOR_HSA-SAME: () #[[ATTR16]] {			; ATTRIBUTOR_HSA-SAME: () #[[ATTR17]] {
	; ATTRIBUTOR_HSA-NEXT: call void asm sideeffect "", ""() #[[ATTR20:[0-9]+]]			; ATTRIBUTOR_HSA-NEXT: call void asm sideeffect "", ""() #[[ATTR24:[0-9]+]]
	; ATTRIBUTOR_HSA-NEXT: ret void			; ATTRIBUTOR_HSA-NEXT: ret void
	;			;
	call void asm sideeffect "", ""() #3			call void asm sideeffect "", ""() #3
	ret void			ret void
	}			}

	define amdgpu_kernel void @kern_call_external() #3 {			define amdgpu_kernel void @kern_call_external() #3 {
	; AKF_HSA-LABEL: define {{[^@]+}}@kern_call_external			; AKF_HSA-LABEL: define {{[^@]+}}@kern_call_external
	; AKF_HSA-SAME: () #[[ATTR4:[0-9]+]] {			; AKF_HSA-SAME: () #[[ATTR4:[0-9]+]] {
	; AKF_HSA-NEXT: call void @external.func()			; AKF_HSA-NEXT: call void @external.func()
	; AKF_HSA-NEXT: ret void			; AKF_HSA-NEXT: ret void
	;			;
	; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@kern_call_external			; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@kern_call_external
	; ATTRIBUTOR_HSA-SAME: () #[[ATTR15]] {			; ATTRIBUTOR_HSA-SAME: () #[[ATTR18:[0-9]+]] {
	; ATTRIBUTOR_HSA-NEXT: call void @external.func()			; ATTRIBUTOR_HSA-NEXT: call void @external.func()
	; ATTRIBUTOR_HSA-NEXT: ret void			; ATTRIBUTOR_HSA-NEXT: ret void
	;			;
	call void @external.func()			call void @external.func()
	ret void			ret void
	}			}

	define amdgpu_kernel void @func_kern_defined() #3 {			define amdgpu_kernel void @func_kern_defined() #3 {
	; AKF_HSA-LABEL: define {{[^@]+}}@func_kern_defined			; AKF_HSA-LABEL: define {{[^@]+}}@func_kern_defined
	; AKF_HSA-SAME: () #[[ATTR4]] {			; AKF_HSA-SAME: () #[[ATTR4]] {
	; AKF_HSA-NEXT: call void @defined.func()			; AKF_HSA-NEXT: call void @defined.func()
	; AKF_HSA-NEXT: ret void			; AKF_HSA-NEXT: ret void
	;			;
	; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@func_kern_defined			; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@func_kern_defined
	; ATTRIBUTOR_HSA-SAME: () #[[ATTR16]] {			; ATTRIBUTOR_HSA-SAME: () #[[ATTR17]] {
	; ATTRIBUTOR_HSA-NEXT: call void @defined.func()			; ATTRIBUTOR_HSA-NEXT: call void @defined.func()
	; ATTRIBUTOR_HSA-NEXT: ret void			; ATTRIBUTOR_HSA-NEXT: ret void
	;			;
	call void @defined.func()			call void @defined.func()
	ret void			ret void
	}			}

	define i32 @use_dispatch_ptr_ret_type() #1 {			define i32 @use_dispatch_ptr_ret_type() #1 {
	Show All 35 Lines
	define float @func_indirect_call(float()* %fptr) #3 {			define float @func_indirect_call(float()* %fptr) #3 {
	; AKF_HSA-LABEL: define {{[^@]+}}@func_indirect_call			; AKF_HSA-LABEL: define {{[^@]+}}@func_indirect_call
	; AKF_HSA-SAME: (float ()* [[FPTR:%.*]]) #[[ATTR3]] {			; AKF_HSA-SAME: (float ()* [[FPTR:%.*]]) #[[ATTR3]] {
	; AKF_HSA-NEXT: [[F:%.*]] = call float [[FPTR]]()			; AKF_HSA-NEXT: [[F:%.*]] = call float [[FPTR]]()
	; AKF_HSA-NEXT: [[FADD:%.*]] = fadd float [[F]], 1.000000e+00			; AKF_HSA-NEXT: [[FADD:%.*]] = fadd float [[F]], 1.000000e+00
	; AKF_HSA-NEXT: ret float [[FADD]]			; AKF_HSA-NEXT: ret float [[FADD]]
	;			;
	; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@func_indirect_call			; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@func_indirect_call
	; ATTRIBUTOR_HSA-SAME: (float ()* [[FPTR:%.*]]) #[[ATTR15]] {			; ATTRIBUTOR_HSA-SAME: (float ()* [[FPTR:%.*]]) #[[ATTR16]] {
	; ATTRIBUTOR_HSA-NEXT: [[F:%.*]] = call float [[FPTR]]()			; ATTRIBUTOR_HSA-NEXT: [[F:%.*]] = call float [[FPTR]]()
	; ATTRIBUTOR_HSA-NEXT: [[FADD:%.*]] = fadd float [[F]], 1.000000e+00			; ATTRIBUTOR_HSA-NEXT: [[FADD:%.*]] = fadd float [[F]], 1.000000e+00
	; ATTRIBUTOR_HSA-NEXT: ret float [[FADD]]			; ATTRIBUTOR_HSA-NEXT: ret float [[FADD]]
	;			;
	%f = call float %fptr()			%f = call float %fptr()
	%fadd = fadd float %f, 1.0			%fadd = fadd float %f, 1.0
	ret float %fadd			ret float %fadd
	}			}

	declare float @extern() #3			declare float @extern() #3
	define float @func_extern_call() #3 {			define float @func_extern_call() #3 {
	; AKF_HSA-LABEL: define {{[^@]+}}@func_extern_call			; AKF_HSA-LABEL: define {{[^@]+}}@func_extern_call
	; AKF_HSA-SAME: () #[[ATTR3]] {			; AKF_HSA-SAME: () #[[ATTR3]] {
	; AKF_HSA-NEXT: [[F:%.*]] = call float @extern()			; AKF_HSA-NEXT: [[F:%.*]] = call float @extern()
	; AKF_HSA-NEXT: [[FADD:%.*]] = fadd float [[F]], 1.000000e+00			; AKF_HSA-NEXT: [[FADD:%.*]] = fadd float [[F]], 1.000000e+00
	; AKF_HSA-NEXT: ret float [[FADD]]			; AKF_HSA-NEXT: ret float [[FADD]]
	;			;
	; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@func_extern_call			; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@func_extern_call
	; ATTRIBUTOR_HSA-SAME: () #[[ATTR15]] {			; ATTRIBUTOR_HSA-SAME: () #[[ATTR16]] {
	; ATTRIBUTOR_HSA-NEXT: [[F:%.*]] = call float @extern()			; ATTRIBUTOR_HSA-NEXT: [[F:%.*]] = call float @extern()
	; ATTRIBUTOR_HSA-NEXT: [[FADD:%.*]] = fadd float [[F]], 1.000000e+00			; ATTRIBUTOR_HSA-NEXT: [[FADD:%.*]] = fadd float [[F]], 1.000000e+00
	; ATTRIBUTOR_HSA-NEXT: ret float [[FADD]]			; ATTRIBUTOR_HSA-NEXT: ret float [[FADD]]
	;			;
	%f = call float @extern()			%f = call float @extern()
	%fadd = fadd float %f, 1.0			%fadd = fadd float %f, 1.0
	ret float %fadd			ret float %fadd
	}			}

	define float @func_null_call(float()* %fptr) #3 {			define float @func_null_call(float()* %fptr) #3 {
	; AKF_HSA-LABEL: define {{[^@]+}}@func_null_call			; AKF_HSA-LABEL: define {{[^@]+}}@func_null_call
	; AKF_HSA-SAME: (float ()* [[FPTR:%.*]]) #[[ATTR3]] {			; AKF_HSA-SAME: (float ()* [[FPTR:%.*]]) #[[ATTR3]] {
	; AKF_HSA-NEXT: [[F:%.*]] = call float null()			; AKF_HSA-NEXT: [[F:%.*]] = call float null()
	; AKF_HSA-NEXT: [[FADD:%.*]] = fadd float [[F]], 1.000000e+00			; AKF_HSA-NEXT: [[FADD:%.*]] = fadd float [[F]], 1.000000e+00
	; AKF_HSA-NEXT: ret float [[FADD]]			; AKF_HSA-NEXT: ret float [[FADD]]
	;			;
	; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@func_null_call			; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@func_null_call
	; ATTRIBUTOR_HSA-SAME: (float ()* [[FPTR:%.*]]) #[[ATTR15]] {			; ATTRIBUTOR_HSA-SAME: (float ()* [[FPTR:%.*]]) #[[ATTR16]] {
	; ATTRIBUTOR_HSA-NEXT: [[F:%.*]] = call float null()			; ATTRIBUTOR_HSA-NEXT: [[F:%.*]] = call float null()
	; ATTRIBUTOR_HSA-NEXT: [[FADD:%.*]] = fadd float [[F]], 1.000000e+00			; ATTRIBUTOR_HSA-NEXT: [[FADD:%.*]] = fadd float [[F]], 1.000000e+00
	; ATTRIBUTOR_HSA-NEXT: ret float [[FADD]]			; ATTRIBUTOR_HSA-NEXT: ret float [[FADD]]
	;			;
	%f = call float null()			%f = call float null()
	%fadd = fadd float %f, 1.0			%fadd = fadd float %f, 1.0
	ret float %fadd			ret float %fadd
	}			}

	declare float @llvm.amdgcn.rcp.f32(float) #0			declare float @llvm.amdgcn.rcp.f32(float) #0

	; Calls some other recognized intrinsic			; Calls some other recognized intrinsic
	define float @func_other_intrinsic_call(float %arg) #3 {			define float @func_other_intrinsic_call(float %arg) #3 {
	; AKF_HSA-LABEL: define {{[^@]+}}@func_other_intrinsic_call			; AKF_HSA-LABEL: define {{[^@]+}}@func_other_intrinsic_call
	; AKF_HSA-SAME: (float [[ARG:%.*]]) #[[ATTR3]] {			; AKF_HSA-SAME: (float [[ARG:%.*]]) #[[ATTR3]] {
	; AKF_HSA-NEXT: [[F:%.*]] = call float @llvm.amdgcn.rcp.f32(float [[ARG]])			; AKF_HSA-NEXT: [[F:%.*]] = call float @llvm.amdgcn.rcp.f32(float [[ARG]])
	; AKF_HSA-NEXT: [[FADD:%.*]] = fadd float [[F]], 1.000000e+00			; AKF_HSA-NEXT: [[FADD:%.*]] = fadd float [[F]], 1.000000e+00
	; AKF_HSA-NEXT: ret float [[FADD]]			; AKF_HSA-NEXT: ret float [[FADD]]
	;			;
	; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@func_other_intrinsic_call			; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@func_other_intrinsic_call
	; ATTRIBUTOR_HSA-SAME: (float [[ARG:%.*]]) #[[ATTR16]] {			; ATTRIBUTOR_HSA-SAME: (float [[ARG:%.*]]) #[[ATTR17]] {
	; ATTRIBUTOR_HSA-NEXT: [[F:%.*]] = call float @llvm.amdgcn.rcp.f32(float [[ARG]])			; ATTRIBUTOR_HSA-NEXT: [[F:%.*]] = call float @llvm.amdgcn.rcp.f32(float [[ARG]])
	; ATTRIBUTOR_HSA-NEXT: [[FADD:%.*]] = fadd float [[F]], 1.000000e+00			; ATTRIBUTOR_HSA-NEXT: [[FADD:%.*]] = fadd float [[F]], 1.000000e+00
	; ATTRIBUTOR_HSA-NEXT: ret float [[FADD]]			; ATTRIBUTOR_HSA-NEXT: ret float [[FADD]]
	;			;
	%f = call float @llvm.amdgcn.rcp.f32(float %arg)			%f = call float @llvm.amdgcn.rcp.f32(float %arg)
	%fadd = fadd float %f, 1.0			%fadd = fadd float %f, 1.0
	ret float %fadd			ret float %fadd
	}			}

	; Implicit arguments need to be enabled for sanitizers			; Implicit arguments need to be enabled for sanitizers
	define amdgpu_kernel void @kern_sanitize_address() #4 {			define amdgpu_kernel void @kern_sanitize_address() #4 {
	; AKF_HSA-LABEL: define {{[^@]+}}@kern_sanitize_address			; AKF_HSA-LABEL: define {{[^@]+}}@kern_sanitize_address
	; AKF_HSA-SAME: () #[[ATTR5:[0-9]+]] {			; AKF_HSA-SAME: () #[[ATTR5:[0-9]+]] {
	; AKF_HSA-NEXT: store volatile i32 0, i32 addrspace(1)* null, align 4			; AKF_HSA-NEXT: store volatile i32 0, i32 addrspace(1)* null, align 4
	; AKF_HSA-NEXT: ret void			; AKF_HSA-NEXT: ret void
	;			;
	; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@kern_sanitize_address			; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@kern_sanitize_address
	; ATTRIBUTOR_HSA-SAME: () #[[ATTR17:[0-9]+]] {			; ATTRIBUTOR_HSA-SAME: () #[[ATTR19:[0-9]+]] {
	; ATTRIBUTOR_HSA-NEXT: store volatile i32 0, i32 addrspace(1)* null, align 4			; ATTRIBUTOR_HSA-NEXT: store volatile i32 0, i32 addrspace(1)* null, align 4
	; ATTRIBUTOR_HSA-NEXT: ret void			; ATTRIBUTOR_HSA-NEXT: ret void
	;			;
	store volatile i32 0, i32 addrspace(1)* null			store volatile i32 0, i32 addrspace(1)* null
	ret void			ret void
	}			}

	; Implicit arguments need to be enabled for sanitizers			; Implicit arguments need to be enabled for sanitizers
	define void @func_sanitize_address() #4 {			define void @func_sanitize_address() #4 {
	; AKF_HSA-LABEL: define {{[^@]+}}@func_sanitize_address			; AKF_HSA-LABEL: define {{[^@]+}}@func_sanitize_address
	; AKF_HSA-SAME: () #[[ATTR5]] {			; AKF_HSA-SAME: () #[[ATTR5]] {
	; AKF_HSA-NEXT: store volatile i32 0, i32 addrspace(1)* null, align 4			; AKF_HSA-NEXT: store volatile i32 0, i32 addrspace(1)* null, align 4
	; AKF_HSA-NEXT: ret void			; AKF_HSA-NEXT: ret void
	;			;
	; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@func_sanitize_address			; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@func_sanitize_address
	; ATTRIBUTOR_HSA-SAME: () #[[ATTR17]] {			; ATTRIBUTOR_HSA-SAME: () #[[ATTR20:[0-9]+]] {
	; ATTRIBUTOR_HSA-NEXT: store volatile i32 0, i32 addrspace(1)* null, align 4			; ATTRIBUTOR_HSA-NEXT: store volatile i32 0, i32 addrspace(1)* null, align 4
	; ATTRIBUTOR_HSA-NEXT: ret void			; ATTRIBUTOR_HSA-NEXT: ret void
	;			;
	store volatile i32 0, i32 addrspace(1)* null			store volatile i32 0, i32 addrspace(1)* null
	ret void			ret void
	}			}

	; Implicit arguments need to be enabled for sanitizers			; Implicit arguments need to be enabled for sanitizers
	define void @func_indirect_sanitize_address() #3 {			define void @func_indirect_sanitize_address() #3 {
	; AKF_HSA-LABEL: define {{[^@]+}}@func_indirect_sanitize_address			; AKF_HSA-LABEL: define {{[^@]+}}@func_indirect_sanitize_address
	; AKF_HSA-SAME: () #[[ATTR3]] {			; AKF_HSA-SAME: () #[[ATTR3]] {
	; AKF_HSA-NEXT: call void @func_sanitize_address()			; AKF_HSA-NEXT: call void @func_sanitize_address()
	; AKF_HSA-NEXT: ret void			; AKF_HSA-NEXT: ret void
	;			;
	; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@func_indirect_sanitize_address			; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@func_indirect_sanitize_address
	; ATTRIBUTOR_HSA-SAME: () #[[ATTR18:[0-9]+]] {			; ATTRIBUTOR_HSA-SAME: () #[[ATTR21:[0-9]+]] {
	; ATTRIBUTOR_HSA-NEXT: call void @func_sanitize_address()			; ATTRIBUTOR_HSA-NEXT: call void @func_sanitize_address()
	; ATTRIBUTOR_HSA-NEXT: ret void			; ATTRIBUTOR_HSA-NEXT: ret void
	;			;
	call void @func_sanitize_address()			call void @func_sanitize_address()
	ret void			ret void
	}			}

	; Implicit arguments need to be enabled for sanitizers			; Implicit arguments need to be enabled for sanitizers
	define amdgpu_kernel void @kern_indirect_sanitize_address() #3 {			define amdgpu_kernel void @kern_indirect_sanitize_address() #3 {
	; AKF_HSA-LABEL: define {{[^@]+}}@kern_indirect_sanitize_address			; AKF_HSA-LABEL: define {{[^@]+}}@kern_indirect_sanitize_address
	; AKF_HSA-SAME: () #[[ATTR4]] {			; AKF_HSA-SAME: () #[[ATTR4]] {
	; AKF_HSA-NEXT: call void @func_sanitize_address()			; AKF_HSA-NEXT: call void @func_sanitize_address()
	; AKF_HSA-NEXT: ret void			; AKF_HSA-NEXT: ret void
	;			;
	; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@kern_indirect_sanitize_address			; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@kern_indirect_sanitize_address
	; ATTRIBUTOR_HSA-SAME: () #[[ATTR18]] {			; ATTRIBUTOR_HSA-SAME: () #[[ATTR22:[0-9]+]] {
	; ATTRIBUTOR_HSA-NEXT: call void @func_sanitize_address()			; ATTRIBUTOR_HSA-NEXT: call void @func_sanitize_address()
	; ATTRIBUTOR_HSA-NEXT: ret void			; ATTRIBUTOR_HSA-NEXT: ret void
	;			;
	call void @func_sanitize_address()			call void @func_sanitize_address()
	ret void			ret void
	}			}

	; Marked with amdgpu-no-implicitarg-ptr, and			; Marked with amdgpu-no-implicitarg-ptr, and
	; sanitize_address. sanitize_address wins and requires the pointer.			; sanitize_address. sanitize_address wins and requires the pointer.
	declare void @extern_func_sanitize_address() #5			declare void @extern_func_sanitize_address() #5

	define amdgpu_kernel void @kern_decl_sanitize_address() #3 {			define amdgpu_kernel void @kern_decl_sanitize_address() #3 {
	; AKF_HSA-LABEL: define {{[^@]+}}@kern_decl_sanitize_address			; AKF_HSA-LABEL: define {{[^@]+}}@kern_decl_sanitize_address
	; AKF_HSA-SAME: () #[[ATTR4]] {			; AKF_HSA-SAME: () #[[ATTR4]] {
	; AKF_HSA-NEXT: call void @extern_func_sanitize_address()			; AKF_HSA-NEXT: call void @extern_func_sanitize_address()
	; AKF_HSA-NEXT: ret void			; AKF_HSA-NEXT: ret void
	;			;
	; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@kern_decl_sanitize_address			; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@kern_decl_sanitize_address
	; ATTRIBUTOR_HSA-SAME: () #[[ATTR15]] {			; ATTRIBUTOR_HSA-SAME: () #[[ATTR18]] {
	; ATTRIBUTOR_HSA-NEXT: call void @extern_func_sanitize_address()			; ATTRIBUTOR_HSA-NEXT: call void @extern_func_sanitize_address()
	; ATTRIBUTOR_HSA-NEXT: ret void			; ATTRIBUTOR_HSA-NEXT: ret void
	;			;
	call void @extern_func_sanitize_address()			call void @extern_func_sanitize_address()
	ret void			ret void
	}			}

	attributes #0 = { nounwind readnone speculatable }			attributes #0 = { nounwind readnone speculatable }
	attributes #1 = { nounwind "target-cpu"="fiji" }			attributes #1 = { nounwind "target-cpu"="fiji" }
	attributes #2 = { nounwind "target-cpu"="gfx900" }			attributes #2 = { nounwind "target-cpu"="gfx900" }
	attributes #3 = { nounwind }			attributes #3 = { nounwind }
	attributes #4 = { nounwind sanitize_address }			attributes #4 = { nounwind sanitize_address }
	attributes #5 = { nounwind sanitize_address "amdgpu-no-implicitarg-ptr" }			attributes #5 = { nounwind sanitize_address "amdgpu-no-implicitarg-ptr" }

	;.			;.
	; AKF_HSA: attributes #[[ATTR0:[0-9]+]] = { nounwind readnone speculatable willreturn }			; AKF_HSA: attributes #[[ATTR0:[0-9]+]] = { nounwind readnone speculatable willreturn }
	; AKF_HSA: attributes #[[ATTR1]] = { nounwind "target-cpu"="fiji" }			; AKF_HSA: attributes #[[ATTR1]] = { nounwind "target-cpu"="fiji" }
	; AKF_HSA: attributes #[[ATTR2]] = { nounwind "target-cpu"="gfx900" }			; AKF_HSA: attributes #[[ATTR2]] = { nounwind "target-cpu"="gfx900" }
	; AKF_HSA: attributes #[[ATTR3]] = { nounwind }			; AKF_HSA: attributes #[[ATTR3]] = { nounwind }
	; AKF_HSA: attributes #[[ATTR4]] = { nounwind "amdgpu-calls" }			; AKF_HSA: attributes #[[ATTR4]] = { nounwind "amdgpu-calls" }
	; AKF_HSA: attributes #[[ATTR5]] = { nounwind sanitize_address }			; AKF_HSA: attributes #[[ATTR5]] = { nounwind sanitize_address }
	; AKF_HSA: attributes #[[ATTR6:[0-9]+]] = { nounwind sanitize_address "amdgpu-no-implicitarg-ptr" }			; AKF_HSA: attributes #[[ATTR6:[0-9]+]] = { nounwind sanitize_address "amdgpu-no-implicitarg-ptr" }
	;.			;.
	; ATTRIBUTOR_HSA: attributes #[[ATTR0:[0-9]+]] = { nounwind readnone speculatable willreturn }			; ATTRIBUTOR_HSA: attributes #[[ATTR0:[0-9]+]] = { nounwind readnone speculatable willreturn }
	; ATTRIBUTOR_HSA: attributes #[[ATTR1]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "target-cpu"="fiji" "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR1]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "target-cpu"="fiji" "uniform-work-group-size"="false" }
	; ATTRIBUTOR_HSA: attributes #[[ATTR2]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-z" "target-cpu"="fiji" "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR2]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "target-cpu"="fiji" "uniform-work-group-size"="false" }
	; ATTRIBUTOR_HSA: attributes #[[ATTR3]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "target-cpu"="fiji" "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR3]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-waves-per-eu"="4,10" "target-cpu"="fiji" "uniform-work-group-size"="false" }
	; ATTRIBUTOR_HSA: attributes #[[ATTR4]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "target-cpu"="fiji" "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR4]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "target-cpu"="fiji" "uniform-work-group-size"="false" }
	; ATTRIBUTOR_HSA: attributes #[[ATTR5]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "target-cpu"="fiji" "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR5]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "target-cpu"="fiji" "uniform-work-group-size"="false" }
	; ATTRIBUTOR_HSA: attributes #[[ATTR6]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "target-cpu"="fiji" "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR6]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "target-cpu"="fiji" "uniform-work-group-size"="false" }
	; ATTRIBUTOR_HSA: attributes #[[ATTR7]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "target-cpu"="fiji" "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR7]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "target-cpu"="fiji" "uniform-work-group-size"="false" }
	; ATTRIBUTOR_HSA: attributes #[[ATTR8]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "target-cpu"="fiji" "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR8]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "target-cpu"="fiji" "uniform-work-group-size"="false" }
	; ATTRIBUTOR_HSA: attributes #[[ATTR9]] = { nounwind "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "target-cpu"="fiji" "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR9]] = { nounwind "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "target-cpu"="fiji" "uniform-work-group-size"="false" }
	; ATTRIBUTOR_HSA: attributes #[[ATTR10]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "target-cpu"="fiji" "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR10]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "target-cpu"="fiji" "uniform-work-group-size"="false" }
	; ATTRIBUTOR_HSA: attributes #[[ATTR11]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "target-cpu"="fiji" "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR11]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "target-cpu"="fiji" "uniform-work-group-size"="false" }
	; ATTRIBUTOR_HSA: attributes #[[ATTR12]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "target-cpu"="gfx900" "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR12]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "target-cpu"="gfx900" "uniform-work-group-size"="false" }
	; ATTRIBUTOR_HSA: attributes #[[ATTR13]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "target-cpu"="gfx900" "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR13]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "target-cpu"="gfx900" "uniform-work-group-size"="false" }
	; ATTRIBUTOR_HSA: attributes #[[ATTR14]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "target-cpu"="fiji" "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR14]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "target-cpu"="fiji" "uniform-work-group-size"="false" }
	; ATTRIBUTOR_HSA: attributes #[[ATTR15]] = { nounwind "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR15]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "target-cpu"="fiji" "uniform-work-group-size"="false" }
	; ATTRIBUTOR_HSA: attributes #[[ATTR16]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR16]] = { nounwind "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
	; ATTRIBUTOR_HSA: attributes #[[ATTR17]] = { nounwind sanitize_address "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR17]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
	; ATTRIBUTOR_HSA: attributes #[[ATTR18]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR18]] = { nounwind "uniform-work-group-size"="false" }
	; ATTRIBUTOR_HSA: attributes #[[ATTR19:[0-9]+]] = { nounwind sanitize_address "amdgpu-no-implicitarg-ptr" "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR19]] = { nounwind sanitize_address "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }
	; ATTRIBUTOR_HSA: attributes #[[ATTR20]] = { nounwind }			; ATTRIBUTOR_HSA: attributes #[[ATTR20]] = { nounwind sanitize_address "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
				; ATTRIBUTOR_HSA: attributes #[[ATTR21]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
				; ATTRIBUTOR_HSA: attributes #[[ATTR22]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }
				; ATTRIBUTOR_HSA: attributes #[[ATTR23:[0-9]+]] = { nounwind sanitize_address "amdgpu-no-implicitarg-ptr" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
				; ATTRIBUTOR_HSA: attributes #[[ATTR24]] = { nounwind }
	;.			;.

llvm/test/CodeGen/AMDGPU/annotate-kernel-features-hsa.ll

	Show First 20 Lines • Show All 622 Lines • ▼ Show 20 Lines
	define void @use_alloca_func() #1 {			define void @use_alloca_func() #1 {
	; AKF_HSA-LABEL: define {{[^@]+}}@use_alloca_func			; AKF_HSA-LABEL: define {{[^@]+}}@use_alloca_func
	; AKF_HSA-SAME: () #[[ATTR2]] {			; AKF_HSA-SAME: () #[[ATTR2]] {
	; AKF_HSA-NEXT: [[ALLOCA:%.*]] = alloca i32, align 4, addrspace(5)			; AKF_HSA-NEXT: [[ALLOCA:%.*]] = alloca i32, align 4, addrspace(5)
	; AKF_HSA-NEXT: store i32 0, i32 addrspace(5)* [[ALLOCA]], align 4			; AKF_HSA-NEXT: store i32 0, i32 addrspace(5)* [[ALLOCA]], align 4
	; AKF_HSA-NEXT: ret void			; AKF_HSA-NEXT: ret void
	;			;
	; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@use_alloca_func			; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@use_alloca_func
	; ATTRIBUTOR_HSA-SAME: () #[[ATTR1]] {			; ATTRIBUTOR_HSA-SAME: () #[[ATTR12:[0-9]+]] {
	; ATTRIBUTOR_HSA-NEXT: [[ALLOCA:%.*]] = alloca i32, align 4, addrspace(5)			; ATTRIBUTOR_HSA-NEXT: [[ALLOCA:%.*]] = alloca i32, align 4, addrspace(5)
	; ATTRIBUTOR_HSA-NEXT: store i32 0, i32 addrspace(5)* [[ALLOCA]], align 4			; ATTRIBUTOR_HSA-NEXT: store i32 0, i32 addrspace(5)* [[ALLOCA]], align 4
	; ATTRIBUTOR_HSA-NEXT: ret void			; ATTRIBUTOR_HSA-NEXT: ret void
	;			;
	%alloca = alloca i32, addrspace(5)			%alloca = alloca i32, addrspace(5)
	store i32 0, i32 addrspace(5)* %alloca			store i32 0, i32 addrspace(5)* %alloca
	ret void			ret void
	}			}
	Show All 13 Lines
	; ATTRIBUTOR_HSA: attributes #[[ATTR4]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR4]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }
	; ATTRIBUTOR_HSA: attributes #[[ATTR5]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR5]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }
	; ATTRIBUTOR_HSA: attributes #[[ATTR6]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR6]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "uniform-work-group-size"="false" }
	; ATTRIBUTOR_HSA: attributes #[[ATTR7]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR7]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }
	; ATTRIBUTOR_HSA: attributes #[[ATTR8]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR8]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "uniform-work-group-size"="false" }
	; ATTRIBUTOR_HSA: attributes #[[ATTR9]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workitem-id-x" "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR9]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workitem-id-x" "uniform-work-group-size"="false" }
	; ATTRIBUTOR_HSA: attributes #[[ATTR10]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR10]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }
	; ATTRIBUTOR_HSA: attributes #[[ATTR11]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR11]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }
				; ATTRIBUTOR_HSA: attributes #[[ATTR12]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
	;.			;.

llvm/test/CodeGen/AMDGPU/direct-indirect-call.ll

	Show All 29 Lines
	; CHECK-SAME: () #[[ATTR1]] {			; CHECK-SAME: () #[[ATTR1]] {
	; CHECK-NEXT: call void @direct()			; CHECK-NEXT: call void @direct()
	; CHECK-NEXT: ret void			; CHECK-NEXT: ret void
	;			;
	call void @direct()			call void @direct()
	ret void			ret void
	}			}
	;.			;.
	; CHECK: attributes #[[ATTR0]] = { "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }			; CHECK: attributes #[[ATTR0]] = { "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
	; CHECK: attributes #[[ATTR1]] = { "uniform-work-group-size"="false" }			; CHECK: attributes #[[ATTR1]] = { "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
	;.			;.

llvm/test/CodeGen/AMDGPU/duplicate-attribute-indirect.ll

Show All 36 Lines	;
ret void		ret void
}		}

attributes #0 = { "amdgpu-no-dispatch-id" }		attributes #0 = { "amdgpu-no-dispatch-id" }

;.		;.
; AKF_GCN: attributes #[[ATTR0]] = { "amdgpu-calls" "amdgpu-no-dispatch-id" "amdgpu-stack-objects" }		; AKF_GCN: attributes #[[ATTR0]] = { "amdgpu-calls" "amdgpu-no-dispatch-id" "amdgpu-stack-objects" }
;.		;.
; ATTRIBUTOR_GCN: attributes #[[ATTR0]] = { "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }		; ATTRIBUTOR_GCN: attributes #[[ATTR0]] = { "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
; ATTRIBUTOR_GCN: attributes #[[ATTR1]] = { "amdgpu-no-dispatch-id" "uniform-work-group-size"="false" }		; ATTRIBUTOR_GCN: attributes #[[ATTR1]] = { "amdgpu-no-dispatch-id" "uniform-work-group-size"="false" }
;.		;.

llvm/test/CodeGen/AMDGPU/propagate-flat-work-group-size.ll

	Show First 20 Lines • Show All 198 Lines • ▼ Show 20 Lines
	attributes #3 = { "amdgpu-flat-work-group-size"="128,256" }			attributes #3 = { "amdgpu-flat-work-group-size"="128,256" }
	attributes #4 = { "amdgpu-flat-work-group-size"="512,1024" }			attributes #4 = { "amdgpu-flat-work-group-size"="512,1024" }
	attributes #5 = { "amdgpu-flat-work-group-size"="128,512" }			attributes #5 = { "amdgpu-flat-work-group-size"="128,512" }
	attributes #6 = { "amdgpu-flat-work-group-size"="512,512" }			attributes #6 = { "amdgpu-flat-work-group-size"="512,512" }
	attributes #7 = { "amdgpu-flat-work-group-size"="64,256" }			attributes #7 = { "amdgpu-flat-work-group-size"="64,256" }
	;.			;.
	; CHECK: attributes #[[ATTR0]] = { "amdgpu-flat-work-group-size"="1,256" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }			; CHECK: attributes #[[ATTR0]] = { "amdgpu-flat-work-group-size"="1,256" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }
	; CHECK: attributes #[[ATTR1]] = { "amdgpu-flat-work-group-size"="64,128" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }			; CHECK: attributes #[[ATTR1]] = { "amdgpu-flat-work-group-size"="64,128" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }
	; CHECK: attributes #[[ATTR2]] = { "amdgpu-flat-work-group-size"="128,512" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }			; CHECK: attributes #[[ATTR2]] = { "amdgpu-flat-work-group-size"="128,512" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="2,10" "uniform-work-group-size"="false" }
	; CHECK: attributes #[[ATTR3]] = { "amdgpu-flat-work-group-size"="64,64" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }			; CHECK: attributes #[[ATTR3]] = { "amdgpu-flat-work-group-size"="64,64" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }
	; CHECK: attributes #[[ATTR4]] = { "amdgpu-flat-work-group-size"="128,128" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }			; CHECK: attributes #[[ATTR4]] = { "amdgpu-flat-work-group-size"="128,128" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }
	; CHECK: attributes #[[ATTR5]] = { "amdgpu-flat-work-group-size"="512,512" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }			; CHECK: attributes #[[ATTR5]] = { "amdgpu-flat-work-group-size"="512,512" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="2,10" "uniform-work-group-size"="false" }
	; CHECK: attributes #[[ATTR6]] = { "amdgpu-flat-work-group-size"="64,256" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }			; CHECK: attributes #[[ATTR6]] = { "amdgpu-flat-work-group-size"="64,256" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }
	; CHECK: attributes #[[ATTR7]] = { "amdgpu-flat-work-group-size"="128,256" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }			; CHECK: attributes #[[ATTR7]] = { "amdgpu-flat-work-group-size"="128,256" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }
	; CHECK: attributes #[[ATTR8]] = { "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }			; CHECK: attributes #[[ATTR8]] = { "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
	;.			;.

llvm/test/CodeGen/AMDGPU/propagate-waves-per-eu.ll

This file was added.

				; NOTE: Assertions have been autogenerated by utils/update_test_checks.py UTC_ARGS: --function-signature --check-globals
				; RUN: opt -S -mtriple=amdgcn-amd-amdhsa -amdgpu-attributor %s \| FileCheck %s

				; Check propagation of amdgpu-flat-work-group-size attribute.

				; Called from a single kernel with 1,8
				define internal void @default_to_1_8_a() {
				; CHECK-LABEL: define {{[^@]+}}@default_to_1_8_a
				; CHECK-SAME: () #[[ATTR0:[0-9]+]] {
				; CHECK-NEXT: ret void
				;
				ret void
				}

				define amdgpu_kernel void @kernel_1_8() #0 {
				; CHECK-LABEL: define {{[^@]+}}@kernel_1_8
				; CHECK-SAME: () #[[ATTR0]] {
				; CHECK-NEXT: call void @default_to_1_8_a()
				; CHECK-NEXT: ret void
				;
				call void @default_to_1_8_a()
				ret void
				}

				; Called from a single kernel with 1,2
				define internal void @default_to_1_2() {
				; CHECK-LABEL: define {{[^@]+}}@default_to_1_2
				; CHECK-SAME: () #[[ATTR1:[0-9]+]] {
				; CHECK-NEXT: ret void
				;
				ret void
				}

				define amdgpu_kernel void @kernel_1_2() #1 {
				; CHECK-LABEL: define {{[^@]+}}@kernel_1_2
				; CHECK-SAME: () #[[ATTR1]] {
				; CHECK-NEXT: call void @default_to_1_2()
				; CHECK-NEXT: call void @flat_group_1_1()
				; CHECK-NEXT: call void @default_to_1_8_b()
				; CHECK-NEXT: call void @flat_group_2_8()
				; CHECK-NEXT: ret void
				;
				call void @default_to_1_2()
				call void @flat_group_1_1()
				call void @default_to_1_8_b()
				call void @flat_group_2_8()
				ret void
				}

				; Called from kernels with 2,9 and 9,9
				define internal void @default_to_2_9() {
				; CHECK-LABEL: define {{[^@]+}}@default_to_2_9
				; CHECK-SAME: () #[[ATTR2:[0-9]+]] {
				; CHECK-NEXT: ret void
				;
				ret void
				}

				; This already has a strict bounds, but called from kernels with wider
				; bounds, and should not be changed.
				define internal void @flat_group_1_1() #2 {
				; CHECK-LABEL: define {{[^@]+}}@flat_group_1_1
				; CHECK-SAME: () #[[ATTR3:[0-9]+]] {
				; CHECK-NEXT: ret void
				;
				ret void
				}

				; 2,8 -> 2,2
				define internal void @flat_group_2_8() #3 {
				; CHECK-LABEL: define {{[^@]+}}@flat_group_2_8
				; CHECK-SAME: () #[[ATTR4:[0-9]+]] {
				; CHECK-NEXT: ret void
				;
				ret void
				}

				; 9,10 -> 9,9
				define internal void @flat_group_9_10() #4 {
				; CHECK-LABEL: define {{[^@]+}}@flat_group_9_10
				; CHECK-SAME: () #[[ATTR5:[0-9]+]] {
				; CHECK-NEXT: ret void
				;
				ret void
				}

				define amdgpu_kernel void @kernel_2_9() #5 {
				; CHECK-LABEL: define {{[^@]+}}@kernel_2_9
				; CHECK-SAME: () #[[ATTR2]] {
				; CHECK-NEXT: call void @default_to_2_9()
				; CHECK-NEXT: call void @flat_group_1_1()
				; CHECK-NEXT: ret void
				;
				call void @default_to_2_9()
				call void @flat_group_1_1()
				ret void
				}

				define amdgpu_kernel void @kernel_9_9() #6 {
				; CHECK-LABEL: define {{[^@]+}}@kernel_9_9
				; CHECK-SAME: () #[[ATTR5]] {
				; CHECK-NEXT: call void @default_to_2_9()
				; CHECK-NEXT: call void @flat_group_9_10()
				; CHECK-NEXT: ret void
				;
				call void @default_to_2_9()
				call void @flat_group_9_10()
				ret void
				}

				; Called from kernels with 2,8 and 1,2 => 1,8
				define internal void @default_to_1_8_b() {
				; CHECK-LABEL: define {{[^@]+}}@default_to_1_8_b
				; CHECK-SAME: () #[[ATTR0]] {
				; CHECK-NEXT: ret void
				;
				ret void
				}

				; The kernel's lower bound is higher than the callee's lower bound, so
				; this should probably be illegal.
				define amdgpu_kernel void @kernel_2_8() #3 {
				; CHECK-LABEL: define {{[^@]+}}@kernel_2_8
				; CHECK-SAME: () #[[ATTR6:[0-9]+]] {
				; CHECK-NEXT: call void @default_to_1_8_a()
				; CHECK-NEXT: call void @default_to_1_8_b()
				; CHECK-NEXT: ret void
				;
				call void @default_to_1_8_a()
				call void @default_to_1_8_b()
				ret void
				}

				; 1,2 -> 1,2
				define internal void @merge_cycle_0() #1 {
				; CHECK-LABEL: define {{[^@]+}}@merge_cycle_0
				; CHECK-SAME: () #[[ATTR4]] {
				; CHECK-NEXT: call void @merge_cycle_1()
				; CHECK-NEXT: ret void
				;
				call void @merge_cycle_1()
				ret void
				}

				; Called from 1,2 + 3,8
				; 2,8 -> 2,8
				define internal void @merge_cycle_1() #3 {
				; CHECK-LABEL: define {{[^@]+}}@merge_cycle_1
				; CHECK-SAME: () #[[ATTR6]] {
				; CHECK-NEXT: call void @merge_cycle_0()
				; CHECK-NEXT: ret void
				;
				call void @merge_cycle_0()
				ret void
				}

				define amdgpu_kernel void @kernel_3_8() #7 {
				; CHECK-LABEL: define {{[^@]+}}@kernel_3_8
				; CHECK-SAME: () #[[ATTR7:[0-9]+]] {
				; CHECK-NEXT: call void @merge_cycle_0()
				; CHECK-NEXT: call void @default_captured_address()
				; CHECK-NEXT: call void @externally_visible_default()
				; CHECK-NEXT: [[F32:%.]] = call float bitcast (i32 () @bitcasted_function to float ()*)()
				; CHECK-NEXT: ret void
				;
				call void @merge_cycle_0()
				call void @default_captured_address()
				call void @externally_visible_default()
				%f32 = call float bitcast (i32 ()* @bitcasted_function to float ()*)()
				ret void
				}

				define internal void @default_captured_address() {
				; CHECK-LABEL: define {{[^@]+}}@default_captured_address
				; CHECK-SAME: () #[[ATTR8:[0-9]+]] {
				; CHECK-NEXT: store volatile void ()* @default_captured_address, void ()** undef, align 8
				; CHECK-NEXT: ret void
				;
				store volatile void ()* @default_captured_address, void ()** undef, align 8
				ret void
				}

				define void @externally_visible_default() {
				; CHECK-LABEL: define {{[^@]+}}@externally_visible_default
				; CHECK-SAME: () #[[ATTR8]] {
				; CHECK-NEXT: ret void
				;
				ret void
				}

				; 1,10 -> 3,8
				define internal i32 @bitcasted_function() {
				; CHECK-LABEL: define {{[^@]+}}@bitcasted_function
				; CHECK-SAME: () #[[ATTR7]] {
				; CHECK-NEXT: ret i32 0
				;
				ret i32 0
				}

				define internal void @called_from_invalid_bounds_0() {
				; CHECK-LABEL: define {{[^@]+}}@called_from_invalid_bounds_0
				; CHECK-SAME: () #[[ATTR9:[0-9]+]] {
				; CHECK-NEXT: ret void
				;
				ret void
				}

				define internal void @called_from_invalid_bounds_1() {
				; CHECK-LABEL: define {{[^@]+}}@called_from_invalid_bounds_1
				; CHECK-SAME: () #[[ATTR9]] {
				; CHECK-NEXT: ret void
				;
				ret void
				}

				; Invalid range for amdgpu-waves-per-eu
				define amdgpu_kernel void @kernel_invalid_bounds_0_8() #8 {
				; CHECK-LABEL: define {{[^@]+}}@kernel_invalid_bounds_0_8
				; CHECK-SAME: () #[[ATTR10:[0-9]+]] {
				; CHECK-NEXT: call void @called_from_invalid_bounds_0()
				; CHECK-NEXT: ret void
				;
				call void @called_from_invalid_bounds_0()
				ret void
				}

				; Invalid range for amdgpu-waves-per-eu
				define amdgpu_kernel void @kernel_invalid_bounds_1_123() #9 {
				; CHECK-LABEL: define {{[^@]+}}@kernel_invalid_bounds_1_123
				; CHECK-SAME: () #[[ATTR11:[0-9]+]] {
				; CHECK-NEXT: call void @called_from_invalid_bounds_1()
				; CHECK-NEXT: ret void
				;
				call void @called_from_invalid_bounds_1()
				ret void
				}

				; XXX - Why is the maximum not 6?
				; The 512 maximum workgroup size implies a minimum occupancy of 2. The
				; implied minimim waves-per-eu should not be 3
				define void @larger_group_size_implies_lower_minimum() #10 {
				; CHECK-LABEL: define {{[^@]+}}@larger_group_size_implies_lower_minimum
				; CHECK-SAME: () #[[ATTR12:[0-9]+]] {
				; CHECK-NEXT: ret void
				;
				ret void
				}

				define amdgpu_kernel void @kernel_3_6() #11 {
				; CHECK-LABEL: define {{[^@]+}}@kernel_3_6
				; CHECK-SAME: () #[[ATTR13:[0-9]+]] {
				; CHECK-NEXT: call void @larger_group_size_implies_lower_minimum()
				; CHECK-NEXT: ret void
				;
				call void @larger_group_size_implies_lower_minimum()
				ret void
				}

				; Use a 1 wave workgroup so there is no interaction by the workgroup
				; size on the implied waves per EU.
				attributes #0 = { "amdgpu-flat-work-group-size"="1,64" "amdgpu-waves-per-eu"="1,8" }
				attributes #1 = { "amdgpu-flat-work-group-size"="1,64" "amdgpu-waves-per-eu"="1,2" }
				attributes #2 = { "amdgpu-flat-work-group-size"="1,64" "amdgpu-waves-per-eu"="1,1" }
				attributes #3 = { "amdgpu-flat-work-group-size"="1,64" "amdgpu-waves-per-eu"="2,8" }
				attributes #4 = { "amdgpu-flat-work-group-size"="1,64" "amdgpu-waves-per-eu"="9,10" }
				attributes #5 = { "amdgpu-flat-work-group-size"="1,64" "amdgpu-waves-per-eu"="2,9" }
				attributes #6 = { "amdgpu-flat-work-group-size"="1,64" "amdgpu-waves-per-eu"="9,9" }
				attributes #7 = { "amdgpu-flat-work-group-size"="1,64" "amdgpu-waves-per-eu"="3,8" }
				attributes #8 = { "amdgpu-flat-work-group-size"="1,64" "amdgpu-waves-per-eu"="0,8" }
				attributes #9 = { "amdgpu-flat-work-group-size"="1,64" "amdgpu-waves-per-eu"="1,123" }
				attributes #10 = { "amdgpu-flat-work-group-size"="1,512" }
				attributes #11 = { "amdgpu-flat-work-group-size"="1,512" "amdgpu-waves-per-eu"="3,6" }

				;.
				; CHECK: attributes #[[ATTR0]] = { "amdgpu-flat-work-group-size"="1,64" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="1,8" "uniform-work-group-size"="false" }
				; CHECK: attributes #[[ATTR1]] = { "amdgpu-flat-work-group-size"="1,64" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="1,2" "uniform-work-group-size"="false" }
				; CHECK: attributes #[[ATTR2]] = { "amdgpu-flat-work-group-size"="1,64" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="2,9" "uniform-work-group-size"="false" }
				; CHECK: attributes #[[ATTR3]] = { "amdgpu-flat-work-group-size"="1,64" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="1,1" "uniform-work-group-size"="false" }
				; CHECK: attributes #[[ATTR4]] = { "amdgpu-flat-work-group-size"="1,64" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="2,2" "uniform-work-group-size"="false" }
				; CHECK: attributes #[[ATTR5]] = { "amdgpu-flat-work-group-size"="1,64" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="9,9" "uniform-work-group-size"="false" }
				; CHECK: attributes #[[ATTR6]] = { "amdgpu-flat-work-group-size"="1,64" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="2,8" "uniform-work-group-size"="false" }
				; CHECK: attributes #[[ATTR7]] = { "amdgpu-flat-work-group-size"="1,64" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="3,8" "uniform-work-group-size"="false" }
				; CHECK: attributes #[[ATTR8]] = { "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
				; CHECK: attributes #[[ATTR9]] = { "amdgpu-flat-work-group-size"="1,64" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }
				; CHECK: attributes #[[ATTR10]] = { "amdgpu-flat-work-group-size"="1,64" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="0,8" "uniform-work-group-size"="false" }
				; CHECK: attributes #[[ATTR11]] = { "amdgpu-flat-work-group-size"="1,64" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="1,123" "uniform-work-group-size"="false" }
				; CHECK: attributes #[[ATTR12]] = { "amdgpu-flat-work-group-size"="1,512" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="2,10" "uniform-work-group-size"="false" }
				; CHECK: attributes #[[ATTR13]] = { "amdgpu-flat-work-group-size"="1,512" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="3,6" "uniform-work-group-size"="false" }
				;.

llvm/test/CodeGen/AMDGPU/simple-indirect-call.ll

Show First 20 Lines • Show All 67 Lines • ▼ Show 20 Lines	; GFX9-NEXT: s_endpgm
%fp = load void(), void()* %fptr.cast		%fp = load void(), void()* %fptr.cast
call void %fp()		call void %fp()
ret void		ret void
}		}

;.		;.
; AKF_GCN: attributes #[[ATTR0]] = { "amdgpu-calls" "amdgpu-stack-objects" }		; AKF_GCN: attributes #[[ATTR0]] = { "amdgpu-calls" "amdgpu-stack-objects" }
;.		;.
; ATTRIBUTOR_GCN: attributes #[[ATTR0]] = { "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }		; ATTRIBUTOR_GCN: attributes #[[ATTR0]] = { "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
; ATTRIBUTOR_GCN: attributes #[[ATTR1]] = { "uniform-work-group-size"="false" }		; ATTRIBUTOR_GCN: attributes #[[ATTR1]] = { "uniform-work-group-size"="false" }
;.		;.

llvm/test/CodeGen/AMDGPU/uniform-work-group-attribute-missing.ll

	Show All 15 Lines
	; CHECK-NEXT: ret void			; CHECK-NEXT: ret void
	;			;
	store i32 0, i32* @x			store i32 0, i32* @x
	ret void			ret void
	}			}

	define amdgpu_kernel void @kernel1() #1 {			define amdgpu_kernel void @kernel1() #1 {
	; CHECK-LABEL: define {{[^@]+}}@kernel1			; CHECK-LABEL: define {{[^@]+}}@kernel1
	; CHECK-SAME: () #[[ATTR0]] {			; CHECK-SAME: () #[[ATTR1:[0-9]+]] {
	; CHECK-NEXT: call void @foo()			; CHECK-NEXT: call void @foo()
	; CHECK-NEXT: ret void			; CHECK-NEXT: ret void
	;			;
	call void @foo()			call void @foo()
	ret void			ret void
	}			}

	attributes #0 = { "uniform-work-group-size"="true" }			attributes #0 = { "uniform-work-group-size"="true" }
	;.			;.
	; CHECK: attributes #[[ATTR0]] = { "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }			; CHECK: attributes #[[ATTR0]] = { "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
				; CHECK: attributes #[[ATTR1]] = { "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }
	;.			;.

llvm/test/CodeGen/AMDGPU/uniform-work-group-multistep.ll

Show All 37 Lines	;
call void @weak()		call void @weak()
ret void		ret void
}		}

@G2 = global i32 0		@G2 = global i32 0

define internal void @internal3() {		define internal void @internal3() {
; CHECK-LABEL: define {{[^@]+}}@internal3		; CHECK-LABEL: define {{[^@]+}}@internal3
; CHECK-SAME: () #[[ATTR1]] {		; CHECK-SAME: () #[[ATTR2:[0-9]+]] {
; CHECK-NEXT: [[TMP1:%.]] = load i32, i32 @G2, align 4		; CHECK-NEXT: [[TMP1:%.]] = load i32, i32 @G2, align 4
; CHECK-NEXT: [[TMP2:%.*]] = icmp eq i32 [[TMP1]], 0		; CHECK-NEXT: [[TMP2:%.*]] = icmp eq i32 [[TMP1]], 0
; CHECK-NEXT: br i1 [[TMP2]], label [[TMP3:%.]], label [[TMP4:%.]]		; CHECK-NEXT: br i1 [[TMP2]], label [[TMP3:%.]], label [[TMP4:%.]]
; CHECK: 3:		; CHECK: 3:
; CHECK-NEXT: call void @internal4()		; CHECK-NEXT: call void @internal4()
; CHECK-NEXT: call void @internal3()		; CHECK-NEXT: call void @internal3()
; CHECK-NEXT: br label [[TMP4]]		; CHECK-NEXT: br label [[TMP4]]
; CHECK: 4:		; CHECK: 4:
; CHECK-NEXT: ret void		; CHECK-NEXT: ret void
;		;
%1 = load i32, i32* @G2, align 4		%1 = load i32, i32* @G2, align 4
%2 = icmp eq i32 %1, 0		%2 = icmp eq i32 %1, 0
br i1 %2, label %3, label %4		br i1 %2, label %3, label %4
3:		3:
call void @internal4()		call void @internal4()
call void @internal3()		call void @internal3()
br label %4		br label %4
4:		4:
ret void		ret void
}		}

define internal void @internal4() {		define internal void @internal4() {
; CHECK-LABEL: define {{[^@]+}}@internal4		; CHECK-LABEL: define {{[^@]+}}@internal4
; CHECK-SAME: () #[[ATTR1]] {		; CHECK-SAME: () #[[ATTR2]] {
; CHECK-NEXT: store i32 1, i32* @G2, align 4		; CHECK-NEXT: store i32 1, i32* @G2, align 4
; CHECK-NEXT: ret void		; CHECK-NEXT: ret void
;		;
store i32 1, i32* @G2, align 4		store i32 1, i32* @G2, align 4
ret void		ret void
}		}

define internal void @internal2() {		define internal void @internal2() {
; CHECK-LABEL: define {{[^@]+}}@internal2		; CHECK-LABEL: define {{[^@]+}}@internal2
; CHECK-SAME: () #[[ATTR1]] {		; CHECK-SAME: () #[[ATTR2]] {
; CHECK-NEXT: call void @internal3()		; CHECK-NEXT: call void @internal3()
; CHECK-NEXT: ret void		; CHECK-NEXT: ret void
;		;
call void @internal3()		call void @internal3()
ret void		ret void
}		}

define amdgpu_kernel void @kernel2() #0 {		define amdgpu_kernel void @kernel2() #0 {
; CHECK-LABEL: define {{[^@]+}}@kernel2		; CHECK-LABEL: define {{[^@]+}}@kernel2
; CHECK-SAME: () #[[ATTR1]] {		; CHECK-SAME: () #[[ATTR2]] {
; CHECK-NEXT: call void @internal2()		; CHECK-NEXT: call void @internal2()
; CHECK-NEXT: ret void		; CHECK-NEXT: ret void
;		;
call void @internal2()		call void @internal2()
ret void		ret void
}		}

attributes #0 = { "uniform-work-group-size"="true" }		attributes #0 = { "uniform-work-group-size"="true" }
;.		;.
; CHECK: attributes #[[ATTR0]] = { "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }		; CHECK: attributes #[[ATTR0]] = { "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
; CHECK: attributes #[[ATTR1]] = { "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="true" }		; CHECK: attributes #[[ATTR1]] = { "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="true" }
		; CHECK: attributes #[[ATTR2]] = { "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="true" }
;.		;.

llvm/test/CodeGen/AMDGPU/uniform-work-group-nested-function-calls.ll

	Show All 35 Lines
	; CHECK-NEXT: ret void			; CHECK-NEXT: ret void
	;			;
	call void @func2()			call void @func2()
	ret void			ret void
	}			}

	attributes #2 = { "uniform-work-group-size"="true" }			attributes #2 = { "uniform-work-group-size"="true" }
	;.			;.
	; CHECK: attributes #[[ATTR0]] = { "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }			; CHECK: attributes #[[ATTR0]] = { "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
	; CHECK: attributes #[[ATTR1]] = { "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="true" }			; CHECK: attributes #[[ATTR1]] = { "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="true" }
	;.			;.

llvm/test/CodeGen/AMDGPU/uniform-work-group-prevent-attribute-propagation.ll

	Show All 25 Lines
	; CHECK-NEXT: ret void			; CHECK-NEXT: ret void
	;			;
	call void @func()			call void @func()
	ret void			ret void
	}			}

	define amdgpu_kernel void @kernel2() #2 {			define amdgpu_kernel void @kernel2() #2 {
	; CHECK-LABEL: define {{[^@]+}}@kernel2			; CHECK-LABEL: define {{[^@]+}}@kernel2
	; CHECK-SAME: () #[[ATTR0]] {			; CHECK-SAME: () #[[ATTR2:[0-9]+]] {
	; CHECK-NEXT: call void @func()			; CHECK-NEXT: call void @func()
	; CHECK-NEXT: ret void			; CHECK-NEXT: ret void
	;			;
	call void @func()			call void @func()
	ret void			ret void
	}			}

	attributes #1 = { "uniform-work-group-size"="true" }			attributes #1 = { "uniform-work-group-size"="true" }
	;.			;.
	; CHECK: attributes #[[ATTR0]] = { "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }			; CHECK: attributes #[[ATTR0]] = { "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
	; CHECK: attributes #[[ATTR1]] = { "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="true" }			; CHECK: attributes #[[ATTR1]] = { "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="true" }
				; CHECK: attributes #[[ATTR2]] = { "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }
	;.			;.

llvm/test/CodeGen/AMDGPU/uniform-work-group-recursion-test.ll

Show First 20 Lines • Show All 95 Lines • ▼ Show 20 Lines	;
store i32 %r2, i32 addrspace(1)* %m		store i32 %r2, i32 addrspace(1)* %m
ret void		ret void
}		}

; nounwind and readnone are added to match attributor results.		; nounwind and readnone are added to match attributor results.
attributes #0 = { nounwind readnone }		attributes #0 = { nounwind readnone }
attributes #1 = { "uniform-work-group-size"="true" }		attributes #1 = { "uniform-work-group-size"="true" }
;.		;.
; CHECK: attributes #[[ATTR0]] = { nounwind readnone "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }		; CHECK: attributes #[[ATTR0]] = { nounwind readnone "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
; CHECK: attributes #[[ATTR1]] = { nounwind readnone "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="true" }		; CHECK: attributes #[[ATTR1]] = { nounwind readnone "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="true" }
; CHECK: attributes #[[ATTR2]] = { "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="true" }		; CHECK: attributes #[[ATTR2]] = { "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="true" }
;.		;.

llvm/test/CodeGen/AMDGPU/uniform-work-group-test.ll

	Show First 20 Lines • Show All 43 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: ret void			; CHECK-NEXT: ret void
	;			;
	call void @func1()			call void @func1()
	ret void			ret void
	}			}

	define amdgpu_kernel void @kernel3() #0 {			define amdgpu_kernel void @kernel3() #0 {
	; CHECK-LABEL: define {{[^@]+}}@kernel3			; CHECK-LABEL: define {{[^@]+}}@kernel3
	; CHECK-SAME: () #[[ATTR0]] {			; CHECK-SAME: () #[[ATTR1:[0-9]+]] {
	; CHECK-NEXT: call void @func2()			; CHECK-NEXT: call void @func2()
	; CHECK-NEXT: call void @func3()			; CHECK-NEXT: call void @func3()
	; CHECK-NEXT: ret void			; CHECK-NEXT: ret void
	;			;
	call void @func2()			call void @func2()
	call void @func3()			call void @func3()
	ret void			ret void
	}			}

	attributes #0 = { "uniform-work-group-size"="false" }			attributes #0 = { "uniform-work-group-size"="false" }
	;.			;.
	; CHECK: attributes #[[ATTR0]] = { "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }			; CHECK: attributes #[[ATTR0]] = { "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
				; CHECK: attributes #[[ATTR1]] = { "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }
	;.			;.

This is an archive of the discontinued LLVM Phabricator instance.

AMDGPU: Propagate amdgpu-waves-per-eu with attributorClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 393613

llvm/lib/Target/AMDGPU/AMDGPUAttributor.cpp

llvm/lib/Target/AMDGPU/AMDGPUSubtarget.h

llvm/lib/Target/AMDGPU/AMDGPUSubtarget.cpp

llvm/lib/Target/AMDGPU/GCNSubtarget.h

llvm/test/CodeGen/AMDGPU/addrspacecast-constantexpr.ll

llvm/test/CodeGen/AMDGPU/annotate-existing-abi-attributes.ll

llvm/test/CodeGen/AMDGPU/annotate-kernel-features-hsa-call.ll

llvm/test/CodeGen/AMDGPU/annotate-kernel-features-hsa.ll

llvm/test/CodeGen/AMDGPU/direct-indirect-call.ll

llvm/test/CodeGen/AMDGPU/duplicate-attribute-indirect.ll

llvm/test/CodeGen/AMDGPU/propagate-flat-work-group-size.ll

llvm/test/CodeGen/AMDGPU/propagate-waves-per-eu.ll

llvm/test/CodeGen/AMDGPU/simple-indirect-call.ll

llvm/test/CodeGen/AMDGPU/uniform-work-group-attribute-missing.ll

llvm/test/CodeGen/AMDGPU/uniform-work-group-multistep.ll

llvm/test/CodeGen/AMDGPU/uniform-work-group-nested-function-calls.ll

llvm/test/CodeGen/AMDGPU/uniform-work-group-prevent-attribute-propagation.ll

llvm/test/CodeGen/AMDGPU/uniform-work-group-recursion-test.ll

llvm/test/CodeGen/AMDGPU/uniform-work-group-test.ll

AMDGPU: Propagate amdgpu-waves-per-eu with attributor
ClosedPublic