This is an archive of the discontinued LLVM Phabricator instance.

Paths

Table of Contentst

-
llvm/
-
lib/Target/AMDGPU/
-
Target/
-
AMDGPU/
7/13
AMDGPUAttributor.cpp
-
AMDGPUSubtarget.h
-
AMDGPUSubtarget.cpp
-
test/CodeGen/AMDGPU/
-
CodeGen/
-
AMDGPU/
-
addrspacecast-constantexpr.ll
-
annotate-existing-abi-attributes.ll
-
annotate-kernel-features-hsa-call.ll
-
annotate-kernel-features-hsa.ll
-
attributor-loop-issue-58639.ll
-
direct-indirect-call.ll
-
duplicate-attribute-indirect.ll
-
implicitarg-offset-attributes.ll
-
propagate-flat-work-group-size.ll
-
propagate-waves-per-eu.ll
-
simple-indirect-call.ll
-
uniform-work-group-attribute-missing.ll
-
uniform-work-group-multistep.ll
-
uniform-work-group-nested-function-calls.ll
-
uniform-work-group-prevent-attribute-propagation.ll
-
uniform-work-group-propagate-attribute.ll
-
uniform-work-group-recursion-test.ll
-
uniform-work-group-test.ll

Differential D115559

AMDGPU: Propagate amdgpu-waves-per-eu with attributor
ClosedPublic

Authored by arsenm on Dec 10 2021, 3:46 PM.

Download Raw Diff

Details

Reviewers

rampitec
jdoerfert
kzhuravl
t-tye
yaxunl
uenoku
sstefan1
baziotis
nhaehnle

Summary

This will do a value range merging down the callgraph, unlike the
current pass which can only propagate values to undecorated functions
from a kernel.

This one is a bit weird due to the interaction with the implied range
from amdgpu-flat-workgroup-size. At the default group range of 1,1024,
the minimum implied bounds is 4 so this ends up introducing the
attribute on undecorated functions. We could probably simplify this by
ignoring it and propagating the raw values. The subtarget interaction
and the interaction with amdgpu-flat-workgroup-size only really clamp
invalid values (plus the lower bound doesn't seem to do anything as
far as I can tell anyway).

Diff Detail

Event Timeline

arsenm created this revision.Dec 10 2021, 3:46 PM

Herald added a reviewer: uenoku. · View Herald TranscriptDec 10 2021, 3:46 PM

Herald added subscribers: foad, okura, kuter and 7 others. · View Herald Transcript

arsenm requested review of this revision.Dec 10 2021, 3:46 PM

Herald added a reviewer: sstefan1. · View Herald TranscriptDec 10 2021, 3:46 PM

Herald added a reviewer: baziotis. · View Herald Transcript

Herald added a project: Restricted Project. · View Herald Transcript

Herald added a subscriber: wdng. · View Herald Transcript

arsenm added a child revision: D115562: AMDGPU: Remove amdgpu-waves-per-eu support in old attribute pass.Dec 10 2021, 4:19 PM

Harbormaster completed remote builds in B138751: Diff 393613.Dec 10 2021, 4:23 PM

I don't understand all the update logic but from an Attributor standpoint there are only two things that should be addressed.

llvm/lib/Target/AMDGPU/AMDGPUAttributor.cpp
833	Somewhat surprising you intersect the known range with an assumed result, if that is on purpose probably worth a comment explaining why this is reasonable.
867	It is important to return "CHANGED" here.

Return indicatePessimisticFixpoint result

llvm/lib/Target/AMDGPU/AMDGPUAttributor.cpp
833	I'm confused by your surprise. This is the initialize, so the assumed state doesn't mean anything? All the other IntegerRangeState attributes start out with intersectKnown in initialize()

Harbormaster completed remote builds in B139656: Diff 394857.Dec 16 2021, 6:59 AM

jdoerfert added inline comments.Dec 23 2021, 9:00 AM

llvm/lib/Target/AMDGPU/AMDGPUAttributor.cpp
833	So, at this point you move something assumed by another AA into something known by this. However, we don't know the other AAs assumed state is valid yet. Only after the fixpoint is reached it is known to hold. So what other AAs do (I hope) is use IR information to setup the known state. Here we might end up assuming the best for the FlatWorkGroupSize (line 674) then making it to something known in 683, before the values are tightened during the fixpoint iteration causing the known set to be not actually valid anymore. Generally, assumed information should only flow into known information if a fixpoint is reached (at which point the assumed information becomes the known one anyway). Before that, assumed should flow into assumed only and known can flow in either. Does that make some sense?

arsenm mentioned this in D138443: [AMDGPU] Fix GCNSubtarget::getMinNumVGPRs, add unit test to check consistency between GCNSubtarget's getMinNumVGPRs, getMaxNumVGPRs and getOccupancyWithNumVGPRs..Nov 22 2022, 6:44 AM

Make flat work group interaction work by querying the correct thing.

I can convince myself the merged ranges make sense but I'm not sure, particularly on the lower bound

Herald added a project: Restricted Project. · View Herald TranscriptJun 3 2023, 5:33 PM

arsenm added a reviewer: nhaehnle.Jun 3 2023, 5:33 PM

Harbormaster completed remote builds in B236424: Diff 528169.Jun 3 2023, 5:34 PM

arsenm updated this revision to Diff 528172.Jun 3 2023, 6:08 PM

Harbormaster completed remote builds in B236427: Diff 528172.Jun 3 2023, 6:08 PM

There is actually an assumption propagation AA in the Attributor already https://github.com/llvm/llvm-project/blob/main/llvm/lib/Transforms/IPO/AttributorAttributes.cpp#L11609. I don't know if that's relevant to what the AMDGPUAttributor wants to do however.

In D115559#4396025, @jhuber6 wrote:

There is actually an assumption propagation AA in the Attributor already https://github.com/llvm/llvm-project/blob/main/llvm/lib/Transforms/IPO/AttributorAttributes.cpp#L11609. I don't know if that's relevant to what the AMDGPUAttributor wants to do however.

Don't see how assumes are involved. There isn't a way to introspect waves-per-eu

In D115559#4407258, @arsenm wrote:

In D115559#4396025, @jhuber6 wrote:

There is actually an assumption propagation AA in the Attributor already https://github.com/llvm/llvm-project/blob/main/llvm/lib/Transforms/IPO/AttributorAttributes.cpp#L11609. I don't know if that's relevant to what the AMDGPUAttributor wants to do however.

Don't see how assumes are involved. There isn't a way to introspect waves-per-eu

I was just wondering out loud if you could model this as "assume one thread" and then treat it the same way in the backend.

ping

LG, I left some notes and nits below.

llvm/lib/Target/AMDGPU/AMDGPUAttributor.cpp
676	Docs: Base class to derive different size ranges.
686–688	Nit: I doubt you need these. StateWrapper should provide them, IIRC.
691	FWIW, we should be able to track how often we manifested, hence improved, the ranges. I think that would be good to have.
709	Can you add a TODO in this class. The functionality it offers should be in some helper header. Effectively it does call site -> callee lookups and clamping. We have similar helpers in AttributorAttributes.cpp, but not this one. At some point we should move them all out into a header...
732	Nit: You don't need a list with 8 slots, `{ Attr }` probably works just as well.
814	Nit: Probably better to only redirect one level up (`AAAMDSizeRangeAttribute::isValidState()`) FWIW: Empty should mean it's dead/misconfigured, no?

This revision is now accepted and ready to land.Jun 14 2023, 10:06 AM

arsenm marked 2 inline comments as done.Jun 15 2023, 10:07 AM

arsenm added inline comments.

llvm/lib/Target/AMDGPU/AMDGPUAttributor.cpp
686–688	They're already here so I'll try to delete separately
691	It looks like you're supposed to implement this with macros private to AttributorAttributes

arsenm added inline comments.Jun 15 2023, 10:13 AM

llvm/lib/Target/AMDGPU/AMDGPUAttributor.cpp
814	This was one of the struggles I forgot about. I didn't find a better way to express the valid bounds for this to infer. By default it covers 0, -1, which exceeds the maximum of 10 and it produces broken attributes

b9c6d9e6c3b9fab632d2ee33ecce899fadcee456

arsenm mentioned this in D110107: AMDGPU: Propagate amdgpu-waves-per-eu.Jun 22 2023, 3:11 AM

Revision Contents

Path

Size

llvm/

lib/

Target/

AMDGPU/

AMDGPUAttributor.cpp

209 lines

AMDGPUSubtarget.h

3 lines

AMDGPUSubtarget.cpp

20 lines

test/

CodeGen/

AMDGPU/

addrspacecast-constantexpr.ll

3 lines

annotate-existing-abi-attributes.ll

20 lines

annotate-kernel-features-hsa-call.ll

102 lines

annotate-kernel-features-hsa.ll

3 lines

attributor-loop-issue-58639.ll

4 lines

direct-indirect-call.ll

4 lines

duplicate-attribute-indirect.ll

2 lines

implicitarg-offset-attributes.ll

92 lines

propagate-flat-work-group-size.ll

6 lines

propagate-waves-per-eu.ll

80 lines

simple-indirect-call.ll

2 lines

uniform-work-group-attribute-missing.ll

5 lines

uniform-work-group-multistep.ll

11 lines

uniform-work-group-nested-function-calls.ll

2 lines

uniform-work-group-prevent-attribute-propagation.ll

5 lines

uniform-work-group-propagate-attribute.ll

2 lines

uniform-work-group-recursion-test.ll

6 lines

uniform-work-group-test.ll

5 lines

Diff 528172

llvm/lib/Target/AMDGPU/AMDGPUAttributor.cpp

Show First 20 Lines • Show All 168 Lines • ▼ Show 20 Lines getMaximumFlatWorkGroupRange(const Function &F) {

return {ST.getMinFlatWorkGroupSize(), ST.getMaxFlatWorkGroupSize()}; return {ST.getMinFlatWorkGroupSize(), ST.getMaxFlatWorkGroupSize()};

} }

/// Get code object version. /// Get code object version.

unsigned getCodeObjectVersion() const { unsigned getCodeObjectVersion() const {

return CodeObjectVersion; return CodeObjectVersion;

} }

/// Get the effective value of "amdgpu-waves-per-eu" for the function,

/// accounting for the interaction with the passed value to use for

/// "amdgpu-flat-work-group-size".

std::pair<unsigned, unsigned>

getWavesPerEU(const Function &F,

std::pair<unsigned, unsigned> FlatWorkGroupSize) {

const GCNSubtarget &ST = TM.getSubtarget<GCNSubtarget>(F);

return ST.getWavesPerEU(F, FlatWorkGroupSize);

}

std::pair<unsigned, unsigned>

getEffectiveWavesPerEU(const Function &F,

std::pair<unsigned, unsigned> WavesPerEU,

std::pair<unsigned, unsigned> FlatWorkGroupSize) {

const GCNSubtarget &ST = TM.getSubtarget<GCNSubtarget>(F);

return ST.getEffectiveWavesPerEU(WavesPerEU, FlatWorkGroupSize);

}

unsigned getMaxWavesPerEU(const Function &F) {

const GCNSubtarget &ST = TM.getSubtarget<GCNSubtarget>(F);

return ST.getMaxWavesPerEU();

}

private: private:

/// Check if the ConstantExpr \p CE requires the queue pointer. /// Check if the ConstantExpr \p CE requires the queue pointer.

static bool visitConstExpr(const ConstantExpr *CE) { static bool visitConstExpr(const ConstantExpr *CE) {

if (CE->getOpcode() == Instruction::AddrSpaceCast) { if (CE->getOpcode() == Instruction::AddrSpaceCast) {

unsigned SrcAS = CE->getOperand(0)->getType()->getPointerAddressSpace(); unsigned SrcAS = CE->getOperand(0)->getType()->getPointerAddressSpace();

return castRequiresQueuePtr(SrcAS); return castRequiresQueuePtr(SrcAS);

} }

return false; return false;

▲ Show 20 Lines • Show All 460 Lines • ▼ Show 20 Lines

AAAMDAttributes &AAAMDAttributes::createForPosition(const IRPosition &IRP, AAAMDAttributes &AAAMDAttributes::createForPosition(const IRPosition &IRP,

Attributor &A) { Attributor &A) {

if (IRP.getPositionKind() == IRPosition::IRP_FUNCTION) if (IRP.getPositionKind() == IRPosition::IRP_FUNCTION)

return *new (A.Allocator) AAAMDAttributesFunction(IRP, A); return *new (A.Allocator) AAAMDAttributesFunction(IRP, A);

llvm_unreachable("AAAMDAttributes is only valid for function position"); llvm_unreachable("AAAMDAttributes is only valid for function position");

} }

/// Propagate amdgpu-flat-work-group-size attribute. struct AAAMDSizeRangeAttribute

jdoerfertUnsubmitted

Not Done

Docs: Base class to derive different size ranges.

jdoerfert: Docs: Base class to derive different size ranges.

struct AAAMDFlatWorkGroupSize

: public StateWrapper<IntegerRangeState, AbstractAttribute, uint32_t> { : public StateWrapper<IntegerRangeState, AbstractAttribute, uint32_t> {

using Base = StateWrapper<IntegerRangeState, AbstractAttribute, uint32_t>; using Base = StateWrapper<IntegerRangeState, AbstractAttribute, uint32_t>;

AAAMDFlatWorkGroupSize(const IRPosition &IRP, Attributor &A)

: Base(IRP, 32) {} StringRef AttrName;

AAAMDSizeRangeAttribute(const IRPosition &IRP, Attributor &A,

StringRef AttrName)

: Base(IRP, 32), AttrName(AttrName) {}

/// See AbstractAttribute::getState(...). /// See AbstractAttribute::getState(...).

IntegerRangeState &getState() override { return *this; } IntegerRangeState &getState() override { return *this; }

const IntegerRangeState &getState() const override { return *this; } const IntegerRangeState &getState() const override { return *this; }

jdoerfertUnsubmitted

Not Done

Nit: I doubt you need these. StateWrapper should provide them, IIRC.

jdoerfert: Nit: I doubt you need these. StateWrapper should provide them, IIRC.

arsenmAuthorUnsubmitted

Done

They're already here so I'll try to delete separately

arsenm: They're already here so I'll try to delete separately

void initialize(Attributor &A) override { /// See AbstractAttribute::trackStatistics()

Function *F = getAssociatedFunction(); void trackStatistics() const override {}

jdoerfertUnsubmitted

Not Done

FWIW, we should be able to track how often we manifested, hence improved, the ranges. I think that would be good to have.

jdoerfert: FWIW, we should be able to track how often we manifested, hence improved, the ranges. I think…

arsenmAuthorUnsubmitted

Done

It looks like you're supposed to implement this with macros private to AttributorAttributes

arsenm: It looks like you're supposed to implement this with macros private to AttributorAttributes

auto &InfoCache = static_cast<AMDGPUInformationCache &>(A.getInfoCache());

unsigned MinGroupSize, MaxGroupSize;

std::tie(MinGroupSize, MaxGroupSize) = InfoCache.getFlatWorkGroupSizes(*F);

intersectKnown(

ConstantRange(APInt(32, MinGroupSize), APInt(32, MaxGroupSize + 1)));

if (AMDGPU::isEntryFunctionCC(F->getCallingConv()))

indicatePessimisticFixpoint();

}

ChangeStatus updateImpl(Attributor &A) override { template <class AttributeImpl>

ChangeStatus updateImplImpl(Attributor &A) {

ChangeStatus Change = ChangeStatus::UNCHANGED; ChangeStatus Change = ChangeStatus::UNCHANGED;

auto CheckCallSite = [&](AbstractCallSite CS) { auto CheckCallSite = [&](AbstractCallSite CS) {

Function *Caller = CS.getInstruction()->getFunction(); Function *Caller = CS.getInstruction()->getFunction();

LLVM_DEBUG(dbgs() << "[AAAMDFlatWorkGroupSize] Call " << Caller->getName() LLVM_DEBUG(dbgs() << '[' << getName() << "] Call " << Caller->getName()

<< "->" << getAssociatedFunction()->getName() << '\n'); << "->" << getAssociatedFunction()->getName() << '\n');

const auto &CallerInfo = A.getAAFor<AAAMDFlatWorkGroupSize>( const auto &CallerInfo = A.getAAFor<AttributeImpl>(

*this, IRPosition::function(*Caller), DepClassTy::REQUIRED); *this, IRPosition::function(*Caller), DepClassTy::REQUIRED);

Change |= Change |=

clampStateAndIndicateChange(this->getState(), CallerInfo.getState()); clampStateAndIndicateChange(this->getState(), CallerInfo.getState());

return true; return true;

}; };

jdoerfertUnsubmitted

Done

Can you add a TODO in this class. The functionality it offers should be in some helper header. Effectively it does call site -> callee lookups and clamping. We have similar helpers in AttributorAttributes.cpp, but not this one. At some point we should move them all out into a header...

jdoerfert: Can you add a TODO in this class. The functionality it offers should be in some helper header.

bool AllCallSitesKnown = true; bool AllCallSitesKnown = true;

if (!A.checkForAllCallSites(CheckCallSite, *this, true, AllCallSitesKnown)) if (!A.checkForAllCallSites(CheckCallSite, *this, true, AllCallSitesKnown))

return indicatePessimisticFixpoint(); return indicatePessimisticFixpoint();

return Change; return Change;

} }

ChangeStatus manifest(Attributor &A) override { ChangeStatus emitAttributeIfNotDefault(Attributor &A, unsigned Min,

SmallVector<Attribute, 8> AttrList; unsigned Max) {

Function *F = getAssociatedFunction();

LLVMContext &Ctx = F->getContext();

auto &InfoCache = static_cast<AMDGPUInformationCache &>(A.getInfoCache());

unsigned Min, Max;

std::tie(Min, Max) = InfoCache.getMaximumFlatWorkGroupRange(*F);

// Don't add the attribute if it's the implied default. // Don't add the attribute if it's the implied default.

if (getAssumed().getLower() == Min && getAssumed().getUpper() - 1 == Max) if (getAssumed().getLower() == Min && getAssumed().getUpper() - 1 == Max)

return ChangeStatus::UNCHANGED; return ChangeStatus::UNCHANGED;

Function *F = getAssociatedFunction();

LLVMContext &Ctx = F->getContext();

SmallVector<Attribute, 8> AttrList;

SmallString<10> Buffer; SmallString<10> Buffer;

raw_svector_ostream OS(Buffer); raw_svector_ostream OS(Buffer);

OS << getAssumed().getLower() << ',' << getAssumed().getUpper() - 1; OS << getAssumed().getLower() << ',' << getAssumed().getUpper() - 1;

AttrList.push_back( AttrList.push_back(Attribute::get(Ctx, AttrName, OS.str()));

Attribute::get(Ctx, "amdgpu-flat-work-group-size", OS.str()));

return IRAttributeManifest::manifestAttrs(A, getIRPosition(), AttrList, return IRAttributeManifest::manifestAttrs(A, getIRPosition(), AttrList,

jdoerfertUnsubmitted

Done

Nit: You don't need a list with 8 slots, { Attr } probably works just as well.

jdoerfert: Nit: You don't need a list with 8 slots, `{ Attr }` probably works just as well.

/* ForceReplace */ true); /* ForceReplace */ true);

} }

const std::string getAsStr() const override { const std::string getAsStr() const override {

std::string Str; std::string Str;

raw_string_ostream OS(Str); raw_string_ostream OS(Str);

OS << "AMDFlatWorkGroupSize["; OS << getName() << '[';

OS << getAssumed().getLower() << ',' << getAssumed().getUpper() - 1; OS << getAssumed().getLower() << ',' << getAssumed().getUpper() - 1;

OS << ']'; OS << ']';

return OS.str(); return OS.str();

} }

};

/// See AbstractAttribute::trackStatistics() /// Propagate amdgpu-flat-work-group-size attribute.

void trackStatistics() const override {} struct AAAMDFlatWorkGroupSize : public AAAMDSizeRangeAttribute {

AAAMDFlatWorkGroupSize(const IRPosition &IRP, Attributor &A)

: AAAMDSizeRangeAttribute(IRP, A, "amdgpu-flat-work-group-size") {}

void initialize(Attributor &A) override {

Function *F = getAssociatedFunction();

auto &InfoCache = static_cast<AMDGPUInformationCache &>(A.getInfoCache());

unsigned MinGroupSize, MaxGroupSize;

std::tie(MinGroupSize, MaxGroupSize) = InfoCache.getFlatWorkGroupSizes(*F);

intersectKnown(

ConstantRange(APInt(32, MinGroupSize), APInt(32, MaxGroupSize + 1)));

if (AMDGPU::isEntryFunctionCC(F->getCallingConv()))

indicatePessimisticFixpoint();

}

ChangeStatus updateImpl(Attributor &A) override {

return updateImplImpl<AAAMDFlatWorkGroupSize>(A);

}

/// Create an abstract attribute view for the position \p IRP. /// Create an abstract attribute view for the position \p IRP.

static AAAMDFlatWorkGroupSize &createForPosition(const IRPosition &IRP, static AAAMDFlatWorkGroupSize &createForPosition(const IRPosition &IRP,

Attributor &A); Attributor &A);

ChangeStatus manifest(Attributor &A) override {

Function *F = getAssociatedFunction();

auto &InfoCache = static_cast<AMDGPUInformationCache &>(A.getInfoCache());

unsigned Min, Max;

std::tie(Min, Max) = InfoCache.getMaximumFlatWorkGroupRange(*F);

return emitAttributeIfNotDefault(A, Min, Max);

}

/// See AbstractAttribute::getName() /// See AbstractAttribute::getName()

const std::string getName() const override { const std::string getName() const override {

return "AAAMDFlatWorkGroupSize"; return "AAAMDFlatWorkGroupSize";

} }

/// See AbstractAttribute::getIdAddr() /// See AbstractAttribute::getIdAddr()

const char *getIdAddr() const override { return &ID; } const char *getIdAddr() const override { return &ID; }

Show All 13 Lines

AAAMDFlatWorkGroupSize::createForPosition(const IRPosition &IRP, AAAMDFlatWorkGroupSize::createForPosition(const IRPosition &IRP,

Attributor &A) { Attributor &A) {

if (IRP.getPositionKind() == IRPosition::IRP_FUNCTION) if (IRP.getPositionKind() == IRPosition::IRP_FUNCTION)

return *new (A.Allocator) AAAMDFlatWorkGroupSize(IRP, A); return *new (A.Allocator) AAAMDFlatWorkGroupSize(IRP, A);

llvm_unreachable( llvm_unreachable(

"AAAMDFlatWorkGroupSize is only valid for function position"); "AAAMDFlatWorkGroupSize is only valid for function position");

} }

/// Propagate amdgpu-waves-per-eu attribute.

struct AAAMDWavesPerEU : public AAAMDSizeRangeAttribute {

AAAMDWavesPerEU(const IRPosition &IRP, Attributor &A)

: AAAMDSizeRangeAttribute(IRP, A, "amdgpu-waves-per-eu") {}

bool isValidState() const override {

return !Assumed.isEmptySet() && IntegerRangeState::isValidState();

jdoerfertUnsubmitted

Not Done

Nit: Probably better to only redirect one level up (AAAMDSizeRangeAttribute::isValidState())

FWIW:
Empty should mean it's dead/misconfigured, no?

jdoerfert: Nit: Probably better to only redirect one level up (`AAAMDSizeRangeAttribute::isValidState()`)…

arsenmAuthorUnsubmitted

Done

This was one of the struggles I forgot about. I didn't find a better way to express the valid bounds for this to infer. By default it covers 0, -1, which exceeds the maximum of 10 and it produces broken attributes

arsenm: This was one of the struggles I forgot about. I didn't find a better way to express the valid…

}

void initialize(Attributor &A) override {

Function *F = getAssociatedFunction();

auto &InfoCache = static_cast<AMDGPUInformationCache &>(A.getInfoCache());

const auto &AssumedGroupSize = A.getAAFor<AAAMDFlatWorkGroupSize>(

*this, IRPosition::function(*F), DepClassTy::REQUIRED);

unsigned Min, Max;

std::tie(Min, Max) = InfoCache.getWavesPerEU(

*F, {AssumedGroupSize.getAssumed().getLower().getZExtValue(),

AssumedGroupSize.getAssumed().getUpper().getZExtValue() - 1});

ConstantRange Range(APInt(32, Min), APInt(32, Max + 1));

intersectKnown(Range);

if (AMDGPU::isEntryFunctionCC(F->getCallingConv()))

indicatePessimisticFixpoint();

}

jdoerfertUnsubmitted

Not Done

Somewhat surprising you intersect the known range with an assumed result, if that is on purpose probably worth a comment explaining why this is reasonable.

jdoerfert: Somewhat surprising you intersect the known range with an assumed result, if that is on purpose…

arsenmAuthorUnsubmitted

Done

I'm confused by your surprise. This is the initialize, so the assumed state doesn't mean anything? All the other IntegerRangeState attributes start out with intersectKnown in initialize()

arsenm: I'm confused by your surprise. This is the initialize, so the assumed state doesn't mean…

jdoerfertUnsubmitted

Not Done

So, at this point you move something assumed by another AA into something known by this. However, we don't know the other AAs assumed state is valid yet. Only after the fixpoint is reached it is known to hold. So what other AAs do (I hope) is use IR information to setup the known state. Here we might end up assuming the best for the FlatWorkGroupSize (line 674) then making it to something known in 683, before the values are tightened during the fixpoint iteration causing the known set to be not actually valid anymore. Generally, assumed information should only flow into known information if a fixpoint is reached (at which point the assumed information becomes the known one anyway). Before that, assumed should flow into assumed only and known can flow in either.

Does that make some sense?

jdoerfert: So, at this point you move something assumed by another AA into something known by this.

ChangeStatus updateImpl(Attributor &A) override {

auto &InfoCache = static_cast<AMDGPUInformationCache &>(A.getInfoCache());

ChangeStatus Change = ChangeStatus::UNCHANGED;

auto CheckCallSite = [&](AbstractCallSite CS) {

Function *Caller = CS.getInstruction()->getFunction();

Function *Func = getAssociatedFunction();

LLVM_DEBUG(dbgs() << '[' << getName() << "] Call " << Caller->getName()

<< "->" << Func->getName() << '\n');

const auto &CallerInfo = A.getAAFor<AAAMDWavesPerEU>(

*this, IRPosition::function(*Caller), DepClassTy::REQUIRED);

const auto &AssumedGroupSize = A.getAAFor<AAAMDFlatWorkGroupSize>(

*this, IRPosition::function(*Func), DepClassTy::REQUIRED);

unsigned Min, Max;

std::tie(Min, Max) = InfoCache.getEffectiveWavesPerEU(

*Caller,

{CallerInfo.getAssumed().getLower().getZExtValue(),

CallerInfo.getAssumed().getUpper().getZExtValue() - 1},

{AssumedGroupSize.getAssumed().getLower().getZExtValue(),

AssumedGroupSize.getAssumed().getUpper().getZExtValue() - 1});

ConstantRange CallerRange(APInt(32, Min), APInt(32, Max + 1));

IntegerRangeState CallerRangeState(CallerRange);

Change |= clampStateAndIndicateChange(this->getState(), CallerRangeState);

return true;

};

bool AllCallSitesKnown = true;

if (!A.checkForAllCallSites(CheckCallSite, *this, true, AllCallSitesKnown))

return indicatePessimisticFixpoint();

jdoerfertUnsubmitted

Done

if (!A.checkForAllCallSites(CheckCallSite, *this, true, AllCallSitesKnown))

- indicatePessimisticFixpoint();

+ return indicatePessimisticFixpoint();

return Change;

It is important to return "CHANGED" here.

jdoerfert: It is important to return "CHANGED" here.

return Change;

}

/// Create an abstract attribute view for the position \p IRP.

static AAAMDWavesPerEU &createForPosition(const IRPosition &IRP,

Attributor &A);

ChangeStatus manifest(Attributor &A) override {

Function *F = getAssociatedFunction();

auto &InfoCache = static_cast<AMDGPUInformationCache &>(A.getInfoCache());

unsigned Max = InfoCache.getMaxWavesPerEU(*F);

return emitAttributeIfNotDefault(A, 1, Max);

}

/// See AbstractAttribute::getName()

const std::string getName() const override { return "AAAMDWavesPerEU"; }

/// See AbstractAttribute::getIdAddr()

const char *getIdAddr() const override { return &ID; }

/// This function should return true if the type of the \p AA is

/// AAAMDWavesPerEU

static bool classof(const AbstractAttribute *AA) {

return (AA->getIdAddr() == &ID);

}

/// Unique ID (due to the unique address)

static const char ID;

};

const char AAAMDWavesPerEU::ID = 0;

AAAMDWavesPerEU &AAAMDWavesPerEU::createForPosition(const IRPosition &IRP,

Attributor &A) {

if (IRP.getPositionKind() == IRPosition::IRP_FUNCTION)

return *new (A.Allocator) AAAMDWavesPerEU(IRP, A);

llvm_unreachable("AAAMDWavesPerEU is only valid for function position");

}

class AMDGPUAttributor : public ModulePass { class AMDGPUAttributor : public ModulePass {

public: public:

AMDGPUAttributor() : ModulePass(ID) {} AMDGPUAttributor() : ModulePass(ID) {}

/// doInitialization - Virtual method overridden by subclasses to do /// doInitialization - Virtual method overridden by subclasses to do

/// any necessary initialization before any pass is run. /// any necessary initialization before any pass is run.

bool doInitialization(Module &) override { bool doInitialization(Module &) override {

auto *TPC = getAnalysisIfAvailable<TargetPassConfig>(); auto *TPC = getAnalysisIfAvailable<TargetPassConfig>();

Show All 12 Lines for (Function &F : M) {

Functions.insert(&F); Functions.insert(&F);

} }

CallGraphUpdater CGUpdater; CallGraphUpdater CGUpdater;

BumpPtrAllocator Allocator; BumpPtrAllocator Allocator;

AMDGPUInformationCache InfoCache(M, AG, Allocator, nullptr, *TM); AMDGPUInformationCache InfoCache(M, AG, Allocator, nullptr, *TM);

DenseSet<const char *> Allowed( DenseSet<const char *> Allowed(

{&AAAMDAttributes::ID, &AAUniformWorkGroupSize::ID, {&AAAMDAttributes::ID, &AAUniformWorkGroupSize::ID,

&AAPotentialValues::ID, &AAAMDFlatWorkGroupSize::ID, &AACallEdges::ID, &AAPotentialValues::ID, &AAAMDFlatWorkGroupSize::ID,

&AAPointerInfo::ID, &AAPotentialConstantValues::ID}); &AAAMDWavesPerEU::ID, &AACallEdges::ID, &AAPointerInfo::ID,

&AAPotentialConstantValues::ID});

AttributorConfig AC(CGUpdater); AttributorConfig AC(CGUpdater);

AC.Allowed = &Allowed; AC.Allowed = &Allowed;

AC.IsModulePass = true; AC.IsModulePass = true;

AC.DefaultInitializeLiveInternals = false; AC.DefaultInitializeLiveInternals = false;

Attributor A(Functions, InfoCache, AC); Attributor A(Functions, InfoCache, AC);

for (Function &F : M) { for (Function &F : M) {

if (!F.isIntrinsic()) { if (!F.isIntrinsic()) {

A.getOrCreateAAFor<AAAMDAttributes>(IRPosition::function(F)); A.getOrCreateAAFor<AAAMDAttributes>(IRPosition::function(F));

A.getOrCreateAAFor<AAUniformWorkGroupSize>(IRPosition::function(F)); A.getOrCreateAAFor<AAUniformWorkGroupSize>(IRPosition::function(F));

if (!AMDGPU::isEntryFunctionCC(F.getCallingConv())) { if (!AMDGPU::isEntryFunctionCC(F.getCallingConv())) {

A.getOrCreateAAFor<AAAMDFlatWorkGroupSize>(IRPosition::function(F)); A.getOrCreateAAFor<AAAMDFlatWorkGroupSize>(IRPosition::function(F));

A.getOrCreateAAFor<AAAMDWavesPerEU>(IRPosition::function(F));

} }

ChangeStatus Change = A.run(); ChangeStatus Change = A.run();

return Change == ChangeStatus::CHANGED; return Change == ChangeStatus::CHANGED;

} }

Show All 18 Lines

llvm/lib/Target/AMDGPU/AMDGPUSubtarget.h

Show First 20 Lines • Show All 101 Lines • ▼ Show 20 Lines	public:
}		}

/// Overload which uses the specified values for the flat work group sizes,		/// Overload which uses the specified values for the flat work group sizes,
/// rather than querying the function itself. \p FlatWorkGroupSizes Should		/// rather than querying the function itself. \p FlatWorkGroupSizes Should
/// correspond to the function's value for getFlatWorkGroupSizes.		/// correspond to the function's value for getFlatWorkGroupSizes.
std::pair<unsigned, unsigned>		std::pair<unsigned, unsigned>
getWavesPerEU(const Function &F,		getWavesPerEU(const Function &F,
std::pair<unsigned, unsigned> FlatWorkGroupSizes) const;		std::pair<unsigned, unsigned> FlatWorkGroupSizes) const;
		std::pair<unsigned, unsigned> getEffectiveWavesPerEU(
		std::pair<unsigned, unsigned> WavesPerEU,
		std::pair<unsigned, unsigned> FlatWorkGroupSizes) const;

/// Return the amount of LDS that can be used that will not restrict the		/// Return the amount of LDS that can be used that will not restrict the
/// occupancy lower than WaveCount.		/// occupancy lower than WaveCount.
unsigned getMaxLocalMemSizeWithWaveCount(unsigned WaveCount,		unsigned getMaxLocalMemSizeWithWaveCount(unsigned WaveCount,
const Function &) const;		const Function &) const;

/// Inverse of getMaxLocalMemWithWaveCount. Return the maximum wavecount if		/// Inverse of getMaxLocalMemWithWaveCount. Return the maximum wavecount if
/// the given LDS memory size is the only constraint.		/// the given LDS memory size is the only constraint.
▲ Show 20 Lines • Show All 173 Lines • Show Last 20 Lines

llvm/lib/Target/AMDGPU/AMDGPUSubtarget.cpp

Show First 20 Lines • Show All 410 Lines • ▼ Show 20 Lines	std::pair<unsigned, unsigned> AMDGPUSubtarget::getFlatWorkGroupSizes(
if (Requested.first < getMinFlatWorkGroupSize())		if (Requested.first < getMinFlatWorkGroupSize())
return Default;		return Default;
if (Requested.second > getMaxFlatWorkGroupSize())		if (Requested.second > getMaxFlatWorkGroupSize())
return Default;		return Default;

return Requested;		return Requested;
}		}

std::pair<unsigned, unsigned> AMDGPUSubtarget::getWavesPerEU(		std::pair<unsigned, unsigned> AMDGPUSubtarget::getEffectiveWavesPerEU(
const Function &F, std::pair<unsigned, unsigned> FlatWorkGroupSizes) const {		std::pair<unsigned, unsigned> Requested,
		std::pair<unsigned, unsigned> FlatWorkGroupSizes) const {
// Default minimum/maximum number of waves per execution unit.		// Default minimum/maximum number of waves per execution unit.
std::pair<unsigned, unsigned> Default(1, getMaxWavesPerEU());		std::pair<unsigned, unsigned> Default(1, getMaxWavesPerEU());

// If minimum/maximum flat work group sizes were explicitly requested using		// If minimum/maximum flat work group sizes were explicitly requested using
// "amdgpu-flat-work-group-size" attribute, then set default minimum/maximum		// "amdgpu-flat-work-group-size" attribute, then set default minimum/maximum
// number of waves per execution unit to values implied by requested		// number of waves per execution unit to values implied by requested
// minimum/maximum flat work group sizes.		// minimum/maximum flat work group sizes.
unsigned MinImpliedByFlatWorkGroupSize =		unsigned MinImpliedByFlatWorkGroupSize =
getWavesPerEUForWorkGroup(FlatWorkGroupSizes.second);		getWavesPerEUForWorkGroup(FlatWorkGroupSizes.second);
Default.first = MinImpliedByFlatWorkGroupSize;		Default.first = MinImpliedByFlatWorkGroupSize;

// Requested minimum/maximum number of waves per execution unit.
std::pair<unsigned, unsigned> Requested = AMDGPU::getIntegerPairAttribute(
F, "amdgpu-waves-per-eu", Default, true);

// Make sure requested minimum is less than requested maximum.		// Make sure requested minimum is less than requested maximum.
if (Requested.second && Requested.first > Requested.second)		if (Requested.second && Requested.first > Requested.second)
return Default;		return Default;

// Make sure requested values do not violate subtarget's specifications.		// Make sure requested values do not violate subtarget's specifications.
if (Requested.first < getMinWavesPerEU() \|\|		if (Requested.first < getMinWavesPerEU() \|\|
Requested.second > getMaxWavesPerEU())		Requested.second > getMaxWavesPerEU())
return Default;		return Default;

// Make sure requested values are compatible with values implied by requested		// Make sure requested values are compatible with values implied by requested
// minimum/maximum flat work group sizes.		// minimum/maximum flat work group sizes.
if (Requested.first < MinImpliedByFlatWorkGroupSize)		if (Requested.first < MinImpliedByFlatWorkGroupSize)
return Default;		return Default;

return Requested;		return Requested;
}		}

		std::pair<unsigned, unsigned> AMDGPUSubtarget::getWavesPerEU(
		const Function &F, std::pair<unsigned, unsigned> FlatWorkGroupSizes) const {
		// Default minimum/maximum number of waves per execution unit.
		std::pair<unsigned, unsigned> Default(1, getMaxWavesPerEU());

		// Requested minimum/maximum number of waves per execution unit.
		std::pair<unsigned, unsigned> Requested =
		AMDGPU::getIntegerPairAttribute(F, "amdgpu-waves-per-eu", Default, true);
		return getEffectiveWavesPerEU(Requested, FlatWorkGroupSizes);
		}

static unsigned getReqdWorkGroupSize(const Function &Kernel, unsigned Dim) {		static unsigned getReqdWorkGroupSize(const Function &Kernel, unsigned Dim) {
auto Node = Kernel.getMetadata("reqd_work_group_size");		auto Node = Kernel.getMetadata("reqd_work_group_size");
if (Node && Node->getNumOperands() == 3)		if (Node && Node->getNumOperands() == 3)
return mdconst::extract<ConstantInt>(Node->getOperand(Dim))->getZExtValue();		return mdconst::extract<ConstantInt>(Node->getOperand(Dim))->getZExtValue();
return std::numeric_limits<unsigned>::max();		return std::numeric_limits<unsigned>::max();
}		}

bool AMDGPUSubtarget::isMesaKernel(const Function &F) const {		bool AMDGPUSubtarget::isMesaKernel(const Function &F) const {
▲ Show 20 Lines • Show All 539 Lines • Show Last 20 Lines

llvm/test/CodeGen/AMDGPU/addrspacecast-constantexpr.ll

	Show First 20 Lines • Show All 211 Lines • ▼ Show 20 Lines
	}			}

	define ptr addrspace(3) @ret_constant_cast_group_gv_gep_to_flat_to_group() #1 {			define ptr addrspace(3) @ret_constant_cast_group_gv_gep_to_flat_to_group() #1 {
	; AKF_HSA-LABEL: define {{[^@]+}}@ret_constant_cast_group_gv_gep_to_flat_to_group			; AKF_HSA-LABEL: define {{[^@]+}}@ret_constant_cast_group_gv_gep_to_flat_to_group
	; AKF_HSA-SAME: () #[[ATTR1]] {			; AKF_HSA-SAME: () #[[ATTR1]] {
	; AKF_HSA-NEXT: ret ptr addrspace(3) addrspacecast (ptr addrspace(4) getelementptr ([256 x i32], ptr addrspace(4) addrspacecast (ptr addrspace(3) @lds.arr to ptr addrspace(4)), i64 0, i64 8) to ptr addrspace(3))			; AKF_HSA-NEXT: ret ptr addrspace(3) addrspacecast (ptr addrspace(4) getelementptr ([256 x i32], ptr addrspace(4) addrspacecast (ptr addrspace(3) @lds.arr to ptr addrspace(4)), i64 0, i64 8) to ptr addrspace(3))
	;			;
	; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@ret_constant_cast_group_gv_gep_to_flat_to_group			; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@ret_constant_cast_group_gv_gep_to_flat_to_group
	; ATTRIBUTOR_HSA-SAME: () #[[ATTR2]] {			; ATTRIBUTOR_HSA-SAME: () #[[ATTR3:[0-9]+]] {
	; ATTRIBUTOR_HSA-NEXT: ret ptr addrspace(3) addrspacecast (ptr addrspace(4) getelementptr ([256 x i32], ptr addrspace(4) addrspacecast (ptr addrspace(3) @lds.arr to ptr addrspace(4)), i64 0, i64 8) to ptr addrspace(3))			; ATTRIBUTOR_HSA-NEXT: ret ptr addrspace(3) addrspacecast (ptr addrspace(4) getelementptr ([256 x i32], ptr addrspace(4) addrspacecast (ptr addrspace(3) @lds.arr to ptr addrspace(4)), i64 0, i64 8) to ptr addrspace(3))
	;			;
	ret ptr addrspace(3) addrspacecast (ptr addrspace(4) getelementptr ([256 x i32], ptr addrspace(4) addrspacecast (ptr addrspace(3) @lds.arr to ptr addrspace(4)), i64 0, i64 8) to ptr addrspace(3))			ret ptr addrspace(3) addrspacecast (ptr addrspace(4) getelementptr ([256 x i32], ptr addrspace(4) addrspacecast (ptr addrspace(3) @lds.arr to ptr addrspace(4)), i64 0, i64 8) to ptr addrspace(3))
	}			}

	attributes #0 = { argmemonly nounwind }			attributes #0 = { argmemonly nounwind }
	attributes #1 = { nounwind }			attributes #1 = { nounwind }
	;.			;.
	; AKF_HSA: attributes #[[ATTR0:[0-9]+]] = { nocallback nofree nounwind willreturn memory(argmem: readwrite) }			; AKF_HSA: attributes #[[ATTR0:[0-9]+]] = { nocallback nofree nounwind willreturn memory(argmem: readwrite) }
	; AKF_HSA: attributes #[[ATTR1]] = { nounwind }			; AKF_HSA: attributes #[[ATTR1]] = { nounwind }
	;.			;.
	; ATTRIBUTOR_HSA: attributes #[[ATTR0:[0-9]+]] = { nocallback nofree nounwind willreturn memory(argmem: readwrite) }			; ATTRIBUTOR_HSA: attributes #[[ATTR0:[0-9]+]] = { nocallback nofree nounwind willreturn memory(argmem: readwrite) }
	; ATTRIBUTOR_HSA: attributes #[[ATTR1]] = { nounwind "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR1]] = { nounwind "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }
	; ATTRIBUTOR_HSA: attributes #[[ATTR2]] = { nounwind "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR2]] = { nounwind "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }
				; ATTRIBUTOR_HSA: attributes #[[ATTR3]] = { nounwind "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
	;.			;.

llvm/test/CodeGen/AMDGPU/annotate-existing-abi-attributes.ll

	Show First 20 Lines • Show All 111 Lines • ▼ Show 20 Lines
	; CHECK-SAME: () #[[ATTR9:[0-9]+]] {			; CHECK-SAME: () #[[ATTR9:[0-9]+]] {
	; CHECK-NEXT: call void @marked_no_dispatch_id()			; CHECK-NEXT: call void @marked_no_dispatch_id()
	; CHECK-NEXT: ret void			; CHECK-NEXT: ret void
	;			;
	call void @marked_no_dispatch_id()			call void @marked_no_dispatch_id()
	ret void			ret void
	}			}
	;.			;.
	; CHECK: attributes #[[ATTR0]] = { "amdgpu-no-workitem-id-x" "uniform-work-group-size"="false" }			; CHECK: attributes #[[ATTR0]] = { "amdgpu-no-workitem-id-x" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
	; CHECK: attributes #[[ATTR1]] = { "amdgpu-no-workitem-id-y" "uniform-work-group-size"="false" }			; CHECK: attributes #[[ATTR1]] = { "amdgpu-no-workitem-id-y" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
	; CHECK: attributes #[[ATTR2]] = { "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }			; CHECK: attributes #[[ATTR2]] = { "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
	; CHECK: attributes #[[ATTR3]] = { "amdgpu-no-workgroup-id-x" "uniform-work-group-size"="false" }			; CHECK: attributes #[[ATTR3]] = { "amdgpu-no-workgroup-id-x" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
	; CHECK: attributes #[[ATTR4]] = { "amdgpu-no-workgroup-id-y" "uniform-work-group-size"="false" }			; CHECK: attributes #[[ATTR4]] = { "amdgpu-no-workgroup-id-y" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
	; CHECK: attributes #[[ATTR5]] = { "amdgpu-no-workgroup-id-z" "uniform-work-group-size"="false" }			; CHECK: attributes #[[ATTR5]] = { "amdgpu-no-workgroup-id-z" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
	; CHECK: attributes #[[ATTR6]] = { "amdgpu-no-dispatch-ptr" "uniform-work-group-size"="false" }			; CHECK: attributes #[[ATTR6]] = { "amdgpu-no-dispatch-ptr" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
	; CHECK: attributes #[[ATTR7]] = { "amdgpu-no-queue-ptr" "uniform-work-group-size"="false" }			; CHECK: attributes #[[ATTR7]] = { "amdgpu-no-queue-ptr" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
	; CHECK: attributes #[[ATTR8]] = { "amdgpu-no-implicitarg-ptr" "uniform-work-group-size"="false" }			; CHECK: attributes #[[ATTR8]] = { "amdgpu-no-implicitarg-ptr" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
	; CHECK: attributes #[[ATTR9]] = { "amdgpu-no-dispatch-id" "uniform-work-group-size"="false" }			; CHECK: attributes #[[ATTR9]] = { "amdgpu-no-dispatch-id" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
	;.			;.

llvm/test/CodeGen/AMDGPU/annotate-kernel-features-hsa-call.ll

	Show First 20 Lines • Show All 605 Lines • ▼ Show 20 Lines
	define void @use_implicitarg_ptr() #1 {			define void @use_implicitarg_ptr() #1 {
	; AKF_HSA-LABEL: define {{[^@]+}}@use_implicitarg_ptr			; AKF_HSA-LABEL: define {{[^@]+}}@use_implicitarg_ptr
	; AKF_HSA-SAME: () #[[ATTR1]] {			; AKF_HSA-SAME: () #[[ATTR1]] {
	; AKF_HSA-NEXT: [[IMPLICITARG_PTR:%.*]] = call ptr addrspace(4) @llvm.amdgcn.implicitarg.ptr()			; AKF_HSA-NEXT: [[IMPLICITARG_PTR:%.*]] = call ptr addrspace(4) @llvm.amdgcn.implicitarg.ptr()
	; AKF_HSA-NEXT: store volatile ptr addrspace(4) [[IMPLICITARG_PTR]], ptr addrspace(1) undef, align 8			; AKF_HSA-NEXT: store volatile ptr addrspace(4) [[IMPLICITARG_PTR]], ptr addrspace(1) undef, align 8
	; AKF_HSA-NEXT: ret void			; AKF_HSA-NEXT: ret void
	;			;
	; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@use_implicitarg_ptr			; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@use_implicitarg_ptr
	; ATTRIBUTOR_HSA-SAME: () #[[ATTR14]] {			; ATTRIBUTOR_HSA-SAME: () #[[ATTR15:[0-9]+]] {
	; ATTRIBUTOR_HSA-NEXT: [[IMPLICITARG_PTR:%.*]] = call ptr addrspace(4) @llvm.amdgcn.implicitarg.ptr()			; ATTRIBUTOR_HSA-NEXT: [[IMPLICITARG_PTR:%.*]] = call ptr addrspace(4) @llvm.amdgcn.implicitarg.ptr()
	; ATTRIBUTOR_HSA-NEXT: store volatile ptr addrspace(4) [[IMPLICITARG_PTR]], ptr addrspace(1) undef, align 8			; ATTRIBUTOR_HSA-NEXT: store volatile ptr addrspace(4) [[IMPLICITARG_PTR]], ptr addrspace(1) undef, align 8
	; ATTRIBUTOR_HSA-NEXT: ret void			; ATTRIBUTOR_HSA-NEXT: ret void
	;			;
	%implicitarg.ptr = call ptr addrspace(4) @llvm.amdgcn.implicitarg.ptr()			%implicitarg.ptr = call ptr addrspace(4) @llvm.amdgcn.implicitarg.ptr()
	store volatile ptr addrspace(4) %implicitarg.ptr, ptr addrspace(1) undef			store volatile ptr addrspace(4) %implicitarg.ptr, ptr addrspace(1) undef
	ret void			ret void
	}			}

	define void @func_indirect_use_implicitarg_ptr() #1 {			define void @func_indirect_use_implicitarg_ptr() #1 {
	; AKF_HSA-LABEL: define {{[^@]+}}@func_indirect_use_implicitarg_ptr			; AKF_HSA-LABEL: define {{[^@]+}}@func_indirect_use_implicitarg_ptr
	; AKF_HSA-SAME: () #[[ATTR1]] {			; AKF_HSA-SAME: () #[[ATTR1]] {
	; AKF_HSA-NEXT: call void @use_implicitarg_ptr()			; AKF_HSA-NEXT: call void @use_implicitarg_ptr()
	; AKF_HSA-NEXT: ret void			; AKF_HSA-NEXT: ret void
	;			;
	; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@func_indirect_use_implicitarg_ptr			; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@func_indirect_use_implicitarg_ptr
	; ATTRIBUTOR_HSA-SAME: () #[[ATTR14]] {			; ATTRIBUTOR_HSA-SAME: () #[[ATTR15]] {
	; ATTRIBUTOR_HSA-NEXT: call void @use_implicitarg_ptr()			; ATTRIBUTOR_HSA-NEXT: call void @use_implicitarg_ptr()
	; ATTRIBUTOR_HSA-NEXT: ret void			; ATTRIBUTOR_HSA-NEXT: ret void
	;			;
	call void @use_implicitarg_ptr()			call void @use_implicitarg_ptr()
	ret void			ret void
	}			}

	declare void @external.func() #3			declare void @external.func() #3

	; This function gets deleted.			; This function gets deleted.
	define internal void @defined.func() #3 {			define internal void @defined.func() #3 {
	; AKF_HSA-LABEL: define {{[^@]+}}@defined.func			; AKF_HSA-LABEL: define {{[^@]+}}@defined.func
	; AKF_HSA-SAME: () #[[ATTR3:[0-9]+]] {			; AKF_HSA-SAME: () #[[ATTR3:[0-9]+]] {
	; AKF_HSA-NEXT: ret void			; AKF_HSA-NEXT: ret void
	;			;
	; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@defined.func			; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@defined.func
	; ATTRIBUTOR_HSA-SAME: () #[[ATTR16:[0-9]+]] {			; ATTRIBUTOR_HSA-SAME: () #[[ATTR17:[0-9]+]] {
	; ATTRIBUTOR_HSA-NEXT: ret void			; ATTRIBUTOR_HSA-NEXT: ret void
	;			;
	ret void			ret void
	}			}

	define void @func_call_external() #3 {			define void @func_call_external() #3 {
	; AKF_HSA-LABEL: define {{[^@]+}}@func_call_external			; AKF_HSA-LABEL: define {{[^@]+}}@func_call_external
	; AKF_HSA-SAME: () #[[ATTR3]] {			; AKF_HSA-SAME: () #[[ATTR3]] {
	; AKF_HSA-NEXT: call void @external.func()			; AKF_HSA-NEXT: call void @external.func()
	; AKF_HSA-NEXT: ret void			; AKF_HSA-NEXT: ret void
	;			;
	; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@func_call_external			; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@func_call_external
	; ATTRIBUTOR_HSA-SAME: () #[[ATTR15:[0-9]+]] {			; ATTRIBUTOR_HSA-SAME: () #[[ATTR16:[0-9]+]] {
	; ATTRIBUTOR_HSA-NEXT: call void @external.func()			; ATTRIBUTOR_HSA-NEXT: call void @external.func()
	; ATTRIBUTOR_HSA-NEXT: ret void			; ATTRIBUTOR_HSA-NEXT: ret void
	;			;
	call void @external.func()			call void @external.func()
	ret void			ret void
	}			}

	define void @func_call_defined() #3 {			define void @func_call_defined() #3 {
	; AKF_HSA-LABEL: define {{[^@]+}}@func_call_defined			; AKF_HSA-LABEL: define {{[^@]+}}@func_call_defined
	; AKF_HSA-SAME: () #[[ATTR3]] {			; AKF_HSA-SAME: () #[[ATTR3]] {
	; AKF_HSA-NEXT: call void @defined.func()			; AKF_HSA-NEXT: call void @defined.func()
	; AKF_HSA-NEXT: ret void			; AKF_HSA-NEXT: ret void
	;			;
	; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@func_call_defined			; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@func_call_defined
	; ATTRIBUTOR_HSA-SAME: () #[[ATTR16]] {			; ATTRIBUTOR_HSA-SAME: () #[[ATTR17]] {
	; ATTRIBUTOR_HSA-NEXT: call void @defined.func()			; ATTRIBUTOR_HSA-NEXT: call void @defined.func()
	; ATTRIBUTOR_HSA-NEXT: ret void			; ATTRIBUTOR_HSA-NEXT: ret void
	;			;
	call void @defined.func()			call void @defined.func()
	ret void			ret void
	}			}
	define void @func_call_asm() #3 {			define void @func_call_asm() #3 {
	; AKF_HSA-LABEL: define {{[^@]+}}@func_call_asm			; AKF_HSA-LABEL: define {{[^@]+}}@func_call_asm
	; AKF_HSA-SAME: () #[[ATTR3]] {			; AKF_HSA-SAME: () #[[ATTR3]] {
	; AKF_HSA-NEXT: call void asm sideeffect "", ""() #[[ATTR3]]			; AKF_HSA-NEXT: call void asm sideeffect "", ""() #[[ATTR3]]
	; AKF_HSA-NEXT: ret void			; AKF_HSA-NEXT: ret void
	;			;
	; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@func_call_asm			; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@func_call_asm
	; ATTRIBUTOR_HSA-SAME: () #[[ATTR16]] {			; ATTRIBUTOR_HSA-SAME: () #[[ATTR17]] {
	; ATTRIBUTOR_HSA-NEXT: call void asm sideeffect "", ""() #[[ATTR24:[0-9]+]]			; ATTRIBUTOR_HSA-NEXT: call void asm sideeffect "", ""() #[[ATTR28:[0-9]+]]
	; ATTRIBUTOR_HSA-NEXT: ret void			; ATTRIBUTOR_HSA-NEXT: ret void
	;			;
	call void asm sideeffect "", ""() #3			call void asm sideeffect "", ""() #3
	ret void			ret void
	}			}

	define amdgpu_kernel void @kern_call_external() #3 {			define amdgpu_kernel void @kern_call_external() #3 {
	; AKF_HSA-LABEL: define {{[^@]+}}@kern_call_external			; AKF_HSA-LABEL: define {{[^@]+}}@kern_call_external
	; AKF_HSA-SAME: () #[[ATTR4:[0-9]+]] {			; AKF_HSA-SAME: () #[[ATTR4:[0-9]+]] {
	; AKF_HSA-NEXT: call void @external.func()			; AKF_HSA-NEXT: call void @external.func()
	; AKF_HSA-NEXT: ret void			; AKF_HSA-NEXT: ret void
	;			;
	; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@kern_call_external			; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@kern_call_external
	; ATTRIBUTOR_HSA-SAME: () #[[ATTR15]] {			; ATTRIBUTOR_HSA-SAME: () #[[ATTR18:[0-9]+]] {
	; ATTRIBUTOR_HSA-NEXT: call void @external.func()			; ATTRIBUTOR_HSA-NEXT: call void @external.func()
	; ATTRIBUTOR_HSA-NEXT: ret void			; ATTRIBUTOR_HSA-NEXT: ret void
	;			;
	call void @external.func()			call void @external.func()
	ret void			ret void
	}			}

	define amdgpu_kernel void @func_kern_defined() #3 {			define amdgpu_kernel void @func_kern_defined() #3 {
	; AKF_HSA-LABEL: define {{[^@]+}}@func_kern_defined			; AKF_HSA-LABEL: define {{[^@]+}}@func_kern_defined
	; AKF_HSA-SAME: () #[[ATTR4]] {			; AKF_HSA-SAME: () #[[ATTR4]] {
	; AKF_HSA-NEXT: call void @defined.func()			; AKF_HSA-NEXT: call void @defined.func()
	; AKF_HSA-NEXT: ret void			; AKF_HSA-NEXT: ret void
	;			;
	; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@func_kern_defined			; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@func_kern_defined
	; ATTRIBUTOR_HSA-SAME: () #[[ATTR16]] {			; ATTRIBUTOR_HSA-SAME: () #[[ATTR17]] {
	; ATTRIBUTOR_HSA-NEXT: call void @defined.func()			; ATTRIBUTOR_HSA-NEXT: call void @defined.func()
	; ATTRIBUTOR_HSA-NEXT: ret void			; ATTRIBUTOR_HSA-NEXT: ret void
	;			;
	call void @defined.func()			call void @defined.func()
	ret void			ret void
	}			}

	define i32 @use_dispatch_ptr_ret_type() #1 {			define i32 @use_dispatch_ptr_ret_type() #1 {
	Show All 35 Lines
	define float @func_indirect_call(ptr %fptr) #3 {			define float @func_indirect_call(ptr %fptr) #3 {
	; AKF_HSA-LABEL: define {{[^@]+}}@func_indirect_call			; AKF_HSA-LABEL: define {{[^@]+}}@func_indirect_call
	; AKF_HSA-SAME: (ptr [[FPTR:%.*]]) #[[ATTR3]] {			; AKF_HSA-SAME: (ptr [[FPTR:%.*]]) #[[ATTR3]] {
	; AKF_HSA-NEXT: [[F:%.*]] = call float [[FPTR]]()			; AKF_HSA-NEXT: [[F:%.*]] = call float [[FPTR]]()
	; AKF_HSA-NEXT: [[FADD:%.*]] = fadd float [[F]], 1.000000e+00			; AKF_HSA-NEXT: [[FADD:%.*]] = fadd float [[F]], 1.000000e+00
	; AKF_HSA-NEXT: ret float [[FADD]]			; AKF_HSA-NEXT: ret float [[FADD]]
	;			;
	; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@func_indirect_call			; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@func_indirect_call
	; ATTRIBUTOR_HSA-SAME: (ptr [[FPTR:%.*]]) #[[ATTR15]] {			; ATTRIBUTOR_HSA-SAME: (ptr [[FPTR:%.*]]) #[[ATTR16]] {
	; ATTRIBUTOR_HSA-NEXT: [[F:%.*]] = call float [[FPTR]]()			; ATTRIBUTOR_HSA-NEXT: [[F:%.*]] = call float [[FPTR]]()
	; ATTRIBUTOR_HSA-NEXT: [[FADD:%.*]] = fadd float [[F]], 1.000000e+00			; ATTRIBUTOR_HSA-NEXT: [[FADD:%.*]] = fadd float [[F]], 1.000000e+00
	; ATTRIBUTOR_HSA-NEXT: ret float [[FADD]]			; ATTRIBUTOR_HSA-NEXT: ret float [[FADD]]
	;			;
	%f = call float %fptr()			%f = call float %fptr()
	%fadd = fadd float %f, 1.0			%fadd = fadd float %f, 1.0
	ret float %fadd			ret float %fadd
	}			}

	declare float @extern() #3			declare float @extern() #3
	define float @func_extern_call() #3 {			define float @func_extern_call() #3 {
	; AKF_HSA-LABEL: define {{[^@]+}}@func_extern_call			; AKF_HSA-LABEL: define {{[^@]+}}@func_extern_call
	; AKF_HSA-SAME: () #[[ATTR3]] {			; AKF_HSA-SAME: () #[[ATTR3]] {
	; AKF_HSA-NEXT: [[F:%.*]] = call float @extern()			; AKF_HSA-NEXT: [[F:%.*]] = call float @extern()
	; AKF_HSA-NEXT: [[FADD:%.*]] = fadd float [[F]], 1.000000e+00			; AKF_HSA-NEXT: [[FADD:%.*]] = fadd float [[F]], 1.000000e+00
	; AKF_HSA-NEXT: ret float [[FADD]]			; AKF_HSA-NEXT: ret float [[FADD]]
	;			;
	; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@func_extern_call			; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@func_extern_call
	; ATTRIBUTOR_HSA-SAME: () #[[ATTR15]] {			; ATTRIBUTOR_HSA-SAME: () #[[ATTR16]] {
	; ATTRIBUTOR_HSA-NEXT: [[F:%.*]] = call float @extern()			; ATTRIBUTOR_HSA-NEXT: [[F:%.*]] = call float @extern()
	; ATTRIBUTOR_HSA-NEXT: [[FADD:%.*]] = fadd float [[F]], 1.000000e+00			; ATTRIBUTOR_HSA-NEXT: [[FADD:%.*]] = fadd float [[F]], 1.000000e+00
	; ATTRIBUTOR_HSA-NEXT: ret float [[FADD]]			; ATTRIBUTOR_HSA-NEXT: ret float [[FADD]]
	;			;
	%f = call float @extern()			%f = call float @extern()
	%fadd = fadd float %f, 1.0			%fadd = fadd float %f, 1.0
	ret float %fadd			ret float %fadd
	}			}

	define float @func_null_call(ptr %fptr) #3 {			define float @func_null_call(ptr %fptr) #3 {
	; AKF_HSA-LABEL: define {{[^@]+}}@func_null_call			; AKF_HSA-LABEL: define {{[^@]+}}@func_null_call
	; AKF_HSA-SAME: (ptr [[FPTR:%.*]]) #[[ATTR3]] {			; AKF_HSA-SAME: (ptr [[FPTR:%.*]]) #[[ATTR3]] {
	; AKF_HSA-NEXT: [[F:%.*]] = call float null()			; AKF_HSA-NEXT: [[F:%.*]] = call float null()
	; AKF_HSA-NEXT: [[FADD:%.*]] = fadd float [[F]], 1.000000e+00			; AKF_HSA-NEXT: [[FADD:%.*]] = fadd float [[F]], 1.000000e+00
	; AKF_HSA-NEXT: ret float [[FADD]]			; AKF_HSA-NEXT: ret float [[FADD]]
	;			;
	; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@func_null_call			; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@func_null_call
	; ATTRIBUTOR_HSA-SAME: (ptr [[FPTR:%.*]]) #[[ATTR15]] {			; ATTRIBUTOR_HSA-SAME: (ptr [[FPTR:%.*]]) #[[ATTR16]] {
	; ATTRIBUTOR_HSA-NEXT: [[F:%.*]] = call float null()			; ATTRIBUTOR_HSA-NEXT: [[F:%.*]] = call float null()
	; ATTRIBUTOR_HSA-NEXT: [[FADD:%.*]] = fadd float [[F]], 1.000000e+00			; ATTRIBUTOR_HSA-NEXT: [[FADD:%.*]] = fadd float [[F]], 1.000000e+00
	; ATTRIBUTOR_HSA-NEXT: ret float [[FADD]]			; ATTRIBUTOR_HSA-NEXT: ret float [[FADD]]
	;			;
	%f = call float null()			%f = call float null()
	%fadd = fadd float %f, 1.0			%fadd = fadd float %f, 1.0
	ret float %fadd			ret float %fadd
	}			}

	declare float @llvm.amdgcn.rcp.f32(float) #0			declare float @llvm.amdgcn.rcp.f32(float) #0

	; Calls some other recognized intrinsic			; Calls some other recognized intrinsic
	define float @func_other_intrinsic_call(float %arg) #3 {			define float @func_other_intrinsic_call(float %arg) #3 {
	; AKF_HSA-LABEL: define {{[^@]+}}@func_other_intrinsic_call			; AKF_HSA-LABEL: define {{[^@]+}}@func_other_intrinsic_call
	; AKF_HSA-SAME: (float [[ARG:%.*]]) #[[ATTR3]] {			; AKF_HSA-SAME: (float [[ARG:%.*]]) #[[ATTR3]] {
	; AKF_HSA-NEXT: [[F:%.*]] = call float @llvm.amdgcn.rcp.f32(float [[ARG]])			; AKF_HSA-NEXT: [[F:%.*]] = call float @llvm.amdgcn.rcp.f32(float [[ARG]])
	; AKF_HSA-NEXT: [[FADD:%.*]] = fadd float [[F]], 1.000000e+00			; AKF_HSA-NEXT: [[FADD:%.*]] = fadd float [[F]], 1.000000e+00
	; AKF_HSA-NEXT: ret float [[FADD]]			; AKF_HSA-NEXT: ret float [[FADD]]
	;			;
	; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@func_other_intrinsic_call			; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@func_other_intrinsic_call
	; ATTRIBUTOR_HSA-SAME: (float [[ARG:%.*]]) #[[ATTR16]] {			; ATTRIBUTOR_HSA-SAME: (float [[ARG:%.*]]) #[[ATTR17]] {
	; ATTRIBUTOR_HSA-NEXT: [[F:%.*]] = call float @llvm.amdgcn.rcp.f32(float [[ARG]])			; ATTRIBUTOR_HSA-NEXT: [[F:%.*]] = call float @llvm.amdgcn.rcp.f32(float [[ARG]])
	; ATTRIBUTOR_HSA-NEXT: [[FADD:%.*]] = fadd float [[F]], 1.000000e+00			; ATTRIBUTOR_HSA-NEXT: [[FADD:%.*]] = fadd float [[F]], 1.000000e+00
	; ATTRIBUTOR_HSA-NEXT: ret float [[FADD]]			; ATTRIBUTOR_HSA-NEXT: ret float [[FADD]]
	;			;
	%f = call float @llvm.amdgcn.rcp.f32(float %arg)			%f = call float @llvm.amdgcn.rcp.f32(float %arg)
	%fadd = fadd float %f, 1.0			%fadd = fadd float %f, 1.0
	ret float %fadd			ret float %fadd
	}			}

	; Hostcall needs to be enabled for sanitizers			; Hostcall needs to be enabled for sanitizers
	define amdgpu_kernel void @kern_sanitize_address() #4 {			define amdgpu_kernel void @kern_sanitize_address() #4 {
	; AKF_HSA-LABEL: define {{[^@]+}}@kern_sanitize_address			; AKF_HSA-LABEL: define {{[^@]+}}@kern_sanitize_address
	; AKF_HSA-SAME: () #[[ATTR5:[0-9]+]] {			; AKF_HSA-SAME: () #[[ATTR5:[0-9]+]] {
	; AKF_HSA-NEXT: store volatile i32 0, ptr addrspace(1) null, align 4			; AKF_HSA-NEXT: store volatile i32 0, ptr addrspace(1) null, align 4
	; AKF_HSA-NEXT: ret void			; AKF_HSA-NEXT: ret void
	;			;
	; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@kern_sanitize_address			; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@kern_sanitize_address
	; ATTRIBUTOR_HSA-SAME: () #[[ATTR17:[0-9]+]] {			; ATTRIBUTOR_HSA-SAME: () #[[ATTR19:[0-9]+]] {
	; ATTRIBUTOR_HSA-NEXT: store volatile i32 0, ptr addrspace(1) null, align 4			; ATTRIBUTOR_HSA-NEXT: store volatile i32 0, ptr addrspace(1) null, align 4
	; ATTRIBUTOR_HSA-NEXT: ret void			; ATTRIBUTOR_HSA-NEXT: ret void
	;			;
	store volatile i32 0, ptr addrspace(1) null			store volatile i32 0, ptr addrspace(1) null
	ret void			ret void
	}			}

	; Hostcall needs to be enabled for sanitizers			; Hostcall needs to be enabled for sanitizers
	define void @func_sanitize_address() #4 {			define void @func_sanitize_address() #4 {
	; AKF_HSA-LABEL: define {{[^@]+}}@func_sanitize_address			; AKF_HSA-LABEL: define {{[^@]+}}@func_sanitize_address
	; AKF_HSA-SAME: () #[[ATTR5]] {			; AKF_HSA-SAME: () #[[ATTR5]] {
	; AKF_HSA-NEXT: store volatile i32 0, ptr addrspace(1) null, align 4			; AKF_HSA-NEXT: store volatile i32 0, ptr addrspace(1) null, align 4
	; AKF_HSA-NEXT: ret void			; AKF_HSA-NEXT: ret void
	;			;
	; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@func_sanitize_address			; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@func_sanitize_address
	; ATTRIBUTOR_HSA-SAME: () #[[ATTR17]] {			; ATTRIBUTOR_HSA-SAME: () #[[ATTR20:[0-9]+]] {
	; ATTRIBUTOR_HSA-NEXT: store volatile i32 0, ptr addrspace(1) null, align 4			; ATTRIBUTOR_HSA-NEXT: store volatile i32 0, ptr addrspace(1) null, align 4
	; ATTRIBUTOR_HSA-NEXT: ret void			; ATTRIBUTOR_HSA-NEXT: ret void
	;			;
	store volatile i32 0, ptr addrspace(1) null			store volatile i32 0, ptr addrspace(1) null
	ret void			ret void
	}			}

	; Hostcall needs to be enabled for sanitizers			; Hostcall needs to be enabled for sanitizers
	define void @func_indirect_sanitize_address() #3 {			define void @func_indirect_sanitize_address() #3 {
	; AKF_HSA-LABEL: define {{[^@]+}}@func_indirect_sanitize_address			; AKF_HSA-LABEL: define {{[^@]+}}@func_indirect_sanitize_address
	; AKF_HSA-SAME: () #[[ATTR3]] {			; AKF_HSA-SAME: () #[[ATTR3]] {
	; AKF_HSA-NEXT: call void @func_sanitize_address()			; AKF_HSA-NEXT: call void @func_sanitize_address()
	; AKF_HSA-NEXT: ret void			; AKF_HSA-NEXT: ret void
	;			;
	; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@func_indirect_sanitize_address			; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@func_indirect_sanitize_address
	; ATTRIBUTOR_HSA-SAME: () #[[ATTR18:[0-9]+]] {			; ATTRIBUTOR_HSA-SAME: () #[[ATTR21:[0-9]+]] {
	; ATTRIBUTOR_HSA-NEXT: call void @func_sanitize_address()			; ATTRIBUTOR_HSA-NEXT: call void @func_sanitize_address()
	; ATTRIBUTOR_HSA-NEXT: ret void			; ATTRIBUTOR_HSA-NEXT: ret void
	;			;
	call void @func_sanitize_address()			call void @func_sanitize_address()
	ret void			ret void
	}			}

	; Hostcall needs to be enabled for sanitizers			; Hostcall needs to be enabled for sanitizers
	define amdgpu_kernel void @kern_indirect_sanitize_address() #3 {			define amdgpu_kernel void @kern_indirect_sanitize_address() #3 {
	; AKF_HSA-LABEL: define {{[^@]+}}@kern_indirect_sanitize_address			; AKF_HSA-LABEL: define {{[^@]+}}@kern_indirect_sanitize_address
	; AKF_HSA-SAME: () #[[ATTR4]] {			; AKF_HSA-SAME: () #[[ATTR4]] {
	; AKF_HSA-NEXT: call void @func_sanitize_address()			; AKF_HSA-NEXT: call void @func_sanitize_address()
	; AKF_HSA-NEXT: ret void			; AKF_HSA-NEXT: ret void
	;			;
	; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@kern_indirect_sanitize_address			; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@kern_indirect_sanitize_address
	; ATTRIBUTOR_HSA-SAME: () #[[ATTR18]] {			; ATTRIBUTOR_HSA-SAME: () #[[ATTR22:[0-9]+]] {
	; ATTRIBUTOR_HSA-NEXT: call void @func_sanitize_address()			; ATTRIBUTOR_HSA-NEXT: call void @func_sanitize_address()
	; ATTRIBUTOR_HSA-NEXT: ret void			; ATTRIBUTOR_HSA-NEXT: ret void
	;			;
	call void @func_sanitize_address()			call void @func_sanitize_address()
	ret void			ret void
	}			}

	; Marked with amdgpu-no-implicitarg-ptr, and			; Marked with amdgpu-no-implicitarg-ptr, and
	; sanitize_address. sanitize_address wins and requires the pointer.			; sanitize_address. sanitize_address wins and requires the pointer.
	declare void @extern_func_sanitize_address() #5			declare void @extern_func_sanitize_address() #5

	define amdgpu_kernel void @kern_decl_sanitize_address() #3 {			define amdgpu_kernel void @kern_decl_sanitize_address() #3 {
	; AKF_HSA-LABEL: define {{[^@]+}}@kern_decl_sanitize_address			; AKF_HSA-LABEL: define {{[^@]+}}@kern_decl_sanitize_address
	; AKF_HSA-SAME: () #[[ATTR4]] {			; AKF_HSA-SAME: () #[[ATTR4]] {
	; AKF_HSA-NEXT: call void @extern_func_sanitize_address()			; AKF_HSA-NEXT: call void @extern_func_sanitize_address()
	; AKF_HSA-NEXT: ret void			; AKF_HSA-NEXT: ret void
	;			;
	; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@kern_decl_sanitize_address			; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@kern_decl_sanitize_address
	; ATTRIBUTOR_HSA-SAME: () #[[ATTR15]] {			; ATTRIBUTOR_HSA-SAME: () #[[ATTR18]] {
	; ATTRIBUTOR_HSA-NEXT: call void @extern_func_sanitize_address()			; ATTRIBUTOR_HSA-NEXT: call void @extern_func_sanitize_address()
	; ATTRIBUTOR_HSA-NEXT: ret void			; ATTRIBUTOR_HSA-NEXT: ret void
	;			;
	call void @extern_func_sanitize_address()			call void @extern_func_sanitize_address()
	ret void			ret void
	}			}

	declare void @enqueue_block_decl() #6			declare void @enqueue_block_decl() #6

	define internal void @enqueue_block_def() #6 {			define internal void @enqueue_block_def() #6 {
	; AKF_HSA-LABEL: define {{[^@]+}}@enqueue_block_def			; AKF_HSA-LABEL: define {{[^@]+}}@enqueue_block_def
	; AKF_HSA-SAME: () #[[ATTR7:[0-9]+]] {			; AKF_HSA-SAME: () #[[ATTR7:[0-9]+]] {
	; AKF_HSA-NEXT: ret void			; AKF_HSA-NEXT: ret void
	;			;
	; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@enqueue_block_def			; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@enqueue_block_def
	; ATTRIBUTOR_HSA-SAME: () #[[ATTR21:[0-9]+]] {			; ATTRIBUTOR_HSA-SAME: () #[[ATTR25:[0-9]+]] {
	; ATTRIBUTOR_HSA-NEXT: ret void			; ATTRIBUTOR_HSA-NEXT: ret void
	;			;
	ret void			ret void
	}			}

	define amdgpu_kernel void @kern_call_enqueued_block_decl() {			define amdgpu_kernel void @kern_call_enqueued_block_decl() {
	; AKF_HSA-LABEL: define {{[^@]+}}@kern_call_enqueued_block_decl			; AKF_HSA-LABEL: define {{[^@]+}}@kern_call_enqueued_block_decl
	; AKF_HSA-SAME: () #[[ATTR8:[0-9]+]] {			; AKF_HSA-SAME: () #[[ATTR8:[0-9]+]] {
	; AKF_HSA-NEXT: call void @enqueue_block_decl()			; AKF_HSA-NEXT: call void @enqueue_block_decl()
	; AKF_HSA-NEXT: ret void			; AKF_HSA-NEXT: ret void
	;			;
	; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@kern_call_enqueued_block_decl			; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@kern_call_enqueued_block_decl
	; ATTRIBUTOR_HSA-SAME: () #[[ATTR22:[0-9]+]] {			; ATTRIBUTOR_HSA-SAME: () #[[ATTR26:[0-9]+]] {
	; ATTRIBUTOR_HSA-NEXT: call void @enqueue_block_decl()			; ATTRIBUTOR_HSA-NEXT: call void @enqueue_block_decl()
	; ATTRIBUTOR_HSA-NEXT: ret void			; ATTRIBUTOR_HSA-NEXT: ret void
	;			;
	call void @enqueue_block_decl()			call void @enqueue_block_decl()
	ret void			ret void
	}			}

	define amdgpu_kernel void @kern_call_enqueued_block_def() {			define amdgpu_kernel void @kern_call_enqueued_block_def() {
	; AKF_HSA-LABEL: define {{[^@]+}}@kern_call_enqueued_block_def			; AKF_HSA-LABEL: define {{[^@]+}}@kern_call_enqueued_block_def
	; AKF_HSA-SAME: () #[[ATTR8]] {			; AKF_HSA-SAME: () #[[ATTR8]] {
	; AKF_HSA-NEXT: call void @enqueue_block_def()			; AKF_HSA-NEXT: call void @enqueue_block_def()
	; AKF_HSA-NEXT: ret void			; AKF_HSA-NEXT: ret void
	;			;
	; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@kern_call_enqueued_block_def			; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@kern_call_enqueued_block_def
	; ATTRIBUTOR_HSA-SAME: () #[[ATTR23:[0-9]+]] {			; ATTRIBUTOR_HSA-SAME: () #[[ATTR27:[0-9]+]] {
	; ATTRIBUTOR_HSA-NEXT: call void @enqueue_block_def()			; ATTRIBUTOR_HSA-NEXT: call void @enqueue_block_def()
	; ATTRIBUTOR_HSA-NEXT: ret void			; ATTRIBUTOR_HSA-NEXT: ret void
	;			;
	call void @enqueue_block_def()			call void @enqueue_block_def()
	ret void			ret void
	}			}

	define void @unused_enqueue_block() {			define void @unused_enqueue_block() {
	; AKF_HSA-LABEL: define {{[^@]+}}@unused_enqueue_block() {			; AKF_HSA-LABEL: define {{[^@]+}}@unused_enqueue_block() {
	; AKF_HSA-NEXT: ret void			; AKF_HSA-NEXT: ret void
	;			;
	; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@unused_enqueue_block			; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@unused_enqueue_block
	; ATTRIBUTOR_HSA-SAME: () #[[ATTR23]] {			; ATTRIBUTOR_HSA-SAME: () #[[ATTR27]] {
	; ATTRIBUTOR_HSA-NEXT: ret void			; ATTRIBUTOR_HSA-NEXT: ret void
	;			;
	ret void			ret void
	}			}

	define internal void @known_func() {			define internal void @known_func() {
	; AKF_HSA-LABEL: define {{[^@]+}}@known_func() {			; AKF_HSA-LABEL: define {{[^@]+}}@known_func() {
	; AKF_HSA-NEXT: ret void			; AKF_HSA-NEXT: ret void
	;			;
	; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@known_func			; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@known_func
	; ATTRIBUTOR_HSA-SAME: () #[[ATTR23]] {			; ATTRIBUTOR_HSA-SAME: () #[[ATTR27]] {
	; ATTRIBUTOR_HSA-NEXT: ret void			; ATTRIBUTOR_HSA-NEXT: ret void
	;			;
	ret void			ret void
	}			}

	; Should never happen			; Should never happen
	define amdgpu_kernel void @kern_callsite_enqueue_block() {			define amdgpu_kernel void @kern_callsite_enqueue_block() {
	; AKF_HSA-LABEL: define {{[^@]+}}@kern_callsite_enqueue_block			; AKF_HSA-LABEL: define {{[^@]+}}@kern_callsite_enqueue_block
	; AKF_HSA-SAME: () #[[ATTR8]] {			; AKF_HSA-SAME: () #[[ATTR8]] {
	; AKF_HSA-NEXT: call void @known_func() #[[ATTR7]]			; AKF_HSA-NEXT: call void @known_func() #[[ATTR7]]
	; AKF_HSA-NEXT: ret void			; AKF_HSA-NEXT: ret void
	;			;
	; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@kern_callsite_enqueue_block			; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@kern_callsite_enqueue_block
	; ATTRIBUTOR_HSA-SAME: () #[[ATTR23]] {			; ATTRIBUTOR_HSA-SAME: () #[[ATTR27]] {
	; ATTRIBUTOR_HSA-NEXT: call void @known_func() #[[ATTR25:[0-9]+]]			; ATTRIBUTOR_HSA-NEXT: call void @known_func() #[[ATTR29:[0-9]+]]
	; ATTRIBUTOR_HSA-NEXT: ret void			; ATTRIBUTOR_HSA-NEXT: ret void
	;			;
	call void @known_func() #6			call void @known_func() #6
	ret void			ret void
	}			}

	attributes #0 = { nounwind readnone speculatable }			attributes #0 = { nounwind readnone speculatable }
	attributes #1 = { nounwind "target-cpu"="fiji" }			attributes #1 = { nounwind "target-cpu"="fiji" }
	Show All 10 Lines
	; AKF_HSA: attributes #[[ATTR3]] = { nounwind }			; AKF_HSA: attributes #[[ATTR3]] = { nounwind }
	; AKF_HSA: attributes #[[ATTR4]] = { nounwind "amdgpu-calls" }			; AKF_HSA: attributes #[[ATTR4]] = { nounwind "amdgpu-calls" }
	; AKF_HSA: attributes #[[ATTR5]] = { nounwind sanitize_address }			; AKF_HSA: attributes #[[ATTR5]] = { nounwind sanitize_address }
	; AKF_HSA: attributes #[[ATTR6:[0-9]+]] = { nounwind sanitize_address "amdgpu-no-implicitarg-ptr" }			; AKF_HSA: attributes #[[ATTR6:[0-9]+]] = { nounwind sanitize_address "amdgpu-no-implicitarg-ptr" }
	; AKF_HSA: attributes #[[ATTR7]] = { "enqueued-block" }			; AKF_HSA: attributes #[[ATTR7]] = { "enqueued-block" }
	; AKF_HSA: attributes #[[ATTR8]] = { "amdgpu-calls" }			; AKF_HSA: attributes #[[ATTR8]] = { "amdgpu-calls" }
	;.			;.
	; ATTRIBUTOR_HSA: attributes #[[ATTR0:[0-9]+]] = { nocallback nofree nosync nounwind speculatable willreturn memory(none) }			; ATTRIBUTOR_HSA: attributes #[[ATTR0:[0-9]+]] = { nocallback nofree nosync nounwind speculatable willreturn memory(none) }
	; ATTRIBUTOR_HSA: attributes #[[ATTR1]] = { nounwind "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "target-cpu"="fiji" "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR1]] = { nounwind "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "target-cpu"="fiji" "uniform-work-group-size"="false" }
	; ATTRIBUTOR_HSA: attributes #[[ATTR2]] = { nounwind "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-z" "target-cpu"="fiji" "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR2]] = { nounwind "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "target-cpu"="fiji" "uniform-work-group-size"="false" }
	; ATTRIBUTOR_HSA: attributes #[[ATTR3]] = { nounwind "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "target-cpu"="fiji" "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR3]] = { nounwind "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-waves-per-eu"="4,10" "target-cpu"="fiji" "uniform-work-group-size"="false" }
	; ATTRIBUTOR_HSA: attributes #[[ATTR4]] = { nounwind "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "target-cpu"="fiji" "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR4]] = { nounwind "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "target-cpu"="fiji" "uniform-work-group-size"="false" }
	; ATTRIBUTOR_HSA: attributes #[[ATTR5]] = { nounwind "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "target-cpu"="fiji" "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR5]] = { nounwind "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "target-cpu"="fiji" "uniform-work-group-size"="false" }
	; ATTRIBUTOR_HSA: attributes #[[ATTR6]] = { nounwind "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "target-cpu"="fiji" "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR6]] = { nounwind "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "target-cpu"="fiji" "uniform-work-group-size"="false" }
	; ATTRIBUTOR_HSA: attributes #[[ATTR7]] = { nounwind "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "target-cpu"="fiji" "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR7]] = { nounwind "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "target-cpu"="fiji" "uniform-work-group-size"="false" }
	; ATTRIBUTOR_HSA: attributes #[[ATTR8]] = { nounwind "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "target-cpu"="fiji" "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR8]] = { nounwind "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "target-cpu"="fiji" "uniform-work-group-size"="false" }
	; ATTRIBUTOR_HSA: attributes #[[ATTR9]] = { nounwind "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "target-cpu"="fiji" "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR9]] = { nounwind "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "target-cpu"="fiji" "uniform-work-group-size"="false" }
	; ATTRIBUTOR_HSA: attributes #[[ATTR10]] = { nounwind "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "target-cpu"="fiji" "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR10]] = { nounwind "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "target-cpu"="fiji" "uniform-work-group-size"="false" }
	; ATTRIBUTOR_HSA: attributes #[[ATTR11]] = { nounwind "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "target-cpu"="fiji" "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR11]] = { nounwind "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "target-cpu"="fiji" "uniform-work-group-size"="false" }
	; ATTRIBUTOR_HSA: attributes #[[ATTR12]] = { nounwind "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "target-cpu"="gfx900" "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR12]] = { nounwind "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "target-cpu"="gfx900" "uniform-work-group-size"="false" }
	; ATTRIBUTOR_HSA: attributes #[[ATTR13]] = { nounwind "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "target-cpu"="gfx900" "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR13]] = { nounwind "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "target-cpu"="gfx900" "uniform-work-group-size"="false" }
	; ATTRIBUTOR_HSA: attributes #[[ATTR14]] = { nounwind "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "target-cpu"="fiji" "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR14]] = { nounwind "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "target-cpu"="fiji" "uniform-work-group-size"="false" }
	; ATTRIBUTOR_HSA: attributes #[[ATTR15]] = { nounwind "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR15]] = { nounwind "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "target-cpu"="fiji" "uniform-work-group-size"="false" }
	; ATTRIBUTOR_HSA: attributes #[[ATTR16]] = { nounwind "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR16]] = { nounwind "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
	; ATTRIBUTOR_HSA: attributes #[[ATTR17]] = { nounwind sanitize_address "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR17]] = { nounwind "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
	; ATTRIBUTOR_HSA: attributes #[[ATTR18]] = { nounwind "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR18]] = { nounwind "uniform-work-group-size"="false" }
	; ATTRIBUTOR_HSA: attributes #[[ATTR19:[0-9]+]] = { nounwind sanitize_address "amdgpu-no-implicitarg-ptr" "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR19]] = { nounwind sanitize_address "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }
	; ATTRIBUTOR_HSA: attributes #[[ATTR20:[0-9]+]] = { "enqueued-block" "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR20]] = { nounwind sanitize_address "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
	; ATTRIBUTOR_HSA: attributes #[[ATTR21]] = { "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "enqueued-block" "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR21]] = { nounwind "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
	; ATTRIBUTOR_HSA: attributes #[[ATTR22]] = { "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR22]] = { nounwind "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }
	; ATTRIBUTOR_HSA: attributes #[[ATTR23]] = { "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR23:[0-9]+]] = { nounwind sanitize_address "amdgpu-no-implicitarg-ptr" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
	; ATTRIBUTOR_HSA: attributes #[[ATTR24]] = { nounwind }			; ATTRIBUTOR_HSA: attributes #[[ATTR24:[0-9]+]] = { "amdgpu-waves-per-eu"="4,10" "enqueued-block" "uniform-work-group-size"="false" }
	; ATTRIBUTOR_HSA: attributes #[[ATTR25]] = { "enqueued-block" }			; ATTRIBUTOR_HSA: attributes #[[ATTR25]] = { "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "enqueued-block" "uniform-work-group-size"="false" }
				; ATTRIBUTOR_HSA: attributes #[[ATTR26]] = { "uniform-work-group-size"="false" }
				; ATTRIBUTOR_HSA: attributes #[[ATTR27]] = { "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
				; ATTRIBUTOR_HSA: attributes #[[ATTR28]] = { nounwind }
				; ATTRIBUTOR_HSA: attributes #[[ATTR29]] = { "enqueued-block" }
	;.			;.

llvm/test/CodeGen/AMDGPU/annotate-kernel-features-hsa.ll

	Show First 20 Lines • Show All 615 Lines • ▼ Show 20 Lines
	define void @use_alloca_func() #1 {			define void @use_alloca_func() #1 {
	; AKF_HSA-LABEL: define {{[^@]+}}@use_alloca_func			; AKF_HSA-LABEL: define {{[^@]+}}@use_alloca_func
	; AKF_HSA-SAME: () #[[ATTR2]] {			; AKF_HSA-SAME: () #[[ATTR2]] {
	; AKF_HSA-NEXT: [[ALLOCA:%.*]] = alloca i32, align 4, addrspace(5)			; AKF_HSA-NEXT: [[ALLOCA:%.*]] = alloca i32, align 4, addrspace(5)
	; AKF_HSA-NEXT: store i32 0, ptr addrspace(5) [[ALLOCA]], align 4			; AKF_HSA-NEXT: store i32 0, ptr addrspace(5) [[ALLOCA]], align 4
	; AKF_HSA-NEXT: ret void			; AKF_HSA-NEXT: ret void
	;			;
	; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@use_alloca_func			; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@use_alloca_func
	; ATTRIBUTOR_HSA-SAME: () #[[ATTR1]] {			; ATTRIBUTOR_HSA-SAME: () #[[ATTR12:[0-9]+]] {
	; ATTRIBUTOR_HSA-NEXT: [[ALLOCA:%.*]] = alloca i32, align 4, addrspace(5)			; ATTRIBUTOR_HSA-NEXT: [[ALLOCA:%.*]] = alloca i32, align 4, addrspace(5)
	; ATTRIBUTOR_HSA-NEXT: store i32 0, ptr addrspace(5) [[ALLOCA]], align 4			; ATTRIBUTOR_HSA-NEXT: store i32 0, ptr addrspace(5) [[ALLOCA]], align 4
	; ATTRIBUTOR_HSA-NEXT: ret void			; ATTRIBUTOR_HSA-NEXT: ret void
	;			;
	%alloca = alloca i32, addrspace(5)			%alloca = alloca i32, addrspace(5)
	store i32 0, ptr addrspace(5) %alloca			store i32 0, ptr addrspace(5) %alloca
	ret void			ret void
	}			}
	Show All 13 Lines
	; ATTRIBUTOR_HSA: attributes #[[ATTR4]] = { nounwind "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR4]] = { nounwind "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }
	; ATTRIBUTOR_HSA: attributes #[[ATTR5]] = { nounwind "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR5]] = { nounwind "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }
	; ATTRIBUTOR_HSA: attributes #[[ATTR6]] = { nounwind "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR6]] = { nounwind "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "uniform-work-group-size"="false" }
	; ATTRIBUTOR_HSA: attributes #[[ATTR7]] = { nounwind "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR7]] = { nounwind "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }
	; ATTRIBUTOR_HSA: attributes #[[ATTR8]] = { nounwind "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR8]] = { nounwind "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "uniform-work-group-size"="false" }
	; ATTRIBUTOR_HSA: attributes #[[ATTR9]] = { nounwind "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workitem-id-x" "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR9]] = { nounwind "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workitem-id-x" "uniform-work-group-size"="false" }
	; ATTRIBUTOR_HSA: attributes #[[ATTR10]] = { nounwind "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR10]] = { nounwind "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }
	; ATTRIBUTOR_HSA: attributes #[[ATTR11]] = { nounwind "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR11]] = { nounwind "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }
				; ATTRIBUTOR_HSA: attributes #[[ATTR12]] = { nounwind "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
	;.			;.

llvm/test/CodeGen/AMDGPU/attributor-loop-issue-58639.ll

	Show All 21 Lines
	define internal fastcc double @baz(ptr %arg) {			define internal fastcc double @baz(ptr %arg) {
	; CHECK-LABEL: define {{[^@]+}}@baz			; CHECK-LABEL: define {{[^@]+}}@baz
	; CHECK-SAME: (ptr [[ARG:%.*]]) #[[ATTR0]] {			; CHECK-SAME: (ptr [[ARG:%.*]]) #[[ATTR0]] {
	; CHECK-NEXT: bb:			; CHECK-NEXT: bb:
	; CHECK-NEXT: [[TMP1:%.*]] = load ptr, ptr [[ARG]], align 8			; CHECK-NEXT: [[TMP1:%.*]] = load ptr, ptr [[ARG]], align 8
	; CHECK-NEXT: [[TMP2:%.*]] = tail call double [[TMP1]]()			; CHECK-NEXT: [[TMP2:%.*]] = tail call double [[TMP1]]()
	; CHECK-NEXT: br label [[BB3:%.*]]			; CHECK-NEXT: br label [[BB3:%.*]]
	; CHECK: bb3:			; CHECK: bb3:
	; CHECK-NEXT: [[TMP4:%.*]] = getelementptr inbounds [[TMP0]], ptr [[ARG]], i64 0, i32 1			; CHECK-NEXT: [[TMP4:%.]] = getelementptr inbounds [[TMP0:%.]], ptr [[ARG]], i64 0, i32 1
	; CHECK-NEXT: br label [[BB5:%.*]]			; CHECK-NEXT: br label [[BB5:%.*]]
	; CHECK: bb5:			; CHECK: bb5:
	; CHECK-NEXT: [[TMP6:%.*]] = load ptr, ptr [[TMP4]], align 8			; CHECK-NEXT: [[TMP6:%.*]] = load ptr, ptr [[TMP4]], align 8
	; CHECK-NEXT: [[TMP7:%.*]] = call fastcc i1 @widget(ptr [[TMP6]])			; CHECK-NEXT: [[TMP7:%.*]] = call fastcc i1 @widget(ptr [[TMP6]])
	; CHECK-NEXT: br label [[BB5]]			; CHECK-NEXT: br label [[BB5]]
	;			;
	bb:			bb:
	%tmp1 = load ptr, ptr %arg, align 8			%tmp1 = load ptr, ptr %arg, align 8
	Show All 19 Lines
	; CHECK-NEXT: ret void			; CHECK-NEXT: ret void
	;			;
	%alloca = alloca %0, align 8, addrspace(5)			%alloca = alloca %0, align 8, addrspace(5)
	%cast = addrspacecast ptr addrspace(5) %alloca to ptr			%cast = addrspacecast ptr addrspace(5) %alloca to ptr
	%arst = call double @baz(ptr %cast)			%arst = call double @baz(ptr %cast)
	ret void			ret void
	}			}
	;.			;.
	; CHECK: attributes #[[ATTR0]] = { "uniform-work-group-size"="false" }			; CHECK: attributes #[[ATTR0]] = { "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
	;.			;.

llvm/test/CodeGen/AMDGPU/direct-indirect-call.ll

	Show All 29 Lines
	; CHECK-SAME: () #[[ATTR1]] {			; CHECK-SAME: () #[[ATTR1]] {
	; CHECK-NEXT: call void @direct()			; CHECK-NEXT: call void @direct()
	; CHECK-NEXT: ret void			; CHECK-NEXT: ret void
	;			;
	call void @direct()			call void @direct()
	ret void			ret void
	}			}
	;.			;.
	; CHECK: attributes #[[ATTR0]] = { "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }			; CHECK: attributes #[[ATTR0]] = { "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
	; CHECK: attributes #[[ATTR1]] = { "uniform-work-group-size"="false" }			; CHECK: attributes #[[ATTR1]] = { "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
	;.			;.

llvm/test/CodeGen/AMDGPU/duplicate-attribute-indirect.ll

Show All 36 Lines	;
ret void		ret void
}		}

attributes #0 = { "amdgpu-no-dispatch-id" }		attributes #0 = { "amdgpu-no-dispatch-id" }

;.		;.
; AKF_GCN: attributes #[[ATTR0]] = { "amdgpu-calls" "amdgpu-no-dispatch-id" "amdgpu-stack-objects" }		; AKF_GCN: attributes #[[ATTR0]] = { "amdgpu-calls" "amdgpu-no-dispatch-id" "amdgpu-stack-objects" }
;.		;.
; ATTRIBUTOR_GCN: attributes #[[ATTR0]] = { "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }		; ATTRIBUTOR_GCN: attributes #[[ATTR0]] = { "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
; ATTRIBUTOR_GCN: attributes #[[ATTR1]] = { "amdgpu-no-dispatch-id" "uniform-work-group-size"="false" }		; ATTRIBUTOR_GCN: attributes #[[ATTR1]] = { "amdgpu-no-dispatch-id" "uniform-work-group-size"="false" }
;.		;.

llvm/test/CodeGen/AMDGPU/implicitarg-offset-attributes.ll

Show First 20 Lines • Show All 63 Lines • ▼ Show 20 Lines	;
%val8 = call i32 @llvm.amdgcn.lds.kernel.id()		%val8 = call i32 @llvm.amdgcn.lds.kernel.id()
store volatile i32 %val8, ptr addrspace(1) null		store volatile i32 %val8, ptr addrspace(1) null
%val9 = call i64 @llvm.amdgcn.dispatch.id()		%val9 = call i64 @llvm.amdgcn.dispatch.id()
store volatile i64 %val9, ptr addrspace(1) null		store volatile i64 %val9, ptr addrspace(1) null
ret void		ret void
}		}

define amdgpu_kernel void @test_default_queue_offset_v4_0(ptr addrspace(1) %kernarg) {		define amdgpu_kernel void @test_default_queue_offset_v4_0(ptr addrspace(1) %kernarg) {
; V4-LABEL: define {{[^@]+}}@test_default_queue_offset_v4_0		; CHECK-LABEL: define {{[^@]+}}@test_default_queue_offset_v4_0
; V4-SAME: (ptr addrspace(1) [[KERNARG:%.*]]) #[[ATTR2:[0-9]+]] {		; CHECK-SAME: (ptr addrspace(1) [[KERNARG:%.*]]) #[[ATTR2:[0-9]+]] {
; V4-NEXT: call void @use_everything_else()		; CHECK-NEXT: call void @use_everything_else()
; V4-NEXT: [[IMPLICITARG_PTR:%.*]] = call ptr addrspace(4) @llvm.amdgcn.implicitarg.ptr()		; CHECK-NEXT: [[IMPLICITARG_PTR:%.*]] = call ptr addrspace(4) @llvm.amdgcn.implicitarg.ptr()
; V4-NEXT: [[GEP:%.*]] = getelementptr inbounds i8, ptr addrspace(4) [[IMPLICITARG_PTR]], i64 32		; CHECK-NEXT: [[GEP:%.*]] = getelementptr inbounds i8, ptr addrspace(4) [[IMPLICITARG_PTR]], i64 32
; V4-NEXT: [[LOAD:%.*]] = load ptr, ptr addrspace(4) [[GEP]], align 8		; CHECK-NEXT: [[LOAD:%.*]] = load ptr, ptr addrspace(4) [[GEP]], align 8
; V4-NEXT: store ptr [[LOAD]], ptr addrspace(1) [[KERNARG]], align 8		; CHECK-NEXT: store ptr [[LOAD]], ptr addrspace(1) [[KERNARG]], align 8
; V4-NEXT: ret void		; CHECK-NEXT: ret void
;
; V5-LABEL: define {{[^@]+}}@test_default_queue_offset_v4_0
; V5-SAME: (ptr addrspace(1) [[KERNARG:%.*]]) #[[ATTR1]] {
; V5-NEXT: call void @use_everything_else()
; V5-NEXT: [[IMPLICITARG_PTR:%.*]] = call ptr addrspace(4) @llvm.amdgcn.implicitarg.ptr()
; V5-NEXT: [[GEP:%.*]] = getelementptr inbounds i8, ptr addrspace(4) [[IMPLICITARG_PTR]], i64 32
; V5-NEXT: [[LOAD:%.*]] = load ptr, ptr addrspace(4) [[GEP]], align 8
; V5-NEXT: store ptr [[LOAD]], ptr addrspace(1) [[KERNARG]], align 8
; V5-NEXT: ret void
;		;
call void @use_everything_else()		call void @use_everything_else()
%implicitarg.ptr = call ptr addrspace(4) @llvm.amdgcn.implicitarg.ptr()		%implicitarg.ptr = call ptr addrspace(4) @llvm.amdgcn.implicitarg.ptr()
%gep = getelementptr inbounds i8, ptr addrspace(4) %implicitarg.ptr, i64 32		%gep = getelementptr inbounds i8, ptr addrspace(4) %implicitarg.ptr, i64 32
%load = load ptr, ptr addrspace(4) %gep		%load = load ptr, ptr addrspace(4) %gep
store ptr %load, ptr addrspace(1) %kernarg		store ptr %load, ptr addrspace(1) %kernarg
ret void		ret void
}		}

define amdgpu_kernel void @test_default_queue_offset_v5_0(ptr addrspace(1) %kernarg) {		define amdgpu_kernel void @test_default_queue_offset_v5_0(ptr addrspace(1) %kernarg) {
; V4-LABEL: define {{[^@]+}}@test_default_queue_offset_v5_0		; CHECK-LABEL: define {{[^@]+}}@test_default_queue_offset_v5_0
; V4-SAME: (ptr addrspace(1) [[KERNARG:%.*]]) #[[ATTR3:[0-9]+]] {		; CHECK-SAME: (ptr addrspace(1) [[KERNARG:%.*]]) #[[ATTR3:[0-9]+]] {
; V4-NEXT: call void @use_everything_else()		; CHECK-NEXT: call void @use_everything_else()
; V4-NEXT: [[IMPLICITARG_PTR:%.*]] = call ptr addrspace(4) @llvm.amdgcn.implicitarg.ptr()		; CHECK-NEXT: [[IMPLICITARG_PTR:%.*]] = call ptr addrspace(4) @llvm.amdgcn.implicitarg.ptr()
; V4-NEXT: [[GEP:%.*]] = getelementptr inbounds i8, ptr addrspace(4) [[IMPLICITARG_PTR]], i64 104		; CHECK-NEXT: [[GEP:%.*]] = getelementptr inbounds i8, ptr addrspace(4) [[IMPLICITARG_PTR]], i64 104
; V4-NEXT: [[LOAD:%.*]] = load ptr, ptr addrspace(4) [[GEP]], align 8		; CHECK-NEXT: [[LOAD:%.*]] = load ptr, ptr addrspace(4) [[GEP]], align 8
; V4-NEXT: store ptr [[LOAD]], ptr addrspace(1) [[KERNARG]], align 8		; CHECK-NEXT: store ptr [[LOAD]], ptr addrspace(1) [[KERNARG]], align 8
; V4-NEXT: ret void		; CHECK-NEXT: ret void
;
; V5-LABEL: define {{[^@]+}}@test_default_queue_offset_v5_0
; V5-SAME: (ptr addrspace(1) [[KERNARG:%.*]]) #[[ATTR2:[0-9]+]] {
; V5-NEXT: call void @use_everything_else()
; V5-NEXT: [[IMPLICITARG_PTR:%.*]] = call ptr addrspace(4) @llvm.amdgcn.implicitarg.ptr()
; V5-NEXT: [[GEP:%.*]] = getelementptr inbounds i8, ptr addrspace(4) [[IMPLICITARG_PTR]], i64 104
; V5-NEXT: [[LOAD:%.*]] = load ptr, ptr addrspace(4) [[GEP]], align 8
; V5-NEXT: store ptr [[LOAD]], ptr addrspace(1) [[KERNARG]], align 8
; V5-NEXT: ret void
;		;
call void @use_everything_else()		call void @use_everything_else()
%implicitarg.ptr = call ptr addrspace(4) @llvm.amdgcn.implicitarg.ptr()		%implicitarg.ptr = call ptr addrspace(4) @llvm.amdgcn.implicitarg.ptr()
%gep = getelementptr inbounds i8, ptr addrspace(4) %implicitarg.ptr, i64 104		%gep = getelementptr inbounds i8, ptr addrspace(4) %implicitarg.ptr, i64 104
%load = load ptr, ptr addrspace(4) %gep		%load = load ptr, ptr addrspace(4) %gep
store ptr %load, ptr addrspace(1) %kernarg		store ptr %load, ptr addrspace(1) %kernarg
ret void		ret void
}		}

define amdgpu_kernel void @test_completion_action_offset_v4_0(ptr addrspace(1) %kernarg) {		define amdgpu_kernel void @test_completion_action_offset_v4_0(ptr addrspace(1) %kernarg) {
; V4-LABEL: define {{[^@]+}}@test_completion_action_offset_v4_0		; V4-LABEL: define {{[^@]+}}@test_completion_action_offset_v4_0
; V4-SAME: (ptr addrspace(1) [[KERNARG:%.*]]) #[[ATTR4:[0-9]+]] {		; V4-SAME: (ptr addrspace(1) [[KERNARG:%.*]]) #[[ATTR4:[0-9]+]] {
; V4-NEXT: call void @use_everything_else()		; V4-NEXT: call void @use_everything_else()
; V4-NEXT: [[IMPLICITARG_PTR:%.*]] = call ptr addrspace(4) @llvm.amdgcn.implicitarg.ptr()		; V4-NEXT: [[IMPLICITARG_PTR:%.*]] = call ptr addrspace(4) @llvm.amdgcn.implicitarg.ptr()
; V4-NEXT: [[GEP:%.*]] = getelementptr inbounds i8, ptr addrspace(4) [[IMPLICITARG_PTR]], i64 40		; V4-NEXT: [[GEP:%.*]] = getelementptr inbounds i8, ptr addrspace(4) [[IMPLICITARG_PTR]], i64 40
; V4-NEXT: [[LOAD:%.*]] = load ptr, ptr addrspace(4) [[GEP]], align 8		; V4-NEXT: [[LOAD:%.*]] = load ptr, ptr addrspace(4) [[GEP]], align 8
; V4-NEXT: store ptr [[LOAD]], ptr addrspace(1) [[KERNARG]], align 8		; V4-NEXT: store ptr [[LOAD]], ptr addrspace(1) [[KERNARG]], align 8
; V4-NEXT: ret void		; V4-NEXT: ret void
;		;
; V5-LABEL: define {{[^@]+}}@test_completion_action_offset_v4_0		; V5-LABEL: define {{[^@]+}}@test_completion_action_offset_v4_0
; V5-SAME: (ptr addrspace(1) [[KERNARG:%.*]]) #[[ATTR1]] {		; V5-SAME: (ptr addrspace(1) [[KERNARG:%.*]]) #[[ATTR2]] {
; V5-NEXT: call void @use_everything_else()		; V5-NEXT: call void @use_everything_else()
; V5-NEXT: [[IMPLICITARG_PTR:%.*]] = call ptr addrspace(4) @llvm.amdgcn.implicitarg.ptr()		; V5-NEXT: [[IMPLICITARG_PTR:%.*]] = call ptr addrspace(4) @llvm.amdgcn.implicitarg.ptr()
; V5-NEXT: [[GEP:%.*]] = getelementptr inbounds i8, ptr addrspace(4) [[IMPLICITARG_PTR]], i64 40		; V5-NEXT: [[GEP:%.*]] = getelementptr inbounds i8, ptr addrspace(4) [[IMPLICITARG_PTR]], i64 40
; V5-NEXT: [[LOAD:%.*]] = load ptr, ptr addrspace(4) [[GEP]], align 8		; V5-NEXT: [[LOAD:%.*]] = load ptr, ptr addrspace(4) [[GEP]], align 8
; V5-NEXT: store ptr [[LOAD]], ptr addrspace(1) [[KERNARG]], align 8		; V5-NEXT: store ptr [[LOAD]], ptr addrspace(1) [[KERNARG]], align 8
; V5-NEXT: ret void		; V5-NEXT: ret void
;		;
call void @use_everything_else()		call void @use_everything_else()
%implicitarg.ptr = call ptr addrspace(4) @llvm.amdgcn.implicitarg.ptr()		%implicitarg.ptr = call ptr addrspace(4) @llvm.amdgcn.implicitarg.ptr()
%gep = getelementptr inbounds i8, ptr addrspace(4) %implicitarg.ptr, i64 40		%gep = getelementptr inbounds i8, ptr addrspace(4) %implicitarg.ptr, i64 40
%load = load ptr, ptr addrspace(4) %gep		%load = load ptr, ptr addrspace(4) %gep
store ptr %load, ptr addrspace(1) %kernarg		store ptr %load, ptr addrspace(1) %kernarg
ret void		ret void
}		}

define amdgpu_kernel void @test_completion_action_offset_v5_0(ptr addrspace(1) %kernarg) {		define amdgpu_kernel void @test_completion_action_offset_v5_0(ptr addrspace(1) %kernarg) {
; CHECK-LABEL: define {{[^@]+}}@test_completion_action_offset_v5_0		; V4-LABEL: define {{[^@]+}}@test_completion_action_offset_v5_0
; CHECK-SAME: (ptr addrspace(1) [[KERNARG:%.*]]) #[[ATTR3:[0-9]+]] {		; V4-SAME: (ptr addrspace(1) [[KERNARG:%.*]]) #[[ATTR3]] {
; CHECK-NEXT: call void @use_everything_else()		; V4-NEXT: call void @use_everything_else()
; CHECK-NEXT: [[IMPLICITARG_PTR:%.*]] = call ptr addrspace(4) @llvm.amdgcn.implicitarg.ptr()		; V4-NEXT: [[IMPLICITARG_PTR:%.*]] = call ptr addrspace(4) @llvm.amdgcn.implicitarg.ptr()
; CHECK-NEXT: [[GEP:%.*]] = getelementptr inbounds i8, ptr addrspace(4) [[IMPLICITARG_PTR]], i64 112		; V4-NEXT: [[GEP:%.*]] = getelementptr inbounds i8, ptr addrspace(4) [[IMPLICITARG_PTR]], i64 112
; CHECK-NEXT: [[LOAD:%.*]] = load ptr, ptr addrspace(4) [[GEP]], align 8		; V4-NEXT: [[LOAD:%.*]] = load ptr, ptr addrspace(4) [[GEP]], align 8
; CHECK-NEXT: store ptr [[LOAD]], ptr addrspace(1) [[KERNARG]], align 8		; V4-NEXT: store ptr [[LOAD]], ptr addrspace(1) [[KERNARG]], align 8
; CHECK-NEXT: ret void		; V4-NEXT: ret void
		;
		; V5-LABEL: define {{[^@]+}}@test_completion_action_offset_v5_0
		; V5-SAME: (ptr addrspace(1) [[KERNARG:%.*]]) #[[ATTR4:[0-9]+]] {
		; V5-NEXT: call void @use_everything_else()
		; V5-NEXT: [[IMPLICITARG_PTR:%.*]] = call ptr addrspace(4) @llvm.amdgcn.implicitarg.ptr()
		; V5-NEXT: [[GEP:%.*]] = getelementptr inbounds i8, ptr addrspace(4) [[IMPLICITARG_PTR]], i64 112
		; V5-NEXT: [[LOAD:%.*]] = load ptr, ptr addrspace(4) [[GEP]], align 8
		; V5-NEXT: store ptr [[LOAD]], ptr addrspace(1) [[KERNARG]], align 8
		; V5-NEXT: ret void
;		;
call void @use_everything_else()		call void @use_everything_else()
%implicitarg.ptr = call ptr addrspace(4) @llvm.amdgcn.implicitarg.ptr()		%implicitarg.ptr = call ptr addrspace(4) @llvm.amdgcn.implicitarg.ptr()
%gep = getelementptr inbounds i8, ptr addrspace(4) %implicitarg.ptr, i64 112		%gep = getelementptr inbounds i8, ptr addrspace(4) %implicitarg.ptr, i64 112
%load = load ptr, ptr addrspace(4) %gep		%load = load ptr, ptr addrspace(4) %gep
store ptr %load, ptr addrspace(1) %kernarg		store ptr %load, ptr addrspace(1) %kernarg
ret void		ret void
}		}

define amdgpu_kernel void @test_default_queue_completion_action_offset_v3_0(ptr addrspace(1) %kernarg) {		define amdgpu_kernel void @test_default_queue_completion_action_offset_v3_0(ptr addrspace(1) %kernarg) {
; V4-LABEL: define {{[^@]+}}@test_default_queue_completion_action_offset_v3_0		; V4-LABEL: define {{[^@]+}}@test_default_queue_completion_action_offset_v3_0
; V4-SAME: (ptr addrspace(1) [[KERNARG:%.*]]) #[[ATTR5:[0-9]+]] {		; V4-SAME: (ptr addrspace(1) [[KERNARG:%.*]]) #[[ATTR5:[0-9]+]] {
; V4-NEXT: call void @use_everything_else()		; V4-NEXT: call void @use_everything_else()
; V4-NEXT: [[IMPLICITARG_PTR:%.*]] = call ptr addrspace(4) @llvm.amdgcn.implicitarg.ptr()		; V4-NEXT: [[IMPLICITARG_PTR:%.*]] = call ptr addrspace(4) @llvm.amdgcn.implicitarg.ptr()
; V4-NEXT: [[GEP:%.*]] = getelementptr inbounds i8, ptr addrspace(4) [[IMPLICITARG_PTR]], i64 32		; V4-NEXT: [[GEP:%.*]] = getelementptr inbounds i8, ptr addrspace(4) [[IMPLICITARG_PTR]], i64 32
; V4-NEXT: [[LOAD:%.*]] = load <2 x ptr>, ptr addrspace(4) [[GEP]], align 16		; V4-NEXT: [[LOAD:%.*]] = load <2 x ptr>, ptr addrspace(4) [[GEP]], align 16
; V4-NEXT: store <2 x ptr> [[LOAD]], ptr addrspace(1) [[KERNARG]], align 16		; V4-NEXT: store <2 x ptr> [[LOAD]], ptr addrspace(1) [[KERNARG]], align 16
; V4-NEXT: ret void		; V4-NEXT: ret void
;		;
; V5-LABEL: define {{[^@]+}}@test_default_queue_completion_action_offset_v3_0		; V5-LABEL: define {{[^@]+}}@test_default_queue_completion_action_offset_v3_0
; V5-SAME: (ptr addrspace(1) [[KERNARG:%.*]]) #[[ATTR1]] {		; V5-SAME: (ptr addrspace(1) [[KERNARG:%.*]]) #[[ATTR2]] {
; V5-NEXT: call void @use_everything_else()		; V5-NEXT: call void @use_everything_else()
; V5-NEXT: [[IMPLICITARG_PTR:%.*]] = call ptr addrspace(4) @llvm.amdgcn.implicitarg.ptr()		; V5-NEXT: [[IMPLICITARG_PTR:%.*]] = call ptr addrspace(4) @llvm.amdgcn.implicitarg.ptr()
; V5-NEXT: [[GEP:%.*]] = getelementptr inbounds i8, ptr addrspace(4) [[IMPLICITARG_PTR]], i64 32		; V5-NEXT: [[GEP:%.*]] = getelementptr inbounds i8, ptr addrspace(4) [[IMPLICITARG_PTR]], i64 32
; V5-NEXT: [[LOAD:%.*]] = load <2 x ptr>, ptr addrspace(4) [[GEP]], align 16		; V5-NEXT: [[LOAD:%.*]] = load <2 x ptr>, ptr addrspace(4) [[GEP]], align 16
; V5-NEXT: store <2 x ptr> [[LOAD]], ptr addrspace(1) [[KERNARG]], align 16		; V5-NEXT: store <2 x ptr> [[LOAD]], ptr addrspace(1) [[KERNARG]], align 16
; V5-NEXT: ret void		; V5-NEXT: ret void
;		;
call void @use_everything_else()		call void @use_everything_else()
Show All 10 Lines
; V4-NEXT: call void @use_everything_else()		; V4-NEXT: call void @use_everything_else()
; V4-NEXT: [[IMPLICITARG_PTR:%.*]] = call ptr addrspace(4) @llvm.amdgcn.implicitarg.ptr()		; V4-NEXT: [[IMPLICITARG_PTR:%.*]] = call ptr addrspace(4) @llvm.amdgcn.implicitarg.ptr()
; V4-NEXT: [[GEP:%.*]] = getelementptr inbounds i8, ptr addrspace(4) [[IMPLICITARG_PTR]], i64 104		; V4-NEXT: [[GEP:%.*]] = getelementptr inbounds i8, ptr addrspace(4) [[IMPLICITARG_PTR]], i64 104
; V4-NEXT: [[LOAD:%.*]] = load <2 x ptr>, ptr addrspace(4) [[GEP]], align 16		; V4-NEXT: [[LOAD:%.*]] = load <2 x ptr>, ptr addrspace(4) [[GEP]], align 16
; V4-NEXT: store <2 x ptr> [[LOAD]], ptr addrspace(1) [[KERNARG]], align 16		; V4-NEXT: store <2 x ptr> [[LOAD]], ptr addrspace(1) [[KERNARG]], align 16
; V4-NEXT: ret void		; V4-NEXT: ret void
;		;
; V5-LABEL: define {{[^@]+}}@test_default_queue_completion_action_offset_v5_0		; V5-LABEL: define {{[^@]+}}@test_default_queue_completion_action_offset_v5_0
; V5-SAME: (ptr addrspace(1) [[KERNARG:%.*]]) #[[ATTR4:[0-9]+]] {		; V5-SAME: (ptr addrspace(1) [[KERNARG:%.*]]) #[[ATTR5:[0-9]+]] {
; V5-NEXT: call void @use_everything_else()		; V5-NEXT: call void @use_everything_else()
; V5-NEXT: [[IMPLICITARG_PTR:%.*]] = call ptr addrspace(4) @llvm.amdgcn.implicitarg.ptr()		; V5-NEXT: [[IMPLICITARG_PTR:%.*]] = call ptr addrspace(4) @llvm.amdgcn.implicitarg.ptr()
; V5-NEXT: [[GEP:%.*]] = getelementptr inbounds i8, ptr addrspace(4) [[IMPLICITARG_PTR]], i64 104		; V5-NEXT: [[GEP:%.*]] = getelementptr inbounds i8, ptr addrspace(4) [[IMPLICITARG_PTR]], i64 104
; V5-NEXT: [[LOAD:%.*]] = load <2 x ptr>, ptr addrspace(4) [[GEP]], align 16		; V5-NEXT: [[LOAD:%.*]] = load <2 x ptr>, ptr addrspace(4) [[GEP]], align 16
; V5-NEXT: store <2 x ptr> [[LOAD]], ptr addrspace(1) [[KERNARG]], align 16		; V5-NEXT: store <2 x ptr> [[LOAD]], ptr addrspace(1) [[KERNARG]], align 16
; V5-NEXT: ret void		; V5-NEXT: ret void
;		;

call void @use_everything_else()%implicitarg.ptr = call ptr addrspace(4) @llvm.amdgcn.implicitarg.ptr()		call void @use_everything_else()%implicitarg.ptr = call ptr addrspace(4) @llvm.amdgcn.implicitarg.ptr()
%gep = getelementptr inbounds i8, ptr addrspace(4) %implicitarg.ptr, i64 104		%gep = getelementptr inbounds i8, ptr addrspace(4) %implicitarg.ptr, i64 104
%load = load <2 x ptr>, ptr addrspace(4) %gep		%load = load <2 x ptr>, ptr addrspace(4) %gep
store <2 x ptr> %load, ptr addrspace(1) %kernarg		store <2 x ptr> %load, ptr addrspace(1) %kernarg
ret void		ret void
}		}


attributes #0 = { nocallback nofree nosync nounwind speculatable willreturn memory(none) }		attributes #0 = { nocallback nofree nosync nounwind speculatable willreturn memory(none) }

!llvm.module.flags = !{!0}		!llvm.module.flags = !{!0}
!0 = !{i32 1, !"amdgpu_code_object_version", i32 CODE_OBJECT_VERSION}		!0 = !{i32 1, !"amdgpu_code_object_version", i32 CODE_OBJECT_VERSION}


;.		;.
; V4: attributes #[[ATTR0:[0-9]+]] = { nocallback nofree nosync nounwind speculatable willreturn memory(none) }		; V4: attributes #[[ATTR0:[0-9]+]] = { nocallback nofree nosync nounwind speculatable willreturn memory(none) }
; V4: attributes #[[ATTR1]] = { "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-multigrid-sync-arg" "uniform-work-group-size"="false" }		; V4: attributes #[[ATTR1]] = { "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-multigrid-sync-arg" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
; V4: attributes #[[ATTR2]] = { "amdgpu-no-completion-action" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-multigrid-sync-arg" "uniform-work-group-size"="false" }		; V4: attributes #[[ATTR2]] = { "amdgpu-no-completion-action" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-multigrid-sync-arg" "uniform-work-group-size"="false" }
; V4: attributes #[[ATTR3]] = { "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-multigrid-sync-arg" "uniform-work-group-size"="false" }		; V4: attributes #[[ATTR3]] = { "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-multigrid-sync-arg" "uniform-work-group-size"="false" }
; V4: attributes #[[ATTR4]] = { "amdgpu-no-default-queue" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-multigrid-sync-arg" "uniform-work-group-size"="false" }		; V4: attributes #[[ATTR4]] = { "amdgpu-no-default-queue" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-multigrid-sync-arg" "uniform-work-group-size"="false" }
; V4: attributes #[[ATTR5]] = { "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-multigrid-sync-arg" "uniform-work-group-size"="false" }		; V4: attributes #[[ATTR5]] = { "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-multigrid-sync-arg" "uniform-work-group-size"="false" }
;.		;.
; V5: attributes #[[ATTR0:[0-9]+]] = { nocallback nofree nosync nounwind speculatable willreturn memory(none) }		; V5: attributes #[[ATTR0:[0-9]+]] = { nocallback nofree nosync nounwind speculatable willreturn memory(none) }
; V5: attributes #[[ATTR1]] = { "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-multigrid-sync-arg" "uniform-work-group-size"="false" }		; V5: attributes #[[ATTR1]] = { "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-multigrid-sync-arg" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
; V5: attributes #[[ATTR2]] = { "amdgpu-no-completion-action" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-multigrid-sync-arg" "uniform-work-group-size"="false" }		; V5: attributes #[[ATTR2]] = { "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-multigrid-sync-arg" "uniform-work-group-size"="false" }
; V5: attributes #[[ATTR3]] = { "amdgpu-no-default-queue" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-multigrid-sync-arg" "uniform-work-group-size"="false" }		; V5: attributes #[[ATTR3]] = { "amdgpu-no-completion-action" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-multigrid-sync-arg" "uniform-work-group-size"="false" }
; V5: attributes #[[ATTR4]] = { "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-multigrid-sync-arg" "uniform-work-group-size"="false" }		; V5: attributes #[[ATTR4]] = { "amdgpu-no-default-queue" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-multigrid-sync-arg" "uniform-work-group-size"="false" }
		; V5: attributes #[[ATTR5]] = { "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-multigrid-sync-arg" "uniform-work-group-size"="false" }
;.		;.
; V4: [[META0:![0-9]+]] = !{i32 1, !"amdgpu_code_object_version", i32 400}		; V4: [[META0:![0-9]+]] = !{i32 1, !"amdgpu_code_object_version", i32 400}
;.		;.
; V5: [[META0:![0-9]+]] = !{i32 1, !"amdgpu_code_object_version", i32 500}		; V5: [[META0:![0-9]+]] = !{i32 1, !"amdgpu_code_object_version", i32 500}
;.		;.

llvm/test/CodeGen/AMDGPU/propagate-flat-work-group-size.ll

	Show First 20 Lines • Show All 198 Lines • ▼ Show 20 Lines
	attributes #3 = { "amdgpu-flat-work-group-size"="128,256" }			attributes #3 = { "amdgpu-flat-work-group-size"="128,256" }
	attributes #4 = { "amdgpu-flat-work-group-size"="512,1024" }			attributes #4 = { "amdgpu-flat-work-group-size"="512,1024" }
	attributes #5 = { "amdgpu-flat-work-group-size"="128,512" }			attributes #5 = { "amdgpu-flat-work-group-size"="128,512" }
	attributes #6 = { "amdgpu-flat-work-group-size"="512,512" }			attributes #6 = { "amdgpu-flat-work-group-size"="512,512" }
	attributes #7 = { "amdgpu-flat-work-group-size"="64,256" }			attributes #7 = { "amdgpu-flat-work-group-size"="64,256" }
	;.			;.
	; CHECK: attributes #[[ATTR0]] = { "amdgpu-flat-work-group-size"="1,256" "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }			; CHECK: attributes #[[ATTR0]] = { "amdgpu-flat-work-group-size"="1,256" "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }
	; CHECK: attributes #[[ATTR1]] = { "amdgpu-flat-work-group-size"="64,128" "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }			; CHECK: attributes #[[ATTR1]] = { "amdgpu-flat-work-group-size"="64,128" "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }
	; CHECK: attributes #[[ATTR2]] = { "amdgpu-flat-work-group-size"="128,512" "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }			; CHECK: attributes #[[ATTR2]] = { "amdgpu-flat-work-group-size"="128,512" "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="2,10" "uniform-work-group-size"="false" }
	; CHECK: attributes #[[ATTR3]] = { "amdgpu-flat-work-group-size"="64,64" "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }			; CHECK: attributes #[[ATTR3]] = { "amdgpu-flat-work-group-size"="64,64" "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }
	; CHECK: attributes #[[ATTR4]] = { "amdgpu-flat-work-group-size"="128,128" "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }			; CHECK: attributes #[[ATTR4]] = { "amdgpu-flat-work-group-size"="128,128" "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }
	; CHECK: attributes #[[ATTR5]] = { "amdgpu-flat-work-group-size"="512,512" "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }			; CHECK: attributes #[[ATTR5]] = { "amdgpu-flat-work-group-size"="512,512" "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="2,10" "uniform-work-group-size"="false" }
	; CHECK: attributes #[[ATTR6]] = { "amdgpu-flat-work-group-size"="64,256" "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }			; CHECK: attributes #[[ATTR6]] = { "amdgpu-flat-work-group-size"="64,256" "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }
	; CHECK: attributes #[[ATTR7]] = { "amdgpu-flat-work-group-size"="128,256" "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }			; CHECK: attributes #[[ATTR7]] = { "amdgpu-flat-work-group-size"="128,256" "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }
	; CHECK: attributes #[[ATTR8]] = { "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }			; CHECK: attributes #[[ATTR8]] = { "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
	;.			;.

llvm/test/CodeGen/AMDGPU/propagate-waves-per-eu.ll

; NOTE: Assertions have been autogenerated by utils/update_test_checks.py UTC_ARGS: --check-attributes --check-globals --version 2		; NOTE: Assertions have been autogenerated by utils/update_test_checks.py UTC_ARGS: --check-attributes --check-globals --version 2
; RUN: opt -S -mtriple=amdgcn-amd-amdhsa -amdgpu-attributor %s \| FileCheck %s		; RUN: opt -S -mtriple=amdgcn-amd-amdhsa -amdgpu-attributor %s \| FileCheck %s

; Check propagation of amdgpu-flat-work-group-size attribute.		; Check propagation of amdgpu-flat-work-group-size attribute.

; Called from a single kernel with 1,8		; Called from a single kernel with 1,8
define internal void @default_to_1_8_a() {		define internal void @default_to_1_8_a() {
; CHECK-LABEL: define internal void @default_to_1_8_a		; CHECK-LABEL: define internal void @default_to_1_8_a
; CHECK-SAME: () #[[ATTR0:[0-9]+]] {		; CHECK-SAME: () #[[ATTR0:[0-9]+]] {
; CHECK-NEXT: ret void		; CHECK-NEXT: ret void
;		;
ret void		ret void
}		}

define amdgpu_kernel void @kernel_1_8() #0 {		define amdgpu_kernel void @kernel_1_8() #0 {
; CHECK-LABEL: define amdgpu_kernel void @kernel_1_8		; CHECK-LABEL: define amdgpu_kernel void @kernel_1_8
; CHECK-SAME: () #[[ATTR1:[0-9]+]] {		; CHECK-SAME: () #[[ATTR0]] {
; CHECK-NEXT: call void @default_to_1_8_a()		; CHECK-NEXT: call void @default_to_1_8_a()
; CHECK-NEXT: ret void		; CHECK-NEXT: ret void
;		;
call void @default_to_1_8_a()		call void @default_to_1_8_a()
ret void		ret void
}		}

; Called from a single kernel with 1,2		; Called from a single kernel with 1,2
define internal void @default_to_1_2() {		define internal void @default_to_1_2() {
; CHECK-LABEL: define internal void @default_to_1_2		; CHECK-LABEL: define internal void @default_to_1_2
; CHECK-SAME: () #[[ATTR0]] {		; CHECK-SAME: () #[[ATTR1:[0-9]+]] {
; CHECK-NEXT: ret void		; CHECK-NEXT: ret void
;		;
ret void		ret void
}		}

define amdgpu_kernel void @kernel_1_2() #1 {		define amdgpu_kernel void @kernel_1_2() #1 {
; CHECK-LABEL: define amdgpu_kernel void @kernel_1_2		; CHECK-LABEL: define amdgpu_kernel void @kernel_1_2
; CHECK-SAME: () #[[ATTR2:[0-9]+]] {		; CHECK-SAME: () #[[ATTR1]] {
; CHECK-NEXT: call void @default_to_1_2()		; CHECK-NEXT: call void @default_to_1_2()
; CHECK-NEXT: call void @flat_group_1_1()		; CHECK-NEXT: call void @flat_group_1_1()
; CHECK-NEXT: call void @default_to_1_8_b()		; CHECK-NEXT: call void @default_to_1_8_b()
; CHECK-NEXT: call void @flat_group_2_8()		; CHECK-NEXT: call void @flat_group_2_8()
; CHECK-NEXT: ret void		; CHECK-NEXT: ret void
;		;
call void @default_to_1_2()		call void @default_to_1_2()
call void @flat_group_1_1()		call void @flat_group_1_1()
call void @default_to_1_8_b()		call void @default_to_1_8_b()
call void @flat_group_2_8()		call void @flat_group_2_8()
ret void		ret void
}		}

; Called from a single kernel with 1,4		; Called from a single kernel with 1,4
define internal void @default_to_1_4() {		define internal void @default_to_1_4() {
; CHECK-LABEL: define internal void @default_to_1_4		; CHECK-LABEL: define internal void @default_to_1_4
; CHECK-SAME: () #[[ATTR0]] {		; CHECK-SAME: () #[[ATTR2:[0-9]+]] {
; CHECK-NEXT: ret void		; CHECK-NEXT: ret void
;		;
ret void		ret void
}		}

define amdgpu_kernel void @kernel_1_4() #2 {		define amdgpu_kernel void @kernel_1_4() #2 {
; CHECK-LABEL: define amdgpu_kernel void @kernel_1_4		; CHECK-LABEL: define amdgpu_kernel void @kernel_1_4
; CHECK-SAME: () #[[ATTR3:[0-9]+]] {		; CHECK-SAME: () #[[ATTR2]] {
; CHECK-NEXT: call void @default_to_1_4()		; CHECK-NEXT: call void @default_to_1_4()
; CHECK-NEXT: ret void		; CHECK-NEXT: ret void
;		;
call void @default_to_1_4()		call void @default_to_1_4()
ret void		ret void
}		}

; Called from kernels with 2,9 and 9,9		; Called from kernels with 2,9 and 9,9
define internal void @default_to_2_9() {		define internal void @default_to_2_9() {
; CHECK-LABEL: define internal void @default_to_2_9		; CHECK-LABEL: define internal void @default_to_2_9
; CHECK-SAME: () #[[ATTR0]] {		; CHECK-SAME: () #[[ATTR3:[0-9]+]] {
; CHECK-NEXT: ret void		; CHECK-NEXT: ret void
;		;
ret void		ret void
}		}

; This already has strict bounds, but called from kernels with wider		; This already has strict bounds, but called from kernels with wider
; bounds, and should not be changed.		; bounds, and should not be changed.
define internal void @flat_group_1_1() #3 {		define internal void @flat_group_1_1() #3 {
Show All 19 Lines
; CHECK-SAME: () #[[ATTR6:[0-9]+]] {		; CHECK-SAME: () #[[ATTR6:[0-9]+]] {
; CHECK-NEXT: ret void		; CHECK-NEXT: ret void
;		;
ret void		ret void
}		}

define amdgpu_kernel void @kernel_2_9() #6 {		define amdgpu_kernel void @kernel_2_9() #6 {
; CHECK-LABEL: define amdgpu_kernel void @kernel_2_9		; CHECK-LABEL: define amdgpu_kernel void @kernel_2_9
; CHECK-SAME: () #[[ATTR7:[0-9]+]] {		; CHECK-SAME: () #[[ATTR3]] {
; CHECK-NEXT: call void @default_to_2_9()		; CHECK-NEXT: call void @default_to_2_9()
; CHECK-NEXT: call void @flat_group_1_1()		; CHECK-NEXT: call void @flat_group_1_1()
; CHECK-NEXT: ret void		; CHECK-NEXT: ret void
;		;
call void @default_to_2_9()		call void @default_to_2_9()
call void @flat_group_1_1()		call void @flat_group_1_1()
ret void		ret void
}		}

define amdgpu_kernel void @kernel_9_9() #7 {		define amdgpu_kernel void @kernel_9_9() #7 {
; CHECK-LABEL: define amdgpu_kernel void @kernel_9_9		; CHECK-LABEL: define amdgpu_kernel void @kernel_9_9
; CHECK-SAME: () #[[ATTR8:[0-9]+]] {		; CHECK-SAME: () #[[ATTR6]] {
; CHECK-NEXT: call void @default_to_2_9()		; CHECK-NEXT: call void @default_to_2_9()
; CHECK-NEXT: call void @flat_group_9_10()		; CHECK-NEXT: call void @flat_group_9_10()
; CHECK-NEXT: ret void		; CHECK-NEXT: ret void
;		;
call void @default_to_2_9()		call void @default_to_2_9()
call void @flat_group_9_10()		call void @flat_group_9_10()
ret void		ret void
}		}

; Called from kernels with 2,8 and 1,2 => 1,8		; Called from kernels with 2,8 and 1,2 => 1,8
define internal void @default_to_1_8_b() {		define internal void @default_to_1_8_b() {
; CHECK-LABEL: define internal void @default_to_1_8_b		; CHECK-LABEL: define internal void @default_to_1_8_b
; CHECK-SAME: () #[[ATTR0]] {		; CHECK-SAME: () #[[ATTR0]] {
; CHECK-NEXT: ret void		; CHECK-NEXT: ret void
;		;
ret void		ret void
}		}

; The kernel's lower bound is higher than the callee's lower bound, so		; The kernel's lower bound is higher than the callee's lower bound, so
; this should probably be illegal.		; this should probably be illegal.
define amdgpu_kernel void @kernel_2_8() #4 {		define amdgpu_kernel void @kernel_2_8() #4 {
; CHECK-LABEL: define amdgpu_kernel void @kernel_2_8		; CHECK-LABEL: define amdgpu_kernel void @kernel_2_8
; CHECK-SAME: () #[[ATTR5]] {		; CHECK-SAME: () #[[ATTR7:[0-9]+]] {
; CHECK-NEXT: call void @default_to_1_8_a()		; CHECK-NEXT: call void @default_to_1_8_a()
; CHECK-NEXT: call void @default_to_1_8_b()		; CHECK-NEXT: call void @default_to_1_8_b()
; CHECK-NEXT: ret void		; CHECK-NEXT: ret void
;		;
call void @default_to_1_8_a()		call void @default_to_1_8_a()
call void @default_to_1_8_b()		call void @default_to_1_8_b()
ret void		ret void
}		}

; 1,2 -> 2,2		; 1,2 -> 2,2
define internal void @merge_cycle_0() #1 {		define internal void @merge_cycle_0() #1 {
; CHECK-LABEL: define internal void @merge_cycle_0		; CHECK-LABEL: define internal void @merge_cycle_0
; CHECK-SAME: () #[[ATTR2]] {		; CHECK-SAME: () #[[ATTR5]] {
; CHECK-NEXT: call void @merge_cycle_1()		; CHECK-NEXT: call void @merge_cycle_1()
; CHECK-NEXT: ret void		; CHECK-NEXT: ret void
;		;
call void @merge_cycle_1()		call void @merge_cycle_1()
ret void		ret void
}		}

; Called from 1,2 + 3,8		; Called from 1,2 + 3,8
; 2,8 -> 2,8		; 2,8 -> 2,8
define internal void @merge_cycle_1() #4 {		define internal void @merge_cycle_1() #4 {
; CHECK-LABEL: define internal void @merge_cycle_1		; CHECK-LABEL: define internal void @merge_cycle_1
; CHECK-SAME: () #[[ATTR5]] {		; CHECK-SAME: () #[[ATTR7]] {
; CHECK-NEXT: call void @merge_cycle_0()		; CHECK-NEXT: call void @merge_cycle_0()
; CHECK-NEXT: ret void		; CHECK-NEXT: ret void
;		;
call void @merge_cycle_0()		call void @merge_cycle_0()
ret void		ret void
}		}

define amdgpu_kernel void @kernel_3_8() #8 {		define amdgpu_kernel void @kernel_3_8() #8 {
; CHECK-LABEL: define amdgpu_kernel void @kernel_3_8		; CHECK-LABEL: define amdgpu_kernel void @kernel_3_8
; CHECK-SAME: () #[[ATTR9:[0-9]+]] {		; CHECK-SAME: () #[[ATTR8:[0-9]+]] {
; CHECK-NEXT: call void @merge_cycle_0()		; CHECK-NEXT: call void @merge_cycle_0()
; CHECK-NEXT: call void @default_captured_address()		; CHECK-NEXT: call void @default_captured_address()
; CHECK-NEXT: call void @externally_visible_default()		; CHECK-NEXT: call void @externally_visible_default()
; CHECK-NEXT: [[F32:%.*]] = call float @bitcasted_function()		; CHECK-NEXT: [[F32:%.*]] = call float @bitcasted_function()
; CHECK-NEXT: ret void		; CHECK-NEXT: ret void
;		;
call void @merge_cycle_0()		call void @merge_cycle_0()
call void @default_captured_address()		call void @default_captured_address()
call void @externally_visible_default()		call void @externally_visible_default()
%f32 = call float @bitcasted_function()		%f32 = call float @bitcasted_function()
ret void		ret void
}		}

define internal void @default_captured_address() {		define internal void @default_captured_address() {
; CHECK-LABEL: define internal void @default_captured_address		; CHECK-LABEL: define internal void @default_captured_address
; CHECK-SAME: () #[[ATTR10:[0-9]+]] {		; CHECK-SAME: () #[[ATTR9:[0-9]+]] {
; CHECK-NEXT: store volatile ptr @default_captured_address, ptr undef, align 8		; CHECK-NEXT: store volatile ptr @default_captured_address, ptr undef, align 8
; CHECK-NEXT: ret void		; CHECK-NEXT: ret void
;		;
store volatile ptr @default_captured_address, ptr undef, align 8		store volatile ptr @default_captured_address, ptr undef, align 8
ret void		ret void
}		}

define void @externally_visible_default() {		define void @externally_visible_default() {
; CHECK-LABEL: define void @externally_visible_default		; CHECK-LABEL: define void @externally_visible_default
; CHECK-SAME: () #[[ATTR10]] {		; CHECK-SAME: () #[[ATTR9]] {
; CHECK-NEXT: ret void		; CHECK-NEXT: ret void
;		;
ret void		ret void
}		}

; 1,10 -> 3,8		; 1,10 -> 3,8
define internal i32 @bitcasted_function() {		define internal i32 @bitcasted_function() {
; CHECK-LABEL: define internal i32 @bitcasted_function		; CHECK-LABEL: define internal i32 @bitcasted_function
; CHECK-SAME: () #[[ATTR0]] {		; CHECK-SAME: () #[[ATTR8]] {
; CHECK-NEXT: ret i32 0		; CHECK-NEXT: ret i32 0
;		;
ret i32 0		ret i32 0
}		}

define internal void @called_from_invalid_bounds_0() {		define internal void @called_from_invalid_bounds_0() {
; CHECK-LABEL: define internal void @called_from_invalid_bounds_0		; CHECK-LABEL: define internal void @called_from_invalid_bounds_0
; CHECK-SAME: () #[[ATTR0]] {		; CHECK-SAME: () #[[ATTR10:[0-9]+]] {
; CHECK-NEXT: ret void		; CHECK-NEXT: ret void
;		;
ret void		ret void
}		}

define internal void @called_from_invalid_bounds_1() {		define internal void @called_from_invalid_bounds_1() {
; CHECK-LABEL: define internal void @called_from_invalid_bounds_1		; CHECK-LABEL: define internal void @called_from_invalid_bounds_1
; CHECK-SAME: () #[[ATTR0]] {		; CHECK-SAME: () #[[ATTR10]] {
; CHECK-NEXT: ret void		; CHECK-NEXT: ret void
;		;
ret void		ret void
}		}

; Invalid range for amdgpu-waves-per-eu		; Invalid range for amdgpu-waves-per-eu
define amdgpu_kernel void @kernel_invalid_bounds_0_8() #9 {		define amdgpu_kernel void @kernel_invalid_bounds_0_8() #9 {
; CHECK-LABEL: define amdgpu_kernel void @kernel_invalid_bounds_0_8		; CHECK-LABEL: define amdgpu_kernel void @kernel_invalid_bounds_0_8
▲ Show 20 Lines • Show All 55 Lines • ▼ Show 20 Lines
; CHECK-NEXT: ret void		; CHECK-NEXT: ret void
;		;
call void @refine_upper_func_3_6()		call void @refine_upper_func_3_6()
ret void		ret void
}		}

define amdgpu_kernel void @kernel_foo_6_8() #15 {		define amdgpu_kernel void @kernel_foo_6_8() #15 {
; CHECK-LABEL: define amdgpu_kernel void @kernel_foo_6_8		; CHECK-LABEL: define amdgpu_kernel void @kernel_foo_6_8
; CHECK-SAME: () #[[ATTR17:[0-9]+]] {		; CHECK-SAME: () #[[ATTR16]] {
; CHECK-NEXT: call void @refine_upper_func_3_6()		; CHECK-NEXT: call void @refine_upper_func_3_6()
; CHECK-NEXT: call void @refine_lower_func_4_8()		; CHECK-NEXT: call void @refine_lower_func_4_8()
; CHECK-NEXT: call void @func_9_10_a()		; CHECK-NEXT: call void @func_9_10_a()
; CHECK-NEXT: ret void		; CHECK-NEXT: ret void
;		;
call void @refine_upper_func_3_6()		call void @refine_upper_func_3_6()
call void @refine_lower_func_4_8()		call void @refine_lower_func_4_8()
call void @func_9_10_a()		call void @func_9_10_a()
ret void		ret void
}		}

; 5,5 -> 5,5		; 5,5 -> 5,5
define internal void @func_5_5() #16 {		define internal void @func_5_5() #16 {
; CHECK-LABEL: define internal void @func_5_5		; CHECK-LABEL: define internal void @func_5_5
; CHECK-SAME: () #[[ATTR18:[0-9]+]] {		; CHECK-SAME: () #[[ATTR17:[0-9]+]] {
; CHECK-NEXT: ret void		; CHECK-NEXT: ret void
;		;
ret void		ret void
}		}

; 5,8 -> 8,8		; 5,8 -> 8,8
define internal void @func_5_8() #17 {		define internal void @func_5_8() #17 {
; CHECK-LABEL: define internal void @func_5_8		; CHECK-LABEL: define internal void @func_5_8
; CHECK-SAME: () #[[ATTR19:[0-9]+]] {		; CHECK-SAME: () #[[ATTR18:[0-9]+]] {
; CHECK-NEXT: ret void		; CHECK-NEXT: ret void
;		;
ret void		ret void
}		}

; 9,10 -> 9,10		; 9,10 -> 9,10
define internal void @func_9_10_a() #18 {		define internal void @func_9_10_a() #18 {
; CHECK-LABEL: define internal void @func_9_10_a		; CHECK-LABEL: define internal void @func_9_10_a
; CHECK-SAME: () #[[ATTR20:[0-9]+]] {		; CHECK-SAME: () #[[ATTR19:[0-9]+]] {
; CHECK-NEXT: ret void		; CHECK-NEXT: ret void
;		;
ret void		ret void
}		}

; 9,10 -> 9,9		; 9,10 -> 9,9
define internal void @func_9_10_b() #18 {		define internal void @func_9_10_b() #18 {
; CHECK-LABEL: define internal void @func_9_10_b		; CHECK-LABEL: define internal void @func_9_10_b
; CHECK-SAME: () #[[ATTR20]] {		; CHECK-SAME: () #[[ATTR20:[0-9]+]] {
; CHECK-NEXT: ret void		; CHECK-NEXT: ret void
;		;
ret void		ret void
}		}

define amdgpu_kernel void @kernel_bar_8_9() #19 {		define amdgpu_kernel void @kernel_bar_8_9() #19 {
; CHECK-LABEL: define amdgpu_kernel void @kernel_bar_8_9		; CHECK-LABEL: define amdgpu_kernel void @kernel_bar_8_9
; CHECK-SAME: () #[[ATTR21:[0-9]+]] {		; CHECK-SAME: () #[[ATTR21:[0-9]+]] {
Show All 11 Lines	;
call void @externally_visible()		call void @externally_visible()
ret void		ret void
}		}

; This is an optimization hint based on users, so it's not strictly		; This is an optimization hint based on users, so it's not strictly
; required that all callers be visible.		; required that all callers be visible.
define void @externally_visible() {		define void @externally_visible() {
; CHECK-LABEL: define void @externally_visible		; CHECK-LABEL: define void @externally_visible
; CHECK-SAME: () #[[ATTR10]] {		; CHECK-SAME: () #[[ATTR9]] {
; CHECK-NEXT: ret void		; CHECK-NEXT: ret void
;		;
ret void		ret void
}		}


; Use a 1 wave workgroup so there is no interaction by the workgroup		; Use a 1 wave workgroup so there is no interaction by the workgroup
; size on the implied waves per EU.		; size on the implied waves per EU.
Show All 14 Lines
attributes #13 = { "amdgpu-waves-per-eu"="3,6" }		attributes #13 = { "amdgpu-waves-per-eu"="3,6" }
attributes #14 = { "amdgpu-waves-per-eu"="4,8" }		attributes #14 = { "amdgpu-waves-per-eu"="4,8" }
attributes #15 = { "amdgpu-waves-per-eu"="6,8" }		attributes #15 = { "amdgpu-waves-per-eu"="6,8" }
attributes #16 = { "amdgpu-waves-per-eu"="5,5" }		attributes #16 = { "amdgpu-waves-per-eu"="5,5" }
attributes #17 = { "amdgpu-waves-per-eu"="5,8" }		attributes #17 = { "amdgpu-waves-per-eu"="5,8" }
attributes #18 = { "amdgpu-waves-per-eu"="9,10" }		attributes #18 = { "amdgpu-waves-per-eu"="9,10" }
attributes #19 = { "amdgpu-waves-per-eu"="8,9" }		attributes #19 = { "amdgpu-waves-per-eu"="8,9" }
;.		;.
; CHECK: attributes #[[ATTR0]] = { "amdgpu-flat-work-group-size"="1,64" "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }		; CHECK: attributes #[[ATTR0]] = { "amdgpu-flat-work-group-size"="1,64" "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="1,8" "uniform-work-group-size"="false" }
; CHECK: attributes #[[ATTR1]] = { "amdgpu-flat-work-group-size"="1,64" "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="1,8" "uniform-work-group-size"="false" }		; CHECK: attributes #[[ATTR1]] = { "amdgpu-flat-work-group-size"="1,64" "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="1,2" "uniform-work-group-size"="false" }
; CHECK: attributes #[[ATTR2]] = { "amdgpu-flat-work-group-size"="1,64" "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="1,2" "uniform-work-group-size"="false" }		; CHECK: attributes #[[ATTR2]] = { "amdgpu-flat-work-group-size"="1,64" "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="1,4" "uniform-work-group-size"="false" }
; CHECK: attributes #[[ATTR3]] = { "amdgpu-flat-work-group-size"="1,64" "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="1,4" "uniform-work-group-size"="false" }		; CHECK: attributes #[[ATTR3]] = { "amdgpu-flat-work-group-size"="1,64" "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="2,9" "uniform-work-group-size"="false" }
; CHECK: attributes #[[ATTR4]] = { "amdgpu-flat-work-group-size"="1,64" "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="1,1" "uniform-work-group-size"="false" }		; CHECK: attributes #[[ATTR4]] = { "amdgpu-flat-work-group-size"="1,64" "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="1,1" "uniform-work-group-size"="false" }
; CHECK: attributes #[[ATTR5]] = { "amdgpu-flat-work-group-size"="1,64" "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="2,8" "uniform-work-group-size"="false" }		; CHECK: attributes #[[ATTR5]] = { "amdgpu-flat-work-group-size"="1,64" "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="2,2" "uniform-work-group-size"="false" }
; CHECK: attributes #[[ATTR6]] = { "amdgpu-flat-work-group-size"="1,64" "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="9,10" "uniform-work-group-size"="false" }		; CHECK: attributes #[[ATTR6]] = { "amdgpu-flat-work-group-size"="1,64" "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="9,9" "uniform-work-group-size"="false" }
; CHECK: attributes #[[ATTR7]] = { "amdgpu-flat-work-group-size"="1,64" "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="2,9" "uniform-work-group-size"="false" }		; CHECK: attributes #[[ATTR7]] = { "amdgpu-flat-work-group-size"="1,64" "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="2,8" "uniform-work-group-size"="false" }
; CHECK: attributes #[[ATTR8]] = { "amdgpu-flat-work-group-size"="1,64" "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="9,9" "uniform-work-group-size"="false" }		; CHECK: attributes #[[ATTR8]] = { "amdgpu-flat-work-group-size"="1,64" "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="3,8" "uniform-work-group-size"="false" }
; CHECK: attributes #[[ATTR9]] = { "amdgpu-flat-work-group-size"="1,64" "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="3,8" "uniform-work-group-size"="false" }		; CHECK: attributes #[[ATTR9]] = { "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
; CHECK: attributes #[[ATTR10]] = { "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }		; CHECK: attributes #[[ATTR10]] = { "amdgpu-flat-work-group-size"="1,64" "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }
; CHECK: attributes #[[ATTR11]] = { "amdgpu-flat-work-group-size"="1,64" "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="0,8" "uniform-work-group-size"="false" }		; CHECK: attributes #[[ATTR11]] = { "amdgpu-flat-work-group-size"="1,64" "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="0,8" "uniform-work-group-size"="false" }
; CHECK: attributes #[[ATTR12]] = { "amdgpu-flat-work-group-size"="1,64" "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="1,123" "uniform-work-group-size"="false" }		; CHECK: attributes #[[ATTR12]] = { "amdgpu-flat-work-group-size"="1,64" "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="1,123" "uniform-work-group-size"="false" }
; CHECK: attributes #[[ATTR13]] = { "amdgpu-flat-work-group-size"="1,512" "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }		; CHECK: attributes #[[ATTR13]] = { "amdgpu-flat-work-group-size"="1,512" "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="2,10" "uniform-work-group-size"="false" }
; CHECK: attributes #[[ATTR14]] = { "amdgpu-flat-work-group-size"="1,512" "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="3,6" "uniform-work-group-size"="false" }		; CHECK: attributes #[[ATTR14]] = { "amdgpu-flat-work-group-size"="1,512" "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="3,6" "uniform-work-group-size"="false" }
; CHECK: attributes #[[ATTR15]] = { "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="3,6" "uniform-work-group-size"="false" }		; CHECK: attributes #[[ATTR15]] = { "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="6,9" "uniform-work-group-size"="false" }
; CHECK: attributes #[[ATTR16]] = { "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,8" "uniform-work-group-size"="false" }		; CHECK: attributes #[[ATTR16]] = { "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="6,8" "uniform-work-group-size"="false" }
; CHECK: attributes #[[ATTR17]] = { "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="6,8" "uniform-work-group-size"="false" }		; CHECK: attributes #[[ATTR17]] = { "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="5,5" "uniform-work-group-size"="false" }
; CHECK: attributes #[[ATTR18]] = { "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="5,5" "uniform-work-group-size"="false" }		; CHECK: attributes #[[ATTR18]] = { "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="8,8" "uniform-work-group-size"="false" }
; CHECK: attributes #[[ATTR19]] = { "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="5,8" "uniform-work-group-size"="false" }		; CHECK: attributes #[[ATTR19]] = { "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="9,10" "uniform-work-group-size"="false" }
; CHECK: attributes #[[ATTR20]] = { "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="9,10" "uniform-work-group-size"="false" }		; CHECK: attributes #[[ATTR20]] = { "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="9,9" "uniform-work-group-size"="false" }
; CHECK: attributes #[[ATTR21]] = { "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="8,9" "uniform-work-group-size"="false" }		; CHECK: attributes #[[ATTR21]] = { "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="8,9" "uniform-work-group-size"="false" }
;.		;.

llvm/test/CodeGen/AMDGPU/simple-indirect-call.ll

Show First 20 Lines • Show All 67 Lines • ▼ Show 20 Lines	; GFX9-NEXT: s_endpgm
%fp = load ptr, ptr %fptr.cast		%fp = load ptr, ptr %fptr.cast
call void %fp()		call void %fp()
ret void		ret void
}		}

;.		;.
; AKF_GCN: attributes #[[ATTR0]] = { "amdgpu-calls" "amdgpu-stack-objects" }		; AKF_GCN: attributes #[[ATTR0]] = { "amdgpu-calls" "amdgpu-stack-objects" }
;.		;.
; ATTRIBUTOR_GCN: attributes #[[ATTR0]] = { "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }		; ATTRIBUTOR_GCN: attributes #[[ATTR0]] = { "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
; ATTRIBUTOR_GCN: attributes #[[ATTR1]] = { "uniform-work-group-size"="false" }		; ATTRIBUTOR_GCN: attributes #[[ATTR1]] = { "uniform-work-group-size"="false" }
;.		;.

llvm/test/CodeGen/AMDGPU/uniform-work-group-attribute-missing.ll

	Show All 15 Lines
	; CHECK-NEXT: ret void			; CHECK-NEXT: ret void
	;			;
	store i32 0, ptr @x			store i32 0, ptr @x
	ret void			ret void
	}			}

	define amdgpu_kernel void @kernel1() #1 {			define amdgpu_kernel void @kernel1() #1 {
	; CHECK-LABEL: define {{[^@]+}}@kernel1			; CHECK-LABEL: define {{[^@]+}}@kernel1
	; CHECK-SAME: () #[[ATTR0]] {			; CHECK-SAME: () #[[ATTR1:[0-9]+]] {
	; CHECK-NEXT: call void @foo()			; CHECK-NEXT: call void @foo()
	; CHECK-NEXT: ret void			; CHECK-NEXT: ret void
	;			;
	call void @foo()			call void @foo()
	ret void			ret void
	}			}

	attributes #0 = { "uniform-work-group-size"="true" }			attributes #0 = { "uniform-work-group-size"="true" }
	;.			;.
	; CHECK: attributes #[[ATTR0]] = { "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }			; CHECK: attributes #[[ATTR0]] = { "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
				; CHECK: attributes #[[ATTR1]] = { "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }
	;.			;.

llvm/test/CodeGen/AMDGPU/uniform-work-group-multistep.ll

Show All 37 Lines	;
call void @weak()		call void @weak()
ret void		ret void
}		}

@G2 = global i32 0		@G2 = global i32 0

define internal void @internal3() {		define internal void @internal3() {
; CHECK-LABEL: define {{[^@]+}}@internal3		; CHECK-LABEL: define {{[^@]+}}@internal3
; CHECK-SAME: () #[[ATTR1]] {		; CHECK-SAME: () #[[ATTR2:[0-9]+]] {
; CHECK-NEXT: [[TMP1:%.*]] = load i32, ptr @G2, align 4		; CHECK-NEXT: [[TMP1:%.*]] = load i32, ptr @G2, align 4
; CHECK-NEXT: [[TMP2:%.*]] = icmp eq i32 [[TMP1]], 0		; CHECK-NEXT: [[TMP2:%.*]] = icmp eq i32 [[TMP1]], 0
; CHECK-NEXT: br i1 [[TMP2]], label [[TMP3:%.]], label [[TMP4:%.]]		; CHECK-NEXT: br i1 [[TMP2]], label [[TMP3:%.]], label [[TMP4:%.]]
; CHECK: 3:		; CHECK: 3:
; CHECK-NEXT: call void @internal4()		; CHECK-NEXT: call void @internal4()
; CHECK-NEXT: call void @internal3()		; CHECK-NEXT: call void @internal3()
; CHECK-NEXT: br label [[TMP4]]		; CHECK-NEXT: br label [[TMP4]]
; CHECK: 4:		; CHECK: 4:
; CHECK-NEXT: ret void		; CHECK-NEXT: ret void
;		;
%1 = load i32, ptr @G2, align 4		%1 = load i32, ptr @G2, align 4
%2 = icmp eq i32 %1, 0		%2 = icmp eq i32 %1, 0
br i1 %2, label %3, label %4		br i1 %2, label %3, label %4
3:		3:
call void @internal4()		call void @internal4()
call void @internal3()		call void @internal3()
br label %4		br label %4
4:		4:
ret void		ret void
}		}

define internal void @internal4() {		define internal void @internal4() {
; CHECK-LABEL: define {{[^@]+}}@internal4		; CHECK-LABEL: define {{[^@]+}}@internal4
; CHECK-SAME: () #[[ATTR1]] {		; CHECK-SAME: () #[[ATTR2]] {
; CHECK-NEXT: store i32 1, ptr @G2, align 4		; CHECK-NEXT: store i32 1, ptr @G2, align 4
; CHECK-NEXT: ret void		; CHECK-NEXT: ret void
;		;
store i32 1, ptr @G2, align 4		store i32 1, ptr @G2, align 4
ret void		ret void
}		}

define internal void @internal2() {		define internal void @internal2() {
; CHECK-LABEL: define {{[^@]+}}@internal2		; CHECK-LABEL: define {{[^@]+}}@internal2
; CHECK-SAME: () #[[ATTR1]] {		; CHECK-SAME: () #[[ATTR2]] {
; CHECK-NEXT: call void @internal3()		; CHECK-NEXT: call void @internal3()
; CHECK-NEXT: ret void		; CHECK-NEXT: ret void
;		;
call void @internal3()		call void @internal3()
ret void		ret void
}		}

define amdgpu_kernel void @kernel2() #0 {		define amdgpu_kernel void @kernel2() #0 {
; CHECK-LABEL: define {{[^@]+}}@kernel2		; CHECK-LABEL: define {{[^@]+}}@kernel2
; CHECK-SAME: () #[[ATTR1]] {		; CHECK-SAME: () #[[ATTR2]] {
; CHECK-NEXT: call void @internal2()		; CHECK-NEXT: call void @internal2()
; CHECK-NEXT: ret void		; CHECK-NEXT: ret void
;		;
call void @internal2()		call void @internal2()
ret void		ret void
}		}

attributes #0 = { "uniform-work-group-size"="true" }		attributes #0 = { "uniform-work-group-size"="true" }
;.		;.
; CHECK: attributes #[[ATTR0]] = { "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }		; CHECK: attributes #[[ATTR0]] = { "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
; CHECK: attributes #[[ATTR1]] = { "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="true" }		; CHECK: attributes #[[ATTR1]] = { "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="true" }
		; CHECK: attributes #[[ATTR2]] = { "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="true" }
;.		;.

llvm/test/CodeGen/AMDGPU/uniform-work-group-nested-function-calls.ll

	Show All 35 Lines
	; CHECK-NEXT: ret void			; CHECK-NEXT: ret void
	;			;
	call void @func2()			call void @func2()
	ret void			ret void
	}			}

	attributes #2 = { "uniform-work-group-size"="true" }			attributes #2 = { "uniform-work-group-size"="true" }
	;.			;.
	; CHECK: attributes #[[ATTR0]] = { "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }			; CHECK: attributes #[[ATTR0]] = { "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
	; CHECK: attributes #[[ATTR1]] = { "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="true" }			; CHECK: attributes #[[ATTR1]] = { "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="true" }
	;.			;.

llvm/test/CodeGen/AMDGPU/uniform-work-group-prevent-attribute-propagation.ll

	Show All 25 Lines
	; CHECK-NEXT: ret void			; CHECK-NEXT: ret void
	;			;
	call void @func()			call void @func()
	ret void			ret void
	}			}

	define amdgpu_kernel void @kernel2() #2 {			define amdgpu_kernel void @kernel2() #2 {
	; CHECK-LABEL: define {{[^@]+}}@kernel2			; CHECK-LABEL: define {{[^@]+}}@kernel2
	; CHECK-SAME: () #[[ATTR0]] {			; CHECK-SAME: () #[[ATTR2:[0-9]+]] {
	; CHECK-NEXT: call void @func()			; CHECK-NEXT: call void @func()
	; CHECK-NEXT: ret void			; CHECK-NEXT: ret void
	;			;
	call void @func()			call void @func()
	ret void			ret void
	}			}

	attributes #1 = { "uniform-work-group-size"="true" }			attributes #1 = { "uniform-work-group-size"="true" }
	;.			;.
	; CHECK: attributes #[[ATTR0]] = { "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }			; CHECK: attributes #[[ATTR0]] = { "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
	; CHECK: attributes #[[ATTR1]] = { "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="true" }			; CHECK: attributes #[[ATTR1]] = { "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="true" }
				; CHECK: attributes #[[ATTR2]] = { "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }
	;.			;.

llvm/test/CodeGen/AMDGPU/uniform-work-group-propagate-attribute.ll

Show First 20 Lines • Show All 46 Lines • ▼ Show 20 Lines	;
call void @weak_func()		call void @weak_func()
ret void		ret void
}		}

attributes #0 = { nounwind }		attributes #0 = { nounwind }
attributes #1 = { "uniform-work-group-size"="false" }		attributes #1 = { "uniform-work-group-size"="false" }
attributes #2 = { "uniform-work-group-size"="true" }		attributes #2 = { "uniform-work-group-size"="true" }
;.		;.
; CHECK: attributes #[[ATTR0]] = { nounwind "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }		; CHECK: attributes #[[ATTR0]] = { nounwind "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
; CHECK: attributes #[[ATTR1]] = { "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }		; CHECK: attributes #[[ATTR1]] = { "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }
; CHECK: attributes #[[ATTR2]] = { "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="true" }		; CHECK: attributes #[[ATTR2]] = { "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="true" }
;.		;.

llvm/test/CodeGen/AMDGPU/uniform-work-group-recursion-test.ll

Show First 20 Lines • Show All 95 Lines • ▼ Show 20 Lines	;
store i32 %r2, ptr addrspace(1) %m		store i32 %r2, ptr addrspace(1) %m
ret void		ret void
}		}

; nounwind and readnone are added to match attributor results.		; nounwind and readnone are added to match attributor results.
attributes #0 = { nounwind readnone }		attributes #0 = { nounwind readnone }
attributes #1 = { "uniform-work-group-size"="true" }		attributes #1 = { "uniform-work-group-size"="true" }
;.		;.
; CHECK: attributes #[[ATTR0]] = { nounwind memory(none) "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }		; CHECK: attributes #[[ATTR0]] = { nounwind memory(none) "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
; CHECK: attributes #[[ATTR1]] = { nounwind memory(none) "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="true" }		; CHECK: attributes #[[ATTR1]] = { nounwind memory(none) "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="true" }
; CHECK: attributes #[[ATTR2]] = { "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="true" }		; CHECK: attributes #[[ATTR2]] = { "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="true" }
;.		;.

llvm/test/CodeGen/AMDGPU/uniform-work-group-test.ll

	Show First 20 Lines • Show All 43 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: ret void			; CHECK-NEXT: ret void
	;			;
	call void @func1()			call void @func1()
	ret void			ret void
	}			}

	define amdgpu_kernel void @kernel3() #0 {			define amdgpu_kernel void @kernel3() #0 {
	; CHECK-LABEL: define {{[^@]+}}@kernel3			; CHECK-LABEL: define {{[^@]+}}@kernel3
	; CHECK-SAME: () #[[ATTR0]] {			; CHECK-SAME: () #[[ATTR1:[0-9]+]] {
	; CHECK-NEXT: call void @func2()			; CHECK-NEXT: call void @func2()
	; CHECK-NEXT: call void @func3()			; CHECK-NEXT: call void @func3()
	; CHECK-NEXT: ret void			; CHECK-NEXT: ret void
	;			;
	call void @func2()			call void @func2()
	call void @func3()			call void @func3()
	ret void			ret void
	}			}

	attributes #0 = { "uniform-work-group-size"="false" }			attributes #0 = { "uniform-work-group-size"="false" }
	;.			;.
	; CHECK: attributes #[[ATTR0]] = { "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }			; CHECK: attributes #[[ATTR0]] = { "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
				; CHECK: attributes #[[ATTR1]] = { "amdgpu-no-completion-action" "amdgpu-no-default-queue" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-heap-ptr" "amdgpu-no-hostcall-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-lds-kernel-id" "amdgpu-no-multigrid-sync-arg" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }
	;.			;.

This is an archive of the discontinued LLVM Phabricator instance.

AMDGPU: Propagate amdgpu-waves-per-eu with attributorClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 528172

llvm/lib/Target/AMDGPU/AMDGPUAttributor.cpp

llvm/lib/Target/AMDGPU/AMDGPUSubtarget.h

llvm/lib/Target/AMDGPU/AMDGPUSubtarget.cpp

llvm/test/CodeGen/AMDGPU/addrspacecast-constantexpr.ll

llvm/test/CodeGen/AMDGPU/annotate-existing-abi-attributes.ll

llvm/test/CodeGen/AMDGPU/annotate-kernel-features-hsa-call.ll

llvm/test/CodeGen/AMDGPU/annotate-kernel-features-hsa.ll

llvm/test/CodeGen/AMDGPU/attributor-loop-issue-58639.ll

llvm/test/CodeGen/AMDGPU/direct-indirect-call.ll

llvm/test/CodeGen/AMDGPU/duplicate-attribute-indirect.ll

llvm/test/CodeGen/AMDGPU/implicitarg-offset-attributes.ll

llvm/test/CodeGen/AMDGPU/propagate-flat-work-group-size.ll

llvm/test/CodeGen/AMDGPU/propagate-waves-per-eu.ll

llvm/test/CodeGen/AMDGPU/simple-indirect-call.ll

llvm/test/CodeGen/AMDGPU/uniform-work-group-attribute-missing.ll

llvm/test/CodeGen/AMDGPU/uniform-work-group-multistep.ll

llvm/test/CodeGen/AMDGPU/uniform-work-group-nested-function-calls.ll

llvm/test/CodeGen/AMDGPU/uniform-work-group-prevent-attribute-propagation.ll

llvm/test/CodeGen/AMDGPU/uniform-work-group-propagate-attribute.ll

llvm/test/CodeGen/AMDGPU/uniform-work-group-recursion-test.ll

llvm/test/CodeGen/AMDGPU/uniform-work-group-test.ll

AMDGPU: Propagate amdgpu-waves-per-eu with attributor
ClosedPublic