This is an archive of the discontinued LLVM Phabricator instance.

AMDGPU: Propagate amdgpu-waves-per-eu
AbandonedPublic

Authored by arsenm on Sep 20 2021, 1:56 PM.

Download Raw Diff

Details

Reviewers

jdoerfert
kuter
t-tye
kzhuravl
rampitec
bcahoon
sstefan1
baziotis

Summary

This one is a bit weird due to the interaction with the implied range
from amdgpu-flat-workgroup-size. At the default group range of 1,1024,
the minimum implied bounds is 4 so this ends up introducing the
attribute on undecorated functions.

Diff Detail

Event Timeline

arsenm created this revision.Sep 20 2021, 1:56 PM

Herald added subscribers: foad, okura, kerbowa and 6 others. · View Herald TranscriptSep 20 2021, 1:56 PM

arsenm requested review of this revision.Sep 20 2021, 1:56 PM

Herald added a reviewer: sstefan1. · View Herald TranscriptSep 20 2021, 1:56 PM

Herald added a reviewer: baziotis. · View Herald Transcript

Herald added a project: Restricted Project. · View Herald Transcript

Herald added a subscriber: wdng. · View Herald Transcript

Harbormaster completed remote builds in B124752: Diff 373706.Sep 20 2021, 1:56 PM

jdoerfert added inline comments.Sep 20 2021, 3:05 PM

llvm/lib/Target/AMDGPU/AMDGPUAttributor.cpp
651	Is it on purpose that you use the assumed/initial value of the flat-work-group-size as known range here?

arsenm added inline comments.Sep 20 2021, 3:12 PM

llvm/lib/Target/AMDGPU/AMDGPUAttributor.cpp
651	Yes, but I wasn't completely sure if this was the correct way to handle this. The amdgpu-flat-workgroup-size implies restrictions on amdgpu-waves-per-eu, but amdgpu-flat-workgroup-size should win if there's a conflict. There should always be an initially known range

jdoerfert added inline comments.Sep 20 2021, 4:36 PM

llvm/lib/Target/AMDGPU/AMDGPUAttributor.cpp
651	So, the way it is now you will never go below the initial flat-workgroup-size. From what I read it seems like you want an upper bound? If so, you need to restrict the assumed value. That way you'll go at most as big as the flat-workgroup-size initially is. You might also need to consider doing this in update if you need to be bound by the final flat-workgroup-size and not only the initial one.

Apparently I reposted this as D115559

Herald added a project: Restricted Project. · View Herald TranscriptJun 22 2023, 3:11 AM

Revision Contents

Path

Size

llvm/

lib/

Target/

AMDGPU/

AMDGPUAttributor.cpp

158 lines

GCNSubtarget.h

3 lines

test/

CodeGen/

AMDGPU/

addrspacecast-constantexpr.ll

3 lines

annotate-existing-abi-attributes.ll

20 lines

annotate-kernel-features-hsa-call.ll

60 lines

annotate-kernel-features-hsa.ll

3 lines

direct-indirect-call.ll

4 lines

duplicate-attribute-indirect.ll

2 lines

propagate-flat-work-group-size.ll

6 lines

propagate-waves-per-eu.ll

289 lines

simple-indirect-call.ll

2 lines

uniform-work-group-attribute-missing.ll

5 lines

uniform-work-group-multistep.ll

11 lines

uniform-work-group-nested-function-calls.ll

2 lines

uniform-work-group-prevent-attribute-propagation.ll

5 lines

uniform-work-group-recursion-test.ll

6 lines

uniform-work-group-test.ll

5 lines

Diff 373706

llvm/lib/Target/AMDGPU/AMDGPUAttributor.cpp

Show First 20 Lines • Show All 133 Lines • ▼ Show 20 Lines	public:
}		}

std::pair<unsigned, unsigned>		std::pair<unsigned, unsigned>
getMaximumFlatWorkGroupRange(const Function &F) {		getMaximumFlatWorkGroupRange(const Function &F) {
const GCNSubtarget &ST = TM.getSubtarget<GCNSubtarget>(F);		const GCNSubtarget &ST = TM.getSubtarget<GCNSubtarget>(F);
return {ST.getMinFlatWorkGroupSize(), ST.getMaxFlatWorkGroupSize()};		return {ST.getMinFlatWorkGroupSize(), ST.getMaxFlatWorkGroupSize()};
}		}

		std::pair<unsigned, unsigned>
		getWavesPerEU(const Function &F,
		std::pair<unsigned, unsigned> FlatWorkGroupSize) {
		const GCNSubtarget &ST = TM.getSubtarget<GCNSubtarget>(F);
		return ST.getWavesPerEU(F, FlatWorkGroupSize);
		}

		unsigned getMaxWavesPerEU(const Function &F) {
		const GCNSubtarget &ST = TM.getSubtarget<GCNSubtarget>(F);
		return ST.getMaxWavesPerEU();
		}

private:		private:
/// Check if the ConstantExpr \p CE requires queue ptr attribute.		/// Check if the ConstantExpr \p CE requires queue ptr attribute.
static bool visitConstExpr(const ConstantExpr *CE) {		static bool visitConstExpr(const ConstantExpr *CE) {
if (CE->getOpcode() == Instruction::AddrSpaceCast) {		if (CE->getOpcode() == Instruction::AddrSpaceCast) {
unsigned SrcAS = CE->getOperand(0)->getType()->getPointerAddressSpace();		unsigned SrcAS = CE->getOperand(0)->getType()->getPointerAddressSpace();
return castRequiresQueuePtr(SrcAS);		return castRequiresQueuePtr(SrcAS);
}		}
return false;		return false;
▲ Show 20 Lines • Show All 326 Lines • ▼ Show 20 Lines

AAAMDAttributes &AAAMDAttributes::createForPosition(const IRPosition &IRP,		AAAMDAttributes &AAAMDAttributes::createForPosition(const IRPosition &IRP,
Attributor &A) {		Attributor &A) {
if (IRP.getPositionKind() == IRPosition::IRP_FUNCTION)		if (IRP.getPositionKind() == IRPosition::IRP_FUNCTION)
return *new (A.Allocator) AAAMDAttributesFunction(IRP, A);		return *new (A.Allocator) AAAMDAttributesFunction(IRP, A);
llvm_unreachable("AAAMDAttributes is only valid for function position");		llvm_unreachable("AAAMDAttributes is only valid for function position");
}		}

/// Propagate amdgpu-flat-work-group-size attribute.		struct AAAMDSizeRangeAttribute
struct AAAMDFlatWorkGroupSize
: public StateWrapper<IntegerRangeState, AbstractAttribute, uint32_t> {		: public StateWrapper<IntegerRangeState, AbstractAttribute, uint32_t> {
using Base = StateWrapper<IntegerRangeState, AbstractAttribute, uint32_t>;		using Base = StateWrapper<IntegerRangeState, AbstractAttribute, uint32_t>;
AAAMDFlatWorkGroupSize(const IRPosition &IRP, Attributor &A)
: Base(IRP, 32) {}		StringRef AttrName;

		AAAMDSizeRangeAttribute(const IRPosition &IRP, Attributor &A,
		StringRef AttrName)
		: Base(IRP, 32), AttrName(AttrName) {}

/// See AbstractAttribute::getState(...).		/// See AbstractAttribute::getState(...).
IntegerRangeState &getState() override { return *this; }		IntegerRangeState &getState() override { return *this; }
const IntegerRangeState &getState() const override { return *this; }		const IntegerRangeState &getState() const override { return *this; }

void initialize(Attributor &A) override {		/// See AbstractAttribute::trackStatistics()
Function *F = getAssociatedFunction();		void trackStatistics() const override {}
auto &InfoCache = static_cast<AMDGPUInformationCache &>(A.getInfoCache());
unsigned MinGroupSize, MaxGroupSize;
std::tie(MinGroupSize, MaxGroupSize) = InfoCache.getFlatWorkGroupSizes(*F);
intersectKnown(
ConstantRange(APInt(32, MinGroupSize), APInt(32, MaxGroupSize + 1)));
}

ChangeStatus updateImpl(Attributor &A) override {		template <class AttributeImpl>
		ChangeStatus updateImplImpl(Attributor &A) {
ChangeStatus Change = ChangeStatus::UNCHANGED;		ChangeStatus Change = ChangeStatus::UNCHANGED;

auto CheckCallSite = [&](AbstractCallSite CS) {		auto CheckCallSite = [&](AbstractCallSite CS) {
Function *Caller = CS.getInstruction()->getFunction();		Function *Caller = CS.getInstruction()->getFunction();
LLVM_DEBUG(dbgs() << "[AAAMDFlatWorkGroupSize] Call " << Caller->getName()		LLVM_DEBUG(dbgs() << '[' << getName() << "] Call " << Caller->getName()
<< "->" << getAssociatedFunction()->getName() << '\n');		<< "->" << getAssociatedFunction()->getName() << '\n');

const auto &CallerInfo = A.getAAFor<AAAMDFlatWorkGroupSize>(		const auto &CallerInfo = A.getAAFor<AttributeImpl>(
this, IRPosition::function(Caller), DepClassTy::REQUIRED);		this, IRPosition::function(Caller), DepClassTy::REQUIRED);

Change \|=		Change \|=
clampStateAndIndicateChange(this->getState(), CallerInfo.getState());		clampStateAndIndicateChange(this->getState(), CallerInfo.getState());

return true;		return true;
};		};

bool AllCallSitesKnown = true;		bool AllCallSitesKnown = true;
if (!A.checkForAllCallSites(CheckCallSite, *this, true, AllCallSitesKnown))		if (!A.checkForAllCallSites(CheckCallSite, *this, true, AllCallSitesKnown))
indicatePessimisticFixpoint();		indicatePessimisticFixpoint();

return Change;		return Change;
}		}

ChangeStatus manifest(Attributor &A) override {		ChangeStatus emitAttributeIfNotDefault(Attributor &A, unsigned Min,
SmallVector<Attribute, 8> AttrList;		unsigned Max) {
Function *F = getAssociatedFunction();
LLVMContext &Ctx = F->getContext();

auto &InfoCache = static_cast<AMDGPUInformationCache &>(A.getInfoCache());
unsigned Min, Max;
std::tie(Min, Max) = InfoCache.getMaximumFlatWorkGroupRange(*F);

// Don't add the attribute if it's the implied default.		// Don't add the attribute if it's the implied default.
if (getAssumed().getLower() == Min && getAssumed().getUpper() - 1 == Max)		if (getAssumed().getLower() == Min && getAssumed().getUpper() - 1 == Max)
return ChangeStatus::UNCHANGED;		return ChangeStatus::UNCHANGED;

		Function *F = getAssociatedFunction();
		LLVMContext &Ctx = F->getContext();
		SmallVector<Attribute, 8> AttrList;
SmallString<10> Buffer;		SmallString<10> Buffer;
raw_svector_ostream OS(Buffer);		raw_svector_ostream OS(Buffer);
OS << getAssumed().getLower() << ',' << getAssumed().getUpper() - 1;		OS << getAssumed().getLower() << ',' << getAssumed().getUpper() - 1;

AttrList.push_back(		AttrList.push_back(Attribute::get(Ctx, AttrName, OS.str()));
Attribute::get(Ctx, "amdgpu-flat-work-group-size", OS.str()));
return IRAttributeManifest::manifestAttrs(A, getIRPosition(), AttrList,		return IRAttributeManifest::manifestAttrs(A, getIRPosition(), AttrList,
/* ForceReplace */ true);		/* ForceReplace */ true);
}		}

const std::string getAsStr() const override {		const std::string getAsStr() const override {
std::string Str;		std::string Str;
raw_string_ostream OS(Str);		raw_string_ostream OS(Str);
OS << "AMDFlatWorkGroupSize[";		OS << getName() << '[';
OS << getAssumed().getLower() << ',' << getAssumed().getUpper() - 1;		OS << getAssumed().getLower() << ',' << getAssumed().getUpper() - 1;
OS << ']';		OS << ']';
return OS.str();		return OS.str();
}		}
		};

/// See AbstractAttribute::trackStatistics()		/// Propagate amdgpu-flat-work-group-size attribute.
void trackStatistics() const override {}		struct AAAMDFlatWorkGroupSize : public AAAMDSizeRangeAttribute {
		AAAMDFlatWorkGroupSize(const IRPosition &IRP, Attributor &A)
		: AAAMDSizeRangeAttribute(IRP, A, "amdgpu-flat-work-group-size") {}

		void initialize(Attributor &A) override {
		Function *F = getAssociatedFunction();
		auto &InfoCache = static_cast<AMDGPUInformationCache &>(A.getInfoCache());
		unsigned MinGroupSize, MaxGroupSize;
		std::tie(MinGroupSize, MaxGroupSize) = InfoCache.getFlatWorkGroupSizes(*F);
		intersectKnown(
		ConstantRange(APInt(32, MinGroupSize), APInt(32, MaxGroupSize + 1)));
		}

		ChangeStatus updateImpl(Attributor &A) override {
		return updateImplImpl<AAAMDFlatWorkGroupSize>(A);
		}

/// Create an abstract attribute view for the position \p IRP.		/// Create an abstract attribute view for the position \p IRP.
static AAAMDFlatWorkGroupSize &createForPosition(const IRPosition &IRP,		static AAAMDFlatWorkGroupSize &createForPosition(const IRPosition &IRP,
Attributor &A);		Attributor &A);

		ChangeStatus manifest(Attributor &A) override {
		Function *F = getAssociatedFunction();
		auto &InfoCache = static_cast<AMDGPUInformationCache &>(A.getInfoCache());
		unsigned Min, Max;
		std::tie(Min, Max) = InfoCache.getMaximumFlatWorkGroupRange(*F);
		return emitAttributeIfNotDefault(A, Min, Max);
		}

/// See AbstractAttribute::getName()		/// See AbstractAttribute::getName()
const std::string getName() const override {		const std::string getName() const override {
return "AAAMDFlatWorkGroupSize";		return "AAAMDFlatWorkGroupSize";
}		}

/// See AbstractAttribute::getIdAddr()		/// See AbstractAttribute::getIdAddr()
const char *getIdAddr() const override { return &ID; }		const char *getIdAddr() const override { return &ID; }

Show All 13 Lines
AAAMDFlatWorkGroupSize::createForPosition(const IRPosition &IRP,		AAAMDFlatWorkGroupSize::createForPosition(const IRPosition &IRP,
Attributor &A) {		Attributor &A) {
if (IRP.getPositionKind() == IRPosition::IRP_FUNCTION)		if (IRP.getPositionKind() == IRPosition::IRP_FUNCTION)
return *new (A.Allocator) AAAMDFlatWorkGroupSize(IRP, A);		return *new (A.Allocator) AAAMDFlatWorkGroupSize(IRP, A);
llvm_unreachable(		llvm_unreachable(
"AAAMDFlatWorkGroupSize is only valid for function position");		"AAAMDFlatWorkGroupSize is only valid for function position");
}		}

		/// Propagate amdgpu-waves-per-eu attribute.
		struct AAAMDWavesPerEU : public AAAMDSizeRangeAttribute {
		AAAMDWavesPerEU(const IRPosition &IRP, Attributor &A)
		: AAAMDSizeRangeAttribute(IRP, A, "amdgpu-waves-per-eu") {}

		bool isValidState() const override {
		return !Assumed.isEmptySet() && IntegerRangeState::isValidState();
		}

		void initialize(Attributor &A) override {
		Function *F = getAssociatedFunction();

		const AAAMDFlatWorkGroupSize &FlatWorkGroupSize =
		A.getAAFor<AAAMDFlatWorkGroupSize>(this, IRPosition::function(F),
		DepClassTy::REQUIRED);

		const auto &AssumedFlatWorkGroup = FlatWorkGroupSize.getAssumed();

		auto &InfoCache = static_cast<AMDGPUInformationCache &>(A.getInfoCache());
		unsigned Min, Max;
		std::tie(Min, Max) = InfoCache.getWavesPerEU(
		*F, {AssumedFlatWorkGroup.getLower().getZExtValue(),
		AssumedFlatWorkGroup.getUpper().getZExtValue() - 1});

		ConstantRange Range(APInt(32, Min), APInt(32, Max + 1));
		intersectKnown(Range);
		}
		jdoerfertUnsubmitted Not Done Reply Inline Actions Is it on purpose that you use the assumed/initial value of the flat-work-group-size as known range here? jdoerfert: Is it on purpose that you use the assumed/initial value of the flat-work-group-size as known…
		arsenmAuthorUnsubmitted Done Reply Inline Actions Yes, but I wasn't completely sure if this was the correct way to handle this. The amdgpu-flat-workgroup-size implies restrictions on amdgpu-waves-per-eu, but amdgpu-flat-workgroup-size should win if there's a conflict. There should always be an initially known range arsenm: Yes, but I wasn't completely sure if this was the correct way to handle this. The amdgpu-flat…
		jdoerfertUnsubmitted Not Done Reply Inline Actions So, the way it is now you will never go below the initial flat-workgroup-size. From what I read it seems like you want an upper bound? If so, you need to restrict the assumed value. That way you'll go at most as big as the flat-workgroup-size initially is. You might also need to consider doing this in update if you need to be bound by the final flat-workgroup-size and not only the initial one. jdoerfert: So, the way it is now you will never go below the initial flat-workgroup-size. From what I…

		ChangeStatus updateImpl(Attributor &A) override {
		return updateImplImpl<AAAMDWavesPerEU>(A);
		}

		/// Create an abstract attribute view for the position \p IRP.
		static AAAMDWavesPerEU &createForPosition(const IRPosition &IRP,
		Attributor &A);

		ChangeStatus manifest(Attributor &A) override {
		Function *F = getAssociatedFunction();
		auto &InfoCache = static_cast<AMDGPUInformationCache &>(A.getInfoCache());
		unsigned Max = InfoCache.getMaxWavesPerEU(*F);
		return emitAttributeIfNotDefault(A, 1, Max);
		}

		/// See AbstractAttribute::getName()
		const std::string getName() const override { return "AAAMDWavesPerEU"; }

		/// See AbstractAttribute::getIdAddr()
		const char *getIdAddr() const override { return &ID; }

		/// This function should return true if the type of the \p AA is
		/// AAAMDWavesPerEU
		static bool classof(const AbstractAttribute *AA) {
		return (AA->getIdAddr() == &ID);
		}

		/// Unique ID (due to the unique address)
		static const char ID;
		};

		const char AAAMDWavesPerEU::ID = 0;

		AAAMDWavesPerEU &AAAMDWavesPerEU::createForPosition(const IRPosition &IRP,
		Attributor &A) {
		if (IRP.getPositionKind() == IRPosition::IRP_FUNCTION)
		return *new (A.Allocator) AAAMDWavesPerEU(IRP, A);
		llvm_unreachable("AAAMDWavesPerEU is only valid for function position");
		}

class AMDGPUAttributor : public ModulePass {		class AMDGPUAttributor : public ModulePass {
public:		public:
AMDGPUAttributor() : ModulePass(ID) {}		AMDGPUAttributor() : ModulePass(ID) {}

/// doInitialization - Virtual method overridden by subclasses to do		/// doInitialization - Virtual method overridden by subclasses to do
/// any necessary initialization before any pass is run.		/// any necessary initialization before any pass is run.
bool doInitialization(Module &) override {		bool doInitialization(Module &) override {
auto *TPC = getAnalysisIfAvailable<TargetPassConfig>();		auto *TPC = getAnalysisIfAvailable<TargetPassConfig>();
Show All 12 Lines	for (Function &F : M) {
Functions.insert(&F);		Functions.insert(&F);
}		}

CallGraphUpdater CGUpdater;		CallGraphUpdater CGUpdater;
BumpPtrAllocator Allocator;		BumpPtrAllocator Allocator;
AMDGPUInformationCache InfoCache(M, AG, Allocator, nullptr, *TM);		AMDGPUInformationCache InfoCache(M, AG, Allocator, nullptr, *TM);
DenseSet<const char *> Allowed(		DenseSet<const char *> Allowed(
{&AAAMDAttributes::ID, &AAUniformWorkGroupSize::ID,		{&AAAMDAttributes::ID, &AAUniformWorkGroupSize::ID,
&AAAMDFlatWorkGroupSize::ID, &AACallEdges::ID});		&AAAMDFlatWorkGroupSize::ID, &AAAMDWavesPerEU::ID, &AACallEdges::ID});

Attributor A(Functions, InfoCache, CGUpdater, &Allowed);		Attributor A(Functions, InfoCache, CGUpdater, &Allowed);

for (Function &F : M) {		for (Function &F : M) {
if (!F.isIntrinsic()) {		if (!F.isIntrinsic()) {
A.getOrCreateAAFor<AAAMDAttributes>(IRPosition::function(F));		A.getOrCreateAAFor<AAAMDAttributes>(IRPosition::function(F));
A.getOrCreateAAFor<AAUniformWorkGroupSize>(IRPosition::function(F));		A.getOrCreateAAFor<AAUniformWorkGroupSize>(IRPosition::function(F));
if (!AMDGPU::isEntryFunctionCC(F.getCallingConv())) {		if (!AMDGPU::isEntryFunctionCC(F.getCallingConv())) {
A.getOrCreateAAFor<AAAMDFlatWorkGroupSize>(IRPosition::function(F));		A.getOrCreateAAFor<AAAMDFlatWorkGroupSize>(IRPosition::function(F));
		A.getOrCreateAAFor<AAAMDWavesPerEU>(IRPosition::function(F));
}		}
}		}
}		}

ChangeStatus Change = A.run();		ChangeStatus Change = A.run();
return Change == ChangeStatus::CHANGED;		return Change == ChangeStatus::CHANGED;
}		}

Show All 9 Lines

llvm/lib/Target/AMDGPU/GCNSubtarget.h

	Show All 24 Lines
	#include "AMDGPUGenSubtargetInfo.inc"			#include "AMDGPUGenSubtargetInfo.inc"

	namespace llvm {			namespace llvm {

	class GCNTargetMachine;			class GCNTargetMachine;

	class GCNSubtarget final : public AMDGPUGenSubtargetInfo,			class GCNSubtarget final : public AMDGPUGenSubtargetInfo,
	public AMDGPUSubtarget {			public AMDGPUSubtarget {
				public:
	using AMDGPUSubtarget::getMaxWavesPerEU;			using AMDGPUSubtarget::getMaxWavesPerEU;

	public:
	// Following 2 enums are documented at:			// Following 2 enums are documented at:
	// - https://llvm.org/docs/AMDGPUUsage.html#trap-handler-abi			// - https://llvm.org/docs/AMDGPUUsage.html#trap-handler-abi
	enum class TrapHandlerAbi {			enum class TrapHandlerAbi {
	NONE = 0x00,			NONE = 0x00,
	AMDHSA = 0x01,			AMDHSA = 0x01,
	};			};

	enum class TrapID {			enum class TrapID {
	▲ Show 20 Lines • Show All 1,139 Lines • Show Last 20 Lines

llvm/test/CodeGen/AMDGPU/addrspacecast-constantexpr.ll

	Show First 20 Lines • Show All 211 Lines • ▼ Show 20 Lines
	}			}

	define i32 addrspace(3)* @ret_constant_cast_group_gv_gep_to_flat_to_group() #1 {			define i32 addrspace(3)* @ret_constant_cast_group_gv_gep_to_flat_to_group() #1 {
	; AKF_HSA-LABEL: define {{[^@]+}}@ret_constant_cast_group_gv_gep_to_flat_to_group			; AKF_HSA-LABEL: define {{[^@]+}}@ret_constant_cast_group_gv_gep_to_flat_to_group
	; AKF_HSA-SAME: () #[[ATTR1]] {			; AKF_HSA-SAME: () #[[ATTR1]] {
	; AKF_HSA-NEXT: ret i32 addrspace(3)* addrspacecast (i32 addrspace(4)* getelementptr ([256 x i32], [256 x i32] addrspace(4)* addrspacecast ([256 x i32] addrspace(3)* @lds.arr to [256 x i32] addrspace(4)), i64 0, i64 8) to i32 addrspace(3))			; AKF_HSA-NEXT: ret i32 addrspace(3)* addrspacecast (i32 addrspace(4)* getelementptr ([256 x i32], [256 x i32] addrspace(4)* addrspacecast ([256 x i32] addrspace(3)* @lds.arr to [256 x i32] addrspace(4)), i64 0, i64 8) to i32 addrspace(3))
	;			;
	; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@ret_constant_cast_group_gv_gep_to_flat_to_group			; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@ret_constant_cast_group_gv_gep_to_flat_to_group
	; ATTRIBUTOR_HSA-SAME: () #[[ATTR2]] {			; ATTRIBUTOR_HSA-SAME: () #[[ATTR3:[0-9]+]] {
	; ATTRIBUTOR_HSA-NEXT: ret i32 addrspace(3)* addrspacecast (i32 addrspace(4)* getelementptr ([256 x i32], [256 x i32] addrspace(4)* addrspacecast ([256 x i32] addrspace(3)* @lds.arr to [256 x i32] addrspace(4)), i64 0, i64 8) to i32 addrspace(3))			; ATTRIBUTOR_HSA-NEXT: ret i32 addrspace(3)* addrspacecast (i32 addrspace(4)* getelementptr ([256 x i32], [256 x i32] addrspace(4)* addrspacecast ([256 x i32] addrspace(3)* @lds.arr to [256 x i32] addrspace(4)), i64 0, i64 8) to i32 addrspace(3))
	;			;
	ret i32 addrspace(3)* addrspacecast (i32 addrspace(4)* getelementptr ([256 x i32], [256 x i32] addrspace(4)* addrspacecast ([256 x i32] addrspace(3)* @lds.arr to [256 x i32] addrspace(4)), i64 0, i64 8) to i32 addrspace(3))			ret i32 addrspace(3)* addrspacecast (i32 addrspace(4)* getelementptr ([256 x i32], [256 x i32] addrspace(4)* addrspacecast ([256 x i32] addrspace(3)* @lds.arr to [256 x i32] addrspace(4)), i64 0, i64 8) to i32 addrspace(3))
	}			}

	attributes #0 = { argmemonly nounwind }			attributes #0 = { argmemonly nounwind }
	attributes #1 = { nounwind }			attributes #1 = { nounwind }
	;.			;.
	; AKF_HSA: attributes #[[ATTR0:[0-9]+]] = { argmemonly nofree nounwind willreturn }			; AKF_HSA: attributes #[[ATTR0:[0-9]+]] = { argmemonly nofree nounwind willreturn }
	; AKF_HSA: attributes #[[ATTR1]] = { nounwind }			; AKF_HSA: attributes #[[ATTR1]] = { nounwind }
	;.			;.
	; ATTRIBUTOR_HSA: attributes #[[ATTR0:[0-9]+]] = { argmemonly nofree nounwind willreturn }			; ATTRIBUTOR_HSA: attributes #[[ATTR0:[0-9]+]] = { argmemonly nofree nounwind willreturn }
	; ATTRIBUTOR_HSA: attributes #[[ATTR1]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR1]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }
	; ATTRIBUTOR_HSA: attributes #[[ATTR2]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR2]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }
				; ATTRIBUTOR_HSA: attributes #[[ATTR3]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
	;.			;.

llvm/test/CodeGen/AMDGPU/annotate-existing-abi-attributes.ll

	Show First 20 Lines • Show All 111 Lines • ▼ Show 20 Lines
	; CHECK-SAME: () #[[ATTR9:[0-9]+]] {			; CHECK-SAME: () #[[ATTR9:[0-9]+]] {
	; CHECK-NEXT: call void @marked_no_dispatch_id()			; CHECK-NEXT: call void @marked_no_dispatch_id()
	; CHECK-NEXT: ret void			; CHECK-NEXT: ret void
	;			;
	call void @marked_no_dispatch_id()			call void @marked_no_dispatch_id()
	ret void			ret void
	}			}
	;.			;.
	; CHECK: attributes #[[ATTR0]] = { "amdgpu-no-workitem-id-x" "uniform-work-group-size"="false" }			; CHECK: attributes #[[ATTR0]] = { "amdgpu-no-workitem-id-x" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
	; CHECK: attributes #[[ATTR1]] = { "amdgpu-no-workitem-id-y" "uniform-work-group-size"="false" }			; CHECK: attributes #[[ATTR1]] = { "amdgpu-no-workitem-id-y" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
	; CHECK: attributes #[[ATTR2]] = { "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }			; CHECK: attributes #[[ATTR2]] = { "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
	; CHECK: attributes #[[ATTR3]] = { "amdgpu-no-workgroup-id-x" "uniform-work-group-size"="false" }			; CHECK: attributes #[[ATTR3]] = { "amdgpu-no-workgroup-id-x" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
	; CHECK: attributes #[[ATTR4]] = { "amdgpu-no-workgroup-id-y" "uniform-work-group-size"="false" }			; CHECK: attributes #[[ATTR4]] = { "amdgpu-no-workgroup-id-y" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
	; CHECK: attributes #[[ATTR5]] = { "amdgpu-no-workgroup-id-z" "uniform-work-group-size"="false" }			; CHECK: attributes #[[ATTR5]] = { "amdgpu-no-workgroup-id-z" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
	; CHECK: attributes #[[ATTR6]] = { "amdgpu-no-dispatch-ptr" "uniform-work-group-size"="false" }			; CHECK: attributes #[[ATTR6]] = { "amdgpu-no-dispatch-ptr" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
	; CHECK: attributes #[[ATTR7]] = { "amdgpu-no-queue-ptr" "uniform-work-group-size"="false" }			; CHECK: attributes #[[ATTR7]] = { "amdgpu-no-queue-ptr" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
	; CHECK: attributes #[[ATTR8]] = { "amdgpu-no-implicitarg-ptr" "uniform-work-group-size"="false" }			; CHECK: attributes #[[ATTR8]] = { "amdgpu-no-implicitarg-ptr" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
	; CHECK: attributes #[[ATTR9]] = { "amdgpu-no-dispatch-id" "uniform-work-group-size"="false" }			; CHECK: attributes #[[ATTR9]] = { "amdgpu-no-dispatch-id" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
	;.			;.

llvm/test/CodeGen/AMDGPU/annotate-kernel-features-hsa-call.ll

	Show First 20 Lines • Show All 605 Lines • ▼ Show 20 Lines
	define void @use_implicitarg_ptr() #1 {			define void @use_implicitarg_ptr() #1 {
	; AKF_HSA-LABEL: define {{[^@]+}}@use_implicitarg_ptr			; AKF_HSA-LABEL: define {{[^@]+}}@use_implicitarg_ptr
	; AKF_HSA-SAME: () #[[ATTR1]] {			; AKF_HSA-SAME: () #[[ATTR1]] {
	; AKF_HSA-NEXT: [[IMPLICITARG_PTR:%.]] = call i8 addrspace(4) @llvm.amdgcn.implicitarg.ptr()			; AKF_HSA-NEXT: [[IMPLICITARG_PTR:%.]] = call i8 addrspace(4) @llvm.amdgcn.implicitarg.ptr()
	; AKF_HSA-NEXT: store volatile i8 addrspace(4)* [[IMPLICITARG_PTR]], i8 addrspace(4)* addrspace(1)* undef, align 8			; AKF_HSA-NEXT: store volatile i8 addrspace(4)* [[IMPLICITARG_PTR]], i8 addrspace(4)* addrspace(1)* undef, align 8
	; AKF_HSA-NEXT: ret void			; AKF_HSA-NEXT: ret void
	;			;
	; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@use_implicitarg_ptr			; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@use_implicitarg_ptr
	; ATTRIBUTOR_HSA-SAME: () #[[ATTR14]] {			; ATTRIBUTOR_HSA-SAME: () #[[ATTR15:[0-9]+]] {
	; ATTRIBUTOR_HSA-NEXT: [[IMPLICITARG_PTR:%.]] = call i8 addrspace(4) @llvm.amdgcn.implicitarg.ptr()			; ATTRIBUTOR_HSA-NEXT: [[IMPLICITARG_PTR:%.]] = call i8 addrspace(4) @llvm.amdgcn.implicitarg.ptr()
	; ATTRIBUTOR_HSA-NEXT: store volatile i8 addrspace(4)* [[IMPLICITARG_PTR]], i8 addrspace(4)* addrspace(1)* undef, align 8			; ATTRIBUTOR_HSA-NEXT: store volatile i8 addrspace(4)* [[IMPLICITARG_PTR]], i8 addrspace(4)* addrspace(1)* undef, align 8
	; ATTRIBUTOR_HSA-NEXT: ret void			; ATTRIBUTOR_HSA-NEXT: ret void
	;			;
	%implicitarg.ptr = call i8 addrspace(4)* @llvm.amdgcn.implicitarg.ptr()			%implicitarg.ptr = call i8 addrspace(4)* @llvm.amdgcn.implicitarg.ptr()
	store volatile i8 addrspace(4)* %implicitarg.ptr, i8 addrspace(4)* addrspace(1)* undef			store volatile i8 addrspace(4)* %implicitarg.ptr, i8 addrspace(4)* addrspace(1)* undef
	ret void			ret void
	}			}

	define void @func_indirect_use_implicitarg_ptr() #1 {			define void @func_indirect_use_implicitarg_ptr() #1 {
	; AKF_HSA-LABEL: define {{[^@]+}}@func_indirect_use_implicitarg_ptr			; AKF_HSA-LABEL: define {{[^@]+}}@func_indirect_use_implicitarg_ptr
	; AKF_HSA-SAME: () #[[ATTR1]] {			; AKF_HSA-SAME: () #[[ATTR1]] {
	; AKF_HSA-NEXT: call void @use_implicitarg_ptr()			; AKF_HSA-NEXT: call void @use_implicitarg_ptr()
	; AKF_HSA-NEXT: ret void			; AKF_HSA-NEXT: ret void
	;			;
	; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@func_indirect_use_implicitarg_ptr			; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@func_indirect_use_implicitarg_ptr
	; ATTRIBUTOR_HSA-SAME: () #[[ATTR14]] {			; ATTRIBUTOR_HSA-SAME: () #[[ATTR15]] {
	; ATTRIBUTOR_HSA-NEXT: call void @use_implicitarg_ptr()			; ATTRIBUTOR_HSA-NEXT: call void @use_implicitarg_ptr()
	; ATTRIBUTOR_HSA-NEXT: ret void			; ATTRIBUTOR_HSA-NEXT: ret void
	;			;
	call void @use_implicitarg_ptr()			call void @use_implicitarg_ptr()
	ret void			ret void
	}			}

	declare void @external.func() #3			declare void @external.func() #3

	; This function gets deleted.			; This function gets deleted.
	define internal void @defined.func() #3 {			define internal void @defined.func() #3 {
	; AKF_HSA-LABEL: define {{[^@]+}}@defined.func			; AKF_HSA-LABEL: define {{[^@]+}}@defined.func
	; AKF_HSA-SAME: () #[[ATTR3:[0-9]+]] {			; AKF_HSA-SAME: () #[[ATTR3:[0-9]+]] {
	; AKF_HSA-NEXT: ret void			; AKF_HSA-NEXT: ret void
	;			;
	; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@defined.func			; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@defined.func
	; ATTRIBUTOR_HSA-SAME: () #[[ATTR16:[0-9]+]] {			; ATTRIBUTOR_HSA-SAME: () #[[ATTR17:[0-9]+]] {
	; ATTRIBUTOR_HSA-NEXT: ret void			; ATTRIBUTOR_HSA-NEXT: ret void
	;			;
	ret void			ret void
	}			}

	define void @func_call_external() #3 {			define void @func_call_external() #3 {
	; AKF_HSA-LABEL: define {{[^@]+}}@func_call_external			; AKF_HSA-LABEL: define {{[^@]+}}@func_call_external
	; AKF_HSA-SAME: () #[[ATTR3]] {			; AKF_HSA-SAME: () #[[ATTR3]] {
	; AKF_HSA-NEXT: call void @external.func()			; AKF_HSA-NEXT: call void @external.func()
	; AKF_HSA-NEXT: ret void			; AKF_HSA-NEXT: ret void
	;			;
	; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@func_call_external			; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@func_call_external
	; ATTRIBUTOR_HSA-SAME: () #[[ATTR15:[0-9]+]] {			; ATTRIBUTOR_HSA-SAME: () #[[ATTR16:[0-9]+]] {
	; ATTRIBUTOR_HSA-NEXT: call void @external.func()			; ATTRIBUTOR_HSA-NEXT: call void @external.func()
	; ATTRIBUTOR_HSA-NEXT: ret void			; ATTRIBUTOR_HSA-NEXT: ret void
	;			;
	call void @external.func()			call void @external.func()
	ret void			ret void
	}			}

	define void @func_call_defined() #3 {			define void @func_call_defined() #3 {
	; AKF_HSA-LABEL: define {{[^@]+}}@func_call_defined			; AKF_HSA-LABEL: define {{[^@]+}}@func_call_defined
	; AKF_HSA-SAME: () #[[ATTR3]] {			; AKF_HSA-SAME: () #[[ATTR3]] {
	; AKF_HSA-NEXT: call void @defined.func()			; AKF_HSA-NEXT: call void @defined.func()
	; AKF_HSA-NEXT: ret void			; AKF_HSA-NEXT: ret void
	;			;
	; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@func_call_defined			; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@func_call_defined
	; ATTRIBUTOR_HSA-SAME: () #[[ATTR16]] {			; ATTRIBUTOR_HSA-SAME: () #[[ATTR17]] {
	; ATTRIBUTOR_HSA-NEXT: call void @defined.func()			; ATTRIBUTOR_HSA-NEXT: call void @defined.func()
	; ATTRIBUTOR_HSA-NEXT: ret void			; ATTRIBUTOR_HSA-NEXT: ret void
	;			;
	call void @defined.func()			call void @defined.func()
	ret void			ret void
	}			}
	define void @func_call_asm() #3 {			define void @func_call_asm() #3 {
	; AKF_HSA-LABEL: define {{[^@]+}}@func_call_asm			; AKF_HSA-LABEL: define {{[^@]+}}@func_call_asm
	; AKF_HSA-SAME: () #[[ATTR3]] {			; AKF_HSA-SAME: () #[[ATTR3]] {
	; AKF_HSA-NEXT: call void asm sideeffect "", ""() #[[ATTR3]]			; AKF_HSA-NEXT: call void asm sideeffect "", ""() #[[ATTR3]]
	; AKF_HSA-NEXT: ret void			; AKF_HSA-NEXT: ret void
	;			;
	; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@func_call_asm			; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@func_call_asm
	; ATTRIBUTOR_HSA-SAME: () #[[ATTR16]] {			; ATTRIBUTOR_HSA-SAME: () #[[ATTR17]] {
	; ATTRIBUTOR_HSA-NEXT: call void asm sideeffect "", ""() #[[ATTR17:[0-9]+]]			; ATTRIBUTOR_HSA-NEXT: call void asm sideeffect "", ""() #[[ATTR19:[0-9]+]]
	; ATTRIBUTOR_HSA-NEXT: ret void			; ATTRIBUTOR_HSA-NEXT: ret void
	;			;
	call void asm sideeffect "", ""() #3			call void asm sideeffect "", ""() #3
	ret void			ret void
	}			}

	define amdgpu_kernel void @kern_call_external() #3 {			define amdgpu_kernel void @kern_call_external() #3 {
	; AKF_HSA-LABEL: define {{[^@]+}}@kern_call_external			; AKF_HSA-LABEL: define {{[^@]+}}@kern_call_external
	; AKF_HSA-SAME: () #[[ATTR4:[0-9]+]] {			; AKF_HSA-SAME: () #[[ATTR4:[0-9]+]] {
	; AKF_HSA-NEXT: call void @external.func()			; AKF_HSA-NEXT: call void @external.func()
	; AKF_HSA-NEXT: ret void			; AKF_HSA-NEXT: ret void
	;			;
	; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@kern_call_external			; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@kern_call_external
	; ATTRIBUTOR_HSA-SAME: () #[[ATTR15]] {			; ATTRIBUTOR_HSA-SAME: () #[[ATTR18:[0-9]+]] {
	; ATTRIBUTOR_HSA-NEXT: call void @external.func()			; ATTRIBUTOR_HSA-NEXT: call void @external.func()
	; ATTRIBUTOR_HSA-NEXT: ret void			; ATTRIBUTOR_HSA-NEXT: ret void
	;			;
	call void @external.func()			call void @external.func()
	ret void			ret void
	}			}

	define amdgpu_kernel void @func_kern_defined() #3 {			define amdgpu_kernel void @func_kern_defined() #3 {
	; AKF_HSA-LABEL: define {{[^@]+}}@func_kern_defined			; AKF_HSA-LABEL: define {{[^@]+}}@func_kern_defined
	; AKF_HSA-SAME: () #[[ATTR4]] {			; AKF_HSA-SAME: () #[[ATTR4]] {
	; AKF_HSA-NEXT: call void @defined.func()			; AKF_HSA-NEXT: call void @defined.func()
	; AKF_HSA-NEXT: ret void			; AKF_HSA-NEXT: ret void
	;			;
	; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@func_kern_defined			; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@func_kern_defined
	; ATTRIBUTOR_HSA-SAME: () #[[ATTR16]] {			; ATTRIBUTOR_HSA-SAME: () #[[ATTR17]] {
	; ATTRIBUTOR_HSA-NEXT: call void @defined.func()			; ATTRIBUTOR_HSA-NEXT: call void @defined.func()
	; ATTRIBUTOR_HSA-NEXT: ret void			; ATTRIBUTOR_HSA-NEXT: ret void
	;			;
	call void @defined.func()			call void @defined.func()
	ret void			ret void
	}			}

	define i32 @use_dispatch_ptr_ret_type() #1 {			define i32 @use_dispatch_ptr_ret_type() #1 {
	Show All 35 Lines
	define float @func_indirect_call(float()* %fptr) #3 {			define float @func_indirect_call(float()* %fptr) #3 {
	; AKF_HSA-LABEL: define {{[^@]+}}@func_indirect_call			; AKF_HSA-LABEL: define {{[^@]+}}@func_indirect_call
	; AKF_HSA-SAME: (float ()* [[FPTR:%.*]]) #[[ATTR3]] {			; AKF_HSA-SAME: (float ()* [[FPTR:%.*]]) #[[ATTR3]] {
	; AKF_HSA-NEXT: [[F:%.*]] = call float [[FPTR]]()			; AKF_HSA-NEXT: [[F:%.*]] = call float [[FPTR]]()
	; AKF_HSA-NEXT: [[FADD:%.*]] = fadd float [[F]], 1.000000e+00			; AKF_HSA-NEXT: [[FADD:%.*]] = fadd float [[F]], 1.000000e+00
	; AKF_HSA-NEXT: ret float [[FADD]]			; AKF_HSA-NEXT: ret float [[FADD]]
	;			;
	; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@func_indirect_call			; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@func_indirect_call
	; ATTRIBUTOR_HSA-SAME: (float ()* [[FPTR:%.*]]) #[[ATTR15]] {			; ATTRIBUTOR_HSA-SAME: (float ()* [[FPTR:%.*]]) #[[ATTR16]] {
	; ATTRIBUTOR_HSA-NEXT: [[F:%.*]] = call float [[FPTR]]()			; ATTRIBUTOR_HSA-NEXT: [[F:%.*]] = call float [[FPTR]]()
	; ATTRIBUTOR_HSA-NEXT: [[FADD:%.*]] = fadd float [[F]], 1.000000e+00			; ATTRIBUTOR_HSA-NEXT: [[FADD:%.*]] = fadd float [[F]], 1.000000e+00
	; ATTRIBUTOR_HSA-NEXT: ret float [[FADD]]			; ATTRIBUTOR_HSA-NEXT: ret float [[FADD]]
	;			;
	%f = call float %fptr()			%f = call float %fptr()
	%fadd = fadd float %f, 1.0			%fadd = fadd float %f, 1.0
	ret float %fadd			ret float %fadd
	}			}

	declare float @extern() #3			declare float @extern() #3
	define float @func_extern_call() #3 {			define float @func_extern_call() #3 {
	; AKF_HSA-LABEL: define {{[^@]+}}@func_extern_call			; AKF_HSA-LABEL: define {{[^@]+}}@func_extern_call
	; AKF_HSA-SAME: () #[[ATTR3]] {			; AKF_HSA-SAME: () #[[ATTR3]] {
	; AKF_HSA-NEXT: [[F:%.*]] = call float @extern()			; AKF_HSA-NEXT: [[F:%.*]] = call float @extern()
	; AKF_HSA-NEXT: [[FADD:%.*]] = fadd float [[F]], 1.000000e+00			; AKF_HSA-NEXT: [[FADD:%.*]] = fadd float [[F]], 1.000000e+00
	; AKF_HSA-NEXT: ret float [[FADD]]			; AKF_HSA-NEXT: ret float [[FADD]]
	;			;
	; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@func_extern_call			; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@func_extern_call
	; ATTRIBUTOR_HSA-SAME: () #[[ATTR15]] {			; ATTRIBUTOR_HSA-SAME: () #[[ATTR16]] {
	; ATTRIBUTOR_HSA-NEXT: [[F:%.*]] = call float @extern()			; ATTRIBUTOR_HSA-NEXT: [[F:%.*]] = call float @extern()
	; ATTRIBUTOR_HSA-NEXT: [[FADD:%.*]] = fadd float [[F]], 1.000000e+00			; ATTRIBUTOR_HSA-NEXT: [[FADD:%.*]] = fadd float [[F]], 1.000000e+00
	; ATTRIBUTOR_HSA-NEXT: ret float [[FADD]]			; ATTRIBUTOR_HSA-NEXT: ret float [[FADD]]
	;			;
	%f = call float @extern()			%f = call float @extern()
	%fadd = fadd float %f, 1.0			%fadd = fadd float %f, 1.0
	ret float %fadd			ret float %fadd
	}			}

	define float @func_null_call(float()* %fptr) #3 {			define float @func_null_call(float()* %fptr) #3 {
	; AKF_HSA-LABEL: define {{[^@]+}}@func_null_call			; AKF_HSA-LABEL: define {{[^@]+}}@func_null_call
	; AKF_HSA-SAME: (float ()* [[FPTR:%.*]]) #[[ATTR3]] {			; AKF_HSA-SAME: (float ()* [[FPTR:%.*]]) #[[ATTR3]] {
	; AKF_HSA-NEXT: [[F:%.*]] = call float null()			; AKF_HSA-NEXT: [[F:%.*]] = call float null()
	; AKF_HSA-NEXT: [[FADD:%.*]] = fadd float [[F]], 1.000000e+00			; AKF_HSA-NEXT: [[FADD:%.*]] = fadd float [[F]], 1.000000e+00
	; AKF_HSA-NEXT: ret float [[FADD]]			; AKF_HSA-NEXT: ret float [[FADD]]
	;			;
	; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@func_null_call			; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@func_null_call
	; ATTRIBUTOR_HSA-SAME: (float ()* [[FPTR:%.*]]) #[[ATTR15]] {			; ATTRIBUTOR_HSA-SAME: (float ()* [[FPTR:%.*]]) #[[ATTR16]] {
	; ATTRIBUTOR_HSA-NEXT: [[F:%.*]] = call float null()			; ATTRIBUTOR_HSA-NEXT: [[F:%.*]] = call float null()
	; ATTRIBUTOR_HSA-NEXT: [[FADD:%.*]] = fadd float [[F]], 1.000000e+00			; ATTRIBUTOR_HSA-NEXT: [[FADD:%.*]] = fadd float [[F]], 1.000000e+00
	; ATTRIBUTOR_HSA-NEXT: ret float [[FADD]]			; ATTRIBUTOR_HSA-NEXT: ret float [[FADD]]
	;			;
	%f = call float null()			%f = call float null()
	%fadd = fadd float %f, 1.0			%fadd = fadd float %f, 1.0
	ret float %fadd			ret float %fadd
	}			}

	declare float @llvm.amdgcn.rcp.f32(float) #0			declare float @llvm.amdgcn.rcp.f32(float) #0

	; Calls some other recognized intrinsic			; Calls some other recognized intrinsic
	define float @func_other_intrinsic_call(float %arg) #3 {			define float @func_other_intrinsic_call(float %arg) #3 {
	; AKF_HSA-LABEL: define {{[^@]+}}@func_other_intrinsic_call			; AKF_HSA-LABEL: define {{[^@]+}}@func_other_intrinsic_call
	; AKF_HSA-SAME: (float [[ARG:%.*]]) #[[ATTR3]] {			; AKF_HSA-SAME: (float [[ARG:%.*]]) #[[ATTR3]] {
	; AKF_HSA-NEXT: [[F:%.*]] = call float @llvm.amdgcn.rcp.f32(float [[ARG]])			; AKF_HSA-NEXT: [[F:%.*]] = call float @llvm.amdgcn.rcp.f32(float [[ARG]])
	; AKF_HSA-NEXT: [[FADD:%.*]] = fadd float [[F]], 1.000000e+00			; AKF_HSA-NEXT: [[FADD:%.*]] = fadd float [[F]], 1.000000e+00
	; AKF_HSA-NEXT: ret float [[FADD]]			; AKF_HSA-NEXT: ret float [[FADD]]
	;			;
	; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@func_other_intrinsic_call			; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@func_other_intrinsic_call
	; ATTRIBUTOR_HSA-SAME: (float [[ARG:%.*]]) #[[ATTR16]] {			; ATTRIBUTOR_HSA-SAME: (float [[ARG:%.*]]) #[[ATTR17]] {
	; ATTRIBUTOR_HSA-NEXT: [[F:%.*]] = call float @llvm.amdgcn.rcp.f32(float [[ARG]])			; ATTRIBUTOR_HSA-NEXT: [[F:%.*]] = call float @llvm.amdgcn.rcp.f32(float [[ARG]])
	; ATTRIBUTOR_HSA-NEXT: [[FADD:%.*]] = fadd float [[F]], 1.000000e+00			; ATTRIBUTOR_HSA-NEXT: [[FADD:%.*]] = fadd float [[F]], 1.000000e+00
	; ATTRIBUTOR_HSA-NEXT: ret float [[FADD]]			; ATTRIBUTOR_HSA-NEXT: ret float [[FADD]]
	;			;
	%f = call float @llvm.amdgcn.rcp.f32(float %arg)			%f = call float @llvm.amdgcn.rcp.f32(float %arg)
	%fadd = fadd float %f, 1.0			%fadd = fadd float %f, 1.0
	ret float %fadd			ret float %fadd
	}			}

	attributes #0 = { nounwind readnone speculatable }			attributes #0 = { nounwind readnone speculatable }
	attributes #1 = { nounwind "target-cpu"="fiji" }			attributes #1 = { nounwind "target-cpu"="fiji" }
	attributes #2 = { nounwind "target-cpu"="gfx900" }			attributes #2 = { nounwind "target-cpu"="gfx900" }
	attributes #3 = { nounwind }			attributes #3 = { nounwind }

	;.			;.
	; AKF_HSA: attributes #[[ATTR0:[0-9]+]] = { nounwind readnone speculatable willreturn }			; AKF_HSA: attributes #[[ATTR0:[0-9]+]] = { nounwind readnone speculatable willreturn }
	; AKF_HSA: attributes #[[ATTR1]] = { nounwind "target-cpu"="fiji" }			; AKF_HSA: attributes #[[ATTR1]] = { nounwind "target-cpu"="fiji" }
	; AKF_HSA: attributes #[[ATTR2]] = { nounwind "target-cpu"="gfx900" }			; AKF_HSA: attributes #[[ATTR2]] = { nounwind "target-cpu"="gfx900" }
	; AKF_HSA: attributes #[[ATTR3]] = { nounwind }			; AKF_HSA: attributes #[[ATTR3]] = { nounwind }
	; AKF_HSA: attributes #[[ATTR4]] = { nounwind "amdgpu-calls" }			; AKF_HSA: attributes #[[ATTR4]] = { nounwind "amdgpu-calls" }
	;.			;.
	; ATTRIBUTOR_HSA: attributes #[[ATTR0:[0-9]+]] = { nounwind readnone speculatable willreturn }			; ATTRIBUTOR_HSA: attributes #[[ATTR0:[0-9]+]] = { nounwind readnone speculatable willreturn }
	; ATTRIBUTOR_HSA: attributes #[[ATTR1]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "target-cpu"="fiji" "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR1]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "target-cpu"="fiji" "uniform-work-group-size"="false" }
	; ATTRIBUTOR_HSA: attributes #[[ATTR2]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-z" "target-cpu"="fiji" "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR2]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "target-cpu"="fiji" "uniform-work-group-size"="false" }
	; ATTRIBUTOR_HSA: attributes #[[ATTR3]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "target-cpu"="fiji" "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR3]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-waves-per-eu"="4,10" "target-cpu"="fiji" "uniform-work-group-size"="false" }
	; ATTRIBUTOR_HSA: attributes #[[ATTR4]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "target-cpu"="fiji" "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR4]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "target-cpu"="fiji" "uniform-work-group-size"="false" }
	; ATTRIBUTOR_HSA: attributes #[[ATTR5]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "target-cpu"="fiji" "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR5]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "target-cpu"="fiji" "uniform-work-group-size"="false" }
	; ATTRIBUTOR_HSA: attributes #[[ATTR6]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "target-cpu"="fiji" "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR6]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "target-cpu"="fiji" "uniform-work-group-size"="false" }
	; ATTRIBUTOR_HSA: attributes #[[ATTR7]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "target-cpu"="fiji" "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR7]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "target-cpu"="fiji" "uniform-work-group-size"="false" }
	; ATTRIBUTOR_HSA: attributes #[[ATTR8]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "target-cpu"="fiji" "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR8]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "target-cpu"="fiji" "uniform-work-group-size"="false" }
	; ATTRIBUTOR_HSA: attributes #[[ATTR9]] = { nounwind "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "target-cpu"="fiji" "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR9]] = { nounwind "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "target-cpu"="fiji" "uniform-work-group-size"="false" }
	; ATTRIBUTOR_HSA: attributes #[[ATTR10]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "target-cpu"="fiji" "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR10]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "target-cpu"="fiji" "uniform-work-group-size"="false" }
	; ATTRIBUTOR_HSA: attributes #[[ATTR11]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "target-cpu"="fiji" "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR11]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "target-cpu"="fiji" "uniform-work-group-size"="false" }
	; ATTRIBUTOR_HSA: attributes #[[ATTR12]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "target-cpu"="gfx900" "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR12]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "target-cpu"="gfx900" "uniform-work-group-size"="false" }
	; ATTRIBUTOR_HSA: attributes #[[ATTR13]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "target-cpu"="gfx900" "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR13]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "target-cpu"="gfx900" "uniform-work-group-size"="false" }
	; ATTRIBUTOR_HSA: attributes #[[ATTR14]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "target-cpu"="fiji" "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR14]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "target-cpu"="fiji" "uniform-work-group-size"="false" }
	; ATTRIBUTOR_HSA: attributes #[[ATTR15]] = { nounwind "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR15]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "target-cpu"="fiji" "uniform-work-group-size"="false" }
	; ATTRIBUTOR_HSA: attributes #[[ATTR16]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR16]] = { nounwind "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
	; ATTRIBUTOR_HSA: attributes #[[ATTR17]] = { nounwind }			; ATTRIBUTOR_HSA: attributes #[[ATTR17]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
				; ATTRIBUTOR_HSA: attributes #[[ATTR18]] = { nounwind "uniform-work-group-size"="false" }
				; ATTRIBUTOR_HSA: attributes #[[ATTR19]] = { nounwind }
	;.			;.

llvm/test/CodeGen/AMDGPU/annotate-kernel-features-hsa.ll

	Show First 20 Lines • Show All 622 Lines • ▼ Show 20 Lines
	define void @use_alloca_func() #1 {			define void @use_alloca_func() #1 {
	; AKF_HSA-LABEL: define {{[^@]+}}@use_alloca_func			; AKF_HSA-LABEL: define {{[^@]+}}@use_alloca_func
	; AKF_HSA-SAME: () #[[ATTR2]] {			; AKF_HSA-SAME: () #[[ATTR2]] {
	; AKF_HSA-NEXT: [[ALLOCA:%.*]] = alloca i32, align 4, addrspace(5)			; AKF_HSA-NEXT: [[ALLOCA:%.*]] = alloca i32, align 4, addrspace(5)
	; AKF_HSA-NEXT: store i32 0, i32 addrspace(5)* [[ALLOCA]], align 4			; AKF_HSA-NEXT: store i32 0, i32 addrspace(5)* [[ALLOCA]], align 4
	; AKF_HSA-NEXT: ret void			; AKF_HSA-NEXT: ret void
	;			;
	; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@use_alloca_func			; ATTRIBUTOR_HSA-LABEL: define {{[^@]+}}@use_alloca_func
	; ATTRIBUTOR_HSA-SAME: () #[[ATTR1]] {			; ATTRIBUTOR_HSA-SAME: () #[[ATTR12:[0-9]+]] {
	; ATTRIBUTOR_HSA-NEXT: [[ALLOCA:%.*]] = alloca i32, align 4, addrspace(5)			; ATTRIBUTOR_HSA-NEXT: [[ALLOCA:%.*]] = alloca i32, align 4, addrspace(5)
	; ATTRIBUTOR_HSA-NEXT: store i32 0, i32 addrspace(5)* [[ALLOCA]], align 4			; ATTRIBUTOR_HSA-NEXT: store i32 0, i32 addrspace(5)* [[ALLOCA]], align 4
	; ATTRIBUTOR_HSA-NEXT: ret void			; ATTRIBUTOR_HSA-NEXT: ret void
	;			;
	%alloca = alloca i32, addrspace(5)			%alloca = alloca i32, addrspace(5)
	store i32 0, i32 addrspace(5)* %alloca			store i32 0, i32 addrspace(5)* %alloca
	ret void			ret void
	}			}
	Show All 13 Lines
	; ATTRIBUTOR_HSA: attributes #[[ATTR4]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR4]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }
	; ATTRIBUTOR_HSA: attributes #[[ATTR5]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR5]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }
	; ATTRIBUTOR_HSA: attributes #[[ATTR6]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR6]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "uniform-work-group-size"="false" }
	; ATTRIBUTOR_HSA: attributes #[[ATTR7]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR7]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }
	; ATTRIBUTOR_HSA: attributes #[[ATTR8]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR8]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "uniform-work-group-size"="false" }
	; ATTRIBUTOR_HSA: attributes #[[ATTR9]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workitem-id-x" "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR9]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workitem-id-x" "uniform-work-group-size"="false" }
	; ATTRIBUTOR_HSA: attributes #[[ATTR10]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR10]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }
	; ATTRIBUTOR_HSA: attributes #[[ATTR11]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }			; ATTRIBUTOR_HSA: attributes #[[ATTR11]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }
				; ATTRIBUTOR_HSA: attributes #[[ATTR12]] = { nounwind "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
	;.			;.

llvm/test/CodeGen/AMDGPU/direct-indirect-call.ll

	Show All 29 Lines
	; CHECK-SAME: () #[[ATTR1]] {			; CHECK-SAME: () #[[ATTR1]] {
	; CHECK-NEXT: call void @direct()			; CHECK-NEXT: call void @direct()
	; CHECK-NEXT: ret void			; CHECK-NEXT: ret void
	;			;
	call void @direct()			call void @direct()
	ret void			ret void
	}			}
	;.			;.
	; CHECK: attributes #[[ATTR0]] = { "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }			; CHECK: attributes #[[ATTR0]] = { "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
	; CHECK: attributes #[[ATTR1]] = { "uniform-work-group-size"="false" }			; CHECK: attributes #[[ATTR1]] = { "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
	;.			;.

llvm/test/CodeGen/AMDGPU/duplicate-attribute-indirect.ll

Show All 36 Lines	;
ret void		ret void
}		}

attributes #0 = { "amdgpu-no-dispatch-id" }		attributes #0 = { "amdgpu-no-dispatch-id" }

;.		;.
; AKF_GCN: attributes #[[ATTR0]] = { "amdgpu-calls" "amdgpu-no-dispatch-id" "amdgpu-stack-objects" }		; AKF_GCN: attributes #[[ATTR0]] = { "amdgpu-calls" "amdgpu-no-dispatch-id" "amdgpu-stack-objects" }
;.		;.
; ATTRIBUTOR_GCN: attributes #[[ATTR0]] = { "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }		; ATTRIBUTOR_GCN: attributes #[[ATTR0]] = { "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
; ATTRIBUTOR_GCN: attributes #[[ATTR1]] = { "amdgpu-no-dispatch-id" "uniform-work-group-size"="false" }		; ATTRIBUTOR_GCN: attributes #[[ATTR1]] = { "amdgpu-no-dispatch-id" "uniform-work-group-size"="false" }
;.		;.

llvm/test/CodeGen/AMDGPU/propagate-flat-work-group-size.ll

	Show First 20 Lines • Show All 198 Lines • ▼ Show 20 Lines
	attributes #3 = { "amdgpu-flat-work-group-size"="128,256" }			attributes #3 = { "amdgpu-flat-work-group-size"="128,256" }
	attributes #4 = { "amdgpu-flat-work-group-size"="512,1024" }			attributes #4 = { "amdgpu-flat-work-group-size"="512,1024" }
	attributes #5 = { "amdgpu-flat-work-group-size"="128,512" }			attributes #5 = { "amdgpu-flat-work-group-size"="128,512" }
	attributes #6 = { "amdgpu-flat-work-group-size"="512,512" }			attributes #6 = { "amdgpu-flat-work-group-size"="512,512" }
	attributes #7 = { "amdgpu-flat-work-group-size"="64,256" }			attributes #7 = { "amdgpu-flat-work-group-size"="64,256" }
	;.			;.
	; CHECK: attributes #[[ATTR0]] = { "amdgpu-flat-work-group-size"="1,256" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }			; CHECK: attributes #[[ATTR0]] = { "amdgpu-flat-work-group-size"="1,256" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }
	; CHECK: attributes #[[ATTR1]] = { "amdgpu-flat-work-group-size"="64,128" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }			; CHECK: attributes #[[ATTR1]] = { "amdgpu-flat-work-group-size"="64,128" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }
	; CHECK: attributes #[[ATTR2]] = { "amdgpu-flat-work-group-size"="128,512" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }			; CHECK: attributes #[[ATTR2]] = { "amdgpu-flat-work-group-size"="128,512" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="2,10" "uniform-work-group-size"="false" }
	; CHECK: attributes #[[ATTR3]] = { "amdgpu-flat-work-group-size"="64,64" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }			; CHECK: attributes #[[ATTR3]] = { "amdgpu-flat-work-group-size"="64,64" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }
	; CHECK: attributes #[[ATTR4]] = { "amdgpu-flat-work-group-size"="128,128" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }			; CHECK: attributes #[[ATTR4]] = { "amdgpu-flat-work-group-size"="128,128" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }
	; CHECK: attributes #[[ATTR5]] = { "amdgpu-flat-work-group-size"="512,512" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }			; CHECK: attributes #[[ATTR5]] = { "amdgpu-flat-work-group-size"="512,512" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="2,10" "uniform-work-group-size"="false" }
	; CHECK: attributes #[[ATTR6]] = { "amdgpu-flat-work-group-size"="64,256" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }			; CHECK: attributes #[[ATTR6]] = { "amdgpu-flat-work-group-size"="64,256" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }
	; CHECK: attributes #[[ATTR7]] = { "amdgpu-flat-work-group-size"="128,256" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }			; CHECK: attributes #[[ATTR7]] = { "amdgpu-flat-work-group-size"="128,256" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }
	; CHECK: attributes #[[ATTR8]] = { "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }			; CHECK: attributes #[[ATTR8]] = { "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
	;.			;.

llvm/test/CodeGen/AMDGPU/propagate-waves-per-eu.ll

This file was added.

				; NOTE: Assertions have been autogenerated by utils/update_test_checks.py UTC_ARGS: --function-signature --check-globals
				; RUN: opt -S -mtriple=amdgcn-amd-amdhsa -amdgpu-attributor %s \| FileCheck %s

				; Check propagation of amdgpu-flat-work-group-size attribute.

				; Called from a single kernel with 1,8
				define internal void @default_to_1_8_a() {
				; CHECK-LABEL: define {{[^@]+}}@default_to_1_8_a
				; CHECK-SAME: () #[[ATTR0:[0-9]+]] {
				; CHECK-NEXT: ret void
				;
				ret void
				}

				define amdgpu_kernel void @kernel_1_8() #0 {
				; CHECK-LABEL: define {{[^@]+}}@kernel_1_8
				; CHECK-SAME: () #[[ATTR0]] {
				; CHECK-NEXT: call void @default_to_1_8_a()
				; CHECK-NEXT: ret void
				;
				call void @default_to_1_8_a()
				ret void
				}

				; Called from a single kernel with 1,2
				define internal void @default_to_1_2() {
				; CHECK-LABEL: define {{[^@]+}}@default_to_1_2
				; CHECK-SAME: () #[[ATTR1:[0-9]+]] {
				; CHECK-NEXT: ret void
				;
				ret void
				}

				define amdgpu_kernel void @kernel_1_2() #1 {
				; CHECK-LABEL: define {{[^@]+}}@kernel_1_2
				; CHECK-SAME: () #[[ATTR1]] {
				; CHECK-NEXT: call void @default_to_1_2()
				; CHECK-NEXT: call void @flat_group_1_1()
				; CHECK-NEXT: call void @default_to_1_8_b()
				; CHECK-NEXT: call void @flat_group_2_8()
				; CHECK-NEXT: ret void
				;
				call void @default_to_1_2()
				call void @flat_group_1_1()
				call void @default_to_1_8_b()
				call void @flat_group_2_8()
				ret void
				}

				; Called from kernels with 2,9 and 9,9
				define internal void @default_to_2_9() {
				; CHECK-LABEL: define {{[^@]+}}@default_to_2_9
				; CHECK-SAME: () #[[ATTR2:[0-9]+]] {
				; CHECK-NEXT: ret void
				;
				ret void
				}

				; This already has a strict bounds, but called from kernels with wider
				; bounds, and should not be changed.
				define internal void @flat_group_1_1() #2 {
				; CHECK-LABEL: define {{[^@]+}}@flat_group_1_1
				; CHECK-SAME: () #[[ATTR3:[0-9]+]] {
				; CHECK-NEXT: ret void
				;
				ret void
				}

				; 2,8 -> 2,2
				define internal void @flat_group_2_8() #3 {
				; CHECK-LABEL: define {{[^@]+}}@flat_group_2_8
				; CHECK-SAME: () #[[ATTR4:[0-9]+]] {
				; CHECK-NEXT: ret void
				;
				ret void
				}

				; 9,10 -> 9,9
				define internal void @flat_group_9_10() #4 {
				; CHECK-LABEL: define {{[^@]+}}@flat_group_9_10
				; CHECK-SAME: () #[[ATTR5:[0-9]+]] {
				; CHECK-NEXT: ret void
				;
				ret void
				}

				define amdgpu_kernel void @kernel_2_9() #5 {
				; CHECK-LABEL: define {{[^@]+}}@kernel_2_9
				; CHECK-SAME: () #[[ATTR2]] {
				; CHECK-NEXT: call void @default_to_2_9()
				; CHECK-NEXT: call void @flat_group_1_1()
				; CHECK-NEXT: ret void
				;
				call void @default_to_2_9()
				call void @flat_group_1_1()
				ret void
				}

				define amdgpu_kernel void @kernel_9_9() #6 {
				; CHECK-LABEL: define {{[^@]+}}@kernel_9_9
				; CHECK-SAME: () #[[ATTR5]] {
				; CHECK-NEXT: call void @default_to_2_9()
				; CHECK-NEXT: call void @flat_group_9_10()
				; CHECK-NEXT: ret void
				;
				call void @default_to_2_9()
				call void @flat_group_9_10()
				ret void
				}

				; Called from kernels with 2,8 and 1,2 => 1,8
				define internal void @default_to_1_8_b() {
				; CHECK-LABEL: define {{[^@]+}}@default_to_1_8_b
				; CHECK-SAME: () #[[ATTR0]] {
				; CHECK-NEXT: ret void
				;
				ret void
				}

				; The kernel's lower bound is higher than the callee's lower bound, so
				; this should probably be illegal.
				define amdgpu_kernel void @kernel_2_8() #3 {
				; CHECK-LABEL: define {{[^@]+}}@kernel_2_8
				; CHECK-SAME: () #[[ATTR6:[0-9]+]] {
				; CHECK-NEXT: call void @default_to_1_8_a()
				; CHECK-NEXT: call void @default_to_1_8_b()
				; CHECK-NEXT: ret void
				;
				call void @default_to_1_8_a()
				call void @default_to_1_8_b()
				ret void
				}

				; 1,2 -> 1,2
				define internal void @merge_cycle_0() #1 {
				; CHECK-LABEL: define {{[^@]+}}@merge_cycle_0
				; CHECK-SAME: () #[[ATTR1]] {
				; CHECK-NEXT: call void @merge_cycle_1()
				; CHECK-NEXT: ret void
				;
				call void @merge_cycle_1()
				ret void
				}

				; Called from 1,2 + 3,8
				; 2,8 -> 2,8
				define internal void @merge_cycle_1() #3 {
				; CHECK-LABEL: define {{[^@]+}}@merge_cycle_1
				; CHECK-SAME: () #[[ATTR6]] {
				; CHECK-NEXT: call void @merge_cycle_0()
				; CHECK-NEXT: ret void
				;
				call void @merge_cycle_0()
				ret void
				}

				define amdgpu_kernel void @kernel_3_8() #7 {
				; CHECK-LABEL: define {{[^@]+}}@kernel_3_8
				; CHECK-SAME: () #[[ATTR7:[0-9]+]] {
				; CHECK-NEXT: call void @merge_cycle_0()
				; CHECK-NEXT: call void @default_captured_address()
				; CHECK-NEXT: call void @externally_visible_default()
				; CHECK-NEXT: [[F32:%.]] = call float bitcast (i32 () @bitcasted_function to float ()*)()
				; CHECK-NEXT: ret void
				;
				call void @merge_cycle_0()
				call void @default_captured_address()
				call void @externally_visible_default()
				%f32 = call float bitcast (i32 ()* @bitcasted_function to float ()*)()
				ret void
				}

				define internal void @default_captured_address() {
				; CHECK-LABEL: define {{[^@]+}}@default_captured_address
				; CHECK-SAME: () #[[ATTR8:[0-9]+]] {
				; CHECK-NEXT: store volatile void ()* @default_captured_address, void ()** undef, align 8
				; CHECK-NEXT: ret void
				;
				store volatile void ()* @default_captured_address, void ()** undef, align 8
				ret void
				}

				define void @externally_visible_default() {
				; CHECK-LABEL: define {{[^@]+}}@externally_visible_default
				; CHECK-SAME: () #[[ATTR8]] {
				; CHECK-NEXT: ret void
				;
				ret void
				}

				; 1,10 -> 3,8
				define internal i32 @bitcasted_function() {
				; CHECK-LABEL: define {{[^@]+}}@bitcasted_function
				; CHECK-SAME: () #[[ATTR7]] {
				; CHECK-NEXT: ret i32 0
				;
				ret i32 0
				}

				define internal void @called_from_invalid_bounds_0() {
				; CHECK-LABEL: define {{[^@]+}}@called_from_invalid_bounds_0
				; CHECK-SAME: () #[[ATTR9:[0-9]+]] {
				; CHECK-NEXT: ret void
				;
				ret void
				}

				define internal void @called_from_invalid_bounds_1() {
				; CHECK-LABEL: define {{[^@]+}}@called_from_invalid_bounds_1
				; CHECK-SAME: () #[[ATTR9]] {
				; CHECK-NEXT: ret void
				;
				ret void
				}

				; Invalid range for amdgpu-waves-per-eu
				define amdgpu_kernel void @kernel_invalid_bounds_0_8() #8 {
				; CHECK-LABEL: define {{[^@]+}}@kernel_invalid_bounds_0_8
				; CHECK-SAME: () #[[ATTR10:[0-9]+]] {
				; CHECK-NEXT: call void @called_from_invalid_bounds_0()
				; CHECK-NEXT: ret void
				;
				call void @called_from_invalid_bounds_0()
				ret void
				}

				; Invalid range for amdgpu-waves-per-eu
				define amdgpu_kernel void @kernel_invalid_bounds_1_123() #9 {
				; CHECK-LABEL: define {{[^@]+}}@kernel_invalid_bounds_1_123
				; CHECK-SAME: () #[[ATTR11:[0-9]+]] {
				; CHECK-NEXT: call void @called_from_invalid_bounds_1()
				; CHECK-NEXT: ret void
				;
				call void @called_from_invalid_bounds_1()
				ret void
				}

				; XXX - Why is the maximum not 6?
				; The 512 maximum workgroup size implies a minimum occupancy of 2. The
				; implied minimim waves-per-eu should not be 3
				define void @larger_group_size_implies_lower_minimum() #10 {
				; CHECK-LABEL: define {{[^@]+}}@larger_group_size_implies_lower_minimum
				; CHECK-SAME: () #[[ATTR12:[0-9]+]] {
				; CHECK-NEXT: ret void
				;
				ret void
				}

				define amdgpu_kernel void @kernel_3_6() #11 {
				; CHECK-LABEL: define {{[^@]+}}@kernel_3_6
				; CHECK-SAME: () #[[ATTR13:[0-9]+]] {
				; CHECK-NEXT: call void @larger_group_size_implies_lower_minimum()
				; CHECK-NEXT: ret void
				;
				call void @larger_group_size_implies_lower_minimum()
				ret void
				}

				; Use a 1 wave workgroup so there is no interaction by the workgroup
				; size on the implied waves per EU.
				attributes #0 = { "amdgpu-flat-work-group-size"="1,64" "amdgpu-waves-per-eu"="1,8" }
				attributes #1 = { "amdgpu-flat-work-group-size"="1,64" "amdgpu-waves-per-eu"="1,2" }
				attributes #2 = { "amdgpu-flat-work-group-size"="1,64" "amdgpu-waves-per-eu"="1,1" }
				attributes #3 = { "amdgpu-flat-work-group-size"="1,64" "amdgpu-waves-per-eu"="2,8" }
				attributes #4 = { "amdgpu-flat-work-group-size"="1,64" "amdgpu-waves-per-eu"="9,10" }
				attributes #5 = { "amdgpu-flat-work-group-size"="1,64" "amdgpu-waves-per-eu"="2,9" }
				attributes #6 = { "amdgpu-flat-work-group-size"="1,64" "amdgpu-waves-per-eu"="9,9" }
				attributes #7 = { "amdgpu-flat-work-group-size"="1,64" "amdgpu-waves-per-eu"="3,8" }
				attributes #8 = { "amdgpu-flat-work-group-size"="1,64" "amdgpu-waves-per-eu"="0,8" }
				attributes #9 = { "amdgpu-flat-work-group-size"="1,64" "amdgpu-waves-per-eu"="1,123" }
				attributes #10 = { "amdgpu-flat-work-group-size"="1,512" }
				attributes #11 = { "amdgpu-flat-work-group-size"="1,512" "amdgpu-waves-per-eu"="3,6" }

				;.
				; CHECK: attributes #[[ATTR0]] = { "amdgpu-flat-work-group-size"="1,64" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="1,8" "uniform-work-group-size"="false" }
				; CHECK: attributes #[[ATTR1]] = { "amdgpu-flat-work-group-size"="1,64" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="1,2" "uniform-work-group-size"="false" }
				; CHECK: attributes #[[ATTR2]] = { "amdgpu-flat-work-group-size"="1,64" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="2,9" "uniform-work-group-size"="false" }
				; CHECK: attributes #[[ATTR3]] = { "amdgpu-flat-work-group-size"="1,64" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="1,1" "uniform-work-group-size"="false" }
				; CHECK: attributes #[[ATTR4]] = { "amdgpu-flat-work-group-size"="1,64" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="2,2" "uniform-work-group-size"="false" }
				; CHECK: attributes #[[ATTR5]] = { "amdgpu-flat-work-group-size"="1,64" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="9,9" "uniform-work-group-size"="false" }
				; CHECK: attributes #[[ATTR6]] = { "amdgpu-flat-work-group-size"="1,64" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="2,8" "uniform-work-group-size"="false" }
				; CHECK: attributes #[[ATTR7]] = { "amdgpu-flat-work-group-size"="1,64" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="3,8" "uniform-work-group-size"="false" }
				; CHECK: attributes #[[ATTR8]] = { "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
				; CHECK: attributes #[[ATTR9]] = { "amdgpu-flat-work-group-size"="1,64" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }
				; CHECK: attributes #[[ATTR10]] = { "amdgpu-flat-work-group-size"="1,64" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="0,8" "uniform-work-group-size"="false" }
				; CHECK: attributes #[[ATTR11]] = { "amdgpu-flat-work-group-size"="1,64" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="1,123" "uniform-work-group-size"="false" }
				; CHECK: attributes #[[ATTR12]] = { "amdgpu-flat-work-group-size"="1,512" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="2,10" "uniform-work-group-size"="false" }
				; CHECK: attributes #[[ATTR13]] = { "amdgpu-flat-work-group-size"="1,512" "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="3,6" "uniform-work-group-size"="false" }
				;.

llvm/test/CodeGen/AMDGPU/simple-indirect-call.ll

Show First 20 Lines • Show All 67 Lines • ▼ Show 20 Lines	; GFX9-NEXT: s_endpgm
%fp = load void(), void()* %fptr.cast		%fp = load void(), void()* %fptr.cast
call void %fp()		call void %fp()
ret void		ret void
}		}

;.		;.
; AKF_GCN: attributes #[[ATTR0]] = { "amdgpu-calls" "amdgpu-stack-objects" }		; AKF_GCN: attributes #[[ATTR0]] = { "amdgpu-calls" "amdgpu-stack-objects" }
;.		;.
; ATTRIBUTOR_GCN: attributes #[[ATTR0]] = { "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }		; ATTRIBUTOR_GCN: attributes #[[ATTR0]] = { "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
; ATTRIBUTOR_GCN: attributes #[[ATTR1]] = { "uniform-work-group-size"="false" }		; ATTRIBUTOR_GCN: attributes #[[ATTR1]] = { "uniform-work-group-size"="false" }
;.		;.

llvm/test/CodeGen/AMDGPU/uniform-work-group-attribute-missing.ll

	Show All 15 Lines
	; CHECK-NEXT: ret void			; CHECK-NEXT: ret void
	;			;
	store i32 0, i32* @x			store i32 0, i32* @x
	ret void			ret void
	}			}

	define amdgpu_kernel void @kernel1() #1 {			define amdgpu_kernel void @kernel1() #1 {
	; CHECK-LABEL: define {{[^@]+}}@kernel1			; CHECK-LABEL: define {{[^@]+}}@kernel1
	; CHECK-SAME: () #[[ATTR0]] {			; CHECK-SAME: () #[[ATTR1:[0-9]+]] {
	; CHECK-NEXT: call void @foo()			; CHECK-NEXT: call void @foo()
	; CHECK-NEXT: ret void			; CHECK-NEXT: ret void
	;			;
	call void @foo()			call void @foo()
	ret void			ret void
	}			}

	attributes #0 = { "uniform-work-group-size"="true" }			attributes #0 = { "uniform-work-group-size"="true" }
	;.			;.
	; CHECK: attributes #[[ATTR0]] = { "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }			; CHECK: attributes #[[ATTR0]] = { "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
				; CHECK: attributes #[[ATTR1]] = { "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }
	;.			;.

llvm/test/CodeGen/AMDGPU/uniform-work-group-multistep.ll

Show All 37 Lines	;
call void @weak()		call void @weak()
ret void		ret void
}		}

@G2 = global i32 0		@G2 = global i32 0

define internal void @internal3() {		define internal void @internal3() {
; CHECK-LABEL: define {{[^@]+}}@internal3		; CHECK-LABEL: define {{[^@]+}}@internal3
; CHECK-SAME: () #[[ATTR1]] {		; CHECK-SAME: () #[[ATTR2:[0-9]+]] {
; CHECK-NEXT: [[TMP1:%.]] = load i32, i32 @G2, align 4		; CHECK-NEXT: [[TMP1:%.]] = load i32, i32 @G2, align 4
; CHECK-NEXT: [[TMP2:%.*]] = icmp eq i32 [[TMP1]], 0		; CHECK-NEXT: [[TMP2:%.*]] = icmp eq i32 [[TMP1]], 0
; CHECK-NEXT: br i1 [[TMP2]], label [[TMP3:%.]], label [[TMP4:%.]]		; CHECK-NEXT: br i1 [[TMP2]], label [[TMP3:%.]], label [[TMP4:%.]]
; CHECK: 3:		; CHECK: 3:
; CHECK-NEXT: call void @internal4()		; CHECK-NEXT: call void @internal4()
; CHECK-NEXT: call void @internal3()		; CHECK-NEXT: call void @internal3()
; CHECK-NEXT: br label [[TMP4]]		; CHECK-NEXT: br label [[TMP4]]
; CHECK: 4:		; CHECK: 4:
; CHECK-NEXT: ret void		; CHECK-NEXT: ret void
;		;
%1 = load i32, i32* @G2, align 4		%1 = load i32, i32* @G2, align 4
%2 = icmp eq i32 %1, 0		%2 = icmp eq i32 %1, 0
br i1 %2, label %3, label %4		br i1 %2, label %3, label %4
3:		3:
call void @internal4()		call void @internal4()
call void @internal3()		call void @internal3()
br label %4		br label %4
4:		4:
ret void		ret void
}		}

define internal void @internal4() {		define internal void @internal4() {
; CHECK-LABEL: define {{[^@]+}}@internal4		; CHECK-LABEL: define {{[^@]+}}@internal4
; CHECK-SAME: () #[[ATTR1]] {		; CHECK-SAME: () #[[ATTR2]] {
; CHECK-NEXT: store i32 1, i32* @G2, align 4		; CHECK-NEXT: store i32 1, i32* @G2, align 4
; CHECK-NEXT: ret void		; CHECK-NEXT: ret void
;		;
store i32 1, i32* @G2, align 4		store i32 1, i32* @G2, align 4
ret void		ret void
}		}

define internal void @internal2() {		define internal void @internal2() {
; CHECK-LABEL: define {{[^@]+}}@internal2		; CHECK-LABEL: define {{[^@]+}}@internal2
; CHECK-SAME: () #[[ATTR1]] {		; CHECK-SAME: () #[[ATTR2]] {
; CHECK-NEXT: call void @internal3()		; CHECK-NEXT: call void @internal3()
; CHECK-NEXT: ret void		; CHECK-NEXT: ret void
;		;
call void @internal3()		call void @internal3()
ret void		ret void
}		}

define amdgpu_kernel void @kernel2() #0 {		define amdgpu_kernel void @kernel2() #0 {
; CHECK-LABEL: define {{[^@]+}}@kernel2		; CHECK-LABEL: define {{[^@]+}}@kernel2
; CHECK-SAME: () #[[ATTR1]] {		; CHECK-SAME: () #[[ATTR2]] {
; CHECK-NEXT: call void @internal2()		; CHECK-NEXT: call void @internal2()
; CHECK-NEXT: ret void		; CHECK-NEXT: ret void
;		;
call void @internal2()		call void @internal2()
ret void		ret void
}		}

attributes #0 = { "uniform-work-group-size"="true" }		attributes #0 = { "uniform-work-group-size"="true" }
;.		;.
; CHECK: attributes #[[ATTR0]] = { "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }		; CHECK: attributes #[[ATTR0]] = { "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
; CHECK: attributes #[[ATTR1]] = { "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="true" }		; CHECK: attributes #[[ATTR1]] = { "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="true" }
		; CHECK: attributes #[[ATTR2]] = { "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="true" }
;.		;.

llvm/test/CodeGen/AMDGPU/uniform-work-group-nested-function-calls.ll

	Show All 35 Lines
	; CHECK-NEXT: ret void			; CHECK-NEXT: ret void
	;			;
	call void @func2()			call void @func2()
	ret void			ret void
	}			}

	attributes #2 = { "uniform-work-group-size"="true" }			attributes #2 = { "uniform-work-group-size"="true" }
	;.			;.
	; CHECK: attributes #[[ATTR0]] = { "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }			; CHECK: attributes #[[ATTR0]] = { "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
	; CHECK: attributes #[[ATTR1]] = { "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="true" }			; CHECK: attributes #[[ATTR1]] = { "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="true" }
	;.			;.

llvm/test/CodeGen/AMDGPU/uniform-work-group-prevent-attribute-propagation.ll

	Show All 25 Lines
	; CHECK-NEXT: ret void			; CHECK-NEXT: ret void
	;			;
	call void @func()			call void @func()
	ret void			ret void
	}			}

	define amdgpu_kernel void @kernel2() #2 {			define amdgpu_kernel void @kernel2() #2 {
	; CHECK-LABEL: define {{[^@]+}}@kernel2			; CHECK-LABEL: define {{[^@]+}}@kernel2
	; CHECK-SAME: () #[[ATTR0]] {			; CHECK-SAME: () #[[ATTR2:[0-9]+]] {
	; CHECK-NEXT: call void @func()			; CHECK-NEXT: call void @func()
	; CHECK-NEXT: ret void			; CHECK-NEXT: ret void
	;			;
	call void @func()			call void @func()
	ret void			ret void
	}			}

	attributes #1 = { "uniform-work-group-size"="true" }			attributes #1 = { "uniform-work-group-size"="true" }
	;.			;.
	; CHECK: attributes #[[ATTR0]] = { "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }			; CHECK: attributes #[[ATTR0]] = { "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
	; CHECK: attributes #[[ATTR1]] = { "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="true" }			; CHECK: attributes #[[ATTR1]] = { "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="true" }
				; CHECK: attributes #[[ATTR2]] = { "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }
	;.			;.

llvm/test/CodeGen/AMDGPU/uniform-work-group-recursion-test.ll

Show First 20 Lines • Show All 95 Lines • ▼ Show 20 Lines	;
store i32 %r2, i32 addrspace(1)* %m		store i32 %r2, i32 addrspace(1)* %m
ret void		ret void
}		}

; nounwind and readnone are added to match attributor results.		; nounwind and readnone are added to match attributor results.
attributes #0 = { nounwind readnone }		attributes #0 = { nounwind readnone }
attributes #1 = { "uniform-work-group-size"="true" }		attributes #1 = { "uniform-work-group-size"="true" }
;.		;.
; CHECK: attributes #[[ATTR0]] = { nounwind readnone "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }		; CHECK: attributes #[[ATTR0]] = { nounwind readnone "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
; CHECK: attributes #[[ATTR1]] = { nounwind readnone "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="true" }		; CHECK: attributes #[[ATTR1]] = { nounwind readnone "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="true" }
; CHECK: attributes #[[ATTR2]] = { "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="true" }		; CHECK: attributes #[[ATTR2]] = { "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="true" }
;.		;.

llvm/test/CodeGen/AMDGPU/uniform-work-group-test.ll

	Show First 20 Lines • Show All 43 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: ret void			; CHECK-NEXT: ret void
	;			;
	call void @func1()			call void @func1()
	ret void			ret void
	}			}

	define amdgpu_kernel void @kernel3() #0 {			define amdgpu_kernel void @kernel3() #0 {
	; CHECK-LABEL: define {{[^@]+}}@kernel3			; CHECK-LABEL: define {{[^@]+}}@kernel3
	; CHECK-SAME: () #[[ATTR0]] {			; CHECK-SAME: () #[[ATTR1:[0-9]+]] {
	; CHECK-NEXT: call void @func2()			; CHECK-NEXT: call void @func2()
	; CHECK-NEXT: call void @func3()			; CHECK-NEXT: call void @func3()
	; CHECK-NEXT: ret void			; CHECK-NEXT: ret void
	;			;
	call void @func2()			call void @func2()
	call void @func3()			call void @func3()
	ret void			ret void
	}			}

	attributes #0 = { "uniform-work-group-size"="false" }			attributes #0 = { "uniform-work-group-size"="false" }
	;.			;.
	; CHECK: attributes #[[ATTR0]] = { "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }			; CHECK: attributes #[[ATTR0]] = { "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "amdgpu-waves-per-eu"="4,10" "uniform-work-group-size"="false" }
				; CHECK: attributes #[[ATTR1]] = { "amdgpu-no-dispatch-id" "amdgpu-no-dispatch-ptr" "amdgpu-no-implicitarg-ptr" "amdgpu-no-queue-ptr" "amdgpu-no-workgroup-id-x" "amdgpu-no-workgroup-id-y" "amdgpu-no-workgroup-id-z" "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" "uniform-work-group-size"="false" }
	;.			;.

This is an archive of the discontinued LLVM Phabricator instance.

AMDGPU: Propagate amdgpu-waves-per-euAbandonedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 373706

llvm/lib/Target/AMDGPU/AMDGPUAttributor.cpp

llvm/lib/Target/AMDGPU/GCNSubtarget.h

llvm/test/CodeGen/AMDGPU/addrspacecast-constantexpr.ll

llvm/test/CodeGen/AMDGPU/annotate-existing-abi-attributes.ll

llvm/test/CodeGen/AMDGPU/annotate-kernel-features-hsa-call.ll

llvm/test/CodeGen/AMDGPU/annotate-kernel-features-hsa.ll

llvm/test/CodeGen/AMDGPU/direct-indirect-call.ll

llvm/test/CodeGen/AMDGPU/duplicate-attribute-indirect.ll

llvm/test/CodeGen/AMDGPU/propagate-flat-work-group-size.ll

llvm/test/CodeGen/AMDGPU/propagate-waves-per-eu.ll

llvm/test/CodeGen/AMDGPU/simple-indirect-call.ll

llvm/test/CodeGen/AMDGPU/uniform-work-group-attribute-missing.ll

llvm/test/CodeGen/AMDGPU/uniform-work-group-multistep.ll

llvm/test/CodeGen/AMDGPU/uniform-work-group-nested-function-calls.ll

llvm/test/CodeGen/AMDGPU/uniform-work-group-prevent-attribute-propagation.ll

llvm/test/CodeGen/AMDGPU/uniform-work-group-recursion-test.ll

llvm/test/CodeGen/AMDGPU/uniform-work-group-test.ll

AMDGPU: Propagate amdgpu-waves-per-eu
AbandonedPublic