Diff 269595

clang/include/clang/Basic/BuiltinsAMDGPU.def

	Show First 20 Lines • Show All 53 Lines • ▼ Show 20 Lines
	BUILTIN(__builtin_amdgcn_s_dcache_inv, "v", "n")			BUILTIN(__builtin_amdgcn_s_dcache_inv, "v", "n")
	BUILTIN(__builtin_amdgcn_buffer_wbinvl1, "v", "n")			BUILTIN(__builtin_amdgcn_buffer_wbinvl1, "v", "n")
	BUILTIN(__builtin_amdgcn_ds_gws_init, "vUiUi", "n")			BUILTIN(__builtin_amdgcn_ds_gws_init, "vUiUi", "n")
	BUILTIN(__builtin_amdgcn_ds_gws_barrier, "vUiUi", "n")			BUILTIN(__builtin_amdgcn_ds_gws_barrier, "vUiUi", "n")
	BUILTIN(__builtin_amdgcn_ds_gws_sema_v, "vUi", "n")			BUILTIN(__builtin_amdgcn_ds_gws_sema_v, "vUi", "n")
	BUILTIN(__builtin_amdgcn_ds_gws_sema_br, "vUiUi", "n")			BUILTIN(__builtin_amdgcn_ds_gws_sema_br, "vUiUi", "n")
	BUILTIN(__builtin_amdgcn_ds_gws_sema_p, "vUi", "n")			BUILTIN(__builtin_amdgcn_ds_gws_sema_p, "vUi", "n")
	BUILTIN(__builtin_amdgcn_fence, "vUicC*", "n")			BUILTIN(__builtin_amdgcn_fence, "vUicC*", "n")

				BUILTIN(__builtin_amdgcn_atomic_inc32, "ZiZiDZiUicC", "n")
				arsenmUnsubmitted Not Done Reply Inline Actions My main concern is we should probably have both 32 and 64-bit variants arsenm: My main concern is we should probably have both 32 and 64-bit variants
				BUILTIN(__builtin_amdgcn_atomic_inc64, "WiWiDWiUicC", "n")

				BUILTIN(__builtin_amdgcn_atomic_dec32, "ZiZiDZiUicC", "n")
				BUILTIN(__builtin_amdgcn_atomic_dec64, "WiWiDWiUicC", "n")

	// FIXME: Need to disallow constant address space.			// FIXME: Need to disallow constant address space.
	BUILTIN(__builtin_amdgcn_div_scale, "dddbb*", "n")			BUILTIN(__builtin_amdgcn_div_scale, "dddbb*", "n")
	BUILTIN(__builtin_amdgcn_div_scalef, "fffbb*", "n")			BUILTIN(__builtin_amdgcn_div_scalef, "fffbb*", "n")
	BUILTIN(__builtin_amdgcn_div_fmas, "ddddb", "nc")			BUILTIN(__builtin_amdgcn_div_fmas, "ddddb", "nc")
	BUILTIN(__builtin_amdgcn_div_fmasf, "ffffb", "nc")			BUILTIN(__builtin_amdgcn_div_fmasf, "ffffb", "nc")
	BUILTIN(__builtin_amdgcn_div_fixup, "dddd", "nc")			BUILTIN(__builtin_amdgcn_div_fixup, "dddd", "nc")
	BUILTIN(__builtin_amdgcn_div_fixupf, "ffff", "nc")			BUILTIN(__builtin_amdgcn_div_fixupf, "ffff", "nc")
	BUILTIN(__builtin_amdgcn_trig_preop, "ddi", "nc")			BUILTIN(__builtin_amdgcn_trig_preop, "ddi", "nc")
	▲ Show 20 Lines • Show All 177 Lines • Show Last 20 Lines

clang/lib/CodeGen/CGBuiltin.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 14,295 Lines • ▼ Show 20 Lines	llvm::MDNode *RNode = MDHelper.createRange(APInt(16, 1),
APInt(16, CGF.getTarget().getMaxOpenCLWorkGroupSize() + 1));		APInt(16, CGF.getTarget().getMaxOpenCLWorkGroupSize() + 1));
LD->setMetadata(llvm::LLVMContext::MD_range, RNode);		LD->setMetadata(llvm::LLVMContext::MD_range, RNode);
LD->setMetadata(llvm::LLVMContext::MD_invariant_load,		LD->setMetadata(llvm::LLVMContext::MD_invariant_load,
llvm::MDNode::get(CGF.getLLVMContext(), None));		llvm::MDNode::get(CGF.getLLVMContext(), None));
return LD;		return LD;
}		}
} // namespace		} // namespace

		// For processing memory ordering and memory scope arguments of various
		// amdgcn builtins.
		// \p Order takes a C++11 comptabile memory-ordering specifier and converts
		// it into LLVM's memory ordering specifier using atomic C ABI, and writes
		// to \p AO. \p Scope takes a const char * and converts it into AMDGCN
		// specific SyncScopeID and writes it to \p SSID.
		bool CodeGenFunction::ProcessOrderScopeAMDGCN(Value Order, Value Scope,
		llvm::AtomicOrdering &AO,
		llvm::SyncScope::ID &SSID) {
		if (isa<llvm::ConstantInt>(Order)) {
		int ord = cast<llvm::ConstantInt>(Order)->getZExtValue();

		// Map C11/C++11 memory ordering to LLVM memory ordering
		switch (static_cast<llvm::AtomicOrderingCABI>(ord)) {
		case llvm::AtomicOrderingCABI::acquire:
		AO = llvm::AtomicOrdering::Acquire;
		break;
		case llvm::AtomicOrderingCABI::release:
		AO = llvm::AtomicOrdering::Release;
		break;
		case llvm::AtomicOrderingCABI::acq_rel:
		AO = llvm::AtomicOrdering::AcquireRelease;
		break;
		case llvm::AtomicOrderingCABI::seq_cst:
		AO = llvm::AtomicOrdering::SequentiallyConsistent;
		break;
		case llvm::AtomicOrderingCABI::consume:
		case llvm::AtomicOrderingCABI::relaxed:
		break;
		}

		StringRef scp;
		llvm::getConstantStringInfo(Scope, scp);
		SSID = getLLVMContext().getOrInsertSyncScopeID(scp);
		return true;
		}
		return false;
		}

Value *CodeGenFunction::EmitAMDGPUBuiltinExpr(unsigned BuiltinID,		Value *CodeGenFunction::EmitAMDGPUBuiltinExpr(unsigned BuiltinID,
const CallExpr *E) {		const CallExpr *E) {
		llvm::AtomicOrdering AO = llvm::AtomicOrdering::SequentiallyConsistent;
		llvm::SyncScope::ID SSID;
switch (BuiltinID) {		switch (BuiltinID) {
case AMDGPU::BI__builtin_amdgcn_div_scale:		case AMDGPU::BI__builtin_amdgcn_div_scale:
case AMDGPU::BI__builtin_amdgcn_div_scalef: {		case AMDGPU::BI__builtin_amdgcn_div_scalef: {
// Translate from the intrinsics's struct return to the builtin's out		// Translate from the intrinsics's struct return to the builtin's out
// argument.		// argument.

Address FlagOutPtr = EmitPointerWithAlignment(E->getArg(3));		Address FlagOutPtr = EmitPointerWithAlignment(E->getArg(3));

▲ Show 20 Lines • Show All 188 Lines • ▼ Show 20 Lines	case AMDGPU::BI__builtin_amdgcn_alignbit: {
llvm::Value *Src0 = EmitScalarExpr(E->getArg(0));		llvm::Value *Src0 = EmitScalarExpr(E->getArg(0));
llvm::Value *Src1 = EmitScalarExpr(E->getArg(1));		llvm::Value *Src1 = EmitScalarExpr(E->getArg(1));
llvm::Value *Src2 = EmitScalarExpr(E->getArg(2));		llvm::Value *Src2 = EmitScalarExpr(E->getArg(2));
Function *F = CGM.getIntrinsic(Intrinsic::fshr, Src0->getType());		Function *F = CGM.getIntrinsic(Intrinsic::fshr, Src0->getType());
return Builder.CreateCall(F, { Src0, Src1, Src2 });		return Builder.CreateCall(F, { Src0, Src1, Src2 });
}		}

case AMDGPU::BI__builtin_amdgcn_fence: {		case AMDGPU::BI__builtin_amdgcn_fence: {
llvm::AtomicOrdering AO = llvm::AtomicOrdering::SequentiallyConsistent;		if (ProcessOrderScopeAMDGCN(EmitScalarExpr(E->getArg(0)),
llvm::SyncScope::ID SSID;		EmitScalarExpr(E->getArg(1)), AO, SSID))
Value *Order = EmitScalarExpr(E->getArg(0));		return Builder.CreateFence(AO, SSID);
Value *Scope = EmitScalarExpr(E->getArg(1));		LLVM_FALLTHROUGH;
		}
if (isa<llvm::ConstantInt>(Order)) {		case AMDGPU::BI__builtin_amdgcn_atomic_inc32:
int ord = cast<llvm::ConstantInt>(Order)->getZExtValue();		case AMDGPU::BI__builtin_amdgcn_atomic_inc64:
		case AMDGPU::BI__builtin_amdgcn_atomic_dec32:
		case AMDGPU::BI__builtin_amdgcn_atomic_dec64: {
		unsigned BuiltinAtomicOp;
		llvm::Type *ResultType = ConvertType(E->getType());

// Map C11/C++11 memory ordering to LLVM memory ordering		switch (BuiltinID) {
		RKSimonUnsubmitted Not Done Reply Inline Actions @saiislam @arsenm Coverity is warning that the BI__builtin_amdgcn_fence (fallthrough case) is not handled meaning that BuiltinAtomicOp in uninitialized RKSimon: @saiislam @arsenm Coverity is warning that the BI__builtin_amdgcn_fence (fallthrough case) is…
		arsenmUnsubmitted Not Done Reply Inline Actions Test is also missing for builtin_amdgcn_fence arsenm: Test is also missing for builtin_amdgcn_fence
switch (static_cast<llvm::AtomicOrderingCABI>(ord)) {		case AMDGPU::BI__builtin_amdgcn_atomic_inc32:
case llvm::AtomicOrderingCABI::acquire:		case AMDGPU::BI__builtin_amdgcn_atomic_inc64:
		arsenmUnsubmitted Not Done Reply Inline Actions This should be implied by the return type of the builtin? You shouldn't need to switch over it, and you just need to switch between inc/dec intrinsics arsenm: This should be implied by the return type of the builtin? You shouldn't need to switch over it…
AO = llvm::AtomicOrdering::Acquire;		BuiltinAtomicOp = Intrinsic::amdgcn_atomic_inc;
break;		break;
case llvm::AtomicOrderingCABI::release:		case AMDGPU::BI__builtin_amdgcn_atomic_dec32:
AO = llvm::AtomicOrdering::Release;		case AMDGPU::BI__builtin_amdgcn_atomic_dec64:
break;		BuiltinAtomicOp = Intrinsic::amdgcn_atomic_dec;
case llvm::AtomicOrderingCABI::acq_rel:
AO = llvm::AtomicOrdering::AcquireRelease;
break;
case llvm::AtomicOrderingCABI::seq_cst:
AO = llvm::AtomicOrdering::SequentiallyConsistent;
break;
case llvm::AtomicOrderingCABI::consume: // not supported by LLVM fence
case llvm::AtomicOrderingCABI::relaxed: // not supported by LLVM fence
break;		break;
}		}

StringRef scp;		Value *Ptr = EmitScalarExpr(E->getArg(0));
llvm::getConstantStringInfo(Scope, scp);		Value *Val = EmitScalarExpr(E->getArg(1));
SSID = getLLVMContext().getOrInsertSyncScopeID(scp);

return Builder.CreateFence(AO, SSID);		llvm::Function *F =
		CGM.getIntrinsic(BuiltinAtomicOp, {ResultType, Ptr->getType()});

		arsenmUnsubmitted Not Done Reply Inline Actions Should not rely on pointer element type, these are always i32 I think arsenm: Should not rely on pointer element type, these are always i32 I think
		arsenmUnsubmitted Not Done Reply Inline Actions Nope, they can be i64 (but I assume these aren't overloadable builtins, so would need a separate pair) arsenm: Nope, they can be i64 (but I assume these aren't overloadable builtins, so would need a…
		if (ProcessOrderScopeAMDGCN(EmitScalarExpr(E->getArg(2)),
		EmitScalarExpr(E->getArg(3)), AO, SSID)) {

		// llvm.amdgcn.atomic.inc and llvm.amdgcn.atomic.dec expects ordering and
		// scope as unsigned values
		arsenmUnsubmitted Not Done Reply Inline Actions We should fix this (or move these into atomicrmw) arsenm: We should fix this (or move these into atomicrmw)
		sameerdsUnsubmitted Not Done Reply Inline Actions I am not sure why these intrinsics exist as separate from atomicrmw. But while they do, taking a numerical scope is not a problem since they are target-specific. The LLVM instructions take scope as an opaque string just to keep target-specific bits out of the IR. sameerds: I am not sure why these intrinsics exist as separate from atomicrmw. But while they do, taking…
		Value *MemOrder = Builder.getInt32(static_cast<int>(AO));
		Value *MemScope = Builder.getInt32(static_cast<int>(SSID));

		QualType PtrTy = E->getArg(0)->IgnoreImpCasts()->getType();
		arsenmUnsubmitted Not Done Reply Inline Actions Should this come from whether the builtin was called with a volatile pointer rather than being an explicit parameter? arsenm: Should this come from whether the builtin was called with a volatile pointer rather than being…
		bool Volatile =
		PtrTy->castAs<PointerType>()->getPointeeType().isVolatileQualified();
		Value *IsVolatile = Builder.getInt1(static_cast<bool>(Volatile));

		return Builder.CreateCall(F, {Ptr, Val, MemOrder, MemScope, IsVolatile});
}		}
LLVM_FALLTHROUGH;		LLVM_FALLTHROUGH;
}		}
default:		default:
return nullptr;		return nullptr;
}		}
}		}

▲ Show 20 Lines • Show All 1,914 Lines • Show Last 20 Lines

clang/lib/CodeGen/CodeGenFunction.h

Show First 20 Lines • Show All 3,982 Lines • ▼ Show 20 Lines	public:
llvm::Value EmitX86BuiltinExpr(unsigned BuiltinID, const CallExpr E);		llvm::Value EmitX86BuiltinExpr(unsigned BuiltinID, const CallExpr E);
llvm::Value EmitPPCBuiltinExpr(unsigned BuiltinID, const CallExpr E);		llvm::Value EmitPPCBuiltinExpr(unsigned BuiltinID, const CallExpr E);
llvm::Value EmitAMDGPUBuiltinExpr(unsigned BuiltinID, const CallExpr E);		llvm::Value EmitAMDGPUBuiltinExpr(unsigned BuiltinID, const CallExpr E);
llvm::Value EmitSystemZBuiltinExpr(unsigned BuiltinID, const CallExpr E);		llvm::Value EmitSystemZBuiltinExpr(unsigned BuiltinID, const CallExpr E);
llvm::Value EmitNVPTXBuiltinExpr(unsigned BuiltinID, const CallExpr E);		llvm::Value EmitNVPTXBuiltinExpr(unsigned BuiltinID, const CallExpr E);
llvm::Value *EmitWebAssemblyBuiltinExpr(unsigned BuiltinID,		llvm::Value *EmitWebAssemblyBuiltinExpr(unsigned BuiltinID,
const CallExpr *E);		const CallExpr *E);
llvm::Value EmitHexagonBuiltinExpr(unsigned BuiltinID, const CallExpr E);		llvm::Value EmitHexagonBuiltinExpr(unsigned BuiltinID, const CallExpr E);
		bool ProcessOrderScopeAMDGCN(llvm::Value Order, llvm::Value Scope,
		llvm::AtomicOrdering &AO,
		llvm::SyncScope::ID &SSID);

private:		private:
enum class MSVCIntrin;		enum class MSVCIntrin;

public:		public:
llvm::Value EmitMSVCBuiltinExpr(MSVCIntrin BuiltinID, const CallExpr E);		llvm::Value EmitMSVCBuiltinExpr(MSVCIntrin BuiltinID, const CallExpr E);

llvm::Value EmitBuiltinAvailable(ArrayRef<llvm::Value > Args);		llvm::Value EmitBuiltinAvailable(ArrayRef<llvm::Value > Args);
▲ Show 20 Lines • Show All 624 Lines • Show Last 20 Lines

clang/lib/Sema/SemaChecking.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 3,064 Lines • ▼ Show 20 Lines	bool Sema::CheckPPCBuiltinFunctionCall(const TargetInfo &TI, unsigned BuiltinID,
case PPC::BI__builtin_pack_vector_int128:		case PPC::BI__builtin_pack_vector_int128:
return SemaVSXCheck(TheCall);		return SemaVSXCheck(TheCall);
}		}
return SemaBuiltinConstantArgRange(TheCall, i, l, u);		return SemaBuiltinConstantArgRange(TheCall, i, l, u);
}		}

bool Sema::CheckAMDGCNBuiltinFunctionCall(unsigned BuiltinID,		bool Sema::CheckAMDGCNBuiltinFunctionCall(unsigned BuiltinID,
CallExpr *TheCall) {		CallExpr *TheCall) {
		// position of memory order and scope arguments in the builtin
		unsigned OrderIndex, ScopeIndex;
switch (BuiltinID) {		switch (BuiltinID) {
case AMDGPU::BI__builtin_amdgcn_fence: {		case AMDGPU::BI__builtin_amdgcn_atomic_inc32:
ExprResult Arg = TheCall->getArg(0);		case AMDGPU::BI__builtin_amdgcn_atomic_inc64:
		case AMDGPU::BI__builtin_amdgcn_atomic_dec32:
		case AMDGPU::BI__builtin_amdgcn_atomic_dec64:
		OrderIndex = 2;
		ScopeIndex = 3;
		break;
		case AMDGPU::BI__builtin_amdgcn_fence:
		OrderIndex = 0;
		ScopeIndex = 1;
		break;
		default:
		return false;
		}

		ExprResult Arg = TheCall->getArg(OrderIndex);
auto ArgExpr = Arg.get();		auto ArgExpr = Arg.get();
Expr::EvalResult ArgResult;		Expr::EvalResult ArgResult;

if (!ArgExpr->EvaluateAsInt(ArgResult, Context))		if (!ArgExpr->EvaluateAsInt(ArgResult, Context))
return Diag(ArgExpr->getExprLoc(), diag::err_typecheck_expect_int)		return Diag(ArgExpr->getExprLoc(), diag::err_typecheck_expect_int)
<< ArgExpr->getType();		<< ArgExpr->getType();
int ord = ArgResult.Val.getInt().getZExtValue();		int ord = ArgResult.Val.getInt().getZExtValue();

// Check valididty of memory ordering as per C11 / C++11's memody model.		// Check valididty of memory ordering as per C11 / C++11's memody model.
switch (static_cast<llvm::AtomicOrderingCABI>(ord)) {		switch (static_cast<llvm::AtomicOrderingCABI>(ord)) {
case llvm::AtomicOrderingCABI::acquire:		case llvm::AtomicOrderingCABI::acquire:
case llvm::AtomicOrderingCABI::release:		case llvm::AtomicOrderingCABI::release:
case llvm::AtomicOrderingCABI::acq_rel:		case llvm::AtomicOrderingCABI::acq_rel:
case llvm::AtomicOrderingCABI::seq_cst:		case llvm::AtomicOrderingCABI::seq_cst:
break;		break;
default: {		default: {
return Diag(ArgExpr->getBeginLoc(),		return Diag(ArgExpr->getBeginLoc(),
diag::warn_atomic_op_has_invalid_memory_order)		diag::warn_atomic_op_has_invalid_memory_order)
<< ArgExpr->getSourceRange();		<< ArgExpr->getSourceRange();
}		}
}		}

Arg = TheCall->getArg(1);		Arg = TheCall->getArg(ScopeIndex);
ArgExpr = Arg.get();		ArgExpr = Arg.get();
Expr::EvalResult ArgResult1;		Expr::EvalResult ArgResult1;
// Check that sync scope is a constant literal		// Check that sync scope is a constant literal
if (!ArgExpr->EvaluateAsConstantExpr(ArgResult1, Expr::EvaluateForCodeGen,		if (!ArgExpr->EvaluateAsConstantExpr(ArgResult1, Expr::EvaluateForCodeGen,
Context))		Context))
return Diag(ArgExpr->getExprLoc(), diag::err_expr_not_string_literal)		return Diag(ArgExpr->getExprLoc(), diag::err_expr_not_string_literal)
<< ArgExpr->getType();		<< ArgExpr->getType();
} break;
}
return false;		return false;
}		}

bool Sema::CheckSystemZBuiltinFunctionCall(unsigned BuiltinID,		bool Sema::CheckSystemZBuiltinFunctionCall(unsigned BuiltinID,
CallExpr *TheCall) {		CallExpr *TheCall) {
if (BuiltinID == SystemZ::BI__builtin_tabort) {		if (BuiltinID == SystemZ::BI__builtin_tabort) {
Expr *Arg = TheCall->getArg(0);		Expr *Arg = TheCall->getArg(0);
llvm::APSInt AbortCode(32);		llvm::APSInt AbortCode(32);
▲ Show 20 Lines • Show All 11,953 Lines • Show Last 20 Lines

clang/test/CodeGenCXX/builtin-amdgcn-atomic-inc-dec.cpp

This file was added.

				// REQUIRES: amdgpu-registered-target
				// RUN: %clang_cc1 %s -x hip -fcuda-is-device -emit-llvm -O0 -o - \
				// RUN: -triple=amdgcn-amd-amdhsa \| opt -S \| FileCheck %s

				__attribute__((device)) void test_non_volatile_parameter32(int *ptr) {
				// CHECK-LABEL: test_non_volatile_parameter32
				int res;
				// CHECK: %ptr.addr = alloca i32*, align 8, addrspace(5)
				// CHECK-NEXT: %ptr.addr.ascast = addrspacecast i32* addrspace(5)* %ptr.addr to i32**
				// CHECK-NEXT: %res = alloca i32, align 4, addrspace(5)
				// CHECK-NEXT: %res.ascast = addrspacecast i32 addrspace(5)* %res to i32*
				// CHECK-NEXT: store i32* %ptr, i32** %ptr.addr.ascast, align 8
				// CHECK-NEXT: %0 = load i32, i32* %ptr.addr.ascast, align 8
				// CHECK-NEXT: %1 = load i32, i32* %ptr.addr.ascast, align 8
				// CHECK-NEXT: %2 = load i32, i32* %1, align 4
				// CHECK-NEXT: %3 = call i32 @llvm.amdgcn.atomic.inc.i32.p0i32(i32* %0, i32 %2, i32 7, i32 2, i1 false)
				// CHECK-NEXT: store i32 %3, i32* %res.ascast, align 4
				res = __builtin_amdgcn_atomic_inc32(ptr, *ptr, __ATOMIC_SEQ_CST, "workgroup");

				// CHECK: %4 = load i32, i32* %ptr.addr.ascast, align 8
				// CHECK-NEXT: %5 = load i32, i32* %ptr.addr.ascast, align 8
				// CHECK-NEXT: %6 = load i32, i32* %5, align 4
				// CHECK-NEXT: %7 = call i32 @llvm.amdgcn.atomic.dec.i32.p0i32(i32* %4, i32 %6, i32 7, i32 2, i1 false)
				// CHECK-NEXT: store i32 %7, i32* %res.ascast, align 4
				res = __builtin_amdgcn_atomic_dec32(ptr, *ptr, __ATOMIC_SEQ_CST, "workgroup");
				}

				__attribute__((device)) void test_non_volatile_parameter64(__INT64_TYPE__ *ptr) {
				// CHECK-LABEL: test_non_volatile_parameter64
				__INT64_TYPE__ res;
				// CHECK: %ptr.addr = alloca i64*, align 8, addrspace(5)
				// CHECK-NEXT: %ptr.addr.ascast = addrspacecast i64* addrspace(5)* %ptr.addr to i64**
				// CHECK-NEXT: %res = alloca i64, align 8, addrspace(5)
				// CHECK-NEXT: %res.ascast = addrspacecast i64 addrspace(5)* %res to i64*
				// CHECK-NEXT: store i64* %ptr, i64** %ptr.addr.ascast, align 8
				// CHECK-NEXT: %0 = load i64, i64* %ptr.addr.ascast, align 8
				// CHECK-NEXT: %1 = load i64, i64* %ptr.addr.ascast, align 8
				// CHECK-NEXT: %2 = load i64, i64* %1, align 8
				// CHECK-NEXT: %3 = call i64 @llvm.amdgcn.atomic.inc.i64.p0i64(i64* %0, i64 %2, i32 7, i32 2, i1 false)
				// CHECK-NEXT: store i64 %3, i64* %res.ascast, align 8
				res = __builtin_amdgcn_atomic_inc64(ptr, *ptr, __ATOMIC_SEQ_CST, "workgroup");

				// CHECK: %4 = load i64, i64* %ptr.addr.ascast, align 8
				// CHECK-NEXT: %5 = load i64, i64* %ptr.addr.ascast, align 8
				// CHECK-NEXT: %6 = load i64, i64* %5, align 8
				// CHECK-NEXT: %7 = call i64 @llvm.amdgcn.atomic.dec.i64.p0i64(i64* %4, i64 %6, i32 7, i32 2, i1 false)
				// CHECK-NEXT: store i64 %7, i64* %res.ascast, align 8
				res = __builtin_amdgcn_atomic_dec64(ptr, *ptr, __ATOMIC_SEQ_CST, "workgroup");
				}

				__attribute__((device)) void test_volatile_parameter32(volatile int *ptr) {
				// CHECK-LABEL: test_volatile_parameter32
				int res;
				// CHECK: %ptr.addr = alloca i32*, align 8, addrspace(5)
				// CHECK-NEXT: %ptr.addr.ascast = addrspacecast i32* addrspace(5)* %ptr.addr to i32**
				// CHECK-NEXT: %res = alloca i32, align 4, addrspace(5)
				// CHECK-NEXT: %res.ascast = addrspacecast i32 addrspace(5)* %res to i32*
				// CHECK-NEXT: store i32* %ptr, i32** %ptr.addr.ascast, align 8
				// CHECK-NEXT: %0 = load i32, i32* %ptr.addr.ascast, align 8
				// CHECK-NEXT: %1 = load i32, i32* %ptr.addr.ascast, align 8
				// CHECK-NEXT: %2 = load volatile i32, i32* %1, align 4
				// CHECK-NEXT: %3 = call i32 @llvm.amdgcn.atomic.inc.i32.p0i32(i32* %0, i32 %2, i32 7, i32 2, i1 true)
				// CHECK-NEXT: store i32 %3, i32* %res.ascast, align 4
				res = __builtin_amdgcn_atomic_inc32(ptr, *ptr, __ATOMIC_SEQ_CST, "workgroup");

				// CHECK: %4 = load i32, i32* %ptr.addr.ascast, align 8
				// CHECK-NEXT: %5 = load i32, i32* %ptr.addr.ascast, align 8
				// CHECK-NEXT: %6 = load volatile i32, i32* %5, align 4
				// CHECK-NEXT: %7 = call i32 @llvm.amdgcn.atomic.dec.i32.p0i32(i32* %4, i32 %6, i32 7, i32 2, i1 true)
				// CHECK-NEXT: store i32 %7, i32* %res.ascast, align 4
				res = __builtin_amdgcn_atomic_dec32(ptr, *ptr, __ATOMIC_SEQ_CST, "workgroup");
				}

				__attribute__((device)) void test_volatile_parameter64(volatile __INT64_TYPE__ *ptr) {
				// CHECK-LABEL: test_volatile_parameter64
				__INT64_TYPE__ res;
				// CHECK: %ptr.addr = alloca i64*, align 8, addrspace(5)
				// CHECK-NEXT: %ptr.addr.ascast = addrspacecast i64* addrspace(5)* %ptr.addr to i64**
				// CHECK-NEXT: %res = alloca i64, align 8, addrspace(5)
				// CHECK-NEXT: %res.ascast = addrspacecast i64 addrspace(5)* %res to i64*
				// CHECK-NEXT: store i64* %ptr, i64** %ptr.addr.ascast, align 8
				// CHECK-NEXT: %0 = load i64, i64* %ptr.addr.ascast, align 8
				// CHECK-NEXT: %1 = load i64, i64* %ptr.addr.ascast, align 8
				// CHECK-NEXT: %2 = load volatile i64, i64* %1, align 8
				// CHECK-NEXT: %3 = call i64 @llvm.amdgcn.atomic.inc.i64.p0i64(i64* %0, i64 %2, i32 7, i32 2, i1 true)
				// CHECK-NEXT: store i64 %3, i64* %res.ascast, align 8
				res = __builtin_amdgcn_atomic_inc64(ptr, *ptr, __ATOMIC_SEQ_CST, "workgroup");

				// CHECK: %4 = load i64, i64* %ptr.addr.ascast, align 8
				// CHECK-NEXT: %5 = load i64, i64* %ptr.addr.ascast, align 8
				// CHECK-NEXT: %6 = load volatile i64, i64* %5, align 8
				// CHECK-NEXT: %7 = call i64 @llvm.amdgcn.atomic.dec.i64.p0i64(i64* %4, i64 %6, i32 7, i32 2, i1 true)
				// CHECK-NEXT: store i64 %7, i64* %res.ascast, align 8
				res = __builtin_amdgcn_atomic_dec64(ptr, *ptr, __ATOMIC_SEQ_CST, "workgroup");
				}

				__attribute__((device)) void test_shared32() {
				// CHECK-LABEL: test_shared32
				__attribute__((shared)) int val;

				// CHECK: %0 = load i32, i32* addrspacecast (i32 addrspace(3)* @_ZZ13test_shared32vE3val to i32*), align 4
				// CHECK-NEXT: %1 = call i32 @llvm.amdgcn.atomic.inc.i32.p0i32(i32* addrspacecast (i32 addrspace(3)* @_ZZ13test_shared32vE3val to i32*), i32 %0, i32 7, i32 2, i1 false)
				// CHECK-NEXT: store i32 %1, i32* addrspacecast (i32 addrspace(3)* @_ZZ13test_shared32vE3val to i32*), align 4
				val = __builtin_amdgcn_atomic_inc32(&val, val, __ATOMIC_SEQ_CST, "workgroup");

				// CHECK: %2 = load i32, i32* addrspacecast (i32 addrspace(3)* @_ZZ13test_shared32vE3val to i32*), align 4
				// CHECK-NEXT: %3 = call i32 @llvm.amdgcn.atomic.dec.i32.p0i32(i32* addrspacecast (i32 addrspace(3)* @_ZZ13test_shared32vE3val to i32*), i32 %2, i32 7, i32 2, i1 false)
				// CHECK-NEXT: store i32 %3, i32* addrspacecast (i32 addrspace(3)* @_ZZ13test_shared32vE3val to i32*), align 4
				val = __builtin_amdgcn_atomic_dec32(&val, val, __ATOMIC_SEQ_CST, "workgroup");
				}

				__attribute__((device)) void test_shared64() {
				// CHECK-LABEL: test_shared64
				__attribute__((shared)) __INT64_TYPE__ val;

				// CHECK: %0 = load i64, i64* addrspacecast (i64 addrspace(3)* @_ZZ13test_shared64vE3val to i64*), align 8
				// CHECK-NEXT: %1 = call i64 @llvm.amdgcn.atomic.inc.i64.p0i64(i64* addrspacecast (i64 addrspace(3)* @_ZZ13test_shared64vE3val to i64*), i64 %0, i32 7, i32 2, i1 false)
				// CHECK-NEXT: store i64 %1, i64* addrspacecast (i64 addrspace(3)* @_ZZ13test_shared64vE3val to i64*), align 8
				val = __builtin_amdgcn_atomic_inc64(&val, val, __ATOMIC_SEQ_CST, "workgroup");

				// CHECK: %2 = load i64, i64* addrspacecast (i64 addrspace(3)* @_ZZ13test_shared64vE3val to i64*), align 8
				// CHECK-NEXT: %3 = call i64 @llvm.amdgcn.atomic.dec.i64.p0i64(i64* addrspacecast (i64 addrspace(3)* @_ZZ13test_shared64vE3val to i64*), i64 %2, i32 7, i32 2, i1 false)
				// CHECK-NEXT: store i64 %3, i64* addrspacecast (i64 addrspace(3)* @_ZZ13test_shared64vE3val to i64*), align 8
				val = __builtin_amdgcn_atomic_dec64(&val, val, __ATOMIC_SEQ_CST, "workgroup");
				}

				int global_val32;
				__attribute__((device)) void test_global32() {
				// CHECK-LABEL: test_global32
				// CHECK: %0 = load i32, i32* addrspacecast (i32 addrspace(1)* @global_val32 to i32*), align 4
				// CHECK-NEXT: %1 = call i32 @llvm.amdgcn.atomic.inc.i32.p0i32(i32* addrspacecast (i32 addrspace(1)* @global_val32 to i32*), i32 %0, i32 7, i32 2, i1 false)
				// CHECK-NEXT: store i32 %1, i32* addrspacecast (i32 addrspace(1)* @global_val32 to i32*), align 4
				global_val32 = __builtin_amdgcn_atomic_inc32(&global_val32, global_val32, __ATOMIC_SEQ_CST, "workgroup");

				// CHECK: %2 = load i32, i32* addrspacecast (i32 addrspace(1)* @global_val32 to i32*), align 4
				// CHECK-NEXT: %3 = call i32 @llvm.amdgcn.atomic.dec.i32.p0i32(i32* addrspacecast (i32 addrspace(1)* @global_val32 to i32*), i32 %2, i32 7, i32 2, i1 false)
				// CHECK-NEXT: store i32 %3, i32* addrspacecast (i32 addrspace(1)* @global_val32 to i32*), align 4
				global_val32 = __builtin_amdgcn_atomic_dec32(&global_val32, global_val32, __ATOMIC_SEQ_CST, "workgroup");
				}

				__INT64_TYPE__ global_val64;
				__attribute__((device)) void test_global64() {
				// CHECK-LABEL: test_global64
				// CHECK: %0 = load i64, i64* addrspacecast (i64 addrspace(1)* @global_val64 to i64*), align 8
				// CHECK-NEXT: %1 = call i64 @llvm.amdgcn.atomic.inc.i64.p0i64(i64* addrspacecast (i64 addrspace(1)* @global_val64 to i64*), i64 %0, i32 7, i32 2, i1 false)
				// CHECK-NEXT: store i64 %1, i64* addrspacecast (i64 addrspace(1)* @global_val64 to i64*), align 8
				global_val64 = __builtin_amdgcn_atomic_inc64(&global_val64, global_val64, __ATOMIC_SEQ_CST, "workgroup");

				// CHECK: %2 = load i64, i64* addrspacecast (i64 addrspace(1)* @global_val64 to i64*), align 8
				// CHECK-NEXT: %3 = call i64 @llvm.amdgcn.atomic.dec.i64.p0i64(i64* addrspacecast (i64 addrspace(1)* @global_val64 to i64*), i64 %2, i32 7, i32 2, i1 false)
				// CHECK-NEXT: store i64 %3, i64* addrspacecast (i64 addrspace(1)* @global_val64 to i64*), align 8
				global_val64 = __builtin_amdgcn_atomic_dec64(&global_val64, global_val64, __ATOMIC_SEQ_CST, "workgroup");
				}

				__attribute__((constant)) int cval32;
				__attribute__((device)) void test_constant32() {
				// CHECK-LABEL: test_constant32
				int local_val;

				// CHECK: %0 = load i32, i32* addrspacecast (i32 addrspace(4)* @cval32 to i32*), align 4
				// CHECK-NEXT: %1 = call i32 @llvm.amdgcn.atomic.inc.i32.p0i32(i32* addrspacecast (i32 addrspace(4)* @cval32 to i32*), i32 %0, i32 7, i32 2, i1 false)
				// CHECK-NEXT: store i32 %1, i32* %local_val.ascast, align 4
				local_val = __builtin_amdgcn_atomic_inc32(&cval32, cval32, __ATOMIC_SEQ_CST, "workgroup");

				// CHECK: %2 = load i32, i32* addrspacecast (i32 addrspace(4)* @cval32 to i32*), align 4
				// CHECK-NEXT: %3 = call i32 @llvm.amdgcn.atomic.dec.i32.p0i32(i32* addrspacecast (i32 addrspace(4)* @cval32 to i32*), i32 %2, i32 7, i32 2, i1 false)
				// CHECK-NEXT: store i32 %3, i32* %local_val.ascast, align 4
				local_val = __builtin_amdgcn_atomic_dec32(&cval32, cval32, __ATOMIC_SEQ_CST, "workgroup");
				}

				__attribute__((constant)) __INT64_TYPE__ cval64;
				__attribute__((device)) void test_constant64() {
				// CHECK-LABEL: test_constant64
				__INT64_TYPE__ local_val;

				// CHECK: %0 = load i64, i64* addrspacecast (i64 addrspace(4)* @cval64 to i64*), align 8
				// CHECK-NEXT: %1 = call i64 @llvm.amdgcn.atomic.inc.i64.p0i64(i64* addrspacecast (i64 addrspace(4)* @cval64 to i64*), i64 %0, i32 7, i32 2, i1 false)
				// CHECK-NEXT: store i64 %1, i64* %local_val.ascast, align 8
				local_val = __builtin_amdgcn_atomic_inc64(&cval64, cval64, __ATOMIC_SEQ_CST, "workgroup");

				// CHECK: %2 = load i64, i64* addrspacecast (i64 addrspace(4)* @cval64 to i64*), align 8
				// CHECK-NEXT: %3 = call i64 @llvm.amdgcn.atomic.dec.i64.p0i64(i64* addrspacecast (i64 addrspace(4)* @cval64 to i64*), i64 %2, i32 7, i32 2, i1 false)
				// CHECK-NEXT: store i64 %3, i64* %local_val.ascast, align 8
				local_val = __builtin_amdgcn_atomic_dec64(&cval64, cval64, __ATOMIC_SEQ_CST, "workgroup");
				}

				__attribute__((device)) void test_order32() {
				// CHECK-LABEL: test_order32
				__attribute__((shared)) int val;

				// CHECK: %1 = call i32 @llvm.amdgcn.atomic.inc.i32.p0i32(i32* addrspacecast (i32 addrspace(3)* @_ZZ12test_order32vE3val to i32*), i32 %0, i32 4, i32 2, i1 false)
				val = __builtin_amdgcn_atomic_inc32(&val, val, __ATOMIC_ACQUIRE, "workgroup");

				// CHECK: %3 = call i32 @llvm.amdgcn.atomic.dec.i32.p0i32(i32* addrspacecast (i32 addrspace(3)* @_ZZ12test_order32vE3val to i32*), i32 %2, i32 5, i32 2, i1 false)
				val = __builtin_amdgcn_atomic_dec32(&val, val, __ATOMIC_RELEASE, "workgroup");

				// CHECK: %5 = call i32 @llvm.amdgcn.atomic.dec.i32.p0i32(i32* addrspacecast (i32 addrspace(3)* @_ZZ12test_order32vE3val to i32*), i32 %4, i32 6, i32 2, i1 false)
				val = __builtin_amdgcn_atomic_dec32(&val, val, __ATOMIC_ACQ_REL, "workgroup");

				// CHECK: %7 = call i32 @llvm.amdgcn.atomic.dec.i32.p0i32(i32* addrspacecast (i32 addrspace(3)* @_ZZ12test_order32vE3val to i32*), i32 %6, i32 7, i32 2, i1 false)
				val = __builtin_amdgcn_atomic_dec32(&val, val, __ATOMIC_SEQ_CST, "workgroup");
				}

				__attribute__((device)) void test_order64() {
				// CHECK-LABEL: test_order64
				__attribute__((shared)) __INT64_TYPE__ val;

				// CHECK: %1 = call i64 @llvm.amdgcn.atomic.inc.i64.p0i64(i64* addrspacecast (i64 addrspace(3)* @_ZZ12test_order64vE3val to i64*), i64 %0, i32 4, i32 2, i1 false)
				val = __builtin_amdgcn_atomic_inc64(&val, val, __ATOMIC_ACQUIRE, "workgroup");

				// CHECK: %3 = call i64 @llvm.amdgcn.atomic.dec.i64.p0i64(i64* addrspacecast (i64 addrspace(3)* @_ZZ12test_order64vE3val to i64*), i64 %2, i32 5, i32 2, i1 false)
				val = __builtin_amdgcn_atomic_dec64(&val, val, __ATOMIC_RELEASE, "workgroup");

				// CHECK: %5 = call i64 @llvm.amdgcn.atomic.dec.i64.p0i64(i64* addrspacecast (i64 addrspace(3)* @_ZZ12test_order64vE3val to i64*), i64 %4, i32 6, i32 2, i1 false)
				val = __builtin_amdgcn_atomic_dec64(&val, val, __ATOMIC_ACQ_REL, "workgroup");

				// CHECK: %7 = call i64 @llvm.amdgcn.atomic.dec.i64.p0i64(i64* addrspacecast (i64 addrspace(3)* @_ZZ12test_order64vE3val to i64*), i64 %6, i32 7, i32 2, i1 false)
				val = __builtin_amdgcn_atomic_dec64(&val, val, __ATOMIC_SEQ_CST, "workgroup");
				}

				__attribute__((device)) void test_scope32() {
				// CHECK-LABEL: test_scope32
				__attribute__((shared)) int val;

				// CHECK: %1 = call i32 @llvm.amdgcn.atomic.inc.i32.p0i32(i32* addrspacecast (i32 addrspace(3)* @_ZZ12test_scope32vE3val to i32*), i32 %0, i32 7, i32 1, i1 false)
				val = __builtin_amdgcn_atomic_inc32(&val, val, __ATOMIC_SEQ_CST, "");

				// CHECK: %3 = call i32 @llvm.amdgcn.atomic.dec.i32.p0i32(i32* addrspacecast (i32 addrspace(3)* @_ZZ12test_scope32vE3val to i32*), i32 %2, i32 7, i32 2, i1 false)
				val = __builtin_amdgcn_atomic_dec32(&val, val, __ATOMIC_SEQ_CST, "workgroup");

				// CHECK: %5 = call i32 @llvm.amdgcn.atomic.dec.i32.p0i32(i32* addrspacecast (i32 addrspace(3)* @_ZZ12test_scope32vE3val to i32*), i32 %4, i32 7, i32 3, i1 false)
				val = __builtin_amdgcn_atomic_dec32(&val, val, __ATOMIC_SEQ_CST, "agent");

				// CHECK: %7 = call i32 @llvm.amdgcn.atomic.dec.i32.p0i32(i32* addrspacecast (i32 addrspace(3)* @_ZZ12test_scope32vE3val to i32*), i32 %6, i32 7, i32 4, i1 false)
				val = __builtin_amdgcn_atomic_dec32(&val, val, __ATOMIC_SEQ_CST, "wavefront");
				}

				__attribute__((device)) void test_scope64() {
				// CHECK-LABEL: test_scope64
				__attribute__((shared)) __INT64_TYPE__ val;

				// CHECK: %1 = call i64 @llvm.amdgcn.atomic.inc.i64.p0i64(i64* addrspacecast (i64 addrspace(3)* @_ZZ12test_scope64vE3val to i64*), i64 %0, i32 7, i32 1, i1 false)
				val = __builtin_amdgcn_atomic_inc64(&val, val, __ATOMIC_SEQ_CST, "");

				// CHECK: %3 = call i64 @llvm.amdgcn.atomic.dec.i64.p0i64(i64* addrspacecast (i64 addrspace(3)* @_ZZ12test_scope64vE3val to i64*), i64 %2, i32 7, i32 2, i1 false)
				val = __builtin_amdgcn_atomic_dec64(&val, val, __ATOMIC_SEQ_CST, "workgroup");

				// CHECK: %5 = call i64 @llvm.amdgcn.atomic.dec.i64.p0i64(i64* addrspacecast (i64 addrspace(3)* @_ZZ12test_scope64vE3val to i64*), i64 %4, i32 7, i32 3, i1 false)
				val = __builtin_amdgcn_atomic_dec64(&val, val, __ATOMIC_SEQ_CST, "agent");

				// CHECK: %7 = call i64 @llvm.amdgcn.atomic.dec.i64.p0i64(i64* addrspacecast (i64 addrspace(3)* @_ZZ12test_scope64vE3val to i64*), i64 %6, i32 7, i32 4, i1 false)
				val = __builtin_amdgcn_atomic_dec64(&val, val, __ATOMIC_SEQ_CST, "wavefront");
				}

clang/test/Sema/builtin-amdgcn-atomic-inc-dec-failure.cpp

This file was added.

				// REQUIRES: amdgpu-registered-target
				// RUN: not %clang_cc1 %s -x hip -fcuda-is-device -o - -emit-llvm -triple=amdgcn-amd-amdhsa 2>&1 \| FileCheck %s

				void test_host() {
				int val;

				// CHECK: error: reference to __device__ function '__builtin_amdgcn_atomic_inc32' in __host__ function
				val = __builtin_amdgcn_atomic_inc32(&val, val, __ATOMIC_SEQ_CST, "");

				// CHECK: error: reference to __device__ function '__builtin_amdgcn_atomic_inc64' in __host__ function
				val = __builtin_amdgcn_atomic_inc64(&val, val, __ATOMIC_SEQ_CST, "");

				// CHECK: error: reference to __device__ function '__builtin_amdgcn_atomic_dec32' in __host__ function
				val = __builtin_amdgcn_atomic_dec32(&val, val, __ATOMIC_SEQ_CST, "");

				// CHECK: error: reference to __device__ function '__builtin_amdgcn_atomic_dec64' in __host__ function
				val = __builtin_amdgcn_atomic_dec64(&val, val, __ATOMIC_SEQ_CST, "");
				}

clang/test/SemaOpenCL/builtins-amdgcn-error.cl

Show First 20 Lines • Show All 138 Lines • ▼ Show 20 Lines	void test_fence() {
const char ptr[] = "workgroup";		const char ptr[] = "workgroup";
__builtin_amdgcn_fence(__ATOMIC_ACQUIRE, ptr); // expected-error {{expression is not a string literal}}		__builtin_amdgcn_fence(__ATOMIC_ACQUIRE, ptr); // expected-error {{expression is not a string literal}}
}		}

void test_s_setreg(int x, int y) {		void test_s_setreg(int x, int y) {
__builtin_amdgcn_s_setreg(x, 0); // expected-error {{argument to '__builtin_amdgcn_s_setreg' must be a constant integer}}		__builtin_amdgcn_s_setreg(x, 0); // expected-error {{argument to '__builtin_amdgcn_s_setreg' must be a constant integer}}
__builtin_amdgcn_s_setreg(x, y); // expected-error {{argument to '__builtin_amdgcn_s_setreg' must be a constant integer}}		__builtin_amdgcn_s_setreg(x, y); // expected-error {{argument to '__builtin_amdgcn_s_setreg' must be a constant integer}}
}		}

		void test_atomic_inc32() {
		int val = 17;
		val = __builtin_amdgcn_atomic_inc32(&val, val, __ATOMIC_SEQ_CST + 1, "workgroup"); // expected-warning {{memory order argument to atomic operation is invalid}}
		val = __builtin_amdgcn_atomic_inc32(&val, val, __ATOMIC_ACQUIRE - 1, "workgroup"); // expected-warning {{memory order argument to atomic operation is invalid}}
		val = __builtin_amdgcn_atomic_inc32(4); // expected-error {{too few arguments to function call, expected 4}}
		val = __builtin_amdgcn_atomic_inc32(&val, val, 4, 4, 4, 4); // expected-error {{too many arguments to function call, expected 4}}
		val = __builtin_amdgcn_atomic_inc32(&val, val, 3.14, ""); // expected-warning {{implicit conversion from 'double' to 'unsigned int' changes value from 3.14 to 3}}
		val = __builtin_amdgcn_atomic_inc32(&val, val, __ATOMIC_ACQUIRE, 5); // expected-warning {{incompatible integer to pointer conversion passing 'int' to parameter of type 'const char *'}}
		const char ptr[] = "workgroup";
		val = __builtin_amdgcn_atomic_inc32(&val, val, __ATOMIC_ACQUIRE, ptr); // expected-error {{expression is not a string literal}}
		}

		void test_atomic_inc64() {
		__INT64_TYPE__ val = 17;
		val = __builtin_amdgcn_atomic_inc64(&val, val, __ATOMIC_SEQ_CST + 1, "workgroup"); // expected-warning {{memory order argument to atomic operation is invalid}}
		val = __builtin_amdgcn_atomic_inc64(&val, val, __ATOMIC_ACQUIRE - 1, "workgroup"); // expected-warning {{memory order argument to atomic operation is invalid}}
		val = __builtin_amdgcn_atomic_inc64(4); // expected-error {{too few arguments to function call, expected 4}}
		val = __builtin_amdgcn_atomic_inc64(&val, val, 4, 4, 4, 4); // expected-error {{too many arguments to function call, expected 4}}
		val = __builtin_amdgcn_atomic_inc64(&val, val, 3.14, ""); // expected-warning {{implicit conversion from 'double' to 'unsigned int' changes value from 3.14 to 3}}
		val = __builtin_amdgcn_atomic_inc64(&val, val, __ATOMIC_ACQUIRE, 5); // expected-warning {{incompatible integer to pointer conversion passing 'int' to parameter of type 'const char *'}}
		const char ptr[] = "workgroup";
		val = __builtin_amdgcn_atomic_inc64(&val, val, __ATOMIC_ACQUIRE, ptr); // expected-error {{expression is not a string literal}}
		}

		void test_atomic_dec32() {
		int val = 17;
		val = __builtin_amdgcn_atomic_dec32(&val, val, __ATOMIC_SEQ_CST + 1, "workgroup"); // expected-warning {{memory order argument to atomic operation is invalid}}
		val = __builtin_amdgcn_atomic_dec32(&val, val, __ATOMIC_ACQUIRE - 1, "workgroup"); // expected-warning {{memory order argument to atomic operation is invalid}}
		val = __builtin_amdgcn_atomic_dec32(4); // expected-error {{too few arguments to function call, expected 4}}
		val = __builtin_amdgcn_atomic_dec32(&val, val, 4, 4, 4, 4); // expected-error {{too many arguments to function call, expected 4}}
		val = __builtin_amdgcn_atomic_dec32(&val, val, 3.14, ""); // expected-warning {{implicit conversion from 'double' to 'unsigned int' changes value from 3.14 to 3}}
		val = __builtin_amdgcn_atomic_dec32(&val, val, __ATOMIC_ACQUIRE, 5); // expected-warning {{incompatible integer to pointer conversion passing 'int' to parameter of type 'const char *'}}
		const char ptr[] = "workgroup";
		val = __builtin_amdgcn_atomic_dec32(&val, val, __ATOMIC_ACQUIRE, ptr); // expected-error {{expression is not a string literal}}
		}

		void test_atomic_dec64() {
		__INT64_TYPE__ val = 17;
		val = __builtin_amdgcn_atomic_dec64(&val, val, __ATOMIC_SEQ_CST + 1, "workgroup"); // expected-warning {{memory order argument to atomic operation is invalid}}
		val = __builtin_amdgcn_atomic_dec64(&val, val, __ATOMIC_ACQUIRE - 1, "workgroup"); // expected-warning {{memory order argument to atomic operation is invalid}}
		val = __builtin_amdgcn_atomic_dec64(4); // expected-error {{too few arguments to function call, expected 4}}
		val = __builtin_amdgcn_atomic_dec64(&val, val, 4, 4, 4, 4); // expected-error {{too many arguments to function call, expected 4}}
		val = __builtin_amdgcn_atomic_dec64(&val, val, 3.14, ""); // expected-warning {{implicit conversion from 'double' to 'unsigned int' changes value from 3.14 to 3}}
		val = __builtin_amdgcn_atomic_dec64(&val, val, __ATOMIC_ACQUIRE, 5); // expected-warning {{incompatible integer to pointer conversion passing 'int' to parameter of type 'const char *'}}
		const char ptr[] = "workgroup";
		val = __builtin_amdgcn_atomic_dec64(&val, val, __ATOMIC_ACQUIRE, ptr); // expected-error {{expression is not a string literal}}
		}

This is an archive of the discontinued LLVM Phabricator instance.

[AMDGPU] Introduce Clang builtins to be mapped to AMDGCN atomic inc/dec intrinsics
ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 269595

clang/include/clang/Basic/BuiltinsAMDGPU.def

clang/lib/CodeGen/CGBuiltin.cpp

clang/lib/CodeGen/CodeGenFunction.h

clang/lib/Sema/SemaChecking.cpp

clang/test/CodeGenCXX/builtin-amdgcn-atomic-inc-dec.cpp

clang/test/Sema/builtin-amdgcn-atomic-inc-dec-failure.cpp

clang/test/SemaOpenCL/builtins-amdgcn-error.cl

This is an archive of the discontinued LLVM Phabricator instance.

[AMDGPU] Introduce Clang builtins to be mapped to AMDGCN atomic inc/dec intrinsicsClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 269595

clang/include/clang/Basic/BuiltinsAMDGPU.def

clang/lib/CodeGen/CGBuiltin.cpp

clang/lib/CodeGen/CodeGenFunction.h

clang/lib/Sema/SemaChecking.cpp

clang/test/CodeGenCXX/builtin-amdgcn-atomic-inc-dec.cpp

clang/test/Sema/builtin-amdgcn-atomic-inc-dec-failure.cpp

clang/test/SemaOpenCL/builtins-amdgcn-error.cl

[AMDGPU] Introduce Clang builtins to be mapped to AMDGCN atomic inc/dec intrinsics
ClosedPublic