This is an archive of the discontinued LLVM Phabricator instance.

Paths

Table of Contentst

-
clang/
-
lib/Basic/Targets/
-
Basic/
-
Targets/
-
ARM.cpp
-
test/
-
CodeGen/
-
arm-atomics-m0.c
-
atomic-ops-libcall.c
-
atomics-inlining.c
-
c11atomics.c
-
pr45476.cpp
-
CodeGenCXX/
-
threadsafe-statics-no-atomic.cpp
-
CodeGenOpenCL/
-
atomic-ops-libcall.cl
-
llvm/
-
lib/Target/ARM/
-
Target/
-
ARM/
-
ARMISelLowering.cpp
-
test/CodeGen/ARM/
-
CodeGen/
-
ARM/
-
atomic-64bit.ll
-
atomic-load-store.ll
-
atomic-op.ll
-
thumbv6m-atomic32.ll

Differential D137980

[ARM] Pretend atomics are always lock-free for small widths.
Needs ReviewPublic

Authored by efriedma on Nov 14 2022, 1:42 PM.

Download Raw Diff

Details

Reviewers

nikic
t.p.northover
john.brawn
joerg
tomhughes
alanphipps
aykevl

Summary

Trying to accurately model what the hardware actually supports seems to lead to a lot of people complaining, and nobody saying it's actually helpful. So just pretend everything is lock-free, and let users deal with ensuring that the __sync_* routines are actually lock-free. If anyone complains, we can just say "gcc does the same thing".

Partially reverts D120026. Makes D130480 unnecessary.

Fixes https://github.com/llvm/llvm-project/issues/58603

Diff Detail

Repository: rG LLVM Github Monorepo

Unit TestsFailed

	Time	Test
	60,050 ms	x64 debian > ThreadSanitizer-x86_64.ThreadSanitizer-x86_64::restore_stack.cpp
	60,030 ms	x64 debian > libFuzzer.libFuzzer::minimize_crash.test

Event Timeline

efriedma created this revision.Nov 14 2022, 1:42 PM

Herald added a project: Restricted Project. · View Herald TranscriptNov 14 2022, 1:42 PM

Herald added subscribers: s.egerton, simoncook, hiraditya, kristof.beyls. · View Herald Transcript

efriedma requested review of this revision.Nov 14 2022, 1:42 PM

Herald added projects: Restricted Project, Restricted Project. · View Herald TranscriptNov 14 2022, 1:42 PM

Herald added subscribers: cfe-commits, • pcwang-thead. · View Herald Transcript

Harbormaster completed remote builds in B197614: Diff 475263.Nov 14 2022, 2:26 PM

Looking at GCC it looks like there (for cortex-m0 at least) the behaviour is that loads and stores are generated inline, but more complex operations go to the atomic library calls (not the sync library calls). e.g. for

int x, y;
int fn() {
  return __atomic_load_n(&x, __ATOMIC_SEQ_CST);
}
int fn2() {
  return __atomic_compare_exchange_n(&x, &y, 0, 0, 0, __ATOMIC_SEQ_CST);
}

I get with arm-none-eabi-gcc tmp.c -O1 -mcpu=cortex-m0

fn:
        ldr     r3, .L2
        dmb     ish
        ldr     r0, [r3]
        dmb     ish
        bx      lr

fn2:
        push    {lr}
        sub     sp, sp, #12
        ldr     r0, .L5
        adds    r1, r0, #4
        movs    r3, #5
        str     r3, [sp]
        movs    r3, #0
        movs    r2, #0
        bl      __atomic_compare_exchange_4
        add     sp, sp, #12
        pop     {pc}

so if we're doing this for compatibility with GCC we should do the same.

So gcc has two different behaviors on ARM:

On linux, prefers __sync calls, and generates inline code for load/store.
On baremetal, gcc chooses what sort of atomic call to generate based on how the source code is written: if the user writes __sync, you get __sync, and if the user writes __atomic, the user gets __atomic. But it generates inline code for load/store, so it's assuming the __atomic implementation is lock-free.

We'd have to hack clang IR generation to generate different IR for the two constructs. I'm not sure what the underlying logic is, or if it's worth trying to emulate.

Any further comment on this?

Herald added a subscriber: StephenFan. · View Herald TranscriptFeb 7 2023, 9:37 PM

efriedma mentioned this in D141189: [Mips] Set setMaxAtomicSizeInBitsSupported.Feb 7 2023, 9:41 PM

Revision Contents

Path

Size

clang/

lib/

Basic/

Targets/

ARM.cpp

20 lines

test/

CodeGen/

8 lines

2 lines

20 lines

62 lines

2 lines

CodeGenCXX/

threadsafe-statics-no-atomic.cpp

2 lines

CodeGenOpenCL/

atomic-ops-libcall.cl

2 lines

llvm/

lib/

Target/

ARM/

ARMISelLowering.cpp

29 lines

test/

CodeGen/

ARM/

2 lines

43 lines

110 lines

318 lines

Diff 475263

clang/lib/Basic/Targets/ARM.cpp

Show First 20 Lines • Show All 132 Lines • ▼ Show 20 Lines	void ARMTargetInfo::setArchInfo(llvm::ARM::ArchKind Kind) {
// cache CPU related strings		// cache CPU related strings
CPUAttr = getCPUAttr();		CPUAttr = getCPUAttr();
CPUProfile = getCPUProfile();		CPUProfile = getCPUProfile();
}		}

void ARMTargetInfo::setAtomic() {		void ARMTargetInfo::setAtomic() {
// when triple does not specify a sub arch,		// when triple does not specify a sub arch,
// then we are not using inline atomics		// then we are not using inline atomics
bool ShouldUseInlineAtomic =
(ArchISA == llvm::ARM::ISAKind::ARM && ArchVersion >= 6) \|\|
(ArchISA == llvm::ARM::ISAKind::THUMB && ArchVersion >= 7);
// Cortex M does not support 8 byte atomics, while general Thumb2 does.
if (ArchProfile == llvm::ARM::ProfileKind::M) {		if (ArchProfile == llvm::ARM::ProfileKind::M) {
		// Cortex-M besides Cortex-M0 has 32-bit atomics.
		//
		// Cortex-M0 is missing ldrex/strex, so we generate __sync_* calls. (In
		// most cases, these can be implemented by disabling interrupts.)
MaxAtomicPromoteWidth = 32;		MaxAtomicPromoteWidth = 32;
if (ShouldUseInlineAtomic)
MaxAtomicInlineWidth = 32;		MaxAtomicInlineWidth = 32;
} else {		} else {
		// v7 has 64-bit atomics. Some v6 variants have 64-bit atomics, some
		// have 32-bit atomics. Older variants have no atomics, but they
		// might be emulated on some targets. We completely ignore all this,
		// and just assume appropriate __sync_* routines are available on targets
		// that don't have the appropriate native instructions. (In practice,
		// such routines exist on Linux. We assume everyone else copies Linux.)
MaxAtomicPromoteWidth = 64;		MaxAtomicPromoteWidth = 64;
if (ShouldUseInlineAtomic)
MaxAtomicInlineWidth = 64;		MaxAtomicInlineWidth = 64;
}		}
}		}

bool ARMTargetInfo::hasMVE() const {		bool ARMTargetInfo::hasMVE() const {
return ArchKind == llvm::ARM::ArchKind::ARMV8_1MMainline && MVE != 0;		return ArchKind == llvm::ARM::ArchKind::ARMV8_1MMainline && MVE != 0;
}		}

bool ARMTargetInfo::hasMVEFloat() const {		bool ARMTargetInfo::hasMVEFloat() const {
▲ Show 20 Lines • Show All 1,276 Lines • Show Last 20 Lines

clang/test/CodeGen/arm-atomics-m0.c

	// RUN: %clang_cc1 %s -emit-llvm -o - -triple=thumbv6m-none--eabi -target-cpu cortex-m0 \| FileCheck %s			// RUN: %clang_cc1 %s -emit-llvm -o - -triple=thumbv6m-none--eabi -target-cpu cortex-m0 \| FileCheck %s

	int i;			int i;
	long long l;			long long l;

	typedef enum memory_order {			typedef enum memory_order {
	memory_order_relaxed, memory_order_consume, memory_order_acquire,			memory_order_relaxed, memory_order_consume, memory_order_acquire,
	memory_order_release, memory_order_acq_rel, memory_order_seq_cst			memory_order_release, memory_order_acq_rel, memory_order_seq_cst
	} memory_order;			} memory_order;

	void test_presence(void)			void test_presence(void)
	{			{
	// CHECK-LABEL: @test_presence			// CHECK-LABEL: @test_presence
	// CHECK: __atomic_fetch_add_4			// CHECK: atomicrmw add
	__atomic_fetch_add(&i, 1, memory_order_seq_cst);			__atomic_fetch_add(&i, 1, memory_order_seq_cst);
	// CHECK: __atomic_fetch_sub_4			// CHECK: atomicrmw sub
	__atomic_fetch_sub(&i, 1, memory_order_seq_cst);			__atomic_fetch_sub(&i, 1, memory_order_seq_cst);
	// CHECK: __atomic_load_4			// CHECK: load atomic
	int r;			int r;
	__atomic_load(&i, &r, memory_order_seq_cst);			__atomic_load(&i, &r, memory_order_seq_cst);
	// CHECK: __atomic_store_4			// CHECK: store atomic
	r = 0;			r = 0;
	__atomic_store(&i, &r, memory_order_seq_cst);			__atomic_store(&i, &r, memory_order_seq_cst);

	// CHECK: __atomic_fetch_add_8			// CHECK: __atomic_fetch_add_8
	__atomic_fetch_add(&l, 1, memory_order_seq_cst);			__atomic_fetch_add(&l, 1, memory_order_seq_cst);
	// CHECK: __atomic_fetch_sub_8			// CHECK: __atomic_fetch_sub_8
	__atomic_fetch_sub(&l, 1, memory_order_seq_cst);			__atomic_fetch_sub(&l, 1, memory_order_seq_cst);
	// CHECK: __atomic_load_8			// CHECK: __atomic_load_8
	long long rl;			long long rl;
	__atomic_load(&l, &rl, memory_order_seq_cst);			__atomic_load(&l, &rl, memory_order_seq_cst);
	// CHECK: __atomic_store_8			// CHECK: __atomic_store_8
	rl = 0;			rl = 0;
	__atomic_store(&l, &rl, memory_order_seq_cst);			__atomic_store(&l, &rl, memory_order_seq_cst);
	}			}

clang/test/CodeGen/atomic-ops-libcall.c

	// RUN: %clang_cc1 -no-opaque-pointers < %s -triple armv5e-none-linux-gnueabi -emit-llvm -O1 \| FileCheck %s			// RUN: %clang_cc1 -no-opaque-pointers < %s -triple riscv32-none-linux-gnueabi -emit-llvm -O1 \| FileCheck %s

	// FIXME: This file should not be checking -O1 output.			// FIXME: This file should not be checking -O1 output.
	// Ie, it is testing many IR optimizer passes as part of front-end verification.			// Ie, it is testing many IR optimizer passes as part of front-end verification.

	enum memory_order {			enum memory_order {
	memory_order_relaxed, memory_order_consume, memory_order_acquire,			memory_order_relaxed, memory_order_consume, memory_order_acquire,
	memory_order_release, memory_order_acq_rel, memory_order_seq_cst			memory_order_release, memory_order_acq_rel, memory_order_seq_cst
	};			};
	▲ Show 20 Lines • Show All 111 Lines • Show Last 20 Lines

clang/test/CodeGen/atomics-inlining.c

Show All 31 Lines	void test1(void) {
(void)__atomic_load(&i1, &i2, memory_order_seq_cst);		(void)__atomic_load(&i1, &i2, memory_order_seq_cst);
(void)__atomic_store(&i1, &i2, memory_order_seq_cst);		(void)__atomic_store(&i1, &i2, memory_order_seq_cst);
(void)__atomic_load(&ll1, &ll2, memory_order_seq_cst);		(void)__atomic_load(&ll1, &ll2, memory_order_seq_cst);
(void)__atomic_store(&ll1, &ll2, memory_order_seq_cst);		(void)__atomic_store(&ll1, &ll2, memory_order_seq_cst);
(void)__atomic_load(&a1, &a2, memory_order_seq_cst);		(void)__atomic_load(&a1, &a2, memory_order_seq_cst);
(void)__atomic_store(&a1, &a2, memory_order_seq_cst);		(void)__atomic_store(&a1, &a2, memory_order_seq_cst);

// ARM-LABEL: define{{.*}} void @test1		// ARM-LABEL: define{{.*}} void @test1
// ARM: = call{{.*}} zeroext i8 @__atomic_load_1(ptr noundef @c1		// ARM: = load atomic i8, ptr @c1 seq_cst, align 1
// ARM: call{{.*}} void @__atomic_store_1(ptr noundef @c1, i8 noundef zeroext		// ARM: store atomic i8 {{.*}}, ptr @c1 seq_cst, align 1
// ARM: = call{{.*}} zeroext i16 @__atomic_load_2(ptr noundef @s1		// ARM: = load atomic i16, ptr @s1 seq_cst, align 2
// ARM: call{{.*}} void @__atomic_store_2(ptr noundef @s1, i16 noundef zeroext		// ARM: store atomic i16 {{.*}}, ptr @s1 seq_cst, align 2
// ARM: = call{{.*}} i32 @__atomic_load_4(ptr noundef @i1		// ARM: = load atomic i32, ptr @i1 seq_cst, align 4
// ARM: call{{.*}} void @__atomic_store_4(ptr noundef @i1, i32 noundef		// ARM: store atomic i32 {{.*}}, ptr @i1 seq_cst, align 4
// ARM: = call{{.*}} i64 @__atomic_load_8(ptr noundef @ll1		// ARM: = load atomic i64, ptr @ll1 seq_cst, align 8
// ARM: call{{.*}} void @__atomic_store_8(ptr noundef @ll1, i64 noundef		// ARM: store atomic i64 {{.*}}, ptr @ll1 seq_cst, align 8
// ARM: call{{.*}} void @__atomic_load(i32 noundef 100, ptr noundef @a1, ptr noundef @a2		// ARM: call void @__atomic_load(i32 noundef 100, ptr noundef @a1, ptr noundef @a2
// ARM: call{{.*}} void @__atomic_store(i32 noundef 100, ptr noundef @a1, ptr noundef @a2		// ARM: call void @__atomic_store(i32 noundef 100, ptr noundef @a1, ptr noundef @a2

// PPC32-LABEL: define{{.*}} void @test1		// PPC32-LABEL: define{{.*}} void @test1
// PPC32: = load atomic i8, ptr @c1 seq_cst, align 1		// PPC32: = load atomic i8, ptr @c1 seq_cst, align 1
// PPC32: store atomic i8 {{.*}}, ptr @c1 seq_cst, align 1		// PPC32: store atomic i8 {{.*}}, ptr @c1 seq_cst, align 1
// PPC32: = load atomic i16, ptr @s1 seq_cst, align 2		// PPC32: = load atomic i16, ptr @s1 seq_cst, align 2
// PPC32: store atomic i16 {{.*}}, ptr @s1 seq_cst, align 2		// PPC32: store atomic i16 {{.*}}, ptr @s1 seq_cst, align 2
// PPC32: = load atomic i32, ptr @i1 seq_cst, align 4		// PPC32: = load atomic i32, ptr @i1 seq_cst, align 4
// PPC32: store atomic i32 {{.*}}, ptr @i1 seq_cst, align 4		// PPC32: store atomic i32 {{.*}}, ptr @i1 seq_cst, align 4
▲ Show 20 Lines • Show All 55 Lines • Show Last 20 Lines

clang/test/CodeGen/c11atomics.c

// RUN: %clang_cc1 -no-opaque-pointers %s -emit-llvm -o - -triple=armv5-unknown-freebsd -std=c11 \| FileCheck %s		// RUN: %clang_cc1 -no-opaque-pointers %s -emit-llvm -o - -triple=riscv32-unknown-freebsd -std=c11 \| FileCheck %s

// Test that we are generating atomicrmw instructions, rather than		// Test that we are generating atomicrmw instructions, rather than
// compare-exchange loops for common atomic ops. This makes a big difference		// compare-exchange loops for common atomic ops. This makes a big difference
// on RISC platforms, where the compare-exchange loop becomes a ll/sc pair for		// on RISC platforms, where the compare-exchange loop becomes a ll/sc pair for
// the load and then another ll/sc in the loop, expanding to about 30		// the load and then another ll/sc in the loop, expanding to about 30
// instructions when it should be only 4. It has a smaller, but still		// instructions when it should be only 4. It has a smaller, but still
// noticeable, impact on platforms like x86 and RISC-V, where there are atomic		// noticeable, impact on platforms like x86 and RISC-V, where there are atomic
// RMW instructions.		// RMW instructions.
▲ Show 20 Lines • Show All 58 Lines • ▼ Show 20 Lines	void testinc(void)
++l;		++l;
// CHECK: atomicrmw add i16* @s, i16 1 seq_cst, align 2		// CHECK: atomicrmw add i16* @s, i16 1 seq_cst, align 2
// CHECK: add i16		// CHECK: add i16
++s;		++s;
}		}
// CHECK: testdec		// CHECK: testdec
void testdec(void)		void testdec(void)
{		{
// CHECK: call arm_aapcscc zeroext i1 @__atomic_compare_exchange(i32 noundef 1, i8* noundef @b		// CHECK: call zeroext i1 @__atomic_compare_exchange(i32 noundef 1, i8* noundef @b
b--;		b--;
// CHECK: atomicrmw sub i32* @i, i32 1 seq_cst, align 4		// CHECK: atomicrmw sub i32* @i, i32 1 seq_cst, align 4
i--;		i--;
// CHECK: atomicrmw sub i64* @l, i64 1 seq_cst, align 8		// CHECK: atomicrmw sub i64* @l, i64 1 seq_cst, align 8
l--;		l--;
// CHECK: atomicrmw sub i16* @s, i16 1 seq_cst, align 2		// CHECK: atomicrmw sub i16* @s, i16 1 seq_cst, align 2
s--;		s--;
// CHECK: call arm_aapcscc zeroext i1 @__atomic_compare_exchange(i32 noundef 1, i8* noundef @b		// CHECK: call zeroext i1 @__atomic_compare_exchange(i32 noundef 1, i8* noundef @b
--b;		--b;
// CHECK: atomicrmw sub i32* @i, i32 1 seq_cst, align 4		// CHECK: atomicrmw sub i32* @i, i32 1 seq_cst, align 4
// CHECK: sub i32		// CHECK: sub i32
--i;		--i;
// CHECK: atomicrmw sub i64* @l, i64 1 seq_cst, align 8		// CHECK: atomicrmw sub i64* @l, i64 1 seq_cst, align 8
// CHECK: sub i64		// CHECK: sub i64
--l;		--l;
// CHECK: atomicrmw sub i16* @s, i16 1 seq_cst, align 2		// CHECK: atomicrmw sub i16* @s, i16 1 seq_cst, align 2
// CHECK: sub i16		// CHECK: sub i16
--s;		--s;
}		}
// CHECK: testaddeq		// CHECK: testaddeq
void testaddeq(void)		void testaddeq(void)
{		{
// CHECK: call arm_aapcscc zeroext i1 @__atomic_compare_exchange(i32 noundef 1, i8* noundef @b		// CHECK: call zeroext i1 @__atomic_compare_exchange(i32 noundef 1, i8* noundef @b
// CHECK: atomicrmw add i32* @i, i32 42 seq_cst, align 4		// CHECK: atomicrmw add i32* @i, i32 42 seq_cst, align 4
// CHECK: atomicrmw add i64* @l, i64 42 seq_cst, align 8		// CHECK: atomicrmw add i64* @l, i64 42 seq_cst, align 8
// CHECK: atomicrmw add i16* @s, i16 42 seq_cst, align 2		// CHECK: atomicrmw add i16* @s, i16 42 seq_cst, align 2
b += 42;		b += 42;
i += 42;		i += 42;
l += 42;		l += 42;
s += 42;		s += 42;
}		}
// CHECK: testsubeq		// CHECK: testsubeq
void testsubeq(void)		void testsubeq(void)
{		{
// CHECK: call arm_aapcscc zeroext i1 @__atomic_compare_exchange(i32 noundef 1, i8* noundef @b		// CHECK: call zeroext i1 @__atomic_compare_exchange(i32 noundef 1, i8* noundef @b
// CHECK: atomicrmw sub i32* @i, i32 42 seq_cst, align 4		// CHECK: atomicrmw sub i32* @i, i32 42 seq_cst, align 4
// CHECK: atomicrmw sub i64* @l, i64 42 seq_cst, align 8		// CHECK: atomicrmw sub i64* @l, i64 42 seq_cst, align 8
// CHECK: atomicrmw sub i16* @s, i16 42 seq_cst, align 2		// CHECK: atomicrmw sub i16* @s, i16 42 seq_cst, align 2
b -= 42;		b -= 42;
i -= 42;		i -= 42;
l -= 42;		l -= 42;
s -= 42;		s -= 42;
}		}
// CHECK: testxoreq		// CHECK: testxoreq
void testxoreq(void)		void testxoreq(void)
{		{
// CHECK: call arm_aapcscc zeroext i1 @__atomic_compare_exchange(i32 noundef 1, i8* noundef @b		// CHECK: call zeroext i1 @__atomic_compare_exchange(i32 noundef 1, i8* noundef @b
// CHECK: atomicrmw xor i32* @i, i32 42 seq_cst, align 4		// CHECK: atomicrmw xor i32* @i, i32 42 seq_cst, align 4
// CHECK: atomicrmw xor i64* @l, i64 42 seq_cst, align 8		// CHECK: atomicrmw xor i64* @l, i64 42 seq_cst, align 8
// CHECK: atomicrmw xor i16* @s, i16 42 seq_cst, align 2		// CHECK: atomicrmw xor i16* @s, i16 42 seq_cst, align 2
b ^= 42;		b ^= 42;
i ^= 42;		i ^= 42;
l ^= 42;		l ^= 42;
s ^= 42;		s ^= 42;
}		}
// CHECK: testoreq		// CHECK: testoreq
void testoreq(void)		void testoreq(void)
{		{
// CHECK: call arm_aapcscc zeroext i1 @__atomic_compare_exchange(i32 noundef 1, i8* noundef @b		// CHECK: call zeroext i1 @__atomic_compare_exchange(i32 noundef 1, i8* noundef @b
// CHECK: atomicrmw or i32* @i, i32 42 seq_cst, align 4		// CHECK: atomicrmw or i32* @i, i32 42 seq_cst, align 4
// CHECK: atomicrmw or i64* @l, i64 42 seq_cst, align 8		// CHECK: atomicrmw or i64* @l, i64 42 seq_cst, align 8
// CHECK: atomicrmw or i16* @s, i16 42 seq_cst, align 2		// CHECK: atomicrmw or i16* @s, i16 42 seq_cst, align 2
b \|= 42;		b \|= 42;
i \|= 42;		i \|= 42;
l \|= 42;		l \|= 42;
s \|= 42;		s \|= 42;
}		}
// CHECK: testandeq		// CHECK: testandeq
void testandeq(void)		void testandeq(void)
{		{
// CHECK: call arm_aapcscc zeroext i1 @__atomic_compare_exchange(i32 noundef 1, i8* noundef @b		// CHECK: call zeroext i1 @__atomic_compare_exchange(i32 noundef 1, i8* noundef @b
// CHECK: atomicrmw and i32* @i, i32 42 seq_cst, align 4		// CHECK: atomicrmw and i32* @i, i32 42 seq_cst, align 4
// CHECK: atomicrmw and i64* @l, i64 42 seq_cst, align 8		// CHECK: atomicrmw and i64* @l, i64 42 seq_cst, align 8
// CHECK: atomicrmw and i16* @s, i16 42 seq_cst, align 2		// CHECK: atomicrmw and i16* @s, i16 42 seq_cst, align 2
b &= 42;		b &= 42;
i &= 42;		i &= 42;
l &= 42;		l &= 42;
s &= 42;		s &= 42;
}		}

// CHECK-LABEL: define{{.}} arm_aapcscc void @testFloat(float		// CHECK-LABEL: define{{.}} void @testFloat(float
void testFloat(_Atomic(float) *fp) {		void testFloat(_Atomic(float) *fp) {
// CHECK: [[FP:%.]] = alloca float		// CHECK: [[FP:%.]] = alloca float
// CHECK-NEXT: [[X:%.*]] = alloca float		// CHECK-NEXT: [[X:%.*]] = alloca float
// CHECK-NEXT: [[F:%.*]] = alloca float		// CHECK-NEXT: [[F:%.*]] = alloca float
// CHECK-NEXT: [[TMP0:%.*]] = alloca float		// CHECK-NEXT: [[TMP0:%.*]] = alloca float
// CHECK-NEXT: [[TMP1:%.*]] = alloca float		// CHECK-NEXT: [[TMP1:%.*]] = alloca float
// CHECK-NEXT: store float* {{%.}}, float* [[FP]]		// CHECK-NEXT: store float* {{%.}}, float* [[FP]]

// CHECK-NEXT: [[T0:%.]] = load float, float** [[FP]]		// CHECK-NEXT: [[T0:%.]] = load float, float** [[FP]]
// CHECK-NEXT: store float 1.000000e+00, float* [[T0]], align 4		// CHECK-NEXT: store float 1.000000e+00, float* [[T0]], align 4
__c11_atomic_init(fp, 1.0f);		__c11_atomic_init(fp, 1.0f);

// CHECK-NEXT: store float 2.000000e+00, float* [[X]], align 4		// CHECK-NEXT: store float 2.000000e+00, float* [[X]], align 4
_Atomic(float) x = 2.0f;		_Atomic(float) x = 2.0f;

// CHECK-NEXT: [[T0:%.]] = load float, float** [[FP]]		// CHECK-NEXT: [[T0:%.]] = load float, float** [[FP]]
// CHECK-NEXT: [[T1:%.]] = bitcast float [[T0]] to i8*		// CHECK-NEXT: [[T1:%.]] = bitcast float [[T0]] to i8*
// CHECK-NEXT: [[T2:%.]] = bitcast float [[TMP0]] to i8*		// CHECK-NEXT: [[T2:%.]] = bitcast float [[TMP0]] to i8*
// CHECK-NEXT: call arm_aapcscc void @__atomic_load(i32 noundef 4, i8* noundef [[T1]], i8* noundef [[T2]], i32 noundef 5)		// CHECK-NEXT: call void @__atomic_load(i32 noundef 4, i8* noundef [[T1]], i8* noundef [[T2]], i32 noundef 5)
// CHECK-NEXT: [[T3:%.]] = load float, float [[TMP0]], align 4		// CHECK-NEXT: [[T3:%.]] = load float, float [[TMP0]], align 4
// CHECK-NEXT: store float [[T3]], float* [[F]]		// CHECK-NEXT: store float [[T3]], float* [[F]]
float f = *fp;		float f = *fp;

// CHECK-NEXT: [[T0:%.]] = load float, float [[F]], align 4		// CHECK-NEXT: [[T0:%.]] = load float, float [[F]], align 4
// CHECK-NEXT: [[T1:%.]] = load float, float** [[FP]], align 4		// CHECK-NEXT: [[T1:%.]] = load float, float** [[FP]], align 4
// CHECK-NEXT: store float [[T0]], float* [[TMP1]], align 4		// CHECK-NEXT: store float [[T0]], float* [[TMP1]], align 4
// CHECK-NEXT: [[T2:%.]] = bitcast float [[T1]] to i8*		// CHECK-NEXT: [[T2:%.]] = bitcast float [[T1]] to i8*
// CHECK-NEXT: [[T3:%.]] = bitcast float [[TMP1]] to i8*		// CHECK-NEXT: [[T3:%.]] = bitcast float [[TMP1]] to i8*
// CHECK-NEXT: call arm_aapcscc void @__atomic_store(i32 noundef 4, i8* noundef [[T2]], i8* noundef [[T3]], i32 noundef 5)		// CHECK-NEXT: call void @__atomic_store(i32 noundef 4, i8* noundef [[T2]], i8* noundef [[T3]], i32 noundef 5)
*fp = f;		*fp = f;

// CHECK-NEXT: ret void		// CHECK-NEXT: ret void
}		}

// CHECK: define{{.}} arm_aapcscc void @testComplexFloat([[CF:{ float, float }]]		// CHECK: define{{.}} void @testComplexFloat([[CF:{ float, float }]]
void testComplexFloat(_Atomic(_Complex float) *fp) {		void testComplexFloat(_Atomic(_Complex float) *fp) {
// CHECK: [[FP:%.]] = alloca [[CF]], align 4		// CHECK: [[FP:%.]] = alloca [[CF]], align 4
// CHECK-NEXT: [[X:%.*]] = alloca [[CF]], align 8		// CHECK-NEXT: [[X:%.*]] = alloca [[CF]], align 8
// CHECK-NEXT: [[F:%.*]] = alloca [[CF]], align 4		// CHECK-NEXT: [[F:%.*]] = alloca [[CF]], align 4
// CHECK-NEXT: [[TMP0:%.*]] = alloca [[CF]], align 8		// CHECK-NEXT: [[TMP0:%.*]] = alloca [[CF]], align 8
// CHECK-NEXT: [[TMP1:%.*]] = alloca [[CF]], align 8		// CHECK-NEXT: [[TMP1:%.*]] = alloca [[CF]], align 8
// CHECK-NEXT: store [[CF]]*		// CHECK-NEXT: store [[CF]]*

// CHECK-NEXT: [[P:%.]] = load [[CF]], [[CF]]** [[FP]]		// CHECK-NEXT: [[P:%.]] = load [[CF]], [[CF]]** [[FP]]
// CHECK-NEXT: [[T0:%.]] = getelementptr inbounds [[CF]], [[CF]] [[P]], i32 0, i32 0		// CHECK-NEXT: [[T0:%.]] = getelementptr inbounds [[CF]], [[CF]] [[P]], i32 0, i32 0
// CHECK-NEXT: [[T1:%.]] = getelementptr inbounds [[CF]], [[CF]] [[P]], i32 0, i32 1		// CHECK-NEXT: [[T1:%.]] = getelementptr inbounds [[CF]], [[CF]] [[P]], i32 0, i32 1
// CHECK-NEXT: store float 1.000000e+00, float* [[T0]]		// CHECK-NEXT: store float 1.000000e+00, float* [[T0]]
// CHECK-NEXT: store float 0.000000e+00, float* [[T1]]		// CHECK-NEXT: store float 0.000000e+00, float* [[T1]]
__c11_atomic_init(fp, 1.0f);		__c11_atomic_init(fp, 1.0f);

// CHECK-NEXT: [[T0:%.]] = getelementptr inbounds [[CF]], [[CF]] [[X]], i32 0, i32 0		// CHECK-NEXT: [[T0:%.]] = getelementptr inbounds [[CF]], [[CF]] [[X]], i32 0, i32 0
// CHECK-NEXT: [[T1:%.]] = getelementptr inbounds [[CF]], [[CF]] [[X]], i32 0, i32 1		// CHECK-NEXT: [[T1:%.]] = getelementptr inbounds [[CF]], [[CF]] [[X]], i32 0, i32 1
// CHECK-NEXT: store float 2.000000e+00, float* [[T0]]		// CHECK-NEXT: store float 2.000000e+00, float* [[T0]]
// CHECK-NEXT: store float 0.000000e+00, float* [[T1]]		// CHECK-NEXT: store float 0.000000e+00, float* [[T1]]
_Atomic(_Complex float) x = 2.0f;		_Atomic(_Complex float) x = 2.0f;

// CHECK-NEXT: [[T0:%.]] = load [[CF]], [[CF]]** [[FP]]		// CHECK-NEXT: [[T0:%.]] = load [[CF]], [[CF]]** [[FP]]
// CHECK-NEXT: [[T1:%.]] = bitcast [[CF]] [[T0]] to i8*		// CHECK-NEXT: [[T1:%.]] = bitcast [[CF]] [[T0]] to i8*
// CHECK-NEXT: [[T2:%.]] = bitcast [[CF]] [[TMP0]] to i8*		// CHECK-NEXT: [[T2:%.]] = bitcast [[CF]] [[TMP0]] to i8*
// CHECK-NEXT: call arm_aapcscc void @__atomic_load(i32 noundef 8, i8* noundef [[T1]], i8* noundef [[T2]], i32 noundef 5)		// CHECK-NEXT: call void @__atomic_load(i32 noundef 8, i8* noundef [[T1]], i8* noundef [[T2]], i32 noundef 5)
// CHECK-NEXT: [[T0:%.]] = getelementptr inbounds [[CF]], [[CF]] [[TMP0]], i32 0, i32 0		// CHECK-NEXT: [[T0:%.]] = getelementptr inbounds [[CF]], [[CF]] [[TMP0]], i32 0, i32 0
// CHECK-NEXT: [[R:%.]] = load float, float [[T0]]		// CHECK-NEXT: [[R:%.]] = load float, float [[T0]]
// CHECK-NEXT: [[T0:%.]] = getelementptr inbounds [[CF]], [[CF]] [[TMP0]], i32 0, i32 1		// CHECK-NEXT: [[T0:%.]] = getelementptr inbounds [[CF]], [[CF]] [[TMP0]], i32 0, i32 1
// CHECK-NEXT: [[I:%.]] = load float, float [[T0]]		// CHECK-NEXT: [[I:%.]] = load float, float [[T0]]
// CHECK-NEXT: [[T0:%.]] = getelementptr inbounds [[CF]], [[CF]] [[F]], i32 0, i32 0		// CHECK-NEXT: [[T0:%.]] = getelementptr inbounds [[CF]], [[CF]] [[F]], i32 0, i32 0
// CHECK-NEXT: [[T1:%.]] = getelementptr inbounds [[CF]], [[CF]] [[F]], i32 0, i32 1		// CHECK-NEXT: [[T1:%.]] = getelementptr inbounds [[CF]], [[CF]] [[F]], i32 0, i32 1
// CHECK-NEXT: store float [[R]], float* [[T0]]		// CHECK-NEXT: store float [[R]], float* [[T0]]
// CHECK-NEXT: store float [[I]], float* [[T1]]		// CHECK-NEXT: store float [[I]], float* [[T1]]
_Complex float f = *fp;		_Complex float f = *fp;

// CHECK-NEXT: [[T0:%.]] = getelementptr inbounds [[CF]], [[CF]] [[F]], i32 0, i32 0		// CHECK-NEXT: [[T0:%.]] = getelementptr inbounds [[CF]], [[CF]] [[F]], i32 0, i32 0
// CHECK-NEXT: [[R:%.]] = load float, float [[T0]]		// CHECK-NEXT: [[R:%.]] = load float, float [[T0]]
// CHECK-NEXT: [[T0:%.]] = getelementptr inbounds [[CF]], [[CF]] [[F]], i32 0, i32 1		// CHECK-NEXT: [[T0:%.]] = getelementptr inbounds [[CF]], [[CF]] [[F]], i32 0, i32 1
// CHECK-NEXT: [[I:%.]] = load float, float [[T0]]		// CHECK-NEXT: [[I:%.]] = load float, float [[T0]]
// CHECK-NEXT: [[DEST:%.]] = load [[CF]], [[CF]]** [[FP]], align 4		// CHECK-NEXT: [[DEST:%.]] = load [[CF]], [[CF]]** [[FP]], align 4
// CHECK-NEXT: [[T0:%.]] = getelementptr inbounds [[CF]], [[CF]] [[TMP1]], i32 0, i32 0		// CHECK-NEXT: [[T0:%.]] = getelementptr inbounds [[CF]], [[CF]] [[TMP1]], i32 0, i32 0
// CHECK-NEXT: [[T1:%.]] = getelementptr inbounds [[CF]], [[CF]] [[TMP1]], i32 0, i32 1		// CHECK-NEXT: [[T1:%.]] = getelementptr inbounds [[CF]], [[CF]] [[TMP1]], i32 0, i32 1
// CHECK-NEXT: store float [[R]], float* [[T0]]		// CHECK-NEXT: store float [[R]], float* [[T0]]
// CHECK-NEXT: store float [[I]], float* [[T1]]		// CHECK-NEXT: store float [[I]], float* [[T1]]
// CHECK-NEXT: [[T0:%.]] = bitcast [[CF]] [[DEST]] to i8*		// CHECK-NEXT: [[T0:%.]] = bitcast [[CF]] [[DEST]] to i8*
// CHECK-NEXT: [[T1:%.]] = bitcast [[CF]] [[TMP1]] to i8*		// CHECK-NEXT: [[T1:%.]] = bitcast [[CF]] [[TMP1]] to i8*
// CHECK-NEXT: call arm_aapcscc void @__atomic_store(i32 noundef 8, i8* noundef [[T0]], i8* noundef [[T1]], i32 noundef 5)		// CHECK-NEXT: call void @__atomic_store(i32 noundef 8, i8* noundef [[T0]], i8* noundef [[T1]], i32 noundef 5)
*fp = f;		*fp = f;

// CHECK-NEXT: ret void		// CHECK-NEXT: ret void
}		}

typedef struct { short x, y, z, w; } S;		typedef struct { short x, y, z, w; } S;
_Atomic S testStructGlobal = (S){1, 2, 3, 4};		_Atomic S testStructGlobal = (S){1, 2, 3, 4};
// CHECK: define{{.}} arm_aapcscc void @testStruct([[S:.]]*		// CHECK: define{{.}} void @testStruct([[S:.]]*
void testStruct(_Atomic(S) *fp) {		void testStruct(_Atomic(S) *fp) {
// CHECK: [[FP:%.]] = alloca [[S]], align 4		// CHECK: [[FP:%.]] = alloca [[S]], align 4
// CHECK-NEXT: [[X:%.*]] = alloca [[S]], align 8		// CHECK-NEXT: [[X:%.*]] = alloca [[S]], align 8
// CHECK-NEXT: [[F:%.]] = alloca [[S:%.]], align 2		// CHECK-NEXT: [[F:%.]] = alloca [[S:%.]], align 2
// CHECK-NEXT: [[TMP0:%.*]] = alloca [[S]], align 8		// CHECK-NEXT: [[TMP0:%.*]] = alloca [[S]], align 8
// CHECK-NEXT: store [[S]]*		// CHECK-NEXT: store [[S]]*

// CHECK-NEXT: [[P:%.]] = load [[S]], [[S]]** [[FP]]		// CHECK-NEXT: [[P:%.]] = load [[S]], [[S]]** [[FP]]
Show All 15 Lines
// CHECK-NEXT: store i16 3, i16* [[T0]], align 4		// CHECK-NEXT: store i16 3, i16* [[T0]], align 4
// CHECK-NEXT: [[T0:%.]] = getelementptr inbounds [[S]], [[S]] [[X]], i32 0, i32 3		// CHECK-NEXT: [[T0:%.]] = getelementptr inbounds [[S]], [[S]] [[X]], i32 0, i32 3
// CHECK-NEXT: store i16 4, i16* [[T0]], align 2		// CHECK-NEXT: store i16 4, i16* [[T0]], align 2
_Atomic(S) x = (S){1,2,3,4};		_Atomic(S) x = (S){1,2,3,4};

// CHECK-NEXT: [[T0:%.]] = load [[S]], [[S]]** [[FP]]		// CHECK-NEXT: [[T0:%.]] = load [[S]], [[S]]** [[FP]]
// CHECK-NEXT: [[T1:%.]] = bitcast [[S]] [[T0]] to i8*		// CHECK-NEXT: [[T1:%.]] = bitcast [[S]] [[T0]] to i8*
// CHECK-NEXT: [[T2:%.]] = bitcast [[S]] [[F]] to i8*		// CHECK-NEXT: [[T2:%.]] = bitcast [[S]] [[F]] to i8*
// CHECK-NEXT: call arm_aapcscc void @__atomic_load(i32 noundef 8, i8* noundef [[T1]], i8* noundef [[T2]], i32 noundef 5)		// CHECK-NEXT: call void @__atomic_load(i32 noundef 8, i8* noundef [[T1]], i8* noundef [[T2]], i32 noundef 5)
S f = *fp;		S f = *fp;

// CHECK-NEXT: [[T0:%.]] = load [[S]], [[S]]** [[FP]]		// CHECK-NEXT: [[T0:%.]] = load [[S]], [[S]]** [[FP]]
// CHECK-NEXT: [[T1:%.]] = bitcast [[S]] [[TMP0]] to i8*		// CHECK-NEXT: [[T1:%.]] = bitcast [[S]] [[TMP0]] to i8*
// CHECK-NEXT: [[T2:%.]] = bitcast [[S]] [[F]] to i8*		// CHECK-NEXT: [[T2:%.]] = bitcast [[S]] [[F]] to i8*
// CHECK-NEXT: call void @llvm.memcpy.p0i8.p0i8.i32(i8* align 8 [[T1]], i8* align 2 [[T2]], i32 8, i1 false)		// CHECK-NEXT: call void @llvm.memcpy.p0i8.p0i8.i32(i8* align 8 [[T1]], i8* align 2 [[T2]], i32 8, i1 false)
// CHECK-NEXT: [[T3:%.]] = bitcast [[S]] [[T0]] to i8*		// CHECK-NEXT: [[T3:%.]] = bitcast [[S]] [[T0]] to i8*
// CHECK-NEXT: [[T4:%.]] = bitcast [[S]] [[TMP0]] to i8*		// CHECK-NEXT: [[T4:%.]] = bitcast [[S]] [[TMP0]] to i8*
// CHECK-NEXT: call arm_aapcscc void @__atomic_store(i32 noundef 8, i8* noundef [[T3]], i8* noundef [[T4]], i32 noundef 5)		// CHECK-NEXT: call void @__atomic_store(i32 noundef 8, i8* noundef [[T3]], i8* noundef [[T4]], i32 noundef 5)
*fp = f;		*fp = f;

// CHECK-NEXT: ret void		// CHECK-NEXT: ret void
}		}

typedef struct { short x, y, z; } PS;		typedef struct { short x, y, z; } PS;
_Atomic PS testPromotedStructGlobal = (PS){1, 2, 3};		_Atomic PS testPromotedStructGlobal = (PS){1, 2, 3};
// CHECK: define{{.}} arm_aapcscc void @testPromotedStruct([[APS:.]]*		// CHECK: define{{.}} void @testPromotedStruct([[APS:.]]*
void testPromotedStruct(_Atomic(PS) *fp) {		void testPromotedStruct(_Atomic(PS) *fp) {
// CHECK: [[FP:%.]] = alloca [[APS]], align 4		// CHECK: [[FP:%.]] = alloca [[APS]], align 4
// CHECK-NEXT: [[X:%.*]] = alloca [[APS]], align 8		// CHECK-NEXT: [[X:%.*]] = alloca [[APS]], align 8
// CHECK-NEXT: [[F:%.]] = alloca [[PS:%.]], align 2		// CHECK-NEXT: [[F:%.]] = alloca [[PS:%.]], align 2
// CHECK-NEXT: [[TMP0:%.*]] = alloca [[APS]], align 8		// CHECK-NEXT: [[TMP0:%.*]] = alloca [[APS]], align 8
// CHECK-NEXT: [[TMP1:%.*]] = alloca [[APS]], align 8		// CHECK-NEXT: [[TMP1:%.*]] = alloca [[APS]], align 8
// CHECK-NEXT: [[A:%.*]] = alloca i32, align 4		// CHECK-NEXT: [[A:%.*]] = alloca i32, align 4
// CHECK-NEXT: [[TMP2:%.*]] = alloca %struct.PS, align 2		// CHECK-NEXT: [[TMP2:%.*]] = alloca %struct.PS, align 2
Show All 21 Lines
// CHECK-NEXT: store i16 2, i16* [[T1]], align 2		// CHECK-NEXT: store i16 2, i16* [[T1]], align 2
// CHECK-NEXT: [[T1:%.]] = getelementptr inbounds [[PS]], [[PS]] [[T0]], i32 0, i32 2		// CHECK-NEXT: [[T1:%.]] = getelementptr inbounds [[PS]], [[PS]] [[T0]], i32 0, i32 2
// CHECK-NEXT: store i16 3, i16* [[T1]], align 4		// CHECK-NEXT: store i16 3, i16* [[T1]], align 4
_Atomic(PS) x = (PS){1,2,3};		_Atomic(PS) x = (PS){1,2,3};

// CHECK-NEXT: [[T0:%.]] = load [[APS]], [[APS]]** [[FP]]		// CHECK-NEXT: [[T0:%.]] = load [[APS]], [[APS]]** [[FP]]
// CHECK-NEXT: [[T1:%.]] = bitcast [[APS]] [[T0]] to i8*		// CHECK-NEXT: [[T1:%.]] = bitcast [[APS]] [[T0]] to i8*
// CHECK-NEXT: [[T2:%.]] = bitcast [[APS]] [[TMP0]] to i8*		// CHECK-NEXT: [[T2:%.]] = bitcast [[APS]] [[TMP0]] to i8*
// CHECK-NEXT: call arm_aapcscc void @__atomic_load(i32 noundef 8, i8* noundef [[T1]], i8* noundef [[T2]], i32 noundef 5)		// CHECK-NEXT: call void @__atomic_load(i32 noundef 8, i8* noundef [[T1]], i8* noundef [[T2]], i32 noundef 5)
// CHECK-NEXT: [[T0:%.]] = getelementptr inbounds [[APS]], [[APS]] [[TMP0]], i32 0, i32 0		// CHECK-NEXT: [[T0:%.]] = getelementptr inbounds [[APS]], [[APS]] [[TMP0]], i32 0, i32 0
// CHECK-NEXT: [[T1:%.]] = bitcast [[PS]] [[F]] to i8*		// CHECK-NEXT: [[T1:%.]] = bitcast [[PS]] [[F]] to i8*
// CHECK-NEXT: [[T2:%.]] = bitcast [[PS]] [[T0]] to i8*		// CHECK-NEXT: [[T2:%.]] = bitcast [[PS]] [[T0]] to i8*
// CHECK-NEXT: call void @llvm.memcpy.p0i8.p0i8.i32(i8* align 2 [[T1]], i8* align 8 [[T2]], i32 6, i1 false)		// CHECK-NEXT: call void @llvm.memcpy.p0i8.p0i8.i32(i8* align 2 [[T1]], i8* align 8 [[T2]], i32 6, i1 false)
PS f = *fp;		PS f = *fp;

// CHECK-NEXT: [[T0:%.]] = load [[APS]], [[APS]]** [[FP]]		// CHECK-NEXT: [[T0:%.]] = load [[APS]], [[APS]]** [[FP]]
// CHECK-NEXT: [[T1:%.]] = bitcast { %struct.PS, [2 x i8] } [[TMP1]] to i8*		// CHECK-NEXT: [[T1:%.]] = bitcast { %struct.PS, [2 x i8] } [[TMP1]] to i8*
// CHECK-NEXT: call void @llvm.memset.p0i8.i32(i8* align 8 [[T1]], i8 0, i32 8, i1 false)		// CHECK-NEXT: call void @llvm.memset.p0i8.i32(i8* align 8 [[T1]], i8 0, i32 8, i1 false)
// CHECK-NEXT: [[T1:%.]] = getelementptr inbounds [[APS]], [[APS]] [[TMP1]], i32 0, i32 0		// CHECK-NEXT: [[T1:%.]] = getelementptr inbounds [[APS]], [[APS]] [[TMP1]], i32 0, i32 0
// CHECK-NEXT: [[T2:%.]] = bitcast [[PS]] [[T1]] to i8*		// CHECK-NEXT: [[T2:%.]] = bitcast [[PS]] [[T1]] to i8*
// CHECK-NEXT: [[T3:%.]] = bitcast [[PS]] [[F]] to i8*		// CHECK-NEXT: [[T3:%.]] = bitcast [[PS]] [[F]] to i8*
// CHECK-NEXT: call void @llvm.memcpy.p0i8.p0i8.i32(i8* align 8 [[T2]], i8* align 2 [[T3]], i32 6, i1 false)		// CHECK-NEXT: call void @llvm.memcpy.p0i8.p0i8.i32(i8* align 8 [[T2]], i8* align 2 [[T3]], i32 6, i1 false)
// CHECK-NEXT: [[T4:%.]] = bitcast [[APS]] [[T0]] to i8*		// CHECK-NEXT: [[T4:%.]] = bitcast [[APS]] [[T0]] to i8*
// CHECK-NEXT: [[T5:%.]] = bitcast [[APS]] [[TMP1]] to i8*		// CHECK-NEXT: [[T5:%.]] = bitcast [[APS]] [[TMP1]] to i8*
// CHECK-NEXT: call arm_aapcscc void @__atomic_store(i32 noundef 8, i8* noundef [[T4]], i8* noundef [[T5]], i32 noundef 5)		// CHECK-NEXT: call void @__atomic_store(i32 noundef 8, i8* noundef [[T4]], i8* noundef [[T5]], i32 noundef 5)
*fp = f;		*fp = f;

// CHECK-NEXT: [[T0:%.]] = load [[APS]], [[APS]]** [[FP]], align 4		// CHECK-NEXT: [[T0:%.]] = load [[APS]], [[APS]]** [[FP]], align 4
// CHECK-NEXT: [[T1:%.]] = bitcast [[APS]] [[T0]] to i8*		// CHECK-NEXT: [[T1:%.]] = bitcast [[APS]] [[T0]] to i8*
// CHECK-NEXT: [[T2:%.]] = bitcast [[APS]] [[TMP3]] to i8*		// CHECK-NEXT: [[T2:%.]] = bitcast [[APS]] [[TMP3]] to i8*
// CHECK-NEXT: call arm_aapcscc void @__atomic_load(i32 noundef 8, i8* noundef [[T1]], i8* noundef [[T2]], i32 noundef 5)		// CHECK-NEXT: call void @__atomic_load(i32 noundef 8, i8* noundef [[T1]], i8* noundef [[T2]], i32 noundef 5)
// CHECK-NEXT: [[T0:%.]] = getelementptr inbounds [[APS]], [[APS]] [[TMP3]], i32 0, i32 0		// CHECK-NEXT: [[T0:%.]] = getelementptr inbounds [[APS]], [[APS]] [[TMP3]], i32 0, i32 0
// CHECK-NEXT: [[T1:%.]] = bitcast %struct.PS [[TMP2]] to i8*		// CHECK-NEXT: [[T1:%.]] = bitcast %struct.PS [[TMP2]] to i8*
// CHECK-NEXT: [[T2:%.]] = bitcast %struct.PS [[T0]] to i8*		// CHECK-NEXT: [[T2:%.]] = bitcast %struct.PS [[T0]] to i8*
// CHECK-NEXT: call void @llvm.memcpy.p0i8.p0i8.i32(i8* align 2 [[T1]], i8* align 8 [[T2]], i32 6, i1 false)		// CHECK-NEXT: call void @llvm.memcpy.p0i8.p0i8.i32(i8* align 2 [[T1]], i8* align 8 [[T2]], i32 6, i1 false)
// CHECK-NEXT: [[T0:%.]] = getelementptr inbounds %struct.PS, %struct.PS [[TMP2]], i32 0, i32 0		// CHECK-NEXT: [[T0:%.]] = getelementptr inbounds %struct.PS, %struct.PS [[TMP2]], i32 0, i32 0
// CHECK-NEXT: [[T1:%.]] = load i16, i16 [[T0]], align 2		// CHECK-NEXT: [[T1:%.]] = load i16, i16 [[T0]], align 2
// CHECK-NEXT: [[T2:%.*]] = sext i16 [[T1]] to i32		// CHECK-NEXT: [[T2:%.*]] = sext i16 [[T1]] to i32
// CHECK-NEXT: store i32 [[T2]], i32* [[A]], align 4		// CHECK-NEXT: store i32 [[T2]], i32* [[A]], align 4
int a = ((PS)*fp).x;		int a = ((PS)*fp).x;

// CHECK-NEXT: ret void		// CHECK-NEXT: ret void
}		}

PS test_promoted_load(_Atomic(PS) *addr) {		PS test_promoted_load(_Atomic(PS) *addr) {
// CHECK-LABEL: @test_promoted_load(%struct.PS* noalias sret(%struct.PS) align 2 %agg.result, { %struct.PS, [2 x i8] }* noundef %addr)		// CHECK-LABEL: @test_promoted_load({ %struct.PS, [2 x i8] }* noundef %addr)
// CHECK: [[ADDR_ARG:%.]] = alloca { %struct.PS, [2 x i8] }, align 4		// CHECK: [[ADDR_ARG:%.]] = alloca { %struct.PS, [2 x i8] }, align 4
// CHECK: [[ATOMIC_RES:%.*]] = alloca { %struct.PS, [2 x i8] }, align 8		// CHECK: [[ATOMIC_RES:%.*]] = alloca { %struct.PS, [2 x i8] }, align 8
// CHECK: store { %struct.PS, [2 x i8] }* %addr, { %struct.PS, [2 x i8] }** [[ADDR_ARG]], align 4		// CHECK: store { %struct.PS, [2 x i8] }* %addr, { %struct.PS, [2 x i8] }** [[ADDR_ARG]], align 4
// CHECK: [[ADDR:%.]] = load { %struct.PS, [2 x i8] }, { %struct.PS, [2 x i8] }** [[ADDR_ARG]], align 4		// CHECK: [[ADDR:%.]] = load { %struct.PS, [2 x i8] }, { %struct.PS, [2 x i8] }** [[ADDR_ARG]], align 4
// CHECK: [[ADDR64:%.]] = bitcast { %struct.PS, [2 x i8] } [[ADDR]] to i64*		// CHECK: [[ADDR64:%.]] = bitcast { %struct.PS, [2 x i8] } [[ADDR]] to i64*
// CHECK: [[ATOMIC_RES64:%.]] = bitcast { %struct.PS, [2 x i8] } [[ATOMIC_RES]] to i64*		// CHECK: [[ATOMIC_RES64:%.]] = bitcast { %struct.PS, [2 x i8] } [[ATOMIC_RES]] to i64*
// CHECK: [[ADDR8:%.]] = bitcast i64 [[ADDR64]] to i8*		// CHECK: [[ADDR8:%.]] = bitcast i64 [[ADDR64]] to i8*
// CHECK: [[RES:%.]] = call arm_aapcscc i64 @__atomic_load_8(i8 noundef [[ADDR8]], i32 noundef 5)		// CHECK: [[RES:%.]] = call i64 @__atomic_load_8(i8 noundef [[ADDR8]], i32 noundef 5)
// CHECK: store i64 [[RES]], i64* [[ATOMIC_RES64]], align 8		// CHECK: store i64 [[RES]], i64* [[ATOMIC_RES64]], align 8
// CHECK: [[ATOMIC_RES_STRUCT:%.]] = bitcast i64 [[ATOMIC_RES64]] to %struct.PS*		// CHECK: [[ATOMIC_RES_STRUCT:%.]] = bitcast i64 [[ATOMIC_RES64]] to %struct.PS*
// CHECK: [[AGG_RESULT8:%.]] = bitcast %struct.PS %agg.result to i8*		// CHECK: [[AGG_RESULT8:%.]] = bitcast %struct.PS %retval to i8*
// CHECK: [[ATOMIC_RES8:%.]] = bitcast %struct.PS [[ATOMIC_RES_STRUCT]] to i8*		// CHECK: [[ATOMIC_RES8:%.]] = bitcast %struct.PS [[ATOMIC_RES_STRUCT]] to i8*
// CHECK: call void @llvm.memcpy.p0i8.p0i8.i32(i8* align 2 [[AGG_RESULT8]], i8* align 8 [[ATOMIC_RES8]], i32 6, i1 false)		// CHECK: call void @llvm.memcpy.p0i8.p0i8.i32(i8* align 2 [[AGG_RESULT8]], i8* align 8 [[ATOMIC_RES8]], i32 6, i1 false)

return __c11_atomic_load(addr, 5);		return __c11_atomic_load(addr, 5);
}		}

void test_promoted_store(_Atomic(PS) addr, PS val) {		void test_promoted_store(_Atomic(PS) addr, PS val) {
// CHECK-LABEL: @test_promoted_store({ %struct.PS, [2 x i8] }* noundef %addr, %struct.PS* noundef %val)		// CHECK-LABEL: @test_promoted_store({ %struct.PS, [2 x i8] }* noundef %addr, %struct.PS* noundef %val)
Show All 10 Lines	void test_promoted_store(_Atomic(PS) addr, PS val) {
// CHECK: call void @llvm.memcpy.p0i8.p0i8.i32(i8* align 2 [[NONATOMIC_TMP8]], i8* align 2 [[VAL8]], i32 6, i1 false)		// CHECK: call void @llvm.memcpy.p0i8.p0i8.i32(i8* align 2 [[NONATOMIC_TMP8]], i8* align 2 [[VAL8]], i32 6, i1 false)
// CHECK: [[ADDR64:%.]] = bitcast { %struct.PS, [2 x i8] } [[ADDR]] to i64*		// CHECK: [[ADDR64:%.]] = bitcast { %struct.PS, [2 x i8] } [[ADDR]] to i64*
// CHECK: [[ATOMIC_VAL8:%.]] = bitcast { %struct.PS, [2 x i8] } [[ATOMIC_VAL]] to i8*		// CHECK: [[ATOMIC_VAL8:%.]] = bitcast { %struct.PS, [2 x i8] } [[ATOMIC_VAL]] to i8*
// CHECK: [[NONATOMIC_TMP8:%.]] = bitcast %struct.PS [[NONATOMIC_TMP]] to i8*		// CHECK: [[NONATOMIC_TMP8:%.]] = bitcast %struct.PS [[NONATOMIC_TMP]] to i8*
// CHECK: call void @llvm.memcpy.p0i8.p0i8.i64(i8* align 8 [[ATOMIC_VAL8]], i8* align 2 [[NONATOMIC_TMP8]], i64 6, i1 false)		// CHECK: call void @llvm.memcpy.p0i8.p0i8.i64(i8* align 8 [[ATOMIC_VAL8]], i8* align 2 [[NONATOMIC_TMP8]], i64 6, i1 false)
// CHECK: [[ATOMIC_VAL64:%.]] = bitcast { %struct.PS, [2 x i8] } [[ATOMIC_VAL]] to i64*		// CHECK: [[ATOMIC_VAL64:%.]] = bitcast { %struct.PS, [2 x i8] } [[ATOMIC_VAL]] to i64*
// CHECK: [[ADDR8:%.]] = bitcast i64 [[ADDR64]] to i8*		// CHECK: [[ADDR8:%.]] = bitcast i64 [[ADDR64]] to i8*
// CHECK: [[VAL64:%.]] = load i64, i64 [[ATOMIC_VAL64]], align 2		// CHECK: [[VAL64:%.]] = load i64, i64 [[ATOMIC_VAL64]], align 2
// CHECK: call arm_aapcscc void @__atomic_store_8(i8* noundef [[ADDR8]], i64 noundef [[VAL64]], i32 noundef 5)		// CHECK: call void @__atomic_store_8(i8* noundef [[ADDR8]], i64 noundef [[VAL64]], i32 noundef 5)
__c11_atomic_store(addr, *val, 5);		__c11_atomic_store(addr, *val, 5);
}		}

PS test_promoted_exchange(_Atomic(PS) addr, PS val) {		PS test_promoted_exchange(_Atomic(PS) addr, PS val) {
// CHECK-LABEL: @test_promoted_exchange(%struct.PS* noalias sret(%struct.PS) align 2 %agg.result, { %struct.PS, [2 x i8] }* noundef %addr, %struct.PS* noundef %val)		// CHECK-LABEL: @test_promoted_exchange({ %struct.PS, [2 x i8] }* noundef %addr, %struct.PS* noundef %val)
// CHECK: [[ADDR_ARG:%.]] = alloca { %struct.PS, [2 x i8] }, align 4		// CHECK: [[ADDR_ARG:%.]] = alloca { %struct.PS, [2 x i8] }, align 4
// CHECK: [[VAL_ARG:%.]] = alloca %struct.PS, align 4		// CHECK: [[VAL_ARG:%.]] = alloca %struct.PS, align 4
// CHECK: [[NONATOMIC_TMP:%.*]] = alloca %struct.PS, align 2		// CHECK: [[NONATOMIC_TMP:%.*]] = alloca %struct.PS, align 2
// CHECK: [[ATOMIC_VAL:%.*]] = alloca { %struct.PS, [2 x i8] }, align 8		// CHECK: [[ATOMIC_VAL:%.*]] = alloca { %struct.PS, [2 x i8] }, align 8
// CHECK: [[ATOMIC_RES:%.*]] = alloca { %struct.PS, [2 x i8] }, align 8		// CHECK: [[ATOMIC_RES:%.*]] = alloca { %struct.PS, [2 x i8] }, align 8
// CHECK: store { %struct.PS, [2 x i8] }* %addr, { %struct.PS, [2 x i8] }** [[ADDR_ARG]], align 4		// CHECK: store { %struct.PS, [2 x i8] }* %addr, { %struct.PS, [2 x i8] }** [[ADDR_ARG]], align 4
// CHECK: store %struct.PS* %val, %struct.PS** [[VAL_ARG]], align 4		// CHECK: store %struct.PS* %val, %struct.PS** [[VAL_ARG]], align 4
// CHECK: [[ADDR:%.]] = load { %struct.PS, [2 x i8] }, { %struct.PS, [2 x i8] }** [[ADDR_ARG]], align 4		// CHECK: [[ADDR:%.]] = load { %struct.PS, [2 x i8] }, { %struct.PS, [2 x i8] }** [[ADDR_ARG]], align 4
// CHECK: [[VAL:%.]] = load %struct.PS, %struct.PS** [[VAL_ARG]], align 4		// CHECK: [[VAL:%.]] = load %struct.PS, %struct.PS** [[VAL_ARG]], align 4
// CHECK: [[NONATOMIC_TMP8:%.]] = bitcast %struct.PS [[NONATOMIC_TMP]] to i8*		// CHECK: [[NONATOMIC_TMP8:%.]] = bitcast %struct.PS [[NONATOMIC_TMP]] to i8*
// CHECK: [[VAL8:%.]] = bitcast %struct.PS [[VAL]] to i8*		// CHECK: [[VAL8:%.]] = bitcast %struct.PS [[VAL]] to i8*
// CHECK: call void @llvm.memcpy.p0i8.p0i8.i32(i8* align 2 [[NONATOMIC_TMP8]], i8* align 2 [[VAL8]], i32 6, i1 false)		// CHECK: call void @llvm.memcpy.p0i8.p0i8.i32(i8* align 2 [[NONATOMIC_TMP8]], i8* align 2 [[VAL8]], i32 6, i1 false)
// CHECK: [[ADDR64:%.]] = bitcast { %struct.PS, [2 x i8] } [[ADDR]] to i64*		// CHECK: [[ADDR64:%.]] = bitcast { %struct.PS, [2 x i8] } [[ADDR]] to i64*
// CHECK: [[ATOMIC_VAL8:%.]] = bitcast { %struct.PS, [2 x i8] } [[ATOMIC_VAL]] to i8*		// CHECK: [[ATOMIC_VAL8:%.]] = bitcast { %struct.PS, [2 x i8] } [[ATOMIC_VAL]] to i8*
// CHECK: [[NONATOMIC_TMP8:%.]] = bitcast %struct.PS [[NONATOMIC_TMP]] to i8*		// CHECK: [[NONATOMIC_TMP8:%.]] = bitcast %struct.PS [[NONATOMIC_TMP]] to i8*
// CHECK: call void @llvm.memcpy.p0i8.p0i8.i64(i8* align 8 [[ATOMIC_VAL8]], i8* align 2 [[NONATOMIC_TMP8]], i64 6, i1 false)		// CHECK: call void @llvm.memcpy.p0i8.p0i8.i64(i8* align 8 [[ATOMIC_VAL8]], i8* align 2 [[NONATOMIC_TMP8]], i64 6, i1 false)
// CHECK: [[ATOMIC_VAL64:%.]] = bitcast { %struct.PS, [2 x i8] } [[ATOMIC_VAL]] to i64*		// CHECK: [[ATOMIC_VAL64:%.]] = bitcast { %struct.PS, [2 x i8] } [[ATOMIC_VAL]] to i64*
// CHECK: [[ATOMIC_RES64:%.]] = bitcast { %struct.PS, [2 x i8] } [[ATOMIC_RES]] to i64*		// CHECK: [[ATOMIC_RES64:%.]] = bitcast { %struct.PS, [2 x i8] } [[ATOMIC_RES]] to i64*
// CHECK: [[ADDR8:%.]] = bitcast i64 [[ADDR64]] to i8*		// CHECK: [[ADDR8:%.]] = bitcast i64 [[ADDR64]] to i8*
// CHECK: [[VAL64:%.]] = load i64, i64 [[ATOMIC_VAL64]], align 2		// CHECK: [[VAL64:%.]] = load i64, i64 [[ATOMIC_VAL64]], align 2
// CHECK: [[RES:%.]] = call arm_aapcscc i64 @__atomic_exchange_8(i8 noundef [[ADDR8]], i64 noundef [[VAL64]], i32 noundef 5)		// CHECK: [[RES:%.]] = call i64 @__atomic_exchange_8(i8 noundef [[ADDR8]], i64 noundef [[VAL64]], i32 noundef 5)
// CHECK: store i64 [[RES]], i64* [[ATOMIC_RES64]], align 8		// CHECK: store i64 [[RES]], i64* [[ATOMIC_RES64]], align 8
// CHECK: [[ATOMIC_RES_STRUCT:%.]] = bitcast i64 [[ATOMIC_RES64]] to %struct.PS*		// CHECK: [[ATOMIC_RES_STRUCT:%.]] = bitcast i64 [[ATOMIC_RES64]] to %struct.PS*
// CHECK: [[AGG_RESULT8:%.]] = bitcast %struct.PS %agg.result to i8*		// CHECK: [[AGG_RESULT8:%.]] = bitcast %struct.PS %retval to i8*
// CHECK: [[ATOMIC_RES8:%.]] = bitcast %struct.PS [[ATOMIC_RES_STRUCT]] to i8*		// CHECK: [[ATOMIC_RES8:%.]] = bitcast %struct.PS [[ATOMIC_RES_STRUCT]] to i8*
// CHECK: call void @llvm.memcpy.p0i8.p0i8.i32(i8* align 2 [[AGG_RESULT8]], i8* align 8 [[ATOMIC_RES8]], i32 6, i1 false)		// CHECK: call void @llvm.memcpy.p0i8.p0i8.i32(i8* align 2 [[AGG_RESULT8]], i8* align 8 [[ATOMIC_RES8]], i32 6, i1 false)
return __c11_atomic_exchange(addr, *val, 5);		return __c11_atomic_exchange(addr, *val, 5);
}		}

_Bool test_promoted_cmpxchg(_Atomic(PS) addr, PS desired, PS *new) {		_Bool test_promoted_cmpxchg(_Atomic(PS) addr, PS desired, PS *new) {
// CHECK-LABEL: i1 @test_promoted_cmpxchg({ %struct.PS, [2 x i8] }* noundef %addr, %struct.PS* noundef %desired, %struct.PS* noundef %new) #0 {		// CHECK-LABEL: i1 @test_promoted_cmpxchg({ %struct.PS, [2 x i8] }* noundef %addr, %struct.PS* noundef %desired, %struct.PS* noundef %new) #0 {
// CHECK: [[ADDR_ARG:%.]] = alloca { %struct.PS, [2 x i8] }, align 4		// CHECK: [[ADDR_ARG:%.]] = alloca { %struct.PS, [2 x i8] }, align 4
Show All 18 Lines	_Bool test_promoted_cmpxchg(_Atomic(PS) addr, PS desired, PS *new) {
// CHECK: [[ATOMIC_DESIRED64:%.]] = bitcast { %struct.PS, [2 x i8] } [[ATOMIC_DESIRED]] to i64*		// CHECK: [[ATOMIC_DESIRED64:%.]] = bitcast { %struct.PS, [2 x i8] } [[ATOMIC_DESIRED]] to i64*
// CHECK: [[ATOMIC_NEW8:%.]] = bitcast { %struct.PS, [2 x i8] } [[ATOMIC_NEW]] to i8*		// CHECK: [[ATOMIC_NEW8:%.]] = bitcast { %struct.PS, [2 x i8] } [[ATOMIC_NEW]] to i8*
// CHECK: [[NONATOMIC_TMP8:%.]] = bitcast %struct.PS [[NONATOMIC_TMP]] to i8*		// CHECK: [[NONATOMIC_TMP8:%.]] = bitcast %struct.PS [[NONATOMIC_TMP]] to i8*
// CHECK: call void @llvm.memcpy.p0i8.p0i8.i64(i8* align 8 [[ATOMIC_NEW8]], i8* align 2 [[NONATOMIC_TMP8]], i64 6, i1 false)		// CHECK: call void @llvm.memcpy.p0i8.p0i8.i64(i8* align 8 [[ATOMIC_NEW8]], i8* align 2 [[NONATOMIC_TMP8]], i64 6, i1 false)
// CHECK: [[ATOMIC_NEW64:%.]] = bitcast { %struct.PS, [2 x i8] } [[ATOMIC_NEW]] to i64*		// CHECK: [[ATOMIC_NEW64:%.]] = bitcast { %struct.PS, [2 x i8] } [[ATOMIC_NEW]] to i64*
// CHECK: [[ADDR8:%.]] = bitcast i64 [[ADDR64]] to i8*		// CHECK: [[ADDR8:%.]] = bitcast i64 [[ADDR64]] to i8*
// CHECK: [[ATOMIC_DESIRED8:%.]] = bitcast i64 [[ATOMIC_DESIRED64]] to i8*		// CHECK: [[ATOMIC_DESIRED8:%.]] = bitcast i64 [[ATOMIC_DESIRED64]] to i8*
// CHECK: [[NEW64:%.]] = load i64, i64 [[ATOMIC_NEW64]], align 2		// CHECK: [[NEW64:%.]] = load i64, i64 [[ATOMIC_NEW64]], align 2
// CHECK: [[RES:%.]] = call arm_aapcscc zeroext i1 @__atomic_compare_exchange_8(i8 noundef [[ADDR8]], i8* noundef [[ATOMIC_DESIRED8]], i64 noundef [[NEW64]], i32 noundef 5, i32 noundef 5)		// CHECK: [[RES:%.]] = call zeroext i1 @__atomic_compare_exchange_8(i8 noundef [[ADDR8]], i8* noundef [[ATOMIC_DESIRED8]], i64 noundef [[NEW64]], i32 noundef 5, i32 noundef 5)
// CHECK: ret i1 [[RES]]		// CHECK: ret i1 [[RES]]
return __c11_atomic_compare_exchange_strong(addr, desired, *new, 5, 5);		return __c11_atomic_compare_exchange_strong(addr, desired, *new, 5, 5);
}		}

struct Empty {};		struct Empty {};

struct Empty test_empty_struct_load(_Atomic(struct Empty)* empty) {		struct Empty test_empty_struct_load(_Atomic(struct Empty)* empty) {
// CHECK-LABEL: @test_empty_struct_load(		// CHECK-LABEL: @test_empty_struct_load(
// CHECK: call arm_aapcscc zeroext i8 @__atomic_load_1(i8* noundef %{{.*}}, i32 noundef 5)		// CHECK: call zeroext i8 @__atomic_load_1(i8* noundef %{{.*}}, i32 noundef 5)
return __c11_atomic_load(empty, 5);		return __c11_atomic_load(empty, 5);
}		}

void test_empty_struct_store(_Atomic(struct Empty)* empty, struct Empty value) {		void test_empty_struct_store(_Atomic(struct Empty)* empty, struct Empty value) {
// CHECK-LABEL: @test_empty_struct_store(		// CHECK-LABEL: @test_empty_struct_store(
// CHECK: call arm_aapcscc void @__atomic_store_1(i8* noundef %{{.}}, i8 noundef zeroext %{{.}}, i32 noundef 5)		// CHECK: call void @__atomic_store_1(i8* noundef %{{.}}, i8 noundef zeroext %{{.}}, i32 noundef 5)
__c11_atomic_store(empty, value, 5);		__c11_atomic_store(empty, value, 5);
}		}

clang/test/CodeGen/pr45476.cpp

	// RUN: %clang_cc1 -triple arm-unknown-linux-gnueabi -emit-llvm %s -o - \| FileCheck -check-prefix=LIBCALL %s			// RUN: %clang_cc1 -triple riscv32-unknown-linux-gnueabi -emit-llvm %s -o - \| FileCheck -check-prefix=LIBCALL %s
	// RUN: %clang_cc1 -triple armv8-eabi -emit-llvm %s -o - \| FileCheck -check-prefix=NATIVE %s			// RUN: %clang_cc1 -triple armv8-eabi -emit-llvm %s -o - \| FileCheck -check-prefix=NATIVE %s
	// PR45476			// PR45476

	// This test used to get into an infinite loop,			// This test used to get into an infinite loop,
	// which, in turn, caused clang to never finish execution.			// which, in turn, caused clang to never finish execution.

	struct s3 {			struct s3 {
	char a, b, c;			char a, b, c;
	Show All 12 Lines

clang/test/CodeGenCXX/threadsafe-statics-no-atomic.cpp

	// NOTE: Assertions have been autogenerated by utils/update_cc_test_checks.py			// NOTE: Assertions have been autogenerated by utils/update_cc_test_checks.py
	// RUN: %clang_cc1 -emit-llvm -triple=thumbv6m-eabi -o - %s \| FileCheck %s			// RUN: %clang_cc1 -emit-llvm -triple=riscv32 -o - %s \| FileCheck %s

	int f();			int f();

	// CHECK-LABEL: @_Z1gv(			// CHECK-LABEL: @_Z1gv(
	// CHECK-NEXT: entry:			// CHECK-NEXT: entry:
	// CHECK-NEXT: [[TMP0:%.*]] = call i32 @__cxa_guard_acquire(ptr @_ZGVZ1gvE1a) #[[ATTR1:[0-9]+]]			// CHECK-NEXT: [[TMP0:%.*]] = call i32 @__cxa_guard_acquire(ptr @_ZGVZ1gvE1a) #[[ATTR1:[0-9]+]]
	// CHECK-NEXT: [[TOBOOL:%.*]] = icmp ne i32 [[TMP0]], 0			// CHECK-NEXT: [[TOBOOL:%.*]] = icmp ne i32 [[TMP0]], 0
	// CHECK-NEXT: br i1 [[TOBOOL]], label [[INIT:%.]], label [[INIT_END:%.]]			// CHECK-NEXT: br i1 [[TOBOOL]], label [[INIT:%.]], label [[INIT_END:%.]]
	Show All 11 Lines

clang/test/CodeGenOpenCL/atomic-ops-libcall.cl

	// RUN: %clang_cc1 -no-opaque-pointers < %s -cl-std=CL2.0 -triple spir64 -emit-llvm \| FileCheck -check-prefix=SPIR %s			// RUN: %clang_cc1 -no-opaque-pointers < %s -cl-std=CL2.0 -triple spir64 -emit-llvm \| FileCheck -check-prefix=SPIR %s
	// RUN: %clang_cc1 -no-opaque-pointers < %s -cl-std=CL2.0 -triple armv5e-none-linux-gnueabi -emit-llvm \| FileCheck -check-prefix=ARM %s			// RUN: %clang_cc1 -no-opaque-pointers < %s -cl-std=CL2.0 -triple riscv32-none-linux-gnueabi -emit-llvm \| FileCheck -check-prefix=ARM %s
	typedef enum memory_order {			typedef enum memory_order {
	memory_order_relaxed = __ATOMIC_RELAXED,			memory_order_relaxed = __ATOMIC_RELAXED,
	memory_order_acquire = __ATOMIC_ACQUIRE,			memory_order_acquire = __ATOMIC_ACQUIRE,
	memory_order_release = __ATOMIC_RELEASE,			memory_order_release = __ATOMIC_RELEASE,
	memory_order_acq_rel = __ATOMIC_ACQ_REL,			memory_order_acq_rel = __ATOMIC_ACQ_REL,
	memory_order_seq_cst = __ATOMIC_SEQ_CST			memory_order_seq_cst = __ATOMIC_SEQ_CST
	} memory_order;			} memory_order;

	▲ Show 20 Lines • Show All 72 Lines • Show Last 20 Lines

llvm/lib/Target/ARM/ARMISelLowering.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 1,351 Lines • ▼ Show 20 Lines	if (Subtarget->hasAnyDataBarrier() &&
// Unordered/Monotonic case.		// Unordered/Monotonic case.
if (!InsertFencesForAtomic) {		if (!InsertFencesForAtomic) {
setOperationAction(ISD::ATOMIC_LOAD, MVT::i32, Custom);		setOperationAction(ISD::ATOMIC_LOAD, MVT::i32, Custom);
setOperationAction(ISD::ATOMIC_STORE, MVT::i32, Custom);		setOperationAction(ISD::ATOMIC_STORE, MVT::i32, Custom);
}		}
}		}

// Compute supported atomic widths.		// Compute supported atomic widths.
if (Subtarget->isTargetLinux() \|\|		if (Subtarget->isMClass()) {
(!Subtarget->isMClass() && Subtarget->hasV6Ops())) {		// Cortex-M besides Cortex-M0 has 32-bit atomics.
// For targets where __sync_* routines are reliably available, we use them
// if necessary.
//
// ARM Linux always supports 64-bit atomics through kernel-assisted atomic
// routines (kernel 3.1 or later). FIXME: Not with compiler-rt?
//		//
// ARMv6 targets have native instructions in ARM mode. For Thumb mode,		// Cortex-M0 is missing ldrex/strex, so we generate __sync_* calls.
// such targets should provide __sync_* routines, which use the ARM mode		// We assume the user somehow makes that lock-free.
// instructions. (ARMv6 doesn't have dmb, but it has an equivalent
// encoding; see ARMISD::MEMBARRIER_MCR.)
setMaxAtomicSizeInBitsSupported(64);
} else if ((Subtarget->isMClass() && Subtarget->hasV8MBaselineOps()) \|\|
Subtarget->hasForced32BitAtomics()) {
// Cortex-M (besides Cortex-M0) have 32-bit atomics.
setMaxAtomicSizeInBitsSupported(32);		setMaxAtomicSizeInBitsSupported(32);
} else {		} else {
// We can't assume anything about other targets; just use libatomic		// v7 has 64-bit atomics. Some v6 variants have 64-bit atomics, some
// routines.		// have 32-bit atomics. Older variants have no atomics, but they
setMaxAtomicSizeInBitsSupported(0);		// might be emulated on some targets. We completely ignore all this,
		// and just assume appropriate __sync_* routines are available on targets
		// that don't have the appropriate native instructions. (In practice,
		// such routines exist on Linux. We assume everyone else copies Linux.)
		setMaxAtomicSizeInBitsSupported(64);
}		}

setMaxDivRemBitWidthSupported(64);		setMaxDivRemBitWidthSupported(64);

setOperationAction(ISD::PREFETCH, MVT::Other, Custom);		setOperationAction(ISD::PREFETCH, MVT::Other, Custom);

// Requires SXTB/SXTH, available on v6 and up in both ARM and Thumb modes.		// Requires SXTB/SXTH, available on v6 and up in both ARM and Thumb modes.
if (!Subtarget->hasV6Ops()) {		if (!Subtarget->hasV6Ops()) {
▲ Show 20 Lines • Show All 20,447 Lines • Show Last 20 Lines

llvm/test/CodeGen/ARM/atomic-64bit.ll

	; RUN: llc < %s -mtriple=armv7-apple-ios \| FileCheck %s --check-prefix=CHECK --check-prefix=CHECK-LE			; RUN: llc < %s -mtriple=armv7-apple-ios \| FileCheck %s --check-prefix=CHECK --check-prefix=CHECK-LE
	; RUN: llc < %s -mtriple=thumbv7-none-linux-gnueabihf \| FileCheck %s --check-prefix=CHECK-THUMB --check-prefix=CHECK-THUMB-LE			; RUN: llc < %s -mtriple=thumbv7-none-linux-gnueabihf \| FileCheck %s --check-prefix=CHECK-THUMB --check-prefix=CHECK-THUMB-LE
	; RUN: llc < %s -mtriple=armebv7 -target-abi apcs \| FileCheck %s --check-prefix=CHECK --check-prefix=CHECK-BE			; RUN: llc < %s -mtriple=armebv7 -target-abi apcs \| FileCheck %s --check-prefix=CHECK --check-prefix=CHECK-BE
	; RUN: llc < %s -mtriple=thumbebv7-none-linux-gnueabihf \| FileCheck %s --check-prefix=CHECK-THUMB --check-prefix=CHECK-THUMB-BE			; RUN: llc < %s -mtriple=thumbebv7-none-linux-gnueabihf \| FileCheck %s --check-prefix=CHECK-THUMB --check-prefix=CHECK-THUMB-BE
	; RUN: llc < %s -mtriple=armv7m--none-eabi \| FileCheck %s --check-prefix=CHECK-M			; RUN: llc < %s -mtriple=armv7m--none-eabi \| FileCheck %s --check-prefix=CHECK-M
	; RUN: llc < %s -mtriple=armv8m--none-eabi \| FileCheck %s --check-prefix=CHECK-M			; RUN: llc < %s -mtriple=armv8m.base--none-eabi \| FileCheck %s --check-prefix=CHECK-M

	define i64 @test1(i64* %ptr, i64 %val) {			define i64 @test1(i64* %ptr, i64 %val) {
	; CHECK-LABEL: test1:			; CHECK-LABEL: test1:
	; CHECK: dmb {{ish$}}			; CHECK: dmb {{ish$}}
	; CHECK: ldrexd [[REG1:(r[0-9]?[02468])]], [[REG2:(r[0-9]?[13579])]]			; CHECK: ldrexd [[REG1:(r[0-9]?[02468])]], [[REG2:(r[0-9]?[13579])]]
	; CHECK-LE: adds [[REG3:(r[0-9]?[02468])]], [[REG1]]			; CHECK-LE: adds [[REG3:(r[0-9]?[02468])]], [[REG1]]
	; CHECK-LE: adc [[REG4:(r[0-9]?[13579])]], [[REG2]]			; CHECK-LE: adc [[REG4:(r[0-9]?[13579])]], [[REG2]]
	; CHECK-BE: adds [[REG4:(r[0-9]?[13579])]], [[REG2]]			; CHECK-BE: adds [[REG4:(r[0-9]?[13579])]], [[REG2]]
	▲ Show 20 Lines • Show All 437 Lines • Show Last 20 Lines

llvm/test/CodeGen/ARM/atomic-load-store.ll

	Show All 32 Lines
	; THUMBONE: @ %bb.0:			; THUMBONE: @ %bb.0:
	; THUMBONE-NEXT: push {r7, lr}			; THUMBONE-NEXT: push {r7, lr}
	; THUMBONE-NEXT: bl __sync_lock_test_and_set_4			; THUMBONE-NEXT: bl __sync_lock_test_and_set_4
	; THUMBONE-NEXT: pop {r7, pc}			; THUMBONE-NEXT: pop {r7, pc}
	;			;
	; ARMV4-LABEL: test1:			; ARMV4-LABEL: test1:
	; ARMV4: @ %bb.0:			; ARMV4: @ %bb.0:
	; ARMV4-NEXT: push {r11, lr}			; ARMV4-NEXT: push {r11, lr}
	; ARMV4-NEXT: mov r2, #5			; ARMV4-NEXT: bl __sync_lock_test_and_set_4
	; ARMV4-NEXT: bl __atomic_store_4
	; ARMV4-NEXT: pop {r11, lr}			; ARMV4-NEXT: pop {r11, lr}
	; ARMV4-NEXT: mov pc, lr			; ARMV4-NEXT: mov pc, lr
	;			;
	; ARMV6-LABEL: test1:			; ARMV6-LABEL: test1:
	; ARMV6: @ %bb.0:			; ARMV6: @ %bb.0:
	; ARMV6-NEXT: mov r2, #0			; ARMV6-NEXT: mov r2, #0
	; ARMV6-NEXT: mcr p15, #0, r2, c7, c10, #5			; ARMV6-NEXT: mcr p15, #0, r2, c7, c10, #5
	; ARMV6-NEXT: str r1, [r0]			; ARMV6-NEXT: str r1, [r0]
	Show All 35 Lines
	; THUMBONE-NEXT: movs r1, #0			; THUMBONE-NEXT: movs r1, #0
	; THUMBONE-NEXT: mov r2, r1			; THUMBONE-NEXT: mov r2, r1
	; THUMBONE-NEXT: bl __sync_val_compare_and_swap_4			; THUMBONE-NEXT: bl __sync_val_compare_and_swap_4
	; THUMBONE-NEXT: pop {r7, pc}			; THUMBONE-NEXT: pop {r7, pc}
	;			;
	; ARMV4-LABEL: test2:			; ARMV4-LABEL: test2:
	; ARMV4: @ %bb.0:			; ARMV4: @ %bb.0:
	; ARMV4-NEXT: push {r11, lr}			; ARMV4-NEXT: push {r11, lr}
	; ARMV4-NEXT: mov r1, #5			; ARMV4-NEXT: mov r1, #0
	; ARMV4-NEXT: bl __atomic_load_4			; ARMV4-NEXT: mov r2, #0
				; ARMV4-NEXT: bl __sync_val_compare_and_swap_4
	; ARMV4-NEXT: pop {r11, lr}			; ARMV4-NEXT: pop {r11, lr}
	; ARMV4-NEXT: mov pc, lr			; ARMV4-NEXT: mov pc, lr
	;			;
	; ARMV6-LABEL: test2:			; ARMV6-LABEL: test2:
	; ARMV6: @ %bb.0:			; ARMV6: @ %bb.0:
	; ARMV6-NEXT: ldr r0, [r0]			; ARMV6-NEXT: ldr r0, [r0]
	; ARMV6-NEXT: mov r1, #0			; ARMV6-NEXT: mov r1, #0
	; ARMV6-NEXT: mcr p15, #0, r1, c7, c10, #5			; ARMV6-NEXT: mcr p15, #0, r1, c7, c10, #5
	Show All 30 Lines
	; THUMBONE-LABEL: test3:			; THUMBONE-LABEL: test3:
	; THUMBONE: @ %bb.0:			; THUMBONE: @ %bb.0:
	; THUMBONE-NEXT: ldrb r0, [r0]			; THUMBONE-NEXT: ldrb r0, [r0]
	; THUMBONE-NEXT: strb r0, [r1]			; THUMBONE-NEXT: strb r0, [r1]
	; THUMBONE-NEXT: bx lr			; THUMBONE-NEXT: bx lr
	;			;
	; ARMV4-LABEL: test3:			; ARMV4-LABEL: test3:
	; ARMV4: @ %bb.0:			; ARMV4: @ %bb.0:
	; ARMV4-NEXT: push {r4, lr}			; ARMV4-NEXT: ldrb r0, [r0]
	; ARMV4-NEXT: mov r4, r1			; ARMV4-NEXT: strb r0, [r1]
	; ARMV4-NEXT: mov r1, #0
	; ARMV4-NEXT: bl __atomic_load_1
	; ARMV4-NEXT: mov r1, r0
	; ARMV4-NEXT: mov r0, r4
	; ARMV4-NEXT: mov r2, #0
	; ARMV4-NEXT: bl __atomic_store_1
	; ARMV4-NEXT: pop {r4, lr}
	; ARMV4-NEXT: mov pc, lr			; ARMV4-NEXT: mov pc, lr
	;			;
	; ARMV6-LABEL: test3:			; ARMV6-LABEL: test3:
	; ARMV6: @ %bb.0:			; ARMV6: @ %bb.0:
	; ARMV6-NEXT: ldrb r0, [r0]			; ARMV6-NEXT: ldrb r0, [r0]
	; ARMV6-NEXT: strb r0, [r1]			; ARMV6-NEXT: strb r0, [r1]
	; ARMV6-NEXT: bx lr			; ARMV6-NEXT: bx lr
	;			;
	▲ Show 20 Lines • Show All 48 Lines • ▼ Show 20 Lines
	; THUMBONE-NEXT: mov r0, r4			; THUMBONE-NEXT: mov r0, r4
	; THUMBONE-NEXT: bl __sync_lock_test_and_set_1			; THUMBONE-NEXT: bl __sync_lock_test_and_set_1
	; THUMBONE-NEXT: pop {r4, pc}			; THUMBONE-NEXT: pop {r4, pc}
	;			;
	; ARMV4-LABEL: test4:			; ARMV4-LABEL: test4:
	; ARMV4: @ %bb.0:			; ARMV4: @ %bb.0:
	; ARMV4-NEXT: push {r4, lr}			; ARMV4-NEXT: push {r4, lr}
	; ARMV4-NEXT: mov r4, r1			; ARMV4-NEXT: mov r4, r1
	; ARMV4-NEXT: mov r1, #5			; ARMV4-NEXT: mov r1, #0
	; ARMV4-NEXT: bl __atomic_load_1			; ARMV4-NEXT: mov r2, #0
				; ARMV4-NEXT: bl __sync_val_compare_and_swap_1
	; ARMV4-NEXT: mov r1, r0			; ARMV4-NEXT: mov r1, r0
	; ARMV4-NEXT: mov r0, r4			; ARMV4-NEXT: mov r0, r4
	; ARMV4-NEXT: mov r2, #5			; ARMV4-NEXT: bl __sync_lock_test_and_set_1
	; ARMV4-NEXT: bl __atomic_store_1
	; ARMV4-NEXT: pop {r4, lr}			; ARMV4-NEXT: pop {r4, lr}
	; ARMV4-NEXT: mov pc, lr			; ARMV4-NEXT: mov pc, lr
	;			;
	; ARMV6-LABEL: test4:			; ARMV6-LABEL: test4:
	; ARMV6: @ %bb.0:			; ARMV6: @ %bb.0:
	; ARMV6-NEXT: mov r2, #0			; ARMV6-NEXT: mov r2, #0
	; ARMV6-NEXT: ldrb r0, [r0]			; ARMV6-NEXT: ldrb r0, [r0]
	; ARMV6-NEXT: mcr p15, #0, r2, c7, c10, #5			; ARMV6-NEXT: mcr p15, #0, r2, c7, c10, #5
	▲ Show 20 Lines • Show All 49 Lines • ▼ Show 20 Lines
	; THUMBONE-NEXT: mov r3, r2			; THUMBONE-NEXT: mov r3, r2
	; THUMBONE-NEXT: bl __sync_val_compare_and_swap_8			; THUMBONE-NEXT: bl __sync_val_compare_and_swap_8
	; THUMBONE-NEXT: add sp, #8			; THUMBONE-NEXT: add sp, #8
	; THUMBONE-NEXT: pop {r7, pc}			; THUMBONE-NEXT: pop {r7, pc}
	;			;
	; ARMV4-LABEL: test_old_load_64bit:			; ARMV4-LABEL: test_old_load_64bit:
	; ARMV4: @ %bb.0:			; ARMV4: @ %bb.0:
	; ARMV4-NEXT: push {r11, lr}			; ARMV4-NEXT: push {r11, lr}
	; ARMV4-NEXT: mov r1, #5			; ARMV4-NEXT: sub sp, sp, #8
	; ARMV4-NEXT: bl __atomic_load_8			; ARMV4-NEXT: mov r1, #0
				; ARMV4-NEXT: mov r2, #0
				; ARMV4-NEXT: mov r3, #0
				; ARMV4-NEXT: str r1, [sp]
				; ARMV4-NEXT: str r1, [sp, #4]
				; ARMV4-NEXT: bl __sync_val_compare_and_swap_8
				; ARMV4-NEXT: add sp, sp, #8
	; ARMV4-NEXT: pop {r11, lr}			; ARMV4-NEXT: pop {r11, lr}
	; ARMV4-NEXT: mov pc, lr			; ARMV4-NEXT: mov pc, lr
	;			;
	; ARMV6-LABEL: test_old_load_64bit:			; ARMV6-LABEL: test_old_load_64bit:
	; ARMV6: @ %bb.0:			; ARMV6: @ %bb.0:
	; ARMV6-NEXT: ldrexd r0, r1, [r0]			; ARMV6-NEXT: ldrexd r0, r1, [r0]
	; ARMV6-NEXT: mov r2, #0			; ARMV6-NEXT: mov r2, #0
	; ARMV6-NEXT: mcr p15, #0, r2, c7, c10, #5			; ARMV6-NEXT: mcr p15, #0, r2, c7, c10, #5
	▲ Show 20 Lines • Show All 100 Lines • ▼ Show 20 Lines
	; THUMBONE: @ %bb.0:			; THUMBONE: @ %bb.0:
	; THUMBONE-NEXT: push {r7, lr}			; THUMBONE-NEXT: push {r7, lr}
	; THUMBONE-NEXT: bl __sync_lock_test_and_set_8			; THUMBONE-NEXT: bl __sync_lock_test_and_set_8
	; THUMBONE-NEXT: pop {r7, pc}			; THUMBONE-NEXT: pop {r7, pc}
	;			;
	; ARMV4-LABEL: test_old_store_64bit:			; ARMV4-LABEL: test_old_store_64bit:
	; ARMV4: @ %bb.0:			; ARMV4: @ %bb.0:
	; ARMV4-NEXT: push {r11, lr}			; ARMV4-NEXT: push {r11, lr}
	; ARMV4-NEXT: sub sp, sp, #8			; ARMV4-NEXT: bl __sync_lock_test_and_set_8
	; ARMV4-NEXT: mov r1, #5
	; ARMV4-NEXT: str r1, [sp]
	; ARMV4-NEXT: bl __atomic_store_8
	; ARMV4-NEXT: add sp, sp, #8
	; ARMV4-NEXT: pop {r11, lr}			; ARMV4-NEXT: pop {r11, lr}
	; ARMV4-NEXT: mov pc, lr			; ARMV4-NEXT: mov pc, lr
	;			;
	; ARMV6-LABEL: test_old_store_64bit:			; ARMV6-LABEL: test_old_store_64bit:
	; ARMV6: @ %bb.0:			; ARMV6: @ %bb.0:
	; ARMV6-NEXT: push {r4, r5, r11, lr}			; ARMV6-NEXT: push {r4, r5, r11, lr}
	; ARMV6-NEXT: @ kill: def $r3 killed $r3 killed $r2_r3 def $r2_r3			; ARMV6-NEXT: @ kill: def $r3 killed $r3 killed $r2_r3 def $r2_r3
	; ARMV6-NEXT: mov r1, #0			; ARMV6-NEXT: mov r1, #0
	Show All 25 Lines

llvm/test/CodeGen/ARM/atomic-op.ll

; RUN: llc < %s -mtriple=armv7-apple-ios -verify-machineinstrs \| FileCheck %s --check-prefix=CHECK --check-prefix CHECK-ARMV7		; RUN: llc < %s -mtriple=armv7-apple-ios -verify-machineinstrs \| FileCheck %s --check-prefixes=CHECKALL,CHECK,CHECK-ARMV7
; RUN: llc < %s -mtriple=thumbv7-apple-ios -verify-machineinstrs \| FileCheck %s --check-prefix=CHECK --check-prefix=CHECK-T2		; RUN: llc < %s -mtriple=thumbv7-apple-ios -verify-machineinstrs \| FileCheck %s --check-prefixes=CHECKALL,CHECK,CHECK-T2
; RUN: llc < %s -mtriple=thumbv6-apple-ios -verify-machineinstrs \| FileCheck %s --check-prefix=CHECK-T1		; RUN: llc < %s -mtriple=thumbv6-apple-ios -verify-machineinstrs \| FileCheck %s --check-prefixes=CHECKALL,CHECK-T1
; RUN: llc < %s -mtriple=thumbv6-apple-ios -verify-machineinstrs -mcpu=cortex-m0 \| FileCheck %s --check-prefix=CHECK-T1-M0		; RUN: llc < %s -mtriple=thumbv6-apple-ios -verify-machineinstrs -mcpu=cortex-m0 \| FileCheck %s --check-prefixes=CHECKALL,CHECK-T1-M0
; RUN: llc < %s -mtriple=thumbv7--none-eabi -thread-model single -verify-machineinstrs \| FileCheck %s --check-prefix=CHECK-BAREMETAL		; RUN: llc < %s -mtriple=thumbv7--none-eabi -thread-model single -verify-machineinstrs \| FileCheck %s --check-prefixes=CHECKALL,CHECK-BAREMETAL

target datalayout = "e-m:e-p:32:32-i64:64-v128:64:128-a:0:32-n32-S64"		target datalayout = "e-m:e-p:32:32-i64:64-v128:64:128-a:0:32-n32-S64"

; CHECK-LABEL: _func:		; CHECKALL-LABEL: func:
define void @func(i32 %argc, i8** %argv) nounwind {		define void @func(i32 %argc, i8** %argv) nounwind {
entry:		entry:
%argc.addr = alloca i32 ; <i32*> [#uses=1]		%argc.addr = alloca i32 ; <i32*> [#uses=1]
%argv.addr = alloca i8 ; <i8*> [#uses=1]		%argv.addr = alloca i8 ; <i8*> [#uses=1]
%val1 = alloca i32 ; <i32*> [#uses=2]		%val1 = alloca i32 ; <i32*> [#uses=2]
%val2 = alloca i32 ; <i32*> [#uses=15]		%val2 = alloca i32 ; <i32*> [#uses=15]
%andt = alloca i32 ; <i32*> [#uses=2]		%andt = alloca i32 ; <i32*> [#uses=2]
%ort = alloca i32 ; <i32*> [#uses=2]		%ort = alloca i32 ; <i32*> [#uses=2]
Show All 9 Lines	entry:
store i32 3855, i32* %xort		store i32 3855, i32* %xort
store i32 4, i32* %temp		store i32 4, i32* %temp
%tmp = load i32, i32* %temp		%tmp = load i32, i32* %temp
call void asm sideeffect "", "~{memory},~{dirflag},~{fpsr},~{flags}"()		call void asm sideeffect "", "~{memory},~{dirflag},~{fpsr},~{flags}"()
; CHECK: ldrex		; CHECK: ldrex
; CHECK: add		; CHECK: add
; CHECK: strex		; CHECK: strex
; CHECK-T1: bl ___sync_fetch_and_add_4		; CHECK-T1: bl ___sync_fetch_and_add_4
; CHECK-T1-M0: bl ___atomic_fetch_add_4		; CHECK-T1-M0: bl ___sync_fetch_and_add_4
; CHECK-BAREMETAL: add		; CHECK-BAREMETAL: add
; CHECK-BAREMETAL-NOT: __sync		; CHECK-BAREMETAL-NOT: __sync
%0 = atomicrmw add i32* %val1, i32 %tmp monotonic		%0 = atomicrmw add i32* %val1, i32 %tmp monotonic
store i32 %0, i32* %old		store i32 %0, i32* %old
call void asm sideeffect "", "~{memory},~{dirflag},~{fpsr},~{flags}"()		call void asm sideeffect "", "~{memory},~{dirflag},~{fpsr},~{flags}"()
; CHECK: ldrex		; CHECK: ldrex
; CHECK: sub		; CHECK: sub
; CHECK: strex		; CHECK: strex
; CHECK-T1: bl ___sync_fetch_and_sub_4		; CHECK-T1: bl ___sync_fetch_and_sub_4
; CHECK-T1-M0: bl ___atomic_fetch_sub_4		; CHECK-T1-M0: bl ___sync_fetch_and_sub_4
; CHECK-BAREMETAL: sub		; CHECK-BAREMETAL: sub
; CHECK-BAREMETAL-NOT: __sync		; CHECK-BAREMETAL-NOT: __sync
%1 = atomicrmw sub i32* %val2, i32 30 monotonic		%1 = atomicrmw sub i32* %val2, i32 30 monotonic
store i32 %1, i32* %old		store i32 %1, i32* %old
call void asm sideeffect "", "~{memory},~{dirflag},~{fpsr},~{flags}"()		call void asm sideeffect "", "~{memory},~{dirflag},~{fpsr},~{flags}"()
; CHECK: ldrex		; CHECK: ldrex
; CHECK: add		; CHECK: add
; CHECK: strex		; CHECK: strex
; CHECK-T1: bl ___sync_fetch_and_add_4		; CHECK-T1: bl ___sync_fetch_and_add_4
; CHECK-T1-M0: bl ___atomic_fetch_add_4		; CHECK-T1-M0: bl ___sync_fetch_and_add_4
; CHECK-BAREMETAL: add		; CHECK-BAREMETAL: add
; CHECK-BAREMETAL-NOT: __sync		; CHECK-BAREMETAL-NOT: __sync
%2 = atomicrmw add i32* %val2, i32 1 monotonic		%2 = atomicrmw add i32* %val2, i32 1 monotonic
store i32 %2, i32* %old		store i32 %2, i32* %old
call void asm sideeffect "", "~{memory},~{dirflag},~{fpsr},~{flags}"()		call void asm sideeffect "", "~{memory},~{dirflag},~{fpsr},~{flags}"()
; CHECK: ldrex		; CHECK: ldrex
; CHECK: sub		; CHECK: sub
; CHECK: strex		; CHECK: strex
; CHECK-T1: bl ___sync_fetch_and_sub_4		; CHECK-T1: bl ___sync_fetch_and_sub_4
; CHECK-T1-M0: bl ___atomic_fetch_sub_4		; CHECK-T1-M0: bl ___sync_fetch_and_sub_4
; CHECK-BAREMETAL: sub		; CHECK-BAREMETAL: sub
; CHECK-BAREMETAL-NOT: __sync		; CHECK-BAREMETAL-NOT: __sync
%3 = atomicrmw sub i32* %val2, i32 1 monotonic		%3 = atomicrmw sub i32* %val2, i32 1 monotonic
store i32 %3, i32* %old		store i32 %3, i32* %old
call void asm sideeffect "", "~{memory},~{dirflag},~{fpsr},~{flags}"()		call void asm sideeffect "", "~{memory},~{dirflag},~{fpsr},~{flags}"()
; CHECK: ldrex		; CHECK: ldrex
; CHECK: and		; CHECK: and
; CHECK: strex		; CHECK: strex
; CHECK-T1: bl ___sync_fetch_and_and_4		; CHECK-T1: bl ___sync_fetch_and_and_4
; CHECK-T1-M0: bl ___atomic_fetch_and_4		; CHECK-T1-M0: bl ___sync_fetch_and_and_4
; CHECK-BAREMETAL: and		; CHECK-BAREMETAL: and
; CHECK-BAREMETAL-NOT: __sync		; CHECK-BAREMETAL-NOT: __sync
%4 = atomicrmw and i32* %andt, i32 4080 monotonic		%4 = atomicrmw and i32* %andt, i32 4080 monotonic
store i32 %4, i32* %old		store i32 %4, i32* %old
call void asm sideeffect "", "~{memory},~{dirflag},~{fpsr},~{flags}"()		call void asm sideeffect "", "~{memory},~{dirflag},~{fpsr},~{flags}"()
; CHECK: ldrex		; CHECK: ldrex
; CHECK: or		; CHECK: or
; CHECK: strex		; CHECK: strex
; CHECK-T1: bl ___sync_fetch_and_or_4		; CHECK-T1: bl ___sync_fetch_and_or_4
; CHECK-T1-M0: bl ___atomic_fetch_or_4		; CHECK-T1-M0: bl ___sync_fetch_and_or_4
; CHECK-BAREMETAL: or		; CHECK-BAREMETAL: or
; CHECK-BAREMETAL-NOT: __sync		; CHECK-BAREMETAL-NOT: __sync
%5 = atomicrmw or i32* %ort, i32 4080 monotonic		%5 = atomicrmw or i32* %ort, i32 4080 monotonic
store i32 %5, i32* %old		store i32 %5, i32* %old
call void asm sideeffect "", "~{memory},~{dirflag},~{fpsr},~{flags}"()		call void asm sideeffect "", "~{memory},~{dirflag},~{fpsr},~{flags}"()
; CHECK: ldrex		; CHECK: ldrex
; CHECK: eor		; CHECK: eor
; CHECK: strex		; CHECK: strex
; CHECK-T1: bl ___sync_fetch_and_xor_4		; CHECK-T1: bl ___sync_fetch_and_xor_4
; CHECK-T1-M0: bl ___atomic_fetch_xor_4		; CHECK-T1-M0: bl ___sync_fetch_and_xor_4
; CHECK-BAREMETAL: eor		; CHECK-BAREMETAL: eor
; CHECK-BAREMETAL-NOT: __sync		; CHECK-BAREMETAL-NOT: __sync
%6 = atomicrmw xor i32* %xort, i32 4080 monotonic		%6 = atomicrmw xor i32* %xort, i32 4080 monotonic
store i32 %6, i32* %old		store i32 %6, i32* %old
call void asm sideeffect "", "~{memory},~{dirflag},~{fpsr},~{flags}"()		call void asm sideeffect "", "~{memory},~{dirflag},~{fpsr},~{flags}"()
; CHECK: ldrex		; CHECK: ldrex
; CHECK: cmp		; CHECK: cmp
; CHECK: strex		; CHECK: strex
; CHECK-T1: bl ___sync_fetch_and_min_4		; CHECK-T1: bl ___sync_fetch_and_min_4
; CHECK-T1-M0: bl ___atomic_compare_exchange_4		; CHECK-T1-M0: bl ___sync_fetch_and_min_4
; CHECK-BAREMETAL: cmp
; CHECK-BAREMETAL-NOT: __sync		; CHECK-BAREMETAL-NOT: __sync
%7 = atomicrmw min i32* %val2, i32 16 monotonic		%7 = atomicrmw min i32* %val2, i32 16 monotonic
store i32 %7, i32* %old		store i32 %7, i32* %old
call void asm sideeffect "", "~{memory},~{dirflag},~{fpsr},~{flags}"()		call void asm sideeffect "", "~{memory},~{dirflag},~{fpsr},~{flags}"()
%neg = sub i32 0, 1		%neg = sub i32 0, 1
; CHECK: ldrex		; CHECK: ldrex
; CHECK: cmp		; CHECK: cmp
; CHECK: strex		; CHECK: strex
; CHECK-T1: bl ___sync_fetch_and_min_4		; CHECK-T1: bl ___sync_fetch_and_min_4
; CHECK-T1-M0: bl ___atomic_compare_exchange_4		; CHECK-T1-M0: bl ___sync_fetch_and_min_4
; CHECK-BAREMETAL: cmp
; CHECK-BAREMETAL-NOT: __sync		; CHECK-BAREMETAL-NOT: __sync
%8 = atomicrmw min i32* %val2, i32 %neg monotonic		%8 = atomicrmw min i32* %val2, i32 %neg monotonic
store i32 %8, i32* %old		store i32 %8, i32* %old
call void asm sideeffect "", "~{memory},~{dirflag},~{fpsr},~{flags}"()		call void asm sideeffect "", "~{memory},~{dirflag},~{fpsr},~{flags}"()
; CHECK: ldrex		; CHECK: ldrex
; CHECK: cmp		; CHECK: cmp
; CHECK: strex		; CHECK: strex
; CHECK-T1: bl ___sync_fetch_and_max_4		; CHECK-T1: bl ___sync_fetch_and_max_4
; CHECK-T1-M0: bl ___atomic_compare_exchange_4		; CHECK-T1-M0: bl ___sync_fetch_and_max_4
; CHECK-BAREMETAL: cmp
; CHECK-BAREMETAL-NOT: __sync		; CHECK-BAREMETAL-NOT: __sync
%9 = atomicrmw max i32* %val2, i32 1 monotonic		%9 = atomicrmw max i32* %val2, i32 1 monotonic
store i32 %9, i32* %old		store i32 %9, i32* %old
call void asm sideeffect "", "~{memory},~{dirflag},~{fpsr},~{flags}"()		call void asm sideeffect "", "~{memory},~{dirflag},~{fpsr},~{flags}"()
; CHECK: ldrex		; CHECK: ldrex
; CHECK: bic		; CHECK: bic
; CHECK-NOT: cmp		; CHECK-NOT: cmp
; CHECK: strex		; CHECK: strex
; CHECK-T1: bl ___sync_fetch_and_max_4		; CHECK-T1: bl ___sync_fetch_and_max_4
; CHECK-T1-M0: bl ___atomic_compare_exchange_4		; CHECK-T1-M0: bl ___sync_fetch_and_max_4
; CHECK-BAREMETAL: bic		; CHECK-BAREMETAL: bic
; CHECK-BAREMETAL-NOT: __sync		; CHECK-BAREMETAL-NOT: __sync
%10 = atomicrmw max i32* %val2, i32 0 monotonic		%10 = atomicrmw max i32* %val2, i32 0 monotonic
store i32 %10, i32* %old		store i32 %10, i32* %old
call void asm sideeffect "", "~{memory},~{dirflag},~{fpsr},~{flags}"()		call void asm sideeffect "", "~{memory},~{dirflag},~{fpsr},~{flags}"()
; CHECK: ldrex		; CHECK: ldrex
; CHECK: cmp		; CHECK: cmp
; CHECK: strex		; CHECK: strex
; CHECK-T1: bl ___sync_fetch_and_umin_4		; CHECK-T1: bl ___sync_fetch_and_umin_4
; CHECK-T1-M0: bl ___atomic_compare_exchange_4		; CHECK-T1-M0: bl ___sync_fetch_and_umin_4
; CHECK-BAREMETAL: cmp
; CHECK-BAREMETAL-NOT: __sync		; CHECK-BAREMETAL-NOT: __sync
%11 = atomicrmw umin i32* %val2, i32 16 monotonic		%11 = atomicrmw umin i32* %val2, i32 16 monotonic
store i32 %11, i32* %old		store i32 %11, i32* %old
call void asm sideeffect "", "~{memory},~{dirflag},~{fpsr},~{flags}"()		call void asm sideeffect "", "~{memory},~{dirflag},~{fpsr},~{flags}"()
%uneg = sub i32 0, 1		%uneg = sub i32 0, 1
; CHECK: ldrex		; CHECK: ldrex
; CHECK: cmp		; CHECK: cmp
; CHECK: strex		; CHECK: strex
; CHECK-T1: bl ___sync_fetch_and_umin_4		; CHECK-T1: bl ___sync_fetch_and_umin_4
; CHECK-T1-M0: bl ___atomic_compare_exchange_4		; CHECK-T1-M0: bl ___sync_fetch_and_umin_4
; CHECK-BAREMETAL: cmp
; CHECK-BAREMETAL-NOT: __sync		; CHECK-BAREMETAL-NOT: __sync
%12 = atomicrmw umin i32* %val2, i32 %uneg monotonic		%12 = atomicrmw umin i32* %val2, i32 %uneg monotonic
store i32 %12, i32* %old		store i32 %12, i32* %old
call void asm sideeffect "", "~{memory},~{dirflag},~{fpsr},~{flags}"()		call void asm sideeffect "", "~{memory},~{dirflag},~{fpsr},~{flags}"()
; CHECK: ldrex		; CHECK: ldrex
; CHECK: strex		; CHECK: strex
; CHECK: cmp		; CHECK: cmp
; CHECK-T1: bl ___sync_fetch_and_umax_4		; CHECK-T1: bl ___sync_fetch_and_umax_4
; CHECK-T1-M0: bl ___atomic_compare_exchange_4		; CHECK-T1-M0: bl ___sync_fetch_and_umax_4
; CHECK-BAREMETAL: cmp
; CHECK-BAREMETAL-NOT: __sync		; CHECK-BAREMETAL-NOT: __sync
%13 = atomicrmw umax i32* %val2, i32 1 monotonic		%13 = atomicrmw umax i32* %val2, i32 1 monotonic
store i32 %13, i32* %old		store i32 %13, i32* %old
call void asm sideeffect "", "~{memory},~{dirflag},~{fpsr},~{flags}"()		call void asm sideeffect "", "~{memory},~{dirflag},~{fpsr},~{flags}"()
; CHECK: ldrex		; CHECK: ldrex
; CHECK: strex		; CHECK: strex
; CHECK: cmp		; CHECK: cmp
; CHECK-T1: bl ___sync_fetch_and_umax_4		; CHECK-T1: bl ___sync_fetch_and_umax_4
; CHECK-T1-M0: bl ___atomic_compare_exchange_4		; CHECK-T1-M0: bl ___sync_fetch_and_umax_4
; CHECK-BAREMETAL: cmp
; CHECK-BAREMETAL-NOT: __sync		; CHECK-BAREMETAL-NOT: __sync
%14 = atomicrmw umax i32* %val2, i32 0 monotonic		%14 = atomicrmw umax i32* %val2, i32 0 monotonic
store i32 %14, i32* %old		store i32 %14, i32* %old

ret void		ret void
}		}

; CHECK-LABEL: _func2:		; CHECKALL-LABEL: func2:
define void @func2() nounwind {		define void @func2() nounwind {
entry:		entry:
%val = alloca i16		%val = alloca i16
%old = alloca i16		%old = alloca i16
store i16 31, i16* %val		store i16 31, i16* %val
; CHECK: ldrex		; CHECK: ldrex
; CHECK: strex		; CHECK: strex
; CHECK: cmp		; CHECK: cmp
; CHECK-T1: bl ___sync_fetch_and_umin_2		; CHECK-T1: bl ___sync_fetch_and_umin_2
; CHECK-T1-M0: bl ___atomic_compare_exchange_2		; CHECK-T1-M0: bl ___sync_fetch_and_umin_2
; CHECK-BAREMETAL: cmp
; CHECK-BAREMETAL-NOT: __sync		; CHECK-BAREMETAL-NOT: __sync
%0 = atomicrmw umin i16* %val, i16 16 monotonic		%0 = atomicrmw umin i16* %val, i16 16 monotonic
store i16 %0, i16* %old		store i16 %0, i16* %old
%uneg = sub i16 0, 1		%uneg = sub i16 0, 1
; CHECK: ldrex		; CHECK: ldrex
; CHECK: strex		; CHECK: strex
; CHECK: cmp		; CHECK: cmp
; CHECK-T1: bl ___sync_fetch_and_umin_2		; CHECK-T1: bl ___sync_fetch_and_umin_2
; CHECK-T1-M0: bl ___atomic_compare_exchange_2		; CHECK-T1-M0: bl ___sync_fetch_and_umin_2
; CHECK-BAREMETAL: cmp
; CHECK-BAREMETAL-NOT: __sync		; CHECK-BAREMETAL-NOT: __sync
%1 = atomicrmw umin i16* %val, i16 %uneg monotonic		%1 = atomicrmw umin i16* %val, i16 %uneg monotonic
store i16 %1, i16* %old		store i16 %1, i16* %old
; CHECK: ldrex		; CHECK: ldrex
; CHECK: cmp		; CHECK: cmp
; CHECK: strex		; CHECK: strex
; CHECK-T1: bl ___sync_fetch_and_umax_2		; CHECK-T1: bl ___sync_fetch_and_umax_2
; CHECK-T1-M0: bl ___atomic_compare_exchange_2		; CHECK-T1-M0: bl ___sync_fetch_and_umax_2
; CHECK-BAREMETAL: cmp
; CHECK-BAREMETAL-NOT: __sync		; CHECK-BAREMETAL-NOT: __sync
%2 = atomicrmw umax i16* %val, i16 1 monotonic		%2 = atomicrmw umax i16* %val, i16 1 monotonic
store i16 %2, i16* %old		store i16 %2, i16* %old
; CHECK: ldrex		; CHECK: ldrex
; CHECK: strex		; CHECK: strex
; CHECK: cmp		; CHECK: cmp
; CHECK-T1: bl ___sync_fetch_and_umax_2		; CHECK-T1: bl ___sync_fetch_and_umax_2
; CHECK-T1-M0: bl ___atomic_compare_exchange_2		; CHECK-T1-M0: bl ___sync_fetch_and_umax_2
; CHECK-BAREMETAL: cmp
; CHECK-BAREMETAL-NOT: __sync		; CHECK-BAREMETAL-NOT: __sync
%3 = atomicrmw umax i16* %val, i16 0 monotonic		%3 = atomicrmw umax i16* %val, i16 0 monotonic
store i16 %3, i16* %old		store i16 %3, i16* %old
ret void		ret void
}		}

; CHECK-LABEL: _func3:		; CHECKALL-LABEL: func3:
define void @func3() nounwind {		define void @func3() nounwind {
entry:		entry:
%val = alloca i8		%val = alloca i8
%old = alloca i8		%old = alloca i8
store i8 31, i8* %val		store i8 31, i8* %val
; CHECK: ldrex		; CHECK: ldrex
; CHECK: strex		; CHECK: strex
; CHECK: cmp		; CHECK: cmp
; CHECK-T1: bl ___sync_fetch_and_umin_1		; CHECK-T1: bl ___sync_fetch_and_umin_1
; CHECK-T1-M0: bl ___atomic_compare_exchange_1		; CHECK-T1-M0: bl ___sync_fetch_and_umin_1
; CHECK-BAREMETAL: cmp
; CHECK-BAREMETAL-NOT: __sync		; CHECK-BAREMETAL-NOT: __sync
%0 = atomicrmw umin i8* %val, i8 16 monotonic		%0 = atomicrmw umin i8* %val, i8 16 monotonic
store i8 %0, i8* %old		store i8 %0, i8* %old
; CHECK: ldrex		; CHECK: ldrex
; CHECK: strex		; CHECK: strex
; CHECK: cmp		; CHECK: cmp
; CHECK-T1: bl ___sync_fetch_and_umin_1		; CHECK-T1: bl ___sync_fetch_and_umin_1
; CHECK-T1-M0: bl ___atomic_compare_exchange_1		; CHECK-T1-M0: bl ___sync_fetch_and_umin_1
; CHECK-BAREMETAL: cmp
; CHECK-BAREMETAL-NOT: __sync		; CHECK-BAREMETAL-NOT: __sync
%uneg = sub i8 0, 1		%uneg = sub i8 0, 1
%1 = atomicrmw umin i8* %val, i8 %uneg monotonic		%1 = atomicrmw umin i8* %val, i8 %uneg monotonic
store i8 %1, i8* %old		store i8 %1, i8* %old
; CHECK: ldrex		; CHECK: ldrex
; CHECK: strex		; CHECK: strex
; CHECK: cmp		; CHECK: cmp
; CHECK-T1: bl ___sync_fetch_and_umax_1		; CHECK-T1: bl ___sync_fetch_and_umax_1
; CHECK-T1-M0: bl ___atomic_compare_exchange_1		; CHECK-T1-M0: bl ___sync_fetch_and_umax_1
; CHECK-BAREMETAL: cmp
; CHECK-BAREMETAL-NOT: __sync		; CHECK-BAREMETAL-NOT: __sync
%2 = atomicrmw umax i8* %val, i8 1 monotonic		%2 = atomicrmw umax i8* %val, i8 1 monotonic
store i8 %2, i8* %old		store i8 %2, i8* %old
; CHECK: ldrex		; CHECK: ldrex
; CHECK: strex		; CHECK: strex
; CHECK: cmp		; CHECK: cmp
; CHECK-T1: bl ___sync_fetch_and_umax_1		; CHECK-T1: bl ___sync_fetch_and_umax_1
; CHECK-T1-M0: bl ___atomic_compare_exchange_1		; CHECK-T1-M0: bl ___sync_fetch_and_umax_1
; CHECK-BAREMETAL: cmp
; CHECK-BAREMETAL-NOT: __sync		; CHECK-BAREMETAL-NOT: __sync
%3 = atomicrmw umax i8* %val, i8 0 monotonic		%3 = atomicrmw umax i8* %val, i8 0 monotonic
store i8 %3, i8* %old		store i8 %3, i8* %old
ret void		ret void
}		}

; CHECK-LABEL: _func4:		; CHECKALL-LABEL: func4:
; This function should not need to use callee-saved registers.		; This function should not need to use callee-saved registers.
; rdar://problem/12203728		; rdar://problem/12203728
; CHECK-NOT: r4		; CHECK-NOT: r4
define i32 @func4(i32* %p) nounwind optsize ssp {		define i32 @func4(i32* %p) nounwind optsize ssp {
entry:		entry:
%0 = atomicrmw add i32* %p, i32 1 monotonic		%0 = atomicrmw add i32* %p, i32 1 monotonic
ret i32 %0		ret i32 %0
}		}

define i32 @test_cmpxchg_fail_order(i32 *%addr, i32 %desired, i32 %new) {		define i32 @test_cmpxchg_fail_order(i32 *%addr, i32 %desired, i32 %new) {
; CHECK-LABEL: test_cmpxchg_fail_order:		; CHECKALL-LABEL: test_cmpxchg_fail_order:

%pair = cmpxchg i32* %addr, i32 %desired, i32 %new seq_cst monotonic		%pair = cmpxchg i32* %addr, i32 %desired, i32 %new seq_cst monotonic
%oldval = extractvalue { i32, i1 } %pair, 0		%oldval = extractvalue { i32, i1 } %pair, 0
; CHECK-ARMV7: mov r[[ADDR:[0-9]+]], r0		; CHECK-ARMV7: mov r[[ADDR:[0-9]+]], r0
; CHECK-ARMV7: ldrex [[OLDVAL:r[0-9]+]], [r0]		; CHECK-ARMV7: ldrex [[OLDVAL:r[0-9]+]], [r0]
; CHECK-ARMV7: cmp [[OLDVAL]], r1		; CHECK-ARMV7: cmp [[OLDVAL]], r1
; CHECK-ARMV7: bne [[FAIL_BB:\.?LBB[0-9]+_[0-9]+]]		; CHECK-ARMV7: bne [[FAIL_BB:\.?LBB[0-9]+_[0-9]+]]
; CHECK-ARMV7: dmb ish		; CHECK-ARMV7: dmb ish
Show All 25 Lines
; CHECK-T2: cmp [[OLDVAL]], r1		; CHECK-T2: cmp [[OLDVAL]], r1
; CHECK-T2: beq [[LOOP_BB]]		; CHECK-T2: beq [[LOOP_BB]]
; CHECK-T2: clrex		; CHECK-T2: clrex

ret i32 %oldval		ret i32 %oldval
}		}

define i32 @test_cmpxchg_fail_order1(i32 *%addr, i32 %desired, i32 %new) {		define i32 @test_cmpxchg_fail_order1(i32 *%addr, i32 %desired, i32 %new) {
; CHECK-LABEL: test_cmpxchg_fail_order1:		; CHECKALL-LABEL: test_cmpxchg_fail_order1:

%pair = cmpxchg i32* %addr, i32 %desired, i32 %new acquire acquire		%pair = cmpxchg i32* %addr, i32 %desired, i32 %new acquire acquire
%oldval = extractvalue { i32, i1 } %pair, 0		%oldval = extractvalue { i32, i1 } %pair, 0
; CHECK-NOT: dmb ish		; CHECK-NOT: dmb ish
; CHECK: [[LOOP_BB:\.?LBB[0-9]+_1]]:		; CHECK: [[LOOP_BB:\.?LBB[0-9]+_1]]:
; CHECK: ldrex [[OLDVAL:r[0-9]+]], [r[[ADDR:[0-9]+]]]		; CHECK: ldrex [[OLDVAL:r[0-9]+]], [r[[ADDR:[0-9]+]]]
; CHECK: cmp [[OLDVAL]], r1		; CHECK: cmp [[OLDVAL]], r1
; CHECK: bne [[FAIL_BB:\.?LBB[0-9]+_[0-9]+]]		; CHECK: bne [[FAIL_BB:\.?LBB[0-9]+_[0-9]+]]
; CHECK: strex [[SUCCESS:r[0-9]+]], r2, [r[[ADDR]]]		; CHECK: strex [[SUCCESS:r[0-9]+]], r2, [r[[ADDR]]]
; CHECK: cmp [[SUCCESS]], #0		; CHECK: cmp [[SUCCESS]], #0
; CHECK: bne [[LOOP_BB]]		; CHECK: bne [[LOOP_BB]]
; CHECK: dmb ish		; CHECK: dmb ish
; CHECK: bx lr		; CHECK: bx lr
; CHECK: [[FAIL_BB]]:		; CHECK: [[FAIL_BB]]:
; CHECK-NEXT: clrex		; CHECK-NEXT: clrex
; CHECK: dmb ish		; CHECK: dmb ish
; CHECK: bx lr		; CHECK: bx lr

ret i32 %oldval		ret i32 %oldval
}		}

define i32 @load_load_add_acquire(i32* %mem1, i32* %mem2) nounwind {		define i32 @load_load_add_acquire(i32* %mem1, i32* %mem2) nounwind {
; CHECK-LABEL: load_load_add_acquire		; CHECKALL-LABEL: load_load_add_acquire
%val1 = load atomic i32, i32* %mem1 acquire, align 4		%val1 = load atomic i32, i32* %mem1 acquire, align 4
%val2 = load atomic i32, i32* %mem2 acquire, align 4		%val2 = load atomic i32, i32* %mem2 acquire, align 4
%tmp = add i32 %val1, %val2		%tmp = add i32 %val1, %val2

; CHECK: ldr {{r[0-9]}}, [r0]		; CHECK: ldr {{r[0-9]}}, [r0]
; CHECK: dmb		; CHECK: dmb
; CHECK: ldr {{r[0-9]}}, [r1]		; CHECK: ldr {{r[0-9]}}, [r1]
; CHECK: dmb		; CHECK: dmb
; CHECK: add r0,		; CHECK: add r0,

; CHECK-T1-M0: __atomic_load_4		; CHECK-T1-M0: ldr {{r[0-9]}}, [r0]
; CHECK-T1-M0: __atomic_load_4		; CHECK-T1-M0: dmb
		; CHECK-T1-M0: ldr {{r[0-9]}}, [r1]
		; CHECK-T1-M0: adds r0,
		; CHECK-T1-M0: dmb

; CHECK-T1: ___sync_val_compare_and_swap_4		; CHECK-T1: ___sync_val_compare_and_swap_4
; CHECK-T1: ___sync_val_compare_and_swap_4		; CHECK-T1: ___sync_val_compare_and_swap_4

; CHECK-BAREMETAL: ldr {{r[0-9]}}, [r0]
; CHECK-BAREMETAL-NOT: dmb
; CHECK-BAREMETAL: ldr {{r[0-9]}}, [r1]		; CHECK-BAREMETAL: ldr {{r[0-9]}}, [r1]
; CHECK-BAREMETAL-NOT: dmb		; CHECK-BAREMETAL-NOT: dmb
		; CHECK-BAREMETAL: ldr {{r[0-9]}}, [r0]
		; CHECK-BAREMETAL-NOT: dmb
; CHECK-BAREMETAL: add r0,		; CHECK-BAREMETAL: add r0,

ret i32 %tmp		ret i32 %tmp
}		}

define void @store_store_release(i32* %mem1, i32 %val1, i32* %mem2, i32 %val2) {		define void @store_store_release(i32* %mem1, i32 %val1, i32* %mem2, i32 %val2) {
; CHECK-LABEL: store_store_release		; CHECKALL-LABEL: store_store_release
store atomic i32 %val1, i32* %mem1 release, align 4		store atomic i32 %val1, i32* %mem1 release, align 4
store atomic i32 %val2, i32* %mem2 release, align 4		store atomic i32 %val2, i32* %mem2 release, align 4

; CHECK: dmb		; CHECK: dmb
; CHECK: str r1, [r0]		; CHECK: str r1, [r0]
; CHECK: dmb		; CHECK: dmb
; CHECK: str r3, [r2]		; CHECK: str r3, [r2]

; CHECK-T1: ___sync_lock_test_and_set		; CHECK-T1: ___sync_lock_test_and_set
; CHECK-T1: ___sync_lock_test_and_set		; CHECK-T1: ___sync_lock_test_and_set

; CHECK-T1-M0: __atomic_store_4		; CHECK-T1-M0: dmb
; CHECK-T1-M0: __atomic_store_4		; CHECK-T1-M0: str r1, [r0]
		; CHECK-T1-M0: dmb
		; CHECK-T1-M0: str r3, [r2]

; CHECK-BAREMETAL-NOT: dmb		; CHECK-BAREMETAL-NOT: dmb
; CHECK-BAREMETAL: str r1, [r0]		; CHECK-BAREMETAL: str r1, [r0]
; CHECK-BAREMETAL-NOT: dmb		; CHECK-BAREMETAL-NOT: dmb
; CHECK-BAREMETAL: str r3, [r2]		; CHECK-BAREMETAL: str r3, [r2]

ret void		ret void
}		}

define void @load_fence_store_monotonic(i32* %mem1, i32* %mem2) {		define void @load_fence_store_monotonic(i32* %mem1, i32* %mem2) {
; CHECK-LABEL: load_fence_store_monotonic		; CHECKALL-LABEL: load_fence_store_monotonic
%val = load atomic i32, i32* %mem1 monotonic, align 4		%val = load atomic i32, i32* %mem1 monotonic, align 4
fence seq_cst		fence seq_cst
store atomic i32 %val, i32* %mem2 monotonic, align 4		store atomic i32 %val, i32* %mem2 monotonic, align 4

; CHECK: ldr [[R0:r[0-9]]], [r0]		; CHECK: ldr [[R0:r[0-9]]], [r0]
; CHECK: dmb		; CHECK: dmb
; CHECK: str [[R0]], [r1]		; CHECK: str [[R0]], [r1]

; CHECK-T1-M0: __atomic_load_4		; CHECK-T1-M0: ldr [[R0:r[0-9]]], [{{r[0-9]+}}]
; CHECK-T1-M0: dmb		; CHECK-T1-M0: dmb
; CHECK-T1-M0: __atomic_store_4		; CHECK-T1-M0: str [[R0]], [{{r[0-9]+}}]

; CHECK-T1: ldr [[R0:r[0-9]]], [{{r[0-9]+}}]		; CHECK-T1: ldr [[R0:r[0-9]]], [{{r[0-9]+}}]
; CHECK-T1: {{dmb\|bl ___sync_synchronize}}		; CHECK-T1: {{dmb\|bl ___sync_synchronize}}
; CHECK-T1: str [[R0]], [{{r[0-9]+}}]		; CHECK-T1: str [[R0]], [{{r[0-9]+}}]

; CHECK-BAREMETAL: ldr [[R0:r[0-9]]], [r0]		; CHECK-BAREMETAL: ldr [[R0:r[0-9]]], [r0]
; CHECK-BAREMETAL-NOT: dmb		; CHECK-BAREMETAL-NOT: dmb
; CHECK-BAREMETAL: str [[R0]], [r1]		; CHECK-BAREMETAL: str [[R0]], [r1]

ret void		ret void
}		}

llvm/test/CodeGen/ARM/thumbv6m-atomic32.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc -mtriple=thumbv6m-none-eabi < %s \| FileCheck %s --check-prefixes=CHECK,NO-ATOMIC32			; RUN: llc -mtriple=thumbv6m-none-eabi < %s \| FileCheck %s --check-prefixes=CHECK,NO-ATOMIC32
	; RUN: llc -mtriple=thumbv6m-none-eabi -mattr=+atomics-32 < %s \| FileCheck %s --check-prefixes=CHECK,ATOMIC32			; RUN: llc -mtriple=thumbv6m-none-eabi -mattr=+atomics-32 < %s \| FileCheck %s --check-prefixes=CHECK,ATOMIC32

	define i8 @load8(ptr %p) {			define i8 @load8(ptr %p) {
	; NO-ATOMIC32-LABEL: load8:			; CHECK-LABEL: load8:
	; NO-ATOMIC32: @ %bb.0:			; CHECK: @ %bb.0:
	; NO-ATOMIC32-NEXT: .save {r7, lr}			; CHECK-NEXT: ldrb r0, [r0]
	; NO-ATOMIC32-NEXT: push {r7, lr}			; CHECK-NEXT: dmb sy
	; NO-ATOMIC32-NEXT: movs r1, #5			; CHECK-NEXT: bx lr
	; NO-ATOMIC32-NEXT: bl __atomic_load_1
	; NO-ATOMIC32-NEXT: pop {r7, pc}
	;
	; ATOMIC32-LABEL: load8:
	; ATOMIC32: @ %bb.0:
	; ATOMIC32-NEXT: ldrb r0, [r0]
	; ATOMIC32-NEXT: dmb sy
	; ATOMIC32-NEXT: bx lr
	%v = load atomic i8, ptr %p seq_cst, align 1			%v = load atomic i8, ptr %p seq_cst, align 1
	ret i8 %v			ret i8 %v
	}			}

	define void @store8(ptr %p) {			define void @store8(ptr %p) {
	; NO-ATOMIC32-LABEL: store8:			; CHECK-LABEL: store8:
	; NO-ATOMIC32: @ %bb.0:			; CHECK: @ %bb.0:
	; NO-ATOMIC32-NEXT: .save {r7, lr}			; CHECK-NEXT: dmb sy
	; NO-ATOMIC32-NEXT: push {r7, lr}			; CHECK-NEXT: movs r1, #0
	; NO-ATOMIC32-NEXT: movs r1, #0			; CHECK-NEXT: strb r1, [r0]
	; NO-ATOMIC32-NEXT: movs r2, #5			; CHECK-NEXT: dmb sy
	; NO-ATOMIC32-NEXT: bl __atomic_store_1			; CHECK-NEXT: bx lr
	; NO-ATOMIC32-NEXT: pop {r7, pc}
	;
	; ATOMIC32-LABEL: store8:
	; ATOMIC32: @ %bb.0:
	; ATOMIC32-NEXT: dmb sy
	; ATOMIC32-NEXT: movs r1, #0
	; ATOMIC32-NEXT: strb r1, [r0]
	; ATOMIC32-NEXT: dmb sy
	; ATOMIC32-NEXT: bx lr
	store atomic i8 0, ptr %p seq_cst, align 1			store atomic i8 0, ptr %p seq_cst, align 1
	ret void			ret void
	}			}

	define i8 @rmw8(ptr %p) {			define i8 @rmw8(ptr %p) {
	; NO-ATOMIC32-LABEL: rmw8:			; CHECK-LABEL: rmw8:
	; NO-ATOMIC32: @ %bb.0:			; CHECK: @ %bb.0:
	; NO-ATOMIC32-NEXT: .save {r7, lr}			; CHECK-NEXT: .save {r7, lr}
	; NO-ATOMIC32-NEXT: push {r7, lr}			; CHECK-NEXT: push {r7, lr}
	; NO-ATOMIC32-NEXT: movs r1, #1			; CHECK-NEXT: dmb sy
	; NO-ATOMIC32-NEXT: movs r2, #5			; CHECK-NEXT: movs r1, #1
	; NO-ATOMIC32-NEXT: bl __atomic_fetch_add_1			; CHECK-NEXT: bl __sync_fetch_and_add_1
	; NO-ATOMIC32-NEXT: pop {r7, pc}			; CHECK-NEXT: dmb sy
	;			; CHECK-NEXT: pop {r7, pc}
	; ATOMIC32-LABEL: rmw8:
	; ATOMIC32: @ %bb.0:
	; ATOMIC32-NEXT: .save {r7, lr}
	; ATOMIC32-NEXT: push {r7, lr}
	; ATOMIC32-NEXT: dmb sy
	; ATOMIC32-NEXT: movs r1, #1
	; ATOMIC32-NEXT: bl __sync_fetch_and_add_1
	; ATOMIC32-NEXT: dmb sy
	; ATOMIC32-NEXT: pop {r7, pc}
	%v = atomicrmw add ptr %p, i8 1 seq_cst, align 1			%v = atomicrmw add ptr %p, i8 1 seq_cst, align 1
	ret i8 %v			ret i8 %v
	}			}

	define i8 @cmpxchg8(ptr %p) {			define i8 @cmpxchg8(ptr %p) {
	; NO-ATOMIC32-LABEL: cmpxchg8:			; CHECK-LABEL: cmpxchg8:
	; NO-ATOMIC32: @ %bb.0:			; CHECK: @ %bb.0:
	; NO-ATOMIC32-NEXT: .save {r7, lr}			; CHECK-NEXT: .save {r7, lr}
	; NO-ATOMIC32-NEXT: push {r7, lr}			; CHECK-NEXT: push {r7, lr}
	; NO-ATOMIC32-NEXT: .pad #8			; CHECK-NEXT: dmb sy
	; NO-ATOMIC32-NEXT: sub sp, #8			; CHECK-NEXT: movs r1, #0
	; NO-ATOMIC32-NEXT: add r1, sp, #4			; CHECK-NEXT: movs r2, #1
	; NO-ATOMIC32-NEXT: movs r2, #0			; CHECK-NEXT: bl __sync_val_compare_and_swap_1
	; NO-ATOMIC32-NEXT: strb r2, [r1]			; CHECK-NEXT: dmb sy
	; NO-ATOMIC32-NEXT: movs r3, #5			; CHECK-NEXT: pop {r7, pc}
	; NO-ATOMIC32-NEXT: str r3, [sp]
	; NO-ATOMIC32-NEXT: movs r2, #1
	; NO-ATOMIC32-NEXT: bl __atomic_compare_exchange_1
	; NO-ATOMIC32-NEXT: ldr r0, [sp, #4]
	; NO-ATOMIC32-NEXT: add sp, #8
	; NO-ATOMIC32-NEXT: pop {r7, pc}
	;
	; ATOMIC32-LABEL: cmpxchg8:
	; ATOMIC32: @ %bb.0:
	; ATOMIC32-NEXT: .save {r7, lr}
	; ATOMIC32-NEXT: push {r7, lr}
	; ATOMIC32-NEXT: dmb sy
	; ATOMIC32-NEXT: movs r1, #0
	; ATOMIC32-NEXT: movs r2, #1
	; ATOMIC32-NEXT: bl __sync_val_compare_and_swap_1
	; ATOMIC32-NEXT: dmb sy
	; ATOMIC32-NEXT: pop {r7, pc}
	%res = cmpxchg ptr %p, i8 0, i8 1 seq_cst seq_cst			%res = cmpxchg ptr %p, i8 0, i8 1 seq_cst seq_cst
	%res.0 = extractvalue { i8, i1 } %res, 0			%res.0 = extractvalue { i8, i1 } %res, 0
	ret i8 %res.0			ret i8 %res.0
	}			}

	define i16 @load16(ptr %p) {			define i16 @load16(ptr %p) {
	; NO-ATOMIC32-LABEL: load16:			; CHECK-LABEL: load16:
	; NO-ATOMIC32: @ %bb.0:			; CHECK: @ %bb.0:
	; NO-ATOMIC32-NEXT: .save {r7, lr}			; CHECK-NEXT: ldrh r0, [r0]
	; NO-ATOMIC32-NEXT: push {r7, lr}			; CHECK-NEXT: dmb sy
	; NO-ATOMIC32-NEXT: movs r1, #5			; CHECK-NEXT: bx lr
	; NO-ATOMIC32-NEXT: bl __atomic_load_2
	; NO-ATOMIC32-NEXT: pop {r7, pc}
	;
	; ATOMIC32-LABEL: load16:
	; ATOMIC32: @ %bb.0:
	; ATOMIC32-NEXT: ldrh r0, [r0]
	; ATOMIC32-NEXT: dmb sy
	; ATOMIC32-NEXT: bx lr
	%v = load atomic i16, ptr %p seq_cst, align 2			%v = load atomic i16, ptr %p seq_cst, align 2
	ret i16 %v			ret i16 %v
	}			}

	define void @store16(ptr %p) {			define void @store16(ptr %p) {
	; NO-ATOMIC32-LABEL: store16:			; CHECK-LABEL: store16:
	; NO-ATOMIC32: @ %bb.0:			; CHECK: @ %bb.0:
	; NO-ATOMIC32-NEXT: .save {r7, lr}			; CHECK-NEXT: dmb sy
	; NO-ATOMIC32-NEXT: push {r7, lr}			; CHECK-NEXT: movs r1, #0
	; NO-ATOMIC32-NEXT: movs r1, #0			; CHECK-NEXT: strh r1, [r0]
	; NO-ATOMIC32-NEXT: movs r2, #5			; CHECK-NEXT: dmb sy
	; NO-ATOMIC32-NEXT: bl __atomic_store_2			; CHECK-NEXT: bx lr
	; NO-ATOMIC32-NEXT: pop {r7, pc}
	;
	; ATOMIC32-LABEL: store16:
	; ATOMIC32: @ %bb.0:
	; ATOMIC32-NEXT: dmb sy
	; ATOMIC32-NEXT: movs r1, #0
	; ATOMIC32-NEXT: strh r1, [r0]
	; ATOMIC32-NEXT: dmb sy
	; ATOMIC32-NEXT: bx lr
	store atomic i16 0, ptr %p seq_cst, align 2			store atomic i16 0, ptr %p seq_cst, align 2
	ret void			ret void
	}			}

	define i16 @rmw16(ptr %p) {			define i16 @rmw16(ptr %p) {
	; NO-ATOMIC32-LABEL: rmw16:			; CHECK-LABEL: rmw16:
	; NO-ATOMIC32: @ %bb.0:			; CHECK: @ %bb.0:
	; NO-ATOMIC32-NEXT: .save {r7, lr}			; CHECK-NEXT: .save {r7, lr}
	; NO-ATOMIC32-NEXT: push {r7, lr}			; CHECK-NEXT: push {r7, lr}
	; NO-ATOMIC32-NEXT: movs r1, #1			; CHECK-NEXT: dmb sy
	; NO-ATOMIC32-NEXT: movs r2, #5			; CHECK-NEXT: movs r1, #1
	; NO-ATOMIC32-NEXT: bl __atomic_fetch_add_2			; CHECK-NEXT: bl __sync_fetch_and_add_2
	; NO-ATOMIC32-NEXT: pop {r7, pc}			; CHECK-NEXT: dmb sy
	;			; CHECK-NEXT: pop {r7, pc}
	; ATOMIC32-LABEL: rmw16:
	; ATOMIC32: @ %bb.0:
	; ATOMIC32-NEXT: .save {r7, lr}
	; ATOMIC32-NEXT: push {r7, lr}
	; ATOMIC32-NEXT: dmb sy
	; ATOMIC32-NEXT: movs r1, #1
	; ATOMIC32-NEXT: bl __sync_fetch_and_add_2
	; ATOMIC32-NEXT: dmb sy
	; ATOMIC32-NEXT: pop {r7, pc}
	%v = atomicrmw add ptr %p, i16 1 seq_cst, align 2			%v = atomicrmw add ptr %p, i16 1 seq_cst, align 2
	ret i16 %v			ret i16 %v
	}			}

	define i16 @cmpxchg16(ptr %p) {			define i16 @cmpxchg16(ptr %p) {
	; NO-ATOMIC32-LABEL: cmpxchg16:			; CHECK-LABEL: cmpxchg16:
	; NO-ATOMIC32: @ %bb.0:			; CHECK: @ %bb.0:
	; NO-ATOMIC32-NEXT: .save {r7, lr}			; CHECK-NEXT: .save {r7, lr}
	; NO-ATOMIC32-NEXT: push {r7, lr}			; CHECK-NEXT: push {r7, lr}
	; NO-ATOMIC32-NEXT: .pad #8			; CHECK-NEXT: dmb sy
	; NO-ATOMIC32-NEXT: sub sp, #8			; CHECK-NEXT: movs r1, #0
	; NO-ATOMIC32-NEXT: add r1, sp, #4			; CHECK-NEXT: movs r2, #1
	; NO-ATOMIC32-NEXT: movs r2, #0			; CHECK-NEXT: bl __sync_val_compare_and_swap_2
	; NO-ATOMIC32-NEXT: strh r2, [r1]			; CHECK-NEXT: dmb sy
	; NO-ATOMIC32-NEXT: movs r3, #5			; CHECK-NEXT: pop {r7, pc}
	; NO-ATOMIC32-NEXT: str r3, [sp]
	; NO-ATOMIC32-NEXT: movs r2, #1
	; NO-ATOMIC32-NEXT: bl __atomic_compare_exchange_2
	; NO-ATOMIC32-NEXT: ldr r0, [sp, #4]
	; NO-ATOMIC32-NEXT: add sp, #8
	; NO-ATOMIC32-NEXT: pop {r7, pc}
	;
	; ATOMIC32-LABEL: cmpxchg16:
	; ATOMIC32: @ %bb.0:
	; ATOMIC32-NEXT: .save {r7, lr}
	; ATOMIC32-NEXT: push {r7, lr}
	; ATOMIC32-NEXT: dmb sy
	; ATOMIC32-NEXT: movs r1, #0
	; ATOMIC32-NEXT: movs r2, #1
	; ATOMIC32-NEXT: bl __sync_val_compare_and_swap_2
	; ATOMIC32-NEXT: dmb sy
	; ATOMIC32-NEXT: pop {r7, pc}
	%res = cmpxchg ptr %p, i16 0, i16 1 seq_cst seq_cst			%res = cmpxchg ptr %p, i16 0, i16 1 seq_cst seq_cst
	%res.0 = extractvalue { i16, i1 } %res, 0			%res.0 = extractvalue { i16, i1 } %res, 0
	ret i16 %res.0			ret i16 %res.0
	}			}

	define i32 @load32(ptr %p) {			define i32 @load32(ptr %p) {
	; NO-ATOMIC32-LABEL: load32:			; CHECK-LABEL: load32:
	; NO-ATOMIC32: @ %bb.0:			; CHECK: @ %bb.0:
	; NO-ATOMIC32-NEXT: .save {r7, lr}			; CHECK-NEXT: ldr r0, [r0]
	; NO-ATOMIC32-NEXT: push {r7, lr}			; CHECK-NEXT: dmb sy
	; NO-ATOMIC32-NEXT: movs r1, #5			; CHECK-NEXT: bx lr
	; NO-ATOMIC32-NEXT: bl __atomic_load_4
	; NO-ATOMIC32-NEXT: pop {r7, pc}
	;
	; ATOMIC32-LABEL: load32:
	; ATOMIC32: @ %bb.0:
	; ATOMIC32-NEXT: ldr r0, [r0]
	; ATOMIC32-NEXT: dmb sy
	; ATOMIC32-NEXT: bx lr
	%v = load atomic i32, ptr %p seq_cst, align 4			%v = load atomic i32, ptr %p seq_cst, align 4
	ret i32 %v			ret i32 %v
	}			}

	define void @store32(ptr %p) {			define void @store32(ptr %p) {
	; NO-ATOMIC32-LABEL: store32:			; CHECK-LABEL: store32:
	; NO-ATOMIC32: @ %bb.0:			; CHECK: @ %bb.0:
	; NO-ATOMIC32-NEXT: .save {r7, lr}			; CHECK-NEXT: dmb sy
	; NO-ATOMIC32-NEXT: push {r7, lr}			; CHECK-NEXT: movs r1, #0
	; NO-ATOMIC32-NEXT: movs r1, #0			; CHECK-NEXT: str r1, [r0]
	; NO-ATOMIC32-NEXT: movs r2, #5			; CHECK-NEXT: dmb sy
	; NO-ATOMIC32-NEXT: bl __atomic_store_4			; CHECK-NEXT: bx lr
	; NO-ATOMIC32-NEXT: pop {r7, pc}
	;
	; ATOMIC32-LABEL: store32:
	; ATOMIC32: @ %bb.0:
	; ATOMIC32-NEXT: dmb sy
	; ATOMIC32-NEXT: movs r1, #0
	; ATOMIC32-NEXT: str r1, [r0]
	; ATOMIC32-NEXT: dmb sy
	; ATOMIC32-NEXT: bx lr
	store atomic i32 0, ptr %p seq_cst, align 4			store atomic i32 0, ptr %p seq_cst, align 4
	ret void			ret void
	}			}

	define i32 @rmw32(ptr %p) {			define i32 @rmw32(ptr %p) {
	; NO-ATOMIC32-LABEL: rmw32:			; CHECK-LABEL: rmw32:
	; NO-ATOMIC32: @ %bb.0:			; CHECK: @ %bb.0:
	; NO-ATOMIC32-NEXT: .save {r7, lr}			; CHECK-NEXT: .save {r7, lr}
	; NO-ATOMIC32-NEXT: push {r7, lr}			; CHECK-NEXT: push {r7, lr}
	; NO-ATOMIC32-NEXT: movs r1, #1			; CHECK-NEXT: dmb sy
	; NO-ATOMIC32-NEXT: movs r2, #5			; CHECK-NEXT: movs r1, #1
	; NO-ATOMIC32-NEXT: bl __atomic_fetch_add_4			; CHECK-NEXT: bl __sync_fetch_and_add_4
	; NO-ATOMIC32-NEXT: pop {r7, pc}			; CHECK-NEXT: dmb sy
	;			; CHECK-NEXT: pop {r7, pc}
	; ATOMIC32-LABEL: rmw32:
	; ATOMIC32: @ %bb.0:
	; ATOMIC32-NEXT: .save {r7, lr}
	; ATOMIC32-NEXT: push {r7, lr}
	; ATOMIC32-NEXT: dmb sy
	; ATOMIC32-NEXT: movs r1, #1
	; ATOMIC32-NEXT: bl __sync_fetch_and_add_4
	; ATOMIC32-NEXT: dmb sy
	; ATOMIC32-NEXT: pop {r7, pc}
	%v = atomicrmw add ptr %p, i32 1 seq_cst, align 4			%v = atomicrmw add ptr %p, i32 1 seq_cst, align 4
	ret i32 %v			ret i32 %v
	}			}

	define i32 @cmpxchg32(ptr %p) {			define i32 @cmpxchg32(ptr %p) {
	; NO-ATOMIC32-LABEL: cmpxchg32:			; CHECK-LABEL: cmpxchg32:
	; NO-ATOMIC32: @ %bb.0:			; CHECK: @ %bb.0:
	; NO-ATOMIC32-NEXT: .save {r7, lr}			; CHECK-NEXT: .save {r7, lr}
	; NO-ATOMIC32-NEXT: push {r7, lr}			; CHECK-NEXT: push {r7, lr}
	; NO-ATOMIC32-NEXT: .pad #8			; CHECK-NEXT: dmb sy
	; NO-ATOMIC32-NEXT: sub sp, #8			; CHECK-NEXT: movs r1, #0
	; NO-ATOMIC32-NEXT: movs r1, #0			; CHECK-NEXT: movs r2, #1
	; NO-ATOMIC32-NEXT: str r1, [sp, #4]			; CHECK-NEXT: bl __sync_val_compare_and_swap_4
	; NO-ATOMIC32-NEXT: movs r3, #5			; CHECK-NEXT: dmb sy
	; NO-ATOMIC32-NEXT: str r3, [sp]			; CHECK-NEXT: pop {r7, pc}
	; NO-ATOMIC32-NEXT: add r1, sp, #4
	; NO-ATOMIC32-NEXT: movs r2, #1
	; NO-ATOMIC32-NEXT: bl __atomic_compare_exchange_4
	; NO-ATOMIC32-NEXT: ldr r0, [sp, #4]
	; NO-ATOMIC32-NEXT: add sp, #8
	; NO-ATOMIC32-NEXT: pop {r7, pc}
	;
	; ATOMIC32-LABEL: cmpxchg32:
	; ATOMIC32: @ %bb.0:
	; ATOMIC32-NEXT: .save {r7, lr}
	; ATOMIC32-NEXT: push {r7, lr}
	; ATOMIC32-NEXT: dmb sy
	; ATOMIC32-NEXT: movs r1, #0
	; ATOMIC32-NEXT: movs r2, #1
	; ATOMIC32-NEXT: bl __sync_val_compare_and_swap_4
	; ATOMIC32-NEXT: dmb sy
	; ATOMIC32-NEXT: pop {r7, pc}
	%res = cmpxchg ptr %p, i32 0, i32 1 seq_cst seq_cst			%res = cmpxchg ptr %p, i32 0, i32 1 seq_cst seq_cst
	%res.0 = extractvalue { i32, i1 } %res, 0			%res.0 = extractvalue { i32, i1 } %res, 0
	ret i32 %res.0			ret i32 %res.0
	}			}

	define i64 @load64(ptr %p) {			define i64 @load64(ptr %p) {
	; CHECK-LABEL: load64:			; CHECK-LABEL: load64:
	; CHECK: @ %bb.0:			; CHECK: @ %bb.0:
	▲ Show 20 Lines • Show All 61 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: ldr r1, [sp, #12]			; CHECK-NEXT: ldr r1, [sp, #12]
	; CHECK-NEXT: ldr r0, [sp, #8]			; CHECK-NEXT: ldr r0, [sp, #8]
	; CHECK-NEXT: add sp, #16			; CHECK-NEXT: add sp, #16
	; CHECK-NEXT: pop {r7, pc}			; CHECK-NEXT: pop {r7, pc}
	%res = cmpxchg ptr %p, i64 0, i64 1 seq_cst seq_cst			%res = cmpxchg ptr %p, i64 0, i64 1 seq_cst seq_cst
	%res.0 = extractvalue { i64, i1 } %res, 0			%res.0 = extractvalue { i64, i1 } %res, 0
	ret i64 %res.0			ret i64 %res.0
	}			}
				;; NOTE: These prefixes are unused and the list is autogenerated. Do not add tests below this line:
				; ATOMIC32: {{.*}}
				; NO-ATOMIC32: {{.*}}

This is an archive of the discontinued LLVM Phabricator instance.

[ARM] Pretend atomics are always lock-free for small widths.Needs ReviewPublic

Details

Diff Detail

Unit TestsFailed

Event Timeline

Revision Contents

Diff 475263

clang/lib/Basic/Targets/ARM.cpp

clang/test/CodeGen/arm-atomics-m0.c

clang/test/CodeGen/atomic-ops-libcall.c

clang/test/CodeGen/atomics-inlining.c

clang/test/CodeGen/c11atomics.c

clang/test/CodeGen/pr45476.cpp

clang/test/CodeGenCXX/threadsafe-statics-no-atomic.cpp

clang/test/CodeGenOpenCL/atomic-ops-libcall.cl

llvm/lib/Target/ARM/ARMISelLowering.cpp

llvm/test/CodeGen/ARM/atomic-64bit.ll

llvm/test/CodeGen/ARM/atomic-load-store.ll

llvm/test/CodeGen/ARM/atomic-op.ll

llvm/test/CodeGen/ARM/thumbv6m-atomic32.ll

[ARM] Pretend atomics are always lock-free for small widths.
Needs ReviewPublic