This is an archive of the discontinued LLVM Phabricator instance.

ARM: Set MaxAtomicSizeInBitsSupported appropriately.
Needs ReviewPublic

Authored by jyknight on Mar 4 2021, 2:30 PM.

Download Raw Diff

Details

Reviewers

t.p.northover
jfb

Summary

This will result in larger atomic operations getting expanded to
__atomic_* libcalls via AtomicExpandPass. This is a part of a change
to similarly clean up atomics handling on all targets.

When ldrex is available, we can support lock-free atomics up to 32
bits. When ldrexd is available, 64 bits.

When neither are available, we can still support up to 32-bit
lock-free atomics on certain platforms, if they provide
kernel-assisted cmpxchg. In that case, we can emit native 32-bit loads
and stores, and emit rmw/cmpxchg via __sync_* libcalls. 64-bit atomics
are not supported similarly, because 64-bit loads/stores aren't
atomic.

Finally, refactor/simplify the remainder of the code, which no longer
needs to try to deal with oversized atomics.

Diff Detail

Repository: rG LLVM Github Monorepo

Event Timeline

jyknight created this revision.Mar 4 2021, 2:30 PM

Herald added a reviewer: jfb. · View Herald TranscriptMar 4 2021, 2:30 PM

Herald added subscribers: jfb, hiraditya, kristof.beyls. · View Herald Transcript

jyknight requested review of this revision.Mar 4 2021, 2:30 PM

Herald added a project: Restricted Project. · View Herald TranscriptMar 4 2021, 2:30 PM

Herald added a subscriber: llvm-commits. · View Herald Transcript

Version where tests actually pass: I forgot to merge a fixup commit before uploading.

Harbormaster completed remote builds in B92163: Diff 328313.Mar 5 2021, 7:48 AM

Harbormaster completed remote builds in B92171: Diff 328324.Mar 5 2021, 8:37 AM

Revision Contents

Path

Size

llvm/

lib/

Target/

ARM/

4 lines

197 lines

13 lines

2 lines

test/

CodeGen/

ARM/

77 lines

66 lines

12 lines

2 lines

Diff 328324

llvm/lib/Target/ARM/ARMISelLowering.h

Show First 20 Lines • Show All 710 Lines • ▼ Show 20 Lines	private:

const TargetRegisterInfo *RegInfo;		const TargetRegisterInfo *RegInfo;

const InstrItineraryData *Itins;		const InstrItineraryData *Itins;

/// ARMPCLabelIndex - Keep track of the number of ARM PC labels created.		/// ARMPCLabelIndex - Keep track of the number of ARM PC labels created.
unsigned ARMPCLabelIndex;		unsigned ARMPCLabelIndex;

// TODO: remove this, and have shouldInsertFencesForAtomic do the proper
// check.
bool InsertFencesForAtomic;

bool HasStandaloneRem = true;		bool HasStandaloneRem = true;

void addTypeForNEON(MVT VT, MVT PromotedLdStVT, MVT PromotedBitwiseVT);		void addTypeForNEON(MVT VT, MVT PromotedLdStVT, MVT PromotedBitwiseVT);
void addDRTypeForNEON(MVT VT);		void addDRTypeForNEON(MVT VT);
void addQRTypeForNEON(MVT VT);		void addQRTypeForNEON(MVT VT);
std::pair<SDValue, SDValue> getARMXALUOOp(SDValue Op, SelectionDAG &DAG, SDValue &ARMcc) const;		std::pair<SDValue, SDValue> getARMXALUOOp(SDValue Op, SelectionDAG &DAG, SDValue &ARMcc) const;

using RegsToPassVector = SmallVector<std::pair<unsigned, SDValue>, 8>;		using RegsToPassVector = SmallVector<std::pair<unsigned, SDValue>, 8>;
▲ Show 20 Lines • Show All 223 Lines • Show Last 20 Lines

llvm/lib/Target/ARM/ARMISelLowering.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 147 Lines • ▼ Show 20 Lines	MVEMaxSupportedInterleaveFactor("mve-max-interleave-factor", cl::Hidden,
cl::desc("Maximum interleave factor for MVE VLDn to generate."),		cl::desc("Maximum interleave factor for MVE VLDn to generate."),
cl::init(2));		cl::init(2));

// The APCS parameter registers.		// The APCS parameter registers.
static const MCPhysReg GPRArgRegs[] = {		static const MCPhysReg GPRArgRegs[] = {
ARM::R0, ARM::R1, ARM::R2, ARM::R3		ARM::R0, ARM::R1, ARM::R2, ARM::R3
};		};

		// Prior to ARMv6, there were no LL/SC instructions available, which in general
		// means that lock-free atomics can't be supported. However, on some OSes,
		// kernel assistance to implement a cmpxchg operation is provided (e.g. via
		// "Restartable Atomic Sequence" on FreeBSD, or the kuser_cmpxchg function on
		// Linux). On such OSes, we can assume functioning of lock-free __sync_* atomic
		// libcalls, regardless of the target CPU.
		static bool hasLockFreeCmpXChgHelpers(const ARMSubtarget &Subtarget) {
		return (Subtarget.isTargetDarwin() \|\| Subtarget.isTargetLinux() \|\|
		Subtarget.isTargetFreeBSD() \|\| Subtarget.isTargetNetBSD());
		}

void ARMTargetLowering::addTypeForNEON(MVT VT, MVT PromotedLdStVT,		void ARMTargetLowering::addTypeForNEON(MVT VT, MVT PromotedLdStVT,
MVT PromotedBitwiseVT) {		MVT PromotedBitwiseVT) {
if (VT != PromotedLdStVT) {		if (VT != PromotedLdStVT) {
setOperationAction(ISD::LOAD, VT, Promote);		setOperationAction(ISD::LOAD, VT, Promote);
AddPromotedToType (ISD::LOAD, VT, PromotedLdStVT);		AddPromotedToType (ISD::LOAD, VT, PromotedLdStVT);

setOperationAction(ISD::STORE, VT, Promote);		setOperationAction(ISD::STORE, VT, Promote);
AddPromotedToType (ISD::STORE, VT, PromotedLdStVT);		AddPromotedToType (ISD::STORE, VT, PromotedLdStVT);
▲ Show 20 Lines • Show All 1,110 Lines • ▼ Show 20 Lines	ARMTargetLowering::ARMTargetLowering(const TargetMachine &TM,
setOperationAction(ISD::STACKSAVE, MVT::Other, Expand);		setOperationAction(ISD::STACKSAVE, MVT::Other, Expand);
setOperationAction(ISD::STACKRESTORE, MVT::Other, Expand);		setOperationAction(ISD::STACKRESTORE, MVT::Other, Expand);

if (Subtarget->isTargetWindows())		if (Subtarget->isTargetWindows())
setOperationAction(ISD::DYNAMIC_STACKALLOC, MVT::i32, Custom);		setOperationAction(ISD::DYNAMIC_STACKALLOC, MVT::i32, Custom);
else		else
setOperationAction(ISD::DYNAMIC_STACKALLOC, MVT::i32, Expand);		setOperationAction(ISD::DYNAMIC_STACKALLOC, MVT::i32, Expand);

// ARMv6 Thumb1 (except for CPUs that support dmb / dsb) and earlier use		if (Subtarget->hasLdrex()) {
// the default expansion.		// If we have ldrex, we can support native atomics. And with ldrexd, 64bit
InsertFencesForAtomic = false;		// atomics.
if (Subtarget->hasAnyDataBarrier() &&		if (Subtarget->hasLdrexd()) {
(!Subtarget->isThumb() \|\| Subtarget->hasV8MBaselineOps())) {		setMaxAtomicSizeInBitsSupported(64);
// ATOMIC_FENCE needs custom lowering; the others should have been expanded
// to ldrex/strex loops already.
setOperationAction(ISD::ATOMIC_FENCE, MVT::Other, Custom);
if (!Subtarget->isThumb() \|\| !Subtarget->isMClass())
setOperationAction(ISD::ATOMIC_CMP_SWAP, MVT::i64, Custom);		setOperationAction(ISD::ATOMIC_CMP_SWAP, MVT::i64, Custom);
		} else
		setMaxAtomicSizeInBitsSupported(32);
		} else if (hasLockFreeCmpXChgHelpers(*Subtarget)) {
		// If we're on an OS which provide kernel assistance (exposed via lock-free
		// __sync_* libcalls), we can emit 32-bit atomic loads/stores directly, and
		// depend on the __sync_ calls for the other operations. We don't support
		// 64-bit in this way, because the 64-bit load/store instructions are not
		// (always) atomic.

// On v8, we have particularly efficient implementations of atomic fences		setMaxAtomicSizeInBitsSupported(32);
// if they can be combined with nearby atomic loads and stores.
if (!Subtarget->hasAcquireRelease() \|\|
getTargetMachine().getOptLevel() == 0) {
// Automatically insert fences (dmb ish) around ATOMIC_SWAP etc.
InsertFencesForAtomic = true;
}
} else {
// If there's anything we can use as a barrier, go through custom lowering
// for ATOMIC_FENCE.
// If target has DMB in thumb, Fences can be inserted.
if (Subtarget->hasDataBarrier())
InsertFencesForAtomic = true;

setOperationAction(ISD::ATOMIC_FENCE, MVT::Other,
Subtarget->hasAnyDataBarrier() ? Custom : Expand);

// Set them all for expansion, which will force libcalls.		// Set everything but ATOMIC_LOAD/ATOMIC_STORE for expansion to __sync_*
		// libcalls.
setOperationAction(ISD::ATOMIC_CMP_SWAP, MVT::i32, Expand);		setOperationAction(ISD::ATOMIC_CMP_SWAP, MVT::i32, Expand);
setOperationAction(ISD::ATOMIC_SWAP, MVT::i32, Expand);		setOperationAction(ISD::ATOMIC_SWAP, MVT::i32, Expand);
setOperationAction(ISD::ATOMIC_LOAD_ADD, MVT::i32, Expand);		setOperationAction(ISD::ATOMIC_LOAD_ADD, MVT::i32, Expand);
setOperationAction(ISD::ATOMIC_LOAD_SUB, MVT::i32, Expand);		setOperationAction(ISD::ATOMIC_LOAD_SUB, MVT::i32, Expand);
setOperationAction(ISD::ATOMIC_LOAD_AND, MVT::i32, Expand);		setOperationAction(ISD::ATOMIC_LOAD_AND, MVT::i32, Expand);
setOperationAction(ISD::ATOMIC_LOAD_OR, MVT::i32, Expand);		setOperationAction(ISD::ATOMIC_LOAD_OR, MVT::i32, Expand);
setOperationAction(ISD::ATOMIC_LOAD_XOR, MVT::i32, Expand);		setOperationAction(ISD::ATOMIC_LOAD_XOR, MVT::i32, Expand);
setOperationAction(ISD::ATOMIC_LOAD_NAND, MVT::i32, Expand);		setOperationAction(ISD::ATOMIC_LOAD_NAND, MVT::i32, Expand);
setOperationAction(ISD::ATOMIC_LOAD_MIN, MVT::i32, Expand);		setOperationAction(ISD::ATOMIC_LOAD_MIN, MVT::i32, Expand);
setOperationAction(ISD::ATOMIC_LOAD_MAX, MVT::i32, Expand);		setOperationAction(ISD::ATOMIC_LOAD_MAX, MVT::i32, Expand);
setOperationAction(ISD::ATOMIC_LOAD_UMIN, MVT::i32, Expand);		setOperationAction(ISD::ATOMIC_LOAD_UMIN, MVT::i32, Expand);
setOperationAction(ISD::ATOMIC_LOAD_UMAX, MVT::i32, Expand);		setOperationAction(ISD::ATOMIC_LOAD_UMAX, MVT::i32, Expand);
// Mark ATOMIC_LOAD and ATOMIC_STORE custom so we can handle the		} else {
// Unordered/Monotonic case.		// Otherwise, native atomic support cannot be guaranteed.
if (!InsertFencesForAtomic) {		setMaxAtomicSizeInBitsSupported(0);
setOperationAction(ISD::ATOMIC_LOAD, MVT::i32, Custom);
setOperationAction(ISD::ATOMIC_STORE, MVT::i32, Custom);
}
}		}

		// If there's anything we can use as a barrier, go through custom lowering
		// for ATOMIC_FENCE. Otherwise expand to __sync_synchronize libcall.
		setOperationAction(ISD::ATOMIC_FENCE, MVT::Other,
		Subtarget->hasAnyDataBarrier() ? Custom : Expand);

setOperationAction(ISD::PREFETCH, MVT::Other, Custom);		setOperationAction(ISD::PREFETCH, MVT::Other, Custom);

// Requires SXTB/SXTH, available on v6 and up in both ARM and Thumb modes.		// Requires SXTB/SXTH, available on v6 and up in both ARM and Thumb modes.
if (!Subtarget->hasV6Ops()) {		if (!Subtarget->hasV6Ops()) {
setOperationAction(ISD::SIGN_EXTEND_INREG, MVT::i16, Expand);		setOperationAction(ISD::SIGN_EXTEND_INREG, MVT::i16, Expand);
setOperationAction(ISD::SIGN_EXTEND_INREG, MVT::i8, Expand);		setOperationAction(ISD::SIGN_EXTEND_INREG, MVT::i8, Expand);
}		}
setOperationAction(ISD::SIGN_EXTEND_INREG, MVT::i1, Expand);		setOperationAction(ISD::SIGN_EXTEND_INREG, MVT::i1, Expand);
▲ Show 20 Lines • Show All 8,367 Lines • ▼ Show 20 Lines

static SDValue LowerVecReduceF(SDValue Op, SelectionDAG &DAG,		static SDValue LowerVecReduceF(SDValue Op, SelectionDAG &DAG,
const ARMSubtarget *ST) {		const ARMSubtarget *ST) {
if (!ST->hasMVEFloatOps())		if (!ST->hasMVEFloatOps())
return SDValue();		return SDValue();
return LowerVecReduce(Op, DAG, ST);		return LowerVecReduce(Op, DAG, ST);
}		}

static SDValue LowerAtomicLoadStore(SDValue Op, SelectionDAG &DAG) {
if (isStrongerThanMonotonic(cast<AtomicSDNode>(Op)->getOrdering()))
// Acquire/Release load/store is not legal for targets without a dmb or
// equivalent available.
return SDValue();

// Monotonic load/store is legal for all targets.
return Op;
}

static void ReplaceREADCYCLECOUNTER(SDNode *N,		static void ReplaceREADCYCLECOUNTER(SDNode *N,
SmallVectorImpl<SDValue> &Results,		SmallVectorImpl<SDValue> &Results,
SelectionDAG &DAG,		SelectionDAG &DAG,
const ARMSubtarget *Subtarget) {		const ARMSubtarget *Subtarget) {
SDLoc DL(N);		SDLoc DL(N);
// Under Power Management extensions, the cycle-count is:		// Under Power Management extensions, the cycle-count is:
// mrc p15, #0, <Rt>, c9, c13, #0		// mrc p15, #0, <Rt>, c9, c13, #0
SDValue Ops[] = { N->getOperand(0), // Chain		SDValue Ops[] = { N->getOperand(0), // Chain
▲ Show 20 Lines • Show All 190 Lines • ▼ Show 20 Lines	SDValue ARMTargetLowering::LowerOperation(SDValue Op, SelectionDAG &DAG) const {
case ISD::VECREDUCE_OR:		case ISD::VECREDUCE_OR:
case ISD::VECREDUCE_XOR:		case ISD::VECREDUCE_XOR:
return LowerVecReduce(Op, DAG, Subtarget);		return LowerVecReduce(Op, DAG, Subtarget);
case ISD::VECREDUCE_FADD:		case ISD::VECREDUCE_FADD:
case ISD::VECREDUCE_FMUL:		case ISD::VECREDUCE_FMUL:
case ISD::VECREDUCE_FMIN:		case ISD::VECREDUCE_FMIN:
case ISD::VECREDUCE_FMAX:		case ISD::VECREDUCE_FMAX:
return LowerVecReduceF(Op, DAG, Subtarget);		return LowerVecReduceF(Op, DAG, Subtarget);
case ISD::ATOMIC_LOAD:
case ISD::ATOMIC_STORE: return LowerAtomicLoadStore(Op, DAG);
case ISD::FSINCOS: return LowerFSINCOS(Op, DAG);		case ISD::FSINCOS: return LowerFSINCOS(Op, DAG);
case ISD::SDIVREM:		case ISD::SDIVREM:
case ISD::UDIVREM: return LowerDivRem(Op, DAG);		case ISD::UDIVREM: return LowerDivRem(Op, DAG);
case ISD::DYNAMIC_STACKALLOC:		case ISD::DYNAMIC_STACKALLOC:
if (Subtarget->isTargetWindows())		if (Subtarget->isTargetWindows())
return LowerDYNAMIC_STACKALLOC(Op, DAG);		return LowerDYNAMIC_STACKALLOC(Op, DAG);
llvm_unreachable("Don't know how to custom lower this!");		llvm_unreachable("Don't know how to custom lower this!");
case ISD::STRICT_FP_ROUND:		case ISD::STRICT_FP_ROUND:
▲ Show 20 Lines • Show All 8,896 Lines • ▼ Show 20 Lines

Instruction* ARMTargetLowering::makeDMB(IRBuilder<> &Builder,		Instruction* ARMTargetLowering::makeDMB(IRBuilder<> &Builder,
ARM_MB::MemBOpt Domain) const {		ARM_MB::MemBOpt Domain) const {
Module *M = Builder.GetInsertBlock()->getParent()->getParent();		Module *M = Builder.GetInsertBlock()->getParent()->getParent();

// First, if the target has no DMB, see what fallback we can use.		// First, if the target has no DMB, see what fallback we can use.
if (!Subtarget->hasDataBarrier()) {		if (!Subtarget->hasDataBarrier()) {
// Some ARMv6 cpus can support data barriers with an mcr instruction.		// Some ARMv6 cpus can support data barriers with an mcr instruction.
// Thumb1 and pre-v6 ARM mode use a libcall instead and should never get
// here.
if (Subtarget->hasV6Ops() && !Subtarget->isThumb()) {		if (Subtarget->hasV6Ops() && !Subtarget->isThumb()) {
Function *MCR = Intrinsic::getDeclaration(M, Intrinsic::arm_mcr);		Function *MCR = Intrinsic::getDeclaration(M, Intrinsic::arm_mcr);
Value* args[6] = {Builder.getInt32(15), Builder.getInt32(0),		Value* args[6] = {Builder.getInt32(15), Builder.getInt32(0),
Builder.getInt32(0), Builder.getInt32(7),		Builder.getInt32(0), Builder.getInt32(7),
Builder.getInt32(10), Builder.getInt32(5)};		Builder.getInt32(10), Builder.getInt32(5)};
return Builder.CreateCall(MCR, args);		return Builder.CreateCall(MCR, args);
} else {		} else {
// Instead of using barriers, atomic accesses on these subtargets use		// Instead of barriers, atomic accesses on Thumb1 and pre-v6 ARM
// libcalls.		// mode just use a libcall to __sync_synchronize. So, just emit
llvm_unreachable("makeDMB on a target so old that it has no barriers");		// a fence instruction.
		return Builder.CreateFence(AtomicOrdering::SequentiallyConsistent);
}		}
} else {		} else {
Function *DMB = Intrinsic::getDeclaration(M, Intrinsic::arm_dmb);		Function *DMB = Intrinsic::getDeclaration(M, Intrinsic::arm_dmb);
// Only a full system barrier exists in the M-class architectures.		// Only a full system barrier exists in the M-class architectures.
Domain = Subtarget->isMClass() ? ARM_MB::SY : Domain;		Domain = Subtarget->isMClass() ? ARM_MB::SY : Domain;
Constant *CDomain = Builder.getInt32(Domain);		Constant *CDomain = Builder.getInt32(Domain);
return Builder.CreateCall(DMB, CDomain);		return Builder.CreateCall(DMB, CDomain);
}		}
Show All 38 Lines	Instruction *ARMTargetLowering::emitTrailingFence(IRBuilder<> &Builder,
case AtomicOrdering::Acquire:		case AtomicOrdering::Acquire:
case AtomicOrdering::AcquireRelease:		case AtomicOrdering::AcquireRelease:
case AtomicOrdering::SequentiallyConsistent:		case AtomicOrdering::SequentiallyConsistent:
return makeDMB(Builder, ARM_MB::ISH);		return makeDMB(Builder, ARM_MB::ISH);
}		}
llvm_unreachable("Unknown fence ordering in emitTrailingFence");		llvm_unreachable("Unknown fence ordering in emitTrailingFence");
}		}

// Loads and stores less than 64-bits are already atomic; ones above that		// Loads and stores less than 64-bits are intrinsically atomic. For 64-bit
// are doomed anyway, so defer to the default libcall and blame the OS when		// operations, we can replace with ldrexd/strexd. We don't need to check for its
// things go wrong. Cortex M doesn't have ldrexd/strexd though, so don't emit		// availability, because when it's not available, we only support 32-bit
// anything for those.		// lockfree atomics.
		//
		// FIXME: ldrd and strd are atomic if the CPU has LPAE (e.g. A15 has that
		// guarantee, see DDI0406C ARM architecture reference manual, sections
		// A8.8.72-74 LDRD); on such CPUs it would be advantageous to not expand 64-bit
		// loads and stores to LL/SC sequences.
bool ARMTargetLowering::shouldExpandAtomicStoreInIR(StoreInst *SI) const {		bool ARMTargetLowering::shouldExpandAtomicStoreInIR(StoreInst *SI) const {
unsigned Size = SI->getValueOperand()->getType()->getPrimitiveSizeInBits();		unsigned Size = SI->getValueOperand()->getType()->getPrimitiveSizeInBits();
return (Size == 64) && !Subtarget->isMClass();		return Size == 64;
}		}

// Loads and stores less than 64-bits are already atomic; ones above that
// are doomed anyway, so defer to the default libcall and blame the OS when
// things go wrong. Cortex M doesn't have ldrexd/strexd though, so don't emit
// anything for those.
// FIXME: ldrd and strd are atomic if the CPU has LPAE (e.g. A15 has that
// guarantee, see DDI0406C ARM architecture reference manual,
// sections A8.8.72-74 LDRD)
TargetLowering::AtomicExpansionKind		TargetLowering::AtomicExpansionKind
ARMTargetLowering::shouldExpandAtomicLoadInIR(LoadInst *LI) const {		ARMTargetLowering::shouldExpandAtomicLoadInIR(LoadInst *LI) const {
unsigned Size = LI->getType()->getPrimitiveSizeInBits();		unsigned Size = LI->getType()->getPrimitiveSizeInBits();
return ((Size == 64) && !Subtarget->isMClass()) ? AtomicExpansionKind::LLOnly		if (Size == 64)
: AtomicExpansionKind::None;		return AtomicExpansionKind::LLOnly;

		return AtomicExpansionKind::None;
}		}

// For the real atomic operations, we have ldrex/strex up to 32 bits,		// In the following "shouldAtomic" routines, there's two cases to consider:
// and up to 64 bits on the non-M profiles		// 1. We have native atomics (hasLdrex() is true). We want to expand to LL/SC.
		//
		// 2. We don't actually have native atomics, but we pretend that we do, because
		// we're on an OS that provides a "magic" lock-free compare-and-swap
		// routine. In this case, we rely on __sync libcall expansions for all the
		// operations. Thus, we avoid doing expansions in IR.
		//
		// If there's neither native atomics, nor special OS routines allowing lock-free
		// libcalls, these routines will not be called at all, because
		// MaxAtomicSizeInBitsSupported was set to 0.

TargetLowering::AtomicExpansionKind		TargetLowering::AtomicExpansionKind
ARMTargetLowering::shouldExpandAtomicRMWInIR(AtomicRMWInst *AI) const {		ARMTargetLowering::shouldExpandAtomicRMWInIR(AtomicRMWInst *AI) const {
		// Floating-point operations are always emitted to a cmpxchg loop, because
		// they may trigger a trap which aborts an LLSC sequence.
if (AI->isFloatingPointOperation())		if (AI->isFloatingPointOperation())
return AtomicExpansionKind::CmpXChg;		return AtomicExpansionKind::CmpXChg;

unsigned Size = AI->getType()->getPrimitiveSizeInBits();		if (!Subtarget->hasLdrex())
bool hasAtomicRMW = !Subtarget->isThumb() \|\| Subtarget->hasV8MBaselineOps();		return AtomicExpansionKind::None;
return (Size <= (Subtarget->isMClass() ? 32U : 64U) && hasAtomicRMW)		return AtomicExpansionKind::LLSC;
? AtomicExpansionKind::LLSC
: AtomicExpansionKind::None;
}		}

// Similar to shouldExpandAtomicRMWInIR, ldrex/strex can be used up to 32		// Similar to shouldExpandAtomicRMWInIR, we use LL/SC when available, or a
// bits, and up to 64 bits on the non-M profiles.		// __sync_* function if not.
TargetLowering::AtomicExpansionKind		TargetLowering::AtomicExpansionKind
ARMTargetLowering::shouldExpandAtomicCmpXchgInIR(AtomicCmpXchgInst *AI) const {		ARMTargetLowering::shouldExpandAtomicCmpXchgInIR(AtomicCmpXchgInst *AI) const {
		if (!Subtarget->hasLdrex())
		return AtomicExpansionKind::None;
// At -O0, fast-regalloc cannot cope with the live vregs necessary to		// At -O0, fast-regalloc cannot cope with the live vregs necessary to
// implement cmpxchg without spilling. If the address being exchanged is also		// implement cmpxchg without spilling. If the address being exchanged is also
// on the stack and close enough to the spill slot, this can lead to a		// on the stack and close enough to the spill slot, this can lead to a
// situation where the monitor always gets cleared and the atomic operation		// situation where the monitor always gets cleared and the atomic operation
// can never succeed. So at -O0 we need a late-expanded pseudo-inst instead.		// can never succeed. So at -O0 we need a late-expanded pseudo-inst instead.
unsigned Size = AI->getOperand(1)->getType()->getPrimitiveSizeInBits();		if (getTargetMachine().getOptLevel() == 0)
bool HasAtomicCmpXchg =
!Subtarget->isThumb() \|\| Subtarget->hasV8MBaselineOps();
if (getTargetMachine().getOptLevel() != 0 && HasAtomicCmpXchg &&
Size <= (Subtarget->isMClass() ? 32U : 64U))
return AtomicExpansionKind::LLSC;
return AtomicExpansionKind::None;		return AtomicExpansionKind::None;

		return AtomicExpansionKind::LLSC;
}		}

bool ARMTargetLowering::shouldInsertFencesForAtomic(		bool ARMTargetLowering::shouldInsertFencesForAtomic(
const Instruction *I) const {		const Instruction *I) const {
return InsertFencesForAtomic;		// When we don't have ldrex, we may be emitting __sync_* libcalls. These don't
		// need fences inserted as they already have appropriate barriers within the
		// function. Load and Store, however, are handled directly, and thus do
		// require fence insertion.
		if (!Subtarget->hasLdrex()) {
		return isa<LoadInst>(I) \|\| isa<StoreInst>(I);
		}

		// In -O0 mode, there's a hack in place to expand ATOMIC_CMP_SWAP in a late
		// pseudo expansion instead of in IR. This pseduo requires fences to be
		// emitted externally.
		if (getTargetMachine().getOptLevel() == 0 && isa<AtomicCmpXchgInst>(I))
		return true;

		// On v8, we have additional acquire/release instructions that are more
		// efficient than a separate fence.
		if (Subtarget->hasAcquireRelease())
		return false;

		// Otherwise, insert fences (dmb ish) around all atomic operations.
		return true;
}		}

// This has so far only been implemented for MachO.		// This has so far only been implemented for MachO.
bool ARMTargetLowering::useLoadStackGuardNode() const {		bool ARMTargetLowering::useLoadStackGuardNode() const {
return Subtarget->isTargetMachO();		return Subtarget->isTargetMachO();
}		}

void ARMTargetLowering::insertSSPDeclarations(Module &M) const {		void ARMTargetLowering::insertSSPDeclarations(Module &M) const {
▲ Show 20 Lines • Show All 664 Lines • Show Last 20 Lines

llvm/lib/Target/ARM/ARMSubtarget.h

Show First 20 Lines • Show All 733 Lines • ▼ Show 20 Lines	public:

bool isTargetDarwin() const { return TargetTriple.isOSDarwin(); }		bool isTargetDarwin() const { return TargetTriple.isOSDarwin(); }
bool isTargetIOS() const { return TargetTriple.isiOS(); }		bool isTargetIOS() const { return TargetTriple.isiOS(); }
bool isTargetWatchOS() const { return TargetTriple.isWatchOS(); }		bool isTargetWatchOS() const { return TargetTriple.isWatchOS(); }
bool isTargetWatchABI() const { return TargetTriple.isWatchABI(); }		bool isTargetWatchABI() const { return TargetTriple.isWatchABI(); }
bool isTargetLinux() const { return TargetTriple.isOSLinux(); }		bool isTargetLinux() const { return TargetTriple.isOSLinux(); }
bool isTargetNaCl() const { return TargetTriple.isOSNaCl(); }		bool isTargetNaCl() const { return TargetTriple.isOSNaCl(); }
bool isTargetNetBSD() const { return TargetTriple.isOSNetBSD(); }		bool isTargetNetBSD() const { return TargetTriple.isOSNetBSD(); }
		bool isTargetFreeBSD() const { return TargetTriple.isOSFreeBSD(); }
bool isTargetWindows() const { return TargetTriple.isOSWindows(); }		bool isTargetWindows() const { return TargetTriple.isOSWindows(); }

bool isTargetCOFF() const { return TargetTriple.isOSBinFormatCOFF(); }		bool isTargetCOFF() const { return TargetTriple.isOSBinFormatCOFF(); }
bool isTargetELF() const { return TargetTriple.isOSBinFormatELF(); }		bool isTargetELF() const { return TargetTriple.isOSBinFormatELF(); }
bool isTargetMachO() const { return TargetTriple.isOSBinFormatMachO(); }		bool isTargetMachO() const { return TargetTriple.isOSBinFormatMachO(); }

// ARM EABI is the bare-metal EABI described in ARM ABI documents and		// ARM EABI is the bare-metal EABI described in ARM ABI documents and
// can be accessed via -target arm-none-eabi. This is NOT GNUEABI.		// can be accessed via -target arm-none-eabi. This is NOT GNUEABI.
▲ Show 20 Lines • Show All 102 Lines • ▼ Show 20 Lines	public:

/// Check whether this subtarget wants to use subregister liveness.		/// Check whether this subtarget wants to use subregister liveness.
bool enableSubRegLiveness() const override;		bool enableSubRegLiveness() const override;

/// Enable use of alias analysis during code generation (during MI		/// Enable use of alias analysis during code generation (during MI
/// scheduling, DAGCombine, etc.).		/// scheduling, DAGCombine, etc.).
bool useAA() const override { return true; }		bool useAA() const override { return true; }

// enableAtomicExpand- True if we need to expand our atomics.		// True for targets that support atomic ldrex/strex instructions.
bool enableAtomicExpand() const override;		bool hasLdrex() const {
		return HasV6Ops && (!InThumbMode \|\| HasV8MBaselineOps);
		}

		// True for targets which support atomic ldrexd/strexd instructions.
		bool hasLdrexd() const {
		// The Cortex-M series only support 32bit atomics.
		return hasLdrex() && !isMClass();
		}

/// getInstrItins - Return the instruction itineraries based on subtarget		/// getInstrItins - Return the instruction itineraries based on subtarget
/// selection.		/// selection.
const InstrItineraryData *getInstrItineraryData() const override {		const InstrItineraryData *getInstrItineraryData() const override {
return &InstrItins;		return &InstrItins;
}		}

/// getStackAlignment - Returns the minimum alignment known to hold of the		/// getStackAlignment - Returns the minimum alignment known to hold of the
▲ Show 20 Lines • Show All 63 Lines • Show Last 20 Lines

llvm/lib/Target/ARM/ARMSubtarget.cpp

	Show First 20 Lines • Show All 403 Lines • ▼ Show 20 Lines
	bool ARMSubtarget::enablePostRAMachineScheduler() const {			bool ARMSubtarget::enablePostRAMachineScheduler() const {
	if (!enableMachineScheduler())			if (!enableMachineScheduler())
	return false;			return false;
	if (disablePostRAScheduler())			if (disablePostRAScheduler())
	return false;			return false;
	return !isThumb1Only();			return !isThumb1Only();
	}			}

	bool ARMSubtarget::enableAtomicExpand() const { return hasAnyDataBarrier(); }

	bool ARMSubtarget::useStride4VFPs() const {			bool ARMSubtarget::useStride4VFPs() const {
	// For general targets, the prologue can grow when VFPs are allocated with			// For general targets, the prologue can grow when VFPs are allocated with
	// stride 4 (more vpush instructions). But WatchOS uses a compact unwind			// stride 4 (more vpush instructions). But WatchOS uses a compact unwind
	// format which it's more important to get right.			// format which it's more important to get right.
	return isTargetWatchABI() \|\|			return isTargetWatchABI() \|\|
	(useWideStrideVFP() && !OptMinSize);			(useWideStrideVFP() && !OptMinSize);
	}			}

	▲ Show 20 Lines • Show All 64 Lines • Show Last 20 Lines

llvm/test/CodeGen/ARM/atomic-64bit.ll

	; RUN: llc < %s -mtriple=armv7-apple-ios \| FileCheck %s --check-prefix=CHECK --check-prefix=CHECK-LE			; RUN: llc < %s -mtriple=armv7-apple-ios \| FileCheck %s --check-prefixes=COMMON,CHECK,CHECK-LE
	; RUN: llc < %s -mtriple=thumbv7-none-linux-gnueabihf \| FileCheck %s --check-prefix=CHECK-THUMB --check-prefix=CHECK-THUMB-LE			; RUN: llc < %s -mtriple=thumbv7-none-linux-gnueabihf \| FileCheck %s --check-prefixes=COMMON,CHECK-THUMB,CHECK-THUMB-LE
	; RUN: llc < %s -mtriple=armebv7 -target-abi apcs \| FileCheck %s --check-prefix=CHECK --check-prefix=CHECK-BE			; RUN: llc < %s -mtriple=armebv7 -target-abi apcs \| FileCheck %s --check-prefixes=COMMON,CHECK,CHECK-BE
	; RUN: llc < %s -mtriple=thumbebv7-none-linux-gnueabihf \| FileCheck %s --check-prefix=CHECK-THUMB --check-prefix=CHECK-THUMB-BE			; RUN: llc < %s -mtriple=thumbebv7-none-linux-gnueabihf \| FileCheck %s --check-prefixes=COMMON,CHECK-THUMB,CHECK-THUMB-BE
	; RUN: llc < %s -mtriple=armv7m--none-eabi \| FileCheck %s --check-prefix=CHECK-M			; RUN: llc < %s -mtriple=armv7m--none-eabi \| FileCheck %s --check-prefixes=COMMON,CHECK-M
	; RUN: llc < %s -mtriple=armv8m--none-eabi \| FileCheck %s --check-prefix=CHECK-M			; RUN: llc < %s -mtriple=armv8m.base--none-eabi \| FileCheck %s --check-prefixes=COMMON,CHECK-M

	define i64 @test1(i64* %ptr, i64 %val) {			define i64 @test1(i64* %ptr, i64 %val) {
	; CHECK-LABEL: test1:			; COMMON-LABEL: test1:
	; CHECK: dmb {{ish$}}			; CHECK: dmb {{ish$}}
	; CHECK: ldrexd [[REG1:(r[0-9]?[02468])]], [[REG2:(r[0-9]?[13579])]]			; CHECK: ldrexd [[REG1:(r[0-9]?[02468])]], [[REG2:(r[0-9]?[13579])]]
	; CHECK-LE: adds [[REG3:(r[0-9]?[02468])]], [[REG1]]			; CHECK-LE: adds [[REG3:(r[0-9]?[02468])]], [[REG1]]
	; CHECK-LE: adc [[REG4:(r[0-9]?[13579])]], [[REG2]]			; CHECK-LE: adc [[REG4:(r[0-9]?[13579])]], [[REG2]]
	; CHECK-BE: adds [[REG4:(r[0-9]?[13579])]], [[REG2]]			; CHECK-BE: adds [[REG4:(r[0-9]?[13579])]], [[REG2]]
	; CHECK-BE: adc [[REG3:(r[0-9]?[02468])]], [[REG1]]			; CHECK-BE: adc [[REG3:(r[0-9]?[02468])]], [[REG1]]
	; CHECK: strexd {{[a-z0-9]+}}, [[REG3]], [[REG4]]			; CHECK: strexd {{[a-z0-9]+}}, [[REG3]], [[REG4]]
	; CHECK: cmp			; CHECK: cmp
	; CHECK: bne			; CHECK: bne
	; CHECK: dmb {{ish$}}			; CHECK: dmb {{ish$}}

	; CHECK-THUMB-LABEL: test1:
	; CHECK-THUMB: dmb {{ish$}}			; CHECK-THUMB: dmb {{ish$}}
	; CHECK-THUMB: ldrexd [[REG1:[a-z0-9]+]], [[REG2:[a-z0-9]+]]			; CHECK-THUMB: ldrexd [[REG1:[a-z0-9]+]], [[REG2:[a-z0-9]+]]
	; CHECK-THUMB-LE: adds.w [[REG3:[a-z0-9]+]], [[REG1]]			; CHECK-THUMB-LE: adds.w [[REG3:[a-z0-9]+]], [[REG1]]
	; CHECK-THUMB-LE: adc.w [[REG4:[a-z0-9]+]], [[REG2]]			; CHECK-THUMB-LE: adc.w [[REG4:[a-z0-9]+]], [[REG2]]
	; CHECK-THUMB-BE: adds.w [[REG4:[a-z0-9]+]], [[REG2]]			; CHECK-THUMB-BE: adds.w [[REG4:[a-z0-9]+]], [[REG2]]
	; CHECK-THUMB-BE: adc.w [[REG3:[a-z0-9]+]], [[REG1]]			; CHECK-THUMB-BE: adc.w [[REG3:[a-z0-9]+]], [[REG1]]
	; CHECK-THUMB: strexd {{[a-z0-9]+}}, [[REG3]], [[REG4]]			; CHECK-THUMB: strexd {{[a-z0-9]+}}, [[REG3]], [[REG4]]
	; CHECK-THUMB: cmp			; CHECK-THUMB: cmp
	; CHECK-THUMB: bne			; CHECK-THUMB: bne
	; CHECK-THUMB: dmb {{ish$}}			; CHECK-THUMB: dmb {{ish$}}

	; CHECK-M: __sync_fetch_and_add_8			; CHECK-M: __atomic_fetch_add_8

	%r = atomicrmw add i64* %ptr, i64 %val seq_cst			%r = atomicrmw add i64* %ptr, i64 %val seq_cst
	ret i64 %r			ret i64 %r
	}			}

	define i64 @test2(i64* %ptr, i64 %val) {			define i64 @test2(i64* %ptr, i64 %val) {
	; CHECK-LABEL: test2:			; COMMON-LABEL: test2:
	; CHECK: dmb {{ish$}}			; CHECK: dmb {{ish$}}
	; CHECK: ldrexd [[REG1:(r[0-9]?[02468])]], [[REG2:(r[0-9]?[13579])]]			; CHECK: ldrexd [[REG1:(r[0-9]?[02468])]], [[REG2:(r[0-9]?[13579])]]
	; CHECK-LE: subs [[REG3:(r[0-9]?[02468])]], [[REG1]]			; CHECK-LE: subs [[REG3:(r[0-9]?[02468])]], [[REG1]]
	; CHECK-LE: sbc [[REG4:(r[0-9]?[13579])]], [[REG2]]			; CHECK-LE: sbc [[REG4:(r[0-9]?[13579])]], [[REG2]]
	; CHECK-BE: subs [[REG4:(r[0-9]?[13579])]], [[REG2]]			; CHECK-BE: subs [[REG4:(r[0-9]?[13579])]], [[REG2]]
	; CHECK-BE: sbc [[REG3:(r[0-9]?[02468])]], [[REG1]]			; CHECK-BE: sbc [[REG3:(r[0-9]?[02468])]], [[REG1]]
	; CHECK: strexd {{[a-z0-9]+}}, [[REG3]], [[REG4]]			; CHECK: strexd {{[a-z0-9]+}}, [[REG3]], [[REG4]]
	; CHECK: cmp			; CHECK: cmp
	; CHECK: bne			; CHECK: bne
	; CHECK: dmb {{ish$}}			; CHECK: dmb {{ish$}}

	; CHECK-THUMB-LABEL: test2:
	; CHECK-THUMB: dmb {{ish$}}			; CHECK-THUMB: dmb {{ish$}}
	; CHECK-THUMB: ldrexd [[REG1:[a-z0-9]+]], [[REG2:[a-z0-9]+]]			; CHECK-THUMB: ldrexd [[REG1:[a-z0-9]+]], [[REG2:[a-z0-9]+]]
	; CHECK-THUMB-LE: subs.w [[REG3:[a-z0-9]+]], [[REG1]]			; CHECK-THUMB-LE: subs.w [[REG3:[a-z0-9]+]], [[REG1]]
	; CHECK-THUMB-LE: sbc.w [[REG4:[a-z0-9]+]], [[REG2]]			; CHECK-THUMB-LE: sbc.w [[REG4:[a-z0-9]+]], [[REG2]]
	; CHECK-THUMB-BE: subs.w [[REG4:[a-z0-9]+]], [[REG2]]			; CHECK-THUMB-BE: subs.w [[REG4:[a-z0-9]+]], [[REG2]]
	; CHECK-THUMB-BE: sbc.w [[REG3:[a-z0-9]+]], [[REG1]]			; CHECK-THUMB-BE: sbc.w [[REG3:[a-z0-9]+]], [[REG1]]
	; CHECK-THUMB: strexd {{[a-z0-9]+}}, [[REG3]], [[REG4]]			; CHECK-THUMB: strexd {{[a-z0-9]+}}, [[REG3]], [[REG4]]
	; CHECK-THUMB: cmp			; CHECK-THUMB: cmp
	; CHECK-THUMB: bne			; CHECK-THUMB: bne
	; CHECK-THUMB: dmb {{ish$}}			; CHECK-THUMB: dmb {{ish$}}

	; CHECK-M: __sync_fetch_and_sub_8			; CHECK-M: __atomic_fetch_sub_8

	%r = atomicrmw sub i64* %ptr, i64 %val seq_cst			%r = atomicrmw sub i64* %ptr, i64 %val seq_cst
	ret i64 %r			ret i64 %r
	}			}

	define i64 @test3(i64* %ptr, i64 %val) {			define i64 @test3(i64* %ptr, i64 %val) {
	; CHECK-LABEL: test3:			; COMMON-LABEL: test3:
	; CHECK: dmb {{ish$}}			; CHECK: dmb {{ish$}}
	; CHECK: ldrexd [[REG1:(r[0-9]?[02468])]], [[REG2:(r[0-9]?[13579])]]			; CHECK: ldrexd [[REG1:(r[0-9]?[02468])]], [[REG2:(r[0-9]?[13579])]]
	; CHECK-LE-DAG: and [[REG3:(r[0-9]?[02468])]], [[REG1]]			; CHECK-LE-DAG: and [[REG3:(r[0-9]?[02468])]], [[REG1]]
	; CHECK-LE-DAG: and [[REG4:(r[0-9]?[13579])]], [[REG2]]			; CHECK-LE-DAG: and [[REG4:(r[0-9]?[13579])]], [[REG2]]
	; CHECK-BE-DAG: and [[REG4:(r[0-9]?[13579])]], [[REG2]]			; CHECK-BE-DAG: and [[REG4:(r[0-9]?[13579])]], [[REG2]]
	; CHECK-BE-DAG: and [[REG3:(r[0-9]?[02468])]], [[REG1]]			; CHECK-BE-DAG: and [[REG3:(r[0-9]?[02468])]], [[REG1]]
	; CHECK: strexd {{[a-z0-9]+}}, [[REG3]], [[REG4]]			; CHECK: strexd {{[a-z0-9]+}}, [[REG3]], [[REG4]]
	; CHECK: cmp			; CHECK: cmp
	; CHECK: bne			; CHECK: bne
	; CHECK: dmb {{ish$}}			; CHECK: dmb {{ish$}}

	; CHECK-THUMB-LABEL: test3:
	; CHECK-THUMB: dmb {{ish$}}			; CHECK-THUMB: dmb {{ish$}}
	; CHECK-THUMB: ldrexd [[REG1:[a-z0-9]+]], [[REG2:[a-z0-9]+]]			; CHECK-THUMB: ldrexd [[REG1:[a-z0-9]+]], [[REG2:[a-z0-9]+]]
	; CHECK-THUMB-LE-DAG: and.w [[REG3:[a-z0-9]+]], [[REG1]]			; CHECK-THUMB-LE-DAG: and.w [[REG3:[a-z0-9]+]], [[REG1]]
	; CHECK-THUMB-LE-DAG: and.w [[REG4:[a-z0-9]+]], [[REG2]]			; CHECK-THUMB-LE-DAG: and.w [[REG4:[a-z0-9]+]], [[REG2]]
	; CHECK-THUMB-BE-DAG: and.w [[REG4:[a-z0-9]+]], [[REG2]]			; CHECK-THUMB-BE-DAG: and.w [[REG4:[a-z0-9]+]], [[REG2]]
	; CHECK-THUMB-BE-DAG: and.w [[REG3:[a-z0-9]+]], [[REG1]]			; CHECK-THUMB-BE-DAG: and.w [[REG3:[a-z0-9]+]], [[REG1]]
	; CHECK-THUMB: strexd {{[a-z0-9]+}}, [[REG3]], [[REG4]]			; CHECK-THUMB: strexd {{[a-z0-9]+}}, [[REG3]], [[REG4]]
	; CHECK-THUMB: cmp			; CHECK-THUMB: cmp
	; CHECK-THUMB: bne			; CHECK-THUMB: bne
	; CHECK-THUMB: dmb {{ish$}}			; CHECK-THUMB: dmb {{ish$}}

	; CHECK-M: __sync_fetch_and_and_8			; CHECK-M: __atomic_fetch_and_8

	%r = atomicrmw and i64* %ptr, i64 %val seq_cst			%r = atomicrmw and i64* %ptr, i64 %val seq_cst
	ret i64 %r			ret i64 %r
	}			}

	define i64 @test4(i64* %ptr, i64 %val) {			define i64 @test4(i64* %ptr, i64 %val) {
	; CHECK-LABEL: test4:			; COMMON-LABEL: test4:
	; CHECK: dmb {{ish$}}			; CHECK: dmb {{ish$}}
	; CHECK: ldrexd [[REG1:(r[0-9]?[02468])]], [[REG2:(r[0-9]?[13579])]]			; CHECK: ldrexd [[REG1:(r[0-9]?[02468])]], [[REG2:(r[0-9]?[13579])]]
	; CHECK-LE-DAG: orr [[REG3:(r[0-9]?[02468])]], [[REG1]]			; CHECK-LE-DAG: orr [[REG3:(r[0-9]?[02468])]], [[REG1]]
	; CHECK-LE-DAG: orr [[REG4:(r[0-9]?[13579])]], [[REG2]]			; CHECK-LE-DAG: orr [[REG4:(r[0-9]?[13579])]], [[REG2]]
	; CHECK-BE-DAG: orr [[REG4:(r[0-9]?[13579])]], [[REG2]]			; CHECK-BE-DAG: orr [[REG4:(r[0-9]?[13579])]], [[REG2]]
	; CHECK-BE-DAG: orr [[REG3:(r[0-9]?[02468])]], [[REG1]]			; CHECK-BE-DAG: orr [[REG3:(r[0-9]?[02468])]], [[REG1]]
	; CHECK: strexd {{[a-z0-9]+}}, [[REG3]], [[REG4]]			; CHECK: strexd {{[a-z0-9]+}}, [[REG3]], [[REG4]]
	; CHECK: cmp			; CHECK: cmp
	; CHECK: bne			; CHECK: bne
	; CHECK: dmb {{ish$}}			; CHECK: dmb {{ish$}}

	; CHECK-THUMB-LABEL: test4:
	; CHECK-THUMB: dmb {{ish$}}			; CHECK-THUMB: dmb {{ish$}}
	; CHECK-THUMB: ldrexd [[REG1:[a-z0-9]+]], [[REG2:[a-z0-9]+]]			; CHECK-THUMB: ldrexd [[REG1:[a-z0-9]+]], [[REG2:[a-z0-9]+]]
	; CHECK-THUMB-LE-DAG: orr.w [[REG3:[a-z0-9]+]], [[REG1]]			; CHECK-THUMB-LE-DAG: orr.w [[REG3:[a-z0-9]+]], [[REG1]]
	; CHECK-THUMB-LE-DAG: orr.w [[REG4:[a-z0-9]+]], [[REG2]]			; CHECK-THUMB-LE-DAG: orr.w [[REG4:[a-z0-9]+]], [[REG2]]
	; CHECK-THUMB-BE-DAG: orr.w [[REG4:[a-z0-9]+]], [[REG2]]			; CHECK-THUMB-BE-DAG: orr.w [[REG4:[a-z0-9]+]], [[REG2]]
	; CHECK-THUMB-BE-DAG: orr.w [[REG3:[a-z0-9]+]], [[REG1]]			; CHECK-THUMB-BE-DAG: orr.w [[REG3:[a-z0-9]+]], [[REG1]]
	; CHECK-THUMB: strexd {{[a-z0-9]+}}, [[REG3]], [[REG4]]			; CHECK-THUMB: strexd {{[a-z0-9]+}}, [[REG3]], [[REG4]]
	; CHECK-THUMB: cmp			; CHECK-THUMB: cmp
	; CHECK-THUMB: bne			; CHECK-THUMB: bne
	; CHECK-THUMB: dmb {{ish$}}			; CHECK-THUMB: dmb {{ish$}}

	; CHECK-M: __sync_fetch_and_or_8			; CHECK-M: __atomic_fetch_or_8

	%r = atomicrmw or i64* %ptr, i64 %val seq_cst			%r = atomicrmw or i64* %ptr, i64 %val seq_cst
	ret i64 %r			ret i64 %r
	}			}

	define i64 @test5(i64* %ptr, i64 %val) {			define i64 @test5(i64* %ptr, i64 %val) {
	; CHECK-LABEL: test5:			; COMMON-LABEL: test5:
	; CHECK: dmb {{ish$}}			; CHECK: dmb {{ish$}}
	; CHECK: ldrexd [[REG1:(r[0-9]?[02468])]], [[REG2:(r[0-9]?[13579])]]			; CHECK: ldrexd [[REG1:(r[0-9]?[02468])]], [[REG2:(r[0-9]?[13579])]]
	; CHECK-LE-DAG: eor [[REG3:(r[0-9]?[02468])]], [[REG1]]			; CHECK-LE-DAG: eor [[REG3:(r[0-9]?[02468])]], [[REG1]]
	; CHECK-LE-DAG: eor [[REG4:(r[0-9]?[13579])]], [[REG2]]			; CHECK-LE-DAG: eor [[REG4:(r[0-9]?[13579])]], [[REG2]]
	; CHECK-BE-DAG: eor [[REG4:(r[0-9]?[13579])]], [[REG2]]			; CHECK-BE-DAG: eor [[REG4:(r[0-9]?[13579])]], [[REG2]]
	; CHECK-BE-DAG: eor [[REG3:(r[0-9]?[02468])]], [[REG1]]			; CHECK-BE-DAG: eor [[REG3:(r[0-9]?[02468])]], [[REG1]]
	; CHECK: strexd {{[a-z0-9]+}}, [[REG3]], [[REG4]]			; CHECK: strexd {{[a-z0-9]+}}, [[REG3]], [[REG4]]
	; CHECK: cmp			; CHECK: cmp
	; CHECK: bne			; CHECK: bne
	; CHECK: dmb {{ish$}}			; CHECK: dmb {{ish$}}

	; CHECK-THUMB-LABEL: test5:
	; CHECK-THUMB: dmb {{ish$}}			; CHECK-THUMB: dmb {{ish$}}
	; CHECK-THUMB: ldrexd [[REG1:[a-z0-9]+]], [[REG2:[a-z0-9]+]]			; CHECK-THUMB: ldrexd [[REG1:[a-z0-9]+]], [[REG2:[a-z0-9]+]]
	; CHECK-THUMB-LE-DAG: eor.w [[REG3:[a-z0-9]+]], [[REG1]]			; CHECK-THUMB-LE-DAG: eor.w [[REG3:[a-z0-9]+]], [[REG1]]
	; CHECK-THUMB-LE-DAG: eor.w [[REG4:[a-z0-9]+]], [[REG2]]			; CHECK-THUMB-LE-DAG: eor.w [[REG4:[a-z0-9]+]], [[REG2]]
	; CHECK-THUMB-BE-DAG: eor.w [[REG4:[a-z0-9]+]], [[REG2]]			; CHECK-THUMB-BE-DAG: eor.w [[REG4:[a-z0-9]+]], [[REG2]]
	; CHECK-THUMB-BE-DAG: eor.w [[REG3:[a-z0-9]+]], [[REG1]]			; CHECK-THUMB-BE-DAG: eor.w [[REG3:[a-z0-9]+]], [[REG1]]
	; CHECK-THUMB: strexd {{[a-z0-9]+}}, [[REG3]], [[REG4]]			; CHECK-THUMB: strexd {{[a-z0-9]+}}, [[REG3]], [[REG4]]
	; CHECK-THUMB: cmp			; CHECK-THUMB: cmp
	; CHECK-THUMB: bne			; CHECK-THUMB: bne
	; CHECK-THUMB: dmb {{ish$}}			; CHECK-THUMB: dmb {{ish$}}

	; CHECK-M: __sync_fetch_and_xor_8			; CHECK-M: __atomic_fetch_xor_8

	%r = atomicrmw xor i64* %ptr, i64 %val seq_cst			%r = atomicrmw xor i64* %ptr, i64 %val seq_cst
	ret i64 %r			ret i64 %r
	}			}

	define i64 @test6(i64* %ptr, i64 %val) {			define i64 @test6(i64* %ptr, i64 %val) {
	; CHECK-LABEL: test6:			; COMMON-LABEL: test6:
	; CHECK: dmb {{ish$}}			; CHECK: dmb {{ish$}}
	; CHECK: ldrexd [[REG1:(r[0-9]?[02468])]], [[REG2:(r[0-9]?[13579])]]			; CHECK: ldrexd [[REG1:(r[0-9]?[02468])]], [[REG2:(r[0-9]?[13579])]]
	; CHECK: strexd {{[a-z0-9]+}}, {{r[0-9]?[02468]}}, {{r[0-9]?[13579]}}			; CHECK: strexd {{[a-z0-9]+}}, {{r[0-9]?[02468]}}, {{r[0-9]?[13579]}}
	; CHECK: cmp			; CHECK: cmp
	; CHECK: bne			; CHECK: bne
	; CHECK: dmb {{ish$}}			; CHECK: dmb {{ish$}}

	; CHECK-THUMB-LABEL: test6:
	; CHECK-THUMB: dmb {{ish$}}			; CHECK-THUMB: dmb {{ish$}}
	; CHECK-THUMB: ldrexd [[REG1:[a-z0-9]+]], [[REG2:[a-z0-9]+]]			; CHECK-THUMB: ldrexd [[REG1:[a-z0-9]+]], [[REG2:[a-z0-9]+]]
	; CHECK-THUMB: strexd {{[a-z0-9]+}}, {{[a-z0-9]+}}, {{[a-z0-9]+}}			; CHECK-THUMB: strexd {{[a-z0-9]+}}, {{[a-z0-9]+}}, {{[a-z0-9]+}}
	; CHECK-THUMB: cmp			; CHECK-THUMB: cmp
	; CHECK-THUMB: bne			; CHECK-THUMB: bne
	; CHECK-THUMB: dmb {{ish$}}			; CHECK-THUMB: dmb {{ish$}}

	; CHECK-M: __sync_lock_test_and_set_8			; CHECK-M: __atomic_exchange_8

	%r = atomicrmw xchg i64* %ptr, i64 %val seq_cst			%r = atomicrmw xchg i64* %ptr, i64 %val seq_cst
	ret i64 %r			ret i64 %r
	}			}

	define i64 @test7(i64* %ptr, i64 %val1, i64 %val2) {			define i64 @test7(i64* %ptr, i64 %val1, i64 %val2) {
	; CHECK-LABEL: test7:			; COMMON-LABEL: test7:
	; CHECK-DAG: mov [[VAL1LO:r[0-9]+]], r1			; CHECK-DAG: mov [[VAL1LO:r[0-9]+]], r1
	; CHECK: ldrexd [[REG1:(r[0-9]?[02468])]], [[REG2:(r[0-9]?[13579])]]			; CHECK: ldrexd [[REG1:(r[0-9]?[02468])]], [[REG2:(r[0-9]?[13579])]]
	; CHECK-LE-DAG: eor [[MISMATCH_LO:.*]], [[REG1]], [[VAL1LO]]			; CHECK-LE-DAG: eor [[MISMATCH_LO:.*]], [[REG1]], [[VAL1LO]]
	; CHECK-LE-DAG: eor [[MISMATCH_HI:.*]], [[REG2]], r2			; CHECK-LE-DAG: eor [[MISMATCH_HI:.*]], [[REG2]], r2
	; CHECK-BE-DAG: eor [[MISMATCH_LO:.*]], [[REG2]], r2			; CHECK-BE-DAG: eor [[MISMATCH_LO:.*]], [[REG2]], r2
	; CHECK-BE-DAG: eor [[MISMATCH_HI:.*]], [[REG1]], r1			; CHECK-BE-DAG: eor [[MISMATCH_HI:.*]], [[REG1]], r1
	; CHECK: orrs {{r[0-9]+}}, [[MISMATCH_LO]], [[MISMATCH_HI]]			; CHECK: orrs {{r[0-9]+}}, [[MISMATCH_LO]], [[MISMATCH_HI]]
	; CHECK: bne			; CHECK: bne
	; CHECK-DAG: dmb {{ish$}}			; CHECK-DAG: dmb {{ish$}}
	; CHECK: strexd {{[a-z0-9]+}}, {{r[0-9]?[02468]}}, {{r[0-9]?[13579]}}			; CHECK: strexd {{[a-z0-9]+}}, {{r[0-9]?[02468]}}, {{r[0-9]?[13579]}}
	; CHECK: cmp			; CHECK: cmp
	; CHECK: beq			; CHECK: beq
	; CHECK: dmb {{ish$}}			; CHECK: dmb {{ish$}}

	; CHECK-THUMB-LABEL: test7:
	; CHECK-THUMB: ldrexd [[REG1:[a-z0-9]+]], [[REG2:[a-z0-9]+]]			; CHECK-THUMB: ldrexd [[REG1:[a-z0-9]+]], [[REG2:[a-z0-9]+]]
	; CHECK-THUMB-LE-DAG: eor.w [[MISMATCH_LO:[a-z0-9]+]], [[REG1]], r2			; CHECK-THUMB-LE-DAG: eor.w [[MISMATCH_LO:[a-z0-9]+]], [[REG1]], r2
	; CHECK-THUMB-LE-DAG: eor.w [[MISMATCH_HI:[a-z0-9]+]], [[REG2]], r3			; CHECK-THUMB-LE-DAG: eor.w [[MISMATCH_HI:[a-z0-9]+]], [[REG2]], r3
	; CHECK-THUMB-BE-DAG: eor.w [[MISMATCH_HI:[a-z0-9]+]], [[REG1]], r2			; CHECK-THUMB-BE-DAG: eor.w [[MISMATCH_HI:[a-z0-9]+]], [[REG1]], r2
	; CHECK-THUMB-BE-DAG: eor.w [[MISMATCH_LO:[a-z0-9]+]], [[REG2]], r3			; CHECK-THUMB-BE-DAG: eor.w [[MISMATCH_LO:[a-z0-9]+]], [[REG2]], r3
	; CHECK-THUMB-LE: orrs.w {{.*}}, [[MISMATCH_LO]], [[MISMATCH_HI]]			; CHECK-THUMB-LE: orrs.w {{.*}}, [[MISMATCH_LO]], [[MISMATCH_HI]]
	; CHECK-THUMB: bne			; CHECK-THUMB: bne
	; CHECK-THUMB: dmb {{ish$}}			; CHECK-THUMB: dmb {{ish$}}
	; CHECK-THUMB: strexd {{[a-z0-9]+}}, {{[a-z0-9]+}}, {{[a-z0-9]+}}			; CHECK-THUMB: strexd {{[a-z0-9]+}}, {{[a-z0-9]+}}, {{[a-z0-9]+}}
	; CHECK-THUMB: cmp			; CHECK-THUMB: cmp
	; CHECK-THUMB: beq			; CHECK-THUMB: beq
	; CHECK-THUMB: dmb {{ish$}}			; CHECK-THUMB: dmb {{ish$}}

	; CHECK-M: __sync_val_compare_and_swap_8			; CHECK-M: __atomic_compare_exchange_8

	%pair = cmpxchg i64* %ptr, i64 %val1, i64 %val2 seq_cst seq_cst			%pair = cmpxchg i64* %ptr, i64 %val1, i64 %val2 seq_cst seq_cst
	%r = extractvalue { i64, i1 } %pair, 0			%r = extractvalue { i64, i1 } %pair, 0
	ret i64 %r			ret i64 %r
	}			}

	; Compiles down to a single ldrexd, except on M class devices where ldrexd			; Compiles down to a single ldrexd, except on M class devices where ldrexd
	; isn't supported.			; isn't supported.
	define i64 @test8(i64* %ptr) {			define i64 @test8(i64* %ptr) {
	; CHECK-LABEL: test8:			; COMMON-LABEL: test8:
	; CHECK: ldrexd [[REG1:(r[0-9]?[02468])]], [[REG2:(r[0-9]?[13579])]]			; CHECK: ldrexd [[REG1:(r[0-9]?[02468])]], [[REG2:(r[0-9]?[13579])]]
	; CHECK-NOT: strexd			; CHECK-NOT: strexd
	; CHECK: clrex			; CHECK: clrex
	; CHECK-NOT: strexd			; CHECK-NOT: strexd
	; CHECK: dmb {{ish$}}			; CHECK: dmb {{ish$}}

	; CHECK-THUMB-LABEL: test8:
	; CHECK-THUMB: ldrexd [[REG1:[a-z0-9]+]], [[REG2:[a-z0-9]+]]			; CHECK-THUMB: ldrexd [[REG1:[a-z0-9]+]], [[REG2:[a-z0-9]+]]
	; CHECK-THUMB-NOT: strexd			; CHECK-THUMB-NOT: strexd
	; CHECK-THUMB: clrex			; CHECK-THUMB: clrex
	; CHECK-THUMB-NOT: strexd			; CHECK-THUMB-NOT: strexd
	; CHECK-THUMB: dmb {{ish$}}			; CHECK-THUMB: dmb {{ish$}}

	; CHECK-M: __sync_val_compare_and_swap_8			; CHECK-M: __atomic_load_8

	%r = load atomic i64, i64* %ptr seq_cst, align 8			%r = load atomic i64, i64* %ptr seq_cst, align 8
	ret i64 %r			ret i64 %r
	}			}

	; Compiles down to atomicrmw xchg; there really isn't any more efficient			; Compiles down to atomicrmw xchg; there really isn't any more efficient
	; way to write it. Except on M class devices, where ldrexd/strexd aren't			; way to write it. Except on M class devices, where ldrexd/strexd aren't
	; supported.			; supported.
	define void @test9(i64* %ptr, i64 %val) {			define void @test9(i64* %ptr, i64 %val) {
	; CHECK-LABEL: test9:			; COMMON-LABEL: test9:
	; CHECK: dmb {{ish$}}			; CHECK: dmb {{ish$}}
	; CHECK: ldrexd [[REG1:(r[0-9]?[02468])]], [[REG2:(r[0-9]?[13579])]]			; CHECK: ldrexd [[REG1:(r[0-9]?[02468])]], [[REG2:(r[0-9]?[13579])]]
	; CHECK: strexd {{[a-z0-9]+}}, {{r[0-9]?[02468]}}, {{r[0-9]?[13579]}}			; CHECK: strexd {{[a-z0-9]+}}, {{r[0-9]?[02468]}}, {{r[0-9]?[13579]}}
	; CHECK: cmp			; CHECK: cmp
	; CHECK: bne			; CHECK: bne
	; CHECK: dmb {{ish$}}			; CHECK: dmb {{ish$}}

	; CHECK-THUMB-LABEL: test9:
	; CHECK-THUMB: dmb {{ish$}}			; CHECK-THUMB: dmb {{ish$}}
	; CHECK-THUMB: ldrexd [[REG1:[a-z0-9]+]], [[REG2:[a-z0-9]+]]			; CHECK-THUMB: ldrexd [[REG1:[a-z0-9]+]], [[REG2:[a-z0-9]+]]
	; CHECK-THUMB: strexd {{[a-z0-9]+}}, {{[a-z0-9]+}}, {{[a-z0-9]+}}			; CHECK-THUMB: strexd {{[a-z0-9]+}}, {{[a-z0-9]+}}, {{[a-z0-9]+}}
	; CHECK-THUMB: cmp			; CHECK-THUMB: cmp
	; CHECK-THUMB: bne			; CHECK-THUMB: bne
	; CHECK-THUMB: dmb {{ish$}}			; CHECK-THUMB: dmb {{ish$}}

	; CHECK-M: __sync_lock_test_and_set_8			; CHECK-M: __atomic_store_8

	store atomic i64 %val, i64* %ptr seq_cst, align 8			store atomic i64 %val, i64* %ptr seq_cst, align 8
	ret void			ret void
	}			}

	define i64 @test10(i64* %ptr, i64 %val) {			define i64 @test10(i64* %ptr, i64 %val) {
	; CHECK-LABEL: test10:			; COMMON-LABEL: test10:
	; CHECK: dmb {{ish$}}			; CHECK: dmb {{ish$}}
	; CHECK: ldrexd [[REG1:(r[0-9]?[02468])]], [[REG2:(r[0-9]?[13579])]]			; CHECK: ldrexd [[REG1:(r[0-9]?[02468])]], [[REG2:(r[0-9]?[13579])]]
	; CHECK: mov [[OUT_HI:[a-z0-9]+]], r2			; CHECK: mov [[OUT_HI:[a-z0-9]+]], r2
	; CHECK-LE: subs {{[^,]+}}, r1, [[REG1]]			; CHECK-LE: subs {{[^,]+}}, r1, [[REG1]]
	; CHECK-BE: subs {{[^,]+}}, r2, [[REG2]]			; CHECK-BE: subs {{[^,]+}}, r2, [[REG2]]
	; CHECK-LE: sbcs {{[^,]+}}, r2, [[REG2]]			; CHECK-LE: sbcs {{[^,]+}}, r2, [[REG2]]
	; CHECK-BE: sbcs {{[^,]+}}, r1, [[REG1]]			; CHECK-BE: sbcs {{[^,]+}}, r1, [[REG1]]
	; CHECK: mov [[CMP:[a-z0-9]+]], #0			; CHECK: mov [[CMP:[a-z0-9]+]], #0
	; CHECK: movwge [[CMP]], #1			; CHECK: movwge [[CMP]], #1
	; CHECK: cmp [[CMP]], #0			; CHECK: cmp [[CMP]], #0
	; CHECK: movne [[OUT_HI]], [[REG2]]			; CHECK: movne [[OUT_HI]], [[REG2]]
	; CHECK: mov [[OUT_LO:[a-z0-9]+]], r1			; CHECK: mov [[OUT_LO:[a-z0-9]+]], r1
	; CHECK: movne [[OUT_LO]], [[REG1]]			; CHECK: movne [[OUT_LO]], [[REG1]]
	; CHECK: strexd {{[a-z0-9]+}}, [[OUT_LO]], [[OUT_HI]]			; CHECK: strexd {{[a-z0-9]+}}, [[OUT_LO]], [[OUT_HI]]
	; CHECK: cmp			; CHECK: cmp
	; CHECK: bne			; CHECK: bne
	; CHECK: dmb {{ish$}}			; CHECK: dmb {{ish$}}

	; CHECK-THUMB-LABEL: test10:
	; CHECK-THUMB: dmb {{ish$}}			; CHECK-THUMB: dmb {{ish$}}
	; CHECK-THUMB: ldrexd [[REG1:[a-z0-9]+]], [[REG2:[a-z0-9]+]]			; CHECK-THUMB: ldrexd [[REG1:[a-z0-9]+]], [[REG2:[a-z0-9]+]]
	; CHECK-THUMB: mov [[OUT_LO:[a-z0-9]+]], r2			; CHECK-THUMB: mov [[OUT_LO:[a-z0-9]+]], r2
	; CHECK-THUMB-LE: subs.w {{[^,]+}}, r2, [[REG1]]			; CHECK-THUMB-LE: subs.w {{[^,]+}}, r2, [[REG1]]
	; CHECK-THUMB-BE: subs.w {{[^,]+}}, r3, [[REG2]]			; CHECK-THUMB-BE: subs.w {{[^,]+}}, r3, [[REG2]]
	; CHECK-THUMB-LE: sbcs.w {{[^,]+}}, r3, [[REG2]]			; CHECK-THUMB-LE: sbcs.w {{[^,]+}}, r3, [[REG2]]
	; CHECK-THUMB-BE: sbcs.w {{[^,]+}}, r2, [[REG1]]			; CHECK-THUMB-BE: sbcs.w {{[^,]+}}, r2, [[REG1]]
	; CHECK-THUMB: mov.w [[CMP:[a-z0-9]+]], #0			; CHECK-THUMB: mov.w [[CMP:[a-z0-9]+]], #0
	; CHECK-THUMB: movge.w [[CMP]], #1			; CHECK-THUMB: movge.w [[CMP]], #1
	; CHECK-THUMB: cmp.w [[CMP]], #0			; CHECK-THUMB: cmp.w [[CMP]], #0
	; CHECK-THUMB: mov [[OUT_HI:[a-z0-9]+]], r3			; CHECK-THUMB: mov [[OUT_HI:[a-z0-9]+]], r3
	; CHECK-THUMB: movne [[OUT_HI]], [[REG2]]			; CHECK-THUMB: movne [[OUT_HI]], [[REG2]]
	; CHECK-THUMB: movne [[OUT_LO]], [[REG1]]			; CHECK-THUMB: movne [[OUT_LO]], [[REG1]]
	; CHECK-THUMB: strexd {{[a-z0-9]+}}, [[OUT_LO]], [[OUT_HI]]			; CHECK-THUMB: strexd {{[a-z0-9]+}}, [[OUT_LO]], [[OUT_HI]]
	; CHECK-THUMB: cmp			; CHECK-THUMB: cmp
	; CHECK-THUMB: bne			; CHECK-THUMB: bne
	; CHECK-THUMB: dmb {{ish$}}			; CHECK-THUMB: dmb {{ish$}}

	; CHECK-M: __sync_fetch_and_min_8			; CHECK-M: __atomic_compare_exchange_8

	%r = atomicrmw min i64* %ptr, i64 %val seq_cst			%r = atomicrmw min i64* %ptr, i64 %val seq_cst
	ret i64 %r			ret i64 %r
	}			}

	define i64 @test11(i64* %ptr, i64 %val) {			define i64 @test11(i64* %ptr, i64 %val) {
	; CHECK-LABEL: test11:			; COMMON-LABEL: test11:
	; CHECK: dmb {{ish$}}			; CHECK: dmb {{ish$}}
	; CHECK: ldrexd [[REG1:(r[0-9]?[02468])]], [[REG2:(r[0-9]?[13579])]]			; CHECK: ldrexd [[REG1:(r[0-9]?[02468])]], [[REG2:(r[0-9]?[13579])]]
	; CHECK: mov [[OUT_HI:[a-z0-9]+]], r2			; CHECK: mov [[OUT_HI:[a-z0-9]+]], r2
	; CHECK-LE: subs {{[^,]+}}, r1, [[REG1]]			; CHECK-LE: subs {{[^,]+}}, r1, [[REG1]]
	; CHECK-BE: subs {{[^,]+}}, r2, [[REG2]]			; CHECK-BE: subs {{[^,]+}}, r2, [[REG2]]
	; CHECK-LE: sbcs {{[^,]+}}, r2, [[REG2]]			; CHECK-LE: sbcs {{[^,]+}}, r2, [[REG2]]
	; CHECK-BE: sbcs {{[^,]+}}, r1, [[REG1]]			; CHECK-BE: sbcs {{[^,]+}}, r1, [[REG1]]
	; CHECK: mov [[CMP:[a-z0-9]+]], #0			; CHECK: mov [[CMP:[a-z0-9]+]], #0
	; CHECK: movwhs [[CMP]], #1			; CHECK: movwhs [[CMP]], #1
	; CHECK: cmp [[CMP]], #0			; CHECK: cmp [[CMP]], #0
	; CHECK: movne [[OUT_HI]], [[REG2]]			; CHECK: movne [[OUT_HI]], [[REG2]]
	; CHECK: mov [[OUT_LO:[a-z0-9]+]], r1			; CHECK: mov [[OUT_LO:[a-z0-9]+]], r1
	; CHECK: movne [[OUT_LO]], [[REG1]]			; CHECK: movne [[OUT_LO]], [[REG1]]
	; CHECK: strexd {{[a-z0-9]+}}, [[OUT_LO]], [[OUT_HI]]			; CHECK: strexd {{[a-z0-9]+}}, [[OUT_LO]], [[OUT_HI]]
	; CHECK: cmp			; CHECK: cmp
	; CHECK: bne			; CHECK: bne
	; CHECK: dmb {{ish$}}			; CHECK: dmb {{ish$}}

	; CHECK-THUMB-LABEL: test11:
	; CHECK-THUMB: dmb {{ish$}}			; CHECK-THUMB: dmb {{ish$}}
	; CHECK-THUMB: ldrexd [[REG1:[a-z0-9]+]], [[REG2:[a-z0-9]+]]			; CHECK-THUMB: ldrexd [[REG1:[a-z0-9]+]], [[REG2:[a-z0-9]+]]
	; CHECK-THUMB: mov [[OUT_LO:[a-z0-9]+]], r2			; CHECK-THUMB: mov [[OUT_LO:[a-z0-9]+]], r2
	; CHECK-THUMB-LE: subs.w {{[^,]+}}, r2, [[REG1]]			; CHECK-THUMB-LE: subs.w {{[^,]+}}, r2, [[REG1]]
	; CHECK-THUMB-BE: subs.w {{[^,]+}}, r3, [[REG2]]			; CHECK-THUMB-BE: subs.w {{[^,]+}}, r3, [[REG2]]
	; CHECK-THUMB-LE: sbcs.w {{[^,]+}}, r3, [[REG2]]			; CHECK-THUMB-LE: sbcs.w {{[^,]+}}, r3, [[REG2]]
	; CHECK-THUMB-BE: sbcs.w {{[^,]+}}, r2, [[REG1]]			; CHECK-THUMB-BE: sbcs.w {{[^,]+}}, r2, [[REG1]]
	; CHECK-THUMB: mov.w [[CMP:[a-z0-9]+]], #0			; CHECK-THUMB: mov.w [[CMP:[a-z0-9]+]], #0
	; CHECK-THUMB: movhs.w [[CMP]], #1			; CHECK-THUMB: movhs.w [[CMP]], #1
	; CHECK-THUMB: cmp.w [[CMP]], #0			; CHECK-THUMB: cmp.w [[CMP]], #0
	; CHECK-THUMB: mov [[OUT_HI:[a-z0-9]+]], r3			; CHECK-THUMB: mov [[OUT_HI:[a-z0-9]+]], r3
	; CHECK-THUMB: movne [[OUT_HI]], [[REG2]]			; CHECK-THUMB: movne [[OUT_HI]], [[REG2]]
	; CHECK-THUMB: movne [[OUT_LO]], [[REG1]]			; CHECK-THUMB: movne [[OUT_LO]], [[REG1]]
	; CHECK-THUMB: strexd {{[a-z0-9]+}}, [[OUT_LO]], [[OUT_HI]]			; CHECK-THUMB: strexd {{[a-z0-9]+}}, [[OUT_LO]], [[OUT_HI]]
	; CHECK-THUMB: cmp			; CHECK-THUMB: cmp
	; CHECK-THUMB: bne			; CHECK-THUMB: bne
	; CHECK-THUMB: dmb {{ish$}}			; CHECK-THUMB: dmb {{ish$}}

	; CHECK-M: __sync_fetch_and_umin_8			; CHECK-M: __atomic_compare_exchange_8

	%r = atomicrmw umin i64* %ptr, i64 %val seq_cst			%r = atomicrmw umin i64* %ptr, i64 %val seq_cst
	ret i64 %r			ret i64 %r
	}			}

	define i64 @test12(i64* %ptr, i64 %val) {			define i64 @test12(i64* %ptr, i64 %val) {
	; CHECK-LABEL: test12:			; COMMON-LABEL: test12:
	; CHECK: dmb {{ish$}}			; CHECK: dmb {{ish$}}
	; CHECK: ldrexd [[REG1:(r[0-9]?[02468])]], [[REG2:(r[0-9]?[13579])]]			; CHECK: ldrexd [[REG1:(r[0-9]?[02468])]], [[REG2:(r[0-9]?[13579])]]
	; CHECK: mov [[OUT_HI:[a-z0-9]+]], r2			; CHECK: mov [[OUT_HI:[a-z0-9]+]], r2
	; CHECK-LE: subs {{[^,]+}}, r1, [[REG1]]			; CHECK-LE: subs {{[^,]+}}, r1, [[REG1]]
	; CHECK-BE: subs {{[^,]+}}, r2, [[REG2]]			; CHECK-BE: subs {{[^,]+}}, r2, [[REG2]]
	; CHECK-LE: sbcs {{[^,]+}}, r2, [[REG2]]			; CHECK-LE: sbcs {{[^,]+}}, r2, [[REG2]]
	; CHECK-BE: sbcs {{[^,]+}}, r1, [[REG1]]			; CHECK-BE: sbcs {{[^,]+}}, r1, [[REG1]]
	; CHECK: mov [[CMP:[a-z0-9]+]], #0			; CHECK: mov [[CMP:[a-z0-9]+]], #0
	; CHECK: movwlt [[CMP]], #1			; CHECK: movwlt [[CMP]], #1
	; CHECK: cmp [[CMP]], #0			; CHECK: cmp [[CMP]], #0
	; CHECK: movne [[OUT_HI]], [[REG2]]			; CHECK: movne [[OUT_HI]], [[REG2]]
	; CHECK: mov [[OUT_LO:[a-z0-9]+]], r1			; CHECK: mov [[OUT_LO:[a-z0-9]+]], r1
	; CHECK: movne [[OUT_LO]], [[REG1]]			; CHECK: movne [[OUT_LO]], [[REG1]]
	; CHECK: strexd {{[a-z0-9]+}}, [[OUT_LO]], [[OUT_HI]]			; CHECK: strexd {{[a-z0-9]+}}, [[OUT_LO]], [[OUT_HI]]
	; CHECK: cmp			; CHECK: cmp
	; CHECK: bne			; CHECK: bne
	; CHECK: dmb {{ish$}}			; CHECK: dmb {{ish$}}

	; CHECK-THUMB-LABEL: test12:
	; CHECK-THUMB: dmb {{ish$}}			; CHECK-THUMB: dmb {{ish$}}
	; CHECK-THUMB: ldrexd [[REG1:[a-z0-9]+]], [[REG2:[a-z0-9]+]]			; CHECK-THUMB: ldrexd [[REG1:[a-z0-9]+]], [[REG2:[a-z0-9]+]]
	; CHECK-THUMB: mov [[OUT_LO:[a-z0-9]+]], r2			; CHECK-THUMB: mov [[OUT_LO:[a-z0-9]+]], r2
	; CHECK-THUMB-LE: subs.w {{[^,]+}}, r2, [[REG1]]			; CHECK-THUMB-LE: subs.w {{[^,]+}}, r2, [[REG1]]
	; CHECK-THUMB-BE: subs.w {{[^,]+}}, r3, [[REG2]]			; CHECK-THUMB-BE: subs.w {{[^,]+}}, r3, [[REG2]]
	; CHECK-THUMB-LE: sbcs.w {{[^,]+}}, r3, [[REG2]]			; CHECK-THUMB-LE: sbcs.w {{[^,]+}}, r3, [[REG2]]
	; CHECK-THUMB-BE: sbcs.w {{[^,]+}}, r2, [[REG1]]			; CHECK-THUMB-BE: sbcs.w {{[^,]+}}, r2, [[REG1]]
	; CHECK-THUMB: mov.w [[CMP:[a-z0-9]+]], #0			; CHECK-THUMB: mov.w [[CMP:[a-z0-9]+]], #0
	; CHECK-THUMB: movlt.w [[CMP]], #1			; CHECK-THUMB: movlt.w [[CMP]], #1
	; CHECK-THUMB: cmp.w [[CMP]], #0			; CHECK-THUMB: cmp.w [[CMP]], #0
	; CHECK-THUMB: mov [[OUT_HI:[a-z0-9]+]], r3			; CHECK-THUMB: mov [[OUT_HI:[a-z0-9]+]], r3
	; CHECK-THUMB: movne [[OUT_HI]], [[REG2]]			; CHECK-THUMB: movne [[OUT_HI]], [[REG2]]
	; CHECK-THUMB: movne [[OUT_LO]], [[REG1]]			; CHECK-THUMB: movne [[OUT_LO]], [[REG1]]
	; CHECK-THUMB: strexd {{[a-z0-9]+}}, [[OUT_LO]], [[OUT_HI]]			; CHECK-THUMB: strexd {{[a-z0-9]+}}, [[OUT_LO]], [[OUT_HI]]
	; CHECK-THUMB: cmp			; CHECK-THUMB: cmp
	; CHECK-THUMB: bne			; CHECK-THUMB: bne
	; CHECK-THUMB: dmb {{ish$}}			; CHECK-THUMB: dmb {{ish$}}

	; CHECK-M: __sync_fetch_and_max_8			; CHECK-M: __atomic_compare_exchange_8

	%r = atomicrmw max i64* %ptr, i64 %val seq_cst			%r = atomicrmw max i64* %ptr, i64 %val seq_cst
	ret i64 %r			ret i64 %r
	}			}

	define i64 @test13(i64* %ptr, i64 %val) {			define i64 @test13(i64* %ptr, i64 %val) {
	; CHECK-LABEL: test13:			; COMMON-LABEL: test13:
	; CHECK: dmb {{ish$}}			; CHECK: dmb {{ish$}}
	; CHECK: ldrexd [[REG1:(r[0-9]?[02468])]], [[REG2:(r[0-9]?[13579])]]			; CHECK: ldrexd [[REG1:(r[0-9]?[02468])]], [[REG2:(r[0-9]?[13579])]]
	; CHECK: mov [[OUT_HI:[a-z0-9]+]], r2			; CHECK: mov [[OUT_HI:[a-z0-9]+]], r2
	; CHECK-LE: subs {{[^,]+}}, r1, [[REG1]]			; CHECK-LE: subs {{[^,]+}}, r1, [[REG1]]
	; CHECK-BE: subs {{[^,]+}}, r2, [[REG2]]			; CHECK-BE: subs {{[^,]+}}, r2, [[REG2]]
	; CHECK-LE: sbcs {{[^,]+}}, r2, [[REG2]]			; CHECK-LE: sbcs {{[^,]+}}, r2, [[REG2]]
	; CHECK-BE: sbcs {{[^,]+}}, r1, [[REG1]]			; CHECK-BE: sbcs {{[^,]+}}, r1, [[REG1]]
	; CHECK: mov [[CMP:[a-z0-9]+]], #0			; CHECK: mov [[CMP:[a-z0-9]+]], #0
	; CHECK: movwlo [[CMP]], #1			; CHECK: movwlo [[CMP]], #1
	; CHECK: cmp [[CMP]], #0			; CHECK: cmp [[CMP]], #0
	; CHECK: movne [[OUT_HI]], [[REG2]]			; CHECK: movne [[OUT_HI]], [[REG2]]
	; CHECK: mov [[OUT_LO:[a-z0-9]+]], r1			; CHECK: mov [[OUT_LO:[a-z0-9]+]], r1
	; CHECK: movne [[OUT_LO]], [[REG1]]			; CHECK: movne [[OUT_LO]], [[REG1]]
	; CHECK: strexd {{[a-z0-9]+}}, [[OUT_LO]], [[OUT_HI]]			; CHECK: strexd {{[a-z0-9]+}}, [[OUT_LO]], [[OUT_HI]]
	; CHECK: cmp			; CHECK: cmp
	; CHECK: bne			; CHECK: bne
	; CHECK: dmb {{ish$}}			; CHECK: dmb {{ish$}}

	; CHECK-THUMB-LABEL: test13:
	; CHECK-THUMB: dmb {{ish$}}			; CHECK-THUMB: dmb {{ish$}}
	; CHECK-THUMB: ldrexd [[REG1:[a-z0-9]+]], [[REG2:[a-z0-9]+]]			; CHECK-THUMB: ldrexd [[REG1:[a-z0-9]+]], [[REG2:[a-z0-9]+]]
	; CHECK-THUMB: mov [[OUT_LO:[a-z0-9]+]], r2			; CHECK-THUMB: mov [[OUT_LO:[a-z0-9]+]], r2
	; CHECK-THUMB-LE: subs.w {{[^,]+}}, r2, [[REG1]]			; CHECK-THUMB-LE: subs.w {{[^,]+}}, r2, [[REG1]]
	; CHECK-THUMB-BE: subs.w {{[^,]+}}, r3, [[REG2]]			; CHECK-THUMB-BE: subs.w {{[^,]+}}, r3, [[REG2]]
	; CHECK-THUMB-LE: sbcs.w {{[^,]+}}, r3, [[REG2]]			; CHECK-THUMB-LE: sbcs.w {{[^,]+}}, r3, [[REG2]]
	; CHECK-THUMB-BE: sbcs.w {{[^,]+}}, r2, [[REG1]]			; CHECK-THUMB-BE: sbcs.w {{[^,]+}}, r2, [[REG1]]
	; CHECK-THUMB: mov.w [[CMP:[a-z0-9]+]], #0			; CHECK-THUMB: mov.w [[CMP:[a-z0-9]+]], #0
	; CHECK-THUMB: movlo.w [[CMP]], #1			; CHECK-THUMB: movlo.w [[CMP]], #1
	; CHECK-THUMB: cmp.w [[CMP]], #0			; CHECK-THUMB: cmp.w [[CMP]], #0
	; CHECK-THUMB: mov [[OUT_HI:[a-z0-9]+]], r3			; CHECK-THUMB: mov [[OUT_HI:[a-z0-9]+]], r3
	; CHECK-THUMB: movne [[OUT_HI]], [[REG2]]			; CHECK-THUMB: movne [[OUT_HI]], [[REG2]]
	; CHECK-THUMB: movne [[OUT_LO]], [[REG1]]			; CHECK-THUMB: movne [[OUT_LO]], [[REG1]]
	; CHECK-THUMB: strexd {{[a-z0-9]+}}, [[OUT_LO]], [[OUT_HI]]			; CHECK-THUMB: strexd {{[a-z0-9]+}}, [[OUT_LO]], [[OUT_HI]]
	; CHECK-THUMB: cmp			; CHECK-THUMB: cmp
	; CHECK-THUMB: bne			; CHECK-THUMB: bne
	; CHECK-THUMB: dmb {{ish$}}			; CHECK-THUMB: dmb {{ish$}}

	; CHECK-M: __sync_fetch_and_umax_8			; CHECK-M: __atomic_compare_exchange_8

	%r = atomicrmw umax i64* %ptr, i64 %val seq_cst			%r = atomicrmw umax i64* %ptr, i64 %val seq_cst
	ret i64 %r			ret i64 %r
	}			}

llvm/test/CodeGen/ARM/atomic-load-store.ll

	; RUN: llc < %s -mtriple=armv7-apple-ios -verify-machineinstrs \| FileCheck %s -check-prefix=ARM			; RUN: llc < %s -mtriple=armv7-apple-ios -verify-machineinstrs \| FileCheck %s -check-prefixes=CHECK,ARM
	; RUN: llc < %s -mtriple=armv7-apple-ios -O0 \| FileCheck %s -check-prefix=ARM			; RUN: llc < %s -mtriple=armv7-apple-ios -O0 \| FileCheck %s -check-prefixes=CHECK,ARM
	; RUN: llc < %s -mtriple=thumbv7-apple-ios -verify-machineinstrs \| FileCheck %s -check-prefix=THUMBTWO			; RUN: llc < %s -mtriple=thumbv7-apple-ios -verify-machineinstrs \| FileCheck %s -check-prefixes=CHECK,THUMBTWO
	; RUN: llc < %s -mtriple=thumbv6-apple-ios \| FileCheck %s -check-prefix=THUMBONE			; RUN: llc < %s -mtriple=thumbv6-apple-ios \| FileCheck %s -check-prefixes=CHECK,THUMBONE
	; RUN: llc < %s -mtriple=armv4-apple-ios \| FileCheck %s -check-prefix=ARMV4			; RUN: llc < %s -mtriple=armv4-apple-ios \| FileCheck %s -check-prefixes=CHECK,ARMV4
	; RUN: llc < %s -mtriple=armv6-apple-ios \| FileCheck %s -check-prefix=ARMV6			; RUN: llc < %s -mtriple=armv6-apple-ios \| FileCheck %s -check-prefixes=CHECK,ARMV6
	; RUN: llc < %s -mtriple=thumbv7m-apple-ios \| FileCheck %s -check-prefix=THUMBM			; RUN: llc < %s -mtriple=thumbv7m-apple-ios \| FileCheck %s -check-prefixes=CHECK,THUMBM

	define void @test1(i32* %ptr, i32 %val1) {			define void @test1(i32* %ptr, i32 %val1) {
	; ARM-LABEL: test1			; CHECK-LABEL: test1:
	; ARM: dmb {{ish$}}			; ARM: dmb {{ish$}}
	; ARM-NEXT: str			; ARM-NEXT: str
	; ARM-NEXT: dmb {{ish$}}			; ARM-NEXT: dmb {{ish$}}
	; THUMBONE-LABEL: test1			; THUMBONE: ___sync_synchronize
	; THUMBONE: __sync_lock_test_and_set_4			; THUMBONE-NEXT: str
	; THUMBTWO-LABEL: test1			; THUMBONE-NEXT: ___sync_synchronize
	; THUMBTWO: dmb {{ish$}}			; THUMBTWO: dmb {{ish$}}
	; THUMBTWO-NEXT: str			; THUMBTWO-NEXT: str
	; THUMBTWO-NEXT: dmb {{ish$}}			; THUMBTWO-NEXT: dmb {{ish$}}
	; ARMV6-LABEL: test1
	; ARMV6: mcr p15, #0, {{r[0-9]*}}, c7, c10, #5			; ARMV6: mcr p15, #0, {{r[0-9]*}}, c7, c10, #5
	; ARMV6: str			; ARMV6: str
	; ARMV6: mcr p15, #0, {{r[0-9]*}}, c7, c10, #5			; ARMV6: mcr p15, #0, {{r[0-9]*}}, c7, c10, #5
	; THUMBM-LABEL: test1
	; THUMBM: dmb sy			; THUMBM: dmb sy
	; THUMBM: str			; THUMBM: str
	; THUMBM: dmb sy			; THUMBM: dmb sy
	store atomic i32 %val1, i32* %ptr seq_cst, align 4			store atomic i32 %val1, i32* %ptr seq_cst, align 4
	ret void			ret void
	}			}

	define i32 @test2(i32* %ptr) {			define i32 @test2(i32* %ptr) {
	; ARM-LABEL: test2			; CHECK-LABEL: test2:

	; ARM: ldr			; ARM: ldr
	; ARM-NEXT: dmb {{ish$}}			; ARM-NEXT: dmb {{ish$}}
	; THUMBONE-LABEL: test2			; THUMBONE: ldr
	; THUMBONE: __sync_val_compare_and_swap_4			; THUMBONE: __sync_synchronize
	; THUMBTWO-LABEL: test2
	; THUMBTWO: ldr			; THUMBTWO: ldr
	; THUMBTWO-NEXT: dmb {{ish$}}			; THUMBTWO-NEXT: dmb {{ish$}}
	; ARMV6-LABEL: test2
	; ARMV6: ldr			; ARMV6: ldr
	; ARMV6: mcr p15, #0, {{r[0-9]*}}, c7, c10, #5			; ARMV6: mcr p15, #0, {{r[0-9]*}}, c7, c10, #5
	; THUMBM-LABEL: test2
	; THUMBM: ldr			; THUMBM: ldr
	; THUMBM: dmb sy			; THUMBM: dmb sy
	%val = load atomic i32, i32* %ptr seq_cst, align 4			%val = load atomic i32, i32* %ptr seq_cst, align 4
	ret i32 %val			ret i32 %val
	}			}

	define void @test3(i8* %ptr1, i8* %ptr2) {			define void @test3(i8* %ptr1, i8* %ptr2) {
	; ARM-LABEL: test3			; CHECK-LABEL: test3:

	; ARM-NOT: dmb			; ARM-NOT: dmb
	; ARM: ldrb			; ARM: ldrb
	; ARM-NOT: dmb			; ARM-NOT: dmb
	; ARM: strb			; ARM: strb
	; ARM-NOT: dmb			; ARM-NOT: dmb
	; ARM: bx lr			; ARM: bx lr

	; THUMBTWO-LABEL: test3
	; THUMBTWO-NOT: dmb			; THUMBTWO-NOT: dmb
	; THUMBTWO: ldrb			; THUMBTWO: ldrb
	; THUMBTWO-NOT: dmb			; THUMBTWO-NOT: dmb
	; THUMBTWO: strb			; THUMBTWO: strb
	; THUMBTWO-NOT: dmb			; THUMBTWO-NOT: dmb
	; THUMBTWO: bx lr			; THUMBTWO: bx lr

	; THUMBONE-LABEL: test3
	; THUMBONE-NOT: dmb			; THUMBONE-NOT: dmb
				; THUMBONE-NOT: __sync_synchronize
	; THUMBONE: ldrb			; THUMBONE: ldrb
	; THUMBONE-NOT: dmb			; THUMBONE-NOT: dmb
				; THUMBONE-NOT: __sync_synchronize
	; THUMBONE: strb			; THUMBONE: strb
	; THUMBONE-NOT: dmb			; THUMBONE-NOT: dmb
				; THUMBONE-NOT: __sync_synchronize

	; ARMV6-LABEL: test3
	; ARMV6-NOT: mcr			; ARMV6-NOT: mcr
	; THUMBM-LABEL: test3
	; THUMBM-NOT: dmb sy			; THUMBM-NOT: dmb sy
	%val = load atomic i8, i8* %ptr1 unordered, align 1			%val = load atomic i8, i8* %ptr1 unordered, align 1
	store atomic i8 %val, i8* %ptr2 unordered, align 1			store atomic i8 %val, i8* %ptr2 unordered, align 1
	ret void			ret void
	}			}

	define void @test4(i8* %ptr1, i8* %ptr2) {			define void @test4(i8* %ptr1, i8* %ptr2) {
	; THUMBONE-LABEL: test4			; CHECK-LABEL: test4
	; THUMBONE: ___sync_val_compare_and_swap_1
	; THUMBONE: ___sync_lock_test_and_set_1			; THUMBONE: ldrb
	; ARMV6-LABEL: test4			; THUMBONE-NEXT: ___sync_synchronize
	; THUMBM-LABEL: test4			; THUMBONE-NEXT: ___sync_synchronize
				; THUMBONE-NEXT: strb
				; THUMBONE-NEXT: ___sync_synchronize
	%val = load atomic i8, i8* %ptr1 seq_cst, align 1			%val = load atomic i8, i8* %ptr1 seq_cst, align 1
	store atomic i8 %val, i8* %ptr2 seq_cst, align 1			store atomic i8 %val, i8* %ptr2 seq_cst, align 1
	ret void			ret void
	}			}

	define i64 @test_old_load_64bit(i64* %p) {			define i64 @test_old_load_64bit(i64* %p) {
	; ARMV4-LABEL: test_old_load_64bit			; CHECK-LABEL: test_old_load_64bit
	; ARMV4: ___sync_val_compare_and_swap_8
				; ARMV4: ___atomic_load_8
	%1 = load atomic i64, i64* %p seq_cst, align 8			%1 = load atomic i64, i64* %p seq_cst, align 8
	ret i64 %1			ret i64 %1
	}			}

	define void @test_old_store_64bit(i64* %p, i64 %v) {			define void @test_old_store_64bit(i64* %p, i64 %v) {
	; ARMV4-LABEL: test_old_store_64bit			; CHECK-LABEL: test_old_store_64bit
	; ARMV4: ___sync_lock_test_and_set_8
				; ARMV4: ___atomic_store_8
	store atomic i64 %v, i64* %p seq_cst, align 8			store atomic i64 %v, i64* %p seq_cst, align 8
	ret void			ret void
	}			}

llvm/test/CodeGen/ARM/atomic-op.ll

	Show First 20 Lines • Show All 359 Lines • ▼ Show 20 Lines
	; CHECK: dmb			; CHECK: dmb
	; CHECK: add r0,			; CHECK: add r0,

	; CHECK-T1-M0: ldr {{r[0-9]}}, [r0]			; CHECK-T1-M0: ldr {{r[0-9]}}, [r0]
	; CHECK-T1-M0: dmb			; CHECK-T1-M0: dmb
	; CHECK-T1-M0: ldr {{r[0-9]}}, [r1]			; CHECK-T1-M0: ldr {{r[0-9]}}, [r1]
	; CHECK-T1-M0: dmb			; CHECK-T1-M0: dmb

	; CHECK-T1: ___sync_val_compare_and_swap_4			; CHECK-T1: ldr {{r[0-9]}}, [{{r[0-9]}}]
	; CHECK-T1: ___sync_val_compare_and_swap_4			; CHECK-T1: __sync_synchronize
				; CHECK-T1: ldr {{r[0-9]}}, [{{r[0-9]}}]
				; CHECK-T1: __sync_synchronize

	; CHECK-BAREMETAL: ldr {{r[0-9]}}, [r0]			; CHECK-BAREMETAL: ldr {{r[0-9]}}, [r0]
	; CHECK-BAREMETAL-NOT: dmb			; CHECK-BAREMETAL-NOT: dmb
	; CHECK-BAREMETAL: ldr {{r[0-9]}}, [r1]			; CHECK-BAREMETAL: ldr {{r[0-9]}}, [r1]
	; CHECK-BAREMETAL-NOT: dmb			; CHECK-BAREMETAL-NOT: dmb
	; CHECK-BAREMETAL: add r0,			; CHECK-BAREMETAL: add r0,

	ret i32 %tmp			ret i32 %tmp
	}			}

	define void @store_store_release(i32* %mem1, i32 %val1, i32* %mem2, i32 %val2) {			define void @store_store_release(i32* %mem1, i32 %val1, i32* %mem2, i32 %val2) {
	; CHECK-LABEL: store_store_release			; CHECK-LABEL: store_store_release
	store atomic i32 %val1, i32* %mem1 release, align 4			store atomic i32 %val1, i32* %mem1 release, align 4
	store atomic i32 %val2, i32* %mem2 release, align 4			store atomic i32 %val2, i32* %mem2 release, align 4

	; CHECK: dmb			; CHECK: dmb
	; CHECK: str r1, [r0]			; CHECK: str r1, [r0]
	; CHECK: dmb			; CHECK: dmb
	; CHECK: str r3, [r2]			; CHECK: str r3, [r2]

	; CHECK-T1: ___sync_lock_test_and_set			; CHECK-T1: __sync_synchronize
	; CHECK-T1: ___sync_lock_test_and_set			; CHECK-T1: str {{r[0-9]}}, [{{r[0-9]}}]
				; CHECK-T1: __sync_synchronize
				; CHECK-T1: str {{r[0-9]}}, [{{r[0-9]}}]

	; CHECK-T1-M0: dmb			; CHECK-T1-M0: dmb
	; CHECK-T1-M0: str r1, [r0]			; CHECK-T1-M0: str r1, [r0]
	; CHECK-T1-M0: dmb			; CHECK-T1-M0: dmb
	; CHECK-T1-M0: str r3, [r2]			; CHECK-T1-M0: str r3, [r2]

	; CHECK-BAREMETAL-NOT: dmb			; CHECK-BAREMETAL-NOT: dmb
	; CHECK-BAREMETAL: str r1, [r0]			; CHECK-BAREMETAL: str r1, [r0]
	Show All 30 Lines

llvm/test/CodeGen/ARM/atomic-ops-m33.ll

	Show First 20 Lines • Show All 65 Lines • ▼ Show 20 Lines
	; CHECK-NOT: mcr			; CHECK-NOT: mcr

	; CHECK: mov r0, r[[OLD]]			; CHECK: mov r0, r[[OLD]]
	ret i32 %old			ret i32 %old
	}			}

	define void @test_atomic_load_add_i64(i64 %offset) nounwind {			define void @test_atomic_load_add_i64(i64 %offset) nounwind {
	; CHECK-LABEL: test_atomic_load_add_i64:			; CHECK-LABEL: test_atomic_load_add_i64:
	; CHECK: bl __sync_fetch_and_add_8			; CHECK: bl __atomic_fetch_add_8
	%old = atomicrmw add i64* @var64, i64 %offset monotonic			%old = atomicrmw add i64* @var64, i64 %offset monotonic
	store i64 %old, i64* @var64			store i64 %old, i64* @var64
	ret void			ret void
	}			}

	define i8 @test_load_acquire_i8(i8* %ptr) {			define i8 @test_load_acquire_i8(i8* %ptr) {
	; CHECK-LABEL: test_load_acquire_i8:			; CHECK-LABEL: test_load_acquire_i8:
	; CHECK: ldab r0, [r0]			; CHECK: ldab r0, [r0]
	▲ Show 20 Lines • Show All 58 Lines • Show Last 20 Lines