This is an archive of the discontinued LLVM Phabricator instance.

[AArch64] Improve v8.1-A code-gen for atomic load-and
ClosedPublic

Authored by olista01 on Jan 24 2018, 6:58 AM.

Download Raw Diff

Details

Reviewers

mcrosier
gberry
christof

Commits

rG02f08c9d1f9b: [AArch64] Improve v8.1-A code-gen for atomic load-and
rL324908: [AArch64] Improve v8.1-A code-gen for atomic load-and

Summary

Armv8.1-A added an atomic load-clear instruction (which performs bitwise
and with the complement of it's operand), but not a load-and
instruction. Our current code-generation for atomic load-and always
inserts an MVN instruction to invert its argument, even if it could be
folded into a constant or another instruction.

This adds lowering early in selection DAG to convert a load-and
operation into an xor with -1 and a load-clear, allowing the normal DAG
optimisations to work on it.

To do this, I've had to add a new ISD opcode, ATOMIC_LOAD_CLR. I don't
see any easy way to do this with an AArch64-specific ISD node, because
the code-generation for atomic operations assumes the SDNodes are of
type AtomicSDNode.

I've left the old tablegen patterns in because they are still needed for
global isel.

Diff Detail

Repository: rL LLVM

Event Timeline

olista01 created this revision.Jan 24 2018, 6:58 AM

Herald added subscribers: kristof.beyls, javed.absar, rengolin, aemerson. · View Herald TranscriptJan 24 2018, 6:58 AM

olista01 added a parent revision: D42477: [AArch64] Improve v8.1-A code-gen for atomic load-subtract.Jan 24 2018, 6:59 AM

olista01 mentioned this in D42477: [AArch64] Improve v8.1-A code-gen for atomic load-subtract.Feb 12 2018, 2:05 AM

This looks good to me. Thanks

This revision is now accepted and ready to land.Feb 12 2018, 8:39 AM

Closed by commit rL324908: [AArch64] Improve v8.1-A code-gen for atomic load-and (authored by olista01). · Explain WhyFeb 12 2018, 9:05 AM

This revision was automatically updated to reflect the committed changes.

Revision Contents

Path

Size

llvm/

trunk/

include/

llvm/

CodeGen/

ISDOpcodes.h

1 line

SelectionDAGNodes.h

2 lines

Target/

TargetSelectionDAG.td

3 lines

lib/

CodeGen/

SelectionDAG/

LegalizeDAG.cpp

1 line

LegalizeIntegerTypes.cpp

2 lines

SelectionDAG.cpp

2 lines

SelectionDAGDumper.cpp

1 line

Target/

AArch64/

AArch64ISelLowering.h

1 line

AArch64ISelLowering.cpp

21 lines

AArch64InstrAtomics.td

7 lines

test/

CodeGen/

AArch64/

atomic-ops-lse.ll

96 lines

Diff 133881

llvm/trunk/include/llvm/CodeGen/ISDOpcodes.h

Show First 20 Lines • Show All 773 Lines • ▼ Show 20 Lines	enum NodeType {
/// For double-word atomic operations:		/// For double-word atomic operations:
/// ValLo, ValHi, OUTCHAIN = ATOMIC_SWAP(INCHAIN, ptr, amtLo, amtHi)		/// ValLo, ValHi, OUTCHAIN = ATOMIC_SWAP(INCHAIN, ptr, amtLo, amtHi)
/// ValLo, ValHi, OUTCHAIN = ATOMIC_LOAD_[OpName](INCHAIN, ptr, amtLo, amtHi)		/// ValLo, ValHi, OUTCHAIN = ATOMIC_LOAD_[OpName](INCHAIN, ptr, amtLo, amtHi)
/// These correspond to the atomicrmw instruction.		/// These correspond to the atomicrmw instruction.
ATOMIC_SWAP,		ATOMIC_SWAP,
ATOMIC_LOAD_ADD,		ATOMIC_LOAD_ADD,
ATOMIC_LOAD_SUB,		ATOMIC_LOAD_SUB,
ATOMIC_LOAD_AND,		ATOMIC_LOAD_AND,
		ATOMIC_LOAD_CLR,
ATOMIC_LOAD_OR,		ATOMIC_LOAD_OR,
ATOMIC_LOAD_XOR,		ATOMIC_LOAD_XOR,
ATOMIC_LOAD_NAND,		ATOMIC_LOAD_NAND,
ATOMIC_LOAD_MIN,		ATOMIC_LOAD_MIN,
ATOMIC_LOAD_MAX,		ATOMIC_LOAD_MAX,
ATOMIC_LOAD_UMIN,		ATOMIC_LOAD_UMIN,
ATOMIC_LOAD_UMAX,		ATOMIC_LOAD_UMAX,

▲ Show 20 Lines • Show All 207 Lines • Show Last 20 Lines

llvm/trunk/include/llvm/CodeGen/SelectionDAGNodes.h

Show First 20 Lines • Show All 1,288 Lines • ▼ Show 20 Lines	return N->getOpcode() == ISD::LOAD \|\|
N->getOpcode() == ISD::STORE \|\|		N->getOpcode() == ISD::STORE \|\|
N->getOpcode() == ISD::PREFETCH \|\|		N->getOpcode() == ISD::PREFETCH \|\|
N->getOpcode() == ISD::ATOMIC_CMP_SWAP \|\|		N->getOpcode() == ISD::ATOMIC_CMP_SWAP \|\|
N->getOpcode() == ISD::ATOMIC_CMP_SWAP_WITH_SUCCESS \|\|		N->getOpcode() == ISD::ATOMIC_CMP_SWAP_WITH_SUCCESS \|\|
N->getOpcode() == ISD::ATOMIC_SWAP \|\|		N->getOpcode() == ISD::ATOMIC_SWAP \|\|
N->getOpcode() == ISD::ATOMIC_LOAD_ADD \|\|		N->getOpcode() == ISD::ATOMIC_LOAD_ADD \|\|
N->getOpcode() == ISD::ATOMIC_LOAD_SUB \|\|		N->getOpcode() == ISD::ATOMIC_LOAD_SUB \|\|
N->getOpcode() == ISD::ATOMIC_LOAD_AND \|\|		N->getOpcode() == ISD::ATOMIC_LOAD_AND \|\|
		N->getOpcode() == ISD::ATOMIC_LOAD_CLR \|\|
N->getOpcode() == ISD::ATOMIC_LOAD_OR \|\|		N->getOpcode() == ISD::ATOMIC_LOAD_OR \|\|
N->getOpcode() == ISD::ATOMIC_LOAD_XOR \|\|		N->getOpcode() == ISD::ATOMIC_LOAD_XOR \|\|
N->getOpcode() == ISD::ATOMIC_LOAD_NAND \|\|		N->getOpcode() == ISD::ATOMIC_LOAD_NAND \|\|
N->getOpcode() == ISD::ATOMIC_LOAD_MIN \|\|		N->getOpcode() == ISD::ATOMIC_LOAD_MIN \|\|
N->getOpcode() == ISD::ATOMIC_LOAD_MAX \|\|		N->getOpcode() == ISD::ATOMIC_LOAD_MAX \|\|
N->getOpcode() == ISD::ATOMIC_LOAD_UMIN \|\|		N->getOpcode() == ISD::ATOMIC_LOAD_UMIN \|\|
N->getOpcode() == ISD::ATOMIC_LOAD_UMAX \|\|		N->getOpcode() == ISD::ATOMIC_LOAD_UMAX \|\|
N->getOpcode() == ISD::ATOMIC_LOAD \|\|		N->getOpcode() == ISD::ATOMIC_LOAD \|\|
Show All 35 Lines	public:
// Methods to support isa and dyn_cast		// Methods to support isa and dyn_cast
static bool classof(const SDNode *N) {		static bool classof(const SDNode *N) {
return N->getOpcode() == ISD::ATOMIC_CMP_SWAP \|\|		return N->getOpcode() == ISD::ATOMIC_CMP_SWAP \|\|
N->getOpcode() == ISD::ATOMIC_CMP_SWAP_WITH_SUCCESS \|\|		N->getOpcode() == ISD::ATOMIC_CMP_SWAP_WITH_SUCCESS \|\|
N->getOpcode() == ISD::ATOMIC_SWAP \|\|		N->getOpcode() == ISD::ATOMIC_SWAP \|\|
N->getOpcode() == ISD::ATOMIC_LOAD_ADD \|\|		N->getOpcode() == ISD::ATOMIC_LOAD_ADD \|\|
N->getOpcode() == ISD::ATOMIC_LOAD_SUB \|\|		N->getOpcode() == ISD::ATOMIC_LOAD_SUB \|\|
N->getOpcode() == ISD::ATOMIC_LOAD_AND \|\|		N->getOpcode() == ISD::ATOMIC_LOAD_AND \|\|
		N->getOpcode() == ISD::ATOMIC_LOAD_CLR \|\|
N->getOpcode() == ISD::ATOMIC_LOAD_OR \|\|		N->getOpcode() == ISD::ATOMIC_LOAD_OR \|\|
N->getOpcode() == ISD::ATOMIC_LOAD_XOR \|\|		N->getOpcode() == ISD::ATOMIC_LOAD_XOR \|\|
N->getOpcode() == ISD::ATOMIC_LOAD_NAND \|\|		N->getOpcode() == ISD::ATOMIC_LOAD_NAND \|\|
N->getOpcode() == ISD::ATOMIC_LOAD_MIN \|\|		N->getOpcode() == ISD::ATOMIC_LOAD_MIN \|\|
N->getOpcode() == ISD::ATOMIC_LOAD_MAX \|\|		N->getOpcode() == ISD::ATOMIC_LOAD_MAX \|\|
N->getOpcode() == ISD::ATOMIC_LOAD_UMIN \|\|		N->getOpcode() == ISD::ATOMIC_LOAD_UMIN \|\|
N->getOpcode() == ISD::ATOMIC_LOAD_UMAX \|\|		N->getOpcode() == ISD::ATOMIC_LOAD_UMAX \|\|
N->getOpcode() == ISD::ATOMIC_LOAD \|\|		N->getOpcode() == ISD::ATOMIC_LOAD \|\|
▲ Show 20 Lines • Show All 1,009 Lines • Show Last 20 Lines

llvm/trunk/include/llvm/Target/TargetSelectionDAG.td

Show First 20 Lines • Show All 479 Lines • ▼ Show 20 Lines
def atomic_load_add : SDNode<"ISD::ATOMIC_LOAD_ADD" , SDTAtomic2,		def atomic_load_add : SDNode<"ISD::ATOMIC_LOAD_ADD" , SDTAtomic2,
[SDNPHasChain, SDNPMayStore, SDNPMayLoad, SDNPMemOperand]>;		[SDNPHasChain, SDNPMayStore, SDNPMayLoad, SDNPMemOperand]>;
def atomic_swap : SDNode<"ISD::ATOMIC_SWAP", SDTAtomic2,		def atomic_swap : SDNode<"ISD::ATOMIC_SWAP", SDTAtomic2,
[SDNPHasChain, SDNPMayStore, SDNPMayLoad, SDNPMemOperand]>;		[SDNPHasChain, SDNPMayStore, SDNPMayLoad, SDNPMemOperand]>;
def atomic_load_sub : SDNode<"ISD::ATOMIC_LOAD_SUB" , SDTAtomic2,		def atomic_load_sub : SDNode<"ISD::ATOMIC_LOAD_SUB" , SDTAtomic2,
[SDNPHasChain, SDNPMayStore, SDNPMayLoad, SDNPMemOperand]>;		[SDNPHasChain, SDNPMayStore, SDNPMayLoad, SDNPMemOperand]>;
def atomic_load_and : SDNode<"ISD::ATOMIC_LOAD_AND" , SDTAtomic2,		def atomic_load_and : SDNode<"ISD::ATOMIC_LOAD_AND" , SDTAtomic2,
[SDNPHasChain, SDNPMayStore, SDNPMayLoad, SDNPMemOperand]>;		[SDNPHasChain, SDNPMayStore, SDNPMayLoad, SDNPMemOperand]>;
		def atomic_load_clr : SDNode<"ISD::ATOMIC_LOAD_CLR" , SDTAtomic2,
		[SDNPHasChain, SDNPMayStore, SDNPMayLoad, SDNPMemOperand]>;
def atomic_load_or : SDNode<"ISD::ATOMIC_LOAD_OR" , SDTAtomic2,		def atomic_load_or : SDNode<"ISD::ATOMIC_LOAD_OR" , SDTAtomic2,
[SDNPHasChain, SDNPMayStore, SDNPMayLoad, SDNPMemOperand]>;		[SDNPHasChain, SDNPMayStore, SDNPMayLoad, SDNPMemOperand]>;
def atomic_load_xor : SDNode<"ISD::ATOMIC_LOAD_XOR" , SDTAtomic2,		def atomic_load_xor : SDNode<"ISD::ATOMIC_LOAD_XOR" , SDTAtomic2,
[SDNPHasChain, SDNPMayStore, SDNPMayLoad, SDNPMemOperand]>;		[SDNPHasChain, SDNPMayStore, SDNPMayLoad, SDNPMemOperand]>;
def atomic_load_nand: SDNode<"ISD::ATOMIC_LOAD_NAND", SDTAtomic2,		def atomic_load_nand: SDNode<"ISD::ATOMIC_LOAD_NAND", SDTAtomic2,
[SDNPHasChain, SDNPMayStore, SDNPMayLoad, SDNPMemOperand]>;		[SDNPHasChain, SDNPMayStore, SDNPMayLoad, SDNPMemOperand]>;
def atomic_load_min : SDNode<"ISD::ATOMIC_LOAD_MIN", SDTAtomic2,		def atomic_load_min : SDNode<"ISD::ATOMIC_LOAD_MIN", SDTAtomic2,
[SDNPHasChain, SDNPMayStore, SDNPMayLoad, SDNPMemOperand]>;		[SDNPHasChain, SDNPMayStore, SDNPMayLoad, SDNPMemOperand]>;
▲ Show 20 Lines • Show All 743 Lines • ▼ Show 20 Lines	multiclass ternary_atomic_op<SDNode atomic_op> {
defm NAME#_32 : ternary_atomic_op_ord<atomic_op>;		defm NAME#_32 : ternary_atomic_op_ord<atomic_op>;
defm NAME#_64 : ternary_atomic_op_ord<atomic_op>;		defm NAME#_64 : ternary_atomic_op_ord<atomic_op>;
}		}

defm atomic_load_add : binary_atomic_op<atomic_load_add>;		defm atomic_load_add : binary_atomic_op<atomic_load_add>;
defm atomic_swap : binary_atomic_op<atomic_swap>;		defm atomic_swap : binary_atomic_op<atomic_swap>;
defm atomic_load_sub : binary_atomic_op<atomic_load_sub>;		defm atomic_load_sub : binary_atomic_op<atomic_load_sub>;
defm atomic_load_and : binary_atomic_op<atomic_load_and>;		defm atomic_load_and : binary_atomic_op<atomic_load_and>;
		defm atomic_load_clr : binary_atomic_op<atomic_load_clr>;
defm atomic_load_or : binary_atomic_op<atomic_load_or>;		defm atomic_load_or : binary_atomic_op<atomic_load_or>;
defm atomic_load_xor : binary_atomic_op<atomic_load_xor>;		defm atomic_load_xor : binary_atomic_op<atomic_load_xor>;
defm atomic_load_nand : binary_atomic_op<atomic_load_nand>;		defm atomic_load_nand : binary_atomic_op<atomic_load_nand>;
defm atomic_load_min : binary_atomic_op<atomic_load_min>;		defm atomic_load_min : binary_atomic_op<atomic_load_min>;
defm atomic_load_max : binary_atomic_op<atomic_load_max>;		defm atomic_load_max : binary_atomic_op<atomic_load_max>;
defm atomic_load_umin : binary_atomic_op<atomic_load_umin>;		defm atomic_load_umin : binary_atomic_op<atomic_load_umin>;
defm atomic_load_umax : binary_atomic_op<atomic_load_umax>;		defm atomic_load_umax : binary_atomic_op<atomic_load_umax>;
defm atomic_store : binary_atomic_op<atomic_store>;		defm atomic_store : binary_atomic_op<atomic_store>;
▲ Show 20 Lines • Show All 69 Lines • Show Last 20 Lines

llvm/trunk/lib/CodeGen/SelectionDAG/LegalizeDAG.cpp

Show First 20 Lines • Show All 3,965 Lines • ▼ Show 20 Lines	void SelectionDAGLegalize::ConvertNodeToLibcall(SDNode *Node) {
}		}
// By default, atomic intrinsics are marked Legal and lowered. Targets		// By default, atomic intrinsics are marked Legal and lowered. Targets
// which don't support them directly, however, may want libcalls, in which		// which don't support them directly, however, may want libcalls, in which
// case they mark them Expand, and we get here.		// case they mark them Expand, and we get here.
case ISD::ATOMIC_SWAP:		case ISD::ATOMIC_SWAP:
case ISD::ATOMIC_LOAD_ADD:		case ISD::ATOMIC_LOAD_ADD:
case ISD::ATOMIC_LOAD_SUB:		case ISD::ATOMIC_LOAD_SUB:
case ISD::ATOMIC_LOAD_AND:		case ISD::ATOMIC_LOAD_AND:
		case ISD::ATOMIC_LOAD_CLR:
case ISD::ATOMIC_LOAD_OR:		case ISD::ATOMIC_LOAD_OR:
case ISD::ATOMIC_LOAD_XOR:		case ISD::ATOMIC_LOAD_XOR:
case ISD::ATOMIC_LOAD_NAND:		case ISD::ATOMIC_LOAD_NAND:
case ISD::ATOMIC_LOAD_MIN:		case ISD::ATOMIC_LOAD_MIN:
case ISD::ATOMIC_LOAD_MAX:		case ISD::ATOMIC_LOAD_MAX:
case ISD::ATOMIC_LOAD_UMIN:		case ISD::ATOMIC_LOAD_UMIN:
case ISD::ATOMIC_LOAD_UMAX:		case ISD::ATOMIC_LOAD_UMAX:
case ISD::ATOMIC_CMP_SWAP: {		case ISD::ATOMIC_CMP_SWAP: {
▲ Show 20 Lines • Show All 781 Lines • Show Last 20 Lines

llvm/trunk/lib/CodeGen/SelectionDAG/LegalizeIntegerTypes.cpp

Show First 20 Lines • Show All 140 Lines • ▼ Show 20 Lines	#endif
case ISD::SUBCARRY: Res = PromoteIntRes_ADDSUBCARRY(N, ResNo); break;		case ISD::SUBCARRY: Res = PromoteIntRes_ADDSUBCARRY(N, ResNo); break;

case ISD::ATOMIC_LOAD:		case ISD::ATOMIC_LOAD:
Res = PromoteIntRes_Atomic0(cast<AtomicSDNode>(N)); break;		Res = PromoteIntRes_Atomic0(cast<AtomicSDNode>(N)); break;

case ISD::ATOMIC_LOAD_ADD:		case ISD::ATOMIC_LOAD_ADD:
case ISD::ATOMIC_LOAD_SUB:		case ISD::ATOMIC_LOAD_SUB:
case ISD::ATOMIC_LOAD_AND:		case ISD::ATOMIC_LOAD_AND:
		case ISD::ATOMIC_LOAD_CLR:
case ISD::ATOMIC_LOAD_OR:		case ISD::ATOMIC_LOAD_OR:
case ISD::ATOMIC_LOAD_XOR:		case ISD::ATOMIC_LOAD_XOR:
case ISD::ATOMIC_LOAD_NAND:		case ISD::ATOMIC_LOAD_NAND:
case ISD::ATOMIC_LOAD_MIN:		case ISD::ATOMIC_LOAD_MIN:
case ISD::ATOMIC_LOAD_MAX:		case ISD::ATOMIC_LOAD_MAX:
case ISD::ATOMIC_LOAD_UMIN:		case ISD::ATOMIC_LOAD_UMIN:
case ISD::ATOMIC_LOAD_UMAX:		case ISD::ATOMIC_LOAD_UMAX:
case ISD::ATOMIC_SWAP:		case ISD::ATOMIC_SWAP:
▲ Show 20 Lines • Show All 1,240 Lines • ▼ Show 20 Lines	#endif
case ISD::UDIV: ExpandIntRes_UDIV(N, Lo, Hi); break;		case ISD::UDIV: ExpandIntRes_UDIV(N, Lo, Hi); break;
case ISD::UREM: ExpandIntRes_UREM(N, Lo, Hi); break;		case ISD::UREM: ExpandIntRes_UREM(N, Lo, Hi); break;
case ISD::ZERO_EXTEND: ExpandIntRes_ZERO_EXTEND(N, Lo, Hi); break;		case ISD::ZERO_EXTEND: ExpandIntRes_ZERO_EXTEND(N, Lo, Hi); break;
case ISD::ATOMIC_LOAD: ExpandIntRes_ATOMIC_LOAD(N, Lo, Hi); break;		case ISD::ATOMIC_LOAD: ExpandIntRes_ATOMIC_LOAD(N, Lo, Hi); break;

case ISD::ATOMIC_LOAD_ADD:		case ISD::ATOMIC_LOAD_ADD:
case ISD::ATOMIC_LOAD_SUB:		case ISD::ATOMIC_LOAD_SUB:
case ISD::ATOMIC_LOAD_AND:		case ISD::ATOMIC_LOAD_AND:
		case ISD::ATOMIC_LOAD_CLR:
case ISD::ATOMIC_LOAD_OR:		case ISD::ATOMIC_LOAD_OR:
case ISD::ATOMIC_LOAD_XOR:		case ISD::ATOMIC_LOAD_XOR:
case ISD::ATOMIC_LOAD_NAND:		case ISD::ATOMIC_LOAD_NAND:
case ISD::ATOMIC_LOAD_MIN:		case ISD::ATOMIC_LOAD_MIN:
case ISD::ATOMIC_LOAD_MAX:		case ISD::ATOMIC_LOAD_MAX:
case ISD::ATOMIC_LOAD_UMIN:		case ISD::ATOMIC_LOAD_UMIN:
case ISD::ATOMIC_LOAD_UMAX:		case ISD::ATOMIC_LOAD_UMAX:
case ISD::ATOMIC_SWAP:		case ISD::ATOMIC_SWAP:
▲ Show 20 Lines • Show All 2,214 Lines • Show Last 20 Lines

llvm/trunk/lib/CodeGen/SelectionDAG/SelectionDAG.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 487 Lines • ▼ Show 20 Lines	case ISD::STORE: {
break;		break;
}		}
case ISD::ATOMIC_CMP_SWAP:		case ISD::ATOMIC_CMP_SWAP:
case ISD::ATOMIC_CMP_SWAP_WITH_SUCCESS:		case ISD::ATOMIC_CMP_SWAP_WITH_SUCCESS:
case ISD::ATOMIC_SWAP:		case ISD::ATOMIC_SWAP:
case ISD::ATOMIC_LOAD_ADD:		case ISD::ATOMIC_LOAD_ADD:
case ISD::ATOMIC_LOAD_SUB:		case ISD::ATOMIC_LOAD_SUB:
case ISD::ATOMIC_LOAD_AND:		case ISD::ATOMIC_LOAD_AND:
		case ISD::ATOMIC_LOAD_CLR:
case ISD::ATOMIC_LOAD_OR:		case ISD::ATOMIC_LOAD_OR:
case ISD::ATOMIC_LOAD_XOR:		case ISD::ATOMIC_LOAD_XOR:
case ISD::ATOMIC_LOAD_NAND:		case ISD::ATOMIC_LOAD_NAND:
case ISD::ATOMIC_LOAD_MIN:		case ISD::ATOMIC_LOAD_MIN:
case ISD::ATOMIC_LOAD_MAX:		case ISD::ATOMIC_LOAD_MAX:
case ISD::ATOMIC_LOAD_UMIN:		case ISD::ATOMIC_LOAD_UMIN:
case ISD::ATOMIC_LOAD_UMAX:		case ISD::ATOMIC_LOAD_UMAX:
case ISD::ATOMIC_LOAD:		case ISD::ATOMIC_LOAD:
▲ Show 20 Lines • Show All 5,246 Lines • ▼ Show 20 Lines
}		}

SDValue SelectionDAG::getAtomic(unsigned Opcode, const SDLoc &dl, EVT MemVT,		SDValue SelectionDAG::getAtomic(unsigned Opcode, const SDLoc &dl, EVT MemVT,
SDValue Chain, SDValue Ptr, SDValue Val,		SDValue Chain, SDValue Ptr, SDValue Val,
MachineMemOperand *MMO) {		MachineMemOperand *MMO) {
assert((Opcode == ISD::ATOMIC_LOAD_ADD \|\|		assert((Opcode == ISD::ATOMIC_LOAD_ADD \|\|
Opcode == ISD::ATOMIC_LOAD_SUB \|\|		Opcode == ISD::ATOMIC_LOAD_SUB \|\|
Opcode == ISD::ATOMIC_LOAD_AND \|\|		Opcode == ISD::ATOMIC_LOAD_AND \|\|
		Opcode == ISD::ATOMIC_LOAD_CLR \|\|
Opcode == ISD::ATOMIC_LOAD_OR \|\|		Opcode == ISD::ATOMIC_LOAD_OR \|\|
Opcode == ISD::ATOMIC_LOAD_XOR \|\|		Opcode == ISD::ATOMIC_LOAD_XOR \|\|
Opcode == ISD::ATOMIC_LOAD_NAND \|\|		Opcode == ISD::ATOMIC_LOAD_NAND \|\|
Opcode == ISD::ATOMIC_LOAD_MIN \|\|		Opcode == ISD::ATOMIC_LOAD_MIN \|\|
Opcode == ISD::ATOMIC_LOAD_MAX \|\|		Opcode == ISD::ATOMIC_LOAD_MAX \|\|
Opcode == ISD::ATOMIC_LOAD_UMIN \|\|		Opcode == ISD::ATOMIC_LOAD_UMIN \|\|
Opcode == ISD::ATOMIC_LOAD_UMAX \|\|		Opcode == ISD::ATOMIC_LOAD_UMAX \|\|
Opcode == ISD::ATOMIC_SWAP \|\|		Opcode == ISD::ATOMIC_SWAP \|\|
▲ Show 20 Lines • Show All 2,532 Lines • Show Last 20 Lines

llvm/trunk/lib/CodeGen/SelectionDAG/SelectionDAGDumper.cpp

Show First 20 Lines • Show All 79 Lines • ▼ Show 20 Lines	#endif
case ISD::PREFETCH: return "Prefetch";		case ISD::PREFETCH: return "Prefetch";
case ISD::ATOMIC_FENCE: return "AtomicFence";		case ISD::ATOMIC_FENCE: return "AtomicFence";
case ISD::ATOMIC_CMP_SWAP: return "AtomicCmpSwap";		case ISD::ATOMIC_CMP_SWAP: return "AtomicCmpSwap";
case ISD::ATOMIC_CMP_SWAP_WITH_SUCCESS: return "AtomicCmpSwapWithSuccess";		case ISD::ATOMIC_CMP_SWAP_WITH_SUCCESS: return "AtomicCmpSwapWithSuccess";
case ISD::ATOMIC_SWAP: return "AtomicSwap";		case ISD::ATOMIC_SWAP: return "AtomicSwap";
case ISD::ATOMIC_LOAD_ADD: return "AtomicLoadAdd";		case ISD::ATOMIC_LOAD_ADD: return "AtomicLoadAdd";
case ISD::ATOMIC_LOAD_SUB: return "AtomicLoadSub";		case ISD::ATOMIC_LOAD_SUB: return "AtomicLoadSub";
case ISD::ATOMIC_LOAD_AND: return "AtomicLoadAnd";		case ISD::ATOMIC_LOAD_AND: return "AtomicLoadAnd";
		case ISD::ATOMIC_LOAD_CLR: return "AtomicLoadClr";
case ISD::ATOMIC_LOAD_OR: return "AtomicLoadOr";		case ISD::ATOMIC_LOAD_OR: return "AtomicLoadOr";
case ISD::ATOMIC_LOAD_XOR: return "AtomicLoadXor";		case ISD::ATOMIC_LOAD_XOR: return "AtomicLoadXor";
case ISD::ATOMIC_LOAD_NAND: return "AtomicLoadNand";		case ISD::ATOMIC_LOAD_NAND: return "AtomicLoadNand";
case ISD::ATOMIC_LOAD_MIN: return "AtomicLoadMin";		case ISD::ATOMIC_LOAD_MIN: return "AtomicLoadMin";
case ISD::ATOMIC_LOAD_MAX: return "AtomicLoadMax";		case ISD::ATOMIC_LOAD_MAX: return "AtomicLoadMax";
case ISD::ATOMIC_LOAD_UMIN: return "AtomicLoadUMin";		case ISD::ATOMIC_LOAD_UMIN: return "AtomicLoadUMin";
case ISD::ATOMIC_LOAD_UMAX: return "AtomicLoadUMax";		case ISD::ATOMIC_LOAD_UMAX: return "AtomicLoadUMax";
case ISD::ATOMIC_LOAD: return "AtomicLoad";		case ISD::ATOMIC_LOAD: return "AtomicLoad";
▲ Show 20 Lines • Show All 707 Lines • Show Last 20 Lines

llvm/trunk/lib/Target/AArch64/AArch64ISelLowering.h

Show First 20 Lines • Show All 591 Lines • ▼ Show 20 Lines	private:
SDValue LowerFP_TO_INT(SDValue Op, SelectionDAG &DAG) const;		SDValue LowerFP_TO_INT(SDValue Op, SelectionDAG &DAG) const;
SDValue LowerINT_TO_FP(SDValue Op, SelectionDAG &DAG) const;		SDValue LowerINT_TO_FP(SDValue Op, SelectionDAG &DAG) const;
SDValue LowerVectorAND(SDValue Op, SelectionDAG &DAG) const;		SDValue LowerVectorAND(SDValue Op, SelectionDAG &DAG) const;
SDValue LowerVectorOR(SDValue Op, SelectionDAG &DAG) const;		SDValue LowerVectorOR(SDValue Op, SelectionDAG &DAG) const;
SDValue LowerCONCAT_VECTORS(SDValue Op, SelectionDAG &DAG) const;		SDValue LowerCONCAT_VECTORS(SDValue Op, SelectionDAG &DAG) const;
SDValue LowerFSINCOS(SDValue Op, SelectionDAG &DAG) const;		SDValue LowerFSINCOS(SDValue Op, SelectionDAG &DAG) const;
SDValue LowerVECREDUCE(SDValue Op, SelectionDAG &DAG) const;		SDValue LowerVECREDUCE(SDValue Op, SelectionDAG &DAG) const;
SDValue LowerATOMIC_LOAD_SUB(SDValue Op, SelectionDAG &DAG) const;		SDValue LowerATOMIC_LOAD_SUB(SDValue Op, SelectionDAG &DAG) const;
		SDValue LowerATOMIC_LOAD_AND(SDValue Op, SelectionDAG &DAG) const;

SDValue BuildSDIVPow2(SDNode *N, const APInt &Divisor, SelectionDAG &DAG,		SDValue BuildSDIVPow2(SDNode *N, const APInt &Divisor, SelectionDAG &DAG,
std::vector<SDNode > Created) const override;		std::vector<SDNode > Created) const override;
SDValue getSqrtEstimate(SDValue Operand, SelectionDAG &DAG, int Enabled,		SDValue getSqrtEstimate(SDValue Operand, SelectionDAG &DAG, int Enabled,
int &ExtraSteps, bool &UseOneConst,		int &ExtraSteps, bool &UseOneConst,
bool Reciprocal) const override;		bool Reciprocal) const override;
SDValue getRecipEstimate(SDValue Operand, SelectionDAG &DAG, int Enabled,		SDValue getRecipEstimate(SDValue Operand, SelectionDAG &DAG, int Enabled,
int &ExtraSteps) const override;		int &ExtraSteps) const override;
▲ Show 20 Lines • Show All 59 Lines • Show Last 20 Lines

llvm/trunk/lib/Target/AArch64/AArch64ISelLowering.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 460 Lines • ▼ Show 20 Lines	if (Subtarget->hasFullFP16()) {
setOperationAction(ISD::FMAXNAN, MVT::f16, Legal);		setOperationAction(ISD::FMAXNAN, MVT::f16, Legal);
}		}

setOperationAction(ISD::PREFETCH, MVT::Other, Custom);		setOperationAction(ISD::PREFETCH, MVT::Other, Custom);

setOperationAction(ISD::ATOMIC_CMP_SWAP, MVT::i128, Custom);		setOperationAction(ISD::ATOMIC_CMP_SWAP, MVT::i128, Custom);
setOperationAction(ISD::ATOMIC_LOAD_SUB, MVT::i32, Custom);		setOperationAction(ISD::ATOMIC_LOAD_SUB, MVT::i32, Custom);
setOperationAction(ISD::ATOMIC_LOAD_SUB, MVT::i64, Custom);		setOperationAction(ISD::ATOMIC_LOAD_SUB, MVT::i64, Custom);
		setOperationAction(ISD::ATOMIC_LOAD_AND, MVT::i32, Custom);
		setOperationAction(ISD::ATOMIC_LOAD_AND, MVT::i64, Custom);

// Lower READCYCLECOUNTER using an mrs from PMCCNTR_EL0.		// Lower READCYCLECOUNTER using an mrs from PMCCNTR_EL0.
// This requires the Performance Monitors extension.		// This requires the Performance Monitors extension.
if (Subtarget->hasPerfMon())		if (Subtarget->hasPerfMon())
setOperationAction(ISD::READCYCLECOUNTER, MVT::i64, Legal);		setOperationAction(ISD::READCYCLECOUNTER, MVT::i64, Legal);

if (getLibcallName(RTLIB::SINCOS_STRET_F32) != nullptr &&		if (getLibcallName(RTLIB::SINCOS_STRET_F32) != nullptr &&
getLibcallName(RTLIB::SINCOS_STRET_F64) != nullptr) {		getLibcallName(RTLIB::SINCOS_STRET_F64) != nullptr) {
▲ Show 20 Lines • Show All 2,201 Lines • ▼ Show 20 Lines	SDValue AArch64TargetLowering::LowerOperation(SDValue Op,
case ISD::VECREDUCE_SMIN:		case ISD::VECREDUCE_SMIN:
case ISD::VECREDUCE_UMAX:		case ISD::VECREDUCE_UMAX:
case ISD::VECREDUCE_UMIN:		case ISD::VECREDUCE_UMIN:
case ISD::VECREDUCE_FMAX:		case ISD::VECREDUCE_FMAX:
case ISD::VECREDUCE_FMIN:		case ISD::VECREDUCE_FMIN:
return LowerVECREDUCE(Op, DAG);		return LowerVECREDUCE(Op, DAG);
case ISD::ATOMIC_LOAD_SUB:		case ISD::ATOMIC_LOAD_SUB:
return LowerATOMIC_LOAD_SUB(Op, DAG);		return LowerATOMIC_LOAD_SUB(Op, DAG);
		case ISD::ATOMIC_LOAD_AND:
		return LowerATOMIC_LOAD_AND(Op, DAG);
}		}
}		}

//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//
// Calling Convention Implementation		// Calling Convention Implementation
//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//

#include "AArch64GenCallingConv.inc"		#include "AArch64GenCallingConv.inc"
▲ Show 20 Lines • Show All 4,607 Lines • ▼ Show 20 Lines	SDValue AArch64TargetLowering::LowerATOMIC_LOAD_SUB(SDValue Op,
SDValue RHS = Op.getOperand(2);		SDValue RHS = Op.getOperand(2);
AtomicSDNode *AN = cast<AtomicSDNode>(Op.getNode());		AtomicSDNode *AN = cast<AtomicSDNode>(Op.getNode());
RHS = DAG.getNode(ISD::SUB, dl, VT, DAG.getConstant(0, dl, VT), RHS);		RHS = DAG.getNode(ISD::SUB, dl, VT, DAG.getConstant(0, dl, VT), RHS);
return DAG.getAtomic(ISD::ATOMIC_LOAD_ADD, dl, AN->getMemoryVT(),		return DAG.getAtomic(ISD::ATOMIC_LOAD_ADD, dl, AN->getMemoryVT(),
Op.getOperand(0), Op.getOperand(1), RHS,		Op.getOperand(0), Op.getOperand(1), RHS,
AN->getMemOperand());		AN->getMemOperand());
}		}

		SDValue AArch64TargetLowering::LowerATOMIC_LOAD_AND(SDValue Op,
		SelectionDAG &DAG) const {
		auto &Subtarget = static_cast<const AArch64Subtarget &>(DAG.getSubtarget());
		if (!Subtarget.hasLSE())
		return SDValue();

		// LSE has an atomic load-clear instruction, but not a load-and.
		SDLoc dl(Op);
		MVT VT = Op.getSimpleValueType();
		SDValue RHS = Op.getOperand(2);
		AtomicSDNode *AN = cast<AtomicSDNode>(Op.getNode());
		RHS = DAG.getNode(ISD::XOR, dl, VT, DAG.getConstant(-1ULL, dl, VT), RHS);
		return DAG.getAtomic(ISD::ATOMIC_LOAD_CLR, dl, AN->getMemoryVT(),
		Op.getOperand(0), Op.getOperand(1), RHS,
		AN->getMemOperand());
		}

/// getTgtMemIntrinsic - Represent NEON load and store intrinsics as		/// getTgtMemIntrinsic - Represent NEON load and store intrinsics as
/// MemIntrinsicNodes. The associated MachineMemOperands record the alignment		/// MemIntrinsicNodes. The associated MachineMemOperands record the alignment
/// specified in the intrinsic calls.		/// specified in the intrinsic calls.
bool AArch64TargetLowering::getTgtMemIntrinsic(IntrinsicInfo &Info,		bool AArch64TargetLowering::getTgtMemIntrinsic(IntrinsicInfo &Info,
const CallInst &I,		const CallInst &I,
MachineFunction &MF,		MachineFunction &MF,
unsigned Intrinsic) const {		unsigned Intrinsic) const {
auto &DL = I.getModule()->getDataLayout();		auto &DL = I.getModule()->getDataLayout();
▲ Show 20 Lines • Show All 3,677 Lines • Show Last 20 Lines

llvm/trunk/lib/Target/AArch64/AArch64InstrAtomics.td

Show First 20 Lines • Show All 403 Lines • ▼ Show 20 Lines	def CMP_SWAP_128 : Pseudo<(outs GPR64:$RdLo, GPR64:$RdHi, GPR32:$scratch),
GPR64:$newLo, GPR64:$newHi), []>,		GPR64:$newLo, GPR64:$newHi), []>,
Sched<[WriteAtomic]>;		Sched<[WriteAtomic]>;

// v8.1 Atomic instructions:		// v8.1 Atomic instructions:
let Predicates = [HasLSE] in {		let Predicates = [HasLSE] in {
defm : LDOPregister_patterns<"LDADD", "atomic_load_add">;		defm : LDOPregister_patterns<"LDADD", "atomic_load_add">;
defm : LDOPregister_patterns<"LDSET", "atomic_load_or">;		defm : LDOPregister_patterns<"LDSET", "atomic_load_or">;
defm : LDOPregister_patterns<"LDEOR", "atomic_load_xor">;		defm : LDOPregister_patterns<"LDEOR", "atomic_load_xor">;
		defm : LDOPregister_patterns<"LDCLR", "atomic_load_clr">;
defm : LDOPregister_patterns<"LDSMAX", "atomic_load_max">;		defm : LDOPregister_patterns<"LDSMAX", "atomic_load_max">;
defm : LDOPregister_patterns<"LDSMIN", "atomic_load_min">;		defm : LDOPregister_patterns<"LDSMIN", "atomic_load_min">;
defm : LDOPregister_patterns<"LDUMAX", "atomic_load_umax">;		defm : LDOPregister_patterns<"LDUMAX", "atomic_load_umax">;
defm : LDOPregister_patterns<"LDUMIN", "atomic_load_umin">;		defm : LDOPregister_patterns<"LDUMIN", "atomic_load_umin">;
defm : LDOPregister_patterns<"SWP", "atomic_swap">;		defm : LDOPregister_patterns<"SWP", "atomic_swap">;
		defm : CASregister_patterns<"CAS", "atomic_cmp_swap">;

		// These two patterns are only needed for global isel, selection dag isel
		// converts atomic load-sub into a sub and atomic load-add, and likewise for
		// and -> clr.
defm : LDOPregister_patterns_mod<"LDADD", "atomic_load_sub", "SUB">;		defm : LDOPregister_patterns_mod<"LDADD", "atomic_load_sub", "SUB">;
defm : LDOPregister_patterns_mod<"LDCLR", "atomic_load_and", "ORN">;		defm : LDOPregister_patterns_mod<"LDCLR", "atomic_load_and", "ORN">;
defm : CASregister_patterns<"CAS", "atomic_cmp_swap">;
}		}

llvm/trunk/test/CodeGen/AArch64/atomic-ops-lse.ll

	Show First 20 Lines • Show All 972 Lines • ▼ Show 20 Lines
	; CHECK: adrp [[TMPADDR:x[0-9]+]], var64			; CHECK: adrp [[TMPADDR:x[0-9]+]], var64
	; CHECK: add x[[ADDR:[0-9]+]], [[TMPADDR]], {{#?}}:lo12:var64			; CHECK: add x[[ADDR:[0-9]+]], [[TMPADDR]], {{#?}}:lo12:var64

	; CHECK: ldclral x[[NOT]], x[[NEW:[0-9]+]], [x[[ADDR]]]			; CHECK: ldclral x[[NOT]], x[[NEW:[0-9]+]], [x[[ADDR]]]
	; CHECK-NOT: dmb			; CHECK-NOT: dmb
	ret i64 %old			ret i64 %old
	}			}

				define i8 @test_atomic_load_and_i8_inv_imm() nounwind {
				; CHECK-LABEL: test_atomic_load_and_i8_inv_imm:
				%old = atomicrmw and i8* @var8, i8 -2 seq_cst
				; CHECK-NOT: dmb
				; CHECK: adrp [[TMPADDR:x[0-9]+]], var8
				; CHECK: add x[[ADDR:[0-9]+]], [[TMPADDR]], {{#?}}:lo12:var8
				; CHECK: orr w[[CONST:[0-9]+]], wzr, #0x1
				; CHECK: ldclralb w[[CONST]], w[[NEW:[0-9]+]], [x[[ADDR]]]
				; CHECK-NOT: dmb
				ret i8 %old
				}

				define i16 @test_atomic_load_and_i16_inv_imm() nounwind {
				; CHECK-LABEL: test_atomic_load_and_i16_inv_imm:
				%old = atomicrmw and i16* @var16, i16 -2 seq_cst
				; CHECK-NOT: dmb
				; CHECK: adrp [[TMPADDR:x[0-9]+]], var16
				; CHECK: add x[[ADDR:[0-9]+]], [[TMPADDR]], {{#?}}:lo12:var16
				; CHECK: orr w[[CONST:[0-9]+]], wzr, #0x1
				; CHECK: ldclralh w[[CONST]], w[[NEW:[0-9]+]], [x[[ADDR]]]
				; CHECK-NOT: dmb
				ret i16 %old
				}

				define i32 @test_atomic_load_and_i32_inv_imm() nounwind {
				; CHECK-LABEL: test_atomic_load_and_i32_inv_imm:
				%old = atomicrmw and i32* @var32, i32 -2 seq_cst
				; CHECK-NOT: dmb
				; CHECK: adrp [[TMPADDR:x[0-9]+]], var32
				; CHECK: add x[[ADDR:[0-9]+]], [[TMPADDR]], {{#?}}:lo12:var32
				; CHECK: orr w[[CONST:[0-9]+]], wzr, #0x1
				; CHECK: ldclral w[[CONST]], w[[NEW:[0-9]+]], [x[[ADDR]]]
				; CHECK-NOT: dmb
				ret i32 %old
				}

				define i64 @test_atomic_load_and_i64_inv_imm() nounwind {
				; CHECK-LABEL: test_atomic_load_and_i64_inv_imm:
				%old = atomicrmw and i64* @var64, i64 -2 seq_cst
				; CHECK-NOT: dmb
				; CHECK: adrp [[TMPADDR:x[0-9]+]], var64
				; CHECK: add x[[ADDR:[0-9]+]], [[TMPADDR]], {{#?}}:lo12:var64
				; CHECK: orr w[[CONST:[0-9]+]], wzr, #0x1
				; CHECK: ldclral x[[CONST]], x[[NEW:[0-9]+]], [x[[ADDR]]]
				; CHECK-NOT: dmb
				ret i64 %old
				}

				define i8 @test_atomic_load_and_i8_inv_arg(i8 %offset) nounwind {
				; CHECK-LABEL: test_atomic_load_and_i8_inv_arg:
				%inv = xor i8 %offset, -1
				%old = atomicrmw and i8* @var8, i8 %inv seq_cst
				; CHECK-NOT: dmb
				; CHECK: adrp [[TMPADDR:x[0-9]+]], var8
				; CHECK: add x[[ADDR:[0-9]+]], [[TMPADDR]], {{#?}}:lo12:var8
				; CHECK: ldclralb w0, w[[NEW:[0-9]+]], [x[[ADDR]]]
				; CHECK-NOT: dmb
				ret i8 %old
				}

				define i16 @test_atomic_load_and_i16_inv_arg(i16 %offset) nounwind {
				; CHECK-LABEL: test_atomic_load_and_i16_inv_arg:
				%inv = xor i16 %offset, -1
				%old = atomicrmw and i16* @var16, i16 %inv seq_cst
				; CHECK-NOT: dmb
				; CHECK: adrp [[TMPADDR:x[0-9]+]], var16
				; CHECK: add x[[ADDR:[0-9]+]], [[TMPADDR]], {{#?}}:lo12:var16
				; CHECK: ldclralh w0, w[[NEW:[0-9]+]], [x[[ADDR]]]
				; CHECK-NOT: dmb
				ret i16 %old
				}

				define i32 @test_atomic_load_and_i32_inv_arg(i32 %offset) nounwind {
				; CHECK-LABEL: test_atomic_load_and_i32_inv_arg:
				%inv = xor i32 %offset, -1
				%old = atomicrmw and i32* @var32, i32 %inv seq_cst
				; CHECK-NOT: dmb
				; CHECK: adrp [[TMPADDR:x[0-9]+]], var32
				; CHECK: add x[[ADDR:[0-9]+]], [[TMPADDR]], {{#?}}:lo12:var32
				; CHECK: ldclral w0, w[[NEW:[0-9]+]], [x[[ADDR]]]
				; CHECK-NOT: dmb
				ret i32 %old
				}

				define i64 @test_atomic_load_and_i64_inv_arg(i64 %offset) nounwind {
				; CHECK-LABEL: test_atomic_load_and_i64_inv_arg:
				%inv = xor i64 %offset, -1
				%old = atomicrmw and i64* @var64, i64 %inv seq_cst
				; CHECK-NOT: dmb
				; CHECK: adrp [[TMPADDR:x[0-9]+]], var64
				; CHECK: add x[[ADDR:[0-9]+]], [[TMPADDR]], {{#?}}:lo12:var64
				; CHECK: ldclral x0, x[[NEW:[0-9]+]], [x[[ADDR]]]
				; CHECK-NOT: dmb
				ret i64 %old
				}

	define void @test_atomic_load_and_i32_noret(i32 %offset) nounwind {			define void @test_atomic_load_and_i32_noret(i32 %offset) nounwind {
	; CHECK-LABEL: test_atomic_load_and_i32_noret:			; CHECK-LABEL: test_atomic_load_and_i32_noret:
	atomicrmw and i32* @var32, i32 %offset seq_cst			atomicrmw and i32* @var32, i32 %offset seq_cst
	; CHECK-NOT: dmb			; CHECK-NOT: dmb
	; CHECK: mvn w[[NOT:[0-9]+]], w[[OLD:[0-9]+]]			; CHECK: mvn w[[NOT:[0-9]+]], w[[OLD:[0-9]+]]
	; CHECK: adrp [[TMPADDR:x[0-9]+]], var32			; CHECK: adrp [[TMPADDR:x[0-9]+]], var32
	; CHECK: add x[[ADDR:[0-9]+]], [[TMPADDR]], {{#?}}:lo12:var32			; CHECK: add x[[ADDR:[0-9]+]], [[TMPADDR]], {{#?}}:lo12:var32

	▲ Show 20 Lines • Show All 4,104 Lines • Show Last 20 Lines

This is an archive of the discontinued LLVM Phabricator instance.

[AArch64] Improve v8.1-A code-gen for atomic load-andClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 133881

llvm/trunk/include/llvm/CodeGen/ISDOpcodes.h

llvm/trunk/include/llvm/CodeGen/SelectionDAGNodes.h

llvm/trunk/include/llvm/Target/TargetSelectionDAG.td

llvm/trunk/lib/CodeGen/SelectionDAG/LegalizeDAG.cpp

llvm/trunk/lib/CodeGen/SelectionDAG/LegalizeIntegerTypes.cpp

llvm/trunk/lib/CodeGen/SelectionDAG/SelectionDAG.cpp

llvm/trunk/lib/CodeGen/SelectionDAG/SelectionDAGDumper.cpp

llvm/trunk/lib/Target/AArch64/AArch64ISelLowering.h

llvm/trunk/lib/Target/AArch64/AArch64ISelLowering.cpp

llvm/trunk/lib/Target/AArch64/AArch64InstrAtomics.td

llvm/trunk/test/CodeGen/AArch64/atomic-ops-lse.ll

[AArch64] Improve v8.1-A code-gen for atomic load-and
ClosedPublic