Diff 358804

llvm/include/llvm/IR/IntrinsicsPowerPC.td

Show First 20 Lines • Show All 1,594 Lines • ▼ Show 20 Lines	let TargetPrefix = "ppc" in {
def int_ppc_maddhdu		def int_ppc_maddhdu
: GCCBuiltin<"__builtin_ppc_maddhdu">,		: GCCBuiltin<"__builtin_ppc_maddhdu">,
Intrinsic<[llvm_i64_ty], [llvm_i64_ty, llvm_i64_ty, llvm_i64_ty], [IntrNoMem]>;		Intrinsic<[llvm_i64_ty], [llvm_i64_ty, llvm_i64_ty, llvm_i64_ty], [IntrNoMem]>;
def int_ppc_maddld		def int_ppc_maddld
: GCCBuiltin<"__builtin_ppc_maddld">,		: GCCBuiltin<"__builtin_ppc_maddld">,
Intrinsic<[llvm_i64_ty], [llvm_i64_ty, llvm_i64_ty, llvm_i64_ty], [IntrNoMem]>;		Intrinsic<[llvm_i64_ty], [llvm_i64_ty, llvm_i64_ty, llvm_i64_ty], [IntrNoMem]>;
}		}

		//===----------------------------------------------------------------------===//
		// PowerPC Atomic Intrinsic Definitions.
		let TargetPrefix = "ppc" in {
		class AtomicRMW128Intrinsic
		: Intrinsic<[llvm_i64_ty, llvm_i64_ty],
		[llvm_ptr_ty, llvm_i64_ty, llvm_i64_ty],
		[IntrArgMemOnly, NoCapture<ArgIndex<0>>]>;
		def int_ppc_atomicrmw_xchg_i128 : AtomicRMW128Intrinsic;
		def int_ppc_atomicrmw_add_i128 : AtomicRMW128Intrinsic;
		def int_ppc_atomicrmw_sub_i128 : AtomicRMW128Intrinsic;
		def int_ppc_atomicrmw_and_i128 : AtomicRMW128Intrinsic;
		def int_ppc_atomicrmw_or_i128 : AtomicRMW128Intrinsic;
		def int_ppc_atomicrmw_xor_i128 : AtomicRMW128Intrinsic;
		def int_ppc_atomicrmw_nand_i128 : AtomicRMW128Intrinsic;
		def int_ppc_cmpxchg_i128 : Intrinsic<[llvm_i64_ty, llvm_i64_ty],
		[llvm_ptr_ty,
		llvm_i64_ty, llvm_i64_ty,
		llvm_i64_ty, llvm_i64_ty],
		efriedmaUnsubmitted Not Done Reply Inline Actions Adding IR intrinsics for this is a little weird. Is there any reason you can't just use SelectionDAG custom legalization for these operations? I mean, not that it doesn't work this way, but it seems more complicated overall. efriedma: Adding IR intrinsics for this is a little weird. Is there any reason you can't just use…
		lkailAuthorUnsubmitted Done Reply Inline Actions Exploit AtomicExpandPass looks easier from my side :). And what's more current PPC backend also has spilling issues with `-O0`(fastregalloc enabled), see https://bugs.llvm.org/show_bug.cgi?id=50780. Maybe we should unify PPC's instruction selection of atomic operations one day (PPC also has partword atomics which is feasible to use MaskedIntrinsic) which I need more feedback from @nemanjai and @jsji . lkail: Exploit AtomicExpandPass looks easier from my side :). And what's more current PPC backend also…
		jsjiUnsubmitted Not Done Reply Inline Actions Yes, I think we should refactor partword atomics to use AtomicExpandPass as well, although not necessary do it now. jsji: Yes, I think we should refactor partword atomics to use AtomicExpandPass as well, although not…
		[IntrArgMemOnly, NoCapture<ArgIndex<0>>]>;
		}

llvm/lib/CodeGen/AtomicExpandPass.cpp

Show First 20 Lines • Show All 683 Lines • ▼ Show 20 Lines	static PartwordMaskValues createMaskInstrs(IRBuilder<> &Builder, Instruction *I,
unsigned ValueSize = DL.getTypeStoreSize(ValueType);		unsigned ValueSize = DL.getTypeStoreSize(ValueType);

PMV.ValueType = ValueType;		PMV.ValueType = ValueType;
PMV.WordType = MinWordSize > ValueSize ? Type::getIntNTy(Ctx, MinWordSize * 8)		PMV.WordType = MinWordSize > ValueSize ? Type::getIntNTy(Ctx, MinWordSize * 8)
: ValueType;		: ValueType;
if (PMV.ValueType == PMV.WordType) {		if (PMV.ValueType == PMV.WordType) {
PMV.AlignedAddr = Addr;		PMV.AlignedAddr = Addr;
PMV.AlignedAddrAlignment = AddrAlign;		PMV.AlignedAddrAlignment = AddrAlign;
		PMV.ShiftAmt = ConstantInt::get(PMV.ValueType, 0);
		PMV.Mask = ConstantInt::get(PMV.ValueType, ~0);
return PMV;		return PMV;
}		}

assert(ValueSize < MinWordSize);		assert(ValueSize < MinWordSize);

Type *WordPtrType =		Type *WordPtrType =
PMV.WordType->getPointerTo(Addr->getType()->getPointerAddressSpace());		PMV.WordType->getPointerTo(Addr->getType()->getPointerAddressSpace());

▲ Show 20 Lines • Show All 1,197 Lines • Show Last 20 Lines

llvm/lib/Target/PowerPC/CMakeLists.txt

Show All 21 Lines	add_llvm_target(PowerPCCodeGen
GISel/PPCInstructionSelector.cpp		GISel/PPCInstructionSelector.cpp
PPCBoolRetToInt.cpp		PPCBoolRetToInt.cpp
PPCAsmPrinter.cpp		PPCAsmPrinter.cpp
PPCBranchSelector.cpp		PPCBranchSelector.cpp
PPCBranchCoalescing.cpp		PPCBranchCoalescing.cpp
PPCCallingConv.cpp		PPCCallingConv.cpp
PPCCCState.cpp		PPCCCState.cpp
PPCCTRLoops.cpp		PPCCTRLoops.cpp
		PPCExpandAtomicPseudoInsts.cpp
PPCHazardRecognizers.cpp		PPCHazardRecognizers.cpp
PPCInstrInfo.cpp		PPCInstrInfo.cpp
PPCISelDAGToDAG.cpp		PPCISelDAGToDAG.cpp
PPCISelLowering.cpp		PPCISelLowering.cpp
PPCEarlyReturn.cpp		PPCEarlyReturn.cpp
PPCFastISel.cpp		PPCFastISel.cpp
PPCFrameLowering.cpp		PPCFrameLowering.cpp
PPCLoopInstrFormPrep.cpp		PPCLoopInstrFormPrep.cpp
▲ Show 20 Lines • Show All 47 Lines • Show Last 20 Lines

llvm/lib/Target/PowerPC/PPC.h

Show First 20 Lines • Show All 46 Lines • ▼ Show 20 Lines	#endif
FunctionPass *createPPCMIPeepholePass();		FunctionPass *createPPCMIPeepholePass();
FunctionPass *createPPCBranchSelectionPass();		FunctionPass *createPPCBranchSelectionPass();
FunctionPass *createPPCBranchCoalescingPass();		FunctionPass *createPPCBranchCoalescingPass();
FunctionPass *createPPCISelDag(PPCTargetMachine &TM, CodeGenOpt::Level OL);		FunctionPass *createPPCISelDag(PPCTargetMachine &TM, CodeGenOpt::Level OL);
FunctionPass *createPPCTLSDynamicCallPass();		FunctionPass *createPPCTLSDynamicCallPass();
FunctionPass *createPPCBoolRetToIntPass();		FunctionPass *createPPCBoolRetToIntPass();
FunctionPass *createPPCExpandISELPass();		FunctionPass *createPPCExpandISELPass();
FunctionPass *createPPCPreEmitPeepholePass();		FunctionPass *createPPCPreEmitPeepholePass();
		FunctionPass *createPPCExpandAtomicPseudoPass();
void LowerPPCMachineInstrToMCInst(const MachineInstr *MI, MCInst &OutMI,		void LowerPPCMachineInstrToMCInst(const MachineInstr *MI, MCInst &OutMI,
AsmPrinter &AP);		AsmPrinter &AP);
bool LowerPPCMachineOperandToMCOperand(const MachineOperand &MO,		bool LowerPPCMachineOperandToMCOperand(const MachineOperand &MO,
MCOperand &OutMO, AsmPrinter &AP);		MCOperand &OutMO, AsmPrinter &AP);

void initializePPCCTRLoopsPass(PassRegistry&);		void initializePPCCTRLoopsPass(PassRegistry&);
#ifndef NDEBUG		#ifndef NDEBUG
void initializePPCCTRLoopsVerifyPass(PassRegistry&);		void initializePPCCTRLoopsVerifyPass(PassRegistry&);
#endif		#endif
void initializePPCLoopInstrFormPrepPass(PassRegistry&);		void initializePPCLoopInstrFormPrepPass(PassRegistry&);
void initializePPCTOCRegDepsPass(PassRegistry&);		void initializePPCTOCRegDepsPass(PassRegistry&);
void initializePPCEarlyReturnPass(PassRegistry&);		void initializePPCEarlyReturnPass(PassRegistry&);
void initializePPCVSXCopyPass(PassRegistry&);		void initializePPCVSXCopyPass(PassRegistry&);
void initializePPCVSXFMAMutatePass(PassRegistry&);		void initializePPCVSXFMAMutatePass(PassRegistry&);
void initializePPCVSXSwapRemovalPass(PassRegistry&);		void initializePPCVSXSwapRemovalPass(PassRegistry&);
void initializePPCReduceCRLogicalsPass(PassRegistry&);		void initializePPCReduceCRLogicalsPass(PassRegistry&);
void initializePPCBSelPass(PassRegistry&);		void initializePPCBSelPass(PassRegistry&);
void initializePPCBranchCoalescingPass(PassRegistry&);		void initializePPCBranchCoalescingPass(PassRegistry&);
void initializePPCBoolRetToIntPass(PassRegistry&);		void initializePPCBoolRetToIntPass(PassRegistry&);
void initializePPCExpandISELPass(PassRegistry &);		void initializePPCExpandISELPass(PassRegistry &);
void initializePPCPreEmitPeepholePass(PassRegistry &);		void initializePPCPreEmitPeepholePass(PassRegistry &);
void initializePPCTLSDynamicCallPass(PassRegistry &);		void initializePPCTLSDynamicCallPass(PassRegistry &);
void initializePPCMIPeepholePass(PassRegistry&);		void initializePPCMIPeepholePass(PassRegistry&);
		void initializePPCExpandAtomicPseudoPass(PassRegistry &);

extern char &PPCVSXFMAMutateID;		extern char &PPCVSXFMAMutateID;

ModulePass *createPPCLowerMASSVEntriesPass();		ModulePass *createPPCLowerMASSVEntriesPass();
void initializePPCLowerMASSVEntriesPass(PassRegistry &);		void initializePPCLowerMASSVEntriesPass(PassRegistry &);
extern char &PPCLowerMASSVEntriesID;		extern char &PPCLowerMASSVEntriesID;

InstructionSelector *		InstructionSelector *
▲ Show 20 Lines • Show All 88 Lines • Show Last 20 Lines

llvm/lib/Target/PowerPC/PPC.td

Show First 20 Lines • Show All 155 Lines • ▼ Show 20 Lines	def FeatureP8Vector : SubtargetFeature<"power8-vector", "HasP8Vector", "true",
[FeatureVSX, FeatureP8Altivec]>;		[FeatureVSX, FeatureP8Altivec]>;
def FeatureDirectMove :		def FeatureDirectMove :
SubtargetFeature<"direct-move", "HasDirectMove", "true",		SubtargetFeature<"direct-move", "HasDirectMove", "true",
"Enable Power8 direct move instructions",		"Enable Power8 direct move instructions",
[FeatureVSX]>;		[FeatureVSX]>;
def FeaturePartwordAtomic : SubtargetFeature<"partword-atomics",		def FeaturePartwordAtomic : SubtargetFeature<"partword-atomics",
"HasPartwordAtomics", "true",		"HasPartwordAtomics", "true",
"Enable l[bh]arx and st[bh]cx.">;		"Enable l[bh]arx and st[bh]cx.">;
		def FeatureQuadwordAtomic : SubtargetFeature<"quadword-atomics",
		"HasQuadwordAtomics", "true",
		"Enable lqarx and stqcx.">;
def FeatureInvariantFunctionDescriptors :		def FeatureInvariantFunctionDescriptors :
SubtargetFeature<"invariant-function-descriptors",		SubtargetFeature<"invariant-function-descriptors",
"HasInvariantFunctionDescriptors", "true",		"HasInvariantFunctionDescriptors", "true",
"Assume function descriptors are invariant">;		"Assume function descriptors are invariant">;
def FeatureLongCall : SubtargetFeature<"longcall", "UseLongCalls", "true",		def FeatureLongCall : SubtargetFeature<"longcall", "UseLongCalls", "true",
"Always use indirect calls">;		"Always use indirect calls">;
def FeatureHTM : SubtargetFeature<"htm", "HasHTM", "true",		def FeatureHTM : SubtargetFeature<"htm", "HasHTM", "true",
"Enable Hardware Transactional Memory instructions">;		"Enable Hardware Transactional Memory instructions">;
▲ Show 20 Lines • Show All 154 Lines • ▼ Show 20 Lines	list<SubtargetFeature> P8AdditionalFeatures =
[DirectivePwr8,		[DirectivePwr8,
FeatureP8Altivec,		FeatureP8Altivec,
FeatureP8Vector,		FeatureP8Vector,
FeatureP8Crypto,		FeatureP8Crypto,
FeatureHTM,		FeatureHTM,
FeatureDirectMove,		FeatureDirectMove,
FeatureICBT,		FeatureICBT,
FeaturePartwordAtomic,		FeaturePartwordAtomic,
		FeatureQuadwordAtomic,
FeaturePredictableSelectIsExpensive		FeaturePredictableSelectIsExpensive
];		];

list<SubtargetFeature> P8SpecificFeatures = [FeatureAddiLoadFusion,		list<SubtargetFeature> P8SpecificFeatures = [FeatureAddiLoadFusion,
FeatureAddisLoadFusion];		FeatureAddisLoadFusion];
list<SubtargetFeature> P8InheritableFeatures =		list<SubtargetFeature> P8InheritableFeatures =
!listconcat(P7InheritableFeatures, P8AdditionalFeatures);		!listconcat(P7InheritableFeatures, P8AdditionalFeatures);
list<SubtargetFeature> P8Features =		list<SubtargetFeature> P8Features =
▲ Show 20 Lines • Show All 310 Lines • Show Last 20 Lines

llvm/lib/Target/PowerPC/PPCExpandAtomicPseudoInsts.cpp

This file was added.

				//===-- PPCExpandAtomicPseudoInsts.cpp - Expand atomic pseudo instrs. -----===//
				//
				// Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.
				// See https://llvm.org/LICENSE.txt for license information.
				// SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception
				//
				//===----------------------------------------------------------------------===//
				//
				// This file contains a pass that expands atomic pseudo instructions into
				// target instructions post RA. With such method, LL/SC loop is considered as
				// a whole blob and make spilling unlikely happens in the LL/SC loop.
				//
				//===----------------------------------------------------------------------===//

				#include "MCTargetDesc/PPCPredicates.h"
				#include "PPC.h"
				#include "PPCInstrInfo.h"
				#include "PPCTargetMachine.h"

				#include "llvm/CodeGen/LivePhysRegs.h"
				#include "llvm/CodeGen/MachineFunctionPass.h"
				#include "llvm/CodeGen/MachineInstrBuilder.h"

				using namespace llvm;

				#define DEBUG_TYPE "ppc-atomic-expand"

				namespace {

				class PPCExpandAtomicPseudo : public MachineFunctionPass {
				public:
				const PPCInstrInfo *TII;
				const PPCRegisterInfo *TRI;
				static char ID;

				PPCExpandAtomicPseudo() : MachineFunctionPass(ID) {
				initializePPCExpandAtomicPseudoPass(*PassRegistry::getPassRegistry());
				}

				bool runOnMachineFunction(MachineFunction &MF) override;

				private:
				bool expandMI(MachineBasicBlock &MBB, MachineInstr &MI,
				MachineBasicBlock::iterator &NMBBI);
				bool expandAtomicRMW128(MachineBasicBlock &MBB, MachineInstr &MI,
				MachineBasicBlock::iterator &NMBBI);
				bool expandAtomicCmpSwap128(MachineBasicBlock &MBB, MachineInstr &MI,
				MachineBasicBlock::iterator &NMBBI);
				};

				static void PairedCopy(const PPCInstrInfo *TII, MachineBasicBlock &MBB,
				MachineBasicBlock::iterator MBBI, const DebugLoc &DL,
				Register Dest0, Register Dest1, Register Src0,
				Register Src1) {
				const MCInstrDesc &OR = TII->get(PPC::OR8);
				const MCInstrDesc &XOR = TII->get(PPC::XOR8);
				if (Dest0 == Src1 && Dest1 == Src0) {
				// The most tricky case, swapping values.
				BuildMI(MBB, MBBI, DL, XOR, Dest0).addReg(Dest0).addReg(Dest1);
				BuildMI(MBB, MBBI, DL, XOR, Dest1).addReg(Dest0).addReg(Dest1);
				BuildMI(MBB, MBBI, DL, XOR, Dest0).addReg(Dest0).addReg(Dest1);
				} else if (Dest0 != Src0 \|\| Dest1 != Src1) {
				if (Dest0 == Src1 \|\| Dest1 != Src0) {
				BuildMI(MBB, MBBI, DL, OR, Dest1).addReg(Src1).addReg(Src1);
				BuildMI(MBB, MBBI, DL, OR, Dest0).addReg(Src0).addReg(Src0);
				} else {
				BuildMI(MBB, MBBI, DL, OR, Dest0).addReg(Src0).addReg(Src0);
				BuildMI(MBB, MBBI, DL, OR, Dest1).addReg(Src1).addReg(Src1);
				}
				}
				}

				bool PPCExpandAtomicPseudo::runOnMachineFunction(MachineFunction &MF) {
				bool Changed = false;
				TII = static_cast<const PPCInstrInfo *>(MF.getSubtarget().getInstrInfo());
				TRI = &TII->getRegisterInfo();
				for (MachineFunction::iterator I = MF.begin(), E = MF.end(); I != E; ++I) {
				MachineBasicBlock &MBB = *I;
				for (MachineBasicBlock::iterator MBBI = MBB.begin(), MBBE = MBB.end();
				MBBI != MBBE;) {
				MachineInstr &MI = *MBBI;
				MachineBasicBlock::iterator NMBBI = std::next(MBBI);
				Changed \|= expandMI(MBB, MI, NMBBI);
				MBBI = NMBBI;
				}
				}
				if (Changed)
				MF.RenumberBlocks();
				return Changed;
				}

				bool PPCExpandAtomicPseudo::expandMI(MachineBasicBlock &MBB, MachineInstr &MI,
				MachineBasicBlock::iterator &NMBBI) {
				switch (MI.getOpcode()) {
				case PPC::ATOMIC_SWAP_I128:
				case PPC::ATOMIC_LOAD_ADD_I128:
				case PPC::ATOMIC_LOAD_SUB_I128:
				case PPC::ATOMIC_LOAD_XOR_I128:
				case PPC::ATOMIC_LOAD_NAND_I128:
				case PPC::ATOMIC_LOAD_AND_I128:
				case PPC::ATOMIC_LOAD_OR_I128:
				return expandAtomicRMW128(MBB, MI, NMBBI);
				case PPC::ATOMIC_CMP_SWAP_I128:
				return expandAtomicCmpSwap128(MBB, MI, NMBBI);
				default:
				return false;
				}
				}

				bool PPCExpandAtomicPseudo::expandAtomicRMW128(
				MachineBasicBlock &MBB, MachineInstr &MI,
				MachineBasicBlock::iterator &NMBBI) {
				const MCInstrDesc &LL = TII->get(PPC::LQARX);
				const MCInstrDesc &SC = TII->get(PPC::STQCX);
				DebugLoc DL = MI.getDebugLoc();
				MachineFunction *MF = MBB.getParent();
				const BasicBlock *BB = MBB.getBasicBlock();
				// Create layout of control flow.
				MachineFunction::iterator MFI = ++MBB.getIterator();
				MachineBasicBlock *LoopMBB = MF->CreateMachineBasicBlock(BB);
				MachineBasicBlock *ExitMBB = MF->CreateMachineBasicBlock(BB);
				MF->insert(MFI, LoopMBB);
				MF->insert(MFI, ExitMBB);
				ExitMBB->splice(ExitMBB->begin(), &MBB, std::next(MI.getIterator()),
				MBB.end());
				ExitMBB->transferSuccessorsAndUpdatePHIs(&MBB);
				MBB.addSuccessor(LoopMBB);

				// For non-min/max operations, control flow is kinda like:
				// MBB:
				// ...
				// LoopMBB:
				// lqarx in, ptr
				// addc out.sub_x1, in.sub_x1, op.sub_x1
				// adde out.sub_x0, in.sub_x0, op.sub_x0
				// stqcx out, ptr
				// bne- LoopMBB
				// ExitMBB:
				// ...
				Register Old = MI.getOperand(0).getReg();
				Register OldHi = TRI->getSubReg(Old, PPC::sub_gp8_x0);
				Register OldLo = TRI->getSubReg(Old, PPC::sub_gp8_x1);
				Register Scratch = MI.getOperand(1).getReg();
				Register ScratchHi = TRI->getSubReg(Scratch, PPC::sub_gp8_x0);
				Register ScratchLo = TRI->getSubReg(Scratch, PPC::sub_gp8_x1);
				Register RA = MI.getOperand(2).getReg();
				Register RB = MI.getOperand(3).getReg();
				Register IncrLo = MI.getOperand(4).getReg();
				Register IncrHi = MI.getOperand(5).getReg();
				unsigned RMWOpcode = MI.getOpcode();

				MachineBasicBlock *CurrentMBB = LoopMBB;
				BuildMI(CurrentMBB, DL, LL, Old).addReg(RA).addReg(RB);

				switch (RMWOpcode) {
				case PPC::ATOMIC_SWAP_I128:
				PairedCopy(TII, *CurrentMBB, CurrentMBB->end(), DL, ScratchHi, ScratchLo,
				IncrHi, IncrLo);
				break;
				case PPC::ATOMIC_LOAD_ADD_I128:
				BuildMI(CurrentMBB, DL, TII->get(PPC::ADDC8), ScratchLo)
				.addReg(IncrLo)
				.addReg(OldLo);
				BuildMI(CurrentMBB, DL, TII->get(PPC::ADDE8), ScratchHi)
				.addReg(IncrHi)
				.addReg(OldHi);
				break;
				case PPC::ATOMIC_LOAD_SUB_I128:
				BuildMI(CurrentMBB, DL, TII->get(PPC::SUBFC8), ScratchLo)
				.addReg(IncrLo)
				.addReg(OldLo);
				BuildMI(CurrentMBB, DL, TII->get(PPC::SUBFE8), ScratchHi)
				.addReg(IncrHi)
				.addReg(OldHi);
				break;

				#define TRIVIAL_ATOMICRMW(Opcode, Instr) \
				case Opcode: \
				BuildMI(CurrentMBB, DL, TII->get((Instr)), ScratchLo) \
				.addReg(IncrLo) \
				.addReg(OldLo); \
				BuildMI(CurrentMBB, DL, TII->get((Instr)), ScratchHi) \
				.addReg(IncrHi) \
				.addReg(OldHi); \
				break

				TRIVIAL_ATOMICRMW(PPC::ATOMIC_LOAD_OR_I128, PPC::OR8);
				TRIVIAL_ATOMICRMW(PPC::ATOMIC_LOAD_XOR_I128, PPC::XOR8);
				TRIVIAL_ATOMICRMW(PPC::ATOMIC_LOAD_AND_I128, PPC::AND8);
				TRIVIAL_ATOMICRMW(PPC::ATOMIC_LOAD_NAND_I128, PPC::NAND8);
				#undef TRIVIAL_ATOMICRMW
				default:
				llvm_unreachable("Unhandled atomic RMW operation");
				}
				BuildMI(CurrentMBB, DL, SC).addReg(Scratch).addReg(RA).addReg(RB);
				BuildMI(CurrentMBB, DL, TII->get(PPC::BCC))
				.addImm(PPC::PRED_NE)
				.addReg(PPC::CR0)
				.addMBB(LoopMBB);
				CurrentMBB->addSuccessor(LoopMBB);
				CurrentMBB->addSuccessor(ExitMBB);
				recomputeLiveIns(*LoopMBB);
				recomputeLiveIns(*ExitMBB);
				NMBBI = MBB.end();
				MI.eraseFromParent();
				return true;
				}

				bool PPCExpandAtomicPseudo::expandAtomicCmpSwap128(
				MachineBasicBlock &MBB, MachineInstr &MI,
				MachineBasicBlock::iterator &NMBBI) {
				const MCInstrDesc &LL = TII->get(PPC::LQARX);
				const MCInstrDesc &SC = TII->get(PPC::STQCX);
				DebugLoc DL = MI.getDebugLoc();
				MachineFunction *MF = MBB.getParent();
				const BasicBlock *BB = MBB.getBasicBlock();
				Register Old = MI.getOperand(0).getReg();
				Register OldHi = TRI->getSubReg(Old, PPC::sub_gp8_x0);
				Register OldLo = TRI->getSubReg(Old, PPC::sub_gp8_x1);
				Register Scratch = MI.getOperand(1).getReg();
				Register ScratchHi = TRI->getSubReg(Scratch, PPC::sub_gp8_x0);
				Register ScratchLo = TRI->getSubReg(Scratch, PPC::sub_gp8_x1);
				Register RA = MI.getOperand(2).getReg();
				Register RB = MI.getOperand(3).getReg();
				Register CmpLo = MI.getOperand(4).getReg();
				Register CmpHi = MI.getOperand(5).getReg();
				Register NewLo = MI.getOperand(6).getReg();
				Register NewHi = MI.getOperand(7).getReg();
				// Create layout of control flow.
				// loop:
				// old = lqarx ptr
				// <compare old, cmp>
				// bne 0, fail
				// succ:
				// stqcx new ptr
				// bne 0, loop
				// b exit
				// fail:
				// stqcx old ptr
				// exit:
				// ....
				MachineFunction::iterator MFI = ++MBB.getIterator();
				MachineBasicBlock *LoopCmpMBB = MF->CreateMachineBasicBlock(BB);
				MachineBasicBlock *CmpSuccMBB = MF->CreateMachineBasicBlock(BB);
				MachineBasicBlock *CmpFailMBB = MF->CreateMachineBasicBlock(BB);
				MachineBasicBlock *ExitMBB = MF->CreateMachineBasicBlock(BB);
				MF->insert(MFI, LoopCmpMBB);
				MF->insert(MFI, CmpSuccMBB);
				MF->insert(MFI, CmpFailMBB);
				MF->insert(MFI, ExitMBB);
				ExitMBB->splice(ExitMBB->begin(), &MBB, std::next(MI.getIterator()),
				MBB.end());
				ExitMBB->transferSuccessorsAndUpdatePHIs(&MBB);
				MBB.addSuccessor(LoopCmpMBB);
				// Build loop.
				MachineBasicBlock *CurrentMBB = LoopCmpMBB;
				BuildMI(CurrentMBB, DL, LL, Old).addReg(RA).addReg(RB);
				BuildMI(CurrentMBB, DL, TII->get(PPC::XOR8), ScratchLo)
				.addReg(OldLo)
				.addReg(CmpLo);
				BuildMI(CurrentMBB, DL, TII->get(PPC::XOR8), ScratchHi)
				.addReg(OldHi)
				.addReg(CmpHi);
				BuildMI(CurrentMBB, DL, TII->get(PPC::OR8_rec), ScratchLo)
				.addReg(ScratchLo)
				.addReg(ScratchHi);
				BuildMI(CurrentMBB, DL, TII->get(PPC::BCC))
				.addImm(PPC::PRED_NE)
				.addReg(PPC::CR0)
				.addMBB(CmpFailMBB);
				CurrentMBB->addSuccessor(CmpSuccMBB);
				CurrentMBB->addSuccessor(CmpFailMBB);
				// Build succ.
				CurrentMBB = CmpSuccMBB;
				PairedCopy(TII, *CurrentMBB, CurrentMBB->end(), DL, ScratchHi, ScratchLo,
				NewHi, NewLo);
				BuildMI(CurrentMBB, DL, SC).addReg(Scratch).addReg(RA).addReg(RB);
				BuildMI(CurrentMBB, DL, TII->get(PPC::BCC))
				.addImm(PPC::PRED_NE)
				.addReg(PPC::CR0)
				.addMBB(LoopCmpMBB);
				BuildMI(CurrentMBB, DL, TII->get(PPC::B)).addMBB(ExitMBB);
				CurrentMBB->addSuccessor(LoopCmpMBB);
				CurrentMBB->addSuccessor(ExitMBB);
				CurrentMBB = CmpFailMBB;
				BuildMI(CurrentMBB, DL, SC).addReg(Old).addReg(RA).addReg(RB);
				CurrentMBB->addSuccessor(ExitMBB);

				recomputeLiveIns(*LoopCmpMBB);
				recomputeLiveIns(*CmpSuccMBB);
				recomputeLiveIns(*CmpFailMBB);
				recomputeLiveIns(*ExitMBB);
				NMBBI = MBB.end();
				MI.eraseFromParent();
				return true;
				}

				} // namespace

				INITIALIZE_PASS(PPCExpandAtomicPseudo, DEBUG_TYPE, "PowerPC Expand Atomic",
				false, false)

				char PPCExpandAtomicPseudo::ID = 0;
				FunctionPass *llvm::createPPCExpandAtomicPseudoPass() {
				return new PPCExpandAtomicPseudo();
				}

llvm/lib/Target/PowerPC/PPCISelLowering.h

Show First 20 Lines • Show All 870 Lines • ▼ Show 20 Lines	bool shouldInsertFencesForAtomic(const Instruction *I) const override {
return true;		return true;
}		}

Instruction emitLeadingFence(IRBuilderBase &Builder, Instruction Inst,		Instruction emitLeadingFence(IRBuilderBase &Builder, Instruction Inst,
AtomicOrdering Ord) const override;		AtomicOrdering Ord) const override;
Instruction emitTrailingFence(IRBuilderBase &Builder, Instruction Inst,		Instruction emitTrailingFence(IRBuilderBase &Builder, Instruction Inst,
AtomicOrdering Ord) const override;		AtomicOrdering Ord) const override;

		TargetLowering::AtomicExpansionKind
		shouldExpandAtomicRMWInIR(AtomicRMWInst *AI) const override;

		TargetLowering::AtomicExpansionKind
		shouldExpandAtomicCmpXchgInIR(AtomicCmpXchgInst *AI) const override;

		Value *emitMaskedAtomicRMWIntrinsic(IRBuilderBase &Builder,
		AtomicRMWInst AI, Value AlignedAddr,
		Value Incr, Value Mask,
		Value *ShiftAmt,
		AtomicOrdering Ord) const override;
		Value *emitMaskedAtomicCmpXchgIntrinsic(IRBuilderBase &Builder,
		AtomicCmpXchgInst *CI,
		Value AlignedAddr, Value CmpVal,
		Value NewVal, Value Mask,
		AtomicOrdering Ord) const override;

MachineBasicBlock *		MachineBasicBlock *
EmitInstrWithCustomInserter(MachineInstr &MI,		EmitInstrWithCustomInserter(MachineInstr &MI,
MachineBasicBlock *MBB) const override;		MachineBasicBlock *MBB) const override;
MachineBasicBlock *EmitAtomicBinary(MachineInstr &MI,		MachineBasicBlock *EmitAtomicBinary(MachineInstr &MI,
MachineBasicBlock *MBB,		MachineBasicBlock *MBB,
unsigned AtomicSize,		unsigned AtomicSize,
unsigned BinOpcode,		unsigned BinOpcode,
unsigned CmpOpcode = 0,		unsigned CmpOpcode = 0,
▲ Show 20 Lines • Show All 528 Lines • Show Last 20 Lines

llvm/lib/Target/PowerPC/PPCISelLowering.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 115 Lines • ▼ Show 20 Lines
cl::desc("disable sibling call optimization on ppc"), cl::Hidden);		cl::desc("disable sibling call optimization on ppc"), cl::Hidden);

static cl::opt<bool> DisableInnermostLoopAlign32("disable-ppc-innermost-loop-align32",		static cl::opt<bool> DisableInnermostLoopAlign32("disable-ppc-innermost-loop-align32",
cl::desc("don't always align innermost loop to 32 bytes on ppc"), cl::Hidden);		cl::desc("don't always align innermost loop to 32 bytes on ppc"), cl::Hidden);

static cl::opt<bool> UseAbsoluteJumpTables("ppc-use-absolute-jumptables",		static cl::opt<bool> UseAbsoluteJumpTables("ppc-use-absolute-jumptables",
cl::desc("use absolute jump tables on ppc"), cl::Hidden);		cl::desc("use absolute jump tables on ppc"), cl::Hidden);

		static cl::opt<bool> EnableQuadwordAtomics(
		"ppc-quadword-atomics",
		cl::desc("enable quadword lock-free atomic operations"), cl::init(false),
		cl::Hidden);

STATISTIC(NumTailCalls, "Number of tail calls");		STATISTIC(NumTailCalls, "Number of tail calls");
STATISTIC(NumSiblingCalls, "Number of sibling calls");		STATISTIC(NumSiblingCalls, "Number of sibling calls");
STATISTIC(ShufflesHandledWithVPERM, "Number of shuffles lowered to a VPERM");		STATISTIC(ShufflesHandledWithVPERM, "Number of shuffles lowered to a VPERM");
STATISTIC(NumDynamicAllocaProbed, "Number of dynamic stack allocation probed");		STATISTIC(NumDynamicAllocaProbed, "Number of dynamic stack allocation probed");

static bool isNByteElemShuffleMask(ShuffleVectorSDNode *, unsigned, int);		static bool isNByteElemShuffleMask(ShuffleVectorSDNode *, unsigned, int);

static SDValue widenVec(SelectionDAG &DAG, SDValue Vec, const SDLoc &dl);		static SDValue widenVec(SelectionDAG &DAG, SDValue Vec, const SDLoc &dl);
▲ Show 20 Lines • Show All 1,144 Lines • ▼ Show 20 Lines

setOperationAction(ISD::READCYCLECOUNTER, MVT::i64, isPPC64 ? Legal : Custom);		setOperationAction(ISD::READCYCLECOUNTER, MVT::i64, isPPC64 ? Legal : Custom);

if (!isPPC64) {		if (!isPPC64) {
setOperationAction(ISD::ATOMIC_LOAD, MVT::i64, Expand);		setOperationAction(ISD::ATOMIC_LOAD, MVT::i64, Expand);
setOperationAction(ISD::ATOMIC_STORE, MVT::i64, Expand);		setOperationAction(ISD::ATOMIC_STORE, MVT::i64, Expand);
}		}

		if (EnableQuadwordAtomics && Subtarget.hasQuadwordAtomics())
		setMaxAtomicSizeInBitsSupported(128);

setBooleanContents(ZeroOrOneBooleanContent);		setBooleanContents(ZeroOrOneBooleanContent);

if (Subtarget.hasAltivec()) {		if (Subtarget.hasAltivec()) {
// Altivec instructions set fields to all zeros or all ones.		// Altivec instructions set fields to all zeros or all ones.
setBooleanVectorContents(ZeroOrNegativeOneBooleanContent);		setBooleanVectorContents(ZeroOrNegativeOneBooleanContent);
}		}

if (!isPPC64) {		if (!isPPC64) {
▲ Show 20 Lines • Show All 11,331 Lines • ▼ Show 20 Lines	else if (MI.getOpcode() == PPC::ATOMIC_CMP_SWAP_I32 \|\|
BuildMI(*BB, MI, Dl, TII->get(PPC::MTFSF))		BuildMI(*BB, MI, Dl, TII->get(PPC::MTFSF))
.addImm(255)		.addImm(255)
.addReg(NewFPSCRReg)		.addReg(NewFPSCRReg)
.addImm(0)		.addImm(0)
.addImm(0);		.addImm(0);
} else if (MI.getOpcode() == PPC::PROBED_ALLOCA_32 \|\|		} else if (MI.getOpcode() == PPC::PROBED_ALLOCA_32 \|\|
MI.getOpcode() == PPC::PROBED_ALLOCA_64) {		MI.getOpcode() == PPC::PROBED_ALLOCA_64) {
return emitProbedAlloca(MI, BB);		return emitProbedAlloca(MI, BB);
		} else if (MI.getOpcode() == PPC::SPLIT_QUADWORD) {
		DebugLoc DL = MI.getDebugLoc();
		Register Src = MI.getOperand(2).getReg();
		Register Lo = MI.getOperand(0).getReg();
		Register Hi = MI.getOperand(1).getReg();
		BuildMI(*BB, MI, DL, TII->get(TargetOpcode::COPY))
		.addDef(Lo)
		.addUse(Src, 0, PPC::sub_gp8_x1);
		BuildMI(*BB, MI, DL, TII->get(TargetOpcode::COPY))
		.addDef(Hi)
		.addUse(Src, 0, PPC::sub_gp8_x0);
} else {		} else {
llvm_unreachable("Unexpected instr type to insert");		llvm_unreachable("Unexpected instr type to insert");
}		}

MI.eraseFromParent(); // The pseudo instruction is gone now.		MI.eraseFromParent(); // The pseudo instruction is gone now.
return BB;		return BB;
}		}

▲ Show 20 Lines • Show All 3,398 Lines • ▼ Show 20 Lines	PPCTargetLowering::isOffsetFoldingLegal(const GlobalAddressSDNode *GA) const {
return false;		return false;
}		}

bool PPCTargetLowering::getTgtMemIntrinsic(IntrinsicInfo &Info,		bool PPCTargetLowering::getTgtMemIntrinsic(IntrinsicInfo &Info,
const CallInst &I,		const CallInst &I,
MachineFunction &MF,		MachineFunction &MF,
unsigned Intrinsic) const {		unsigned Intrinsic) const {
switch (Intrinsic) {		switch (Intrinsic) {
		case Intrinsic::ppc_atomicrmw_xchg_i128:
		case Intrinsic::ppc_atomicrmw_add_i128:
		case Intrinsic::ppc_atomicrmw_sub_i128:
		case Intrinsic::ppc_atomicrmw_nand_i128:
		case Intrinsic::ppc_atomicrmw_and_i128:
		case Intrinsic::ppc_atomicrmw_or_i128:
		case Intrinsic::ppc_atomicrmw_xor_i128:
		case Intrinsic::ppc_cmpxchg_i128:
		Info.opc = ISD::INTRINSIC_W_CHAIN;
		Info.memVT = MVT::i128;
		Info.ptrVal = I.getArgOperand(0);
		Info.offset = 0;
		Info.align = Align(16);
		Info.flags = MachineMemOperand::MOLoad \| MachineMemOperand::MOStore \|
		MachineMemOperand::MOVolatile;
		return true;
case Intrinsic::ppc_altivec_lvx:		case Intrinsic::ppc_altivec_lvx:
case Intrinsic::ppc_altivec_lvxl:		case Intrinsic::ppc_altivec_lvxl:
case Intrinsic::ppc_altivec_lvebx:		case Intrinsic::ppc_altivec_lvebx:
case Intrinsic::ppc_altivec_lvehx:		case Intrinsic::ppc_altivec_lvehx:
case Intrinsic::ppc_altivec_lvewx:		case Intrinsic::ppc_altivec_lvewx:
case Intrinsic::ppc_vsx_lxvd2x:		case Intrinsic::ppc_vsx_lxvd2x:
case Intrinsic::ppc_vsx_lxvw4x:		case Intrinsic::ppc_vsx_lxvw4x:
case Intrinsic::ppc_vsx_lxvd2x_be:		case Intrinsic::ppc_vsx_lxvd2x_be:
▲ Show 20 Lines • Show All 1,399 Lines • ▼ Show 20 Lines	CCAssignFn *PPCTargetLowering::ccAssignFnForCall(CallingConv::ID CC,
bool IsVarArg) const {		bool IsVarArg) const {
switch (CC) {		switch (CC) {
case CallingConv::Cold:		case CallingConv::Cold:
return (Return ? RetCC_PPC_Cold : CC_PPC64_ELF_FIS);		return (Return ? RetCC_PPC_Cold : CC_PPC64_ELF_FIS);
default:		default:
return CC_PPC64_ELF_FIS;		return CC_PPC64_ELF_FIS;
}		}
}		}

		TargetLowering::AtomicExpansionKind
		PPCTargetLowering::shouldExpandAtomicRMWInIR(AtomicRMWInst *AI) const {
		if (AI->isFloatingPointOperation())
		return AtomicExpansionKind::None;
		unsigned Size = AI->getType()->getPrimitiveSizeInBits();
		if (EnableQuadwordAtomics && Subtarget.hasQuadwordAtomics() && Size == 128)
		return AtomicExpansionKind::MaskedIntrinsic;
		return AtomicExpansionKind::None;
		}

		TargetLowering::AtomicExpansionKind
		PPCTargetLowering::shouldExpandAtomicCmpXchgInIR(AtomicCmpXchgInst *AI) const {
		unsigned Size = AI->getPointerOperand()
		->getType()
		->getPointerElementType()
		->getPrimitiveSizeInBits();
		if (EnableQuadwordAtomics && Subtarget.hasQuadwordAtomics() && Size == 128)
		return AtomicExpansionKind::MaskedIntrinsic;
		return AtomicExpansionKind::None;
		}

		static Intrinsic::ID
		getIntrinsicForAtomicRMWBinOp128(AtomicRMWInst::BinOp BinOp) {
		switch (BinOp) {
		default:
		llvm_unreachable("Unexpected AtomicRMW BinOp");
		case AtomicRMWInst::Xchg:
		return Intrinsic::ppc_atomicrmw_xchg_i128;
		case AtomicRMWInst::Add:
		return Intrinsic::ppc_atomicrmw_add_i128;
		case AtomicRMWInst::Sub:
		return Intrinsic::ppc_atomicrmw_sub_i128;
		case AtomicRMWInst::And:
		return Intrinsic::ppc_atomicrmw_and_i128;
		case AtomicRMWInst::Or:
		return Intrinsic::ppc_atomicrmw_or_i128;
		case AtomicRMWInst::Xor:
		return Intrinsic::ppc_atomicrmw_xor_i128;
		case AtomicRMWInst::Nand:
		return Intrinsic::ppc_atomicrmw_nand_i128;
		}
		}

		Value *PPCTargetLowering::emitMaskedAtomicRMWIntrinsic(
		IRBuilderBase &Builder, AtomicRMWInst AI, Value AlignedAddr, Value *Incr,
		Value Mask, Value ShiftAmt, AtomicOrdering Ord) const {
		assert(EnableQuadwordAtomics && Subtarget.hasQuadwordAtomics() &&
		"Only support quadword now");
		Module *M = Builder.GetInsertBlock()->getParent()->getParent();
		Type *ValTy = cast<PointerType>(AlignedAddr->getType())->getElementType();
		assert(ValTy->getPrimitiveSizeInBits() == 128);
		Function *RMW = Intrinsic::getDeclaration(
		M, getIntrinsicForAtomicRMWBinOp128(AI->getOperation()));
		Type *Int64Ty = Type::getInt64Ty(M->getContext());
		Value *IncrLo = Builder.CreateTrunc(Incr, Int64Ty, "incr_lo");
		Value *IncrHi =
		Builder.CreateTrunc(Builder.CreateLShr(Incr, 64), Int64Ty, "incr_hi");
		Value *Addr =
		Builder.CreateBitCast(AlignedAddr, Type::getInt8PtrTy(M->getContext()));
		Value *LoHi = Builder.CreateCall(RMW, {Addr, IncrLo, IncrHi});
		Value *Lo = Builder.CreateExtractValue(LoHi, 0, "lo");
		Value *Hi = Builder.CreateExtractValue(LoHi, 1, "hi");
		Lo = Builder.CreateZExt(Lo, ValTy, "lo64");
		Hi = Builder.CreateZExt(Hi, ValTy, "hi64");
		return Builder.CreateOr(
		Lo, Builder.CreateShl(Hi, ConstantInt::get(ValTy, 64)), "val64");
		}

		Value *PPCTargetLowering::emitMaskedAtomicCmpXchgIntrinsic(
		IRBuilderBase &Builder, AtomicCmpXchgInst CI, Value AlignedAddr,
		Value CmpVal, Value NewVal, Value *Mask, AtomicOrdering Ord) const {
		assert(EnableQuadwordAtomics && Subtarget.hasQuadwordAtomics() &&
		"Only support quadword now");
		Module *M = Builder.GetInsertBlock()->getParent()->getParent();
		Type *ValTy = cast<PointerType>(AlignedAddr->getType())->getElementType();
		assert(ValTy->getPrimitiveSizeInBits() == 128);
		Function *IntCmpXchg =
		Intrinsic::getDeclaration(M, Intrinsic::ppc_cmpxchg_i128);
		Type *Int64Ty = Type::getInt64Ty(M->getContext());
		Value *CmpLo = Builder.CreateTrunc(CmpVal, Int64Ty, "cmp_lo");
		Value *CmpHi =
		Builder.CreateTrunc(Builder.CreateLShr(CmpVal, 64), Int64Ty, "cmp_hi");
		Value *NewLo = Builder.CreateTrunc(NewVal, Int64Ty, "new_lo");
		Value *NewHi =
		Builder.CreateTrunc(Builder.CreateLShr(NewVal, 64), Int64Ty, "new_hi");
		Value *Addr =
		Builder.CreateBitCast(AlignedAddr, Type::getInt8PtrTy(M->getContext()));
		emitLeadingFence(Builder, CI, Ord);
		Value *LoHi =
		Builder.CreateCall(IntCmpXchg, {Addr, CmpLo, CmpHi, NewLo, NewHi});
		emitTrailingFence(Builder, CI, Ord);
		Value *Lo = Builder.CreateExtractValue(LoHi, 0, "lo");
		Value *Hi = Builder.CreateExtractValue(LoHi, 1, "hi");
		Lo = Builder.CreateZExt(Lo, ValTy, "lo64");
		Hi = Builder.CreateZExt(Hi, ValTy, "hi64");
		return Builder.CreateOr(
		Lo, Builder.CreateShl(Hi, ConstantInt::get(ValTy, 64)), "val64");
		}

llvm/lib/Target/PowerPC/PPCInstr64Bit.td

Show First 20 Lines • Show All 298 Lines • ▼ Show 20 Lines	def STDCX : XForm_1_memOp<31, 214, (outs), (ins g8rc:$rS, memrr:$dst),
"stdcx. $rS, $dst", IIC_LdStSTDCX, []>, isRecordForm;		"stdcx. $rS, $dst", IIC_LdStSTDCX, []>, isRecordForm;
// TODO: Add scheduling info.		// TODO: Add scheduling info.
let hasNoSchedulingInfo = 1 in		let hasNoSchedulingInfo = 1 in
def STQCX : XForm_1_memOp<31, 182, (outs), (ins g8prc:$RSp, memrr:$dst),		def STQCX : XForm_1_memOp<31, 182, (outs), (ins g8prc:$RSp, memrr:$dst),
"stqcx. $RSp, $dst", IIC_LdStSTQCX, []>,		"stqcx. $RSp, $dst", IIC_LdStSTQCX, []>,
isPPC64, isRecordForm;		isPPC64, isRecordForm;
}		}

		def SPLIT_QUADWORD : PPCCustomInserterPseudo<(outs g8rc:$lo, g8rc:$hi),
		(ins g8prc:$src),
		"#SPLIT_QUADWORD", []>;
		class AtomicRMW128<string asmstr>
		: PPCPostRAExpPseudo<(outs g8prc:$RTp, g8prc:$scratch),
		(ins memrr:$ptr, g8rc:$incr_lo, g8rc:$incr_hi),
		asmstr, []>;
		// We have to keep values in MI's uses during LL/SC looping as they are,
		// so set both $RTp and $scratch earlyclobber.
		let mayStore = 1, mayLoad = 1,
		Defs = [CR0],
		Constraints = "@earlyclobber $scratch,@earlyclobber $RTp" in {
		efriedmaUnsubmitted Not Done Reply Inline Actions Do you need to specify the size of these instructions somewhere, if you're expanding them after branch relaxation? efriedma: Do you need to specify the size of these instructions somewhere, if you're expanding them after…
		lkailAuthorUnsubmitted Done Reply Inline Actions Good point. There is `PPCBranchSelector` pass serves as branch relaxation and PowerPC hasn't implemented LLVM MC's branch relaxation. I should have put the expansion before `PPCBranchSelector`. lkail: Good point. There is `PPCBranchSelector` pass serves as branch relaxation and PowerPC hasn't…
		// Atomic pseudo instructions expanded post-ra.
		def ATOMIC_SWAP_I128 : AtomicRMW128<"#ATOMIC_SWAP_I128">;
		def ATOMIC_LOAD_ADD_I128 : AtomicRMW128<"#ATOMIC_LOAD_ADD_I128">;
		def ATOMIC_LOAD_SUB_I128 : AtomicRMW128<"#ATOMIC_LOAD_SUB_I128">;
		def ATOMIC_LOAD_AND_I128 : AtomicRMW128<"#ATOMIC_LOAD_AND_I128">;
		def ATOMIC_LOAD_XOR_I128 : AtomicRMW128<"#ATOMIC_LOAD_XOR_I128">;
		def ATOMIC_LOAD_OR_I128 : AtomicRMW128<"#ATOMIC_LOAD_OR_I128">;
		def ATOMIC_LOAD_NAND_I128 : AtomicRMW128<"#ATOMIC_LOAD_NAND_I128">;

		def ATOMIC_CMP_SWAP_I128 : PPCPostRAExpPseudo<
		(outs g8prc:$RTp, g8prc:$scratch),
		(ins memrr:$ptr, g8rc:$cmp_lo, g8rc:$cmp_hi,
		g8rc:$new_lo, g8rc:$new_hi),
		"#ATOMIC_CMP_SWAP_I128", []>;
		}

		def : Pat<(int_ppc_atomicrmw_add_i128 ForceXForm:$ptr,
		i64:$incr_lo,
		i64:$incr_hi),
		(SPLIT_QUADWORD (ATOMIC_LOAD_ADD_I128 memrr:$ptr,
		g8rc:$incr_lo,
		g8rc:$incr_hi))>;
		def : Pat<(int_ppc_atomicrmw_sub_i128 ForceXForm:$ptr,
		i64:$incr_lo,
		i64:$incr_hi),
		(SPLIT_QUADWORD (ATOMIC_LOAD_SUB_I128 memrr:$ptr,
		g8rc:$incr_lo,
		g8rc:$incr_hi))>;
		def : Pat<(int_ppc_atomicrmw_xor_i128 ForceXForm:$ptr,
		i64:$incr_lo,
		i64:$incr_hi),
		(SPLIT_QUADWORD (ATOMIC_LOAD_XOR_I128 memrr:$ptr,
		g8rc:$incr_lo,
		g8rc:$incr_hi))>;
		def : Pat<(int_ppc_atomicrmw_and_i128 ForceXForm:$ptr,
		i64:$incr_lo,
		i64:$incr_hi),
		(SPLIT_QUADWORD (ATOMIC_LOAD_AND_I128 memrr:$ptr,
		g8rc:$incr_lo,
		g8rc:$incr_hi))>;
		def : Pat<(int_ppc_atomicrmw_nand_i128 ForceXForm:$ptr,
		i64:$incr_lo,
		i64:$incr_hi),
		(SPLIT_QUADWORD (ATOMIC_LOAD_NAND_I128 memrr:$ptr,
		g8rc:$incr_lo,
		g8rc:$incr_hi))>;
		def : Pat<(int_ppc_atomicrmw_or_i128 ForceXForm:$ptr,
		i64:$incr_lo,
		i64:$incr_hi),
		(SPLIT_QUADWORD (ATOMIC_LOAD_OR_I128 memrr:$ptr,
		g8rc:$incr_lo,
		g8rc:$incr_hi))>;
		def : Pat<(int_ppc_atomicrmw_xchg_i128 ForceXForm:$ptr,
		i64:$incr_lo,
		i64:$incr_hi),
		(SPLIT_QUADWORD (ATOMIC_SWAP_I128 memrr:$ptr,
		g8rc:$incr_lo,
		g8rc:$incr_hi))>;
		def : Pat<(int_ppc_cmpxchg_i128 ForceXForm:$ptr,
		i64:$cmp_lo,
		i64:$cmp_hi,
		i64:$new_lo,
		i64:$new_hi),
		(SPLIT_QUADWORD (ATOMIC_CMP_SWAP_I128
		memrr:$ptr,
		g8rc:$cmp_lo,
		g8rc:$cmp_hi,
		g8rc:$new_lo,
		g8rc:$new_hi))>;

let mayStore = 1, mayLoad = 0, hasSideEffects = 0 in		let mayStore = 1, mayLoad = 0, hasSideEffects = 0 in
def STDAT : X_RD5_RS5_IM5<31, 742, (outs), (ins g8rc:$rS, g8rc:$rA, u5imm:$FC),		def STDAT : X_RD5_RS5_IM5<31, 742, (outs), (ins g8rc:$rS, g8rc:$rA, u5imm:$FC),
"stdat $rS, $rA, $FC", IIC_LdStStore>, isPPC64,		"stdat $rS, $rA, $FC", IIC_LdStStore>, isPPC64,
Requires<[IsISA3_0]>;		Requires<[IsISA3_0]>;

let Interpretation64Bit = 1, isCodeGenOnly = 1 in {		let Interpretation64Bit = 1, isCodeGenOnly = 1 in {
let isCall = 1, isTerminator = 1, isReturn = 1, isBarrier = 1, Uses = [RM] in		let isCall = 1, isTerminator = 1, isReturn = 1, isBarrier = 1, Uses = [RM] in
def TCRETURNdi8 :PPCEmitTimePseudo< (outs),		def TCRETURNdi8 :PPCEmitTimePseudo< (outs),
▲ Show 20 Lines • Show All 1,437 Lines • Show Last 20 Lines

llvm/lib/Target/PowerPC/PPCInstrInfo.td

	Show First 20 Lines • Show All 1,164 Lines • ▼ Show 20 Lines
	def HasOnlyMSYNC : Predicate<"Subtarget->hasOnlyMSYNC()">;			def HasOnlyMSYNC : Predicate<"Subtarget->hasOnlyMSYNC()">;
	def HasSYNC : Predicate<"!Subtarget->hasOnlyMSYNC()">;			def HasSYNC : Predicate<"!Subtarget->hasOnlyMSYNC()">;
	def IsPPC4xx : Predicate<"Subtarget->isPPC4xx()">;			def IsPPC4xx : Predicate<"Subtarget->isPPC4xx()">;
	def IsPPC6xx : Predicate<"Subtarget->isPPC6xx()">;			def IsPPC6xx : Predicate<"Subtarget->isPPC6xx()">;
	def IsE500 : Predicate<"Subtarget->isE500()">;			def IsE500 : Predicate<"Subtarget->isE500()">;
	def HasSPE : Predicate<"Subtarget->hasSPE()">;			def HasSPE : Predicate<"Subtarget->hasSPE()">;
	def HasICBT : Predicate<"Subtarget->hasICBT()">;			def HasICBT : Predicate<"Subtarget->hasICBT()">;
	def HasPartwordAtomics : Predicate<"Subtarget->hasPartwordAtomics()">;			def HasPartwordAtomics : Predicate<"Subtarget->hasPartwordAtomics()">;
				def HasQuadwordAtomics : Predicate<"Subtarget->hasQuadwordAtomics()">;
	def NoNaNsFPMath			def NoNaNsFPMath
	: Predicate<"Subtarget->getTargetMachine().Options.NoNaNsFPMath">;			: Predicate<"Subtarget->getTargetMachine().Options.NoNaNsFPMath">;
	def NaNsFPMath			def NaNsFPMath
	: Predicate<"!Subtarget->getTargetMachine().Options.NoNaNsFPMath">;			: Predicate<"!Subtarget->getTargetMachine().Options.NoNaNsFPMath">;
	def HasBPERMD : Predicate<"Subtarget->hasBPERMD()">;			def HasBPERMD : Predicate<"Subtarget->hasBPERMD()">;
	def HasExtDiv : Predicate<"Subtarget->hasExtDiv()">;			def HasExtDiv : Predicate<"Subtarget->hasExtDiv()">;
	def IsISA2_07 : Predicate<"Subtarget->isISA2_07()">;			def IsISA2_07 : Predicate<"Subtarget->isISA2_07()">;
	def IsISA3_0 : Predicate<"Subtarget->isISA3_0()">;			def IsISA3_0 : Predicate<"Subtarget->isISA3_0()">;
	▲ Show 20 Lines • Show All 4,267 Lines • Show Last 20 Lines

llvm/lib/Target/PowerPC/PPCSubtarget.h

Show First 20 Lines • Show All 133 Lines • ▼ Show 20 Lines	protected:
bool IsPPC6xx;		bool IsPPC6xx;
bool FeatureMFTB;		bool FeatureMFTB;
bool AllowsUnalignedFPAccess;		bool AllowsUnalignedFPAccess;
bool DeprecatedDST;		bool DeprecatedDST;
bool IsLittleEndian;		bool IsLittleEndian;
bool HasICBT;		bool HasICBT;
bool HasInvariantFunctionDescriptors;		bool HasInvariantFunctionDescriptors;
bool HasPartwordAtomics;		bool HasPartwordAtomics;
		bool HasQuadwordAtomics;
bool HasDirectMove;		bool HasDirectMove;
bool HasHTM;		bool HasHTM;
bool HasFloat128;		bool HasFloat128;
bool HasFusion;		bool HasFusion;
bool HasStoreFusion;		bool HasStoreFusion;
bool HasAddiLoadFusion;		bool HasAddiLoadFusion;
bool HasAddisLoadFusion;		bool HasAddisLoadFusion;
bool IsISA2_07;		bool IsISA2_07;
▲ Show 20 Lines • Show All 147 Lines • ▼ Show 20 Lines	public:
bool isDeprecatedDST() const { return DeprecatedDST; }		bool isDeprecatedDST() const { return DeprecatedDST; }
bool hasICBT() const { return HasICBT; }		bool hasICBT() const { return HasICBT; }
bool hasInvariantFunctionDescriptors() const {		bool hasInvariantFunctionDescriptors() const {
return HasInvariantFunctionDescriptors;		return HasInvariantFunctionDescriptors;
}		}
bool usePPCPreRASchedStrategy() const { return UsePPCPreRASchedStrategy; }		bool usePPCPreRASchedStrategy() const { return UsePPCPreRASchedStrategy; }
bool usePPCPostRASchedStrategy() const { return UsePPCPostRASchedStrategy; }		bool usePPCPostRASchedStrategy() const { return UsePPCPostRASchedStrategy; }
bool hasPartwordAtomics() const { return HasPartwordAtomics; }		bool hasPartwordAtomics() const { return HasPartwordAtomics; }
		bool hasQuadwordAtomics() const { return HasQuadwordAtomics; }
bool hasDirectMove() const { return HasDirectMove; }		bool hasDirectMove() const { return HasDirectMove; }

Align getPlatformStackAlignment() const {		Align getPlatformStackAlignment() const {
return Align(16);		return Align(16);
}		}

unsigned getRedZoneSize() const {		unsigned getRedZoneSize() const {
if (isPPC64())		if (isPPC64())
▲ Show 20 Lines • Show All 122 Lines • Show Last 20 Lines

llvm/lib/Target/PowerPC/PPCTargetMachine.cpp

Show First 20 Lines • Show All 117 Lines • ▼ Show 20 Lines	#endif
initializePPCBSelPass(PR);		initializePPCBSelPass(PR);
initializePPCBranchCoalescingPass(PR);		initializePPCBranchCoalescingPass(PR);
initializePPCBoolRetToIntPass(PR);		initializePPCBoolRetToIntPass(PR);
initializePPCExpandISELPass(PR);		initializePPCExpandISELPass(PR);
initializePPCPreEmitPeepholePass(PR);		initializePPCPreEmitPeepholePass(PR);
initializePPCTLSDynamicCallPass(PR);		initializePPCTLSDynamicCallPass(PR);
initializePPCMIPeepholePass(PR);		initializePPCMIPeepholePass(PR);
initializePPCLowerMASSVEntriesPass(PR);		initializePPCLowerMASSVEntriesPass(PR);
		initializePPCExpandAtomicPseudoPass(PR);
initializeGlobalISel(PR);		initializeGlobalISel(PR);
}		}

static bool isLittleEndianTriple(const Triple &T) {		static bool isLittleEndianTriple(const Triple &T) {
return T.getArch() == Triple::ppc64le \|\| T.getArch() == Triple::ppcle;		return T.getArch() == Triple::ppc64le \|\| T.getArch() == Triple::ppcle;
}		}

/// Return the datalayout string of a subtarget.		/// Return the datalayout string of a subtarget.
▲ Show 20 Lines • Show All 400 Lines • ▼ Show 20 Lines	void PPCPassConfig::addPreEmitPass() {
addPass(createPPCPreEmitPeepholePass());		addPass(createPPCPreEmitPeepholePass());
addPass(createPPCExpandISELPass());		addPass(createPPCExpandISELPass());

if (getOptLevel() != CodeGenOpt::None)		if (getOptLevel() != CodeGenOpt::None)
addPass(createPPCEarlyReturnPass());		addPass(createPPCEarlyReturnPass());
}		}

void PPCPassConfig::addPreEmitPass2() {		void PPCPassConfig::addPreEmitPass2() {
		// Schedule the expansion of AMOs at the last possible moment, avoiding the
		// possibility for other passes to break the requirements for forward
		// progress in the LL/SC block.
		addPass(createPPCExpandAtomicPseudoPass());
// Must run branch selection immediately preceding the asm printer.		// Must run branch selection immediately preceding the asm printer.
addPass(createPPCBranchSelectionPass());		addPass(createPPCBranchSelectionPass());
}		}

TargetTransformInfo		TargetTransformInfo
PPCTargetMachine::getTargetTransformInfo(const Function &F) {		PPCTargetMachine::getTargetTransformInfo(const Function &F) {
return TargetTransformInfo(PPCTTIImpl(this, F));		return TargetTransformInfo(PPCTTIImpl(this, F));
}		}
Show All 37 Lines

llvm/test/CodeGen/PowerPC/O3-pipeline.ll

	Show First 20 Lines • Show All 191 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: Insert XRay ops			; CHECK-NEXT: Insert XRay ops
	; CHECK-NEXT: Implement the 'patchable-function' attribute			; CHECK-NEXT: Implement the 'patchable-function' attribute
	; CHECK-NEXT: PowerPC Pre-Emit Peephole			; CHECK-NEXT: PowerPC Pre-Emit Peephole
	; CHECK-NEXT: PowerPC Expand ISEL Generation			; CHECK-NEXT: PowerPC Expand ISEL Generation
	; CHECK-NEXT: PowerPC Early-Return Creation			; CHECK-NEXT: PowerPC Early-Return Creation
	; CHECK-NEXT: Contiguously Lay Out Funclets			; CHECK-NEXT: Contiguously Lay Out Funclets
	; CHECK-NEXT: StackMap Liveness Analysis			; CHECK-NEXT: StackMap Liveness Analysis
	; CHECK-NEXT: Live DEBUG_VALUE analysis			; CHECK-NEXT: Live DEBUG_VALUE analysis
				; CHECK-NEXT: PowerPC Expand Atomic
	; CHECK-NEXT: PowerPC Branch Selector			; CHECK-NEXT: PowerPC Branch Selector
	; CHECK-NEXT: Lazy Machine Block Frequency Analysis			; CHECK-NEXT: Lazy Machine Block Frequency Analysis
	; CHECK-NEXT: Machine Optimization Remark Emitter			; CHECK-NEXT: Machine Optimization Remark Emitter
	; CHECK-NEXT: Linux PPC Assembly Printer			; CHECK-NEXT: Linux PPC Assembly Printer
	; CHECK-NEXT: Free MachineFunction			; CHECK-NEXT: Free MachineFunction

	define void @f() {			define void @f() {
	ret void			ret void
	}			}
	No newline at end of file			No newline at end of file

llvm/test/CodeGen/PowerPC/atomics-i128.ll

This file was added.

				; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
				; RUN: llc -verify-machineinstrs -mtriple=powerpc64-unknown-unknown -mcpu=pwr8 \
				; RUN: -ppc-asm-full-reg-names -ppc-quadword-atomics \
				; RUN: -ppc-track-subreg-liveness < %s \| FileCheck %s
				; RUN: llc -verify-machineinstrs -mtriple=powerpc64-unknown-unknown -mcpu=pwr7 \
				; RUN: -ppc-asm-full-reg-names -ppc-quadword-atomics \
				; RUN: -ppc-track-subreg-liveness < %s \| FileCheck --check-prefix=PWR7 %s


				define i128 @swap(i128* %a, i128 %x) {
				; CHECK-LABEL: swap:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: sync
				; CHECK-NEXT: .LBB0_1: # %entry
				; CHECK-NEXT: #
				; CHECK-NEXT: lqarx r6, 0, r3
				; CHECK-NEXT: mr r9, r5
				; CHECK-NEXT: mr r8, r4
				; CHECK-NEXT: stqcx. r8, 0, r3
				; CHECK-NEXT: bne cr0, .LBB0_1
				; CHECK-NEXT: # %bb.2: # %entry
				; CHECK-NEXT: lwsync
				; CHECK-NEXT: mr r3, r6
				; CHECK-NEXT: mr r4, r7
				; CHECK-NEXT: blr
				;
				; PWR7-LABEL: swap:
				; PWR7: # %bb.0: # %entry
				; PWR7-NEXT: mflr r0
				; PWR7-NEXT: std r0, 16(r1)
				; PWR7-NEXT: stdu r1, -112(r1)
				; PWR7-NEXT: .cfi_def_cfa_offset 112
				; PWR7-NEXT: .cfi_offset lr, 16
				; PWR7-NEXT: sync
				; PWR7-NEXT: bl __sync_lock_test_and_set_16
				; PWR7-NEXT: nop
				; PWR7-NEXT: lwsync
				; PWR7-NEXT: addi r1, r1, 112
				; PWR7-NEXT: ld r0, 16(r1)
				; PWR7-NEXT: mtlr r0
				; PWR7-NEXT: blr
				entry:
				%0 = atomicrmw xchg i128* %a, i128 %x seq_cst, align 16
				ret i128 %0
				}

				define i128 @add(i128* %a, i128 %x) {
				; CHECK-LABEL: add:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: sync
				; CHECK-NEXT: .LBB1_1: # %entry
				; CHECK-NEXT: #
				; CHECK-NEXT: lqarx r6, 0, r3
				; CHECK-NEXT: addc r9, r5, r7
				; CHECK-NEXT: adde r8, r4, r6
				; CHECK-NEXT: stqcx. r8, 0, r3
				; CHECK-NEXT: bne cr0, .LBB1_1
				; CHECK-NEXT: # %bb.2: # %entry
				; CHECK-NEXT: lwsync
				; CHECK-NEXT: mr r3, r6
				; CHECK-NEXT: mr r4, r7
				; CHECK-NEXT: blr
				;
				; PWR7-LABEL: add:
				; PWR7: # %bb.0: # %entry
				; PWR7-NEXT: mflr r0
				; PWR7-NEXT: std r0, 16(r1)
				; PWR7-NEXT: stdu r1, -112(r1)
				; PWR7-NEXT: .cfi_def_cfa_offset 112
				; PWR7-NEXT: .cfi_offset lr, 16
				; PWR7-NEXT: sync
				; PWR7-NEXT: bl __sync_fetch_and_add_16
				; PWR7-NEXT: nop
				; PWR7-NEXT: lwsync
				; PWR7-NEXT: addi r1, r1, 112
				; PWR7-NEXT: ld r0, 16(r1)
				; PWR7-NEXT: mtlr r0
				; PWR7-NEXT: blr
				entry:
				%0 = atomicrmw add i128* %a, i128 %x seq_cst, align 16
				ret i128 %0
				}

				define i128 @sub(i128* %a, i128 %x) {
				; CHECK-LABEL: sub:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: sync
				; CHECK-NEXT: .LBB2_1: # %entry
				; CHECK-NEXT: #
				; CHECK-NEXT: lqarx r6, 0, r3
				; CHECK-NEXT: subc r9, r7, r5
				; CHECK-NEXT: subfe r8, r4, r6
				; CHECK-NEXT: stqcx. r8, 0, r3
				; CHECK-NEXT: bne cr0, .LBB2_1
				; CHECK-NEXT: # %bb.2: # %entry
				; CHECK-NEXT: lwsync
				; CHECK-NEXT: mr r3, r6
				; CHECK-NEXT: mr r4, r7
				; CHECK-NEXT: blr
				;
				; PWR7-LABEL: sub:
				; PWR7: # %bb.0: # %entry
				; PWR7-NEXT: mflr r0
				; PWR7-NEXT: std r0, 16(r1)
				; PWR7-NEXT: stdu r1, -112(r1)
				; PWR7-NEXT: .cfi_def_cfa_offset 112
				; PWR7-NEXT: .cfi_offset lr, 16
				; PWR7-NEXT: sync
				; PWR7-NEXT: bl __sync_fetch_and_sub_16
				; PWR7-NEXT: nop
				; PWR7-NEXT: lwsync
				; PWR7-NEXT: addi r1, r1, 112
				; PWR7-NEXT: ld r0, 16(r1)
				; PWR7-NEXT: mtlr r0
				; PWR7-NEXT: blr
				entry:
				%0 = atomicrmw sub i128* %a, i128 %x seq_cst, align 16
				ret i128 %0
				}

				define i128 @and(i128* %a, i128 %x) {
				; CHECK-LABEL: and:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: sync
				; CHECK-NEXT: .LBB3_1: # %entry
				; CHECK-NEXT: #
				; CHECK-NEXT: lqarx r6, 0, r3
				; CHECK-NEXT: and r9, r5, r7
				; CHECK-NEXT: and r8, r4, r6
				; CHECK-NEXT: stqcx. r8, 0, r3
				; CHECK-NEXT: bne cr0, .LBB3_1
				; CHECK-NEXT: # %bb.2: # %entry
				; CHECK-NEXT: lwsync
				; CHECK-NEXT: mr r3, r6
				; CHECK-NEXT: mr r4, r7
				; CHECK-NEXT: blr
				;
				; PWR7-LABEL: and:
				; PWR7: # %bb.0: # %entry
				; PWR7-NEXT: mflr r0
				; PWR7-NEXT: std r0, 16(r1)
				; PWR7-NEXT: stdu r1, -112(r1)
				; PWR7-NEXT: .cfi_def_cfa_offset 112
				; PWR7-NEXT: .cfi_offset lr, 16
				; PWR7-NEXT: sync
				; PWR7-NEXT: bl __sync_fetch_and_and_16
				; PWR7-NEXT: nop
				; PWR7-NEXT: lwsync
				; PWR7-NEXT: addi r1, r1, 112
				; PWR7-NEXT: ld r0, 16(r1)
				; PWR7-NEXT: mtlr r0
				; PWR7-NEXT: blr
				entry:
				%0 = atomicrmw and i128* %a, i128 %x seq_cst, align 16
				ret i128 %0
				}

				define i128 @or(i128* %a, i128 %x) {
				; CHECK-LABEL: or:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: sync
				; CHECK-NEXT: .LBB4_1: # %entry
				; CHECK-NEXT: #
				; CHECK-NEXT: lqarx r6, 0, r3
				; CHECK-NEXT: or r9, r5, r7
				; CHECK-NEXT: or r8, r4, r6
				; CHECK-NEXT: stqcx. r8, 0, r3
				; CHECK-NEXT: bne cr0, .LBB4_1
				; CHECK-NEXT: # %bb.2: # %entry
				; CHECK-NEXT: lwsync
				; CHECK-NEXT: mr r3, r6
				; CHECK-NEXT: mr r4, r7
				; CHECK-NEXT: blr
				;
				; PWR7-LABEL: or:
				; PWR7: # %bb.0: # %entry
				; PWR7-NEXT: mflr r0
				; PWR7-NEXT: std r0, 16(r1)
				; PWR7-NEXT: stdu r1, -112(r1)
				; PWR7-NEXT: .cfi_def_cfa_offset 112
				; PWR7-NEXT: .cfi_offset lr, 16
				; PWR7-NEXT: sync
				; PWR7-NEXT: bl __sync_fetch_and_or_16
				; PWR7-NEXT: nop
				; PWR7-NEXT: lwsync
				; PWR7-NEXT: addi r1, r1, 112
				; PWR7-NEXT: ld r0, 16(r1)
				; PWR7-NEXT: mtlr r0
				; PWR7-NEXT: blr
				entry:
				%0 = atomicrmw or i128* %a, i128 %x seq_cst, align 16
				ret i128 %0
				}

				define i128 @xor(i128* %a, i128 %x) {
				; CHECK-LABEL: xor:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: sync
				; CHECK-NEXT: .LBB5_1: # %entry
				; CHECK-NEXT: #
				; CHECK-NEXT: lqarx r6, 0, r3
				; CHECK-NEXT: xor r9, r5, r7
				; CHECK-NEXT: xor r8, r4, r6
				; CHECK-NEXT: stqcx. r8, 0, r3
				; CHECK-NEXT: bne cr0, .LBB5_1
				; CHECK-NEXT: # %bb.2: # %entry
				; CHECK-NEXT: lwsync
				; CHECK-NEXT: mr r3, r6
				; CHECK-NEXT: mr r4, r7
				; CHECK-NEXT: blr
				;
				; PWR7-LABEL: xor:
				; PWR7: # %bb.0: # %entry
				; PWR7-NEXT: mflr r0
				; PWR7-NEXT: std r0, 16(r1)
				; PWR7-NEXT: stdu r1, -112(r1)
				; PWR7-NEXT: .cfi_def_cfa_offset 112
				; PWR7-NEXT: .cfi_offset lr, 16
				; PWR7-NEXT: sync
				; PWR7-NEXT: bl __sync_fetch_and_xor_16
				; PWR7-NEXT: nop
				; PWR7-NEXT: lwsync
				; PWR7-NEXT: addi r1, r1, 112
				; PWR7-NEXT: ld r0, 16(r1)
				; PWR7-NEXT: mtlr r0
				; PWR7-NEXT: blr
				entry:
				%0 = atomicrmw xor i128* %a, i128 %x seq_cst, align 16
				ret i128 %0
				}

				define i128 @nand(i128* %a, i128 %x) {
				; CHECK-LABEL: nand:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: sync
				; CHECK-NEXT: .LBB6_1: # %entry
				; CHECK-NEXT: #
				; CHECK-NEXT: lqarx r6, 0, r3
				; CHECK-NEXT: nand r9, r5, r7
				; CHECK-NEXT: nand r8, r4, r6
				; CHECK-NEXT: stqcx. r8, 0, r3
				; CHECK-NEXT: bne cr0, .LBB6_1
				; CHECK-NEXT: # %bb.2: # %entry
				; CHECK-NEXT: lwsync
				; CHECK-NEXT: mr r3, r6
				; CHECK-NEXT: mr r4, r7
				; CHECK-NEXT: blr
				;
				; PWR7-LABEL: nand:
				; PWR7: # %bb.0: # %entry
				; PWR7-NEXT: mflr r0
				; PWR7-NEXT: std r0, 16(r1)
				; PWR7-NEXT: stdu r1, -112(r1)
				; PWR7-NEXT: .cfi_def_cfa_offset 112
				; PWR7-NEXT: .cfi_offset lr, 16
				; PWR7-NEXT: sync
				; PWR7-NEXT: bl __sync_fetch_and_nand_16
				; PWR7-NEXT: nop
				; PWR7-NEXT: lwsync
				; PWR7-NEXT: addi r1, r1, 112
				; PWR7-NEXT: ld r0, 16(r1)
				; PWR7-NEXT: mtlr r0
				; PWR7-NEXT: blr
				entry:
				%0 = atomicrmw nand i128* %a, i128 %x seq_cst, align 16
				ret i128 %0
				}

				;; CmpXchg
				define i128 @cas_weak_acquire_acquire(i128* %a, i128 %cmp, i128 %new) {
				; CHECK-LABEL: cas_weak_acquire_acquire:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: .LBB7_1: # %entry
				; CHECK-NEXT: #
				; CHECK-NEXT: lqarx r8, 0, r3
				; CHECK-NEXT: xor r11, r9, r5
				; CHECK-NEXT: xor r10, r8, r4
				; CHECK-NEXT: or. r11, r11, r10
				; CHECK-NEXT: bne cr0, .LBB7_3
				; CHECK-NEXT: # %bb.2: # %entry
				; CHECK-NEXT: #
				; CHECK-NEXT: mr r11, r7
				; CHECK-NEXT: mr r10, r6
				; CHECK-NEXT: stqcx. r10, 0, r3
				; CHECK-NEXT: bne cr0, .LBB7_1
				; CHECK-NEXT: b .LBB7_4
				; CHECK-NEXT: .LBB7_3: # %entry
				; CHECK-NEXT: stqcx. r8, 0, r3
				; CHECK-NEXT: .LBB7_4: # %entry
				; CHECK-NEXT: lwsync
				; CHECK-NEXT: mr r3, r8
				; CHECK-NEXT: mr r4, r9
				; CHECK-NEXT: blr
				;
				; PWR7-LABEL: cas_weak_acquire_acquire:
				; PWR7: # %bb.0: # %entry
				; PWR7-NEXT: mflr r0
				; PWR7-NEXT: std r0, 16(r1)
				; PWR7-NEXT: stdu r1, -112(r1)
				; PWR7-NEXT: .cfi_def_cfa_offset 112
				; PWR7-NEXT: .cfi_offset lr, 16
				; PWR7-NEXT: bl __sync_val_compare_and_swap_16
				; PWR7-NEXT: nop
				; PWR7-NEXT: lwsync
				; PWR7-NEXT: addi r1, r1, 112
				; PWR7-NEXT: ld r0, 16(r1)
				; PWR7-NEXT: mtlr r0
				; PWR7-NEXT: blr
				entry:
				%0 = cmpxchg weak i128* %a, i128 %cmp, i128 %new acquire acquire
				%1 = extractvalue { i128, i1 } %0, 0
				ret i128 %1
				}

				define i128 @cas_weak_release_monotonic(i128* %a, i128 %cmp, i128 %new) {
				; CHECK-LABEL: cas_weak_release_monotonic:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: lwsync
				; CHECK-NEXT: .LBB8_1: # %entry
				; CHECK-NEXT: #
				; CHECK-NEXT: lqarx r8, 0, r3
				; CHECK-NEXT: xor r11, r9, r5
				; CHECK-NEXT: xor r10, r8, r4
				; CHECK-NEXT: or. r11, r11, r10
				; CHECK-NEXT: bne cr0, .LBB8_3
				; CHECK-NEXT: # %bb.2: # %entry
				; CHECK-NEXT: #
				; CHECK-NEXT: mr r11, r7
				; CHECK-NEXT: mr r10, r6
				; CHECK-NEXT: stqcx. r10, 0, r3
				; CHECK-NEXT: bne cr0, .LBB8_1
				; CHECK-NEXT: b .LBB8_4
				; CHECK-NEXT: .LBB8_3: # %entry
				; CHECK-NEXT: stqcx. r8, 0, r3
				; CHECK-NEXT: .LBB8_4: # %entry
				; CHECK-NEXT: mr r3, r8
				; CHECK-NEXT: mr r4, r9
				; CHECK-NEXT: blr
				;
				; PWR7-LABEL: cas_weak_release_monotonic:
				; PWR7: # %bb.0: # %entry
				; PWR7-NEXT: mflr r0
				; PWR7-NEXT: std r0, 16(r1)
				; PWR7-NEXT: stdu r1, -112(r1)
				; PWR7-NEXT: .cfi_def_cfa_offset 112
				; PWR7-NEXT: .cfi_offset lr, 16
				; PWR7-NEXT: lwsync
				; PWR7-NEXT: bl __sync_val_compare_and_swap_16
				; PWR7-NEXT: nop
				; PWR7-NEXT: addi r1, r1, 112
				; PWR7-NEXT: ld r0, 16(r1)
				; PWR7-NEXT: mtlr r0
				; PWR7-NEXT: blr
				entry:
				%0 = cmpxchg weak i128* %a, i128 %cmp, i128 %new release monotonic
				%1 = extractvalue { i128, i1 } %0, 0
				ret i128 %1
				}

				define i128 @cas_sc_sc(i128* %a, i128 %cmp, i128 %new) {
				; CHECK-LABEL: cas_sc_sc:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: sync
				; CHECK-NEXT: .LBB9_1: # %entry
				; CHECK-NEXT: #
				; CHECK-NEXT: lqarx r8, 0, r3
				; CHECK-NEXT: xor r11, r9, r5
				; CHECK-NEXT: xor r10, r8, r4
				; CHECK-NEXT: or. r11, r11, r10
				; CHECK-NEXT: bne cr0, .LBB9_3
				; CHECK-NEXT: # %bb.2: # %entry
				; CHECK-NEXT: #
				; CHECK-NEXT: mr r11, r7
				; CHECK-NEXT: mr r10, r6
				; CHECK-NEXT: stqcx. r10, 0, r3
				; CHECK-NEXT: bne cr0, .LBB9_1
				; CHECK-NEXT: b .LBB9_4
				; CHECK-NEXT: .LBB9_3: # %entry
				; CHECK-NEXT: stqcx. r8, 0, r3
				; CHECK-NEXT: .LBB9_4: # %entry
				; CHECK-NEXT: lwsync
				; CHECK-NEXT: mr r3, r8
				; CHECK-NEXT: mr r4, r9
				; CHECK-NEXT: blr
				;
				; PWR7-LABEL: cas_sc_sc:
				; PWR7: # %bb.0: # %entry
				; PWR7-NEXT: mflr r0
				; PWR7-NEXT: std r0, 16(r1)
				; PWR7-NEXT: stdu r1, -112(r1)
				; PWR7-NEXT: .cfi_def_cfa_offset 112
				; PWR7-NEXT: .cfi_offset lr, 16
				; PWR7-NEXT: sync
				; PWR7-NEXT: bl __sync_val_compare_and_swap_16
				; PWR7-NEXT: nop
				; PWR7-NEXT: lwsync
				; PWR7-NEXT: addi r1, r1, 112
				; PWR7-NEXT: ld r0, 16(r1)
				; PWR7-NEXT: mtlr r0
				; PWR7-NEXT: blr
				entry:
				%0 = cmpxchg i128* %a, i128 %cmp, i128 %new seq_cst seq_cst
				%1 = extractvalue { i128, i1 } %0, 0
				ret i128 %1
				}

				define i128 @cas_acqrel_acquire(i128* %a, i128 %cmp, i128 %new) {
				; CHECK-LABEL: cas_acqrel_acquire:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: lwsync
				; CHECK-NEXT: .LBB10_1: # %entry
				; CHECK-NEXT: #
				; CHECK-NEXT: lqarx r8, 0, r3
				; CHECK-NEXT: xor r11, r9, r5
				; CHECK-NEXT: xor r10, r8, r4
				; CHECK-NEXT: or. r11, r11, r10
				; CHECK-NEXT: bne cr0, .LBB10_3
				; CHECK-NEXT: # %bb.2: # %entry
				; CHECK-NEXT: #
				; CHECK-NEXT: mr r11, r7
				; CHECK-NEXT: mr r10, r6
				; CHECK-NEXT: stqcx. r10, 0, r3
				; CHECK-NEXT: bne cr0, .LBB10_1
				; CHECK-NEXT: b .LBB10_4
				; CHECK-NEXT: .LBB10_3: # %entry
				; CHECK-NEXT: stqcx. r8, 0, r3
				; CHECK-NEXT: .LBB10_4: # %entry
				; CHECK-NEXT: lwsync
				; CHECK-NEXT: mr r3, r8
				; CHECK-NEXT: mr r4, r9
				; CHECK-NEXT: blr
				;
				; PWR7-LABEL: cas_acqrel_acquire:
				; PWR7: # %bb.0: # %entry
				; PWR7-NEXT: mflr r0
				; PWR7-NEXT: std r0, 16(r1)
				; PWR7-NEXT: stdu r1, -112(r1)
				; PWR7-NEXT: .cfi_def_cfa_offset 112
				; PWR7-NEXT: .cfi_offset lr, 16
				; PWR7-NEXT: lwsync
				; PWR7-NEXT: bl __sync_val_compare_and_swap_16
				; PWR7-NEXT: nop
				; PWR7-NEXT: lwsync
				; PWR7-NEXT: addi r1, r1, 112
				; PWR7-NEXT: ld r0, 16(r1)
				; PWR7-NEXT: mtlr r0
				; PWR7-NEXT: blr
				entry:
				%0 = cmpxchg i128* %a, i128 %cmp, i128 %new acq_rel acquire
				%1 = extractvalue { i128, i1 } %0, 0
				ret i128 %1
				}

This is an archive of the discontinued LLVM Phabricator instance.

[PowerPC] Generate inlined quadword lock free atomic operations via AtomicExpand
ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 358804

llvm/include/llvm/IR/IntrinsicsPowerPC.td

llvm/lib/CodeGen/AtomicExpandPass.cpp

llvm/lib/Target/PowerPC/CMakeLists.txt

llvm/lib/Target/PowerPC/PPC.h

llvm/lib/Target/PowerPC/PPC.td

llvm/lib/Target/PowerPC/PPCExpandAtomicPseudoInsts.cpp

llvm/lib/Target/PowerPC/PPCISelLowering.h

llvm/lib/Target/PowerPC/PPCISelLowering.cpp

llvm/lib/Target/PowerPC/PPCInstr64Bit.td

llvm/lib/Target/PowerPC/PPCInstrInfo.td

llvm/lib/Target/PowerPC/PPCSubtarget.h

llvm/lib/Target/PowerPC/PPCTargetMachine.cpp

llvm/test/CodeGen/PowerPC/O3-pipeline.ll

llvm/test/CodeGen/PowerPC/atomics-i128.ll

This is an archive of the discontinued LLVM Phabricator instance.

[PowerPC] Generate inlined quadword lock free atomic operations via AtomicExpandClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 358804

llvm/include/llvm/IR/IntrinsicsPowerPC.td

llvm/lib/CodeGen/AtomicExpandPass.cpp

llvm/lib/Target/PowerPC/CMakeLists.txt

llvm/lib/Target/PowerPC/PPC.h

llvm/lib/Target/PowerPC/PPC.td

llvm/lib/Target/PowerPC/PPCExpandAtomicPseudoInsts.cpp

llvm/lib/Target/PowerPC/PPCISelLowering.h

llvm/lib/Target/PowerPC/PPCISelLowering.cpp

llvm/lib/Target/PowerPC/PPCInstr64Bit.td

llvm/lib/Target/PowerPC/PPCInstrInfo.td

llvm/lib/Target/PowerPC/PPCSubtarget.h

llvm/lib/Target/PowerPC/PPCTargetMachine.cpp

llvm/test/CodeGen/PowerPC/O3-pipeline.ll

llvm/test/CodeGen/PowerPC/atomics-i128.ll

[PowerPC] Generate inlined quadword lock free atomic operations via AtomicExpand
ClosedPublic