Diff 471149

llvm/include/llvm/IR/IntrinsicsLoongArch.td

	Show All 23 Lines
	// or i64 respectively:			// or i64 respectively:
	multiclass MaskedAtomicRMWIntrinsics {			multiclass MaskedAtomicRMWIntrinsics {
	// i32 @llvm.<name>.i32.<p>(any*, i32, i32, i32 imm);			// i32 @llvm.<name>.i32.<p>(any*, i32, i32, i32 imm);
	def _i32 : MaskedAtomicRMW<llvm_i32_ty>;			def _i32 : MaskedAtomicRMW<llvm_i32_ty>;
	// i64 @llvm.<name>.i32.<p>(any*, i64, i64, i64 imm);			// i64 @llvm.<name>.i32.<p>(any*, i64, i64, i64 imm);
	def _i64 : MaskedAtomicRMW<llvm_i64_ty>;			def _i64 : MaskedAtomicRMW<llvm_i64_ty>;
	}			}

				multiclass MaskedAtomicRMWFiveOpIntrinsics {
				// TODO: Support cmpxchg on LA32.
				// i64 @llvm.<name>.i64.<p>(any*, i64, i64, i64, i64 imm);
				def _i64 : MaskedAtomicRMWFiveArg<llvm_i64_ty>;
				}

	defm int_loongarch_masked_atomicrmw_xchg : MaskedAtomicRMWIntrinsics;			defm int_loongarch_masked_atomicrmw_xchg : MaskedAtomicRMWIntrinsics;
	defm int_loongarch_masked_atomicrmw_add : MaskedAtomicRMWIntrinsics;			defm int_loongarch_masked_atomicrmw_add : MaskedAtomicRMWIntrinsics;
	defm int_loongarch_masked_atomicrmw_sub : MaskedAtomicRMWIntrinsics;			defm int_loongarch_masked_atomicrmw_sub : MaskedAtomicRMWIntrinsics;
	defm int_loongarch_masked_atomicrmw_nand : MaskedAtomicRMWIntrinsics;			defm int_loongarch_masked_atomicrmw_nand : MaskedAtomicRMWIntrinsics;
	defm int_loongarch_masked_atomicrmw_umax : MaskedAtomicRMWIntrinsics;			defm int_loongarch_masked_atomicrmw_umax : MaskedAtomicRMWIntrinsics;
	defm int_loongarch_masked_atomicrmw_umin : MaskedAtomicRMWIntrinsics;			defm int_loongarch_masked_atomicrmw_umin : MaskedAtomicRMWIntrinsics;

				// @llvm.loongarch.masked.cmpxchg.i64.<p>(
				// ptr addr, grlen cmpval, grlen newval, grlen mask, grlenimm ordering)
				defm int_loongarch_masked_cmpxchg : MaskedAtomicRMWFiveOpIntrinsics;
	} // TargetPrefix = "loongarch"			} // TargetPrefix = "loongarch"

llvm/lib/Target/LoongArch/LoongArchExpandAtomicPseudoInsts.cpp

Show First 20 Lines • Show All 49 Lines • ▼ Show 20 Lines	private:
bool expandAtomicBinOp(MachineBasicBlock &MBB,		bool expandAtomicBinOp(MachineBasicBlock &MBB,
MachineBasicBlock::iterator MBBI, AtomicRMWInst::BinOp,		MachineBasicBlock::iterator MBBI, AtomicRMWInst::BinOp,
bool IsMasked, int Width,		bool IsMasked, int Width,
MachineBasicBlock::iterator &NextMBBI);		MachineBasicBlock::iterator &NextMBBI);
bool expandAtomicMinMaxOp(MachineBasicBlock &MBB,		bool expandAtomicMinMaxOp(MachineBasicBlock &MBB,
MachineBasicBlock::iterator MBBI,		MachineBasicBlock::iterator MBBI,
AtomicRMWInst::BinOp, bool IsMasked, int Width,		AtomicRMWInst::BinOp, bool IsMasked, int Width,
MachineBasicBlock::iterator &NextMBBI);		MachineBasicBlock::iterator &NextMBBI);
		bool expandAtomicCmpXchg(MachineBasicBlock &MBB,
		MachineBasicBlock::iterator MBBI, bool IsMasked,
		int Width, MachineBasicBlock::iterator &NextMBBI);
};		};

char LoongArchExpandAtomicPseudo::ID = 0;		char LoongArchExpandAtomicPseudo::ID = 0;

bool LoongArchExpandAtomicPseudo::runOnMachineFunction(MachineFunction &MF) {		bool LoongArchExpandAtomicPseudo::runOnMachineFunction(MachineFunction &MF) {
TII =		TII =
static_cast<const LoongArchInstrInfo *>(MF.getSubtarget().getInstrInfo());		static_cast<const LoongArchInstrInfo *>(MF.getSubtarget().getInstrInfo());
bool Modified = false;		bool Modified = false;
▲ Show 20 Lines • Show All 53 Lines • ▼ Show 20 Lines	case LoongArch::PseudoAtomicLoadXor32:
return expandAtomicBinOp(MBB, MBBI, AtomicRMWInst::Xor, false, 32,		return expandAtomicBinOp(MBB, MBBI, AtomicRMWInst::Xor, false, 32,
NextMBBI);		NextMBBI);
case LoongArch::PseudoMaskedAtomicLoadUMax32:		case LoongArch::PseudoMaskedAtomicLoadUMax32:
return expandAtomicMinMaxOp(MBB, MBBI, AtomicRMWInst::UMax, true, 32,		return expandAtomicMinMaxOp(MBB, MBBI, AtomicRMWInst::UMax, true, 32,
NextMBBI);		NextMBBI);
case LoongArch::PseudoMaskedAtomicLoadUMin32:		case LoongArch::PseudoMaskedAtomicLoadUMin32:
return expandAtomicMinMaxOp(MBB, MBBI, AtomicRMWInst::UMin, true, 32,		return expandAtomicMinMaxOp(MBB, MBBI, AtomicRMWInst::UMin, true, 32,
NextMBBI);		NextMBBI);
		case LoongArch::PseudoCmpXchg32:
		return expandAtomicCmpXchg(MBB, MBBI, false, 32, NextMBBI);
		case LoongArch::PseudoCmpXchg64:
		return expandAtomicCmpXchg(MBB, MBBI, false, 64, NextMBBI);
		case LoongArch::PseudoMaskedCmpXchg32:
		return expandAtomicCmpXchg(MBB, MBBI, true, 32, NextMBBI);
}		}
return false;		return false;
}		}

static void doAtomicBinOpExpansion(const LoongArchInstrInfo *TII,		static void doAtomicBinOpExpansion(const LoongArchInstrInfo *TII,
MachineInstr &MI, DebugLoc DL,		MachineInstr &MI, DebugLoc DL,
MachineBasicBlock *ThisMBB,		MachineBasicBlock *ThisMBB,
MachineBasicBlock *LoopMBB,		MachineBasicBlock *LoopMBB,
▲ Show 20 Lines • Show All 292 Lines • ▼ Show 20 Lines	bool LoongArchExpandAtomicPseudo::expandAtomicMinMaxOp(
computeAndAddLiveIns(LiveRegs, *LoopHeadMBB);		computeAndAddLiveIns(LiveRegs, *LoopHeadMBB);
computeAndAddLiveIns(LiveRegs, *LoopIfBodyMBB);		computeAndAddLiveIns(LiveRegs, *LoopIfBodyMBB);
computeAndAddLiveIns(LiveRegs, *LoopTailMBB);		computeAndAddLiveIns(LiveRegs, *LoopTailMBB);
computeAndAddLiveIns(LiveRegs, *DoneMBB);		computeAndAddLiveIns(LiveRegs, *DoneMBB);

return true;		return true;
}		}

		bool LoongArchExpandAtomicPseudo::expandAtomicCmpXchg(
		MachineBasicBlock &MBB, MachineBasicBlock::iterator MBBI, bool IsMasked,
		int Width, MachineBasicBlock::iterator &NextMBBI) {
		MachineInstr &MI = *MBBI;
		DebugLoc DL = MI.getDebugLoc();
		MachineFunction *MF = MBB.getParent();
		auto LoopHeadMBB = MF->CreateMachineBasicBlock(MBB.getBasicBlock());
		auto LoopTailMBB = MF->CreateMachineBasicBlock(MBB.getBasicBlock());
		auto TailMBB = MF->CreateMachineBasicBlock(MBB.getBasicBlock());
		auto DoneMBB = MF->CreateMachineBasicBlock(MBB.getBasicBlock());

		// Insert new MBBs.
		MF->insert(++MBB.getIterator(), LoopHeadMBB);
		MF->insert(++LoopHeadMBB->getIterator(), LoopTailMBB);
		MF->insert(++LoopTailMBB->getIterator(), TailMBB);
		MF->insert(++TailMBB->getIterator(), DoneMBB);

		// Set up successors and transfer remaining instructions to DoneMBB.
		LoopHeadMBB->addSuccessor(LoopTailMBB);
		LoopHeadMBB->addSuccessor(TailMBB);
		LoopTailMBB->addSuccessor(DoneMBB);
		LoopTailMBB->addSuccessor(LoopHeadMBB);
		TailMBB->addSuccessor(DoneMBB);
		DoneMBB->splice(DoneMBB->end(), &MBB, MI, MBB.end());
		DoneMBB->transferSuccessors(&MBB);
		MBB.addSuccessor(LoopHeadMBB);

		Register DestReg = MI.getOperand(0).getReg();
		Register ScratchReg = MI.getOperand(1).getReg();
		Register AddrReg = MI.getOperand(2).getReg();
		Register CmpValReg = MI.getOperand(3).getReg();
		Register NewValReg = MI.getOperand(4).getReg();

		if (!IsMasked) {
		// .loophead:
		// ll.[w\|d] dest, (addr)
		// bne dest, cmpval, tail
		BuildMI(LoopHeadMBB, DL,
		TII->get(Width == 32 ? LoongArch::LL_W : LoongArch::LL_D), DestReg)
		.addReg(AddrReg)
		.addImm(0);
		BuildMI(LoopHeadMBB, DL, TII->get(LoongArch::BNE))
		.addReg(DestReg)
		.addReg(CmpValReg)
		.addMBB(TailMBB);
		// .looptail:
		// dbar 0
		// move scratch, newval
		// sc.[w\|d] scratch, scratch, (addr)
		// beqz scratch, loophead
		// b done
		BuildMI(LoopTailMBB, DL, TII->get(LoongArch::DBAR)).addImm(0);
		BuildMI(LoopTailMBB, DL, TII->get(LoongArch::OR), ScratchReg)
		.addReg(NewValReg)
		.addReg(LoongArch::R0);
		BuildMI(LoopTailMBB, DL,
		TII->get(Width == 32 ? LoongArch::SC_W : LoongArch::SC_D),
		ScratchReg)
		.addReg(ScratchReg)
		.addReg(AddrReg)
		.addImm(0);
		BuildMI(LoopTailMBB, DL, TII->get(LoongArch::BEQZ))
		.addReg(ScratchReg)
		.addMBB(LoopHeadMBB);
		BuildMI(LoopTailMBB, DL, TII->get(LoongArch::B)).addMBB(DoneMBB);
		} else {
		// .loophead:
		// ll.[w\|d] dest, (addr)
		// and scratch, dest, mask
		// bne scratch, cmpval, tail
		Register MaskReg = MI.getOperand(5).getReg();
		BuildMI(LoopHeadMBB, DL,
		TII->get(Width == 32 ? LoongArch::LL_W : LoongArch::LL_D), DestReg)
		.addReg(AddrReg)
		.addImm(0);
		BuildMI(LoopHeadMBB, DL, TII->get(LoongArch::AND), ScratchReg)
		.addReg(DestReg)
		.addReg(MaskReg);
		BuildMI(LoopHeadMBB, DL, TII->get(LoongArch::BNE))
		.addReg(ScratchReg)
		.addReg(CmpValReg)
		.addMBB(TailMBB);

		// .looptail:
		// dbar 0
		// andn scratch, dest, mask
		// or scratch, scratch, newval
		// sc.[w\|d] scratch, scratch, (addr)
		// beqz scratch, loophead
		// b done
		BuildMI(LoopTailMBB, DL, TII->get(LoongArch::DBAR)).addImm(0);
		BuildMI(LoopTailMBB, DL, TII->get(LoongArch::ANDN), ScratchReg)
		.addReg(DestReg)
		.addReg(MaskReg);
		BuildMI(LoopTailMBB, DL, TII->get(LoongArch::OR), ScratchReg)
		.addReg(ScratchReg)
		.addReg(NewValReg);
		BuildMI(LoopTailMBB, DL,
		TII->get(Width == 32 ? LoongArch::SC_W : LoongArch::SC_D),
		ScratchReg)
		.addReg(ScratchReg)
		.addReg(AddrReg)
		.addImm(0);
		BuildMI(LoopTailMBB, DL, TII->get(LoongArch::BEQZ))
		.addReg(ScratchReg)
		.addMBB(LoopHeadMBB);
		BuildMI(LoopTailMBB, DL, TII->get(LoongArch::B)).addMBB(DoneMBB);
		}

		// .tail:
		// dbar 0x700
		BuildMI(TailMBB, DL, TII->get(LoongArch::DBAR)).addImm(0x700);

		NextMBBI = MBB.end();
		MI.eraseFromParent();

		LivePhysRegs LiveRegs;
		computeAndAddLiveIns(LiveRegs, *LoopHeadMBB);
		computeAndAddLiveIns(LiveRegs, *LoopTailMBB);
		computeAndAddLiveIns(LiveRegs, *TailMBB);
		computeAndAddLiveIns(LiveRegs, *DoneMBB);

		return true;
		}

} // end namespace		} // end namespace

INITIALIZE_PASS(LoongArchExpandAtomicPseudo, "loongarch-expand-atomic-pseudo",		INITIALIZE_PASS(LoongArchExpandAtomicPseudo, "loongarch-expand-atomic-pseudo",
LoongArch_EXPAND_ATOMIC_PSEUDO_NAME, false, false)		LoongArch_EXPAND_ATOMIC_PSEUDO_NAME, false, false)

namespace llvm {		namespace llvm {

FunctionPass *createLoongArchExpandAtomicPseudoPass() {		FunctionPass *createLoongArchExpandAtomicPseudoPass() {
return new LoongArchExpandAtomicPseudo();		return new LoongArchExpandAtomicPseudo();
}		}

} // end namespace llvm		} // end namespace llvm

llvm/lib/Target/LoongArch/LoongArchISelLowering.h

Show First 20 Lines • Show All 103 Lines • ▼ Show 20 Lines	public:

Value emitMaskedAtomicRMWIntrinsic(IRBuilderBase &Builder, AtomicRMWInst AI,		Value emitMaskedAtomicRMWIntrinsic(IRBuilderBase &Builder, AtomicRMWInst AI,
Value AlignedAddr, Value Incr,		Value AlignedAddr, Value Incr,
Value Mask, Value ShiftAmt,		Value Mask, Value ShiftAmt,
AtomicOrdering Ord) const override;		AtomicOrdering Ord) const override;

EVT getSetCCResultType(const DataLayout &DL, LLVMContext &Context,		EVT getSetCCResultType(const DataLayout &DL, LLVMContext &Context,
EVT VT) const override;		EVT VT) const override;
		TargetLowering::AtomicExpansionKind
		shouldExpandAtomicCmpXchgInIR(AtomicCmpXchgInst *CI) const override;
		Value *emitMaskedAtomicCmpXchgIntrinsic(IRBuilderBase &Builder,
		AtomicCmpXchgInst *CI,
		Value AlignedAddr, Value CmpVal,
		Value NewVal, Value Mask,
		AtomicOrdering Ord) const override;

bool getTgtMemIntrinsic(IntrinsicInfo &Info, const CallInst &I,		bool getTgtMemIntrinsic(IntrinsicInfo &Info, const CallInst &I,
MachineFunction &MF,		MachineFunction &MF,
unsigned Intrinsic) const override;		unsigned Intrinsic) const override;

bool isFMAFasterThanFMulAndFAdd(const MachineFunction &MF,		bool isFMAFasterThanFMulAndFAdd(const MachineFunction &MF,
EVT VT) const override;		EVT VT) const override;

Register		Register
getExceptionPointerRegister(const Constant *PersonalityFn) const override;		getExceptionPointerRegister(const Constant *PersonalityFn) const override;

Register		Register
getExceptionSelectorRegister(const Constant *PersonalityFn) const override;		getExceptionSelectorRegister(const Constant *PersonalityFn) const override;

		ISD::NodeType getExtendForAtomicOps() const override {
		return ISD::SIGN_EXTEND;
		}

private:		private:
/// Target-specific function used to lower LoongArch calling conventions.		/// Target-specific function used to lower LoongArch calling conventions.
typedef bool LoongArchCCAssignFn(const DataLayout &DL, LoongArchABI::ABI ABI,		typedef bool LoongArchCCAssignFn(const DataLayout &DL, LoongArchABI::ABI ABI,
unsigned ValNo, MVT ValVT,		unsigned ValNo, MVT ValVT,
CCValAssign::LocInfo LocInfo,		CCValAssign::LocInfo LocInfo,
ISD::ArgFlagsTy ArgFlags, CCState &State,		ISD::ArgFlagsTy ArgFlags, CCState &State,
bool IsFixed, bool IsReg, Type *OrigTy);		bool IsFixed, bool IsReg, Type *OrigTy);

▲ Show 20 Lines • Show All 55 Lines • Show Last 20 Lines

llvm/lib/Target/LoongArch/LoongArchISelLowering.cpp

Show First 20 Lines • Show All 2,078 Lines • ▼ Show 20 Lines	case AtomicRMWInst::Nand:
return Intrinsic::loongarch_masked_atomicrmw_nand_i32;		return Intrinsic::loongarch_masked_atomicrmw_nand_i32;
// TODO: support other AtomicRMWInst.		// TODO: support other AtomicRMWInst.
}		}
}		}

llvm_unreachable("Unexpected GRLen\n");		llvm_unreachable("Unexpected GRLen\n");
}		}

		TargetLowering::AtomicExpansionKind
		LoongArchTargetLowering::shouldExpandAtomicCmpXchgInIR(
		AtomicCmpXchgInst *CI) const {
		unsigned Size = CI->getCompareOperand()->getType()->getPrimitiveSizeInBits();
		if (Size == 8 \|\| Size == 16)
		return AtomicExpansionKind::MaskedIntrinsic;
		return AtomicExpansionKind::None;
		}

		Value *LoongArchTargetLowering::emitMaskedAtomicCmpXchgIntrinsic(
		IRBuilderBase &Builder, AtomicCmpXchgInst CI, Value AlignedAddr,
		Value CmpVal, Value NewVal, Value *Mask, AtomicOrdering Ord) const {
		Value *Ordering =
		Builder.getIntN(Subtarget.getGRLen(), static_cast<uint64_t>(Ord));

		// TODO: Support cmpxchg on LA32.
		Intrinsic::ID CmpXchgIntrID = Intrinsic::loongarch_masked_cmpxchg_i64;
		CmpVal = Builder.CreateSExt(CmpVal, Builder.getInt64Ty());
		NewVal = Builder.CreateSExt(NewVal, Builder.getInt64Ty());
		Mask = Builder.CreateSExt(Mask, Builder.getInt64Ty());
		Type *Tys[] = {AlignedAddr->getType()};
		Function *MaskedCmpXchg =
		Intrinsic::getDeclaration(CI->getModule(), CmpXchgIntrID, Tys);
		Value *Result = Builder.CreateCall(
		MaskedCmpXchg, {AlignedAddr, CmpVal, NewVal, Mask, Ordering});
		Result = Builder.CreateTrunc(Result, Builder.getInt32Ty());
		return Result;
		}

Value *LoongArchTargetLowering::emitMaskedAtomicRMWIntrinsic(		Value *LoongArchTargetLowering::emitMaskedAtomicRMWIntrinsic(
IRBuilderBase &Builder, AtomicRMWInst AI, Value AlignedAddr, Value *Incr,		IRBuilderBase &Builder, AtomicRMWInst AI, Value AlignedAddr, Value *Incr,
Value Mask, Value ShiftAmt, AtomicOrdering Ord) const {		Value Mask, Value ShiftAmt, AtomicOrdering Ord) const {
unsigned GRLen = Subtarget.getGRLen();		unsigned GRLen = Subtarget.getGRLen();
Value *Ordering =		Value *Ordering =
Builder.getIntN(GRLen, static_cast<uint64_t>(AI->getOrdering()));		Builder.getIntN(GRLen, static_cast<uint64_t>(AI->getOrdering()));
Type *Tys[] = {AlignedAddr->getType()};		Type *Tys[] = {AlignedAddr->getType()};
Function *LlwOpScwLoop = Intrinsic::getDeclaration(		Function *LlwOpScwLoop = Intrinsic::getDeclaration(
▲ Show 20 Lines • Show All 195 Lines • Show Last 20 Lines

llvm/lib/Target/LoongArch/LoongArchInstrInfo.td

Show First 20 Lines • Show All 1,174 Lines • ▼ Show 20 Lines	class PseudoMaskedAMUMinUMax
let mayLoad = 1;		let mayLoad = 1;
let mayStore = 1;		let mayStore = 1;
let hasSideEffects = 0;		let hasSideEffects = 0;
}		}

def PseudoMaskedAtomicLoadUMax32 : PseudoMaskedAMUMinUMax;		def PseudoMaskedAtomicLoadUMax32 : PseudoMaskedAMUMinUMax;
def PseudoMaskedAtomicLoadUMin32 : PseudoMaskedAMUMinUMax;		def PseudoMaskedAtomicLoadUMin32 : PseudoMaskedAMUMinUMax;

		/// Compare and exchange

		class PseudoCmpXchg
		: Pseudo<(outs GPR:$res, GPR:$scratch),
		(ins GPR:$addr, GPR:$cmpval, GPR:$newval), []> {
		let Constraints = "@earlyclobber $res,@earlyclobber $scratch";
		let mayLoad = 1;
		let mayStore = 1;
		let hasSideEffects = 0;
		}

		def PseudoCmpXchg32 : PseudoCmpXchg;
		def PseudoCmpXchg64 : PseudoCmpXchg;

		def PseudoMaskedCmpXchg32
		: Pseudo<(outs GPR:$res, GPR:$scratch),
		(ins GPR:$addr, GPR:$cmpval, GPR:$newval, GPR:$mask,
		grlenimm:$ordering), []> {
		let Constraints = "@earlyclobber $res,@earlyclobber $scratch";
		let mayLoad = 1;
		let mayStore = 1;
		let hasSideEffects = 0;
		}

class AtomicPat<Intrinsic intrin, Pseudo AMInst>		class AtomicPat<Intrinsic intrin, Pseudo AMInst>
: Pat<(intrin GPR:$addr, GPR:$incr, GPR:$mask, timm:$ordering),		: Pat<(intrin GPR:$addr, GPR:$incr, GPR:$mask, timm:$ordering),
(AMInst GPR:$addr, GPR:$incr, GPR:$mask, timm:$ordering)>;		(AMInst GPR:$addr, GPR:$incr, GPR:$mask, timm:$ordering)>;

let Predicates = [IsLA64] in {		let Predicates = [IsLA64] in {
def : AtomicPat<int_loongarch_masked_atomicrmw_xchg_i64,		def : AtomicPat<int_loongarch_masked_atomicrmw_xchg_i64,
PseudoMaskedAtomicSwap32>;		PseudoMaskedAtomicSwap32>;
def : Pat<(atomic_swap_32 GPR:$addr, GPR:$incr),		def : Pat<(atomic_swap_32 GPR:$addr, GPR:$incr),
Show All 37 Lines	def : Pat<(atomic_load_umax_32 GPR:$rj, GPR:$rk),
(AMMAX_DB_WU GPR:$rk, GPR:$rj)>;		(AMMAX_DB_WU GPR:$rk, GPR:$rj)>;
def : Pat<(atomic_load_umax_64 GPR:$rj, GPR:$rk),		def : Pat<(atomic_load_umax_64 GPR:$rj, GPR:$rk),
(AMMAX_DB_DU GPR:$rk, GPR:$rj)>;		(AMMAX_DB_DU GPR:$rk, GPR:$rj)>;

def : AtomicPat<int_loongarch_masked_atomicrmw_umax_i64,		def : AtomicPat<int_loongarch_masked_atomicrmw_umax_i64,
PseudoMaskedAtomicLoadUMax32>;		PseudoMaskedAtomicLoadUMax32>;
def : AtomicPat<int_loongarch_masked_atomicrmw_umin_i64,		def : AtomicPat<int_loongarch_masked_atomicrmw_umin_i64,
PseudoMaskedAtomicLoadUMin32>;		PseudoMaskedAtomicLoadUMin32>;

		def : Pat<(atomic_cmp_swap_64 GPR:$addr, GPR:$cmp, GPR:$new),
		(PseudoCmpXchg64 GPR:$addr, GPR:$cmp, GPR:$new)>;
		def : Pat<(int_loongarch_masked_cmpxchg_i64
		GPR:$addr, GPR:$cmpval, GPR:$newval, GPR:$mask, timm:$ordering),
		(PseudoMaskedCmpXchg32
		GPR:$addr, GPR:$cmpval, GPR:$newval, GPR:$mask, timm:$ordering)>;
		def : Pat<(atomic_cmp_swap_32 GPR:$addr, GPR:$cmp, GPR:$new),
		(PseudoCmpXchg32 GPR:$addr, GPR:$cmp, GPR:$new)>;
} // Predicates = [IsLA64]		} // Predicates = [IsLA64]

def : Pat<(atomic_load_nand_32 GPR:$rj, GPR:$rk),		def : Pat<(atomic_load_nand_32 GPR:$rj, GPR:$rk),
(PseudoAtomicLoadNand32 GPR:$rj, GPR:$rk)>;		(PseudoAtomicLoadNand32 GPR:$rj, GPR:$rk)>;

let Predicates = [IsLA32] in {		let Predicates = [IsLA32] in {
def : AtomicPat<int_loongarch_masked_atomicrmw_xchg_i32,		def : AtomicPat<int_loongarch_masked_atomicrmw_xchg_i32,
PseudoMaskedAtomicSwap32>;		PseudoMaskedAtomicSwap32>;
▲ Show 20 Lines • Show All 99 Lines • Show Last 20 Lines

llvm/test/CodeGen/LoongArch/ir-instruction/atomic-cmpxchg.ll

This file was added.

				; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
				; RUN: llc --mtriple=loongarch64 < %s \| FileCheck %s --check-prefix=LA64

				define void @cmpxchg_i8_acquire_acquire(ptr %ptr, i8 %cmp, i8 %val) nounwind {
				; LA64-LABEL: cmpxchg_i8_acquire_acquire:
				; LA64: # %bb.0:
				; LA64-NEXT: addi.w $a3, $zero, -4
				; LA64-NEXT: and $a3, $a0, $a3
				; LA64-NEXT: slli.d $a0, $a0, 3
				; LA64-NEXT: andi $a1, $a1, 255
				; LA64-NEXT: sll.w $a1, $a1, $a0
				; LA64-NEXT: andi $a2, $a2, 255
				; LA64-NEXT: sll.w $a2, $a2, $a0
				; LA64-NEXT: ori $a4, $zero, 255
				; LA64-NEXT: sll.w $a0, $a4, $a0
				; LA64-NEXT: addi.w $a0, $a0, 0
				; LA64-NEXT: addi.w $a2, $a2, 0
				; LA64-NEXT: addi.w $a1, $a1, 0
				; LA64-NEXT: .LBB0_1: # =>This Inner Loop Header: Depth=1
				; LA64-NEXT: ll.w $a4, $a3, 0
				; LA64-NEXT: and $a5, $a4, $a0
				hevUnsubmitted Not Done Reply Inline Actions Not needed. ll: full-membar + load-exclusive hev: Not needed. ll: full-membar + load-exclusive
				xry111Unsubmitted Not Done Reply Inline Actions Jiaxun told me (via linux-mips): I had checked with Loongson guys and they confirmed that the workaround still needs to be applied to latest 3A4000 processors, including 3A4000 for MIPS and 3A5000 for LoongArch. Though, the reason behind the workaround varies with the evaluation of their uArch, for GS464V based core, barrier is required as the uArch design allows regular load to be reordered after an atomic linked load, and that would break assumption of compiler atomic constraints. In GCC we use `dbar 0x700`, so in the future HW engineers can fix this issue and make `dbar 0x700` no-op. xry111: Jiaxun told me (via linux-mips): > I had checked with Loongson guys and they confirmed that…
				xry111Unsubmitted Not Done Reply Inline Actions Ouch, I mean the `dbar 1792` instruction at `LBB0_3`. Yes this one can be removed for 3A5000. But what should we do if `LLDBAR` bit is 0 in CPUCFG? xry111: Ouch, I mean the `dbar 1792` instruction at `LBB0_3`. Yes this one can be removed for 3A5000.
				hevUnsubmitted Not Done Reply Inline Actions Nice question. What case we need memory barrier before atomic-op? Atomic-op with store-release semantics? Why not make sc as membar + store-conditional? If memory barrier semantics of ll are still membar + load-exclusive in future, and the atomic-op with load-acquire semantics, I think we can't make dbar 0x700 as no-op. hev: Nice question. What case we need memory barrier before atomic-op? Atomic-op with store-release…
				gonglingqinAuthorUnsubmitted Done Reply Inline Actions @hev, @xry111, Thank you for your input, I will remove this dbar. In addition, thanks to @hev's suggestion, dbar is added before sc to ensure correctness when LLDBAR bit is 0. gonglingqin: @hev, @xry111, Thank you for your input, I will remove this dbar. In addition, thanks to @hev's…
				; LA64-NEXT: bne $a5, $a1, .LBB0_3
				; LA64-NEXT: # %bb.2: # in Loop: Header=BB0_1 Depth=1
				; LA64-NEXT: dbar 0
				; LA64-NEXT: andn $a5, $a4, $a0
				; LA64-NEXT: or $a5, $a5, $a2
				; LA64-NEXT: sc.w $a5, $a3, 0
				; LA64-NEXT: beqz $a5, .LBB0_1
				hevUnsubmitted Not Done Reply Inline Actions I think we should reduce the number of instructions between ll and sc to make ll/sc complete as fast as possible. for refer: https://git.kernel.org/pub/scm/linux/kernel/git/next/linux-next.git/tree/arch/loongarch/include/asm/cmpxchg.h?h=next-20221014#n114 hev: I think we should reduce the number of instructions between ll and sc to make ll/sc complete as…
				gonglingqinAuthorUnsubmitted Done Reply Inline Actions Thanks, I will modify it. gonglingqin: Thanks, I will modify it.
				; LA64-NEXT: b .LBB0_4
				; LA64-NEXT: .LBB0_3:
				; LA64-NEXT: dbar 1792
				; LA64-NEXT: .LBB0_4:
				; LA64-NEXT: ret
				%res = cmpxchg ptr %ptr, i8 %cmp, i8 %val acquire acquire
				ret void
				}

				define void @cmpxchg_i16_acquire_acquire(ptr %ptr, i16 %cmp, i16 %val) nounwind {
				; LA64-LABEL: cmpxchg_i16_acquire_acquire:
				; LA64: # %bb.0:
				; LA64-NEXT: addi.w $a3, $zero, -4
				; LA64-NEXT: and $a3, $a0, $a3
				; LA64-NEXT: slli.d $a0, $a0, 3
				; LA64-NEXT: bstrpick.d $a1, $a1, 15, 0
				; LA64-NEXT: sll.w $a1, $a1, $a0
				; LA64-NEXT: bstrpick.d $a2, $a2, 15, 0
				; LA64-NEXT: sll.w $a2, $a2, $a0
				; LA64-NEXT: lu12i.w $a4, 15
				; LA64-NEXT: ori $a4, $a4, 4095
				; LA64-NEXT: sll.w $a0, $a4, $a0
				; LA64-NEXT: addi.w $a0, $a0, 0
				; LA64-NEXT: addi.w $a2, $a2, 0
				; LA64-NEXT: addi.w $a1, $a1, 0
				; LA64-NEXT: .LBB1_1: # =>This Inner Loop Header: Depth=1
				; LA64-NEXT: ll.w $a4, $a3, 0
				; LA64-NEXT: and $a5, $a4, $a0
				; LA64-NEXT: bne $a5, $a1, .LBB1_3
				; LA64-NEXT: # %bb.2: # in Loop: Header=BB1_1 Depth=1
				; LA64-NEXT: dbar 0
				; LA64-NEXT: andn $a5, $a4, $a0
				; LA64-NEXT: or $a5, $a5, $a2
				; LA64-NEXT: sc.w $a5, $a3, 0
				; LA64-NEXT: beqz $a5, .LBB1_1
				; LA64-NEXT: b .LBB1_4
				; LA64-NEXT: .LBB1_3:
				; LA64-NEXT: dbar 1792
				; LA64-NEXT: .LBB1_4:
				; LA64-NEXT: ret
				%res = cmpxchg ptr %ptr, i16 %cmp, i16 %val acquire acquire
				ret void
				}

				define void @cmpxchg_i32_acquire_acquire(ptr %ptr, i32 %cmp, i32 %val) nounwind {
				; LA64-LABEL: cmpxchg_i32_acquire_acquire:
				; LA64: # %bb.0:
				; LA64-NEXT: .LBB2_1: # =>This Inner Loop Header: Depth=1
				; LA64-NEXT: ll.w $a3, $a0, 0
				; LA64-NEXT: bne $a3, $a1, .LBB2_3
				; LA64-NEXT: # %bb.2: # in Loop: Header=BB2_1 Depth=1
				; LA64-NEXT: dbar 0
				; LA64-NEXT: move $a4, $a2
				; LA64-NEXT: sc.w $a4, $a0, 0
				; LA64-NEXT: beqz $a4, .LBB2_1
				; LA64-NEXT: b .LBB2_4
				; LA64-NEXT: .LBB2_3:
				; LA64-NEXT: dbar 1792
				; LA64-NEXT: .LBB2_4:
				; LA64-NEXT: ret
				%res = cmpxchg ptr %ptr, i32 %cmp, i32 %val acquire acquire
				ret void
				}

				define void @cmpxchg_i64_acquire_acquire(ptr %ptr, i64 %cmp, i64 %val) nounwind {
				; LA64-LABEL: cmpxchg_i64_acquire_acquire:
				; LA64: # %bb.0:
				; LA64-NEXT: .LBB3_1: # =>This Inner Loop Header: Depth=1
				; LA64-NEXT: ll.d $a3, $a0, 0
				; LA64-NEXT: bne $a3, $a1, .LBB3_3
				; LA64-NEXT: # %bb.2: # in Loop: Header=BB3_1 Depth=1
				; LA64-NEXT: dbar 0
				; LA64-NEXT: move $a4, $a2
				; LA64-NEXT: sc.d $a4, $a0, 0
				; LA64-NEXT: beqz $a4, .LBB3_1
				; LA64-NEXT: b .LBB3_4
				; LA64-NEXT: .LBB3_3:
				; LA64-NEXT: dbar 1792
				; LA64-NEXT: .LBB3_4:
				; LA64-NEXT: ret
				%res = cmpxchg ptr %ptr, i64 %cmp, i64 %val acquire acquire
				ret void
				}

				define i8 @cmpxchg_i8_acquire_acquire_reti8(ptr %ptr, i8 %cmp, i8 %val) nounwind {
				; LA64-LABEL: cmpxchg_i8_acquire_acquire_reti8:
				; LA64: # %bb.0:
				; LA64-NEXT: addi.w $a3, $zero, -4
				; LA64-NEXT: and $a3, $a0, $a3
				; LA64-NEXT: slli.d $a0, $a0, 3
				; LA64-NEXT: ori $a4, $zero, 255
				; LA64-NEXT: sll.w $a4, $a4, $a0
				; LA64-NEXT: addi.w $a4, $a4, 0
				; LA64-NEXT: andi $a2, $a2, 255
				; LA64-NEXT: sll.w $a2, $a2, $a0
				; LA64-NEXT: addi.w $a2, $a2, 0
				; LA64-NEXT: andi $a1, $a1, 255
				; LA64-NEXT: sll.w $a1, $a1, $a0
				; LA64-NEXT: addi.w $a1, $a1, 0
				; LA64-NEXT: .LBB4_1: # =>This Inner Loop Header: Depth=1
				; LA64-NEXT: ll.w $a5, $a3, 0
				; LA64-NEXT: and $a6, $a5, $a4
				; LA64-NEXT: bne $a6, $a1, .LBB4_3
				; LA64-NEXT: # %bb.2: # in Loop: Header=BB4_1 Depth=1
				; LA64-NEXT: dbar 0
				; LA64-NEXT: andn $a6, $a5, $a4
				; LA64-NEXT: or $a6, $a6, $a2
				; LA64-NEXT: sc.w $a6, $a3, 0
				; LA64-NEXT: beqz $a6, .LBB4_1
				; LA64-NEXT: b .LBB4_4
				; LA64-NEXT: .LBB4_3:
				; LA64-NEXT: dbar 1792
				; LA64-NEXT: .LBB4_4:
				; LA64-NEXT: srl.w $a0, $a5, $a0
				; LA64-NEXT: ret
				%tmp = cmpxchg ptr %ptr, i8 %cmp, i8 %val acquire acquire
				%res = extractvalue { i8, i1 } %tmp, 0
				ret i8 %res
				}

				define i16 @cmpxchg_i16_acquire_acquire_reti16(ptr %ptr, i16 %cmp, i16 %val) nounwind {
				; LA64-LABEL: cmpxchg_i16_acquire_acquire_reti16:
				; LA64: # %bb.0:
				; LA64-NEXT: addi.w $a3, $zero, -4
				; LA64-NEXT: and $a3, $a0, $a3
				; LA64-NEXT: slli.d $a0, $a0, 3
				; LA64-NEXT: lu12i.w $a4, 15
				; LA64-NEXT: ori $a4, $a4, 4095
				; LA64-NEXT: sll.w $a4, $a4, $a0
				; LA64-NEXT: addi.w $a4, $a4, 0
				; LA64-NEXT: bstrpick.d $a2, $a2, 15, 0
				; LA64-NEXT: sll.w $a2, $a2, $a0
				; LA64-NEXT: addi.w $a2, $a2, 0
				; LA64-NEXT: bstrpick.d $a1, $a1, 15, 0
				; LA64-NEXT: sll.w $a1, $a1, $a0
				; LA64-NEXT: addi.w $a1, $a1, 0
				; LA64-NEXT: .LBB5_1: # =>This Inner Loop Header: Depth=1
				; LA64-NEXT: ll.w $a5, $a3, 0
				; LA64-NEXT: and $a6, $a5, $a4
				; LA64-NEXT: bne $a6, $a1, .LBB5_3
				; LA64-NEXT: # %bb.2: # in Loop: Header=BB5_1 Depth=1
				; LA64-NEXT: dbar 0
				; LA64-NEXT: andn $a6, $a5, $a4
				; LA64-NEXT: or $a6, $a6, $a2
				; LA64-NEXT: sc.w $a6, $a3, 0
				; LA64-NEXT: beqz $a6, .LBB5_1
				; LA64-NEXT: b .LBB5_4
				; LA64-NEXT: .LBB5_3:
				; LA64-NEXT: dbar 1792
				; LA64-NEXT: .LBB5_4:
				; LA64-NEXT: srl.w $a0, $a5, $a0
				; LA64-NEXT: ret
				%tmp = cmpxchg ptr %ptr, i16 %cmp, i16 %val acquire acquire
				%res = extractvalue { i16, i1 } %tmp, 0
				ret i16 %res
				}

				define i32 @cmpxchg_i32_acquire_acquire_reti32(ptr %ptr, i32 %cmp, i32 %val) nounwind {
				; LA64-LABEL: cmpxchg_i32_acquire_acquire_reti32:
				; LA64: # %bb.0:
				; LA64-NEXT: .LBB6_1: # =>This Inner Loop Header: Depth=1
				; LA64-NEXT: ll.w $a3, $a0, 0
				; LA64-NEXT: bne $a3, $a1, .LBB6_3
				; LA64-NEXT: # %bb.2: # in Loop: Header=BB6_1 Depth=1
				; LA64-NEXT: dbar 0
				; LA64-NEXT: move $a4, $a2
				; LA64-NEXT: sc.w $a4, $a0, 0
				; LA64-NEXT: beqz $a4, .LBB6_1
				; LA64-NEXT: b .LBB6_4
				; LA64-NEXT: .LBB6_3:
				; LA64-NEXT: dbar 1792
				; LA64-NEXT: .LBB6_4:
				; LA64-NEXT: move $a0, $a3
				; LA64-NEXT: ret
				xen0nUnsubmitted Not Done Reply Inline Actions Okay so my suspicion is confirmed, and the implementation is wrong... the [[ https://llvm.org/docs/LangRef.html#cmpxchg-instruction \| result of a strong `cmpxchg` ]] should be 1 if `$a3 == $a1`, and 0 otherwise. It shouldn't be the original value. Please check if I'm misunderstanding anything... xen0n: Okay so my suspicion is confirmed, and the implementation is wrong... the [[ https://llvm.
				gonglingqinAuthorUnsubmitted Done Reply Inline Actions The original value at the location is returned, together with a flag indicating success (true) or failure (false). The return values of cmpxchg include {original value, i1}, which is checked in this test case for original value. %res = extractvalue { i32, i1 } %tmp, 0 ret i32 %res gonglingqin: > The original value at the location is returned, together with a flag indicating success…
				xen0nUnsubmitted Not Done Reply Inline Actions Ah I see. It's compound. Then how about some more tests checking the `i1` part too? xen0n: Ah I see. It's compound. Then how about some more tests checking the `i1` part too?
				gonglingqinAuthorUnsubmitted Done Reply Inline Actions Sure, I'll add test cases. gonglingqin: Sure, I'll add test cases.
				%tmp = cmpxchg ptr %ptr, i32 %cmp, i32 %val acquire acquire
				%res = extractvalue { i32, i1 } %tmp, 0
				ret i32 %res
				}

				define i64 @cmpxchg_i64_acquire_acquire_reti64(ptr %ptr, i64 %cmp, i64 %val) nounwind {
				; LA64-LABEL: cmpxchg_i64_acquire_acquire_reti64:
				; LA64: # %bb.0:
				; LA64-NEXT: .LBB7_1: # =>This Inner Loop Header: Depth=1
				; LA64-NEXT: ll.d $a3, $a0, 0
				; LA64-NEXT: bne $a3, $a1, .LBB7_3
				; LA64-NEXT: # %bb.2: # in Loop: Header=BB7_1 Depth=1
				; LA64-NEXT: dbar 0
				; LA64-NEXT: move $a4, $a2
				; LA64-NEXT: sc.d $a4, $a0, 0
				; LA64-NEXT: beqz $a4, .LBB7_1
				; LA64-NEXT: b .LBB7_4
				; LA64-NEXT: .LBB7_3:
				; LA64-NEXT: dbar 1792
				; LA64-NEXT: .LBB7_4:
				; LA64-NEXT: move $a0, $a3
				; LA64-NEXT: ret
				%tmp = cmpxchg ptr %ptr, i64 %cmp, i64 %val acquire acquire
				%res = extractvalue { i64, i1 } %tmp, 0
				ret i64 %res
				}

				define i1 @cmpxchg_i8_acquire_acquire_reti1(ptr %ptr, i8 %cmp, i8 %val) nounwind {
				; LA64-LABEL: cmpxchg_i8_acquire_acquire_reti1:
				; LA64: # %bb.0:
				; LA64-NEXT: addi.w $a3, $zero, -4
				; LA64-NEXT: and $a3, $a0, $a3
				; LA64-NEXT: slli.d $a0, $a0, 3
				; LA64-NEXT: andi $a1, $a1, 255
				; LA64-NEXT: sll.w $a1, $a1, $a0
				; LA64-NEXT: ori $a4, $zero, 255
				; LA64-NEXT: sll.w $a4, $a4, $a0
				; LA64-NEXT: andi $a2, $a2, 255
				; LA64-NEXT: sll.w $a0, $a2, $a0
				; LA64-NEXT: addi.w $a0, $a0, 0
				; LA64-NEXT: addi.w $a2, $a4, 0
				; LA64-NEXT: addi.w $a5, $a1, 0
				; LA64-NEXT: .LBB8_1: # =>This Inner Loop Header: Depth=1
				; LA64-NEXT: ll.w $a6, $a3, 0
				; LA64-NEXT: and $a7, $a6, $a2
				; LA64-NEXT: bne $a7, $a5, .LBB8_3
				; LA64-NEXT: # %bb.2: # in Loop: Header=BB8_1 Depth=1
				; LA64-NEXT: dbar 0
				; LA64-NEXT: andn $a7, $a6, $a2
				; LA64-NEXT: or $a7, $a7, $a0
				; LA64-NEXT: sc.w $a7, $a3, 0
				; LA64-NEXT: beqz $a7, .LBB8_1
				; LA64-NEXT: b .LBB8_4
				; LA64-NEXT: .LBB8_3:
				; LA64-NEXT: dbar 1792
				; LA64-NEXT: .LBB8_4:
				; LA64-NEXT: and $a0, $a6, $a4
				; LA64-NEXT: bstrpick.d $a0, $a0, 31, 0
				; LA64-NEXT: bstrpick.d $a1, $a1, 31, 0
				; LA64-NEXT: xor $a0, $a1, $a0
				; LA64-NEXT: sltui $a0, $a0, 1
				; LA64-NEXT: ret
				%tmp = cmpxchg ptr %ptr, i8 %cmp, i8 %val acquire acquire
				%res = extractvalue { i8, i1 } %tmp, 1
				ret i1 %res
				}

				define i1 @cmpxchg_i16_acquire_acquire_reti1(ptr %ptr, i16 %cmp, i16 %val) nounwind {
				; LA64-LABEL: cmpxchg_i16_acquire_acquire_reti1:
				; LA64: # %bb.0:
				; LA64-NEXT: addi.w $a3, $zero, -4
				; LA64-NEXT: and $a3, $a0, $a3
				; LA64-NEXT: slli.d $a0, $a0, 3
				; LA64-NEXT: bstrpick.d $a1, $a1, 15, 0
				; LA64-NEXT: sll.w $a1, $a1, $a0
				; LA64-NEXT: lu12i.w $a4, 15
				; LA64-NEXT: ori $a4, $a4, 4095
				; LA64-NEXT: sll.w $a4, $a4, $a0
				; LA64-NEXT: bstrpick.d $a2, $a2, 15, 0
				; LA64-NEXT: sll.w $a0, $a2, $a0
				; LA64-NEXT: addi.w $a0, $a0, 0
				; LA64-NEXT: addi.w $a2, $a4, 0
				; LA64-NEXT: addi.w $a5, $a1, 0
				; LA64-NEXT: .LBB9_1: # =>This Inner Loop Header: Depth=1
				; LA64-NEXT: ll.w $a6, $a3, 0
				; LA64-NEXT: and $a7, $a6, $a2
				; LA64-NEXT: bne $a7, $a5, .LBB9_3
				; LA64-NEXT: # %bb.2: # in Loop: Header=BB9_1 Depth=1
				; LA64-NEXT: dbar 0
				; LA64-NEXT: andn $a7, $a6, $a2
				; LA64-NEXT: or $a7, $a7, $a0
				; LA64-NEXT: sc.w $a7, $a3, 0
				; LA64-NEXT: beqz $a7, .LBB9_1
				; LA64-NEXT: b .LBB9_4
				; LA64-NEXT: .LBB9_3:
				; LA64-NEXT: dbar 1792
				; LA64-NEXT: .LBB9_4:
				; LA64-NEXT: and $a0, $a6, $a4
				; LA64-NEXT: bstrpick.d $a0, $a0, 31, 0
				; LA64-NEXT: bstrpick.d $a1, $a1, 31, 0
				; LA64-NEXT: xor $a0, $a1, $a0
				; LA64-NEXT: sltui $a0, $a0, 1
				; LA64-NEXT: ret
				%tmp = cmpxchg ptr %ptr, i16 %cmp, i16 %val acquire acquire
				%res = extractvalue { i16, i1 } %tmp, 1
				ret i1 %res
				}

				define i1 @cmpxchg_i32_acquire_acquire_reti1(ptr %ptr, i32 %cmp, i32 %val) nounwind {
				; LA64-LABEL: cmpxchg_i32_acquire_acquire_reti1:
				; LA64: # %bb.0:
				; LA64-NEXT: .LBB10_1: # =>This Inner Loop Header: Depth=1
				; LA64-NEXT: ll.w $a3, $a0, 0
				; LA64-NEXT: bne $a3, $a1, .LBB10_3
				; LA64-NEXT: # %bb.2: # in Loop: Header=BB10_1 Depth=1
				; LA64-NEXT: dbar 0
				; LA64-NEXT: move $a4, $a2
				; LA64-NEXT: sc.w $a4, $a0, 0
				; LA64-NEXT: beqz $a4, .LBB10_1
				; LA64-NEXT: b .LBB10_4
				; LA64-NEXT: .LBB10_3:
				; LA64-NEXT: dbar 1792
				; LA64-NEXT: .LBB10_4:
				; LA64-NEXT: addi.w $a0, $a1, 0
				; LA64-NEXT: xor $a0, $a3, $a0
				xen0nUnsubmitted Not Done Reply Inline Actions This seems wrong: the following `xor` insn responsible for the `same value -> 0` part operates on full GRLen, but here `a1` i.e. `%cmp` gets zero-extended to `a0`, yet `a3` i.e. the value from memory is loaded with `ll.w` that sign-extends. I expect this will fail for cases where `cmp == ptr && cmp < 0`. Either this should be a sign-extension, or the comparison shouldn't be `xor`. xen0n:* This seems wrong: the following `xor` insn responsible for the `same value -> 0` part operates…
				gonglingqinAuthorUnsubmitted Done Reply Inline Actions Thanks for the fact checking! I will fix it. gonglingqin: Thanks for the fact checking! I will fix it.
				; LA64-NEXT: sltui $a0, $a0, 1
				; LA64-NEXT: ret
				%tmp = cmpxchg ptr %ptr, i32 %cmp, i32 %val acquire acquire
				%res = extractvalue { i32, i1 } %tmp, 1
				ret i1 %res
				}

				define i1 @cmpxchg_i64_acquire_acquire_reti1(ptr %ptr, i64 %cmp, i64 %val) nounwind {
				; LA64-LABEL: cmpxchg_i64_acquire_acquire_reti1:
				; LA64: # %bb.0:
				; LA64-NEXT: .LBB11_1: # =>This Inner Loop Header: Depth=1
				; LA64-NEXT: ll.d $a3, $a0, 0
				; LA64-NEXT: bne $a3, $a1, .LBB11_3
				; LA64-NEXT: # %bb.2: # in Loop: Header=BB11_1 Depth=1
				; LA64-NEXT: dbar 0
				; LA64-NEXT: move $a4, $a2
				; LA64-NEXT: sc.d $a4, $a0, 0
				; LA64-NEXT: beqz $a4, .LBB11_1
				; LA64-NEXT: b .LBB11_4
				; LA64-NEXT: .LBB11_3:
				; LA64-NEXT: dbar 1792
				; LA64-NEXT: .LBB11_4:
				; LA64-NEXT: xor $a0, $a3, $a1
				; LA64-NEXT: sltui $a0, $a0, 1
				; LA64-NEXT: ret
				%tmp = cmpxchg ptr %ptr, i64 %cmp, i64 %val acquire acquire
				%res = extractvalue { i64, i1 } %tmp, 1
				ret i1 %res
				}

This is an archive of the discontinued LLVM Phabricator instance.

[LoongArch] Add codegen support for cmpxchg on LA64
ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 471149

llvm/include/llvm/IR/IntrinsicsLoongArch.td

llvm/lib/Target/LoongArch/LoongArchExpandAtomicPseudoInsts.cpp

llvm/lib/Target/LoongArch/LoongArchISelLowering.h

llvm/lib/Target/LoongArch/LoongArchISelLowering.cpp

llvm/lib/Target/LoongArch/LoongArchInstrInfo.td

llvm/test/CodeGen/LoongArch/ir-instruction/atomic-cmpxchg.ll

This is an archive of the discontinued LLVM Phabricator instance.

[LoongArch] Add codegen support for cmpxchg on LA64ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 471149

llvm/include/llvm/IR/IntrinsicsLoongArch.td

llvm/lib/Target/LoongArch/LoongArchExpandAtomicPseudoInsts.cpp

llvm/lib/Target/LoongArch/LoongArchISelLowering.h

llvm/lib/Target/LoongArch/LoongArchISelLowering.cpp

llvm/lib/Target/LoongArch/LoongArchInstrInfo.td

llvm/test/CodeGen/LoongArch/ir-instruction/atomic-cmpxchg.ll

[LoongArch] Add codegen support for cmpxchg on LA64
ClosedPublic