Diff 392121

llvm/lib/Target/SystemZ/SystemZISelLowering.h

Show First 20 Lines • Show All 120 Lines • ▼ Show 20 Lines	enum NodeType : unsigned {
NC,		NC,
OC,		OC,
XC,		XC,

// Use CLC to compare two blocks of memory, with the same comments		// Use CLC to compare two blocks of memory, with the same comments
// as for MVC.		// as for MVC.
CLC,		CLC,

		// Use MVC to set a block of memory after storing the first byte.
		MEMSET_MVC,

// Use an MVST-based sequence to implement stpcpy().		// Use an MVST-based sequence to implement stpcpy().
STPCPY,		STPCPY,

// Use a CLST-based sequence to implement strcmp(). The two input operands		// Use a CLST-based sequence to implement strcmp(). The two input operands
// are the addresses of the strings to compare.		// are the addresses of the strings to compare.
STRCMP,		STRCMP,

// Use an SRST-based sequence to search a block of memory. The first		// Use an SRST-based sequence to search a block of memory. The first
▲ Show 20 Lines • Show All 567 Lines • ▼ Show 20 Lines	private:
MachineBasicBlock *emitAtomicLoadMinMax(MachineInstr &MI,		MachineBasicBlock *emitAtomicLoadMinMax(MachineInstr &MI,
MachineBasicBlock *MBB,		MachineBasicBlock *MBB,
unsigned CompareOpcode,		unsigned CompareOpcode,
unsigned KeepOldMask,		unsigned KeepOldMask,
unsigned BitSize) const;		unsigned BitSize) const;
MachineBasicBlock *emitAtomicCmpSwapW(MachineInstr &MI,		MachineBasicBlock *emitAtomicCmpSwapW(MachineInstr &MI,
MachineBasicBlock *BB) const;		MachineBasicBlock *BB) const;
MachineBasicBlock emitMemMemWrapper(MachineInstr &MI, MachineBasicBlock BB,		MachineBasicBlock emitMemMemWrapper(MachineInstr &MI, MachineBasicBlock BB,
unsigned Opcode) const;		unsigned Opcode,
		bool IsMemset = false) const;
MachineBasicBlock emitStringWrapper(MachineInstr &MI, MachineBasicBlock BB,		MachineBasicBlock emitStringWrapper(MachineInstr &MI, MachineBasicBlock BB,
unsigned Opcode) const;		unsigned Opcode) const;
MachineBasicBlock *emitTransactionBegin(MachineInstr &MI,		MachineBasicBlock *emitTransactionBegin(MachineInstr &MI,
MachineBasicBlock *MBB,		MachineBasicBlock *MBB,
unsigned Opcode, bool NoFloat) const;		unsigned Opcode, bool NoFloat) const;
MachineBasicBlock *emitLoadAndTestCmp0(MachineInstr &MI,		MachineBasicBlock *emitLoadAndTestCmp0(MachineInstr &MI,
MachineBasicBlock *MBB,		MachineBasicBlock *MBB,
unsigned Opcode) const;		unsigned Opcode) const;
Show All 30 Lines

llvm/lib/Target/SystemZ/SystemZISelLowering.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 5,708 Lines • ▼ Show 20 Lines	switch ((SystemZISD::NodeType)Opcode) {
OPCODE(ADDCARRY);		OPCODE(ADDCARRY);
OPCODE(SUBCARRY);		OPCODE(SUBCARRY);
OPCODE(GET_CCMASK);		OPCODE(GET_CCMASK);
OPCODE(MVC);		OPCODE(MVC);
OPCODE(NC);		OPCODE(NC);
OPCODE(OC);		OPCODE(OC);
OPCODE(XC);		OPCODE(XC);
OPCODE(CLC);		OPCODE(CLC);
		OPCODE(MEMSET_MVC);
OPCODE(STPCPY);		OPCODE(STPCPY);
OPCODE(STRCMP);		OPCODE(STRCMP);
OPCODE(SEARCH_STRING);		OPCODE(SEARCH_STRING);
OPCODE(IPM);		OPCODE(IPM);
OPCODE(MEMBARRIER);		OPCODE(MEMBARRIER);
OPCODE(TBEGIN);		OPCODE(TBEGIN);
OPCODE(TBEGIN_NOFLOAT);		OPCODE(TBEGIN_NOFLOAT);
OPCODE(TEND);		OPCODE(TEND);
▲ Show 20 Lines • Show All 2,130 Lines • ▼ Show 20 Lines	MachineBasicBlock *SystemZTargetLowering::emitExt128(MachineInstr &MI,
}		}
BuildMI(*MBB, MI, DL, TII->get(TargetOpcode::INSERT_SUBREG), Dest)		BuildMI(*MBB, MI, DL, TII->get(TargetOpcode::INSERT_SUBREG), Dest)
.addReg(In128).addReg(Src).addImm(SystemZ::subreg_l64);		.addReg(In128).addReg(Src).addImm(SystemZ::subreg_l64);

MI.eraseFromParent();		MI.eraseFromParent();
return MBB;		return MBB;
}		}

MachineBasicBlock *SystemZTargetLowering::emitMemMemWrapper(		MachineBasicBlock *
MachineInstr &MI, MachineBasicBlock *MBB, unsigned Opcode) const {		SystemZTargetLowering::emitMemMemWrapper(MachineInstr &MI,
		MachineBasicBlock *MBB,
		unsigned Opcode, bool IsMemset) const {
MachineFunction &MF = *MBB->getParent();		MachineFunction &MF = *MBB->getParent();
const SystemZInstrInfo *TII =		const SystemZInstrInfo *TII =
static_cast<const SystemZInstrInfo *>(Subtarget.getInstrInfo());		static_cast<const SystemZInstrInfo *>(Subtarget.getInstrInfo());
MachineRegisterInfo &MRI = MF.getRegInfo();		MachineRegisterInfo &MRI = MF.getRegInfo();
DebugLoc DL = MI.getDebugLoc();		DebugLoc DL = MI.getDebugLoc();

MachineOperand DestBase = earlyUseOperand(MI.getOperand(0));		MachineOperand DestBase = earlyUseOperand(MI.getOperand(0));
uint64_t DestDisp = MI.getOperand(1).getImm();		uint64_t DestDisp = MI.getOperand(1).getImm();
MachineOperand SrcBase = earlyUseOperand(MI.getOperand(2));		MachineOperand SrcBase = MachineOperand::CreateReg(0U, false);
uint64_t SrcDisp = MI.getOperand(3).getImm();		uint64_t SrcDisp;
MachineOperand &LengthMO = MI.getOperand(4);
		// Fold the displacement Disp if it is out of range.
		auto foldDisplIfNeeded = [&](MachineOperand &Base, uint64_t &Disp) -> void {
		if (!isUInt<12>(Disp)) {
		uweigandUnsubmitted Done Reply Inline Actions Minor nit: this should use `!isUInt<12>(Disp)` like elsewhere. uweigand: Minor nit: this should use `!isUInt<12>(Disp)` like elsewhere.
		Register Reg = MRI.createVirtualRegister(&SystemZ::ADDR64BitRegClass);
		unsigned Opcode = TII->getOpcodeForOffset(SystemZ::LA, Disp);
		BuildMI(*MI.getParent(), MI, MI.getDebugLoc(), TII->get(Opcode), Reg)
		.add(Base).addImm(Disp).addReg(0);
		Base = MachineOperand::CreateReg(Reg, false);
		Disp = 0;
		}
		};

		if (!IsMemset) {
		SrcBase = earlyUseOperand(MI.getOperand(2));
		SrcDisp = MI.getOperand(3).getImm();
		} else {
		SrcBase = DestBase;
		SrcDisp = DestDisp++;
		foldDisplIfNeeded(DestBase, DestDisp);
		}

		MachineOperand &LengthMO = MI.getOperand(IsMemset ? 2 : 4);
bool IsImmForm = LengthMO.isImm();		bool IsImmForm = LengthMO.isImm();
bool IsRegForm = !IsImmForm;		bool IsRegForm = !IsImmForm;

		// Build and insert one Opcode of Length, with special treatment for memset.
		auto insertMemMemOp = [&](MachineBasicBlock *InsMBB,
		MachineBasicBlock::iterator InsPos,
		MachineOperand DBase, uint64_t DDisp,
		MachineOperand SBase, uint64_t SDisp,
		unsigned Length) -> void {
		assert(Length > 0 && Length <= 256 && "Building memory op with bad length.");
		if (IsMemset) {
		MachineOperand ByteMO = earlyUseOperand(MI.getOperand(3));
		if (ByteMO.isImm())
		BuildMI(*InsMBB, InsPos, DL, TII->get(SystemZ::MVI))
		.add(SBase).addImm(SDisp).add(ByteMO);
		else
		BuildMI(*InsMBB, InsPos, DL, TII->get(SystemZ::STC))
		.add(ByteMO).add(SBase).addImm(SDisp).addReg(0);
		if (--Length == 0)
		return;
		}
		BuildMI(*MBB, InsPos, DL, TII->get(Opcode))
		.add(DBase).addImm(DDisp).addImm(Length)
		.add(SBase).addImm(SDisp)
		.setMemRefs(MI.memoperands());
		};

bool NeedsLoop = false;		bool NeedsLoop = false;
uint64_t ImmLength = 0;		uint64_t ImmLength = 0;
Register LenMinus1Reg = SystemZ::NoRegister;		Register LenAdjReg = SystemZ::NoRegister;
if (IsImmForm) {		if (IsImmForm) {
ImmLength = LengthMO.getImm();		ImmLength = LengthMO.getImm();
ImmLength++; // Add back the '1' subtracted originally.		ImmLength += IsMemset ? 2 : 1; // Add back the subtracted adjustment.
if (ImmLength == 0) {		if (ImmLength == 0) {
MI.eraseFromParent();		MI.eraseFromParent();
return MBB;		return MBB;
}		}
if (Opcode == SystemZ::CLC) {		if (Opcode == SystemZ::CLC) {
if (ImmLength > 3 * 256)		if (ImmLength > 3 * 256)
// A two-CLC sequence is a clear win over a loop, not least because		// A two-CLC sequence is a clear win over a loop, not least because
// it needs only one branch. A three-CLC sequence needs the same		// it needs only one branch. A three-CLC sequence needs the same
// number of branches as a loop (i.e. 2), but is shorter. That		// number of branches as a loop (i.e. 2), but is shorter. That
// brings us to lengths greater than 768 bytes. It seems relatively		// brings us to lengths greater than 768 bytes. It seems relatively
// likely that a difference will be found within the first 768 bytes,		// likely that a difference will be found within the first 768 bytes,
// so we just optimize for the smallest number of branch		// so we just optimize for the smallest number of branch
// instructions, in order to avoid polluting the prediction buffer		// instructions, in order to avoid polluting the prediction buffer
// too much.		// too much.
NeedsLoop = true;		NeedsLoop = true;
} else if (ImmLength > 6 * 256)		} else if (ImmLength > 6 * 256)
// The heuristic we use is to prefer loops for anything that would		// The heuristic we use is to prefer loops for anything that would
// require 7 or more MVCs. With these kinds of sizes there isn't much		// require 7 or more MVCs. With these kinds of sizes there isn't much
// to choose between straight-line code and looping code, since the		// to choose between straight-line code and looping code, since the
// time will be dominated by the MVCs themselves.		// time will be dominated by the MVCs themselves.
NeedsLoop = true;		NeedsLoop = true;
} else {		} else {
NeedsLoop = true;		NeedsLoop = true;
LenMinus1Reg = LengthMO.getReg();		LenAdjReg = LengthMO.getReg();
}		}

// When generating more than one CLC, all but the last will need to		// When generating more than one CLC, all but the last will need to
// branch to the end when a difference is found.		// branch to the end when a difference is found.
MachineBasicBlock *EndMBB =		MachineBasicBlock *EndMBB =
(Opcode == SystemZ::CLC && (ImmLength > 256 \|\| NeedsLoop)		(Opcode == SystemZ::CLC && (ImmLength > 256 \|\| NeedsLoop)
? SystemZ::splitBlockAfter(MI, MBB)		? SystemZ::splitBlockAfter(MI, MBB)
: nullptr);		: nullptr);

if (NeedsLoop) {		if (NeedsLoop) {
Register StartCountReg =		Register StartCountReg =
MRI.createVirtualRegister(&SystemZ::GR64BitRegClass);		MRI.createVirtualRegister(&SystemZ::GR64BitRegClass);
if (IsImmForm) {		if (IsImmForm) {
TII->loadImmediate(*MBB, MI, StartCountReg, ImmLength / 256);		TII->loadImmediate(*MBB, MI, StartCountReg, ImmLength / 256);
ImmLength &= 255;		ImmLength &= 255;
} else {		} else {
BuildMI(*MBB, MI, DL, TII->get(SystemZ::SRLG), StartCountReg)		BuildMI(*MBB, MI, DL, TII->get(SystemZ::SRLG), StartCountReg)
.addReg(LenMinus1Reg)		.addReg(LenAdjReg)
.addReg(0)		.addReg(0)
.addImm(8);		.addImm(8);
}		}

		bool HaveSingleBase = DestBase.isIdenticalTo(SrcBase);
		uweigandUnsubmitted Not Done Reply Inline Actions Was this line moved deliberately? uweigand: Was this line moved deliberately?
		jonpaAuthorUnsubmitted Done Reply Inline Actions yes, I thought that looked a little better, but it doesn't matter that much... jonpa: yes, I thought that looked a little better, but it doesn't matter that much...
		uweigandUnsubmitted Done Reply Inline Actions OK, that's fine with me then. uweigand: OK, that's fine with me then.
auto loadZeroAddress = [&]() -> MachineOperand {		auto loadZeroAddress = [&]() -> MachineOperand {
Register Reg = MRI.createVirtualRegister(&SystemZ::ADDR64BitRegClass);		Register Reg = MRI.createVirtualRegister(&SystemZ::ADDR64BitRegClass);
BuildMI(*MBB, MI, DL, TII->get(SystemZ::LGHI), Reg).addImm(0);		BuildMI(*MBB, MI, DL, TII->get(SystemZ::LGHI), Reg).addImm(0);
return MachineOperand::CreateReg(Reg, false);		return MachineOperand::CreateReg(Reg, false);
};		};
bool HaveSingleBase = DestBase.isIdenticalTo(SrcBase);
if (DestBase.isReg() && DestBase.getReg() == SystemZ::NoRegister)		if (DestBase.isReg() && DestBase.getReg() == SystemZ::NoRegister)
DestBase = loadZeroAddress();		DestBase = loadZeroAddress();
if (SrcBase.isReg() && SrcBase.getReg() == SystemZ::NoRegister)		if (SrcBase.isReg() && SrcBase.getReg() == SystemZ::NoRegister)
SrcBase = HaveSingleBase ? DestBase : loadZeroAddress();		SrcBase = HaveSingleBase ? DestBase : loadZeroAddress();

MachineBasicBlock *StartMBB = nullptr;		MachineBasicBlock *StartMBB = nullptr;
MachineBasicBlock *LoopMBB = nullptr;		MachineBasicBlock *LoopMBB = nullptr;
MachineBasicBlock *NextMBB = nullptr;		MachineBasicBlock *NextMBB = nullptr;
Show All 18 Lines	if (NeedsLoop) {
if (IsRegForm) {		if (IsRegForm) {
AllDoneMBB = SystemZ::splitBlockBefore(MI, MBB);		AllDoneMBB = SystemZ::splitBlockBefore(MI, MBB);
StartMBB = SystemZ::emitBlockAfter(MBB);		StartMBB = SystemZ::emitBlockAfter(MBB);
LoopMBB = SystemZ::emitBlockAfter(StartMBB);		LoopMBB = SystemZ::emitBlockAfter(StartMBB);
NextMBB = (EndMBB ? SystemZ::emitBlockAfter(LoopMBB) : LoopMBB);		NextMBB = (EndMBB ? SystemZ::emitBlockAfter(LoopMBB) : LoopMBB);
DoneMBB = SystemZ::emitBlockAfter(NextMBB);		DoneMBB = SystemZ::emitBlockAfter(NextMBB);

// MBB:		// MBB:
// # Jump to AllDoneMBB if LenMinus1Reg is -1, or fall thru to StartMBB.		// # Jump to AllDoneMBB if LenAdjReg means 0, or fall thru to StartMBB.
BuildMI(MBB, DL, TII->get(SystemZ::CGHI))		BuildMI(MBB, DL, TII->get(SystemZ::CGHI))
.addReg(LenMinus1Reg).addImm(-1);		.addReg(LenAdjReg).addImm(IsMemset ? -2 : -1);
BuildMI(MBB, DL, TII->get(SystemZ::BRC))		BuildMI(MBB, DL, TII->get(SystemZ::BRC))
.addImm(SystemZ::CCMASK_ICMP).addImm(SystemZ::CCMASK_CMP_EQ)		.addImm(SystemZ::CCMASK_ICMP).addImm(SystemZ::CCMASK_CMP_EQ)
.addMBB(AllDoneMBB);		.addMBB(AllDoneMBB);
MBB->addSuccessor(AllDoneMBB);		MBB->addSuccessor(AllDoneMBB);
		if (!IsMemset)
MBB->addSuccessor(StartMBB);		MBB->addSuccessor(StartMBB);
		else {
		// MemsetOneCheckMBB:
		// # Jump to MemsetOneMBB for a memset of length 1, or
		// # fall thru to StartMBB.
		MachineBasicBlock *MemsetOneCheckMBB = SystemZ::emitBlockAfter(MBB);
		MachineBasicBlock MemsetOneMBB = SystemZ::emitBlockAfter(&MF.rbegin());
		MBB->addSuccessor(MemsetOneCheckMBB);
		MBB = MemsetOneCheckMBB;
		BuildMI(MBB, DL, TII->get(SystemZ::CGHI))
		.addReg(LenAdjReg).addImm(-1);
		BuildMI(MBB, DL, TII->get(SystemZ::BRC))
		.addImm(SystemZ::CCMASK_ICMP).addImm(SystemZ::CCMASK_CMP_EQ)
		.addMBB(MemsetOneMBB);
		MBB->addSuccessor(MemsetOneMBB, {10, 100});
		MBB->addSuccessor(StartMBB, {90, 100});

		// MemsetOneMBB:
		// # Jump back to AllDoneMBB after a single MVI or STC.
		MBB = MemsetOneMBB;
		insertMemMemOp(MBB, MBB->end(),
		MachineOperand::CreateReg(StartDestReg, false), DestDisp,
		MachineOperand::CreateReg(StartSrcReg, false), SrcDisp,
		1);
		BuildMI(MBB, DL, TII->get(SystemZ::J)).addMBB(AllDoneMBB);
		MBB->addSuccessor(AllDoneMBB);
		}

// StartMBB:		// StartMBB:
// # Jump to DoneMBB if %StartCountReg is zero, or fall through to LoopMBB.		// # Jump to DoneMBB if %StartCountReg is zero, or fall through to LoopMBB.
MBB = StartMBB;		MBB = StartMBB;
BuildMI(MBB, DL, TII->get(SystemZ::CGHI))		BuildMI(MBB, DL, TII->get(SystemZ::CGHI))
.addReg(StartCountReg).addImm(0);		.addReg(StartCountReg).addImm(0);
BuildMI(MBB, DL, TII->get(SystemZ::BRC))		BuildMI(MBB, DL, TII->get(SystemZ::BRC))
.addImm(SystemZ::CCMASK_ICMP).addImm(SystemZ::CCMASK_CMP_EQ)		.addImm(SystemZ::CCMASK_ICMP).addImm(SystemZ::CCMASK_CMP_EQ)
Show All 40 Lines	if (!HaveSingleBase)
.addReg(StartSrcReg).addMBB(StartMBB)		.addReg(StartSrcReg).addMBB(StartMBB)
.addReg(NextSrcReg).addMBB(NextMBB);		.addReg(NextSrcReg).addMBB(NextMBB);
BuildMI(MBB, DL, TII->get(SystemZ::PHI), ThisCountReg)		BuildMI(MBB, DL, TII->get(SystemZ::PHI), ThisCountReg)
.addReg(StartCountReg).addMBB(StartMBB)		.addReg(StartCountReg).addMBB(StartMBB)
.addReg(NextCountReg).addMBB(NextMBB);		.addReg(NextCountReg).addMBB(NextMBB);
if (Opcode == SystemZ::MVC)		if (Opcode == SystemZ::MVC)
BuildMI(MBB, DL, TII->get(SystemZ::PFD))		BuildMI(MBB, DL, TII->get(SystemZ::PFD))
.addImm(SystemZ::PFD_WRITE)		.addImm(SystemZ::PFD_WRITE)
.addReg(ThisDestReg).addImm(DestDisp + 768).addReg(0);		.addReg(ThisDestReg).addImm(DestDisp - IsMemset + 768).addReg(0);
BuildMI(MBB, DL, TII->get(Opcode))		insertMemMemOp(MBB, MBB->end(),
.addReg(ThisDestReg).addImm(DestDisp).addImm(256)		MachineOperand::CreateReg(ThisDestReg, false), DestDisp,
.addReg(ThisSrcReg).addImm(SrcDisp);		MachineOperand::CreateReg(ThisSrcReg, false), SrcDisp, 256);
if (EndMBB) {		if (EndMBB) {
BuildMI(MBB, DL, TII->get(SystemZ::BRC))		BuildMI(MBB, DL, TII->get(SystemZ::BRC))
.addImm(SystemZ::CCMASK_ICMP).addImm(SystemZ::CCMASK_CMP_NE)		.addImm(SystemZ::CCMASK_ICMP).addImm(SystemZ::CCMASK_CMP_NE)
.addMBB(EndMBB);		.addMBB(EndMBB);
MBB->addSuccessor(EndMBB);		MBB->addSuccessor(EndMBB);
MBB->addSuccessor(NextMBB);		MBB->addSuccessor(NextMBB);
}		}

Show All 23 Lines	if (NeedsLoop) {
MBB->addSuccessor(DoneMBB);		MBB->addSuccessor(DoneMBB);

MBB = DoneMBB;		MBB = DoneMBB;
if (IsRegForm) {		if (IsRegForm) {
// DoneMBB:		// DoneMBB:
// # Make PHIs for RemDestReg/RemSrcReg as the loop may or may not run.		// # Make PHIs for RemDestReg/RemSrcReg as the loop may or may not run.
// # Use EXecute Relative Long for the remainder of the bytes. The target		// # Use EXecute Relative Long for the remainder of the bytes. The target
// instruction of the EXRL will have a length field of 1 since 0 is an		// instruction of the EXRL will have a length field of 1 since 0 is an
// illegal value. The number of bytes processed becomes (%LenMinus1Reg &		// illegal value. The number of bytes processed becomes (%LenAdjReg &
// 0xff) + 1.		// 0xff) + 1.
// # Fall through to AllDoneMBB.		// # Fall through to AllDoneMBB.
Register RemSrcReg = MRI.createVirtualRegister(&SystemZ::ADDR64BitRegClass);		Register RemSrcReg = MRI.createVirtualRegister(&SystemZ::ADDR64BitRegClass);
Register RemDestReg = HaveSingleBase ? RemSrcReg		Register RemDestReg = HaveSingleBase ? RemSrcReg
: MRI.createVirtualRegister(&SystemZ::ADDR64BitRegClass);		: MRI.createVirtualRegister(&SystemZ::ADDR64BitRegClass);
BuildMI(MBB, DL, TII->get(SystemZ::PHI), RemDestReg)		BuildMI(MBB, DL, TII->get(SystemZ::PHI), RemDestReg)
.addReg(StartDestReg).addMBB(StartMBB)		.addReg(StartDestReg).addMBB(StartMBB)
.addReg(NextDestReg).addMBB(NextMBB);		.addReg(NextDestReg).addMBB(NextMBB);
if (!HaveSingleBase)		if (!HaveSingleBase)
BuildMI(MBB, DL, TII->get(SystemZ::PHI), RemSrcReg)		BuildMI(MBB, DL, TII->get(SystemZ::PHI), RemSrcReg)
.addReg(StartSrcReg).addMBB(StartMBB)		.addReg(StartSrcReg).addMBB(StartMBB)
.addReg(NextSrcReg).addMBB(NextMBB);		.addReg(NextSrcReg).addMBB(NextMBB);
		if (IsMemset)
		insertMemMemOp(MBB, MBB->end(),
		MachineOperand::CreateReg(RemDestReg, false), DestDisp,
		MachineOperand::CreateReg(RemSrcReg, false), SrcDisp, 1);
MachineInstrBuilder EXRL_MIB =		MachineInstrBuilder EXRL_MIB =
BuildMI(MBB, DL, TII->get(SystemZ::EXRL_Pseudo))		BuildMI(MBB, DL, TII->get(SystemZ::EXRL_Pseudo))
.addImm(Opcode)		.addImm(Opcode)
.addReg(LenMinus1Reg)		.addReg(LenAdjReg)
.addReg(RemDestReg).addImm(DestDisp)		.addReg(RemDestReg).addImm(DestDisp)
.addReg(RemSrcReg).addImm(SrcDisp);		.addReg(RemSrcReg).addImm(SrcDisp);
MBB->addSuccessor(AllDoneMBB);		MBB->addSuccessor(AllDoneMBB);
MBB = AllDoneMBB;		MBB = AllDoneMBB;
if (EndMBB) {		if (EndMBB) {
EXRL_MIB.addReg(SystemZ::CC, RegState::ImplicitDefine);		EXRL_MIB.addReg(SystemZ::CC, RegState::ImplicitDefine);
MBB->addLiveIn(SystemZ::CC);		MBB->addLiveIn(SystemZ::CC);
}		}
}		}
}		}

// Handle any remaining bytes with straight-line code.		// Handle any remaining bytes with straight-line code.
while (ImmLength > 0) {		while (ImmLength > 0) {
uint64_t ThisLength = std::min(ImmLength, uint64_t(256));		uint64_t ThisLength = std::min(ImmLength, uint64_t(256));
// The previous iteration might have created out-of-range displacements.		// The previous iteration might have created out-of-range displacements.
// Apply them using LAY if so.		// Apply them using LA/LAY if so.
if (!isUInt<12>(DestDisp)) {		foldDisplIfNeeded(DestBase, DestDisp);
Register Reg = MRI.createVirtualRegister(&SystemZ::ADDR64BitRegClass);		foldDisplIfNeeded(SrcBase, SrcDisp);
BuildMI(*MBB, MI, MI.getDebugLoc(), TII->get(SystemZ::LAY), Reg)		insertMemMemOp(MBB, MI, DestBase, DestDisp, SrcBase, SrcDisp, ThisLength);
.add(DestBase)
.addImm(DestDisp)
.addReg(0);
DestBase = MachineOperand::CreateReg(Reg, false);
DestDisp = 0;
}
if (!isUInt<12>(SrcDisp)) {
Register Reg = MRI.createVirtualRegister(&SystemZ::ADDR64BitRegClass);
BuildMI(*MBB, MI, MI.getDebugLoc(), TII->get(SystemZ::LAY), Reg)
.add(SrcBase)
.addImm(SrcDisp)
.addReg(0);
SrcBase = MachineOperand::CreateReg(Reg, false);
SrcDisp = 0;
}
BuildMI(*MBB, MI, DL, TII->get(Opcode))
.add(DestBase)
.addImm(DestDisp)
.addImm(ThisLength)
.add(SrcBase)
.addImm(SrcDisp)
.setMemRefs(MI.memoperands());
DestDisp += ThisLength;		DestDisp += ThisLength;
SrcDisp += ThisLength;		SrcDisp += ThisLength;
ImmLength -= ThisLength;		ImmLength -= ThisLength;
// If there's another CLC to go, branch to the end if a difference		// If there's another CLC to go, branch to the end if a difference
// was found.		// was found.
if (EndMBB && ImmLength > 0) {		if (EndMBB && ImmLength > 0) {
MachineBasicBlock *NextMBB = SystemZ::splitBlockBefore(MI, MBB);		MachineBasicBlock *NextMBB = SystemZ::splitBlockBefore(MI, MBB);
BuildMI(MBB, DL, TII->get(SystemZ::BRC))		BuildMI(MBB, DL, TII->get(SystemZ::BRC))
▲ Show 20 Lines • Show All 481 Lines • ▼ Show 20 Lines	MachineBasicBlock *SystemZTargetLowering::EmitInstrWithCustomInserter(
case SystemZ::OCImm:		case SystemZ::OCImm:
return emitMemMemWrapper(MI, MBB, SystemZ::OC);		return emitMemMemWrapper(MI, MBB, SystemZ::OC);
case SystemZ::XCImm:		case SystemZ::XCImm:
case SystemZ::XCReg:		case SystemZ::XCReg:
return emitMemMemWrapper(MI, MBB, SystemZ::XC);		return emitMemMemWrapper(MI, MBB, SystemZ::XC);
case SystemZ::CLCImm:		case SystemZ::CLCImm:
case SystemZ::CLCReg:		case SystemZ::CLCReg:
return emitMemMemWrapper(MI, MBB, SystemZ::CLC);		return emitMemMemWrapper(MI, MBB, SystemZ::CLC);
		case SystemZ::MemsetImmImm:
		case SystemZ::MemsetImmReg:
		case SystemZ::MemsetRegImm:
		case SystemZ::MemsetRegReg:
		return emitMemMemWrapper(MI, MBB, SystemZ::MVC, true/IsMemset/);
case SystemZ::CLSTLoop:		case SystemZ::CLSTLoop:
return emitStringWrapper(MI, MBB, SystemZ::CLST);		return emitStringWrapper(MI, MBB, SystemZ::CLST);
case SystemZ::MVSTLoop:		case SystemZ::MVSTLoop:
return emitStringWrapper(MI, MBB, SystemZ::MVST);		return emitStringWrapper(MI, MBB, SystemZ::MVST);
case SystemZ::SRSTLoop:		case SystemZ::SRSTLoop:
return emitStringWrapper(MI, MBB, SystemZ::SRST);		return emitStringWrapper(MI, MBB, SystemZ::SRST);
case SystemZ::TBEGIN:		case SystemZ::TBEGIN:
return emitTransactionBegin(MI, MBB, SystemZ::TBEGIN, false);		return emitTransactionBegin(MI, MBB, SystemZ::TBEGIN, false);
Show All 31 Lines

llvm/lib/Target/SystemZ/SystemZInstrFormats.td

	Show First 20 Lines • Show All 5,250 Lines • ▼ Show 20 Lines
	// An alias of a RotateSelectRIEf, but with different register sizes.			// An alias of a RotateSelectRIEf, but with different register sizes.
	class RotateSelectAliasRIEf<RegisterOperand cls1, RegisterOperand cls2>			class RotateSelectAliasRIEf<RegisterOperand cls1, RegisterOperand cls2>
	: Alias<6, (outs cls1:$R1),			: Alias<6, (outs cls1:$R1),
	(ins cls1:$R1src, cls2:$R2, imm32zx8:$I3, imm32zx8:$I4,			(ins cls1:$R1src, cls2:$R2, imm32zx8:$I3, imm32zx8:$I4,
	imm32zx6:$I5), []> {			imm32zx6:$I5), []> {
	let Constraints = "$R1 = $R1src";			let Constraints = "$R1 = $R1src";
	}			}

				class MemsetPseudo<DAGOperand lenop, DAGOperand byteop>
				: Pseudo<(outs), (ins bdaddr12only:$dest, lenop:$length, byteop:$B),
				[(z_memset_mvc bdaddr12only:$dest, lenop:$length, byteop:$B)]> {
				let Defs = [CC];
				let mayLoad = 1;
				let mayStore = 1;
				let usesCustomInserter = 1;
				let hasNoSchedulingInfo = 1;
				}

	//===----------------------------------------------------------------------===//			//===----------------------------------------------------------------------===//
	// Multiclasses that emit both real and pseudo instructions			// Multiclasses that emit both real and pseudo instructions
	//===----------------------------------------------------------------------===//			//===----------------------------------------------------------------------===//

	multiclass BinaryRXYAndPseudo<string mnemonic, bits<16> opcode,			multiclass BinaryRXYAndPseudo<string mnemonic, bits<16> opcode,
	SDPatternOperator operator, RegisterOperand cls,			SDPatternOperator operator, RegisterOperand cls,
	SDPatternOperator load, bits<5> bytes,			SDPatternOperator load, bits<5> bytes,
	AddressingMode mode = bdxaddr20only> {			AddressingMode mode = bdxaddr20only> {
	▲ Show 20 Lines • Show All 114 Lines • Show Last 20 Lines

llvm/lib/Target/SystemZ/SystemZInstrInfo.td

	Show First 20 Lines • Show All 504 Lines • ▼ Show 20 Lines
	let mayLoad = 1, mayStore = 1 in			let mayLoad = 1, mayStore = 1 in
	defm MVC : MemorySS<"mvc", 0xD2, z_mvc>;			defm MVC : MemorySS<"mvc", 0xD2, z_mvc>;
	let mayLoad = 1, mayStore = 1, Defs = [CC] in {			let mayLoad = 1, mayStore = 1, Defs = [CC] in {
	def MVCL : SideEffectBinaryMemMemRR<"mvcl", 0x0E, GR128, GR128>;			def MVCL : SideEffectBinaryMemMemRR<"mvcl", 0x0E, GR128, GR128>;
	def MVCLE : SideEffectTernaryMemMemRS<"mvcle", 0xA8, GR128, GR128>;			def MVCLE : SideEffectTernaryMemMemRS<"mvcle", 0xA8, GR128, GR128>;
	def MVCLU : SideEffectTernaryMemMemRSY<"mvclu", 0xEB8E, GR128, GR128>;			def MVCLU : SideEffectTernaryMemMemRSY<"mvclu", 0xEB8E, GR128, GR128>;
	}			}

				// Memset[Length][Byte] pseudos.
				def MemsetImmImm : MemsetPseudo<imm64, imm32zx8trunc>;
				def MemsetImmReg : MemsetPseudo<imm64, GR32>;
				def MemsetRegImm : MemsetPseudo<ADDR64, imm32zx8trunc>;
				def MemsetRegReg : MemsetPseudo<ADDR64, GR32>;

	// Move right.			// Move right.
	let Predicates = [FeatureMiscellaneousExtensions3],			let Predicates = [FeatureMiscellaneousExtensions3],
	mayLoad = 1, mayStore = 1, Uses = [R0L] in			mayLoad = 1, mayStore = 1, Uses = [R0L] in
	def MVCRL : SideEffectBinarySSE<"mvcrl", 0xE50A>;			def MVCRL : SideEffectBinarySSE<"mvcrl", 0xE50A>;

	// String moves.			// String moves.
	let mayLoad = 1, mayStore = 1, Defs = [CC] in			let mayLoad = 1, mayStore = 1, Defs = [CC] in
	defm MVST : StringRRE<"mvst", 0xB255, z_stpcpy>;			defm MVST : StringRRE<"mvst", 0xB255, z_stpcpy>;
	▲ Show 20 Lines • Show All 1,870 Lines • Show Last 20 Lines

llvm/lib/Target/SystemZ/SystemZOperators.td

Show First 20 Lines • Show All 96 Lines • ▼ Show 20 Lines	def SDT_ZMemMemLength : SDTypeProfile<0, 3,
[SDTCisPtrTy<0>,		[SDTCisPtrTy<0>,
SDTCisPtrTy<1>,		SDTCisPtrTy<1>,
SDTCisVT<2, i64>]>;		SDTCisVT<2, i64>]>;
def SDT_ZMemMemLengthCC : SDTypeProfile<1, 3,		def SDT_ZMemMemLengthCC : SDTypeProfile<1, 3,
[SDTCisVT<0, i32>,		[SDTCisVT<0, i32>,
SDTCisPtrTy<1>,		SDTCisPtrTy<1>,
SDTCisPtrTy<2>,		SDTCisPtrTy<2>,
SDTCisVT<3, i64>]>;		SDTCisVT<3, i64>]>;
		def SDT_ZMemsetMVC : SDTypeProfile<0, 3,
		[SDTCisPtrTy<0>,
		SDTCisVT<1, i64>,
		SDTCisVT<2, i32>]>;
def SDT_ZString : SDTypeProfile<1, 3,		def SDT_ZString : SDTypeProfile<1, 3,
[SDTCisPtrTy<0>,		[SDTCisPtrTy<0>,
SDTCisPtrTy<1>,		SDTCisPtrTy<1>,
SDTCisPtrTy<2>,		SDTCisPtrTy<2>,
SDTCisVT<3, i32>]>;		SDTCisVT<3, i32>]>;
def SDT_ZStringCC : SDTypeProfile<2, 3,		def SDT_ZStringCC : SDTypeProfile<2, 3,
[SDTCisPtrTy<0>,		[SDTCisPtrTy<0>,
SDTCisVT<1, i32>,		SDTCisVT<1, i32>,
▲ Show 20 Lines • Show All 295 Lines • ▼ Show 20 Lines
def z_nc : SDNode<"SystemZISD::NC", SDT_ZMemMemLength,		def z_nc : SDNode<"SystemZISD::NC", SDT_ZMemMemLength,
[SDNPHasChain, SDNPMayStore, SDNPMayLoad]>;		[SDNPHasChain, SDNPMayStore, SDNPMayLoad]>;
def z_oc : SDNode<"SystemZISD::OC", SDT_ZMemMemLength,		def z_oc : SDNode<"SystemZISD::OC", SDT_ZMemMemLength,
[SDNPHasChain, SDNPMayStore, SDNPMayLoad]>;		[SDNPHasChain, SDNPMayStore, SDNPMayLoad]>;
def z_xc : SDNode<"SystemZISD::XC", SDT_ZMemMemLength,		def z_xc : SDNode<"SystemZISD::XC", SDT_ZMemMemLength,
[SDNPHasChain, SDNPMayStore, SDNPMayLoad]>;		[SDNPHasChain, SDNPMayStore, SDNPMayLoad]>;
def z_clc : SDNode<"SystemZISD::CLC", SDT_ZMemMemLengthCC,		def z_clc : SDNode<"SystemZISD::CLC", SDT_ZMemMemLengthCC,
[SDNPHasChain, SDNPMayLoad]>;		[SDNPHasChain, SDNPMayLoad]>;
		def z_memset_mvc : SDNode<"SystemZISD::MEMSET_MVC", SDT_ZMemsetMVC,
		[SDNPHasChain, SDNPMayStore, SDNPMayLoad]>;
def z_strcmp : SDNode<"SystemZISD::STRCMP", SDT_ZStringCC,		def z_strcmp : SDNode<"SystemZISD::STRCMP", SDT_ZStringCC,
[SDNPHasChain, SDNPMayLoad]>;		[SDNPHasChain, SDNPMayLoad]>;
def z_stpcpy : SDNode<"SystemZISD::STPCPY", SDT_ZString,		def z_stpcpy : SDNode<"SystemZISD::STPCPY", SDT_ZString,
[SDNPHasChain, SDNPMayStore, SDNPMayLoad]>;		[SDNPHasChain, SDNPMayStore, SDNPMayLoad]>;
def z_search_string : SDNode<"SystemZISD::SEARCH_STRING", SDT_ZStringCC,		def z_search_string : SDNode<"SystemZISD::SEARCH_STRING", SDT_ZStringCC,
[SDNPHasChain, SDNPMayLoad]>;		[SDNPHasChain, SDNPMayLoad]>;
def z_prefetch : SDNode<"SystemZISD::PREFETCH", SDT_ZPrefetch,		def z_prefetch : SDNode<"SystemZISD::PREFETCH", SDT_ZPrefetch,
[SDNPHasChain, SDNPMayLoad, SDNPMayStore,		[SDNPHasChain, SDNPMayLoad, SDNPMayStore,
▲ Show 20 Lines • Show All 458 Lines • Show Last 20 Lines

llvm/lib/Target/SystemZ/SystemZSelectionDAGInfo.cpp

Show All 11 Lines

#include "SystemZTargetMachine.h"		#include "SystemZTargetMachine.h"
#include "llvm/CodeGen/SelectionDAG.h"		#include "llvm/CodeGen/SelectionDAG.h"

using namespace llvm;		using namespace llvm;

#define DEBUG_TYPE "systemz-selectiondag-info"		#define DEBUG_TYPE "systemz-selectiondag-info"

static SDVTList getMemMemVTs(unsigned Op, SelectionDAG &DAG) {		static unsigned getMemMemLenAdj(unsigned Op) {
return Op == SystemZISD::CLC ? DAG.getVTList(MVT::i32, MVT::Other)		return Op == SystemZISD::MEMSET_MVC ? 2 : 1;
		}

		static SDValue createMemMemNode(SelectionDAG &DAG, const SDLoc &DL, unsigned Op,
		SDValue Chain, SDValue Dst, SDValue Src,
		SDValue LenAdj, SDValue Byte) {
		SDVTList VTs = Op == SystemZISD::CLC ? DAG.getVTList(MVT::i32, MVT::Other)
: DAG.getVTList(MVT::Other);		: DAG.getVTList(MVT::Other);
		SmallVector<SDValue, 6> Ops;
		if (Op == SystemZISD::MEMSET_MVC)
		Ops = { Chain, Dst, LenAdj, Byte };
		else
		Ops = { Chain, Dst, Src, LenAdj };
		return DAG.getNode(Op, DL, VTs, Ops);
}		}

// Emit a mem-mem operation after subtracting one from size, which will be		// Emit a mem-mem operation after subtracting one (or two for memset) from
// added back during pseudo expansion. As the Reg case emitted here may be		// size, which will be added back during pseudo expansion. As the Reg case
// converted by DAGCombiner into having an Imm length, they are both emitted		// emitted here may be converted by DAGCombiner into having an Imm length,
// the same way.		// they are both emitted the same way.
static SDValue emitMemMemImm(SelectionDAG &DAG, const SDLoc &DL, unsigned Op,		static SDValue emitMemMemImm(SelectionDAG &DAG, const SDLoc &DL, unsigned Op,
SDValue Chain, SDValue Dst, SDValue Src,		SDValue Chain, SDValue Dst, SDValue Src,
uint64_t Size) {		uint64_t Size, SDValue Byte = SDValue()) {
return DAG.getNode(Op, DL, getMemMemVTs(Op, DAG), Chain, Dst, Src,		unsigned Adj = getMemMemLenAdj(Op);
DAG.getConstant(Size - 1, DL, Src.getValueType()));		assert(Size >= Adj && "Adjusted length overflow.");
		SDValue LenAdj = DAG.getConstant(Size - Adj, DL, Dst.getValueType());
		return createMemMemNode(DAG, DL, Op, Chain, Dst, Src, LenAdj, Byte);
}		}

static SDValue emitMemMemReg(SelectionDAG &DAG, const SDLoc &DL, unsigned Op,		static SDValue emitMemMemReg(SelectionDAG &DAG, const SDLoc &DL, unsigned Op,
SDValue Chain, SDValue Dst, SDValue Src,		SDValue Chain, SDValue Dst, SDValue Src,
SDValue Size) {		SDValue Size, SDValue Byte = SDValue()) {
SDValue LenMinus1 = DAG.getNode(ISD::ADD, DL, MVT::i64,		int64_t Adj = getMemMemLenAdj(Op);
		SDValue LenAdj = DAG.getNode(ISD::ADD, DL, MVT::i64,
DAG.getZExtOrTrunc(Size, DL, MVT::i64),		DAG.getZExtOrTrunc(Size, DL, MVT::i64),
DAG.getConstant(-1, DL, MVT::i64));		DAG.getConstant(0 - Adj, DL, MVT::i64));
return DAG.getNode(Op, DL, getMemMemVTs(Op, DAG), Chain, Dst, Src, LenMinus1);		return createMemMemNode(DAG, DL, Op, Chain, Dst, Src, LenAdj, Byte);
}		}

SDValue SystemZSelectionDAGInfo::EmitTargetCodeForMemcpy(		SDValue SystemZSelectionDAGInfo::EmitTargetCodeForMemcpy(
SelectionDAG &DAG, const SDLoc &DL, SDValue Chain, SDValue Dst, SDValue Src,		SelectionDAG &DAG, const SDLoc &DL, SDValue Chain, SDValue Dst, SDValue Src,
SDValue Size, Align Alignment, bool IsVolatile, bool AlwaysInline,		SDValue Size, Align Alignment, bool IsVolatile, bool AlwaysInline,
MachinePointerInfo DstPtrInfo, MachinePointerInfo SrcPtrInfo) const {		MachinePointerInfo DstPtrInfo, MachinePointerInfo SrcPtrInfo) const {
if (IsVolatile)		if (IsVolatile)
return SDValue();		return SDValue();
▲ Show 20 Lines • Show All 71 Lines • ▼ Show 20 Lines	if (CByte) {
}		}
}		}
assert(Bytes >= 2 && "Should have dealt with 0- and 1-byte cases already");		assert(Bytes >= 2 && "Should have dealt with 0- and 1-byte cases already");

// Handle the special case of a memset of 0, which can use XC.		// Handle the special case of a memset of 0, which can use XC.
if (CByte && CByte->getZExtValue() == 0)		if (CByte && CByte->getZExtValue() == 0)
return emitMemMemImm(DAG, DL, SystemZISD::XC, Chain, Dst, Dst, Bytes);		return emitMemMemImm(DAG, DL, SystemZISD::XC, Chain, Dst, Dst, Bytes);

// Copy the byte to the first location and then use MVC to copy		return emitMemMemImm(DAG, DL, SystemZISD::MEMSET_MVC, Chain, Dst, SDValue(),
// it to the rest.		Bytes, DAG.getAnyExtOrTrunc(Byte, DL, MVT::i32));
Chain = DAG.getStore(Chain, DL, Byte, Dst, DstPtrInfo, Alignment);
SDValue DstPlus1 = DAG.getNode(ISD::ADD, DL, PtrVT, Dst,
DAG.getConstant(1, DL, PtrVT));
return emitMemMemImm(DAG, DL, SystemZISD::MVC, Chain, DstPlus1, Dst,
Bytes - 1);
}		}

// Variable length		// Variable length
if (CByte && CByte->getZExtValue() == 0)		if (CByte && CByte->getZExtValue() == 0)
// Handle the special case of a variable length memset of 0 with XC.		// Handle the special case of a variable length memset of 0 with XC.
return emitMemMemReg(DAG, DL, SystemZISD::XC, Chain, Dst, Dst, Size);		return emitMemMemReg(DAG, DL, SystemZISD::XC, Chain, Dst, Dst, Size);

return SDValue();		return emitMemMemReg(DAG, DL, SystemZISD::MEMSET_MVC, Chain, Dst, SDValue(),
		Size, DAG.getAnyExtOrTrunc(Byte, DL, MVT::i32));
}		}

// Convert the current CC value into an integer that is 0 if CC == 0,		// Convert the current CC value into an integer that is 0 if CC == 0,
// greater than zero if CC == 1 and less than zero if CC >= 2.		// greater than zero if CC == 1 and less than zero if CC >= 2.
// The sequence starts with IPM, which puts CC into bits 29 and 28		// The sequence starts with IPM, which puts CC into bits 29 and 28
// of an integer and clears bits 30 and 31.		// of an integer and clears bits 30 and 31.
static SDValue addIPMSequence(const SDLoc &DL, SDValue CCReg,		static SDValue addIPMSequence(const SDLoc &DL, SDValue CCReg,
SelectionDAG &DAG) {		SelectionDAG &DAG) {
▲ Show 20 Lines • Show All 106 Lines • Show Last 20 Lines

llvm/test/CodeGen/SystemZ/memset-01.ll

Show First 20 Lines • Show All 81 Lines • ▼ Show 20 Lines	; CHECK: br %r14
call void @llvm.memset.p0i8.i64(i8* %dest, i8 %val, i64 3, i1 false)		call void @llvm.memset.p0i8.i64(i8* %dest, i8 %val, i64 3, i1 false)
ret void		ret void
}		}

; 257 bytes, i32 version.		; 257 bytes, i32 version.
define void @f9(i8* %dest, i8 %val) {		define void @f9(i8* %dest, i8 %val) {
; CHECK-LABEL: f9:		; CHECK-LABEL: f9:
; CHECK: stc %r3, 0(%r2)		; CHECK: stc %r3, 0(%r2)
; CHECK: mvc 1(256,%r2), 0(%r2)		; CHECK: mvc 1(255,%r2), 0(%r2)
		; CHECK: stc %r3, 256(%r2)
; CHECK: br %r14		; CHECK: br %r14
call void @llvm.memset.p0i8.i32(i8* %dest, i8 %val, i32 257, i1 false)		call void @llvm.memset.p0i8.i32(i8* %dest, i8 %val, i32 257, i1 false)
ret void		ret void
}		}

; 257 bytes, i64 version.		; 257 bytes, i64 version.
define void @f10(i8* %dest, i8 %val) {		define void @f10(i8* %dest, i8 %val) {
; CHECK-LABEL: f10:		; CHECK-LABEL: f10:
; CHECK: stc %r3, 0(%r2)		; CHECK: stc %r3, 0(%r2)
; CHECK: mvc 1(256,%r2), 0(%r2)		; CHECK: mvc 1(255,%r2), 0(%r2)
		; CHECK: stc %r3, 256(%r2)
; CHECK: br %r14		; CHECK: br %r14
call void @llvm.memset.p0i8.i64(i8* %dest, i8 %val, i64 257, i1 false)		call void @llvm.memset.p0i8.i64(i8* %dest, i8 %val, i64 257, i1 false)
ret void		ret void
}		}

; 258 bytes, i32 version. We need two MVCs.		; 258 bytes, i32 version. We need two MVCs.
define void @f11(i8* %dest, i8 %val) {		define void @f11(i8* %dest, i8 %val) {
; CHECK-LABEL: f11:		; CHECK-LABEL: f11:
; CHECK: stc %r3, 0(%r2)		; CHECK: stc %r3, 0(%r2)
; CHECK: mvc 1(256,%r2), 0(%r2)		; CHECK: mvc 1(255,%r2), 0(%r2)
		; CHECK: stc %r3, 256(%r2)
; CHECK: mvc 257(1,%r2), 256(%r2)		; CHECK: mvc 257(1,%r2), 256(%r2)
; CHECK: br %r14		; CHECK: br %r14
call void @llvm.memset.p0i8.i32(i8* %dest, i8 %val, i32 258, i1 false)		call void @llvm.memset.p0i8.i32(i8* %dest, i8 %val, i32 258, i1 false)
ret void		ret void
}		}

; 258 bytes, i64 version.		; 258 bytes, i64 version.
define void @f12(i8* %dest, i8 %val) {		define void @f12(i8* %dest, i8 %val) {
; CHECK-LABEL: f12:		; CHECK-LABEL: f12:
; CHECK: stc %r3, 0(%r2)		; CHECK: stc %r3, 0(%r2)
; CHECK: mvc 1(256,%r2), 0(%r2)		; CHECK: mvc 1(255,%r2), 0(%r2)
		; CHECK: stc %r3, 256(%r2)
; CHECK: mvc 257(1,%r2), 256(%r2)		; CHECK: mvc 257(1,%r2), 256(%r2)
; CHECK: br %r14		; CHECK: br %r14
call void @llvm.memset.p0i8.i64(i8* %dest, i8 %val, i64 258, i1 false)		call void @llvm.memset.p0i8.i64(i8* %dest, i8 %val, i64 258, i1 false)
ret void		ret void
}		}

; Test the largest case for which straight-line code is used.		; Test the largest case for which straight-line code is used.
define void @f13(i8* %dest, i8 %val) {		define void @f13(i8* %dest, i8 %val) {
; CHECK-LABEL: f13:		; CHECK-LABEL: f13:
; CHECK: stc %r3, 0(%r2)		; CHECK: stc %r3, 0(%r2)
; CHECK: mvc 1(256,%r2), 0(%r2)		; CHECK: mvc 1(255,%r2), 0(%r2)
; CHECK: mvc 257(256,%r2), 256(%r2)		; CHECK: stc %r3, 256(%r2)
; CHECK: mvc 513(256,%r2), 512(%r2)		; CHECK: mvc 257(255,%r2), 256(%r2)
; CHECK: mvc 769(256,%r2), 768(%r2)		; CHECK: stc %r3, 512(%r2)
; CHECK: mvc 1025(256,%r2), 1024(%r2)		; CHECK: mvc 513(255,%r2), 512(%r2)
; CHECK: mvc 1281(256,%r2), 1280(%r2)		; CHECK: stc %r3, 768(%r2)
		; CHECK: mvc 769(255,%r2), 768(%r2)
		; CHECK: stc %r3, 1024(%r2)
		; CHECK: mvc 1025(255,%r2), 1024(%r2)
		; CHECK: stc %r3, 1280(%r2)
		; CHECK: mvc 1281(255,%r2), 1280(%r2)
; CHECK: br %r14		; CHECK: br %r14
call void @llvm.memset.p0i8.i64(i8* %dest, i8 %val, i64 1537, i1 false)		call void @llvm.memset.p0i8.i64(i8* %dest, i8 %val, i64 1536, i1 false)
ret void		ret void
}		}

; Test the next size up, which uses a loop. We leave the other corner		; Test the next size up, which uses a loop. We leave the other corner
; cases to memcpy-01.ll.		; cases to memcpy-01.ll and memset-07.ll.
define void @f14(i8* %dest, i8 %val) {		define void @f14(i8* %dest, i8 %val) {
; CHECK-LABEL: f14:		; CHECK-LABEL: f14:
; CHECK: stc %r3, 0(%r2)
; CHECK: lghi [[COUNT:%r[0-5]]], 6		; CHECK: lghi [[COUNT:%r[0-5]]], 6
; CHECK: [[LABEL:\.L[^:]*]]:		; CHECK: [[LABEL:\.L[^:]*]]:
; CHECK: pfd 2, 769(%r2)		; CHECK: pfd 2, 768(%r2)
; CHECK: mvc 1(256,%r2), 0(%r2)		; CHECK: stc %r3, 0(%r2)
		; CHECK: mvc 1(255,%r2), 0(%r2)
; CHECK: la %r2, 256(%r2)		; CHECK: la %r2, 256(%r2)
; CHECK: brctg [[COUNT]], [[LABEL]]		; CHECK: brctg [[COUNT]], [[LABEL]]
; CHECK: mvc 1(1,%r2), 0(%r2)		; CHECK: stc %r3, 0(%r2)
; CHECK: br %r14		; CHECK-NEXT: br %r14
call void @llvm.memset.p0i8.i64(i8* %dest, i8 %val, i64 1538, i1 false)		call void @llvm.memset.p0i8.i64(i8* %dest, i8 %val, i64 1537, i1 false)
ret void		ret void
}		}

		; Test (no) folding of displacement: Begins with max(uint12) - 1.
		define void @f15(i8* %dest, i8 %val) {
		; CHECK-LABEL: f15:
		; CHECK-NOT: la {{.*}}%r2
		%addr = getelementptr i8, i8* %dest, i64 4094
		call void @llvm.memset.p0i8.i64(i8* %addr, i8 %val, i64 256, i1 false)
		ret void
		}

		; Test folding of displacement: Begins with max(uint12).
		define void @f16(i8* %dest, i8 %val) {
		; CHECK-LABEL: f16:
		; CHECK-DAG: lay %r1, 4096(%r2)
		; CHECK-DAG: stc %r3, 4095(%r2)
		%addr = getelementptr i8, i8* %dest, i64 4095
		call void @llvm.memset.p0i8.i64(i8* %addr, i8 %val, i64 256, i1 false)
		ret void
		}

		; Test folding of displacement with LA: First two ops are in range.
		define void @f17(i8* %dest, i8 %val) {
		; CHECK-LABEL: f17:
		; CHECK: stc %r3, 3583(%r2)
		; CHECK-NEXT: mvc 3584(255,%r2), 3583(%r2)
		; CHECK-NEXT: stc %r3, 3839(%r2)
		; CHECK-NEXT: mvc 3840(255,%r2), 3839(%r2)
		; CHECK-NEXT: lay %r1, 4096(%r2)
		; CHECK-NEXT: stc %r3, 4095(%r2)
		; CHECK-NEXT: mvc 0(1,%r1), 4095(%r2)
		; CHECK-NEXT: br %r14
		%addr = getelementptr i8, i8* %dest, i64 3583
		call void @llvm.memset.p0i8.i64(i8* %addr, i8 %val, i64 514, i1 false)
		ret void
		}

		; Test folding of displacement with LAY: First two ops are in range.
		define void @f18(i8* %dest, i8 %val) {
		; CHECK-LABEL: f18:
		; CHECK: stc %r3, 3584(%r2)
		; CHECK-NEXT: mvc 3585(255,%r2), 3584(%r2)
		; CHECK-NEXT: stc %r3, 3840(%r2)
		; CHECK-NEXT: mvc 3841(255,%r2), 3840(%r2)
		; CHECK-NEXT: lay %r1, 4097(%r2)
		; CHECK-NEXT: lay %r2, 4096(%r2)
		; CHECK-NEXT: stc %r3, 0(%r2)
		; CHECK-NEXT: mvc 0(1,%r1), 0(%r2)
		; CHECK-NEXT: br %r14
		%addr = getelementptr i8, i8* %dest, i64 3584
		call void @llvm.memset.p0i8.i64(i8* %addr, i8 %val, i64 514, i1 false)
		ret void
		}

llvm/test/CodeGen/SystemZ/memset-02.ll

Show First 20 Lines • Show All 117 Lines • ▼ Show 20 Lines	; CHECK: br %r14
call void @llvm.memset.p0i8.i64(i8* %dest, i8 128, i64 5, i1 false)		call void @llvm.memset.p0i8.i64(i8* %dest, i8 128, i64 5, i1 false)
ret void		ret void
}		}

; 257 bytes, i32 version.		; 257 bytes, i32 version.
define void @f13(i8* %dest) {		define void @f13(i8* %dest) {
; CHECK-LABEL: f13:		; CHECK-LABEL: f13:
; CHECK: mvi 0(%r2), 128		; CHECK: mvi 0(%r2), 128
; CHECK: mvc 1(256,%r2), 0(%r2)		; CHECK: mvc 1(255,%r2), 0(%r2)
		; CHECK: mvi 256(%r2), 128
; CHECK: br %r14		; CHECK: br %r14
call void @llvm.memset.p0i8.i32(i8* %dest, i8 128, i32 257, i1 false)		call void @llvm.memset.p0i8.i32(i8* %dest, i8 128, i32 257, i1 false)
ret void		ret void
}		}

; 257 bytes, i64 version.		; 257 bytes, i64 version.
define void @f14(i8* %dest) {		define void @f14(i8* %dest) {
; CHECK-LABEL: f14:		; CHECK-LABEL: f14:
; CHECK: mvi 0(%r2), 128		; CHECK: mvi 0(%r2), 128
; CHECK: mvc 1(256,%r2), 0(%r2)		; CHECK: mvc 1(255,%r2), 0(%r2)
		; CHECK: mvi 256(%r2), 128
; CHECK: br %r14		; CHECK: br %r14
call void @llvm.memset.p0i8.i64(i8* %dest, i8 128, i64 257, i1 false)		call void @llvm.memset.p0i8.i64(i8* %dest, i8 128, i64 257, i1 false)
ret void		ret void
}		}

; 258 bytes, i32 version. We need two MVCs.		; 258 bytes, i32 version. We need two MVCs.
define void @f15(i8* %dest) {		define void @f15(i8* %dest) {
; CHECK-LABEL: f15:		; CHECK-LABEL: f15:
; CHECK: mvi 0(%r2), 128		; CHECK: mvi 0(%r2), 128
; CHECK: mvc 1(256,%r2), 0(%r2)		; CHECK: mvc 1(255,%r2), 0(%r2)
		; CHECK: mvi 256(%r2), 128
; CHECK: mvc 257(1,%r2), 256(%r2)		; CHECK: mvc 257(1,%r2), 256(%r2)
; CHECK: br %r14		; CHECK: br %r14
call void @llvm.memset.p0i8.i32(i8* %dest, i8 128, i32 258, i1 false)		call void @llvm.memset.p0i8.i32(i8* %dest, i8 128, i32 258, i1 false)
ret void		ret void
}		}

; 258 bytes, i64 version.		; 258 bytes, i64 version.
define void @f16(i8* %dest) {		define void @f16(i8* %dest) {
; CHECK-LABEL: f16:		; CHECK-LABEL: f16:
; CHECK: mvi 0(%r2), 128		; CHECK: mvi 0(%r2), 128
; CHECK: mvc 1(256,%r2), 0(%r2)		; CHECK: mvc 1(255,%r2), 0(%r2)
		; CHECK: mvi 256(%r2), 128
; CHECK: mvc 257(1,%r2), 256(%r2)		; CHECK: mvc 257(1,%r2), 256(%r2)
; CHECK: br %r14		; CHECK: br %r14
call void @llvm.memset.p0i8.i64(i8* %dest, i8 128, i64 258, i1 false)		call void @llvm.memset.p0i8.i64(i8* %dest, i8 128, i64 258, i1 false)
ret void		ret void
}		}

llvm/test/CodeGen/SystemZ/memset-04.ll

Show First 20 Lines • Show All 353 Lines • ▼ Show 20 Lines	; CHECK: br %r14
call void @llvm.memset.p0i8.i64(i8* %dest, i8 -1, i64 17, i1 false)		call void @llvm.memset.p0i8.i64(i8* %dest, i8 -1, i64 17, i1 false)
ret void		ret void
}		}

; 257 bytes, i32 version.		; 257 bytes, i32 version.
define void @f37(i8* %dest) {		define void @f37(i8* %dest) {
; CHECK-LABEL: f37:		; CHECK-LABEL: f37:
; CHECK: mvi 0(%r2), 255		; CHECK: mvi 0(%r2), 255
; CHECK: mvc 1(256,%r2), 0(%r2)		; CHECK: mvc 1(255,%r2), 0(%r2)
		; CHECK: mvi 256(%r2), 255
; CHECK: br %r14		; CHECK: br %r14
call void @llvm.memset.p0i8.i32(i8* %dest, i8 -1, i32 257, i1 false)		call void @llvm.memset.p0i8.i32(i8* %dest, i8 -1, i32 257, i1 false)
ret void		ret void
}		}

; 257 bytes, i64 version.		; 257 bytes, i64 version.
define void @f38(i8* %dest) {		define void @f38(i8* %dest) {
; CHECK-LABEL: f38:		; CHECK-LABEL: f38:
; CHECK: mvi 0(%r2), 255		; CHECK: mvi 0(%r2), 255
; CHECK: mvc 1(256,%r2), 0(%r2)		; CHECK: mvc 1(255,%r2), 0(%r2)
		; CHECK: mvi 256(%r2), 255
; CHECK: br %r14		; CHECK: br %r14
call void @llvm.memset.p0i8.i64(i8* %dest, i8 -1, i64 257, i1 false)		call void @llvm.memset.p0i8.i64(i8* %dest, i8 -1, i64 257, i1 false)
ret void		ret void
}		}

; 258 bytes, i32 version. We need two MVCs.		; 258 bytes, i32 version. We need two MVCs.
define void @f39(i8* %dest) {		define void @f39(i8* %dest) {
; CHECK-LABEL: f39:		; CHECK-LABEL: f39:
; CHECK: mvi 0(%r2), 255		; CHECK: mvi 0(%r2), 255
; CHECK: mvc 1(256,%r2), 0(%r2)		; CHECK: mvc 1(255,%r2), 0(%r2)
		; CHECK: mvi 256(%r2), 255
; CHECK: mvc 257(1,%r2), 256(%r2)		; CHECK: mvc 257(1,%r2), 256(%r2)
; CHECK: br %r14		; CHECK: br %r14
call void @llvm.memset.p0i8.i32(i8* %dest, i8 -1, i32 258, i1 false)		call void @llvm.memset.p0i8.i32(i8* %dest, i8 -1, i32 258, i1 false)
ret void		ret void
}		}

; 258 bytes, i64 version.		; 258 bytes, i64 version.
define void @f40(i8* %dest) {		define void @f40(i8* %dest) {
; CHECK-LABEL: f40:		; CHECK-LABEL: f40:
; CHECK: mvi 0(%r2), 255		; CHECK: mvi 0(%r2), 255
; CHECK: mvc 1(256,%r2), 0(%r2)		; CHECK: mvc 1(255,%r2), 0(%r2)
		; CHECK: mvi 256(%r2), 255
; CHECK: mvc 257(1,%r2), 256(%r2)		; CHECK: mvc 257(1,%r2), 256(%r2)
; CHECK: br %r14		; CHECK: br %r14
call void @llvm.memset.p0i8.i64(i8* %dest, i8 -1, i64 258, i1 false)		call void @llvm.memset.p0i8.i64(i8* %dest, i8 -1, i64 258, i1 false)
ret void		ret void
}		}

llvm/test/CodeGen/SystemZ/memset-07.ll

This file was added.

				; Test memset in cases where a loop is used.
				;
				; RUN: llc < %s -mtriple=s390x-linux-gnu \| FileCheck %s

				declare void @llvm.memset.p0i8.i32(i8 *nocapture, i8, i32, i1) nounwind
				declare void @llvm.memset.p0i8.i64(i8 *nocapture, i8, i64, i1) nounwind

				; Constant length: 6 iterations and 2 bytes remainder.
				define void @f1(i8* %dest, i8 %val) {
				; CHECK-LABEL: f1:
				; CHECK: lghi [[COUNT:%r[0-5]]], 6
				; CHECK: [[LABEL:\.L[^:]*]]:
				; CHECK: pfd 2, 768(%r2)
				; CHECK: stc %r3, 0(%r2)
				; CHECK: mvc 1(255,%r2), 0(%r2)
				; CHECK: la %r2, 256(%r2)
				; CHECK: brctg [[COUNT]], [[LABEL]]
				; CHECK: stc %r3, 0(%r2)
				; CHECK-NEXT: mvc 1(1,%r2), 0(%r2)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %dest, i8 %val, i64 1538, i1 false)
				ret void
				}

				; Constant length: 6 iterations and 255 bytes remainder.
				define void @f2(i8* %dest) {
				; CHECK-LABEL: f2:
				; CHECK: lghi [[COUNT:%r[0-5]]], 6
				; CHECK: [[LABEL:\.L[^:]*]]:
				; CHECK: pfd 2, 768(%r2)
				; CHECK: mvi 0(%r2), 1
				; CHECK: mvc 1(255,%r2), 0(%r2)
				; CHECK: la %r2, 256(%r2)
				; CHECK: brctg [[COUNT]], [[LABEL]]
				; CHECK: mvi 0(%r2), 1
				; CHECK-NEXT: mvc 1(254,%r2), 0(%r2)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i32(i8* %dest, i8 1, i32 1791, i1 false)
				ret void
				}

				; Variable length, byte in register.
				define void @f3(i8* %dest, i8 %val, i64 %Len) {
				; CHECK-LABEL: f3:
				; CHECK: # %bb.0:
				; CHECK-NEXT: aghi %r4, -2
				; CHECK-NEXT: cgibe %r4, -2, 0(%r14)
				; CHECK-NEXT: .LBB2_1:
				; CHECK-NEXT: cgije %r4, -1, .LBB2_5
				; CHECK-NEXT:# %bb.2:
				; CHECK-NEXT: srlg %r0, %r4, 8
				; CHECK-NEXT: cgije %r0, 0, .LBB2_4
				; CHECK-NEXT:.LBB2_3: # =>This Inner Loop Header: Depth=1
				; CHECK-NEXT: pfd 2, 768(%r2)
				; CHECK-NEXT: stc %r3, 0(%r2)
				; CHECK-NEXT: mvc 1(255,%r2), 0(%r2)
				; CHECK-NEXT: la %r2, 256(%r2)
				; CHECK-NEXT: brctg %r0, .LBB2_3
				; CHECK-NEXT:.LBB2_4:
				; CHECK-NEXT: stc %r3, 0(%r2)
				; CHECK-NEXT: exrl %r4, .Ltmp0
				; CHECK-NEXT: br %r14
				; CHECK-NEXT:.LBB2_5:
				; CHECK-NEXT: stc %r3, 0(%r2)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %dest, i8 %val, i64 %Len, i1 false)
				ret void
				}

				; Variable length, immediate byte.
				define void @f4(i8* %dest, i32 %Len) {
				; CHECK-LABEL: f4:
				; CHECK: # %bb.0:
				; CHECK-NEXT: llgfr %r1, %r3
				; CHECK-NEXT: aghi %r1, -2
				; CHECK-NEXT: cgibe %r1, -2, 0(%r14)
				; CHECK-NEXT:.LBB3_1:
				; CHECK-NEXT: cgije %r1, -1, .LBB3_5
				; CHECK-NEXT:# %bb.2:
				; CHECK-NEXT: srlg %r0, %r1, 8
				; CHECK-NEXT: cgije %r0, 0, .LBB3_4
				; CHECK-NEXT:.LBB3_3: # =>This Inner Loop Header: Depth=1
				; CHECK-NEXT: pfd 2, 768(%r2)
				; CHECK-NEXT: mvi 0(%r2), 1
				; CHECK-NEXT: mvc 1(255,%r2), 0(%r2)
				; CHECK-NEXT: la %r2, 256(%r2)
				; CHECK-NEXT: brctg %r0, .LBB3_3
				; CHECK-NEXT:.LBB3_4:
				; CHECK-NEXT: mvi 0(%r2), 1
				; CHECK-NEXT: exrl %r1, .Ltmp0
				; CHECK-NEXT: br %r14
				; CHECK-NEXT:.LBB3_5:
				; CHECK-NEXT: mvi 0(%r2), 1
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i32(i8* %dest, i8 1, i32 %Len, i1 false)
				ret void
				}

				; CHECK: .Ltmp0:
				; CHECK-NEXT: mvc 1(1,%r2), 0(%r2)

llvm/test/CodeGen/SystemZ/tail-call-mem-intrinsics.ll

	; RUN: llc -mtriple=s390x-linux-gnu < %s \| FileCheck %s			; RUN: llc -mtriple=s390x-linux-gnu < %s \| FileCheck %s

	; CHECK-LABEL: tail_memmove:			; CHECK-LABEL: tail_memmove:
	; CHECK: jg memmove			; CHECK: jg memmove
	define void @tail_memmove(i8* nocapture %p, i8* nocapture readonly %q, i32 %n) #0 {			define void @tail_memmove(i8* nocapture %p, i8* nocapture readonly %q, i32 %n) #0 {
	entry:			entry:
	tail call void @llvm.memmove.p0i8.p0i8.i32(i8* %p, i8* %q, i32 %n, i1 false)			tail call void @llvm.memmove.p0i8.p0i8.i32(i8* %p, i8* %q, i32 %n, i1 false)
	ret void			ret void
	}			}

	; CHECK-LABEL: tail_memset:			; CHECK-LABEL: tail_memset:
	; CHECK: jg memset			; CHECK: jg memset
	uweigandUnsubmitted Done Reply Inline Actions Maybe we can still find a way to test emission of the call? E.g. using a volatile pointer? uweigand: Maybe we can still find a way to test emission of the call? E.g. using a volatile pointer?
	jonpaAuthorUnsubmitted Done Reply Inline Actions ah, yes - the fourth argument is actually 'isvolatile'... jonpa: ah, yes - the fourth argument is actually 'isvolatile'...
	define void @tail_memset(i8* nocapture %p, i8 %c, i32 %n) #0 {			define void @tail_memset(i8* nocapture %p, i8 %c, i32 %n) #0 {
	entry:			entry:
	tail call void @llvm.memset.p0i8.i32(i8* %p, i8 %c, i32 %n, i1 false)			tail call void @llvm.memset.p0i8.i32(i8* %p, i8 %c, i32 %n, i1 true)
	ret void			ret void
	}			}

	declare void @llvm.memcpy.p0i8.p0i8.i32(i8* nocapture, i8* nocapture readonly, i32, i1) #0			declare void @llvm.memcpy.p0i8.p0i8.i32(i8* nocapture, i8* nocapture readonly, i32, i1) #0
	declare void @llvm.memmove.p0i8.p0i8.i32(i8* nocapture, i8* nocapture readonly, i32, i1) #0			declare void @llvm.memmove.p0i8.p0i8.i32(i8* nocapture, i8* nocapture readonly, i32, i1) #0
	declare void @llvm.memset.p0i8.i32(i8* nocapture, i8, i32, i1) #0			declare void @llvm.memset.p0i8.i32(i8* nocapture, i8, i32, i1) #0

	attributes #0 = { nounwind }			attributes #0 = { nounwind }

This is an archive of the discontinued LLVM Phabricator instance.

[SystemZ] Improve codegen for memset
ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 392121

llvm/lib/Target/SystemZ/SystemZISelLowering.h

llvm/lib/Target/SystemZ/SystemZISelLowering.cpp

llvm/lib/Target/SystemZ/SystemZInstrFormats.td

llvm/lib/Target/SystemZ/SystemZInstrInfo.td

llvm/lib/Target/SystemZ/SystemZOperators.td

llvm/lib/Target/SystemZ/SystemZSelectionDAGInfo.cpp

llvm/test/CodeGen/SystemZ/memset-01.ll

llvm/test/CodeGen/SystemZ/memset-02.ll

llvm/test/CodeGen/SystemZ/memset-04.ll

llvm/test/CodeGen/SystemZ/memset-07.ll

llvm/test/CodeGen/SystemZ/tail-call-mem-intrinsics.ll

This is an archive of the discontinued LLVM Phabricator instance.

[SystemZ] Improve codegen for memsetClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 392121

llvm/lib/Target/SystemZ/SystemZISelLowering.h

llvm/lib/Target/SystemZ/SystemZISelLowering.cpp

llvm/lib/Target/SystemZ/SystemZInstrFormats.td

llvm/lib/Target/SystemZ/SystemZInstrInfo.td

llvm/lib/Target/SystemZ/SystemZOperators.td

llvm/lib/Target/SystemZ/SystemZSelectionDAGInfo.cpp

llvm/test/CodeGen/SystemZ/memset-01.ll

llvm/test/CodeGen/SystemZ/memset-02.ll

llvm/test/CodeGen/SystemZ/memset-04.ll

llvm/test/CodeGen/SystemZ/memset-07.ll

llvm/test/CodeGen/SystemZ/tail-call-mem-intrinsics.ll

[SystemZ] Improve codegen for memset
ClosedPublic