This is an archive of the discontinued LLVM Phabricator instance.

Differential D120277

[SystemZ] Expand some memcpys/memsets into Load/Store sequences.
AbandonedPublic

Authored by jonpa on Feb 21 2022, 12:33 PM.

Download Raw Diff

Details

Reviewers

Summary

For sizes over 16 bytes MVC is not always efficient, so up to a certain limit it would be better to use a Load/Store sequence.

This is still experimental with two different approaches included for now, to show what they look like.

Approach 1:

New TLI hook prefersVectorSplatForMemset(), to avoid the mandatory scalar multiplication as a means of replication, but instead directly generate a splat vector. I think this makes sense, and it is probably even better to just do this whenever target returns a vector type from getOptimalMemOpType().

Approach 2:

Detect replicated bytes in SystemZTargetLowering::combineSTORE().

If getMemsetStores() generates the multiplies (as it does now unaltered), they need to be combined in combineSTORE() . This is used like '-memset-splat=false -byterepl-fix'. This seems to work also, although it is more LOCs. It does seem though as it would be good also on its own - I see if using this *without* expanding any memcpy/memsets:

vsteh          :                 2557                 2875     +318
vlrepb         :                  187                  475     +288
llc            :                39057                38771     -286
sth            :                25792                25515     -277
mhi            :                 6009                 5741     -268   // multiply
stg            :               371885               371803      -82
vstef          :                 5779                 5859      +80
st             :               122692               122620      -72
lay            :                54734                54797      +63
vsteg          :                 6106                 6159      +53
lg             :               987456               987405      -51
sthy           :                 1054                 1014      -40
vlvgp          :                 8300                 8339      +39
vrepb          :                   95                  134      +39
vrepib         :                  283                  320      +37
msgrkc         :                 6741                 6707      -34   // multiply
iilf           :                 6397                 6364      -33
msfi           :                 7106                 7082      -24
vl             :               107362               107381      +19
...
Spill|Reload   :               611703               611679      -24
Copies         :              1002825              1002832       +7

Example:

-       llc     %r0, 0(%r4)
-       msrkc   %r0, %r0, %r0
-       st      %r0, 0(%r1)
+       vlrepb  %v0, 0(%r4)
+       vstef   %v0, 0(%r1), 0

Maybe this could be done in the common DAGCombiner even...

LegalAMVecTy and GEPOffsSplit are experimental options I have played with to see how to best fix the problem where a memcpy address is >U12 range, and now we instead get multiple VL/VSTs which all are out of range. This is a problem that needs to be fixed before using this patch, I think. I see for instance:

stg     %r2, 8696(%r15                  stg     %r2, 8696(%r15
lg      %r2, 8816(%r15                  lg      %r2, 8816(%r15
                          >             vl      %v0, 0(%r2), 3
lay     %r1, 8712(%r15                  lay     %r1, 8712(%r15
mvc     0(44,%r1), 0(%    |             vst     %v0, 0(%r1), 3
                          >             vl      %v0, 16(%r2), 
                          >             lay     %r1, 8728(%r15
                          >             vst     %v0, 0(%r1), 3
                          >             vl      %v0, 28(%r2)
                          >             lay     %r1, 8740(%r15
                          >             vst     %v0, 0(%r1)

The problem right now is that if the vector type is set to reject long displacements in isLegalAddressingMode(), LSR generates worse code for some loops :-/

The MVI_TYPEFIX code is probably not needed above 16 bytes, but in some cases there were immediates of type i64 that first got loaded into a register instead of used directly with MVI.

The test cases for now include full ranges of interesting sizes of memcpy/memset.

Diff Detail

Unit TestsFailed

	Time	Test
	60,020 ms	x64 debian > libFuzzer.libFuzzer::large.test

Event Timeline

jonpa created this revision.Feb 21 2022, 12:33 PM

Herald added subscribers: ctetreau, steven.zhang, dmgreen, hiraditya. · View Herald TranscriptFeb 21 2022, 12:33 PM

jonpa requested review of this revision.Feb 21 2022, 12:33 PM

Herald added a project: Restricted Project. · View Herald TranscriptFeb 21 2022, 12:33 PM

Herald added a subscriber: llvm-commits. · View Herald Transcript

Harbormaster completed remote builds in B150746: Diff 410362.Feb 21 2022, 1:48 PM

jonpa mentioned this in D122105: [SystemZ] Patchset for expanding memcpy/memset using at most 2 stores..Mar 20 2022, 12:02 PM

This patch includes some experimental parts, which have been removed here: https://reviews.llvm.org/D122105.

Please look there during further review, instead of at this post...

Herald added a project: Restricted Project. · View Herald TranscriptApr 4 2022, 3:17 AM

Part of eaa7803.

Revision Contents

Path

Size

llvm/

include/

llvm/

CodeGen/

TargetLowering.h

8 lines

lib/

CodeGen/

SelectionDAG/

SelectionDAG.cpp

21 lines

TargetLowering.cpp

2 lines

Target/

SystemZ/

SystemZISelLowering.h

7 lines

SystemZISelLowering.cpp

150 lines

test/

CodeGen/

SystemZ/

memcpy-03.ll

440 lines

memset-08.ll

1207 lines

Diff 410362

llvm/include/llvm/CodeGen/TargetLowering.h

Show First 20 Lines • Show All 1,619 Lines • ▼ Show 20 Lines	#include "llvm/IR/ConstrainedOps.def"
/// This function returns the maximum number of store operations permitted		/// This function returns the maximum number of store operations permitted
/// to replace a call to llvm.memset. The value is set by the target at the		/// to replace a call to llvm.memset. The value is set by the target at the
/// performance threshold for such a replacement. If OptSize is true,		/// performance threshold for such a replacement. If OptSize is true,
/// return the limit for functions that have OptSize attribute.		/// return the limit for functions that have OptSize attribute.
unsigned getMaxStoresPerMemset(bool OptSize) const {		unsigned getMaxStoresPerMemset(bool OptSize) const {
return OptSize ? MaxStoresPerMemsetOptSize : MaxStoresPerMemset;		return OptSize ? MaxStoresPerMemsetOptSize : MaxStoresPerMemset;
}		}

		/// If target can replicate a byte in a vector register and store (parts
		/// of) it, do that for a memset instead of a multiplication of the value
		/// with 0x010101...
		virtual bool prefersVectorSplatForMemset() const { return false; }

/// Get maximum # of store operations permitted for llvm.memcpy		/// Get maximum # of store operations permitted for llvm.memcpy
///		///
/// This function returns the maximum number of store operations permitted		/// This function returns the maximum number of store operations permitted
/// to replace a call to llvm.memcpy. The value is set by the target at the		/// to replace a call to llvm.memcpy. The value is set by the target at the
/// performance threshold for such a replacement. If OptSize is true,		/// performance threshold for such a replacement. If OptSize is true,
/// return the limit for functions that have OptSize attribute.		/// return the limit for functions that have OptSize attribute.
unsigned getMaxStoresPerMemcpy(bool OptSize) const {		unsigned getMaxStoresPerMemcpy(bool OptSize) const {
return OptSize ? MaxStoresPerMemcpyOptSize : MaxStoresPerMemcpy;		return OptSize ? MaxStoresPerMemcpyOptSize : MaxStoresPerMemcpy;
▲ Show 20 Lines • Show All 92 Lines • ▼ Show 20 Lines	#include "llvm/IR/ConstrainedOps.def"
/// LLT handling variant.		/// LLT handling variant.
bool allowsMemoryAccess(LLVMContext &Context, const DataLayout &DL, LLT Ty,		bool allowsMemoryAccess(LLVMContext &Context, const DataLayout &DL, LLT Ty,
const MachineMemOperand &MMO,		const MachineMemOperand &MMO,
bool *Fast = nullptr) const;		bool *Fast = nullptr) const;

/// Returns the target specific optimal type for load and store operations as		/// Returns the target specific optimal type for load and store operations as
/// a result of memset, memcpy, and memmove lowering.		/// a result of memset, memcpy, and memmove lowering.
/// It returns EVT::Other if the type should be determined using generic		/// It returns EVT::Other if the type should be determined using generic
/// target-independent logic.		/// target-independent logic. MVT::Untyped can be returned for a case that
		/// is handled in some other way by the target.
virtual EVT		virtual EVT
getOptimalMemOpType(const MemOp &Op,		getOptimalMemOpType(const MemOp &Op,
const AttributeList & /FuncAttributes/) const {		const AttributeList & /FuncAttributes/) const {
return MVT::Other;		return MVT::Other;
}		}

/// LLT returning variant.		/// LLT returning variant.
virtual LLT		virtual LLT
▲ Show 20 Lines • Show All 3,087 Lines • Show Last 20 Lines

llvm/lib/CodeGen/SelectionDAG/SelectionDAG.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 6,364 Lines • ▼ Show 20 Lines	SDValue SelectionDAG::getStackArgumentTokenFactor(SDValue Chain) {
return getNode(ISD::TokenFactor, SDLoc(Chain), MVT::Other, ArgChains);		return getNode(ISD::TokenFactor, SDLoc(Chain), MVT::Other, ArgChains);
}		}

/// getMemsetValue - Vectorized representation of the memset value		/// getMemsetValue - Vectorized representation of the memset value
/// operand.		/// operand.
static SDValue getMemsetValue(SDValue Value, EVT VT, SelectionDAG &DAG,		static SDValue getMemsetValue(SDValue Value, EVT VT, SelectionDAG &DAG,
const SDLoc &dl) {		const SDLoc &dl) {
assert(!Value.isUndef());		assert(!Value.isUndef());
		const TargetLowering &TLI = DAG.getTargetLoweringInfo();

		assert(Value.getValueType() == MVT::i8 && "memset with non-byte fill value?");

		if (TLI.prefersVectorSplatForMemset()) {
		// XXX Maybe simply check for vector VT instead?
		EVT ByteReplVT = EVT::getVectorVT(*DAG.getContext(), MVT::i8,
		Lint: Pre-merge checks Inline Actions clang-format: please reformat the code - EVT ByteReplVT = EVT::getVectorVT(DAG.getContext(), MVT::i8, - VT.getSizeInBits() / 8); + EVT ByteReplVT = + EVT::getVectorVT(DAG.getContext(), MVT::i8, VT.getSizeInBits() / 8); Lint: Pre-merge checks: clang-format: please reformat the code ``` - EVT ByteReplVT = EVT::getVectorVT(*DAG.
		VT.getSizeInBits() / 8);
		Value = DAG.getSplatBuildVector(ByteReplVT, dl, Value);
		return DAG.getBitcast(VT, Value);
		}

unsigned NumBits = VT.getScalarSizeInBits();		unsigned NumBits = VT.getScalarSizeInBits();
if (ConstantSDNode *C = dyn_cast<ConstantSDNode>(Value)) {		if (ConstantSDNode *C = dyn_cast<ConstantSDNode>(Value)) {
assert(C->getAPIntValue().getBitWidth() == 8);		assert(C->getAPIntValue().getBitWidth() == 8);
APInt Val = APInt::getSplat(NumBits, C->getAPIntValue());		APInt Val = APInt::getSplat(NumBits, C->getAPIntValue());
if (VT.isInteger()) {		if (VT.isInteger()) {
bool IsOpaque = VT.getSizeInBits() > 64 \|\|		bool IsOpaque = VT.getSizeInBits() > 64 \|\|
!DAG.getTargetLoweringInfo().isLegalStoreImmediate(C->getSExtValue());		!DAG.getTargetLoweringInfo().isLegalStoreImmediate(C->getSExtValue());
return DAG.getConstant(Val, dl, VT, false, IsOpaque);		return DAG.getConstant(Val, dl, VT, false, IsOpaque);
}		}
return DAG.getConstantFP(APFloat(DAG.EVTToAPFloatSemantics(VT), Val), dl,		return DAG.getConstantFP(APFloat(DAG.EVTToAPFloatSemantics(VT), Val), dl,
VT);		VT);
}		}

assert(Value.getValueType() == MVT::i8 && "memset with non-byte fill value?");
EVT IntVT = VT.getScalarType();		EVT IntVT = VT.getScalarType();
if (!IntVT.isInteger())		if (!IntVT.isInteger())
IntVT = EVT::getIntegerVT(*DAG.getContext(), IntVT.getSizeInBits());		IntVT = EVT::getIntegerVT(*DAG.getContext(), IntVT.getSizeInBits());

Value = DAG.getNode(ISD::ZERO_EXTEND, dl, IntVT, Value);		Value = DAG.getNode(ISD::ZERO_EXTEND, dl, IntVT, Value);
if (NumBits > 8) {		if (NumBits > 8) {
// Use a multiplication with 0x010101... to extend the input to the		// Use a multiplication with 0x010101... to extend the input to the
// required length.		// required length.
▲ Show 20 Lines • Show All 460 Lines • ▼ Show 20 Lines	static SDValue getMemsetStores(SelectionDAG &DAG, const SDLoc &dl,
MachineFunction &MF = DAG.getMachineFunction();		MachineFunction &MF = DAG.getMachineFunction();
MachineFrameInfo &MFI = MF.getFrameInfo();		MachineFrameInfo &MFI = MF.getFrameInfo();
bool OptSize = shouldLowerMemFuncForSize(MF, DAG);		bool OptSize = shouldLowerMemFuncForSize(MF, DAG);
FrameIndexSDNode *FI = dyn_cast<FrameIndexSDNode>(Dst);		FrameIndexSDNode *FI = dyn_cast<FrameIndexSDNode>(Dst);
if (FI && !MFI.isFixedObjectIndex(FI->getIndex()))		if (FI && !MFI.isFixedObjectIndex(FI->getIndex()))
DstAlignCanChange = true;		DstAlignCanChange = true;
bool IsZeroVal =		bool IsZeroVal =
isa<ConstantSDNode>(Src) && cast<ConstantSDNode>(Src)->isZero();		isa<ConstantSDNode>(Src) && cast<ConstantSDNode>(Src)->isZero();

if (!TLI.findOptimalMemOpLowering(		if (!TLI.findOptimalMemOpLowering(
MemOps, TLI.getMaxStoresPerMemset(OptSize),		MemOps, TLI.getMaxStoresPerMemset(OptSize),
MemOp::Set(Size, DstAlignCanChange, Alignment, IsZeroVal, isVol),		MemOp::Set(Size, DstAlignCanChange, Alignment, IsZeroVal, isVol),
DstPtrInfo.getAddrSpace(), ~0u, MF.getFunction().getAttributes()))		DstPtrInfo.getAddrSpace(), ~0u, MF.getFunction().getAttributes()))
return SDValue();		return SDValue();

if (DstAlignCanChange) {		if (DstAlignCanChange) {
Type Ty = MemOps[0].getTypeForEVT(DAG.getContext());		Type Ty = MemOps[0].getTypeForEVT(DAG.getContext());
Show All 33 Lines	for (unsigned i = 0; i < NumMemOps; i++) {

// If this store is smaller than the largest store see whether we can get		// If this store is smaller than the largest store see whether we can get
// the smaller value for free with a truncate.		// the smaller value for free with a truncate.
SDValue Value = MemSetValue;		SDValue Value = MemSetValue;
if (VT.bitsLT(LargestVT)) {		if (VT.bitsLT(LargestVT)) {
if (!LargestVT.isVector() && !VT.isVector() &&		if (!LargestVT.isVector() && !VT.isVector() &&
TLI.isTruncateFree(LargestVT, VT))		TLI.isTruncateFree(LargestVT, VT))
Value = DAG.getNode(ISD::TRUNCATE, dl, VT, MemSetValue);		Value = DAG.getNode(ISD::TRUNCATE, dl, VT, MemSetValue);
		else if (TLI.prefersVectorSplatForMemset()) {
		// XXX Maybe simply check for vector VT instead?
		EVT VecVT = EVT::getVectorVT(*DAG.getContext(), VT,
		Lint: Pre-merge checks Inline Actions clang-format: please reformat the code - EVT VecVT = EVT::getVectorVT(DAG.getContext(), VT, - LargestVT.getSizeInBits() / VT.getSizeInBits()); + EVT VecVT = + EVT::getVectorVT(DAG.getContext(), VT, + LargestVT.getSizeInBits() / VT.getSizeInBits()); Lint: Pre-merge checks: clang-format: please reformat the code ``` - EVT VecVT = EVT::getVectorVT(*DAG.
		LargestVT.getSizeInBits() / VT.getSizeInBits());
		Value = DAG.getNode(ISD::EXTRACT_VECTOR_ELT, dl, VT,
		DAG.getBitcast(VecVT, Value),
		DAG.getVectorIdxConstant(0, dl));
		}
		Lint: Pre-merge checks Inline Actions clang-format: please reformat the code - } - else + } else Lint: Pre-merge checks: clang-format: please reformat the code ``` - } - else + } else ```
else		else
Value = getMemsetValue(Src, VT, DAG, dl);		Value = getMemsetValue(Src, VT, DAG, dl);
}		}
assert(Value.getValueType() == VT && "Value with wrong type.");		assert(Value.getValueType() == VT && "Value with wrong type.");
SDValue Store = DAG.getStore(		SDValue Store = DAG.getStore(
Chain, dl, Value,		Chain, dl, Value,
DAG.getMemBasePlusOffset(Dst, TypeSize::Fixed(DstOff), dl),		DAG.getMemBasePlusOffset(Dst, TypeSize::Fixed(DstOff), dl),
DstPtrInfo.getWithOffset(DstOff), Alignment,		DstPtrInfo.getWithOffset(DstOff), Alignment,
▲ Show 20 Lines • Show All 4,350 Lines • Show Last 20 Lines

llvm/lib/CodeGen/SelectionDAG/TargetLowering.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

	Show First 20 Lines • Show All 193 Lines • ▼ Show 20 Lines

	bool TargetLowering::findOptimalMemOpLowering(			bool TargetLowering::findOptimalMemOpLowering(
	std::vector<EVT> &MemOps, unsigned Limit, const MemOp &Op, unsigned DstAS,			std::vector<EVT> &MemOps, unsigned Limit, const MemOp &Op, unsigned DstAS,
	unsigned SrcAS, const AttributeList &FuncAttributes) const {			unsigned SrcAS, const AttributeList &FuncAttributes) const {
	if (Op.isMemcpyWithFixedDstAlign() && Op.getSrcAlign() < Op.getDstAlign())			if (Op.isMemcpyWithFixedDstAlign() && Op.getSrcAlign() < Op.getDstAlign())
	return false;			return false;

	EVT VT = getOptimalMemOpType(Op, FuncAttributes);			EVT VT = getOptimalMemOpType(Op, FuncAttributes);
				if (VT == MVT::Untyped)
				return false;

	if (VT == MVT::Other) {			if (VT == MVT::Other) {
	// Use the largest integer type whose alignment constraints are satisfied.			// Use the largest integer type whose alignment constraints are satisfied.
	// We only need to check DstAlign here as SrcAlign is always greater or			// We only need to check DstAlign here as SrcAlign is always greater or
	// equal to DstAlign (or zero).			// equal to DstAlign (or zero).
	VT = MVT::i64;			VT = MVT::i64;
	if (Op.isFixedDstAlign())			if (Op.isFixedDstAlign())
	while (Op.getDstAlign() < (VT.getSizeInBits() / 8) &&			while (Op.getDstAlign() < (VT.getSizeInBits() / 8) &&
	▲ Show 20 Lines • Show All 9,010 Lines • Show Last 20 Lines

llvm/lib/Target/SystemZ/SystemZISelLowering.h

Show First 20 Lines • Show All 451 Lines • ▼ Show 20 Lines	public:
bool isLegalICmpImmediate(int64_t Imm) const override;		bool isLegalICmpImmediate(int64_t Imm) const override;
bool isLegalAddImmediate(int64_t Imm) const override;		bool isLegalAddImmediate(int64_t Imm) const override;
bool isLegalAddressingMode(const DataLayout &DL, const AddrMode &AM, Type *Ty,		bool isLegalAddressingMode(const DataLayout &DL, const AddrMode &AM, Type *Ty,
unsigned AS,		unsigned AS,
Instruction *I = nullptr) const override;		Instruction *I = nullptr) const override;
bool allowsMisalignedMemoryAccesses(EVT VT, unsigned AS, Align Alignment,		bool allowsMisalignedMemoryAccesses(EVT VT, unsigned AS, Align Alignment,
MachineMemOperand::Flags Flags,		MachineMemOperand::Flags Flags,
bool *Fast) const override;		bool *Fast) const override;

		bool prefersVectorSplatForMemset() const override;
		EVT getOptimalMemOpType(const MemOp &Op,
		const AttributeList &FuncAttributes) const override;

bool isTruncateFree(Type , Type ) const override;		bool isTruncateFree(Type , Type ) const override;
bool isTruncateFree(EVT, EVT) const override;		bool isTruncateFree(EVT, EVT) const override;

bool shouldFormOverflowOp(unsigned Opcode, EVT VT,		bool shouldFormOverflowOp(unsigned Opcode, EVT VT,
bool MathUsed) const override {		bool MathUsed) const override {
// Form add and sub with overflow intrinsics regardless of any extra		// Form add and sub with overflow intrinsics regardless of any extra
// users of the math result.		// users of the math result.
return VT == MVT::i32 \|\| VT == MVT::i64;		return VT == MVT::i32 \|\| VT == MVT::i64;
}		}

		bool shouldConsiderGEPOffsetSplit() const override;

const char *getTargetNodeName(unsigned Opcode) const override;		const char *getTargetNodeName(unsigned Opcode) const override;
std::pair<unsigned, const TargetRegisterClass *>		std::pair<unsigned, const TargetRegisterClass *>
getRegForInlineAsmConstraint(const TargetRegisterInfo *TRI,		getRegForInlineAsmConstraint(const TargetRegisterInfo *TRI,
StringRef Constraint, MVT VT) const override;		StringRef Constraint, MVT VT) const override;
TargetLowering::ConstraintType		TargetLowering::ConstraintType
getConstraintType(StringRef Constraint) const override;		getConstraintType(StringRef Constraint) const override;
TargetLowering::ConstraintWeight		TargetLowering::ConstraintWeight
getSingleConstraintMatchWeight(AsmOperandInfo &info,		getSingleConstraintMatchWeight(AsmOperandInfo &info,
▲ Show 20 Lines • Show All 289 Lines • Show Last 20 Lines

llvm/lib/Target/SystemZ/SystemZISelLowering.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 71 Lines • ▼ Show 20 Lines
// Return a version of MachineOperand that can be safely used before the		// Return a version of MachineOperand that can be safely used before the
// final use.		// final use.
static MachineOperand earlyUseOperand(MachineOperand Op) {		static MachineOperand earlyUseOperand(MachineOperand Op) {
if (Op.isReg())		if (Op.isReg())
Op.setIsKill(false);		Op.setIsKill(false);
return Op;		return Op;
}		}

		// EXPERIMENTAL
		static cl::opt<unsigned> MaxStoresMemset("max-stores-memset", cl::init(0));
		static cl::opt<unsigned> MaxStoresMemcpy("max-stores-memcpy", cl::init(0));

SystemZTargetLowering::SystemZTargetLowering(const TargetMachine &TM,		SystemZTargetLowering::SystemZTargetLowering(const TargetMachine &TM,
const SystemZSubtarget &STI)		const SystemZSubtarget &STI)
: TargetLowering(TM), Subtarget(STI) {		: TargetLowering(TM), Subtarget(STI) {
MVT PtrVT = MVT::getIntegerVT(8 * TM.getPointerSize(0));		MVT PtrVT = MVT::getIntegerVT(8 * TM.getPointerSize(0));

auto *Regs = STI.getSpecialRegisters();		auto *Regs = STI.getSpecialRegisters();

// Set up the register classes.		// Set up the register classes.
▲ Show 20 Lines • Show All 573 Lines • ▼ Show 20 Lines	SystemZTargetLowering::SystemZTargetLowering(const TargetMachine &TM,
setTargetDAGCombine(ISD::INTRINSIC_VOID);		setTargetDAGCombine(ISD::INTRINSIC_VOID);
setTargetDAGCombine(ISD::INTRINSIC_W_CHAIN);		setTargetDAGCombine(ISD::INTRINSIC_W_CHAIN);

// Handle intrinsics.		// Handle intrinsics.
setOperationAction(ISD::INTRINSIC_W_CHAIN, MVT::Other, Custom);		setOperationAction(ISD::INTRINSIC_W_CHAIN, MVT::Other, Custom);
setOperationAction(ISD::INTRINSIC_WO_CHAIN, MVT::Other, Custom);		setOperationAction(ISD::INTRINSIC_WO_CHAIN, MVT::Other, Custom);

// We want to use MVC in preference to even a single load/store pair.		// We want to use MVC in preference to even a single load/store pair.
MaxStoresPerMemcpy = 0;		MaxStoresPerMemcpy = Subtarget.hasVector() ? MaxStoresMemcpy : 0;
MaxStoresPerMemcpyOptSize = 0;		MaxStoresPerMemcpyOptSize = 0;

// The main memset sequence is a byte store followed by an MVC.		// The main memset sequence is a byte store followed by an MVC.
// Two STC or MV..I stores win over that, but the kind of fused stores		// Two STC or MV..I stores win over that, but the kind of fused stores
// generated by target-independent code don't when the byte value is		// generated by target-independent code don't when the byte value is
// variable. E.g. "STC <reg>;MHI <reg>,257;STH <reg>" is not better		// variable. E.g. "STC <reg>;MHI <reg>,257;STH <reg>" is not better
// than "STC;MVC". Handle the choice in target-specific code instead.		// than "STC;MVC". Handle the choice in target-specific code instead.
MaxStoresPerMemset = 0;		MaxStoresPerMemset = Subtarget.hasVector() ? MaxStoresMemset : 0;
MaxStoresPerMemsetOptSize = 0;		MaxStoresPerMemsetOptSize = 0;

// Default to having -disable-strictnode-mutation on		// Default to having -disable-strictnode-mutation on
IsStrictFPEnabled = true;		IsStrictFPEnabled = true;
}		}

bool SystemZTargetLowering::useSoftFloat() const {		bool SystemZTargetLowering::useSoftFloat() const {
return Subtarget.hasSoftFloat();		return Subtarget.hasSoftFloat();
▲ Show 20 Lines • Show All 271 Lines • ▼ Show 20 Lines	if (HasVector && (isa<LoadInst>(I) \|\| isa<StoreInst>(I))) {

if (IsFPAccess \|\| IsVectorAccess)		if (IsFPAccess \|\| IsVectorAccess)
return AddressingMode(false/LongDispl/, true/IdxReg/);		return AddressingMode(false/LongDispl/, true/IdxReg/);
}		}

return AddressingMode(true/LongDispl/, true/IdxReg/);		return AddressingMode(true/LongDispl/, true/IdxReg/);
}		}

		// EXPERIMENTAL
		static cl::opt<bool> LegalAMVecTy("legalam-vec", cl::init(false), cl::Hidden);
		static cl::opt<bool> GEPOffsSplit("gepoffssplit", cl::init(false), cl::Hidden);

		bool SystemZTargetLowering::shouldConsiderGEPOffsetSplit() const {
		return GEPOffsSplit;
		}

bool SystemZTargetLowering::isLegalAddressingMode(const DataLayout &DL,		bool SystemZTargetLowering::isLegalAddressingMode(const DataLayout &DL,
const AddrMode &AM, Type Ty, unsigned AS, Instruction I) const {		const AddrMode &AM, Type Ty, unsigned AS, Instruction I) const {
// Punt on globals for now, although they can be used in limited		// Punt on globals for now, although they can be used in limited
// RELATIVE LONG cases.		// RELATIVE LONG cases.
if (AM.BaseGV)		if (AM.BaseGV)
return false;		return false;

// Require a 20-bit signed offset.		// Require a 20-bit signed offset.
if (!isInt<20>(AM.BaseOffs))		if (!isInt<20>(AM.BaseOffs))
return false;		return false;

AddressingMode SupportedAM(true, true);		bool RequireD12 = Subtarget.hasVector() && Ty->isVectorTy() && LegalAMVecTy;
		AddressingMode SupportedAM(!RequireD12, true);
if (I != nullptr)		if (I != nullptr)
SupportedAM = supportedAddressingMode(I, Subtarget.hasVector());		SupportedAM = supportedAddressingMode(I, Subtarget.hasVector());

if (!SupportedAM.LongDisplacement && !isUInt<12>(AM.BaseOffs))		if (!SupportedAM.LongDisplacement && !isUInt<12>(AM.BaseOffs))
return false;		return false;

if (!SupportedAM.IndexReg)		if (!SupportedAM.IndexReg)
// No indexing allowed.		// No indexing allowed.
return AM.Scale == 0;		return AM.Scale == 0;
else		else
// Indexing is OK but no scale factor can be applied.		// Indexing is OK but no scale factor can be applied.
return AM.Scale == 0 \|\| AM.Scale == 1;		return AM.Scale == 0 \|\| AM.Scale == 1;
}		}

		// EXPERIMENTAL
		#include "llvm/Support/CommandLine.h"
		static cl::opt<bool> MemsetSplat("memset-splat", cl::init(true));
		static cl::opt<bool> MVI_TYPEFIX("mvi-typefix", cl::init(false));
		static cl::opt<bool> BYTEREPL_FIX("byterepl-fix", cl::init(false));

		bool SystemZTargetLowering::prefersVectorSplatForMemset() const {
		return Subtarget.hasVector() && MemsetSplat;
		}

		EVT SystemZTargetLowering::getOptimalMemOpType(const MemOp &Op,
		Lint: Pre-merge checks Inline Actions clang-format: please reformat the code -EVT SystemZTargetLowering::getOptimalMemOpType(const MemOp &Op, - const AttributeList &FuncAttributes) const { +EVT SystemZTargetLowering::getOptimalMemOpType( + const MemOp &Op, const AttributeList &FuncAttributes) const { Lint: Pre-merge checks: clang-format: please reformat the code ``` -EVT SystemZTargetLowering::getOptimalMemOpType…
		const AttributeList &FuncAttributes) const {
		const int MVCFastLen = 16;

		// Return MVT::Untyped in these cases to indicate that a load/store
		// sequence is not desired.
		if (Op.isMemcpy() && Op.allowOverlap() && Op.size() <= MVCFastLen)
		return MVT::Untyped; // Small memcpy: Use MVC
		Lint: Pre-merge checks Inline Actions clang-format: please reformat the code - return MVT::Untyped; // Small memcpy: Use MVC + return MVT::Untyped; // Small memcpy: Use MVC Lint: Pre-merge checks: clang-format: please reformat the code ``` - return MVT::Untyped; // Small memcpy: Use MVC…
		if (Op.isMemset() && Op.size() <= MVCFastLen)
		return MVT::Untyped; // Small memset: Use MVC
		Lint: Pre-merge checks Inline Actions clang-format: please reformat the code - return MVT::Untyped; // Small memset: Use MVC + return MVT::Untyped; // Small memset: Use MVC Lint: Pre-merge checks: clang-format: please reformat the code ``` - return MVT::Untyped; // Small memset: Use MVC…
		if (Op.isZeroMemset())
		return MVT::Untyped; // Memset zero: Use XC
		Lint: Pre-merge checks Inline Actions clang-format: please reformat the code - return MVT::Untyped; // Memset zero: Use XC + return MVT::Untyped; // Memset zero: Use XC Lint: Pre-merge checks: clang-format: please reformat the code ``` - return MVT::Untyped; // Memset zero: Use XC +…

		return Subtarget.hasVector() ? MVT::v2i64 : MVT::Other;
		}

bool SystemZTargetLowering::isTruncateFree(Type FromType, Type ToType) const {		bool SystemZTargetLowering::isTruncateFree(Type FromType, Type ToType) const {
if (!FromType->isIntegerTy() \|\| !ToType->isIntegerTy())		if (!FromType->isIntegerTy() \|\| !ToType->isIntegerTy())
return false;		return false;
unsigned FromBits = FromType->getPrimitiveSizeInBits().getFixedSize();		unsigned FromBits = FromType->getPrimitiveSizeInBits().getFixedSize();
unsigned ToBits = ToType->getPrimitiveSizeInBits().getFixedSize();		unsigned ToBits = ToType->getPrimitiveSizeInBits().getFixedSize();
return FromBits > ToBits;		return FromBits > ToBits;
}		}

▲ Show 20 Lines • Show All 5,304 Lines • ▼ Show 20 Lines	if (isVectorElementSwap(ShuffleMask, Op1.getValueType())) {
};		};

return DAG.getMemIntrinsicNode(SystemZISD::VSTER, SDLoc(N),		return DAG.getMemIntrinsicNode(SystemZISD::VSTER, SDLoc(N),
DAG.getVTList(MVT::Other),		DAG.getVTList(MVT::Other),
Ops, MemVT, SN->getMemOperand());		Ops, MemVT, SN->getMemOperand());
}		}
}		}

		// EXPERIMENTAL: Make sure store of small constant uses MVI. This just
		// changes the type of the constant to i32, which is needed for
		// SelectionDAGs expansion of memset using extracts from a replicated value.
		// TODO: better to fix isel pattern for MVI...
		if (MVI_TYPEFIX && Op1.getValueType() == MVT::i64)
		if (auto *C = dyn_cast<ConstantSDNode>(Op1)) {
		int64_t CVal = C->getSExtValue();
		if ((MemVT == MVT::i8 && (isInt<8>(CVal) \|\| isUInt<8>(CVal))) \|\|
		Lint: Pre-merge checks Inline Actions clang-format: please reformat the code - if ((MemVT == MVT::i8 && (isInt<8>(CVal) \|\| isUInt<8>(CVal))) \|\| + if ((MemVT == MVT::i8 && (isInt<8>(CVal) \|\| isUInt<8>(CVal))) \|\| Lint: Pre-merge checks: clang-format: please reformat the code ``` - if ((MemVT == MVT::i8 && (isInt<8>(CVal) \|\|…
		(MemVT == MVT::i16 && (isInt<16>(CVal) \|\| isUInt<16>(CVal))) \|\|
		(MemVT == MVT::i32 && (isInt<32>(CVal) \|\| isUInt<32>(CVal))))
		return DAG.getTruncStore(SN->getChain(), SDLoc(SN),
		DAG.getConstant(CVal, SDLoc(SN), MVT::i32),
		SN->getBasePtr(), MemVT, SN->getMemOperand());
		}

		// EXPERIMENTAL: replicate a byte with VREP instead of scalar mul. This is
		// the code we get from SelectionDAGs expansion of memset if not fixing it
		// to emit a vector directly. The immediate case could be generalized for
		// any bigger constant using the SystemZVectorConstantInfo...
		bool OnlyUsedByStores = true;
		for (auto *U : Op1->uses())
		if (StoreSDNode *ST = dyn_cast<StoreSDNode>(U)) {
		if (ST->isTruncatingStore() \|\|
		(!isTypeLegal(ST->getMemoryVT()) && MemVT != MVT::i16))
		OnlyUsedByStores = false;
		}
		Lint: Pre-merge checks Inline Actions clang-format: please reformat the code - } - else + } else Lint: Pre-merge checks: clang-format: please reformat the code ``` - } - else + } else ```
		else
		OnlyUsedByStores = false;

		if (BYTEREPL_FIX && OnlyUsedByStores) {
		unsigned NumMemBytes = MemVT.getStoreSizeInBits() / 8;
		uint32_t SplatVal;
		auto IsReplicatedByteImm = [&SplatVal, &NumMemBytes](uint64_t CVal) {
		SplatVal = CVal & 0xff;
		for (unsigned B = 1 ; B < NumMemBytes; B++)
		Lint: Pre-merge checks Inline Actions clang-format: please reformat the code - for (unsigned B = 1 ; B < NumMemBytes; B++) + for (unsigned B = 1; B < NumMemBytes; B++) Lint: Pre-merge checks: clang-format: please reformat the code ``` - for (unsigned B = 1 ; B < NumMemBytes; B++) +…
		if (((CVal >> (B * 8)) & 0xff) != SplatVal)
		return false;
		return true;
		};

		SDValue Byte = SDValue();
		auto IsReplicatedByteReg = [&](SDValue MulOp) {
		EVT MulVT = MulOp.getValueType();
		if (MulOp->getOpcode() == ISD::MUL &&
		(MulVT == MVT::i16 \|\| MulVT == MVT::i32 \|\| MulVT == MVT::i64)) {
		if (auto *C = dyn_cast<ConstantSDNode>(MulOp->getOperand(1)))
		if (!(IsReplicatedByteImm(C->getZExtValue()) && SplatVal == 1))
		return false;
		SDValue ZExt = MulOp->getOperand(0);
		if (ZExt->getOpcode() == ISD::ZERO_EXTEND &&
		ZExt->getOperand(0).getValueType() == MVT::i8) {
		Byte = ZExt->getOperand(0);
		return true;
		}
		}
		return false;
		};

		if (isa<BuildVectorSDNode>(Op1) && Op1.getValueType() == MVT::v2i64 &&
		IsReplicatedByteReg(Op1->getOperand(0))) {
		SDValue SplatV = DAG.getSplatVector(MVT::v16i8, SDLoc(SN), Byte);
		Lint: Pre-merge checks Inline Actions clang-format: please reformat the code - SDValue SplatV = DAG.getSplatVector(MVT::v16i8, SDLoc(SN), Byte); - return DAG.getStore(SN->getChain(), SDLoc(SN), SplatV, - SN->getBasePtr(), SN->getMemOperand()); + SDValue SplatV = DAG.getSplatVector(MVT::v16i8, SDLoc(SN), Byte); + return DAG.getStore(SN->getChain(), SDLoc(SN), SplatV, SN->getBasePtr(), + SN->getMemOperand()); Lint: Pre-merge checks: clang-format: please reformat the code ``` - SDValue SplatV = DAG.getSplatVector(MVT…
		return DAG.getStore(SN->getChain(), SDLoc(SN), SplatV,
		SN->getBasePtr(), SN->getMemOperand());
		}

		if (IsReplicatedByteReg(Op1)) {
		SDValue SplatV = DAG.getSplatVector(MVT::v16i8, SDLoc(SN), Byte);
		EVT VecVT = EVT::getVectorVT(*DAG.getContext(), MemVT,
		SystemZ::VectorBytes / NumMemBytes);
		SDValue ValueToStore =
		DAG.getNode(ISD::EXTRACT_VECTOR_ELT, SDLoc(SN), MemVT,
		Lint: Pre-merge checks Inline Actions clang-format: please reformat the code - DAG.getNode(ISD::EXTRACT_VECTOR_ELT, SDLoc(SN), MemVT, - DAG.getBitcast(VecVT, SplatV), - DAG.getVectorIdxConstant(0, SDLoc(SN))); + DAG.getNode(ISD::EXTRACT_VECTOR_ELT, SDLoc(SN), MemVT, + DAG.getBitcast(VecVT, SplatV), + DAG.getVectorIdxConstant(0, SDLoc(SN))); Lint: Pre-merge checks: clang-format: please reformat the code ``` - DAG.getNode(ISD::EXTRACT_VECTOR_ELT, SDLoc…
		DAG.getBitcast(VecVT, SplatV),
		DAG.getVectorIdxConstant(0, SDLoc(SN)));
		return DAG.getStore(SN->getChain(), SDLoc(SN), ValueToStore,
		SN->getBasePtr(), SN->getMemOperand());
		}

		// Store replicated immediate with VREPI+VST.
		APInt ConstValue;
		if (isa<BuildVectorSDNode>(Op1) && Op1.getValueType() == MVT::v2i64 &&
		ISD::isConstantSplatVector(Op1.getNode(), ConstValue) &&
		IsReplicatedByteImm(ConstValue.getZExtValue())) {
		SDValue SplatV = DAG.getSplatVector(MVT::v16i8, SDLoc(SN),
		Lint: Pre-merge checks Inline Actions clang-format: please reformat the code - SDValue SplatV = DAG.getSplatVector(MVT::v16i8, SDLoc(SN), + SDValue SplatV = + DAG.getSplatVector(MVT::v16i8, SDLoc(SN), Lint: Pre-merge checks: clang-format: please reformat the code ``` - SDValue SplatV = DAG.getSplatVector(MVT…
		DAG.getConstant(SplatVal, SDLoc(SN), MVT::i32));
		return DAG.getStore(SN->getChain(), SDLoc(SN), SplatV,
		Lint: Pre-merge checks Inline Actions clang-format: please reformat the code - return DAG.getStore(SN->getChain(), SDLoc(SN), SplatV, - SN->getBasePtr(), SN->getMemOperand()); + return DAG.getStore(SN->getChain(), SDLoc(SN), SplatV, SN->getBasePtr(), + SN->getMemOperand()); Lint: Pre-merge checks: clang-format: please reformat the code ``` - return DAG.getStore(SN->getChain(), SDLoc…
		SN->getBasePtr(), SN->getMemOperand());
		}

		if (auto *C = dyn_cast<ConstantSDNode>(Op1))
		if (IsReplicatedByteImm(C->getZExtValue())) {
		if (SplatVal == 0 \|\| SplatVal == 0xff \|\| NumMemBytes <= 2)
		return SDValue();
		SDValue SplatV = DAG.getSplatVector(MVT::v16i8, SDLoc(SN),
		Lint: Pre-merge checks Inline Actions clang-format: please reformat the code - SDValue SplatV = DAG.getSplatVector(MVT::v16i8, SDLoc(SN), - DAG.getConstant(SplatVal, SDLoc(SN), MVT::i32)); + SDValue SplatV = + DAG.getSplatVector(MVT::v16i8, SDLoc(SN), + DAG.getConstant(SplatVal, SDLoc(SN), MVT::i32)); Lint: Pre-merge checks: clang-format: please reformat the code ``` - SDValue SplatV = DAG.getSplatVector(MVT…
		DAG.getConstant(SplatVal, SDLoc(SN), MVT::i32));
		EVT VecVT = EVT::getVectorVT(*DAG.getContext(), MemVT,
		SystemZ::VectorBytes / NumMemBytes);
		SDValue ValueToStore =
		DAG.getNode(ISD::EXTRACT_VECTOR_ELT, SDLoc(SN), MemVT,
		Lint: Pre-merge checks Inline Actions clang-format: please reformat the code - DAG.getNode(ISD::EXTRACT_VECTOR_ELT, SDLoc(SN), MemVT, - DAG.getBitcast(VecVT, SplatV), - DAG.getVectorIdxConstant(0, SDLoc(SN))); + DAG.getNode(ISD::EXTRACT_VECTOR_ELT, SDLoc(SN), MemVT, + DAG.getBitcast(VecVT, SplatV), + DAG.getVectorIdxConstant(0, SDLoc(SN))); Lint: Pre-merge checks: clang-format: please reformat the code ``` - DAG.getNode(ISD::EXTRACT_VECTOR_ELT…
		DAG.getBitcast(VecVT, SplatV),
		DAG.getVectorIdxConstant(0, SDLoc(SN)));
		return DAG.getStore(SN->getChain(), SDLoc(SN), ValueToStore,
		SN->getBasePtr(), SN->getMemOperand());
		}
		}

return SDValue();		return SDValue();
}		}

SDValue SystemZTargetLowering::combineVECTOR_SHUFFLE(		SDValue SystemZTargetLowering::combineVECTOR_SHUFFLE(
SDNode *N, DAGCombinerInfo &DCI) const {		SDNode *N, DAGCombinerInfo &DCI) const {
SelectionDAG &DAG = DCI.DAG;		SelectionDAG &DAG = DCI.DAG;
// Combine element-swap (LOAD) into VLER		// Combine element-swap (LOAD) into VLER
if (ISD::isNON_EXTLoad(N->getOperand(0).getNode()) &&		if (ISD::isNON_EXTLoad(N->getOperand(0).getNode()) &&
▲ Show 20 Lines • Show All 2,526 Lines • Show Last 20 Lines

llvm/test/CodeGen/SystemZ/memcpy-03.ll

This file was added.

				; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
				; Test memcpys of small constant lengths, that should not be done with MVC.
				;
				; RUN: llc -mcpu=z15 -max-stores-memcpy=3 < %s -mtriple=s390x-linux-gnu \| FileCheck %s

				declare void @llvm.memcpy.p0i8.p0i8.i64(i8 nocapture, i8 nocapture, i64, i1) nounwind

				define void @fun16(i8* %Src, i8* %Dst, i8 %val) {
				; CHECK-LABEL: fun16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: mvc 0(16,%r3), 0(%r2)
				; CHECK-NEXT: br %r14
				call void @llvm.memcpy.p0i8.p0i8.i64(i8* align 16 %Dst, i8* align 16 %Src, i64 16, i1 false)
				ret void
				}

				define void @fun17(i8* %Src, i8* %Dst, i8 %val) {
				; CHECK-LABEL: fun17:
				; CHECK: # %bb.0:
				; CHECK-NEXT: lb %r0, 16(%r2)
				; CHECK-NEXT: stc %r0, 16(%r3)
				; CHECK-NEXT: vl %v0, 0(%r2), 4
				; CHECK-NEXT: vst %v0, 0(%r3), 4
				; CHECK-NEXT: br %r14
				call void @llvm.memcpy.p0i8.p0i8.i64(i8* align 16 %Dst, i8* align 16 %Src, i64 17, i1 false)
				ret void
				}

				define void @fun18(i8* %Src, i8* %Dst, i8 %val) {
				; CHECK-LABEL: fun18:
				; CHECK: # %bb.0:
				; CHECK-NEXT: lh %r0, 16(%r2)
				; CHECK-NEXT: sth %r0, 16(%r3)
				; CHECK-NEXT: vl %v0, 0(%r2), 4
				; CHECK-NEXT: vst %v0, 0(%r3), 4
				; CHECK-NEXT: br %r14
				call void @llvm.memcpy.p0i8.p0i8.i64(i8* align 16 %Dst, i8* align 16 %Src, i64 18, i1 false)
				ret void
				}

				define void @fun19(i8* %Src, i8* %Dst, i8 %val) {
				; CHECK-LABEL: fun19:
				; CHECK: # %bb.0:
				; CHECK-NEXT: l %r0, 15(%r2)
				; CHECK-NEXT: st %r0, 15(%r3)
				; CHECK-NEXT: vl %v0, 0(%r2), 4
				; CHECK-NEXT: vst %v0, 0(%r3), 4
				; CHECK-NEXT: br %r14
				call void @llvm.memcpy.p0i8.p0i8.i64(i8* align 16 %Dst, i8* align 16 %Src, i64 19, i1 false)
				ret void
				}

				define void @fun20(i8* %Src, i8* %Dst, i8 %val) {
				; CHECK-LABEL: fun20:
				; CHECK: # %bb.0:
				; CHECK-NEXT: l %r0, 16(%r2)
				; CHECK-NEXT: st %r0, 16(%r3)
				; CHECK-NEXT: vl %v0, 0(%r2), 4
				; CHECK-NEXT: vst %v0, 0(%r3), 4
				; CHECK-NEXT: br %r14
				call void @llvm.memcpy.p0i8.p0i8.i64(i8* align 16 %Dst, i8* align 16 %Src, i64 20, i1 false)
				ret void
				}

				define void @fun21(i8* %Src, i8* %Dst, i8 %val) {
				; CHECK-LABEL: fun21:
				; CHECK: # %bb.0:
				; CHECK-NEXT: lg %r0, 13(%r2)
				; CHECK-NEXT: stg %r0, 13(%r3)
				; CHECK-NEXT: vl %v0, 0(%r2), 4
				; CHECK-NEXT: vst %v0, 0(%r3), 4
				; CHECK-NEXT: br %r14
				call void @llvm.memcpy.p0i8.p0i8.i64(i8* align 16 %Dst, i8* align 16 %Src, i64 21, i1 false)
				ret void
				}

				define void @fun22(i8* %Src, i8* %Dst, i8 %val) {
				; CHECK-LABEL: fun22:
				; CHECK: # %bb.0:
				; CHECK-NEXT: lg %r0, 14(%r2)
				; CHECK-NEXT: stg %r0, 14(%r3)
				; CHECK-NEXT: vl %v0, 0(%r2), 4
				; CHECK-NEXT: vst %v0, 0(%r3), 4
				; CHECK-NEXT: br %r14
				call void @llvm.memcpy.p0i8.p0i8.i64(i8* align 16 %Dst, i8* align 16 %Src, i64 22, i1 false)
				ret void
				}

				define void @fun23(i8* %Src, i8* %Dst, i8 %val) {
				; CHECK-LABEL: fun23:
				; CHECK: # %bb.0:
				; CHECK-NEXT: lg %r0, 15(%r2)
				; CHECK-NEXT: stg %r0, 15(%r3)
				; CHECK-NEXT: vl %v0, 0(%r2), 4
				; CHECK-NEXT: vst %v0, 0(%r3), 4
				; CHECK-NEXT: br %r14
				call void @llvm.memcpy.p0i8.p0i8.i64(i8* align 16 %Dst, i8* align 16 %Src, i64 23, i1 false)
				ret void
				}

				define void @fun24(i8* %Src, i8* %Dst, i8 %val) {
				; CHECK-LABEL: fun24:
				; CHECK: # %bb.0:
				; CHECK-NEXT: lg %r0, 16(%r2)
				; CHECK-NEXT: stg %r0, 16(%r3)
				; CHECK-NEXT: vl %v0, 0(%r2), 4
				; CHECK-NEXT: vst %v0, 0(%r3), 4
				; CHECK-NEXT: br %r14
				call void @llvm.memcpy.p0i8.p0i8.i64(i8* align 16 %Dst, i8* align 16 %Src, i64 24, i1 false)
				ret void
				}

				define void @fun25(i8* %Src, i8* %Dst, i8 %val) {
				; CHECK-LABEL: fun25:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vl %v0, 9(%r2)
				; CHECK-NEXT: vst %v0, 9(%r3)
				; CHECK-NEXT: vl %v0, 0(%r2), 4
				; CHECK-NEXT: vst %v0, 0(%r3), 4
				; CHECK-NEXT: br %r14
				call void @llvm.memcpy.p0i8.p0i8.i64(i8* align 16 %Dst, i8* align 16 %Src, i64 25, i1 false)
				ret void
				}

				define void @fun26(i8* %Src, i8* %Dst, i8 %val) {
				; CHECK-LABEL: fun26:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vl %v0, 10(%r2)
				; CHECK-NEXT: vst %v0, 10(%r3)
				; CHECK-NEXT: vl %v0, 0(%r2), 4
				; CHECK-NEXT: vst %v0, 0(%r3), 4
				; CHECK-NEXT: br %r14
				call void @llvm.memcpy.p0i8.p0i8.i64(i8* align 16 %Dst, i8* align 16 %Src, i64 26, i1 false)
				ret void
				}

				define void @fun27(i8* %Src, i8* %Dst, i8 %val) {
				; CHECK-LABEL: fun27:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vl %v0, 11(%r2)
				; CHECK-NEXT: vst %v0, 11(%r3)
				; CHECK-NEXT: vl %v0, 0(%r2), 4
				; CHECK-NEXT: vst %v0, 0(%r3), 4
				; CHECK-NEXT: br %r14
				call void @llvm.memcpy.p0i8.p0i8.i64(i8* align 16 %Dst, i8* align 16 %Src, i64 27, i1 false)
				ret void
				}

				define void @fun28(i8* %Src, i8* %Dst, i8 %val) {
				; CHECK-LABEL: fun28:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vl %v0, 12(%r2)
				; CHECK-NEXT: vst %v0, 12(%r3)
				; CHECK-NEXT: vl %v0, 0(%r2), 4
				; CHECK-NEXT: vst %v0, 0(%r3), 4
				; CHECK-NEXT: br %r14
				call void @llvm.memcpy.p0i8.p0i8.i64(i8* align 16 %Dst, i8* align 16 %Src, i64 28, i1 false)
				ret void
				}

				define void @fun29(i8* %Src, i8* %Dst, i8 %val) {
				; CHECK-LABEL: fun29:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vl %v0, 13(%r2)
				; CHECK-NEXT: vst %v0, 13(%r3)
				; CHECK-NEXT: vl %v0, 0(%r2), 4
				; CHECK-NEXT: vst %v0, 0(%r3), 4
				; CHECK-NEXT: br %r14
				call void @llvm.memcpy.p0i8.p0i8.i64(i8* align 16 %Dst, i8* align 16 %Src, i64 29, i1 false)
				ret void
				}

				define void @fun30(i8* %Src, i8* %Dst, i8 %val) {
				; CHECK-LABEL: fun30:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vl %v0, 14(%r2)
				; CHECK-NEXT: vst %v0, 14(%r3)
				; CHECK-NEXT: vl %v0, 0(%r2), 4
				; CHECK-NEXT: vst %v0, 0(%r3), 4
				; CHECK-NEXT: br %r14
				call void @llvm.memcpy.p0i8.p0i8.i64(i8* align 16 %Dst, i8* align 16 %Src, i64 30, i1 false)
				ret void
				}

				define void @fun31(i8* %Src, i8* %Dst, i8 %val) {
				; CHECK-LABEL: fun31:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vl %v0, 15(%r2)
				; CHECK-NEXT: vst %v0, 15(%r3)
				; CHECK-NEXT: vl %v0, 0(%r2), 4
				; CHECK-NEXT: vst %v0, 0(%r3), 4
				; CHECK-NEXT: br %r14
				call void @llvm.memcpy.p0i8.p0i8.i64(i8* align 16 %Dst, i8* align 16 %Src, i64 31, i1 false)
				ret void
				}

				define void @fun32(i8* %Src, i8* %Dst, i8 %val) {
				; CHECK-LABEL: fun32:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vl %v0, 16(%r2), 4
				; CHECK-NEXT: vst %v0, 16(%r3), 4
				; CHECK-NEXT: vl %v0, 0(%r2), 4
				; CHECK-NEXT: vst %v0, 0(%r3), 4
				; CHECK-NEXT: br %r14
				call void @llvm.memcpy.p0i8.p0i8.i64(i8* align 16 %Dst, i8* align 16 %Src, i64 32, i1 false)
				ret void
				}

				define void @fun33(i8* %Src, i8* %Dst, i8 %val) {
				; CHECK-LABEL: fun33:
				; CHECK: # %bb.0:
				; CHECK-NEXT: lb %r0, 32(%r2)
				; CHECK-NEXT: stc %r0, 32(%r3)
				; CHECK-NEXT: vl %v0, 16(%r2), 4
				; CHECK-NEXT: vst %v0, 16(%r3), 4
				; CHECK-NEXT: vl %v0, 0(%r2), 4
				; CHECK-NEXT: vst %v0, 0(%r3), 4
				; CHECK-NEXT: br %r14
				call void @llvm.memcpy.p0i8.p0i8.i64(i8* align 16 %Dst, i8* align 16 %Src, i64 33, i1 false)
				ret void
				}

				define void @fun34(i8* %Src, i8* %Dst, i8 %val) {
				; CHECK-LABEL: fun34:
				; CHECK: # %bb.0:
				; CHECK-NEXT: lh %r0, 32(%r2)
				; CHECK-NEXT: sth %r0, 32(%r3)
				; CHECK-NEXT: vl %v0, 16(%r2), 4
				; CHECK-NEXT: vst %v0, 16(%r3), 4
				; CHECK-NEXT: vl %v0, 0(%r2), 4
				; CHECK-NEXT: vst %v0, 0(%r3), 4
				; CHECK-NEXT: br %r14
				call void @llvm.memcpy.p0i8.p0i8.i64(i8* align 16 %Dst, i8* align 16 %Src, i64 34, i1 false)
				ret void
				}

				define void @fun35(i8* %Src, i8* %Dst, i8 %val) {
				; CHECK-LABEL: fun35:
				; CHECK: # %bb.0:
				; CHECK-NEXT: l %r0, 31(%r2)
				; CHECK-NEXT: st %r0, 31(%r3)
				; CHECK-NEXT: vl %v0, 16(%r2), 4
				; CHECK-NEXT: vst %v0, 16(%r3), 4
				; CHECK-NEXT: vl %v0, 0(%r2), 4
				; CHECK-NEXT: vst %v0, 0(%r3), 4
				; CHECK-NEXT: br %r14
				call void @llvm.memcpy.p0i8.p0i8.i64(i8* align 16 %Dst, i8* align 16 %Src, i64 35, i1 false)
				ret void
				}

				define void @fun36(i8* %Src, i8* %Dst, i8 %val) {
				; CHECK-LABEL: fun36:
				; CHECK: # %bb.0:
				; CHECK-NEXT: l %r0, 32(%r2)
				; CHECK-NEXT: st %r0, 32(%r3)
				; CHECK-NEXT: vl %v0, 16(%r2), 4
				; CHECK-NEXT: vst %v0, 16(%r3), 4
				; CHECK-NEXT: vl %v0, 0(%r2), 4
				; CHECK-NEXT: vst %v0, 0(%r3), 4
				; CHECK-NEXT: br %r14
				call void @llvm.memcpy.p0i8.p0i8.i64(i8* align 16 %Dst, i8* align 16 %Src, i64 36, i1 false)
				ret void
				}

				define void @fun37(i8* %Src, i8* %Dst, i8 %val) {
				; CHECK-LABEL: fun37:
				; CHECK: # %bb.0:
				; CHECK-NEXT: lg %r0, 29(%r2)
				; CHECK-NEXT: stg %r0, 29(%r3)
				; CHECK-NEXT: vl %v0, 16(%r2), 4
				; CHECK-NEXT: vst %v0, 16(%r3), 4
				; CHECK-NEXT: vl %v0, 0(%r2), 4
				; CHECK-NEXT: vst %v0, 0(%r3), 4
				; CHECK-NEXT: br %r14
				call void @llvm.memcpy.p0i8.p0i8.i64(i8* align 16 %Dst, i8* align 16 %Src, i64 37, i1 false)
				ret void
				}

				define void @fun38(i8* %Src, i8* %Dst, i8 %val) {
				; CHECK-LABEL: fun38:
				; CHECK: # %bb.0:
				; CHECK-NEXT: lg %r0, 30(%r2)
				; CHECK-NEXT: stg %r0, 30(%r3)
				; CHECK-NEXT: vl %v0, 16(%r2), 4
				; CHECK-NEXT: vst %v0, 16(%r3), 4
				; CHECK-NEXT: vl %v0, 0(%r2), 4
				; CHECK-NEXT: vst %v0, 0(%r3), 4
				; CHECK-NEXT: br %r14
				call void @llvm.memcpy.p0i8.p0i8.i64(i8* align 16 %Dst, i8* align 16 %Src, i64 38, i1 false)
				ret void
				}

				define void @fun39(i8* %Src, i8* %Dst, i8 %val) {
				; CHECK-LABEL: fun39:
				; CHECK: # %bb.0:
				; CHECK-NEXT: lg %r0, 31(%r2)
				; CHECK-NEXT: stg %r0, 31(%r3)
				; CHECK-NEXT: vl %v0, 16(%r2), 4
				; CHECK-NEXT: vst %v0, 16(%r3), 4
				; CHECK-NEXT: vl %v0, 0(%r2), 4
				; CHECK-NEXT: vst %v0, 0(%r3), 4
				; CHECK-NEXT: br %r14
				call void @llvm.memcpy.p0i8.p0i8.i64(i8* align 16 %Dst, i8* align 16 %Src, i64 39, i1 false)
				ret void
				}

				define void @fun40(i8* %Src, i8* %Dst, i8 %val) {
				; CHECK-LABEL: fun40:
				; CHECK: # %bb.0:
				; CHECK-NEXT: lg %r0, 32(%r2)
				; CHECK-NEXT: stg %r0, 32(%r3)
				; CHECK-NEXT: vl %v0, 16(%r2), 4
				; CHECK-NEXT: vst %v0, 16(%r3), 4
				; CHECK-NEXT: vl %v0, 0(%r2), 4
				; CHECK-NEXT: vst %v0, 0(%r3), 4
				; CHECK-NEXT: br %r14
				call void @llvm.memcpy.p0i8.p0i8.i64(i8* align 16 %Dst, i8* align 16 %Src, i64 40, i1 false)
				ret void
				}

				define void @fun41(i8* %Src, i8* %Dst, i8 %val) {
				; CHECK-LABEL: fun41:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vl %v0, 25(%r2)
				; CHECK-NEXT: vst %v0, 25(%r3)
				; CHECK-NEXT: vl %v0, 16(%r2), 4
				; CHECK-NEXT: vst %v0, 16(%r3), 4
				; CHECK-NEXT: vl %v0, 0(%r2), 4
				; CHECK-NEXT: vst %v0, 0(%r3), 4
				; CHECK-NEXT: br %r14
				call void @llvm.memcpy.p0i8.p0i8.i64(i8* align 16 %Dst, i8* align 16 %Src, i64 41, i1 false)
				ret void
				}

				define void @fun42(i8* %Src, i8* %Dst, i8 %val) {
				; CHECK-LABEL: fun42:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vl %v0, 26(%r2)
				; CHECK-NEXT: vst %v0, 26(%r3)
				; CHECK-NEXT: vl %v0, 16(%r2), 4
				; CHECK-NEXT: vst %v0, 16(%r3), 4
				; CHECK-NEXT: vl %v0, 0(%r2), 4
				; CHECK-NEXT: vst %v0, 0(%r3), 4
				; CHECK-NEXT: br %r14
				call void @llvm.memcpy.p0i8.p0i8.i64(i8* align 16 %Dst, i8* align 16 %Src, i64 42, i1 false)
				ret void
				}

				define void @fun43(i8* %Src, i8* %Dst, i8 %val) {
				; CHECK-LABEL: fun43:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vl %v0, 27(%r2)
				; CHECK-NEXT: vst %v0, 27(%r3)
				; CHECK-NEXT: vl %v0, 16(%r2), 4
				; CHECK-NEXT: vst %v0, 16(%r3), 4
				; CHECK-NEXT: vl %v0, 0(%r2), 4
				; CHECK-NEXT: vst %v0, 0(%r3), 4
				; CHECK-NEXT: br %r14
				call void @llvm.memcpy.p0i8.p0i8.i64(i8* align 16 %Dst, i8* align 16 %Src, i64 43, i1 false)
				ret void
				}

				define void @fun44(i8* %Src, i8* %Dst, i8 %val) {
				; CHECK-LABEL: fun44:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vl %v0, 28(%r2)
				; CHECK-NEXT: vst %v0, 28(%r3)
				; CHECK-NEXT: vl %v0, 16(%r2), 4
				; CHECK-NEXT: vst %v0, 16(%r3), 4
				; CHECK-NEXT: vl %v0, 0(%r2), 4
				; CHECK-NEXT: vst %v0, 0(%r3), 4
				; CHECK-NEXT: br %r14
				call void @llvm.memcpy.p0i8.p0i8.i64(i8* align 16 %Dst, i8* align 16 %Src, i64 44, i1 false)
				ret void
				}

				define void @fun45(i8* %Src, i8* %Dst, i8 %val) {
				; CHECK-LABEL: fun45:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vl %v0, 29(%r2)
				; CHECK-NEXT: vst %v0, 29(%r3)
				; CHECK-NEXT: vl %v0, 16(%r2), 4
				; CHECK-NEXT: vst %v0, 16(%r3), 4
				; CHECK-NEXT: vl %v0, 0(%r2), 4
				; CHECK-NEXT: vst %v0, 0(%r3), 4
				; CHECK-NEXT: br %r14
				call void @llvm.memcpy.p0i8.p0i8.i64(i8* align 16 %Dst, i8* align 16 %Src, i64 45, i1 false)
				ret void
				}

				define void @fun46(i8* %Src, i8* %Dst, i8 %val) {
				; CHECK-LABEL: fun46:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vl %v0, 30(%r2)
				; CHECK-NEXT: vst %v0, 30(%r3)
				; CHECK-NEXT: vl %v0, 16(%r2), 4
				; CHECK-NEXT: vst %v0, 16(%r3), 4
				; CHECK-NEXT: vl %v0, 0(%r2), 4
				; CHECK-NEXT: vst %v0, 0(%r3), 4
				; CHECK-NEXT: br %r14
				call void @llvm.memcpy.p0i8.p0i8.i64(i8* align 16 %Dst, i8* align 16 %Src, i64 46, i1 false)
				ret void
				}

				define void @fun47(i8* %Src, i8* %Dst, i8 %val) {
				; CHECK-LABEL: fun47:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vl %v0, 31(%r2)
				; CHECK-NEXT: vst %v0, 31(%r3)
				; CHECK-NEXT: vl %v0, 16(%r2), 4
				; CHECK-NEXT: vst %v0, 16(%r3), 4
				; CHECK-NEXT: vl %v0, 0(%r2), 4
				; CHECK-NEXT: vst %v0, 0(%r3), 4
				; CHECK-NEXT: br %r14
				call void @llvm.memcpy.p0i8.p0i8.i64(i8* align 16 %Dst, i8* align 16 %Src, i64 47, i1 false)
				ret void
				}

				define void @fun48(i8* %Src, i8* %Dst, i8 %val) {
				; CHECK-LABEL: fun48:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vl %v0, 32(%r2), 4
				; CHECK-NEXT: vst %v0, 32(%r3), 4
				; CHECK-NEXT: vl %v0, 16(%r2), 4
				; CHECK-NEXT: vst %v0, 16(%r3), 4
				; CHECK-NEXT: vl %v0, 0(%r2), 4
				; CHECK-NEXT: vst %v0, 0(%r3), 4
				; CHECK-NEXT: br %r14
				call void @llvm.memcpy.p0i8.p0i8.i64(i8* align 16 %Dst, i8* align 16 %Src, i64 48, i1 false)
				ret void
				}

				define void @fun49(i8* %Src, i8* %Dst, i8 %val) {
				; CHECK-LABEL: fun49:
				; CHECK: # %bb.0:
				; CHECK-NEXT: mvc 0(49,%r3), 0(%r2)
				; CHECK-NEXT: br %r14
				call void @llvm.memcpy.p0i8.p0i8.i64(i8* align 16 %Dst, i8* align 16 %Src, i64 49, i1 false)
				ret void
				}

llvm/test/CodeGen/SystemZ/memset-08.ll

This file was added.

				; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
				; Test memsets of small constant lengths, that should not be done with MVC.
				;
				; RUN: llc -mcpu=z15 -max-stores-memset=3 \
				; RUN: < %s -mtriple=s390x-linux-gnu \| FileCheck %s

				declare void @llvm.memset.p0i8.i64(i8* nocapture writeonly, i8, i64, i1 immarg)

				define void @reg16(i8* %Src, i8* %Dst, i8 %val) {
				; CHECK-LABEL: reg16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: stc %r4, 0(%r3)
				; CHECK-NEXT: mvc 1(15,%r3), 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 %val, i64 16, i1 false)
				ret void
				}

				define void @reg17(i8* %Src, i8* %Dst, i8 %val) {
				; CHECK-LABEL: reg17:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vlvgp %v0, %r4, %r4
				; CHECK-NEXT: vrepb %v0, %v0, 7
				; CHECK-NEXT: stc %r4, 16(%r3)
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 %val, i64 17, i1 false)
				ret void
				}

				define void @reg18(i8* %Src, i8* %Dst, i8 %val) {
				; CHECK-LABEL: reg18:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vlvgp %v0, %r4, %r4
				; CHECK-NEXT: vrepb %v0, %v0, 7
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: vsteh %v0, 16(%r3), 0
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 %val, i64 18, i1 false)
				ret void
				}

				define void @reg19(i8* %Src, i8* %Dst, i8 %val) {
				; CHECK-LABEL: reg19:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vlvgp %v0, %r4, %r4
				; CHECK-NEXT: vrepb %v0, %v0, 7
				; CHECK-NEXT: vstef %v0, 15(%r3), 0
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 %val, i64 19, i1 false)
				ret void
				}

				define void @reg20(i8* %Src, i8* %Dst, i8 %val) {
				; CHECK-LABEL: reg20:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vlvgp %v0, %r4, %r4
				; CHECK-NEXT: vrepb %v0, %v0, 7
				; CHECK-NEXT: vstef %v0, 16(%r3), 0
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 %val, i64 20, i1 false)
				ret void
				}

				define void @reg21(i8* %Src, i8* %Dst, i8 %val) {
				; CHECK-LABEL: reg21:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vlvgp %v0, %r4, %r4
				; CHECK-NEXT: vrepb %v0, %v0, 7
				; CHECK-NEXT: vsteg %v0, 13(%r3), 0
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 %val, i64 21, i1 false)
				ret void
				}

				define void @reg22(i8* %Src, i8* %Dst, i8 %val) {
				; CHECK-LABEL: reg22:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vlvgp %v0, %r4, %r4
				; CHECK-NEXT: vrepb %v0, %v0, 7
				; CHECK-NEXT: vsteg %v0, 14(%r3), 0
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 %val, i64 22, i1 false)
				ret void
				}

				define void @reg23(i8* %Src, i8* %Dst, i8 %val) {
				; CHECK-LABEL: reg23:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vlvgp %v0, %r4, %r4
				; CHECK-NEXT: vrepb %v0, %v0, 7
				; CHECK-NEXT: vsteg %v0, 15(%r3), 0
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 %val, i64 23, i1 false)
				ret void
				}

				define void @reg24(i8* %Src, i8* %Dst, i8 %val) {
				; CHECK-LABEL: reg24:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vlvgp %v0, %r4, %r4
				; CHECK-NEXT: vrepb %v0, %v0, 7
				; CHECK-NEXT: vsteg %v0, 16(%r3), 0
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 %val, i64 24, i1 false)
				ret void
				}

				define void @reg25(i8* %Src, i8* %Dst, i8 %val) {
				; CHECK-LABEL: reg25:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vlvgp %v0, %r4, %r4
				; CHECK-NEXT: vrepb %v0, %v0, 7
				; CHECK-NEXT: vst %v0, 9(%r3)
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 %val, i64 25, i1 false)
				ret void
				}

				define void @reg26(i8* %Src, i8* %Dst, i8 %val) {
				; CHECK-LABEL: reg26:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vlvgp %v0, %r4, %r4
				; CHECK-NEXT: vrepb %v0, %v0, 7
				; CHECK-NEXT: vst %v0, 10(%r3)
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 %val, i64 26, i1 false)
				ret void
				}

				define void @reg27(i8* %Src, i8* %Dst, i8 %val) {
				; CHECK-LABEL: reg27:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vlvgp %v0, %r4, %r4
				; CHECK-NEXT: vrepb %v0, %v0, 7
				; CHECK-NEXT: vst %v0, 11(%r3)
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 %val, i64 27, i1 false)
				ret void
				}

				define void @reg28(i8* %Src, i8* %Dst, i8 %val) {
				; CHECK-LABEL: reg28:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vlvgp %v0, %r4, %r4
				; CHECK-NEXT: vrepb %v0, %v0, 7
				; CHECK-NEXT: vst %v0, 12(%r3)
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 %val, i64 28, i1 false)
				ret void
				}

				define void @reg29(i8* %Src, i8* %Dst, i8 %val) {
				; CHECK-LABEL: reg29:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vlvgp %v0, %r4, %r4
				; CHECK-NEXT: vrepb %v0, %v0, 7
				; CHECK-NEXT: vst %v0, 13(%r3)
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 %val, i64 29, i1 false)
				ret void
				}

				define void @reg30(i8* %Src, i8* %Dst, i8 %val) {
				; CHECK-LABEL: reg30:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vlvgp %v0, %r4, %r4
				; CHECK-NEXT: vrepb %v0, %v0, 7
				; CHECK-NEXT: vst %v0, 14(%r3)
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 %val, i64 30, i1 false)
				ret void
				}

				define void @reg31(i8* %Src, i8* %Dst, i8 %val) {
				; CHECK-LABEL: reg31:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vlvgp %v0, %r4, %r4
				; CHECK-NEXT: vrepb %v0, %v0, 7
				; CHECK-NEXT: vst %v0, 15(%r3)
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 %val, i64 31, i1 false)
				ret void
				}

				define void @reg32(i8* %Src, i8* %Dst, i8 %val) {
				; CHECK-LABEL: reg32:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vlvgp %v0, %r4, %r4
				; CHECK-NEXT: vrepb %v0, %v0, 7
				; CHECK-NEXT: vst %v0, 16(%r3)
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 %val, i64 32, i1 false)
				ret void
				}

				define void @reg33(i8* %Src, i8* %Dst, i8 %val) {
				; CHECK-LABEL: reg33:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vlvgp %v0, %r4, %r4
				; CHECK-NEXT: vrepb %v0, %v0, 7
				; CHECK-NEXT: stc %r4, 32(%r3)
				; CHECK-NEXT: vst %v0, 16(%r3)
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 %val, i64 33, i1 false)
				ret void
				}

				define void @reg34(i8* %Src, i8* %Dst, i8 %val) {
				; CHECK-LABEL: reg34:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vlvgp %v0, %r4, %r4
				; CHECK-NEXT: vrepb %v0, %v0, 7
				; CHECK-NEXT: vst %v0, 16(%r3)
				; CHECK-NEXT: vsteh %v0, 32(%r3), 0
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 %val, i64 34, i1 false)
				ret void
				}

				define void @reg35(i8* %Src, i8* %Dst, i8 %val) {
				; CHECK-LABEL: reg35:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vlvgp %v0, %r4, %r4
				; CHECK-NEXT: vrepb %v0, %v0, 7
				; CHECK-NEXT: vstef %v0, 31(%r3), 0
				; CHECK-NEXT: vst %v0, 16(%r3)
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 %val, i64 35, i1 false)
				ret void
				}

				define void @reg36(i8* %Src, i8* %Dst, i8 %val) {
				; CHECK-LABEL: reg36:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vlvgp %v0, %r4, %r4
				; CHECK-NEXT: vrepb %v0, %v0, 7
				; CHECK-NEXT: vstef %v0, 32(%r3), 0
				; CHECK-NEXT: vst %v0, 16(%r3)
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 %val, i64 36, i1 false)
				ret void
				}

				define void @reg37(i8* %Src, i8* %Dst, i8 %val) {
				; CHECK-LABEL: reg37:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vlvgp %v0, %r4, %r4
				; CHECK-NEXT: vrepb %v0, %v0, 7
				; CHECK-NEXT: vsteg %v0, 29(%r3), 0
				; CHECK-NEXT: vst %v0, 16(%r3)
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 %val, i64 37, i1 false)
				ret void
				}

				define void @reg38(i8* %Src, i8* %Dst, i8 %val) {
				; CHECK-LABEL: reg38:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vlvgp %v0, %r4, %r4
				; CHECK-NEXT: vrepb %v0, %v0, 7
				; CHECK-NEXT: vsteg %v0, 30(%r3), 0
				; CHECK-NEXT: vst %v0, 16(%r3)
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 %val, i64 38, i1 false)
				ret void
				}

				define void @reg39(i8* %Src, i8* %Dst, i8 %val) {
				; CHECK-LABEL: reg39:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vlvgp %v0, %r4, %r4
				; CHECK-NEXT: vrepb %v0, %v0, 7
				; CHECK-NEXT: vsteg %v0, 31(%r3), 0
				; CHECK-NEXT: vst %v0, 16(%r3)
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 %val, i64 39, i1 false)
				ret void
				}

				define void @reg40(i8* %Src, i8* %Dst, i8 %val) {
				; CHECK-LABEL: reg40:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vlvgp %v0, %r4, %r4
				; CHECK-NEXT: vrepb %v0, %v0, 7
				; CHECK-NEXT: vsteg %v0, 32(%r3), 0
				; CHECK-NEXT: vst %v0, 16(%r3)
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 %val, i64 40, i1 false)
				ret void
				}

				define void @reg41(i8* %Src, i8* %Dst, i8 %val) {
				; CHECK-LABEL: reg41:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vlvgp %v0, %r4, %r4
				; CHECK-NEXT: vrepb %v0, %v0, 7
				; CHECK-NEXT: vst %v0, 25(%r3)
				; CHECK-NEXT: vst %v0, 16(%r3)
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 %val, i64 41, i1 false)
				ret void
				}

				define void @reg42(i8* %Src, i8* %Dst, i8 %val) {
				; CHECK-LABEL: reg42:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vlvgp %v0, %r4, %r4
				; CHECK-NEXT: vrepb %v0, %v0, 7
				; CHECK-NEXT: vst %v0, 26(%r3)
				; CHECK-NEXT: vst %v0, 16(%r3)
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 %val, i64 42, i1 false)
				ret void
				}

				define void @reg43(i8* %Src, i8* %Dst, i8 %val) {
				; CHECK-LABEL: reg43:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vlvgp %v0, %r4, %r4
				; CHECK-NEXT: vrepb %v0, %v0, 7
				; CHECK-NEXT: vst %v0, 27(%r3)
				; CHECK-NEXT: vst %v0, 16(%r3)
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 %val, i64 43, i1 false)
				ret void
				}

				define void @reg44(i8* %Src, i8* %Dst, i8 %val) {
				; CHECK-LABEL: reg44:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vlvgp %v0, %r4, %r4
				; CHECK-NEXT: vrepb %v0, %v0, 7
				; CHECK-NEXT: vst %v0, 28(%r3)
				; CHECK-NEXT: vst %v0, 16(%r3)
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 %val, i64 44, i1 false)
				ret void
				}

				define void @reg45(i8* %Src, i8* %Dst, i8 %val) {
				; CHECK-LABEL: reg45:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vlvgp %v0, %r4, %r4
				; CHECK-NEXT: vrepb %v0, %v0, 7
				; CHECK-NEXT: vst %v0, 29(%r3)
				; CHECK-NEXT: vst %v0, 16(%r3)
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 %val, i64 45, i1 false)
				ret void
				}

				define void @reg46(i8* %Src, i8* %Dst, i8 %val) {
				; CHECK-LABEL: reg46:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vlvgp %v0, %r4, %r4
				; CHECK-NEXT: vrepb %v0, %v0, 7
				; CHECK-NEXT: vst %v0, 30(%r3)
				; CHECK-NEXT: vst %v0, 16(%r3)
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 %val, i64 46, i1 false)
				ret void
				}

				define void @reg47(i8* %Src, i8* %Dst, i8 %val) {
				; CHECK-LABEL: reg47:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vlvgp %v0, %r4, %r4
				; CHECK-NEXT: vrepb %v0, %v0, 7
				; CHECK-NEXT: vst %v0, 31(%r3)
				; CHECK-NEXT: vst %v0, 16(%r3)
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 %val, i64 47, i1 false)
				ret void
				}

				define void @reg48(i8* %Src, i8* %Dst, i8 %val) {
				; CHECK-LABEL: reg48:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vlvgp %v0, %r4, %r4
				; CHECK-NEXT: vrepb %v0, %v0, 7
				; CHECK-NEXT: vst %v0, 32(%r3)
				; CHECK-NEXT: vst %v0, 16(%r3)
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 %val, i64 48, i1 false)
				ret void
				}

				define void @reg49(i8* %Src, i8* %Dst, i8 %val) {
				; CHECK-LABEL: reg49:
				; CHECK: # %bb.0:
				; CHECK-NEXT: stc %r4, 0(%r3)
				; CHECK-NEXT: mvc 1(48,%r3), 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 %val, i64 49, i1 false)
				ret void
				}

				; Same, but with an immediate. First all ones, which is a special case.

				define void @ones16(i8* %Src, i8* %Dst) {
				; CHECK-LABEL: ones16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: mvghi 8(%r3), -1
				; CHECK-NEXT: mvghi 0(%r3), -1
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 -1, i64 16, i1 false)
				ret void
				}

				define void @ones17(i8* %Src, i8* %Dst) {
				; CHECK-LABEL: ones17:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vgbm %v0, 65535
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: mvi 16(%r3), 255
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 -1, i64 17, i1 false)
				ret void
				}

				define void @ones18(i8* %Src, i8* %Dst) {
				; CHECK-LABEL: ones18:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vgbm %v0, 65535
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: mvhhi 16(%r3), -1
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 -1, i64 18, i1 false)
				ret void
				}

				define void @ones19(i8* %Src, i8* %Dst) {
				; CHECK-LABEL: ones19:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vgbm %v0, 65535
				; CHECK-NEXT: vstef %v0, 15(%r3), 0
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 -1, i64 19, i1 false)
				ret void
				}

				define void @ones20(i8* %Src, i8* %Dst) {
				; CHECK-LABEL: ones20:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vgbm %v0, 65535
				; CHECK-NEXT: vstef %v0, 16(%r3), 0
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 -1, i64 20, i1 false)
				ret void
				}

				define void @ones21(i8* %Src, i8* %Dst) {
				; CHECK-LABEL: ones21:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vgbm %v0, 65535
				; CHECK-NEXT: vsteg %v0, 13(%r3), 0
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 -1, i64 21, i1 false)
				ret void
				}

				define void @ones22(i8* %Src, i8* %Dst) {
				; CHECK-LABEL: ones22:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vgbm %v0, 65535
				; CHECK-NEXT: vsteg %v0, 14(%r3), 0
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 -1, i64 22, i1 false)
				ret void
				}

				define void @ones23(i8* %Src, i8* %Dst) {
				; CHECK-LABEL: ones23:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vgbm %v0, 65535
				; CHECK-NEXT: vsteg %v0, 15(%r3), 0
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 -1, i64 23, i1 false)
				ret void
				}

				define void @ones24(i8* %Src, i8* %Dst) {
				; CHECK-LABEL: ones24:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vgbm %v0, 65535
				; CHECK-NEXT: vsteg %v0, 16(%r3), 0
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 -1, i64 24, i1 false)
				ret void
				}

				define void @ones25(i8* %Src, i8* %Dst) {
				; CHECK-LABEL: ones25:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vgbm %v0, 65535
				; CHECK-NEXT: vst %v0, 9(%r3)
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 -1, i64 25, i1 false)
				ret void
				}

				define void @ones26(i8* %Src, i8* %Dst) {
				; CHECK-LABEL: ones26:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vgbm %v0, 65535
				; CHECK-NEXT: vst %v0, 10(%r3)
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 -1, i64 26, i1 false)
				ret void
				}

				define void @ones27(i8* %Src, i8* %Dst) {
				; CHECK-LABEL: ones27:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vgbm %v0, 65535
				; CHECK-NEXT: vst %v0, 11(%r3)
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 -1, i64 27, i1 false)
				ret void
				}

				define void @ones28(i8* %Src, i8* %Dst) {
				; CHECK-LABEL: ones28:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vgbm %v0, 65535
				; CHECK-NEXT: vst %v0, 12(%r3)
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 -1, i64 28, i1 false)
				ret void
				}

				define void @ones29(i8* %Src, i8* %Dst) {
				; CHECK-LABEL: ones29:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vgbm %v0, 65535
				; CHECK-NEXT: vst %v0, 13(%r3)
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 -1, i64 29, i1 false)
				ret void
				}

				define void @ones30(i8* %Src, i8* %Dst) {
				; CHECK-LABEL: ones30:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vgbm %v0, 65535
				; CHECK-NEXT: vst %v0, 14(%r3)
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 -1, i64 30, i1 false)
				ret void
				}

				define void @ones31(i8* %Src, i8* %Dst) {
				; CHECK-LABEL: ones31:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vgbm %v0, 65535
				; CHECK-NEXT: vst %v0, 15(%r3)
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 -1, i64 31, i1 false)
				ret void
				}

				define void @ones32(i8* %Src, i8* %Dst) {
				; CHECK-LABEL: ones32:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vgbm %v0, 65535
				; CHECK-NEXT: vst %v0, 16(%r3)
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 -1, i64 32, i1 false)
				ret void
				}

				define void @ones33(i8* %Src, i8* %Dst) {
				; CHECK-LABEL: ones33:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vgbm %v0, 65535
				; CHECK-NEXT: vst %v0, 16(%r3)
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: mvi 32(%r3), 255
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 -1, i64 33, i1 false)
				ret void
				}

				define void @ones34(i8* %Src, i8* %Dst) {
				; CHECK-LABEL: ones34:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vgbm %v0, 65535
				; CHECK-NEXT: vst %v0, 16(%r3)
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: mvhhi 32(%r3), -1
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 -1, i64 34, i1 false)
				ret void
				}

				define void @ones35(i8* %Src, i8* %Dst) {
				; CHECK-LABEL: ones35:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vgbm %v0, 65535
				; CHECK-NEXT: vstef %v0, 31(%r3), 0
				; CHECK-NEXT: vst %v0, 16(%r3)
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 -1, i64 35, i1 false)
				ret void
				}

				define void @ones36(i8* %Src, i8* %Dst) {
				; CHECK-LABEL: ones36:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vgbm %v0, 65535
				; CHECK-NEXT: vstef %v0, 32(%r3), 0
				; CHECK-NEXT: vst %v0, 16(%r3)
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 -1, i64 36, i1 false)
				ret void
				}

				define void @ones37(i8* %Src, i8* %Dst) {
				; CHECK-LABEL: ones37:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vgbm %v0, 65535
				; CHECK-NEXT: vsteg %v0, 29(%r3), 0
				; CHECK-NEXT: vst %v0, 16(%r3)
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 -1, i64 37, i1 false)
				ret void
				}

				define void @ones38(i8* %Src, i8* %Dst) {
				; CHECK-LABEL: ones38:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vgbm %v0, 65535
				; CHECK-NEXT: vsteg %v0, 30(%r3), 0
				; CHECK-NEXT: vst %v0, 16(%r3)
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 -1, i64 38, i1 false)
				ret void
				}

				define void @ones39(i8* %Src, i8* %Dst) {
				; CHECK-LABEL: ones39:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vgbm %v0, 65535
				; CHECK-NEXT: vsteg %v0, 31(%r3), 0
				; CHECK-NEXT: vst %v0, 16(%r3)
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 -1, i64 39, i1 false)
				ret void
				}

				define void @ones40(i8* %Src, i8* %Dst) {
				; CHECK-LABEL: ones40:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vgbm %v0, 65535
				; CHECK-NEXT: vsteg %v0, 32(%r3), 0
				; CHECK-NEXT: vst %v0, 16(%r3)
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 -1, i64 40, i1 false)
				ret void
				}

				define void @ones41(i8* %Src, i8* %Dst) {
				; CHECK-LABEL: ones41:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vgbm %v0, 65535
				; CHECK-NEXT: vst %v0, 25(%r3)
				; CHECK-NEXT: vst %v0, 16(%r3)
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 -1, i64 41, i1 false)
				ret void
				}

				define void @ones42(i8* %Src, i8* %Dst) {
				; CHECK-LABEL: ones42:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vgbm %v0, 65535
				; CHECK-NEXT: vst %v0, 26(%r3)
				; CHECK-NEXT: vst %v0, 16(%r3)
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 -1, i64 42, i1 false)
				ret void
				}

				define void @ones43(i8* %Src, i8* %Dst) {
				; CHECK-LABEL: ones43:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vgbm %v0, 65535
				; CHECK-NEXT: vst %v0, 27(%r3)
				; CHECK-NEXT: vst %v0, 16(%r3)
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 -1, i64 43, i1 false)
				ret void
				}

				define void @ones44(i8* %Src, i8* %Dst) {
				; CHECK-LABEL: ones44:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vgbm %v0, 65535
				; CHECK-NEXT: vst %v0, 28(%r3)
				; CHECK-NEXT: vst %v0, 16(%r3)
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 -1, i64 44, i1 false)
				ret void
				}

				define void @ones45(i8* %Src, i8* %Dst) {
				; CHECK-LABEL: ones45:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vgbm %v0, 65535
				; CHECK-NEXT: vst %v0, 29(%r3)
				; CHECK-NEXT: vst %v0, 16(%r3)
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 -1, i64 45, i1 false)
				ret void
				}

				define void @ones46(i8* %Src, i8* %Dst) {
				; CHECK-LABEL: ones46:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vgbm %v0, 65535
				; CHECK-NEXT: vst %v0, 30(%r3)
				; CHECK-NEXT: vst %v0, 16(%r3)
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 -1, i64 46, i1 false)
				ret void
				}

				define void @ones47(i8* %Src, i8* %Dst) {
				; CHECK-LABEL: ones47:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vgbm %v0, 65535
				; CHECK-NEXT: vst %v0, 31(%r3)
				; CHECK-NEXT: vst %v0, 16(%r3)
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 -1, i64 47, i1 false)
				ret void
				}

				define void @ones48(i8* %Src, i8* %Dst) {
				; CHECK-LABEL: ones48:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vgbm %v0, 65535
				; CHECK-NEXT: vst %v0, 32(%r3)
				; CHECK-NEXT: vst %v0, 16(%r3)
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 -1, i64 48, i1 false)
				ret void
				}

				define void @ones49(i8* %Src, i8* %Dst) {
				; CHECK-LABEL: ones49:
				; CHECK: # %bb.0:
				; CHECK-NEXT: mvi 0(%r3), 255
				; CHECK-NEXT: mvc 1(48,%r3), 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 -1, i64 49, i1 false)
				ret void
				}

				; Some, other immediate.

				define void @other16(i8* %Src, i8* %Dst) {
				; CHECK-LABEL: other16:
				; CHECK: # %bb.0:
				; CHECK-NEXT: mvi 0(%r3), 1
				; CHECK-NEXT: mvc 1(15,%r3), 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 1, i64 16, i1 false)
				ret void
				}

				define void @other17(i8* %Src, i8* %Dst) {
				; CHECK-LABEL: other17:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vrepib %v0, 1
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: mvi 16(%r3), 1
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 1, i64 17, i1 false)
				ret void
				}

				define void @other18(i8* %Src, i8* %Dst) {
				; CHECK-LABEL: other18:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vrepib %v0, 1
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: mvhhi 16(%r3), 257
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 1, i64 18, i1 false)
				ret void
				}

				define void @other19(i8* %Src, i8* %Dst) {
				; CHECK-LABEL: other19:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vrepib %v0, 1
				; CHECK-NEXT: vstef %v0, 15(%r3), 0
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 1, i64 19, i1 false)
				ret void
				}

				define void @other20(i8* %Src, i8* %Dst) {
				; CHECK-LABEL: other20:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vrepib %v0, 1
				; CHECK-NEXT: vstef %v0, 16(%r3), 0
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 1, i64 20, i1 false)
				ret void
				}

				define void @other21(i8* %Src, i8* %Dst) {
				; CHECK-LABEL: other21:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vrepib %v0, 1
				; CHECK-NEXT: vsteg %v0, 13(%r3), 0
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 1, i64 21, i1 false)
				ret void
				}

				define void @other22(i8* %Src, i8* %Dst) {
				; CHECK-LABEL: other22:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vrepib %v0, 1
				; CHECK-NEXT: vsteg %v0, 14(%r3), 0
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 1, i64 22, i1 false)
				ret void
				}

				define void @other23(i8* %Src, i8* %Dst) {
				; CHECK-LABEL: other23:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vrepib %v0, 1
				; CHECK-NEXT: vsteg %v0, 15(%r3), 0
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 1, i64 23, i1 false)
				ret void
				}

				define void @other24(i8* %Src, i8* %Dst) {
				; CHECK-LABEL: other24:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vrepib %v0, 1
				; CHECK-NEXT: vsteg %v0, 16(%r3), 0
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 1, i64 24, i1 false)
				ret void
				}

				define void @other25(i8* %Src, i8* %Dst) {
				; CHECK-LABEL: other25:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vrepib %v0, 1
				; CHECK-NEXT: vst %v0, 9(%r3)
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 1, i64 25, i1 false)
				ret void
				}

				define void @other26(i8* %Src, i8* %Dst) {
				; CHECK-LABEL: other26:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vrepib %v0, 1
				; CHECK-NEXT: vst %v0, 10(%r3)
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 1, i64 26, i1 false)
				ret void
				}

				define void @other27(i8* %Src, i8* %Dst) {
				; CHECK-LABEL: other27:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vrepib %v0, 1
				; CHECK-NEXT: vst %v0, 11(%r3)
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 1, i64 27, i1 false)
				ret void
				}

				define void @other28(i8* %Src, i8* %Dst) {
				; CHECK-LABEL: other28:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vrepib %v0, 1
				; CHECK-NEXT: vst %v0, 12(%r3)
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 1, i64 28, i1 false)
				ret void
				}

				define void @other29(i8* %Src, i8* %Dst) {
				; CHECK-LABEL: other29:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vrepib %v0, 1
				; CHECK-NEXT: vst %v0, 13(%r3)
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 1, i64 29, i1 false)
				ret void
				}

				define void @other30(i8* %Src, i8* %Dst) {
				; CHECK-LABEL: other30:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vrepib %v0, 1
				; CHECK-NEXT: vst %v0, 14(%r3)
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 1, i64 30, i1 false)
				ret void
				}

				define void @other31(i8* %Src, i8* %Dst) {
				; CHECK-LABEL: other31:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vrepib %v0, 1
				; CHECK-NEXT: vst %v0, 15(%r3)
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 1, i64 31, i1 false)
				ret void
				}

				define void @other32(i8* %Src, i8* %Dst) {
				; CHECK-LABEL: other32:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vrepib %v0, 1
				; CHECK-NEXT: vst %v0, 16(%r3)
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 1, i64 32, i1 false)
				ret void
				}

				define void @other33(i8* %Src, i8* %Dst) {
				; CHECK-LABEL: other33:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vrepib %v0, 1
				; CHECK-NEXT: vst %v0, 16(%r3)
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: mvi 32(%r3), 1
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 1, i64 33, i1 false)
				ret void
				}

				define void @other34(i8* %Src, i8* %Dst) {
				; CHECK-LABEL: other34:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vrepib %v0, 1
				; CHECK-NEXT: vst %v0, 16(%r3)
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: mvhhi 32(%r3), 257
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 1, i64 34, i1 false)
				ret void
				}

				define void @other35(i8* %Src, i8* %Dst) {
				; CHECK-LABEL: other35:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vrepib %v0, 1
				; CHECK-NEXT: vstef %v0, 31(%r3), 0
				; CHECK-NEXT: vst %v0, 16(%r3)
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 1, i64 35, i1 false)
				ret void
				}

				define void @other36(i8* %Src, i8* %Dst) {
				; CHECK-LABEL: other36:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vrepib %v0, 1
				; CHECK-NEXT: vstef %v0, 32(%r3), 0
				; CHECK-NEXT: vst %v0, 16(%r3)
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 1, i64 36, i1 false)
				ret void
				}

				define void @other37(i8* %Src, i8* %Dst) {
				; CHECK-LABEL: other37:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vrepib %v0, 1
				; CHECK-NEXT: vsteg %v0, 29(%r3), 0
				; CHECK-NEXT: vst %v0, 16(%r3)
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 1, i64 37, i1 false)
				ret void
				}

				define void @other38(i8* %Src, i8* %Dst) {
				; CHECK-LABEL: other38:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vrepib %v0, 1
				; CHECK-NEXT: vsteg %v0, 30(%r3), 0
				; CHECK-NEXT: vst %v0, 16(%r3)
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 1, i64 38, i1 false)
				ret void
				}

				define void @other39(i8* %Src, i8* %Dst) {
				; CHECK-LABEL: other39:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vrepib %v0, 1
				; CHECK-NEXT: vsteg %v0, 31(%r3), 0
				; CHECK-NEXT: vst %v0, 16(%r3)
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 1, i64 39, i1 false)
				ret void
				}

				define void @other40(i8* %Src, i8* %Dst) {
				; CHECK-LABEL: other40:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vrepib %v0, 1
				; CHECK-NEXT: vsteg %v0, 32(%r3), 0
				; CHECK-NEXT: vst %v0, 16(%r3)
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 1, i64 40, i1 false)
				ret void
				}

				define void @other41(i8* %Src, i8* %Dst) {
				; CHECK-LABEL: other41:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vrepib %v0, 1
				; CHECK-NEXT: vst %v0, 25(%r3)
				; CHECK-NEXT: vst %v0, 16(%r3)
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 1, i64 41, i1 false)
				ret void
				}

				define void @other42(i8* %Src, i8* %Dst) {
				; CHECK-LABEL: other42:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vrepib %v0, 1
				; CHECK-NEXT: vst %v0, 26(%r3)
				; CHECK-NEXT: vst %v0, 16(%r3)
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 1, i64 42, i1 false)
				ret void
				}

				define void @other43(i8* %Src, i8* %Dst) {
				; CHECK-LABEL: other43:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vrepib %v0, 1
				; CHECK-NEXT: vst %v0, 27(%r3)
				; CHECK-NEXT: vst %v0, 16(%r3)
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 1, i64 43, i1 false)
				ret void
				}

				define void @other44(i8* %Src, i8* %Dst) {
				; CHECK-LABEL: other44:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vrepib %v0, 1
				; CHECK-NEXT: vst %v0, 28(%r3)
				; CHECK-NEXT: vst %v0, 16(%r3)
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 1, i64 44, i1 false)
				ret void
				}

				define void @other45(i8* %Src, i8* %Dst) {
				; CHECK-LABEL: other45:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vrepib %v0, 1
				; CHECK-NEXT: vst %v0, 29(%r3)
				; CHECK-NEXT: vst %v0, 16(%r3)
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 1, i64 45, i1 false)
				ret void
				}

				define void @other46(i8* %Src, i8* %Dst) {
				; CHECK-LABEL: other46:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vrepib %v0, 1
				; CHECK-NEXT: vst %v0, 30(%r3)
				; CHECK-NEXT: vst %v0, 16(%r3)
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 1, i64 46, i1 false)
				ret void
				}

				define void @other47(i8* %Src, i8* %Dst) {
				; CHECK-LABEL: other47:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vrepib %v0, 1
				; CHECK-NEXT: vst %v0, 31(%r3)
				; CHECK-NEXT: vst %v0, 16(%r3)
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 1, i64 47, i1 false)
				ret void
				}

				define void @other48(i8* %Src, i8* %Dst) {
				; CHECK-LABEL: other48:
				; CHECK: # %bb.0:
				; CHECK-NEXT: vrepib %v0, 1
				; CHECK-NEXT: vst %v0, 32(%r3)
				; CHECK-NEXT: vst %v0, 16(%r3)
				; CHECK-NEXT: vst %v0, 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 1, i64 48, i1 false)
				ret void
				}

				define void @other49(i8* %Src, i8* %Dst) {
				; CHECK-LABEL: other49:
				; CHECK: # %bb.0:
				; CHECK-NEXT: mvi 0(%r3), 1
				; CHECK-NEXT: mvc 1(48,%r3), 0(%r3)
				; CHECK-NEXT: br %r14
				call void @llvm.memset.p0i8.i64(i8* %Dst, i8 1, i64 49, i1 false)
				ret void
				}

This is an archive of the discontinued LLVM Phabricator instance.

[SystemZ] Expand some memcpys/memsets into Load/Store sequences.AbandonedPublic

Details

Diff Detail

Unit TestsFailed

Event Timeline

Revision Contents

Diff 410362

llvm/include/llvm/CodeGen/TargetLowering.h

llvm/lib/CodeGen/SelectionDAG/SelectionDAG.cpp

llvm/lib/CodeGen/SelectionDAG/TargetLowering.cpp

llvm/lib/Target/SystemZ/SystemZISelLowering.h

llvm/lib/Target/SystemZ/SystemZISelLowering.cpp

llvm/test/CodeGen/SystemZ/memcpy-03.ll

llvm/test/CodeGen/SystemZ/memset-08.ll

[SystemZ] Expand some memcpys/memsets into Load/Store sequences.
AbandonedPublic