Diff 25584

llvm/trunk/lib/Target/ARM/ARMSelectionDAGInfo.h

Show First 20 Lines • Show All 42 Lines • ▼ Show 20 Lines	public:
SDValue EmitTargetCodeForMemcpy(SelectionDAG &DAG, SDLoc dl,		SDValue EmitTargetCodeForMemcpy(SelectionDAG &DAG, SDLoc dl,
SDValue Chain,		SDValue Chain,
SDValue Dst, SDValue Src,		SDValue Dst, SDValue Src,
SDValue Size, unsigned Align,		SDValue Size, unsigned Align,
bool isVolatile, bool AlwaysInline,		bool isVolatile, bool AlwaysInline,
MachinePointerInfo DstPtrInfo,		MachinePointerInfo DstPtrInfo,
MachinePointerInfo SrcPtrInfo) const override;		MachinePointerInfo SrcPtrInfo) const override;

		SDValue EmitTargetCodeForMemmove(SelectionDAG &DAG, SDLoc dl,
		SDValue Chain,
		SDValue Dst, SDValue Src,
		SDValue Size, unsigned Align, bool isVolatile,
		MachinePointerInfo DstPtrInfo,
		MachinePointerInfo SrcPtrInfo) const override;

// Adjust parameters for memset, see RTABI section 4.3.4		// Adjust parameters for memset, see RTABI section 4.3.4
SDValue EmitTargetCodeForMemset(SelectionDAG &DAG, SDLoc dl,		SDValue EmitTargetCodeForMemset(SelectionDAG &DAG, SDLoc dl,
SDValue Chain,		SDValue Chain,
SDValue Op1, SDValue Op2,		SDValue Op1, SDValue Op2,
SDValue Op3, unsigned Align,		SDValue Op3, unsigned Align,
bool isVolatile,		bool isVolatile,
MachinePointerInfo DstPtrInfo) const override;		MachinePointerInfo DstPtrInfo) const override;

		SDValue EmitSpecializedLibcall(SelectionDAG &DAG, SDLoc dl,
		SDValue Chain,
		SDValue Dst, SDValue Src,
		SDValue Size, unsigned Align,
		RTLIB::Libcall LC) const;
};		};

}		}

#endif		#endif

llvm/trunk/lib/Target/ARM/ARMSelectionDAGInfo.cpp

Show All 18 Lines
#define DEBUG_TYPE "arm-selectiondag-info"		#define DEBUG_TYPE "arm-selectiondag-info"

ARMSelectionDAGInfo::ARMSelectionDAGInfo(const DataLayout &DL)		ARMSelectionDAGInfo::ARMSelectionDAGInfo(const DataLayout &DL)
: TargetSelectionDAGInfo(&DL) {}		: TargetSelectionDAGInfo(&DL) {}

ARMSelectionDAGInfo::~ARMSelectionDAGInfo() {		ARMSelectionDAGInfo::~ARMSelectionDAGInfo() {
}		}

		// Emit, if possible, a specialized version of the given Libcall. Typically this
		// means selecting the appropriately aligned version, but we also convert memset
		// of 0 into memclr.
		SDValue ARMSelectionDAGInfo::
		EmitSpecializedLibcall(SelectionDAG &DAG, SDLoc dl,
		SDValue Chain,
		SDValue Dst, SDValue Src,
		SDValue Size, unsigned Align,
		RTLIB::Libcall LC) const {
		const ARMSubtarget &Subtarget =
		DAG.getMachineFunction().getSubtarget<ARMSubtarget>();
		const ARMTargetLowering *TLI = Subtarget.getTargetLowering();

		// Only use a specialized AEABI function if the default version of this
		// Libcall is an AEABI function.
		if (std::strncmp(TLI->getLibcallName(LC), "__aeabi", 7) != 0)
		return SDValue();

		// Translate RTLIB::Libcall to AEABILibcall. We only do this in order to be
		// able to translate memset to memclr and use the value to index the function
		// name array.
		enum {
		AEABI_MEMCPY = 0,
		AEABI_MEMMOVE,
		AEABI_MEMSET,
		AEABI_MEMCLR
		} AEABILibcall;
		switch (LC) {
		case RTLIB::MEMCPY:
		AEABILibcall = AEABI_MEMCPY;
		break;
		case RTLIB::MEMMOVE:
		AEABILibcall = AEABI_MEMMOVE;
		break;
		case RTLIB::MEMSET:
		AEABILibcall = AEABI_MEMSET;
		if (ConstantSDNode *ConstantSrc = dyn_cast<ConstantSDNode>(Src))
		if (ConstantSrc->getZExtValue() == 0)
		AEABILibcall = AEABI_MEMCLR;
		break;
		default:
		return SDValue();
		}

		// Choose the most-aligned libcall variant that we can
		enum {
		ALIGN1 = 0,
		ALIGN4,
		ALIGN8
		} AlignVariant;
		if ((Align & 7) == 0)
		AlignVariant = ALIGN8;
		else if ((Align & 3) == 0)
		AlignVariant = ALIGN4;
		else
		AlignVariant = ALIGN1;

		TargetLowering::ArgListTy Args;
		TargetLowering::ArgListEntry Entry;
		Entry.Ty = TLI->getDataLayout()->getIntPtrType(*DAG.getContext());
		Entry.Node = Dst;
		Args.push_back(Entry);
		if (AEABILibcall == AEABI_MEMCLR) {
		Entry.Node = Size;
		Args.push_back(Entry);
		} else if (AEABILibcall == AEABI_MEMSET) {
		// Adjust parameters for memset, EABI uses format (ptr, size, value),
		// GNU library uses (ptr, value, size)
		// See RTABI section 4.3.4
		Entry.Node = Size;
		Args.push_back(Entry);

		// Extend or truncate the argument to be an i32 value for the call.
		if (Src.getValueType().bitsGT(MVT::i32))
		Src = DAG.getNode(ISD::TRUNCATE, dl, MVT::i32, Src);
		else if (Src.getValueType().bitsLT(MVT::i32))
		Src = DAG.getNode(ISD::ZERO_EXTEND, dl, MVT::i32, Src);

		Entry.Node = Src;
		Entry.Ty = Type::getInt32Ty(*DAG.getContext());
		Entry.isSExt = false;
		Args.push_back(Entry);
		} else {
		Entry.Node = Src;
		Args.push_back(Entry);

		Entry.Node = Size;
		Args.push_back(Entry);
		}

		char const *FunctionNames[4][3] = {
		{ "__aeabi_memcpy", "__aeabi_memcpy4", "__aeabi_memcpy8" },
		{ "__aeabi_memmove", "__aeabi_memmove4", "__aeabi_memmove8" },
		{ "__aeabi_memset", "__aeabi_memset4", "__aeabi_memset8" },
		{ "__aeabi_memclr", "__aeabi_memclr4", "__aeabi_memclr8" }
		};
		TargetLowering::CallLoweringInfo CLI(DAG);
		CLI.setDebugLoc(dl).setChain(Chain)
		.setCallee(TLI->getLibcallCallingConv(LC),
		Type::getVoidTy(*DAG.getContext()),
		DAG.getExternalSymbol(FunctionNames[AEABILibcall][AlignVariant],
		TLI->getPointerTy()), std::move(Args), 0)
		.setDiscardResult();
		std::pair<SDValue,SDValue> CallResult = TLI->LowerCallTo(CLI);

		return CallResult.second;
		}

SDValue		SDValue
ARMSelectionDAGInfo::EmitTargetCodeForMemcpy(SelectionDAG &DAG, SDLoc dl,		ARMSelectionDAGInfo::EmitTargetCodeForMemcpy(SelectionDAG &DAG, SDLoc dl,
SDValue Chain,		SDValue Chain,
SDValue Dst, SDValue Src,		SDValue Dst, SDValue Src,
SDValue Size, unsigned Align,		SDValue Size, unsigned Align,
bool isVolatile, bool AlwaysInline,		bool isVolatile, bool AlwaysInline,
MachinePointerInfo DstPtrInfo,		MachinePointerInfo DstPtrInfo,
MachinePointerInfo SrcPtrInfo) const {		MachinePointerInfo SrcPtrInfo) const {
const ARMSubtarget &Subtarget =		const ARMSubtarget &Subtarget =
DAG.getMachineFunction().getSubtarget<ARMSubtarget>();		DAG.getMachineFunction().getSubtarget<ARMSubtarget>();
// Do repeated 4-byte loads and stores. To be improved.		// Do repeated 4-byte loads and stores. To be improved.
// This requires 4-byte alignment.		// This requires 4-byte alignment.
if ((Align & 3) != 0)		if ((Align & 3) != 0)
return SDValue();		return SDValue();
// This requires the copy size to be a constant, preferably		// This requires the copy size to be a constant, preferably
// within a subtarget-specific limit.		// within a subtarget-specific limit.
ConstantSDNode *ConstantSize = dyn_cast<ConstantSDNode>(Size);		ConstantSDNode *ConstantSize = dyn_cast<ConstantSDNode>(Size);
if (!ConstantSize)		if (!ConstantSize)
return SDValue();		return EmitSpecializedLibcall(DAG, dl, Chain, Dst, Src, Size, Align,
		RTLIB::MEMCPY);
uint64_t SizeVal = ConstantSize->getZExtValue();		uint64_t SizeVal = ConstantSize->getZExtValue();
if (!AlwaysInline && SizeVal > Subtarget.getMaxInlineSizeThreshold())		if (!AlwaysInline && SizeVal > Subtarget.getMaxInlineSizeThreshold())
return SDValue();		return EmitSpecializedLibcall(DAG, dl, Chain, Dst, Src, Size, Align,
		RTLIB::MEMCPY);

unsigned BytesLeft = SizeVal & 3;		unsigned BytesLeft = SizeVal & 3;
unsigned NumMemOps = SizeVal >> 2;		unsigned NumMemOps = SizeVal >> 2;
unsigned EmittedNumMemOps = 0;		unsigned EmittedNumMemOps = 0;
EVT VT = MVT::i32;		EVT VT = MVT::i32;
unsigned VTSize = 4;		unsigned VTSize = 4;
unsigned i = 0;		unsigned i = 0;
// Emit a maximum of 4 loads in Thumb1 since we have fewer registers		// Emit a maximum of 4 loads in Thumb1 since we have fewer registers
▲ Show 20 Lines • Show All 80 Lines • ▼ Show 20 Lines	while (BytesLeft) {
++i;		++i;
DstOff += VTSize;		DstOff += VTSize;
BytesLeft -= VTSize;		BytesLeft -= VTSize;
}		}
return DAG.getNode(ISD::TokenFactor, dl, MVT::Other,		return DAG.getNode(ISD::TokenFactor, dl, MVT::Other,
makeArrayRef(TFOps, i));		makeArrayRef(TFOps, i));
}		}

// Adjust parameters for memset, EABI uses format (ptr, size, value),
// GNU library uses (ptr, value, size)		SDValue ARMSelectionDAGInfo::
// See RTABI section 4.3.4		EmitTargetCodeForMemmove(SelectionDAG &DAG, SDLoc dl,
		SDValue Chain,
		SDValue Dst, SDValue Src,
		SDValue Size, unsigned Align,
		bool isVolatile,
		MachinePointerInfo DstPtrInfo,
		MachinePointerInfo SrcPtrInfo) const {
		return EmitSpecializedLibcall(DAG, dl, Chain, Dst, Src, Size, Align,
		RTLIB::MEMMOVE);
		}


SDValue ARMSelectionDAGInfo::		SDValue ARMSelectionDAGInfo::
EmitTargetCodeForMemset(SelectionDAG &DAG, SDLoc dl,		EmitTargetCodeForMemset(SelectionDAG &DAG, SDLoc dl,
SDValue Chain, SDValue Dst,		SDValue Chain, SDValue Dst,
SDValue Src, SDValue Size,		SDValue Src, SDValue Size,
unsigned Align, bool isVolatile,		unsigned Align, bool isVolatile,
MachinePointerInfo DstPtrInfo) const {		MachinePointerInfo DstPtrInfo) const {
const ARMSubtarget &Subtarget =		return EmitSpecializedLibcall(DAG, dl, Chain, Dst, Src, Size, Align,
DAG.getMachineFunction().getSubtarget<ARMSubtarget>();		RTLIB::MEMSET);
// Use default for non-AAPCS (or MachO) subtargets
if (!Subtarget.isAAPCS_ABI() \|\| Subtarget.isTargetMachO() \|\|
Subtarget.isTargetWindows())
return SDValue();

const ARMTargetLowering &TLI = *Subtarget.getTargetLowering();
TargetLowering::ArgListTy Args;
TargetLowering::ArgListEntry Entry;

// First argument: data pointer
Type IntPtrTy = TLI.getDataLayout()->getIntPtrType(DAG.getContext());
Entry.Node = Dst;
Entry.Ty = IntPtrTy;
Args.push_back(Entry);

// Second argument: buffer size
Entry.Node = Size;
Entry.Ty = IntPtrTy;
Entry.isSExt = false;
Args.push_back(Entry);

// Extend or truncate the argument to be an i32 value for the call.
if (Src.getValueType().bitsGT(MVT::i32))
Src = DAG.getNode(ISD::TRUNCATE, dl, MVT::i32, Src);
else
Src = DAG.getNode(ISD::ZERO_EXTEND, dl, MVT::i32, Src);

// Third argument: value to fill
Entry.Node = Src;
Entry.Ty = Type::getInt32Ty(*DAG.getContext());
Entry.isSExt = true;
Args.push_back(Entry);

// Emit __eabi_memset call
TargetLowering::CallLoweringInfo CLI(DAG);
CLI.setDebugLoc(dl).setChain(Chain)
.setCallee(TLI.getLibcallCallingConv(RTLIB::MEMSET),
Type::getVoidTy(*DAG.getContext()),
DAG.getExternalSymbol(TLI.getLibcallName(RTLIB::MEMSET),
TLI.getPointerTy()), std::move(Args), 0)
.setDiscardResult();

std::pair<SDValue,SDValue> CallResult = TLI.LowerCallTo(CLI);
return CallResult.second;
}		}

llvm/trunk/test/CodeGen/ARM/memfunc.ll

Show All 12 Lines	entry:
call void @llvm.memmove.p0i8.p0i8.i32(i8* %dest, i8* %src, i32 500, i32 0, i1 false)		call void @llvm.memmove.p0i8.p0i8.i32(i8* %dest, i8* %src, i32 500, i32 0, i1 false)

; CHECK-IOS: memcpy		; CHECK-IOS: memcpy
; CHECK-DARWIN: memcpy		; CHECK-DARWIN: memcpy
; CHECK-EABI: __aeabi_memcpy		; CHECK-EABI: __aeabi_memcpy
call void @llvm.memcpy.p0i8.p0i8.i32(i8* %dest, i8* %src, i32 500, i32 0, i1 false)		call void @llvm.memcpy.p0i8.p0i8.i32(i8* %dest, i8* %src, i32 500, i32 0, i1 false)

; EABI memset swaps arguments		; EABI memset swaps arguments
		; CHECK-IOS: mov r1, #1
		; CHECK-IOS: memset
		; CHECK-DARWIN: movs r1, #1
		; CHECK-DARWIN: memset
		; CHECK-EABI: mov r2, #1
		; CHECK-EABI: __aeabi_memset
		call void @llvm.memset.p0i8.i32(i8* %dest, i8 1, i32 500, i32 0, i1 false)

		; EABI uses memclr if value set to 0
; CHECK-IOS: mov r1, #0		; CHECK-IOS: mov r1, #0
; CHECK-IOS: memset		; CHECK-IOS: memset
; CHECK-DARWIN: movs r1, #0		; CHECK-DARWIN: movs r1, #0
; CHECK-DARWIN: memset		; CHECK-DARWIN: memset
; CHECK-EABI: mov r2, #0		; CHECK-EABI: __aeabi_memclr
; CHECK-EABI: __aeabi_memset
call void @llvm.memset.p0i8.i32(i8* %dest, i8 0, i32 500, i32 0, i1 false)		call void @llvm.memset.p0i8.i32(i8* %dest, i8 0, i32 500, i32 0, i1 false)

		; EABI uses aligned function variants if possible

		; CHECK-IOS: memmove
		; CHECK-DARWIN: memmove
		; CHECK-EABI: __aeabi_memmove4
		call void @llvm.memmove.p0i8.p0i8.i32(i8* %dest, i8* %src, i32 500, i32 4, i1 false)

		; CHECK-IOS: memcpy
		; CHECK-DARWIN: memcpy
		; CHECK-EABI: __aeabi_memcpy4
		call void @llvm.memcpy.p0i8.p0i8.i32(i8* %dest, i8* %src, i32 500, i32 4, i1 false)

		; CHECK-IOS: memset
		; CHECK-DARWIN: memset
		; CHECK-EABI: __aeabi_memset4
		call void @llvm.memset.p0i8.i32(i8* %dest, i8 1, i32 500, i32 4, i1 false)

		; CHECK-IOS: memset
		; CHECK-DARWIN: memset
		; CHECK-EABI: __aeabi_memclr4
		call void @llvm.memset.p0i8.i32(i8* %dest, i8 0, i32 500, i32 4, i1 false)

		; CHECK-IOS: memmove
		; CHECK-DARWIN: memmove
		; CHECK-EABI: __aeabi_memmove8
		call void @llvm.memmove.p0i8.p0i8.i32(i8* %dest, i8* %src, i32 500, i32 8, i1 false)

		; CHECK-IOS: memcpy
		; CHECK-DARWIN: memcpy
		; CHECK-EABI: __aeabi_memcpy8
		call void @llvm.memcpy.p0i8.p0i8.i32(i8* %dest, i8* %src, i32 500, i32 8, i1 false)

		; CHECK-IOS: memset
		; CHECK-DARWIN: memset
		; CHECK-EABI: __aeabi_memset8
		call void @llvm.memset.p0i8.i32(i8* %dest, i8 1, i32 500, i32 8, i1 false)

		; CHECK-IOS: memset
		; CHECK-DARWIN: memset
		; CHECK-EABI: __aeabi_memclr8
		call void @llvm.memset.p0i8.i32(i8* %dest, i8 0, i32 500, i32 8, i1 false)

unreachable		unreachable
}		}

; Check that alloca arguments to memory intrinsics are automatically aligned if at least 8 bytes in size		; Check that alloca arguments to memory intrinsics are automatically aligned if at least 8 bytes in size
define void @f2(i8* %dest, i32 %n) {		define void @f2(i8* %dest, i32 %n) {
entry:		entry:
; CHECK-LABEL: f2		; CHECK-LABEL: f2

Show All 12 Lines	entry:
; CHECK-IOS: memcpy		; CHECK-IOS: memcpy
; CHECK-DARWIN: memcpy		; CHECK-DARWIN: memcpy
; CHECK-EABI: __aeabi_memcpy		; CHECK-EABI: __aeabi_memcpy
%arr1 = alloca [9 x i8], align 1		%arr1 = alloca [9 x i8], align 1
%1 = bitcast [9 x i8]* %arr1 to i8*		%1 = bitcast [9 x i8]* %arr1 to i8*
call void @llvm.memcpy.p0i8.p0i8.i32(i8* %dest, i8* %1, i32 %n, i32 0, i1 false)		call void @llvm.memcpy.p0i8.p0i8.i32(i8* %dest, i8* %1, i32 %n, i32 0, i1 false)

; CHECK-IOS: mov r0, sp		; CHECK-IOS: mov r0, sp
; CHECK-IOS: mov r1, #0		; CHECK-IOS: mov r1, #1
; CHECK-IOS: memset		; CHECK-IOS: memset
; CHECK-DARINW: add r0, sp, #4		; CHECK-DARWIN: add r0, sp, #4
; CHECK-DARWIN: movs r1, #0		; CHECK-DARWIN: movs r1, #1
; CHECK-DARWIN: memset		; CHECK-DARWIN: memset
; CHECK-EABI: add r0, sp, #4		; CHECK-EABI: add r0, sp, #4
; CHECK-EABI: mov r2, #0		; CHECK-EABI: mov r2, #1
; CHECK-EABI: __aeabi_memset		; CHECK-EABI: __aeabi_memset
%arr2 = alloca [9 x i8], align 1		%arr2 = alloca [9 x i8], align 1
%2 = bitcast [9 x i8]* %arr2 to i8*		%2 = bitcast [9 x i8]* %arr2 to i8*
call void @llvm.memset.p0i8.i32(i8* %2, i8 0, i32 %n, i32 0, i1 false)		call void @llvm.memset.p0i8.i32(i8* %2, i8 1, i32 %n, i32 0, i1 false)

unreachable		unreachable
}		}

; Check that alloca arguments are not aligned if less than 8 bytes in size		; Check that alloca arguments are not aligned if less than 8 bytes in size
define void @f3(i8* %dest, i32 %n) {		define void @f3(i8* %dest, i32 %n) {
entry:		entry:
; CHECK-LABEL: f3		; CHECK-LABEL: f3
Show All 10 Lines	entry:
; CHECK-IOS: memcpy		; CHECK-IOS: memcpy
; CHECK-DARWIN: memcpy		; CHECK-DARWIN: memcpy
; CHECK-EABI: __aeabi_memcpy		; CHECK-EABI: __aeabi_memcpy
%arr1 = alloca [7 x i8], align 1		%arr1 = alloca [7 x i8], align 1
%1 = bitcast [7 x i8]* %arr1 to i8*		%1 = bitcast [7 x i8]* %arr1 to i8*
call void @llvm.memcpy.p0i8.p0i8.i32(i8* %dest, i8* %1, i32 %n, i32 0, i1 false)		call void @llvm.memcpy.p0i8.p0i8.i32(i8* %dest, i8* %1, i32 %n, i32 0, i1 false)

; CHECK: {{add(.w)? r0, sp, #3}}		; CHECK: {{add(.w)? r0, sp, #3}}
; CHECK-IOS: mov r1, #0		; CHECK-IOS: mov r1, #1
; CHECK-IOS: memset		; CHECK-IOS: memset
; CHECK-DARWIN: movs r1, #0		; CHECK-DARWIN: movs r1, #1
; CHECK-DARWIN: memset		; CHECK-DARWIN: memset
; CHECK-EABI: mov r2, #0		; CHECK-EABI: mov r2, #1
; CHECK-EABI: __aeabi_memset		; CHECK-EABI: __aeabi_memset
%arr2 = alloca [7 x i8], align 1		%arr2 = alloca [7 x i8], align 1
%2 = bitcast [7 x i8]* %arr2 to i8*		%2 = bitcast [7 x i8]* %arr2 to i8*
call void @llvm.memset.p0i8.i32(i8* %2, i8 0, i32 %n, i32 0, i1 false)		call void @llvm.memset.p0i8.i32(i8* %2, i8 1, i32 %n, i32 0, i1 false)

unreachable		unreachable
}		}

; Check that alloca arguments are not aligned if size+offset is less than 8 bytes		; Check that alloca arguments are not aligned if size+offset is less than 8 bytes
define void @f4(i8* %dest, i32 %n) {		define void @f4(i8* %dest, i32 %n) {
entry:		entry:
; CHECK-LABEL: f4		; CHECK-LABEL: f4
Show All 10 Lines	entry:
; CHECK-IOS: memcpy		; CHECK-IOS: memcpy
; CHECK-DARWIN: memcpy		; CHECK-DARWIN: memcpy
; CHECK-EABI: __aeabi_memcpy		; CHECK-EABI: __aeabi_memcpy
%arr1 = alloca [9 x i8], align 1		%arr1 = alloca [9 x i8], align 1
%1 = getelementptr inbounds [9 x i8], [9 x i8]* %arr1, i32 0, i32 4		%1 = getelementptr inbounds [9 x i8], [9 x i8]* %arr1, i32 0, i32 4
call void @llvm.memcpy.p0i8.p0i8.i32(i8* %dest, i8* %1, i32 %n, i32 0, i1 false)		call void @llvm.memcpy.p0i8.p0i8.i32(i8* %dest, i8* %1, i32 %n, i32 0, i1 false)

; CHECK: {{add(.w)? r., sp, #(1\|5)}}		; CHECK: {{add(.w)? r., sp, #(1\|5)}}
; CHECK-IOS: mov r1, #0		; CHECK-IOS: mov r1, #1
; CHECK-IOS: memset		; CHECK-IOS: memset
; CHECK-DARWIN: movs r1, #0		; CHECK-DARWIN: movs r1, #1
; CHECK-DARWIN: memset		; CHECK-DARWIN: memset
; CHECK-EABI: mov r2, #0		; CHECK-EABI: mov r2, #1
; CHECK-EABI: __aeabi_memset		; CHECK-EABI: __aeabi_memset
%arr2 = alloca [9 x i8], align 1		%arr2 = alloca [9 x i8], align 1
%2 = getelementptr inbounds [9 x i8], [9 x i8]* %arr2, i32 0, i32 4		%2 = getelementptr inbounds [9 x i8], [9 x i8]* %arr2, i32 0, i32 4
call void @llvm.memset.p0i8.i32(i8* %2, i8 0, i32 %n, i32 0, i1 false)		call void @llvm.memset.p0i8.i32(i8* %2, i8 1, i32 %n, i32 0, i1 false)

unreachable		unreachable
}		}

; Check that alloca arguments are not aligned if the offset is not a multiple of 4		; Check that alloca arguments are not aligned if the offset is not a multiple of 4
define void @f5(i8* %dest, i32 %n) {		define void @f5(i8* %dest, i32 %n) {
entry:		entry:
; CHECK-LABEL: f5		; CHECK-LABEL: f5
Show All 10 Lines	entry:
; CHECK-IOS: memcpy		; CHECK-IOS: memcpy
; CHECK-DARWIN: memcpy		; CHECK-DARWIN: memcpy
; CHECK-EABI: __aeabi_memcpy		; CHECK-EABI: __aeabi_memcpy
%arr1 = alloca [13 x i8], align 1		%arr1 = alloca [13 x i8], align 1
%1 = getelementptr inbounds [13 x i8], [13 x i8]* %arr1, i32 0, i32 1		%1 = getelementptr inbounds [13 x i8], [13 x i8]* %arr1, i32 0, i32 1
call void @llvm.memcpy.p0i8.p0i8.i32(i8* %dest, i8* %1, i32 %n, i32 0, i1 false)		call void @llvm.memcpy.p0i8.p0i8.i32(i8* %dest, i8* %1, i32 %n, i32 0, i1 false)

; CHECK: {{add(.w)? r., sp, #(1\|5)}}		; CHECK: {{add(.w)? r., sp, #(1\|5)}}
; CHECK-IOS: mov r1, #0		; CHECK-IOS: mov r1, #1
; CHECK-IOS: memset		; CHECK-IOS: memset
; CHECK-DARWIN: movs r1, #0		; CHECK-DARWIN: movs r1, #1
; CHECK-DARWIN: memset		; CHECK-DARWIN: memset
; CHECK-EABI: mov r2, #0		; CHECK-EABI: mov r2, #1
; CHECK-EABI: __aeabi_memset		; CHECK-EABI: __aeabi_memset
%arr2 = alloca [13 x i8], align 1		%arr2 = alloca [13 x i8], align 1
%2 = getelementptr inbounds [13 x i8], [13 x i8]* %arr2, i32 0, i32 1		%2 = getelementptr inbounds [13 x i8], [13 x i8]* %arr2, i32 0, i32 1
call void @llvm.memset.p0i8.i32(i8* %2, i8 0, i32 %n, i32 0, i1 false)		call void @llvm.memset.p0i8.i32(i8* %2, i8 1, i32 %n, i32 0, i1 false)

unreachable		unreachable
}		}

; Check that alloca arguments are not aligned if the offset is unknown		; Check that alloca arguments are not aligned if the offset is unknown
define void @f6(i8* %dest, i32 %n, i32 %i) {		define void @f6(i8* %dest, i32 %n, i32 %i) {
entry:		entry:
; CHECK-LABEL: f6		; CHECK-LABEL: f6
Show All 10 Lines	entry:
; CHECK-IOS: memcpy		; CHECK-IOS: memcpy
; CHECK-DARWIN: memcpy		; CHECK-DARWIN: memcpy
; CHECK-EABI: __aeabi_memcpy		; CHECK-EABI: __aeabi_memcpy
%arr1 = alloca [13 x i8], align 1		%arr1 = alloca [13 x i8], align 1
%1 = getelementptr inbounds [13 x i8], [13 x i8]* %arr1, i32 0, i32 %i		%1 = getelementptr inbounds [13 x i8], [13 x i8]* %arr1, i32 0, i32 %i
call void @llvm.memcpy.p0i8.p0i8.i32(i8* %dest, i8* %1, i32 %n, i32 0, i1 false)		call void @llvm.memcpy.p0i8.p0i8.i32(i8* %dest, i8* %1, i32 %n, i32 0, i1 false)

; CHECK: {{add(.w)? r., sp, #(1\|5)}}		; CHECK: {{add(.w)? r., sp, #(1\|5)}}
; CHECK-IOS: mov r1, #0		; CHECK-IOS: mov r1, #1
; CHECK-IOS: memset		; CHECK-IOS: memset
; CHECK-DARWIN: movs r1, #0		; CHECK-DARWIN: movs r1, #1
; CHECK-DARWIN: memset		; CHECK-DARWIN: memset
; CHECK-EABI: mov r2, #0		; CHECK-EABI: mov r2, #1
; CHECK-EABI: __aeabi_memset		; CHECK-EABI: __aeabi_memset
%arr2 = alloca [13 x i8], align 1		%arr2 = alloca [13 x i8], align 1
%2 = getelementptr inbounds [13 x i8], [13 x i8]* %arr2, i32 0, i32 %i		%2 = getelementptr inbounds [13 x i8], [13 x i8]* %arr2, i32 0, i32 %i
call void @llvm.memset.p0i8.i32(i8* %2, i8 0, i32 %n, i32 0, i1 false)		call void @llvm.memset.p0i8.i32(i8* %2, i8 1, i32 %n, i32 0, i1 false)

unreachable		unreachable
}		}

; Check that alloca arguments are not aligned if the GEP is not inbounds		; Check that alloca arguments are not aligned if the GEP is not inbounds
define void @f7(i8* %dest, i32 %n) {		define void @f7(i8* %dest, i32 %n) {
entry:		entry:
; CHECK-LABEL: f7		; CHECK-LABEL: f7
Show All 10 Lines	entry:
; CHECK-IOS: memcpy		; CHECK-IOS: memcpy
; CHECK-DARWIN: memcpy		; CHECK-DARWIN: memcpy
; CHECK-EABI: __aeabi_memcpy		; CHECK-EABI: __aeabi_memcpy
%arr1 = alloca [13 x i8], align 1		%arr1 = alloca [13 x i8], align 1
%1 = getelementptr [13 x i8], [13 x i8]* %arr1, i32 0, i32 4		%1 = getelementptr [13 x i8], [13 x i8]* %arr1, i32 0, i32 4
call void @llvm.memcpy.p0i8.p0i8.i32(i8* %dest, i8* %1, i32 %n, i32 0, i1 false)		call void @llvm.memcpy.p0i8.p0i8.i32(i8* %dest, i8* %1, i32 %n, i32 0, i1 false)

; CHECK: {{add(.w)? r., sp, #(1\|5)}}		; CHECK: {{add(.w)? r., sp, #(1\|5)}}
; CHECK-IOS: mov r1, #0		; CHECK-IOS: mov r1, #1
; CHECK-IOS: memset		; CHECK-IOS: memset
; CHECK-DARWIN: movs r1, #0		; CHECK-DARWIN: movs r1, #1
; CHECK-DARWIN: memset		; CHECK-DARWIN: memset
; CHECK-EABI: mov r2, #0		; CHECK-EABI: mov r2, #1
; CHECK-EABI: __aeabi_memset		; CHECK-EABI: __aeabi_memset
%arr2 = alloca [13 x i8], align 1		%arr2 = alloca [13 x i8], align 1
%2 = getelementptr [13 x i8], [13 x i8]* %arr2, i32 0, i32 4		%2 = getelementptr [13 x i8], [13 x i8]* %arr2, i32 0, i32 4
call void @llvm.memset.p0i8.i32(i8* %2, i8 0, i32 %n, i32 0, i1 false)		call void @llvm.memset.p0i8.i32(i8* %2, i8 1, i32 %n, i32 0, i1 false)

unreachable		unreachable
}		}

; Check that alloca arguments are not aligned when the offset is past the end of the allocation		; Check that alloca arguments are not aligned when the offset is past the end of the allocation
define void @f8(i8* %dest, i32 %n) {		define void @f8(i8* %dest, i32 %n) {
entry:		entry:
; CHECK-LABEL: f8		; CHECK-LABEL: f8
Show All 10 Lines	entry:
; CHECK-IOS: memcpy		; CHECK-IOS: memcpy
; CHECK-DARWIN: memcpy		; CHECK-DARWIN: memcpy
; CHECK-EABI: __aeabi_memcpy		; CHECK-EABI: __aeabi_memcpy
%arr1 = alloca [13 x i8], align 1		%arr1 = alloca [13 x i8], align 1
%1 = getelementptr inbounds [13 x i8], [13 x i8]* %arr1, i32 0, i32 16		%1 = getelementptr inbounds [13 x i8], [13 x i8]* %arr1, i32 0, i32 16
call void @llvm.memcpy.p0i8.p0i8.i32(i8* %dest, i8* %1, i32 %n, i32 0, i1 false)		call void @llvm.memcpy.p0i8.p0i8.i32(i8* %dest, i8* %1, i32 %n, i32 0, i1 false)

; CHECK: {{add(.w)? r., sp, #(1\|5)}}		; CHECK: {{add(.w)? r., sp, #(1\|5)}}
; CHECK-IOS: mov r1, #0		; CHECK-IOS: mov r1, #1
; CHECK-IOS: memset		; CHECK-IOS: memset
; CHECK-DARWIN: movs r1, #0		; CHECK-DARWIN: movs r1, #1
; CHECK-DARWIN: memset		; CHECK-DARWIN: memset
; CHECK-EABI: mov r2, #0		; CHECK-EABI: mov r2, #1
; CHECK-EABI: __aeabi_memset		; CHECK-EABI: __aeabi_memset
%arr2 = alloca [13 x i8], align 1		%arr2 = alloca [13 x i8], align 1
%2 = getelementptr inbounds [13 x i8], [13 x i8]* %arr2, i32 0, i32 16		%2 = getelementptr inbounds [13 x i8], [13 x i8]* %arr2, i32 0, i32 16
call void @llvm.memset.p0i8.i32(i8* %2, i8 0, i32 %n, i32 0, i1 false)		call void @llvm.memset.p0i8.i32(i8* %2, i8 1, i32 %n, i32 0, i1 false)

unreachable		unreachable
}		}

; Check that global variables are aligned if they are large enough, but only if		; Check that global variables are aligned if they are large enough, but only if
; they are defined in this object and don't have an explicit section.		; they are defined in this object and don't have an explicit section.
@arr1 = global [7 x i8] c"\01\02\03\04\05\06\07", align 1		@arr1 = global [7 x i8] c"\01\02\03\04\05\06\07", align 1
@arr2 = global [8 x i8] c"\01\02\03\04\05\06\07\08", align 1		@arr2 = global [8 x i8] c"\01\02\03\04\05\06\07\08", align 1
Show All 40 Lines

This is an archive of the discontinued LLVM Phabricator instance.

[ARM] Use AEABI aligned function variants
ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 25584

llvm/trunk/lib/Target/ARM/ARMSelectionDAGInfo.h

llvm/trunk/lib/Target/ARM/ARMSelectionDAGInfo.cpp

llvm/trunk/test/CodeGen/ARM/memfunc.ll

This is an archive of the discontinued LLVM Phabricator instance.

[ARM] Use AEABI aligned function variantsClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 25584

llvm/trunk/lib/Target/ARM/ARMSelectionDAGInfo.h

llvm/trunk/lib/Target/ARM/ARMSelectionDAGInfo.cpp

llvm/trunk/test/CodeGen/ARM/memfunc.ll

[ARM] Use AEABI aligned function variants
ClosedPublic