Diff 147129

llvm/trunk/lib/Target/X86/X86ISelLowering.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 16,029 Lines • ▼ Show 20 Lines	if (Op.getOpcode() == ISD::SHL_PARTS) {
Lo = DAG.getNode(X86ISD::CMOV, dl, VT, Ops0);		Lo = DAG.getNode(X86ISD::CMOV, dl, VT, Ops0);
Hi = DAG.getNode(X86ISD::CMOV, dl, VT, Ops1);		Hi = DAG.getNode(X86ISD::CMOV, dl, VT, Ops1);
}		}

SDValue Ops[2] = { Lo, Hi };		SDValue Ops[2] = { Lo, Hi };
return DAG.getMergeValues(Ops, dl);		return DAG.getMergeValues(Ops, dl);
}		}

		// Try to use a packed vector operation to handle i64 on 32-bit targets when
		// AVX512DQ is enabled.
		static SDValue LowerI64IntToFP_AVX512DQ(SDValue Op, SelectionDAG &DAG,
		const X86Subtarget &Subtarget) {
		assert((Op.getOpcode() == ISD::SINT_TO_FP \|\|
		Op.getOpcode() == ISD::UINT_TO_FP) && "Unexpected opcode!");
		SDValue Src = Op.getOperand(0);
		MVT SrcVT = Src.getSimpleValueType();
		MVT VT = Op.getSimpleValueType();

		if (!Subtarget.hasDQI() \|\| SrcVT != MVT::i64 \|\| Subtarget.is64Bit() \|\|
		(VT != MVT::f32 && VT != MVT::f64))
		return SDValue();

		// Pack the i64 into a vector, do the operation and extract.

		// Using 256-bit to ensure result is 128-bits for f32 case.
		unsigned NumElts = Subtarget.hasVLX() ? 4 : 8;
		MVT VecInVT = MVT::getVectorVT(MVT::i64, NumElts);
		MVT VecVT = MVT::getVectorVT(VT, NumElts);

		SDLoc dl(Op);
		SDValue InVec = DAG.getNode(ISD::SCALAR_TO_VECTOR, dl, VecInVT, Src);
		SDValue CvtVec = DAG.getNode(Op.getOpcode(), dl, VecVT, InVec);
		return DAG.getNode(ISD::EXTRACT_VECTOR_ELT, dl, VT, CvtVec,
		DAG.getIntPtrConstant(0, dl));
		}

SDValue X86TargetLowering::LowerSINT_TO_FP(SDValue Op,		SDValue X86TargetLowering::LowerSINT_TO_FP(SDValue Op,
SelectionDAG &DAG) const {		SelectionDAG &DAG) const {
SDValue Src = Op.getOperand(0);		SDValue Src = Op.getOperand(0);
MVT SrcVT = Src.getSimpleValueType();		MVT SrcVT = Src.getSimpleValueType();
MVT VT = Op.getSimpleValueType();		MVT VT = Op.getSimpleValueType();
SDLoc dl(Op);		SDLoc dl(Op);

if (SrcVT.isVector()) {		if (SrcVT.isVector()) {
if (SrcVT == MVT::v2i32 && VT == MVT::v2f64) {		if (SrcVT == MVT::v2i32 && VT == MVT::v2f64) {
return DAG.getNode(X86ISD::CVTSI2P, dl, VT,		return DAG.getNode(X86ISD::CVTSI2P, dl, VT,
DAG.getNode(ISD::CONCAT_VECTORS, dl, MVT::v4i32, Src,		DAG.getNode(ISD::CONCAT_VECTORS, dl, MVT::v4i32, Src,
DAG.getUNDEF(SrcVT)));		DAG.getUNDEF(SrcVT)));
}		}
return SDValue();		return SDValue();
}		}

assert(SrcVT <= MVT::i64 && SrcVT >= MVT::i16 &&		assert(SrcVT <= MVT::i64 && SrcVT >= MVT::i16 &&
"Unknown SINT_TO_FP to lower!");		"Unknown SINT_TO_FP to lower!");

// These are really Legal; return the operand so the caller accepts it as		// These are really Legal; return the operand so the caller accepts it as
// Legal.		// Legal.
if (SrcVT == MVT::i32 && isScalarFPTypeInSSEReg(Op.getValueType()))		if (SrcVT == MVT::i32 && isScalarFPTypeInSSEReg(VT))
return Op;		return Op;
if (SrcVT == MVT::i64 && isScalarFPTypeInSSEReg(Op.getValueType()) &&		if (SrcVT == MVT::i64 && isScalarFPTypeInSSEReg(VT) && Subtarget.is64Bit()) {
Subtarget.is64Bit()) {
return Op;		return Op;
}		}

		if (SDValue V = LowerI64IntToFP_AVX512DQ(Op, DAG, Subtarget))
		return V;

SDValue ValueToStore = Op.getOperand(0);		SDValue ValueToStore = Op.getOperand(0);
if (SrcVT == MVT::i64 && isScalarFPTypeInSSEReg(Op.getValueType()) &&		if (SrcVT == MVT::i64 && isScalarFPTypeInSSEReg(VT) &&
!Subtarget.is64Bit())		!Subtarget.is64Bit())
// Bitcasting to f64 here allows us to do a single 64-bit store from		// Bitcasting to f64 here allows us to do a single 64-bit store from
// an SSE register, avoiding the store forwarding penalty that would come		// an SSE register, avoiding the store forwarding penalty that would come
// with two 32-bit stores.		// with two 32-bit stores.
ValueToStore = DAG.getBitcast(MVT::f64, ValueToStore);		ValueToStore = DAG.getBitcast(MVT::f64, ValueToStore);

unsigned Size = SrcVT.getSizeInBits()/8;		unsigned Size = SrcVT.getSizeInBits()/8;
MachineFunction &MF = DAG.getMachineFunction();		MachineFunction &MF = DAG.getMachineFunction();
▲ Show 20 Lines • Show All 334 Lines • ▼ Show 20 Lines	SDValue X86TargetLowering::LowerUINT_TO_FP(SDValue Op,

if (Subtarget.hasAVX512() && isScalarFPTypeInSSEReg(DstVT) &&		if (Subtarget.hasAVX512() && isScalarFPTypeInSSEReg(DstVT) &&
(SrcVT == MVT::i32 \|\| (SrcVT == MVT::i64 && Subtarget.is64Bit()))) {		(SrcVT == MVT::i32 \|\| (SrcVT == MVT::i64 && Subtarget.is64Bit()))) {
// Conversions from unsigned i32 to f32/f64 are legal,		// Conversions from unsigned i32 to f32/f64 are legal,
// using VCVTUSI2SS/SD. Same for i64 in 64-bit mode.		// using VCVTUSI2SS/SD. Same for i64 in 64-bit mode.
return Op;		return Op;
}		}

		if (SDValue V = LowerI64IntToFP_AVX512DQ(Op, DAG, Subtarget))
		return V;

if (SrcVT == MVT::i64 && DstVT == MVT::f64 && X86ScalarSSEf64)		if (SrcVT == MVT::i64 && DstVT == MVT::f64 && X86ScalarSSEf64)
return LowerUINT_TO_FP_i64(Op, DAG, Subtarget);		return LowerUINT_TO_FP_i64(Op, DAG, Subtarget);
if (SrcVT == MVT::i32 && X86ScalarSSEf64)		if (SrcVT == MVT::i32 && X86ScalarSSEf64)
return LowerUINT_TO_FP_i32(Op, DAG, Subtarget);		return LowerUINT_TO_FP_i32(Op, DAG, Subtarget);
if (Subtarget.is64Bit() && SrcVT == MVT::i64 && DstVT == MVT::f32)		if (Subtarget.is64Bit() && SrcVT == MVT::i64 && DstVT == MVT::f32)
return SDValue();		return SDValue();

// Make a 64-bit buffer, and use it to build an FILD.		// Make a 64-bit buffer, and use it to build an FILD.
▲ Show 20 Lines • Show All 8,760 Lines • ▼ Show 20 Lines	void X86TargetLowering::ReplaceNodeResults(SDNode *N,
case ISD::UDIVREM: {		case ISD::UDIVREM: {
SDValue V = LowerWin64_i128OP(SDValue(N,0), DAG);		SDValue V = LowerWin64_i128OP(SDValue(N,0), DAG);
Results.push_back(V);		Results.push_back(V);
return;		return;
}		}
case ISD::FP_TO_SINT:		case ISD::FP_TO_SINT:
case ISD::FP_TO_UINT: {		case ISD::FP_TO_UINT: {
bool IsSigned = N->getOpcode() == ISD::FP_TO_SINT;		bool IsSigned = N->getOpcode() == ISD::FP_TO_SINT;
		EVT VT = N->getValueType(0);
		SDValue Src = N->getOperand(0);
		EVT SrcVT = Src.getValueType();

if (N->getValueType(0) == MVT::v2i32) {		if (VT == MVT::v2i32) {
assert((IsSigned \|\| Subtarget.hasAVX512()) &&		assert((IsSigned \|\| Subtarget.hasAVX512()) &&
"Can only handle signed conversion without AVX512");		"Can only handle signed conversion without AVX512");
assert(Subtarget.hasSSE2() && "Requires at least SSE2!");		assert(Subtarget.hasSSE2() && "Requires at least SSE2!");
SDValue Src = N->getOperand(0);
if (Src.getValueType() == MVT::v2f64) {		if (Src.getValueType() == MVT::v2f64) {
MVT ResVT = MVT::v4i32;		MVT ResVT = MVT::v4i32;
unsigned Opc = IsSigned ? X86ISD::CVTTP2SI : X86ISD::CVTTP2UI;		unsigned Opc = IsSigned ? X86ISD::CVTTP2SI : X86ISD::CVTTP2UI;
if (!IsSigned && !Subtarget.hasVLX()) {		if (!IsSigned && !Subtarget.hasVLX()) {
// Widen to 512-bits.		// Widen to 512-bits.
ResVT = MVT::v8i32;		ResVT = MVT::v8i32;
Opc = ISD::FP_TO_UINT;		Opc = ISD::FP_TO_UINT;
Src = DAG.getNode(ISD::INSERT_SUBVECTOR, dl, MVT::v8f64,		Src = DAG.getNode(ISD::INSERT_SUBVECTOR, dl, MVT::v8f64,
DAG.getUNDEF(MVT::v8f64),		DAG.getUNDEF(MVT::v8f64),
Src, DAG.getIntPtrConstant(0, dl));		Src, DAG.getIntPtrConstant(0, dl));
}		}
SDValue Res = DAG.getNode(Opc, dl, ResVT, Src);		SDValue Res = DAG.getNode(Opc, dl, ResVT, Src);
bool WidenType = getTypeAction(*DAG.getContext(),		bool WidenType = getTypeAction(*DAG.getContext(),
MVT::v2i32) == TypeWidenVector;		MVT::v2i32) == TypeWidenVector;
ResVT = WidenType ? MVT::v4i32 : MVT::v2i32;		ResVT = WidenType ? MVT::v4i32 : MVT::v2i32;
Res = DAG.getNode(ISD::EXTRACT_SUBVECTOR, dl, ResVT, Res,		Res = DAG.getNode(ISD::EXTRACT_SUBVECTOR, dl, ResVT, Res,
DAG.getIntPtrConstant(0, dl));		DAG.getIntPtrConstant(0, dl));
Results.push_back(Res);		Results.push_back(Res);
return;		return;
}		}
if (Src.getValueType() == MVT::v2f32) {		if (SrcVT == MVT::v2f32) {
SDValue Idx = DAG.getIntPtrConstant(0, dl);		SDValue Idx = DAG.getIntPtrConstant(0, dl);
SDValue Res = DAG.getNode(ISD::CONCAT_VECTORS, dl, MVT::v4f32, Src,		SDValue Res = DAG.getNode(ISD::CONCAT_VECTORS, dl, MVT::v4f32, Src,
DAG.getUNDEF(MVT::v2f32));		DAG.getUNDEF(MVT::v2f32));
Res = DAG.getNode(IsSigned ? ISD::FP_TO_SINT		Res = DAG.getNode(IsSigned ? ISD::FP_TO_SINT
: ISD::FP_TO_UINT, dl, MVT::v4i32, Res);		: ISD::FP_TO_UINT, dl, MVT::v4i32, Res);
if (getTypeAction(*DAG.getContext(), MVT::v2i32) != TypeWidenVector)		if (getTypeAction(*DAG.getContext(), MVT::v2i32) != TypeWidenVector)
Res = DAG.getNode(ISD::EXTRACT_SUBVECTOR, dl, MVT::v2i32, Res, Idx);		Res = DAG.getNode(ISD::EXTRACT_SUBVECTOR, dl, MVT::v2i32, Res, Idx);
Results.push_back(Res);		Results.push_back(Res);
return;		return;
}		}

// The FP_TO_INTHelper below only handles f32/f64/f80 scalar inputs,		// The FP_TO_INTHelper below only handles f32/f64/f80 scalar inputs,
// so early out here.		// so early out here.
return;		return;
}		}

		if (Subtarget.hasDQI() && VT == MVT::i64 &&
		(SrcVT == MVT::f32 \|\| SrcVT == MVT::f64)) {
		assert(!Subtarget.is64Bit() && "i64 should be legal");
		unsigned NumElts = Subtarget.hasVLX() ? 4 : 8;
		// Using a 256-bit input here to guarantee 128-bit input for f32 case.
		// TODO: Use 128-bit vectors for f64 case?
		// TODO: Use 128-bit vectors for f32 by using CVTTP2SI/CVTTP2UI.
		MVT VecVT = MVT::getVectorVT(MVT::i64, NumElts);
		MVT VecInVT = MVT::getVectorVT(SrcVT.getSimpleVT(), NumElts);

		SDValue ZeroIdx = DAG.getIntPtrConstant(0, dl);
		SDValue Res = DAG.getNode(ISD::INSERT_VECTOR_ELT, dl, VecInVT,
		DAG.getConstantFP(0.0, dl, VecInVT), Src,
		ZeroIdx);
		Res = DAG.getNode(N->getOpcode(), SDLoc(N), VecVT, Res);
		Res = DAG.getNode(ISD::EXTRACT_VECTOR_ELT, dl, VT, Res, ZeroIdx);
		Results.push_back(Res);
		return;
		}

std::pair<SDValue,SDValue> Vals =		std::pair<SDValue,SDValue> Vals =
FP_TO_INTHelper(SDValue(N, 0), DAG, IsSigned, /IsReplace=/ true);		FP_TO_INTHelper(SDValue(N, 0), DAG, IsSigned, /IsReplace=/ true);
SDValue FIST = Vals.first, StackSlot = Vals.second;		SDValue FIST = Vals.first, StackSlot = Vals.second;
if (FIST.getNode()) {		if (FIST.getNode()) {
EVT VT = N->getValueType(0);
// Return a load from the stack slot.		// Return a load from the stack slot.
if (StackSlot.getNode())		if (StackSlot.getNode())
Results.push_back(		Results.push_back(
DAG.getLoad(VT, dl, FIST, StackSlot, MachinePointerInfo()));		DAG.getLoad(VT, dl, FIST, StackSlot, MachinePointerInfo()));
else		else
Results.push_back(FIST);		Results.push_back(FIST);
}		}
return;		return;
▲ Show 20 Lines • Show All 14,574 Lines • Show Last 20 Lines

llvm/trunk/test/CodeGen/X86/avx512-regcall-NoMask.ll

Show First 20 Lines • Show All 1,160 Lines • ▼ Show 20 Lines	; LINUXOSX64-NEXT: retq
%x8 = fadd <32 x float> %c2, %x7		%x8 = fadd <32 x float> %c2, %x7
ret <32 x float> %x8		ret <32 x float> %x8
}		}

; Test regcall when passing/retrieving mixed types		; Test regcall when passing/retrieving mixed types
define x86_regcallcc i32 @test_argRetMixTypes(double, float, i8 signext, i32, i64, i16 signext, i32*) #0 {		define x86_regcallcc i32 @test_argRetMixTypes(double, float, i8 signext, i32, i64, i16 signext, i32*) #0 {
; X32-LABEL: test_argRetMixTypes:		; X32-LABEL: test_argRetMixTypes:
; X32: # %bb.0:		; X32: # %bb.0:
; X32-NEXT: pushl %ebp		; X32-NEXT: pushl %ebx
; X32-NEXT: movl %esp, %ebp		; X32-NEXT: movl {{[0-9]+}}(%esp), %ebx
; X32-NEXT: andl $-8, %esp
; X32-NEXT: subl $16, %esp
; X32-NEXT: vmovd %edx, %xmm2
; X32-NEXT: vpinsrd $1, %edi, %xmm2, %xmm2
; X32-NEXT: movl 8(%ebp), %edx
; X32-NEXT: vcvtss2sd %xmm1, %xmm1, %xmm1		; X32-NEXT: vcvtss2sd %xmm1, %xmm1, %xmm1
; X32-NEXT: vaddsd %xmm0, %xmm1, %xmm0		; X32-NEXT: vaddsd %xmm0, %xmm1, %xmm0
; X32-NEXT: vcvtsi2sdl %eax, %xmm3, %xmm1		; X32-NEXT: vcvtsi2sdl %eax, %xmm2, %xmm1
		; X32-NEXT: vaddsd %xmm1, %xmm0, %xmm0
		; X32-NEXT: vcvtsi2sdl %ecx, %xmm2, %xmm1
; X32-NEXT: vaddsd %xmm1, %xmm0, %xmm0		; X32-NEXT: vaddsd %xmm1, %xmm0, %xmm0
; X32-NEXT: vcvtsi2sdl %ecx, %xmm3, %xmm1		; X32-NEXT: vmovd %edx, %xmm1
		; X32-NEXT: vpinsrd $1, %edi, %xmm1, %xmm1
		; X32-NEXT: vcvtqq2pd %ymm1, %ymm1
; X32-NEXT: vaddsd %xmm1, %xmm0, %xmm0		; X32-NEXT: vaddsd %xmm1, %xmm0, %xmm0
; X32-NEXT: vmovq %xmm2, {{[0-9]+}}(%esp)		; X32-NEXT: vcvtsi2sdl %esi, %xmm2, %xmm1
; X32-NEXT: fildll {{[0-9]+}}(%esp)
; X32-NEXT: fstpl (%esp)
; X32-NEXT: vaddsd (%esp), %xmm0, %xmm0
; X32-NEXT: vcvtsi2sdl %esi, %xmm3, %xmm1
; X32-NEXT: vaddsd %xmm1, %xmm0, %xmm0		; X32-NEXT: vaddsd %xmm1, %xmm0, %xmm0
; X32-NEXT: vcvtsi2sdl (%edx), %xmm3, %xmm1		; X32-NEXT: vcvtsi2sdl (%ebx), %xmm2, %xmm1
; X32-NEXT: vaddsd %xmm1, %xmm0, %xmm0		; X32-NEXT: vaddsd %xmm1, %xmm0, %xmm0
; X32-NEXT: vcvttsd2si %xmm0, %eax		; X32-NEXT: vcvttsd2si %xmm0, %eax
; X32-NEXT: movl %ebp, %esp		; X32-NEXT: popl %ebx
; X32-NEXT: popl %ebp		; X32-NEXT: vzeroupper
; X32-NEXT: retl		; X32-NEXT: retl
;		;
; WIN64-LABEL: test_argRetMixTypes:		; WIN64-LABEL: test_argRetMixTypes:
; WIN64: # %bb.0:		; WIN64: # %bb.0:
; WIN64-NEXT: vcvtss2sd %xmm1, %xmm1, %xmm1		; WIN64-NEXT: vcvtss2sd %xmm1, %xmm1, %xmm1
; WIN64-NEXT: vaddsd %xmm0, %xmm1, %xmm0		; WIN64-NEXT: vaddsd %xmm0, %xmm1, %xmm0
; WIN64-NEXT: vcvtsi2sdl %eax, %xmm2, %xmm1		; WIN64-NEXT: vcvtsi2sdl %eax, %xmm2, %xmm1
; WIN64-NEXT: vaddsd %xmm1, %xmm0, %xmm0		; WIN64-NEXT: vaddsd %xmm1, %xmm0, %xmm0
▲ Show 20 Lines • Show All 79 Lines • Show Last 20 Lines

llvm/trunk/test/CodeGen/X86/scalar-fp-to-i64.ll

	Show All 33 Lines
	; Otherwise the sequence will involve an FP subtract (fsub, subss or subsd),			; Otherwise the sequence will involve an FP subtract (fsub, subss or subsd),
	; and a truncating conversion (cvtts[ds]2si, fisttp, or fnstcw+fist). When			; and a truncating conversion (cvtts[ds]2si, fisttp, or fnstcw+fist). When
	; both a subtract and fnstcw are needed, they can occur in either order.			; both a subtract and fnstcw are needed, they can occur in either order.
	;			;
	; The interesting subtargets are AVX512F (vcvtts[ds]2usi), SSE3 (fisttp),			; The interesting subtargets are AVX512F (vcvtts[ds]2usi), SSE3 (fisttp),
	; SSE2 (cvtts[ds]2si) and vanilla X87 (fnstcw+fist, 32-bit only).			; SSE2 (cvtts[ds]2si) and vanilla X87 (fnstcw+fist, 32-bit only).

	define i64 @f_to_u64(float %a) nounwind {			define i64 @f_to_u64(float %a) nounwind {
	; AVX512_32_WIN-LABEL: f_to_u64:			; AVX512DQVL_32_WIN-LABEL: f_to_u64:
	; AVX512_32_WIN: # %bb.0:			; AVX512DQVL_32_WIN: # %bb.0:
	; AVX512_32_WIN-NEXT: pushl %ebp			; AVX512DQVL_32_WIN-NEXT: vmovss {{.*#+}} xmm0 = mem[0],zero,zero,zero
	; AVX512_32_WIN-NEXT: movl %esp, %ebp			; AVX512DQVL_32_WIN-NEXT: vcvttps2uqq %xmm0, %ymm0
	; AVX512_32_WIN-NEXT: andl $-8, %esp			; AVX512DQVL_32_WIN-NEXT: vmovd %xmm0, %eax
	; AVX512_32_WIN-NEXT: subl $16, %esp			; AVX512DQVL_32_WIN-NEXT: vpextrd $1, %xmm0, %edx
	; AVX512_32_WIN-NEXT: vmovss {{.*#+}} xmm0 = mem[0],zero,zero,zero			; AVX512DQVL_32_WIN-NEXT: vzeroupper
	; AVX512_32_WIN-NEXT: vmovss {{.*#+}} xmm1 = mem[0],zero,zero,zero			; AVX512DQVL_32_WIN-NEXT: retl
	; AVX512_32_WIN-NEXT: vcmpltss %xmm1, %xmm0, %k1			;
	; AVX512_32_WIN-NEXT: vsubss %xmm1, %xmm0, %xmm2			; AVX512DQVL_32_LIN-LABEL: f_to_u64:
	; AVX512_32_WIN-NEXT: vmovss %xmm0, %xmm0, %xmm2 {%k1}			; AVX512DQVL_32_LIN: # %bb.0:
	; AVX512_32_WIN-NEXT: vmovss %xmm2, {{[0-9]+}}(%esp)			; AVX512DQVL_32_LIN-NEXT: vmovss {{.*#+}} xmm0 = mem[0],zero,zero,zero
	; AVX512_32_WIN-NEXT: flds {{[0-9]+}}(%esp)			; AVX512DQVL_32_LIN-NEXT: vcvttps2uqq %xmm0, %ymm0
	; AVX512_32_WIN-NEXT: fisttpll (%esp)			; AVX512DQVL_32_LIN-NEXT: vmovd %xmm0, %eax
	; AVX512_32_WIN-NEXT: xorl %edx, %edx			; AVX512DQVL_32_LIN-NEXT: vpextrd $1, %xmm0, %edx
	; AVX512_32_WIN-NEXT: vucomiss %xmm0, %xmm1			; AVX512DQVL_32_LIN-NEXT: vzeroupper
	; AVX512_32_WIN-NEXT: setbe %dl			; AVX512DQVL_32_LIN-NEXT: retl
	; AVX512_32_WIN-NEXT: shll $31, %edx
	; AVX512_32_WIN-NEXT: xorl {{[0-9]+}}(%esp), %edx
	; AVX512_32_WIN-NEXT: movl (%esp), %eax
	; AVX512_32_WIN-NEXT: movl %ebp, %esp
	; AVX512_32_WIN-NEXT: popl %ebp
	; AVX512_32_WIN-NEXT: retl
	;
	; AVX512_32_LIN-LABEL: f_to_u64:
	; AVX512_32_LIN: # %bb.0:
	; AVX512_32_LIN-NEXT: subl $20, %esp
	; AVX512_32_LIN-NEXT: vmovss {{.*#+}} xmm0 = mem[0],zero,zero,zero
	; AVX512_32_LIN-NEXT: vmovss {{.*#+}} xmm1 = mem[0],zero,zero,zero
	; AVX512_32_LIN-NEXT: vcmpltss %xmm1, %xmm0, %k1
	; AVX512_32_LIN-NEXT: vsubss %xmm1, %xmm0, %xmm2
	; AVX512_32_LIN-NEXT: vmovss %xmm0, %xmm0, %xmm2 {%k1}
	; AVX512_32_LIN-NEXT: vmovss %xmm2, {{[0-9]+}}(%esp)
	; AVX512_32_LIN-NEXT: flds {{[0-9]+}}(%esp)
	; AVX512_32_LIN-NEXT: fisttpll (%esp)
	; AVX512_32_LIN-NEXT: xorl %edx, %edx
	; AVX512_32_LIN-NEXT: vucomiss %xmm0, %xmm1
	; AVX512_32_LIN-NEXT: setbe %dl
	; AVX512_32_LIN-NEXT: shll $31, %edx
	; AVX512_32_LIN-NEXT: xorl {{[0-9]+}}(%esp), %edx
	; AVX512_32_LIN-NEXT: movl (%esp), %eax
	; AVX512_32_LIN-NEXT: addl $20, %esp
	; AVX512_32_LIN-NEXT: retl
	;			;
	; AVX512_64-LABEL: f_to_u64:			; AVX512_64-LABEL: f_to_u64:
	; AVX512_64: # %bb.0:			; AVX512_64: # %bb.0:
	; AVX512_64-NEXT: vcvttss2usi %xmm0, %rax			; AVX512_64-NEXT: vcvttss2usi %xmm0, %rax
	; AVX512_64-NEXT: retq			; AVX512_64-NEXT: retq
	;			;
				; AVX512DQ_32_WIN-LABEL: f_to_u64:
				; AVX512DQ_32_WIN: # %bb.0:
				; AVX512DQ_32_WIN-NEXT: vmovss {{.*#+}} xmm0 = mem[0],zero,zero,zero
				; AVX512DQ_32_WIN-NEXT: vcvttps2uqq %ymm0, %zmm0
				; AVX512DQ_32_WIN-NEXT: vmovd %xmm0, %eax
				; AVX512DQ_32_WIN-NEXT: vpextrd $1, %xmm0, %edx
				; AVX512DQ_32_WIN-NEXT: vzeroupper
				; AVX512DQ_32_WIN-NEXT: retl
				;
				; AVX512DQ_32_LIN-LABEL: f_to_u64:
				; AVX512DQ_32_LIN: # %bb.0:
				; AVX512DQ_32_LIN-NEXT: vmovss {{.*#+}} xmm0 = mem[0],zero,zero,zero
				; AVX512DQ_32_LIN-NEXT: vcvttps2uqq %ymm0, %zmm0
				; AVX512DQ_32_LIN-NEXT: vmovd %xmm0, %eax
				; AVX512DQ_32_LIN-NEXT: vpextrd $1, %xmm0, %edx
				; AVX512DQ_32_LIN-NEXT: vzeroupper
				; AVX512DQ_32_LIN-NEXT: retl
				;
				; AVX512F_32_WIN-LABEL: f_to_u64:
				; AVX512F_32_WIN: # %bb.0:
				; AVX512F_32_WIN-NEXT: pushl %ebp
				; AVX512F_32_WIN-NEXT: movl %esp, %ebp
				; AVX512F_32_WIN-NEXT: andl $-8, %esp
				; AVX512F_32_WIN-NEXT: subl $16, %esp
				; AVX512F_32_WIN-NEXT: vmovss {{.*#+}} xmm0 = mem[0],zero,zero,zero
				; AVX512F_32_WIN-NEXT: vmovss {{.*#+}} xmm1 = mem[0],zero,zero,zero
				; AVX512F_32_WIN-NEXT: vcmpltss %xmm1, %xmm0, %k1
				; AVX512F_32_WIN-NEXT: vsubss %xmm1, %xmm0, %xmm2
				; AVX512F_32_WIN-NEXT: vmovss %xmm0, %xmm0, %xmm2 {%k1}
				; AVX512F_32_WIN-NEXT: vmovss %xmm2, {{[0-9]+}}(%esp)
				; AVX512F_32_WIN-NEXT: flds {{[0-9]+}}(%esp)
				; AVX512F_32_WIN-NEXT: fisttpll (%esp)
				; AVX512F_32_WIN-NEXT: xorl %edx, %edx
				; AVX512F_32_WIN-NEXT: vucomiss %xmm0, %xmm1
				; AVX512F_32_WIN-NEXT: setbe %dl
				; AVX512F_32_WIN-NEXT: shll $31, %edx
				; AVX512F_32_WIN-NEXT: xorl {{[0-9]+}}(%esp), %edx
				; AVX512F_32_WIN-NEXT: movl (%esp), %eax
				; AVX512F_32_WIN-NEXT: movl %ebp, %esp
				; AVX512F_32_WIN-NEXT: popl %ebp
				; AVX512F_32_WIN-NEXT: retl
				;
				; AVX512F_32_LIN-LABEL: f_to_u64:
				; AVX512F_32_LIN: # %bb.0:
				; AVX512F_32_LIN-NEXT: subl $20, %esp
				; AVX512F_32_LIN-NEXT: vmovss {{.*#+}} xmm0 = mem[0],zero,zero,zero
				; AVX512F_32_LIN-NEXT: vmovss {{.*#+}} xmm1 = mem[0],zero,zero,zero
				; AVX512F_32_LIN-NEXT: vcmpltss %xmm1, %xmm0, %k1
				; AVX512F_32_LIN-NEXT: vsubss %xmm1, %xmm0, %xmm2
				; AVX512F_32_LIN-NEXT: vmovss %xmm0, %xmm0, %xmm2 {%k1}
				; AVX512F_32_LIN-NEXT: vmovss %xmm2, {{[0-9]+}}(%esp)
				; AVX512F_32_LIN-NEXT: flds {{[0-9]+}}(%esp)
				; AVX512F_32_LIN-NEXT: fisttpll (%esp)
				; AVX512F_32_LIN-NEXT: xorl %edx, %edx
				; AVX512F_32_LIN-NEXT: vucomiss %xmm0, %xmm1
				; AVX512F_32_LIN-NEXT: setbe %dl
				; AVX512F_32_LIN-NEXT: shll $31, %edx
				; AVX512F_32_LIN-NEXT: xorl {{[0-9]+}}(%esp), %edx
				; AVX512F_32_LIN-NEXT: movl (%esp), %eax
				; AVX512F_32_LIN-NEXT: addl $20, %esp
				; AVX512F_32_LIN-NEXT: retl
				;
	; SSE3_32_WIN-LABEL: f_to_u64:			; SSE3_32_WIN-LABEL: f_to_u64:
	; SSE3_32_WIN: # %bb.0:			; SSE3_32_WIN: # %bb.0:
	; SSE3_32_WIN-NEXT: pushl %ebp			; SSE3_32_WIN-NEXT: pushl %ebp
	; SSE3_32_WIN-NEXT: movl %esp, %ebp			; SSE3_32_WIN-NEXT: movl %esp, %ebp
	; SSE3_32_WIN-NEXT: andl $-8, %esp			; SSE3_32_WIN-NEXT: andl $-8, %esp
	; SSE3_32_WIN-NEXT: subl $16, %esp			; SSE3_32_WIN-NEXT: subl $16, %esp
	; SSE3_32_WIN-NEXT: movss {{.*#+}} xmm0 = mem[0],zero,zero,zero			; SSE3_32_WIN-NEXT: movss {{.*#+}} xmm0 = mem[0],zero,zero,zero
	; SSE3_32_WIN-NEXT: movss {{.*#+}} xmm1 = mem[0],zero,zero,zero			; SSE3_32_WIN-NEXT: movss {{.*#+}} xmm1 = mem[0],zero,zero,zero
	▲ Show 20 Lines • Show All 200 Lines • ▼ Show 20 Lines
	; X87_LIN-NEXT: movl {{[0-9]+}}(%esp), %eax			; X87_LIN-NEXT: movl {{[0-9]+}}(%esp), %eax
	; X87_LIN-NEXT: addl $20, %esp			; X87_LIN-NEXT: addl $20, %esp
	; X87_LIN-NEXT: retl			; X87_LIN-NEXT: retl
	%r = fptoui float %a to i64			%r = fptoui float %a to i64
	ret i64 %r			ret i64 %r
	}			}

	define i64 @f_to_s64(float %a) nounwind {			define i64 @f_to_s64(float %a) nounwind {
	; AVX512_32_WIN-LABEL: f_to_s64:			; AVX512DQVL_32_WIN-LABEL: f_to_s64:
	; AVX512_32_WIN: # %bb.0:			; AVX512DQVL_32_WIN: # %bb.0:
	; AVX512_32_WIN-NEXT: pushl %ebp			; AVX512DQVL_32_WIN-NEXT: vmovss {{.*#+}} xmm0 = mem[0],zero,zero,zero
	; AVX512_32_WIN-NEXT: movl %esp, %ebp			; AVX512DQVL_32_WIN-NEXT: vcvttps2qq %xmm0, %ymm0
	; AVX512_32_WIN-NEXT: andl $-8, %esp			; AVX512DQVL_32_WIN-NEXT: vmovd %xmm0, %eax
	; AVX512_32_WIN-NEXT: subl $16, %esp			; AVX512DQVL_32_WIN-NEXT: vpextrd $1, %xmm0, %edx
	; AVX512_32_WIN-NEXT: vmovss {{.*#+}} xmm0 = mem[0],zero,zero,zero			; AVX512DQVL_32_WIN-NEXT: vzeroupper
	; AVX512_32_WIN-NEXT: vmovss %xmm0, {{[0-9]+}}(%esp)			; AVX512DQVL_32_WIN-NEXT: retl
	; AVX512_32_WIN-NEXT: flds {{[0-9]+}}(%esp)			;
	; AVX512_32_WIN-NEXT: fisttpll (%esp)			; AVX512DQVL_32_LIN-LABEL: f_to_s64:
	; AVX512_32_WIN-NEXT: movl (%esp), %eax			; AVX512DQVL_32_LIN: # %bb.0:
	; AVX512_32_WIN-NEXT: movl {{[0-9]+}}(%esp), %edx			; AVX512DQVL_32_LIN-NEXT: vmovss {{.*#+}} xmm0 = mem[0],zero,zero,zero
	; AVX512_32_WIN-NEXT: movl %ebp, %esp			; AVX512DQVL_32_LIN-NEXT: vcvttps2qq %xmm0, %ymm0
	; AVX512_32_WIN-NEXT: popl %ebp			; AVX512DQVL_32_LIN-NEXT: vmovd %xmm0, %eax
	; AVX512_32_WIN-NEXT: retl			; AVX512DQVL_32_LIN-NEXT: vpextrd $1, %xmm0, %edx
	;			; AVX512DQVL_32_LIN-NEXT: vzeroupper
	; AVX512_32_LIN-LABEL: f_to_s64:			; AVX512DQVL_32_LIN-NEXT: retl
	; AVX512_32_LIN: # %bb.0:
	; AVX512_32_LIN-NEXT: subl $20, %esp
	; AVX512_32_LIN-NEXT: vmovss {{.*#+}} xmm0 = mem[0],zero,zero,zero
	; AVX512_32_LIN-NEXT: vmovss %xmm0, {{[0-9]+}}(%esp)
	; AVX512_32_LIN-NEXT: flds {{[0-9]+}}(%esp)
	; AVX512_32_LIN-NEXT: fisttpll (%esp)
	; AVX512_32_LIN-NEXT: movl (%esp), %eax
	; AVX512_32_LIN-NEXT: movl {{[0-9]+}}(%esp), %edx
	; AVX512_32_LIN-NEXT: addl $20, %esp
	; AVX512_32_LIN-NEXT: retl
	;			;
	; AVX512_64-LABEL: f_to_s64:			; AVX512_64-LABEL: f_to_s64:
	; AVX512_64: # %bb.0:			; AVX512_64: # %bb.0:
	; AVX512_64-NEXT: vcvttss2si %xmm0, %rax			; AVX512_64-NEXT: vcvttss2si %xmm0, %rax
	; AVX512_64-NEXT: retq			; AVX512_64-NEXT: retq
	;			;
				; AVX512DQ_32_WIN-LABEL: f_to_s64:
				; AVX512DQ_32_WIN: # %bb.0:
				; AVX512DQ_32_WIN-NEXT: vmovss {{.*#+}} xmm0 = mem[0],zero,zero,zero
				; AVX512DQ_32_WIN-NEXT: vcvttps2qq %ymm0, %zmm0
				; AVX512DQ_32_WIN-NEXT: vmovd %xmm0, %eax
				; AVX512DQ_32_WIN-NEXT: vpextrd $1, %xmm0, %edx
				; AVX512DQ_32_WIN-NEXT: vzeroupper
				; AVX512DQ_32_WIN-NEXT: retl
				;
				; AVX512DQ_32_LIN-LABEL: f_to_s64:
				; AVX512DQ_32_LIN: # %bb.0:
				; AVX512DQ_32_LIN-NEXT: vmovss {{.*#+}} xmm0 = mem[0],zero,zero,zero
				; AVX512DQ_32_LIN-NEXT: vcvttps2qq %ymm0, %zmm0
				; AVX512DQ_32_LIN-NEXT: vmovd %xmm0, %eax
				; AVX512DQ_32_LIN-NEXT: vpextrd $1, %xmm0, %edx
				; AVX512DQ_32_LIN-NEXT: vzeroupper
				; AVX512DQ_32_LIN-NEXT: retl
				;
				; AVX512F_32_WIN-LABEL: f_to_s64:
				; AVX512F_32_WIN: # %bb.0:
				; AVX512F_32_WIN-NEXT: pushl %ebp
				; AVX512F_32_WIN-NEXT: movl %esp, %ebp
				; AVX512F_32_WIN-NEXT: andl $-8, %esp
				; AVX512F_32_WIN-NEXT: subl $16, %esp
				; AVX512F_32_WIN-NEXT: vmovss {{.*#+}} xmm0 = mem[0],zero,zero,zero
				; AVX512F_32_WIN-NEXT: vmovss %xmm0, {{[0-9]+}}(%esp)
				; AVX512F_32_WIN-NEXT: flds {{[0-9]+}}(%esp)
				; AVX512F_32_WIN-NEXT: fisttpll (%esp)
				; AVX512F_32_WIN-NEXT: movl (%esp), %eax
				; AVX512F_32_WIN-NEXT: movl {{[0-9]+}}(%esp), %edx
				; AVX512F_32_WIN-NEXT: movl %ebp, %esp
				; AVX512F_32_WIN-NEXT: popl %ebp
				; AVX512F_32_WIN-NEXT: retl
				;
				; AVX512F_32_LIN-LABEL: f_to_s64:
				; AVX512F_32_LIN: # %bb.0:
				; AVX512F_32_LIN-NEXT: subl $20, %esp
				; AVX512F_32_LIN-NEXT: vmovss {{.*#+}} xmm0 = mem[0],zero,zero,zero
				; AVX512F_32_LIN-NEXT: vmovss %xmm0, {{[0-9]+}}(%esp)
				; AVX512F_32_LIN-NEXT: flds {{[0-9]+}}(%esp)
				; AVX512F_32_LIN-NEXT: fisttpll (%esp)
				; AVX512F_32_LIN-NEXT: movl (%esp), %eax
				; AVX512F_32_LIN-NEXT: movl {{[0-9]+}}(%esp), %edx
				; AVX512F_32_LIN-NEXT: addl $20, %esp
				; AVX512F_32_LIN-NEXT: retl
				;
	; SSE3_32_WIN-LABEL: f_to_s64:			; SSE3_32_WIN-LABEL: f_to_s64:
	; SSE3_32_WIN: # %bb.0:			; SSE3_32_WIN: # %bb.0:
	; SSE3_32_WIN-NEXT: pushl %ebp			; SSE3_32_WIN-NEXT: pushl %ebp
	; SSE3_32_WIN-NEXT: movl %esp, %ebp			; SSE3_32_WIN-NEXT: movl %esp, %ebp
	; SSE3_32_WIN-NEXT: andl $-8, %esp			; SSE3_32_WIN-NEXT: andl $-8, %esp
	; SSE3_32_WIN-NEXT: subl $16, %esp			; SSE3_32_WIN-NEXT: subl $16, %esp
	; SSE3_32_WIN-NEXT: movss {{.*#+}} xmm0 = mem[0],zero,zero,zero			; SSE3_32_WIN-NEXT: movss {{.*#+}} xmm0 = mem[0],zero,zero,zero
	; SSE3_32_WIN-NEXT: movss %xmm0, {{[0-9]+}}(%esp)			; SSE3_32_WIN-NEXT: movss %xmm0, {{[0-9]+}}(%esp)
	▲ Show 20 Lines • Show All 102 Lines • ▼ Show 20 Lines
	; X87_LIN-NEXT: movl {{[0-9]+}}(%esp), %edx			; X87_LIN-NEXT: movl {{[0-9]+}}(%esp), %edx
	; X87_LIN-NEXT: addl $20, %esp			; X87_LIN-NEXT: addl $20, %esp
	; X87_LIN-NEXT: retl			; X87_LIN-NEXT: retl
	%r = fptosi float %a to i64			%r = fptosi float %a to i64
	ret i64 %r			ret i64 %r
	}			}

	define i64 @d_to_u64(double %a) nounwind {			define i64 @d_to_u64(double %a) nounwind {
	; AVX512_32_WIN-LABEL: d_to_u64:			; AVX512DQVL_32_WIN-LABEL: d_to_u64:
	; AVX512_32_WIN: # %bb.0:			; AVX512DQVL_32_WIN: # %bb.0:
	; AVX512_32_WIN-NEXT: pushl %ebp			; AVX512DQVL_32_WIN-NEXT: vmovsd {{.*#+}} xmm0 = mem[0],zero
	; AVX512_32_WIN-NEXT: movl %esp, %ebp			; AVX512DQVL_32_WIN-NEXT: vcvttpd2uqq %ymm0, %ymm0
	; AVX512_32_WIN-NEXT: andl $-8, %esp			; AVX512DQVL_32_WIN-NEXT: vmovd %xmm0, %eax
	; AVX512_32_WIN-NEXT: subl $16, %esp			; AVX512DQVL_32_WIN-NEXT: vpextrd $1, %xmm0, %edx
	; AVX512_32_WIN-NEXT: vmovsd {{.*#+}} xmm0 = mem[0],zero			; AVX512DQVL_32_WIN-NEXT: vzeroupper
	; AVX512_32_WIN-NEXT: vmovsd {{.*#+}} xmm1 = mem[0],zero			; AVX512DQVL_32_WIN-NEXT: retl
	; AVX512_32_WIN-NEXT: vcmpltsd %xmm1, %xmm0, %k1			;
	; AVX512_32_WIN-NEXT: vsubsd %xmm1, %xmm0, %xmm2			; AVX512DQVL_32_LIN-LABEL: d_to_u64:
	; AVX512_32_WIN-NEXT: vmovsd %xmm0, %xmm0, %xmm2 {%k1}			; AVX512DQVL_32_LIN: # %bb.0:
	; AVX512_32_WIN-NEXT: vmovsd %xmm2, {{[0-9]+}}(%esp)			; AVX512DQVL_32_LIN-NEXT: vmovsd {{.*#+}} xmm0 = mem[0],zero
	; AVX512_32_WIN-NEXT: fldl {{[0-9]+}}(%esp)			; AVX512DQVL_32_LIN-NEXT: vcvttpd2uqq %ymm0, %ymm0
	; AVX512_32_WIN-NEXT: fisttpll (%esp)			; AVX512DQVL_32_LIN-NEXT: vmovd %xmm0, %eax
	; AVX512_32_WIN-NEXT: xorl %edx, %edx			; AVX512DQVL_32_LIN-NEXT: vpextrd $1, %xmm0, %edx
	; AVX512_32_WIN-NEXT: vucomisd %xmm0, %xmm1			; AVX512DQVL_32_LIN-NEXT: vzeroupper
	; AVX512_32_WIN-NEXT: setbe %dl			; AVX512DQVL_32_LIN-NEXT: retl
	; AVX512_32_WIN-NEXT: shll $31, %edx
	; AVX512_32_WIN-NEXT: xorl {{[0-9]+}}(%esp), %edx
	; AVX512_32_WIN-NEXT: movl (%esp), %eax
	; AVX512_32_WIN-NEXT: movl %ebp, %esp
	; AVX512_32_WIN-NEXT: popl %ebp
	; AVX512_32_WIN-NEXT: retl
	;
	; AVX512_32_LIN-LABEL: d_to_u64:
	; AVX512_32_LIN: # %bb.0:
	; AVX512_32_LIN-NEXT: subl $20, %esp
	; AVX512_32_LIN-NEXT: vmovsd {{.*#+}} xmm0 = mem[0],zero
	; AVX512_32_LIN-NEXT: vmovsd {{.*#+}} xmm1 = mem[0],zero
	; AVX512_32_LIN-NEXT: vcmpltsd %xmm1, %xmm0, %k1
	; AVX512_32_LIN-NEXT: vsubsd %xmm1, %xmm0, %xmm2
	; AVX512_32_LIN-NEXT: vmovsd %xmm0, %xmm0, %xmm2 {%k1}
	; AVX512_32_LIN-NEXT: vmovsd %xmm2, {{[0-9]+}}(%esp)
	; AVX512_32_LIN-NEXT: fldl {{[0-9]+}}(%esp)
	; AVX512_32_LIN-NEXT: fisttpll (%esp)
	; AVX512_32_LIN-NEXT: xorl %edx, %edx
	; AVX512_32_LIN-NEXT: vucomisd %xmm0, %xmm1
	; AVX512_32_LIN-NEXT: setbe %dl
	; AVX512_32_LIN-NEXT: shll $31, %edx
	; AVX512_32_LIN-NEXT: xorl {{[0-9]+}}(%esp), %edx
	; AVX512_32_LIN-NEXT: movl (%esp), %eax
	; AVX512_32_LIN-NEXT: addl $20, %esp
	; AVX512_32_LIN-NEXT: retl
	;			;
	; AVX512_64-LABEL: d_to_u64:			; AVX512_64-LABEL: d_to_u64:
	; AVX512_64: # %bb.0:			; AVX512_64: # %bb.0:
	; AVX512_64-NEXT: vcvttsd2usi %xmm0, %rax			; AVX512_64-NEXT: vcvttsd2usi %xmm0, %rax
	; AVX512_64-NEXT: retq			; AVX512_64-NEXT: retq
	;			;
				; AVX512DQ_32_WIN-LABEL: d_to_u64:
				; AVX512DQ_32_WIN: # %bb.0:
				; AVX512DQ_32_WIN-NEXT: vmovsd {{.*#+}} xmm0 = mem[0],zero
				; AVX512DQ_32_WIN-NEXT: vcvttpd2uqq %zmm0, %zmm0
				; AVX512DQ_32_WIN-NEXT: vmovd %xmm0, %eax
				; AVX512DQ_32_WIN-NEXT: vpextrd $1, %xmm0, %edx
				; AVX512DQ_32_WIN-NEXT: vzeroupper
				; AVX512DQ_32_WIN-NEXT: retl
				;
				; AVX512DQ_32_LIN-LABEL: d_to_u64:
				; AVX512DQ_32_LIN: # %bb.0:
				; AVX512DQ_32_LIN-NEXT: vmovsd {{.*#+}} xmm0 = mem[0],zero
				; AVX512DQ_32_LIN-NEXT: vcvttpd2uqq %zmm0, %zmm0
				; AVX512DQ_32_LIN-NEXT: vmovd %xmm0, %eax
				; AVX512DQ_32_LIN-NEXT: vpextrd $1, %xmm0, %edx
				; AVX512DQ_32_LIN-NEXT: vzeroupper
				; AVX512DQ_32_LIN-NEXT: retl
				;
				; AVX512F_32_WIN-LABEL: d_to_u64:
				; AVX512F_32_WIN: # %bb.0:
				; AVX512F_32_WIN-NEXT: pushl %ebp
				; AVX512F_32_WIN-NEXT: movl %esp, %ebp
				; AVX512F_32_WIN-NEXT: andl $-8, %esp
				; AVX512F_32_WIN-NEXT: subl $16, %esp
				; AVX512F_32_WIN-NEXT: vmovsd {{.*#+}} xmm0 = mem[0],zero
				; AVX512F_32_WIN-NEXT: vmovsd {{.*#+}} xmm1 = mem[0],zero
				; AVX512F_32_WIN-NEXT: vcmpltsd %xmm1, %xmm0, %k1
				; AVX512F_32_WIN-NEXT: vsubsd %xmm1, %xmm0, %xmm2
				; AVX512F_32_WIN-NEXT: vmovsd %xmm0, %xmm0, %xmm2 {%k1}
				; AVX512F_32_WIN-NEXT: vmovsd %xmm2, {{[0-9]+}}(%esp)
				; AVX512F_32_WIN-NEXT: fldl {{[0-9]+}}(%esp)
				; AVX512F_32_WIN-NEXT: fisttpll (%esp)
				; AVX512F_32_WIN-NEXT: xorl %edx, %edx
				; AVX512F_32_WIN-NEXT: vucomisd %xmm0, %xmm1
				; AVX512F_32_WIN-NEXT: setbe %dl
				; AVX512F_32_WIN-NEXT: shll $31, %edx
				; AVX512F_32_WIN-NEXT: xorl {{[0-9]+}}(%esp), %edx
				; AVX512F_32_WIN-NEXT: movl (%esp), %eax
				; AVX512F_32_WIN-NEXT: movl %ebp, %esp
				; AVX512F_32_WIN-NEXT: popl %ebp
				; AVX512F_32_WIN-NEXT: retl
				;
				; AVX512F_32_LIN-LABEL: d_to_u64:
				; AVX512F_32_LIN: # %bb.0:
				; AVX512F_32_LIN-NEXT: subl $20, %esp
				; AVX512F_32_LIN-NEXT: vmovsd {{.*#+}} xmm0 = mem[0],zero
				; AVX512F_32_LIN-NEXT: vmovsd {{.*#+}} xmm1 = mem[0],zero
				; AVX512F_32_LIN-NEXT: vcmpltsd %xmm1, %xmm0, %k1
				; AVX512F_32_LIN-NEXT: vsubsd %xmm1, %xmm0, %xmm2
				; AVX512F_32_LIN-NEXT: vmovsd %xmm0, %xmm0, %xmm2 {%k1}
				; AVX512F_32_LIN-NEXT: vmovsd %xmm2, {{[0-9]+}}(%esp)
				; AVX512F_32_LIN-NEXT: fldl {{[0-9]+}}(%esp)
				; AVX512F_32_LIN-NEXT: fisttpll (%esp)
				; AVX512F_32_LIN-NEXT: xorl %edx, %edx
				; AVX512F_32_LIN-NEXT: vucomisd %xmm0, %xmm1
				; AVX512F_32_LIN-NEXT: setbe %dl
				; AVX512F_32_LIN-NEXT: shll $31, %edx
				; AVX512F_32_LIN-NEXT: xorl {{[0-9]+}}(%esp), %edx
				; AVX512F_32_LIN-NEXT: movl (%esp), %eax
				; AVX512F_32_LIN-NEXT: addl $20, %esp
				; AVX512F_32_LIN-NEXT: retl
				;
	; SSE3_32_WIN-LABEL: d_to_u64:			; SSE3_32_WIN-LABEL: d_to_u64:
	; SSE3_32_WIN: # %bb.0:			; SSE3_32_WIN: # %bb.0:
	; SSE3_32_WIN-NEXT: pushl %ebp			; SSE3_32_WIN-NEXT: pushl %ebp
	; SSE3_32_WIN-NEXT: movl %esp, %ebp			; SSE3_32_WIN-NEXT: movl %esp, %ebp
	; SSE3_32_WIN-NEXT: andl $-8, %esp			; SSE3_32_WIN-NEXT: andl $-8, %esp
	; SSE3_32_WIN-NEXT: subl $16, %esp			; SSE3_32_WIN-NEXT: subl $16, %esp
	; SSE3_32_WIN-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero			; SSE3_32_WIN-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero
	; SSE3_32_WIN-NEXT: movsd {{.*#+}} xmm1 = mem[0],zero			; SSE3_32_WIN-NEXT: movsd {{.*#+}} xmm1 = mem[0],zero
	▲ Show 20 Lines • Show All 200 Lines • ▼ Show 20 Lines
	; X87_LIN-NEXT: movl {{[0-9]+}}(%esp), %eax			; X87_LIN-NEXT: movl {{[0-9]+}}(%esp), %eax
	; X87_LIN-NEXT: addl $20, %esp			; X87_LIN-NEXT: addl $20, %esp
	; X87_LIN-NEXT: retl			; X87_LIN-NEXT: retl
	%r = fptoui double %a to i64			%r = fptoui double %a to i64
	ret i64 %r			ret i64 %r
	}			}

	define i64 @d_to_s64(double %a) nounwind {			define i64 @d_to_s64(double %a) nounwind {
	; AVX512_32_WIN-LABEL: d_to_s64:			; AVX512DQVL_32_WIN-LABEL: d_to_s64:
	; AVX512_32_WIN: # %bb.0:			; AVX512DQVL_32_WIN: # %bb.0:
	; AVX512_32_WIN-NEXT: pushl %ebp			; AVX512DQVL_32_WIN-NEXT: vmovsd {{.*#+}} xmm0 = mem[0],zero
	; AVX512_32_WIN-NEXT: movl %esp, %ebp			; AVX512DQVL_32_WIN-NEXT: vcvttpd2qq %ymm0, %ymm0
	; AVX512_32_WIN-NEXT: andl $-8, %esp			; AVX512DQVL_32_WIN-NEXT: vmovd %xmm0, %eax
	; AVX512_32_WIN-NEXT: subl $16, %esp			; AVX512DQVL_32_WIN-NEXT: vpextrd $1, %xmm0, %edx
	; AVX512_32_WIN-NEXT: vmovsd {{.*#+}} xmm0 = mem[0],zero			; AVX512DQVL_32_WIN-NEXT: vzeroupper
	; AVX512_32_WIN-NEXT: vmovsd %xmm0, {{[0-9]+}}(%esp)			; AVX512DQVL_32_WIN-NEXT: retl
	; AVX512_32_WIN-NEXT: fldl {{[0-9]+}}(%esp)			;
	; AVX512_32_WIN-NEXT: fisttpll (%esp)			; AVX512DQVL_32_LIN-LABEL: d_to_s64:
	; AVX512_32_WIN-NEXT: movl (%esp), %eax			; AVX512DQVL_32_LIN: # %bb.0:
	; AVX512_32_WIN-NEXT: movl {{[0-9]+}}(%esp), %edx			; AVX512DQVL_32_LIN-NEXT: vmovsd {{.*#+}} xmm0 = mem[0],zero
	; AVX512_32_WIN-NEXT: movl %ebp, %esp			; AVX512DQVL_32_LIN-NEXT: vcvttpd2qq %ymm0, %ymm0
	; AVX512_32_WIN-NEXT: popl %ebp			; AVX512DQVL_32_LIN-NEXT: vmovd %xmm0, %eax
	; AVX512_32_WIN-NEXT: retl			; AVX512DQVL_32_LIN-NEXT: vpextrd $1, %xmm0, %edx
	;			; AVX512DQVL_32_LIN-NEXT: vzeroupper
	; AVX512_32_LIN-LABEL: d_to_s64:			; AVX512DQVL_32_LIN-NEXT: retl
	; AVX512_32_LIN: # %bb.0:
	; AVX512_32_LIN-NEXT: subl $20, %esp
	; AVX512_32_LIN-NEXT: vmovsd {{.*#+}} xmm0 = mem[0],zero
	; AVX512_32_LIN-NEXT: vmovsd %xmm0, {{[0-9]+}}(%esp)
	; AVX512_32_LIN-NEXT: fldl {{[0-9]+}}(%esp)
	; AVX512_32_LIN-NEXT: fisttpll (%esp)
	; AVX512_32_LIN-NEXT: movl (%esp), %eax
	; AVX512_32_LIN-NEXT: movl {{[0-9]+}}(%esp), %edx
	; AVX512_32_LIN-NEXT: addl $20, %esp
	; AVX512_32_LIN-NEXT: retl
	;			;
	; AVX512_64-LABEL: d_to_s64:			; AVX512_64-LABEL: d_to_s64:
	; AVX512_64: # %bb.0:			; AVX512_64: # %bb.0:
	; AVX512_64-NEXT: vcvttsd2si %xmm0, %rax			; AVX512_64-NEXT: vcvttsd2si %xmm0, %rax
	; AVX512_64-NEXT: retq			; AVX512_64-NEXT: retq
	;			;
				; AVX512DQ_32_WIN-LABEL: d_to_s64:
				; AVX512DQ_32_WIN: # %bb.0:
				; AVX512DQ_32_WIN-NEXT: vmovsd {{.*#+}} xmm0 = mem[0],zero
				; AVX512DQ_32_WIN-NEXT: vcvttpd2qq %zmm0, %zmm0
				; AVX512DQ_32_WIN-NEXT: vmovd %xmm0, %eax
				; AVX512DQ_32_WIN-NEXT: vpextrd $1, %xmm0, %edx
				; AVX512DQ_32_WIN-NEXT: vzeroupper
				; AVX512DQ_32_WIN-NEXT: retl
				;
				; AVX512DQ_32_LIN-LABEL: d_to_s64:
				; AVX512DQ_32_LIN: # %bb.0:
				; AVX512DQ_32_LIN-NEXT: vmovsd {{.*#+}} xmm0 = mem[0],zero
				; AVX512DQ_32_LIN-NEXT: vcvttpd2qq %zmm0, %zmm0
				; AVX512DQ_32_LIN-NEXT: vmovd %xmm0, %eax
				; AVX512DQ_32_LIN-NEXT: vpextrd $1, %xmm0, %edx
				; AVX512DQ_32_LIN-NEXT: vzeroupper
				; AVX512DQ_32_LIN-NEXT: retl
				;
				; AVX512F_32_WIN-LABEL: d_to_s64:
				; AVX512F_32_WIN: # %bb.0:
				; AVX512F_32_WIN-NEXT: pushl %ebp
				; AVX512F_32_WIN-NEXT: movl %esp, %ebp
				; AVX512F_32_WIN-NEXT: andl $-8, %esp
				; AVX512F_32_WIN-NEXT: subl $16, %esp
				; AVX512F_32_WIN-NEXT: vmovsd {{.*#+}} xmm0 = mem[0],zero
				; AVX512F_32_WIN-NEXT: vmovsd %xmm0, {{[0-9]+}}(%esp)
				; AVX512F_32_WIN-NEXT: fldl {{[0-9]+}}(%esp)
				; AVX512F_32_WIN-NEXT: fisttpll (%esp)
				; AVX512F_32_WIN-NEXT: movl (%esp), %eax
				; AVX512F_32_WIN-NEXT: movl {{[0-9]+}}(%esp), %edx
				; AVX512F_32_WIN-NEXT: movl %ebp, %esp
				; AVX512F_32_WIN-NEXT: popl %ebp
				; AVX512F_32_WIN-NEXT: retl
				;
				; AVX512F_32_LIN-LABEL: d_to_s64:
				; AVX512F_32_LIN: # %bb.0:
				; AVX512F_32_LIN-NEXT: subl $20, %esp
				; AVX512F_32_LIN-NEXT: vmovsd {{.*#+}} xmm0 = mem[0],zero
				; AVX512F_32_LIN-NEXT: vmovsd %xmm0, {{[0-9]+}}(%esp)
				; AVX512F_32_LIN-NEXT: fldl {{[0-9]+}}(%esp)
				; AVX512F_32_LIN-NEXT: fisttpll (%esp)
				; AVX512F_32_LIN-NEXT: movl (%esp), %eax
				; AVX512F_32_LIN-NEXT: movl {{[0-9]+}}(%esp), %edx
				; AVX512F_32_LIN-NEXT: addl $20, %esp
				; AVX512F_32_LIN-NEXT: retl
				;
	; SSE3_32_WIN-LABEL: d_to_s64:			; SSE3_32_WIN-LABEL: d_to_s64:
	; SSE3_32_WIN: # %bb.0:			; SSE3_32_WIN: # %bb.0:
	; SSE3_32_WIN-NEXT: pushl %ebp			; SSE3_32_WIN-NEXT: pushl %ebp
	; SSE3_32_WIN-NEXT: movl %esp, %ebp			; SSE3_32_WIN-NEXT: movl %esp, %ebp
	; SSE3_32_WIN-NEXT: andl $-8, %esp			; SSE3_32_WIN-NEXT: andl $-8, %esp
	; SSE3_32_WIN-NEXT: subl $16, %esp			; SSE3_32_WIN-NEXT: subl $16, %esp
	; SSE3_32_WIN-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero			; SSE3_32_WIN-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero
	; SSE3_32_WIN-NEXT: movsd %xmm0, {{[0-9]+}}(%esp)			; SSE3_32_WIN-NEXT: movsd %xmm0, {{[0-9]+}}(%esp)
	▲ Show 20 Lines • Show All 916 Lines • Show Last 20 Lines

llvm/trunk/test/CodeGen/X86/scalar-int-to-fp.ll

	Show First 20 Lines • Show All 294 Lines • ▼ Show 20 Lines
	; CHECK64-NEXT: movl %edi, -{{[0-9]+}}(%rsp)			; CHECK64-NEXT: movl %edi, -{{[0-9]+}}(%rsp)
	; CHECK64-NEXT: fildl -{{[0-9]+}}(%rsp)			; CHECK64-NEXT: fildl -{{[0-9]+}}(%rsp)
	; CHECK64-NEXT: retq			; CHECK64-NEXT: retq
	%r = sitofp i32 %a to x86_fp80			%r = sitofp i32 %a to x86_fp80
	ret x86_fp80 %r			ret x86_fp80 %r
	}			}

	define float @u64_to_f(i64 %a) nounwind {			define float @u64_to_f(i64 %a) nounwind {
	; AVX512_32-LABEL: u64_to_f:			; AVX512DQVL_32-LABEL: u64_to_f:
	; AVX512_32: # %bb.0:			; AVX512DQVL_32: # %bb.0:
	; AVX512_32-NEXT: pushl %ebp			; AVX512DQVL_32-NEXT: pushl %eax
	; AVX512_32-NEXT: movl %esp, %ebp			; AVX512DQVL_32-NEXT: vmovsd {{.*#+}} xmm0 = mem[0],zero
	; AVX512_32-NEXT: andl $-8, %esp			; AVX512DQVL_32-NEXT: vcvtuqq2ps %ymm0, %xmm0
	; AVX512_32-NEXT: subl $16, %esp			; AVX512DQVL_32-NEXT: vmovss %xmm0, (%esp)
	; AVX512_32-NEXT: vmovsd {{.*#+}} xmm0 = mem[0],zero			; AVX512DQVL_32-NEXT: flds (%esp)
	; AVX512_32-NEXT: vmovlps %xmm0, {{[0-9]+}}(%esp)			; AVX512DQVL_32-NEXT: popl %eax
	; AVX512_32-NEXT: xorl %eax, %eax			; AVX512DQVL_32-NEXT: vzeroupper
	; AVX512_32-NEXT: cmpl $0, 12(%ebp)			; AVX512DQVL_32-NEXT: retl
	; AVX512_32-NEXT: setns %al
	; AVX512_32-NEXT: fildll {{[0-9]+}}(%esp)
	; AVX512_32-NEXT: fadds {{\.LCPI.*}}(,%eax,4)
	; AVX512_32-NEXT: fstps {{[0-9]+}}(%esp)
	; AVX512_32-NEXT: vmovss {{.*#+}} xmm0 = mem[0],zero,zero,zero
	; AVX512_32-NEXT: vmovss %xmm0, (%esp)
	; AVX512_32-NEXT: flds (%esp)
	; AVX512_32-NEXT: movl %ebp, %esp
	; AVX512_32-NEXT: popl %ebp
	; AVX512_32-NEXT: retl
	;			;
	; AVX512_64-LABEL: u64_to_f:			; AVX512_64-LABEL: u64_to_f:
	; AVX512_64: # %bb.0:			; AVX512_64: # %bb.0:
	; AVX512_64-NEXT: vcvtusi2ssq %rdi, %xmm0, %xmm0			; AVX512_64-NEXT: vcvtusi2ssq %rdi, %xmm0, %xmm0
	; AVX512_64-NEXT: retq			; AVX512_64-NEXT: retq
	;			;
				; AVX512DQ_32-LABEL: u64_to_f:
				; AVX512DQ_32: # %bb.0:
				; AVX512DQ_32-NEXT: pushl %eax
				; AVX512DQ_32-NEXT: vmovsd {{.*#+}} xmm0 = mem[0],zero
				; AVX512DQ_32-NEXT: vcvtuqq2ps %zmm0, %ymm0
				; AVX512DQ_32-NEXT: vmovss %xmm0, (%esp)
				; AVX512DQ_32-NEXT: flds (%esp)
				; AVX512DQ_32-NEXT: popl %eax
				; AVX512DQ_32-NEXT: vzeroupper
				; AVX512DQ_32-NEXT: retl
				;
				; AVX512F_32-LABEL: u64_to_f:
				; AVX512F_32: # %bb.0:
				; AVX512F_32-NEXT: pushl %ebp
				; AVX512F_32-NEXT: movl %esp, %ebp
				; AVX512F_32-NEXT: andl $-8, %esp
				; AVX512F_32-NEXT: subl $16, %esp
				; AVX512F_32-NEXT: vmovsd {{.*#+}} xmm0 = mem[0],zero
				; AVX512F_32-NEXT: vmovlps %xmm0, {{[0-9]+}}(%esp)
				; AVX512F_32-NEXT: xorl %eax, %eax
				; AVX512F_32-NEXT: cmpl $0, 12(%ebp)
				; AVX512F_32-NEXT: setns %al
				; AVX512F_32-NEXT: fildll {{[0-9]+}}(%esp)
				; AVX512F_32-NEXT: fadds {{\.LCPI.*}}(,%eax,4)
				; AVX512F_32-NEXT: fstps {{[0-9]+}}(%esp)
				; AVX512F_32-NEXT: vmovss {{.*#+}} xmm0 = mem[0],zero,zero,zero
				; AVX512F_32-NEXT: vmovss %xmm0, (%esp)
				; AVX512F_32-NEXT: flds (%esp)
				; AVX512F_32-NEXT: movl %ebp, %esp
				; AVX512F_32-NEXT: popl %ebp
				; AVX512F_32-NEXT: retl
				;
	; SSE2_32-LABEL: u64_to_f:			; SSE2_32-LABEL: u64_to_f:
	; SSE2_32: # %bb.0:			; SSE2_32: # %bb.0:
	; SSE2_32-NEXT: pushl %ebp			; SSE2_32-NEXT: pushl %ebp
	; SSE2_32-NEXT: movl %esp, %ebp			; SSE2_32-NEXT: movl %esp, %ebp
	; SSE2_32-NEXT: andl $-8, %esp			; SSE2_32-NEXT: andl $-8, %esp
	; SSE2_32-NEXT: subl $16, %esp			; SSE2_32-NEXT: subl $16, %esp
	; SSE2_32-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero			; SSE2_32-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero
	; SSE2_32-NEXT: movlps %xmm0, {{[0-9]+}}(%esp)			; SSE2_32-NEXT: movlps %xmm0, {{[0-9]+}}(%esp)
	▲ Show 20 Lines • Show All 83 Lines • ▼ Show 20 Lines
	; X87: # %bb.0:			; X87: # %bb.0:
	; X87-NEXT: fildll {{[0-9]+}}(%esp)			; X87-NEXT: fildll {{[0-9]+}}(%esp)
	; X87-NEXT: retl			; X87-NEXT: retl
	%r = sitofp i64 %a to float			%r = sitofp i64 %a to float
	ret float %r			ret float %r
	}			}

	define float @s64_to_f_2(i64 %a) nounwind {			define float @s64_to_f_2(i64 %a) nounwind {
	; AVX512_32-LABEL: s64_to_f_2:			; AVX512DQVL_32-LABEL: s64_to_f_2:
	; AVX512_32: # %bb.0:			; AVX512DQVL_32: # %bb.0:
	; AVX512_32-NEXT: pushl %ebp			; AVX512DQVL_32-NEXT: pushl %eax
	; AVX512_32-NEXT: movl %esp, %ebp			; AVX512DQVL_32-NEXT: movl {{[0-9]+}}(%esp), %eax
	; AVX512_32-NEXT: andl $-8, %esp			; AVX512DQVL_32-NEXT: movl {{[0-9]+}}(%esp), %ecx
	; AVX512_32-NEXT: subl $16, %esp			; AVX512DQVL_32-NEXT: addl $5, %eax
	; AVX512_32-NEXT: movl 8(%ebp), %eax			; AVX512DQVL_32-NEXT: adcl $0, %ecx
	; AVX512_32-NEXT: movl 12(%ebp), %ecx			; AVX512DQVL_32-NEXT: vmovd %eax, %xmm0
	; AVX512_32-NEXT: addl $5, %eax			; AVX512DQVL_32-NEXT: vpinsrd $1, %ecx, %xmm0, %xmm0
	; AVX512_32-NEXT: adcl $0, %ecx			; AVX512DQVL_32-NEXT: vcvtqq2ps %ymm0, %xmm0
	; AVX512_32-NEXT: vmovd %eax, %xmm0			; AVX512DQVL_32-NEXT: vmovss %xmm0, (%esp)
	; AVX512_32-NEXT: vpinsrd $1, %ecx, %xmm0, %xmm0			; AVX512DQVL_32-NEXT: flds (%esp)
	; AVX512_32-NEXT: vmovq %xmm0, {{[0-9]+}}(%esp)			; AVX512DQVL_32-NEXT: popl %eax
	; AVX512_32-NEXT: fildll {{[0-9]+}}(%esp)			; AVX512DQVL_32-NEXT: vzeroupper
	; AVX512_32-NEXT: fstps {{[0-9]+}}(%esp)			; AVX512DQVL_32-NEXT: retl
	; AVX512_32-NEXT: flds {{[0-9]+}}(%esp)
	; AVX512_32-NEXT: movl %ebp, %esp
	; AVX512_32-NEXT: popl %ebp
	; AVX512_32-NEXT: retl
	;			;
	; AVX512_64-LABEL: s64_to_f_2:			; AVX512_64-LABEL: s64_to_f_2:
	; AVX512_64: # %bb.0:			; AVX512_64: # %bb.0:
	; AVX512_64-NEXT: addq $5, %rdi			; AVX512_64-NEXT: addq $5, %rdi
	; AVX512_64-NEXT: vcvtsi2ssq %rdi, %xmm0, %xmm0			; AVX512_64-NEXT: vcvtsi2ssq %rdi, %xmm0, %xmm0
	; AVX512_64-NEXT: retq			; AVX512_64-NEXT: retq
	;			;
				; AVX512DQ_32-LABEL: s64_to_f_2:
				; AVX512DQ_32: # %bb.0:
				; AVX512DQ_32-NEXT: pushl %eax
				; AVX512DQ_32-NEXT: movl {{[0-9]+}}(%esp), %eax
				; AVX512DQ_32-NEXT: movl {{[0-9]+}}(%esp), %ecx
				; AVX512DQ_32-NEXT: addl $5, %eax
				; AVX512DQ_32-NEXT: adcl $0, %ecx
				; AVX512DQ_32-NEXT: vmovd %eax, %xmm0
				; AVX512DQ_32-NEXT: vpinsrd $1, %ecx, %xmm0, %xmm0
				; AVX512DQ_32-NEXT: vcvtqq2ps %zmm0, %ymm0
				; AVX512DQ_32-NEXT: vmovss %xmm0, (%esp)
				; AVX512DQ_32-NEXT: flds (%esp)
				; AVX512DQ_32-NEXT: popl %eax
				; AVX512DQ_32-NEXT: vzeroupper
				; AVX512DQ_32-NEXT: retl
				;
				; AVX512F_32-LABEL: s64_to_f_2:
				; AVX512F_32: # %bb.0:
				; AVX512F_32-NEXT: pushl %ebp
				; AVX512F_32-NEXT: movl %esp, %ebp
				; AVX512F_32-NEXT: andl $-8, %esp
				; AVX512F_32-NEXT: subl $16, %esp
				; AVX512F_32-NEXT: movl 8(%ebp), %eax
				; AVX512F_32-NEXT: movl 12(%ebp), %ecx
				; AVX512F_32-NEXT: addl $5, %eax
				; AVX512F_32-NEXT: adcl $0, %ecx
				; AVX512F_32-NEXT: vmovd %eax, %xmm0
				; AVX512F_32-NEXT: vpinsrd $1, %ecx, %xmm0, %xmm0
				; AVX512F_32-NEXT: vmovq %xmm0, {{[0-9]+}}(%esp)
				; AVX512F_32-NEXT: fildll {{[0-9]+}}(%esp)
				; AVX512F_32-NEXT: fstps {{[0-9]+}}(%esp)
				; AVX512F_32-NEXT: flds {{[0-9]+}}(%esp)
				; AVX512F_32-NEXT: movl %ebp, %esp
				; AVX512F_32-NEXT: popl %ebp
				; AVX512F_32-NEXT: retl
				;
	; SSE2_32-LABEL: s64_to_f_2:			; SSE2_32-LABEL: s64_to_f_2:
	; SSE2_32: # %bb.0:			; SSE2_32: # %bb.0:
	; SSE2_32-NEXT: pushl %ebp			; SSE2_32-NEXT: pushl %ebp
	; SSE2_32-NEXT: movl %esp, %ebp			; SSE2_32-NEXT: movl %esp, %ebp
	; SSE2_32-NEXT: andl $-8, %esp			; SSE2_32-NEXT: andl $-8, %esp
	; SSE2_32-NEXT: subl $16, %esp			; SSE2_32-NEXT: subl $16, %esp
	; SSE2_32-NEXT: movl 8(%ebp), %eax			; SSE2_32-NEXT: movl 8(%ebp), %eax
	; SSE2_32-NEXT: movl 12(%ebp), %ecx			; SSE2_32-NEXT: movl 12(%ebp), %ecx
	Show All 33 Lines
	; X87-NEXT: popl %ebp			; X87-NEXT: popl %ebp
	; X87-NEXT: retl			; X87-NEXT: retl
	%a1 = add i64 %a, 5			%a1 = add i64 %a, 5
	%r = sitofp i64 %a1 to float			%r = sitofp i64 %a1 to float
	ret float %r			ret float %r
	}			}

	define double @u64_to_d(i64 %a) nounwind {			define double @u64_to_d(i64 %a) nounwind {
	; AVX512_32-LABEL: u64_to_d:			; AVX512DQVL_32-LABEL: u64_to_d:
	; AVX512_32: # %bb.0:			; AVX512DQVL_32: # %bb.0:
	; AVX512_32-NEXT: pushl %ebp			; AVX512DQVL_32-NEXT: pushl %ebp
	; AVX512_32-NEXT: movl %esp, %ebp			; AVX512DQVL_32-NEXT: movl %esp, %ebp
	; AVX512_32-NEXT: andl $-8, %esp			; AVX512DQVL_32-NEXT: andl $-8, %esp
	; AVX512_32-NEXT: subl $8, %esp			; AVX512DQVL_32-NEXT: subl $8, %esp
	; AVX512_32-NEXT: vmovsd {{.*#+}} xmm0 = mem[0],zero			; AVX512DQVL_32-NEXT: vmovsd {{.*#+}} xmm0 = mem[0],zero
	; AVX512_32-NEXT: vunpcklps {{.*#+}} xmm0 = xmm0[0],mem[0],xmm0[1],mem[1]			; AVX512DQVL_32-NEXT: vcvtuqq2pd %ymm0, %ymm0
	; AVX512_32-NEXT: vsubpd {{\.LCPI.*}}, %xmm0, %xmm0			; AVX512DQVL_32-NEXT: vmovlps %xmm0, (%esp)
	; AVX512_32-NEXT: vhaddpd %xmm0, %xmm0, %xmm0			; AVX512DQVL_32-NEXT: fldl (%esp)
	; AVX512_32-NEXT: vmovlpd %xmm0, (%esp)			; AVX512DQVL_32-NEXT: movl %ebp, %esp
	; AVX512_32-NEXT: fldl (%esp)			; AVX512DQVL_32-NEXT: popl %ebp
	; AVX512_32-NEXT: movl %ebp, %esp			; AVX512DQVL_32-NEXT: vzeroupper
	; AVX512_32-NEXT: popl %ebp			; AVX512DQVL_32-NEXT: retl
	; AVX512_32-NEXT: retl
	;			;
	; AVX512_64-LABEL: u64_to_d:			; AVX512_64-LABEL: u64_to_d:
	; AVX512_64: # %bb.0:			; AVX512_64: # %bb.0:
	; AVX512_64-NEXT: vcvtusi2sdq %rdi, %xmm0, %xmm0			; AVX512_64-NEXT: vcvtusi2sdq %rdi, %xmm0, %xmm0
	; AVX512_64-NEXT: retq			; AVX512_64-NEXT: retq
	;			;
				; AVX512DQ_32-LABEL: u64_to_d:
				; AVX512DQ_32: # %bb.0:
				; AVX512DQ_32-NEXT: pushl %ebp
				; AVX512DQ_32-NEXT: movl %esp, %ebp
				; AVX512DQ_32-NEXT: andl $-8, %esp
				; AVX512DQ_32-NEXT: subl $8, %esp
				; AVX512DQ_32-NEXT: vmovsd {{.*#+}} xmm0 = mem[0],zero
				; AVX512DQ_32-NEXT: vcvtuqq2pd %zmm0, %zmm0
				; AVX512DQ_32-NEXT: vmovlps %xmm0, (%esp)
				; AVX512DQ_32-NEXT: fldl (%esp)
				; AVX512DQ_32-NEXT: movl %ebp, %esp
				; AVX512DQ_32-NEXT: popl %ebp
				; AVX512DQ_32-NEXT: vzeroupper
				; AVX512DQ_32-NEXT: retl
				;
				; AVX512F_32-LABEL: u64_to_d:
				; AVX512F_32: # %bb.0:
				; AVX512F_32-NEXT: pushl %ebp
				; AVX512F_32-NEXT: movl %esp, %ebp
				; AVX512F_32-NEXT: andl $-8, %esp
				; AVX512F_32-NEXT: subl $8, %esp
				; AVX512F_32-NEXT: vmovsd {{.*#+}} xmm0 = mem[0],zero
				; AVX512F_32-NEXT: vunpcklps {{.*#+}} xmm0 = xmm0[0],mem[0],xmm0[1],mem[1]
				; AVX512F_32-NEXT: vsubpd {{\.LCPI.*}}, %xmm0, %xmm0
				; AVX512F_32-NEXT: vhaddpd %xmm0, %xmm0, %xmm0
				; AVX512F_32-NEXT: vmovlpd %xmm0, (%esp)
				; AVX512F_32-NEXT: fldl (%esp)
				; AVX512F_32-NEXT: movl %ebp, %esp
				; AVX512F_32-NEXT: popl %ebp
				; AVX512F_32-NEXT: retl
				;
	; SSE2_32-LABEL: u64_to_d:			; SSE2_32-LABEL: u64_to_d:
	; SSE2_32: # %bb.0:			; SSE2_32: # %bb.0:
	; SSE2_32-NEXT: pushl %ebp			; SSE2_32-NEXT: pushl %ebp
	; SSE2_32-NEXT: movl %esp, %ebp			; SSE2_32-NEXT: movl %esp, %ebp
	; SSE2_32-NEXT: andl $-8, %esp			; SSE2_32-NEXT: andl $-8, %esp
	; SSE2_32-NEXT: subl $8, %esp			; SSE2_32-NEXT: subl $8, %esp
	; SSE2_32-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero			; SSE2_32-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero
	; SSE2_32-NEXT: unpcklps {{.*#+}} xmm0 = xmm0[0],mem[0],xmm0[1],mem[1]			; SSE2_32-NEXT: unpcklps {{.*#+}} xmm0 = xmm0[0],mem[0],xmm0[1],mem[1]
	▲ Show 20 Lines • Show All 80 Lines • ▼ Show 20 Lines
	; X87: # %bb.0:			; X87: # %bb.0:
	; X87-NEXT: fildll {{[0-9]+}}(%esp)			; X87-NEXT: fildll {{[0-9]+}}(%esp)
	; X87-NEXT: retl			; X87-NEXT: retl
	%r = sitofp i64 %a to double			%r = sitofp i64 %a to double
	ret double %r			ret double %r
	}			}

	define double @s64_to_d_2(i64 %a) nounwind {			define double @s64_to_d_2(i64 %a) nounwind {
	; AVX512_32-LABEL: s64_to_d_2:			; AVX512DQVL_32-LABEL: s64_to_d_2:
	; AVX512_32: # %bb.0:			; AVX512DQVL_32: # %bb.0:
	; AVX512_32-NEXT: pushl %ebp			; AVX512DQVL_32-NEXT: pushl %ebp
	; AVX512_32-NEXT: movl %esp, %ebp			; AVX512DQVL_32-NEXT: movl %esp, %ebp
	; AVX512_32-NEXT: andl $-8, %esp			; AVX512DQVL_32-NEXT: andl $-8, %esp
	; AVX512_32-NEXT: subl $16, %esp			; AVX512DQVL_32-NEXT: subl $8, %esp
	; AVX512_32-NEXT: movl 8(%ebp), %eax			; AVX512DQVL_32-NEXT: movl 8(%ebp), %eax
	; AVX512_32-NEXT: movl 12(%ebp), %ecx			; AVX512DQVL_32-NEXT: movl 12(%ebp), %ecx
	; AVX512_32-NEXT: addl $5, %eax			; AVX512DQVL_32-NEXT: addl $5, %eax
	; AVX512_32-NEXT: adcl $0, %ecx			; AVX512DQVL_32-NEXT: adcl $0, %ecx
	; AVX512_32-NEXT: vmovd %eax, %xmm0			; AVX512DQVL_32-NEXT: vmovd %eax, %xmm0
	; AVX512_32-NEXT: vpinsrd $1, %ecx, %xmm0, %xmm0			; AVX512DQVL_32-NEXT: vpinsrd $1, %ecx, %xmm0, %xmm0
	; AVX512_32-NEXT: vmovq %xmm0, {{[0-9]+}}(%esp)			; AVX512DQVL_32-NEXT: vcvtqq2pd %ymm0, %ymm0
	; AVX512_32-NEXT: fildll {{[0-9]+}}(%esp)			; AVX512DQVL_32-NEXT: vmovlps %xmm0, (%esp)
	; AVX512_32-NEXT: fstpl (%esp)			; AVX512DQVL_32-NEXT: fldl (%esp)
	; AVX512_32-NEXT: fldl (%esp)			; AVX512DQVL_32-NEXT: movl %ebp, %esp
	; AVX512_32-NEXT: movl %ebp, %esp			; AVX512DQVL_32-NEXT: popl %ebp
	; AVX512_32-NEXT: popl %ebp			; AVX512DQVL_32-NEXT: vzeroupper
	; AVX512_32-NEXT: retl			; AVX512DQVL_32-NEXT: retl
	;			;
	; AVX512_64-LABEL: s64_to_d_2:			; AVX512_64-LABEL: s64_to_d_2:
	; AVX512_64: # %bb.0:			; AVX512_64: # %bb.0:
	; AVX512_64-NEXT: addq $5, %rdi			; AVX512_64-NEXT: addq $5, %rdi
	; AVX512_64-NEXT: vcvtsi2sdq %rdi, %xmm0, %xmm0			; AVX512_64-NEXT: vcvtsi2sdq %rdi, %xmm0, %xmm0
	; AVX512_64-NEXT: retq			; AVX512_64-NEXT: retq
	;			;
				; AVX512DQ_32-LABEL: s64_to_d_2:
				; AVX512DQ_32: # %bb.0:
				; AVX512DQ_32-NEXT: pushl %ebp
				; AVX512DQ_32-NEXT: movl %esp, %ebp
				; AVX512DQ_32-NEXT: andl $-8, %esp
				; AVX512DQ_32-NEXT: subl $8, %esp
				; AVX512DQ_32-NEXT: movl 8(%ebp), %eax
				; AVX512DQ_32-NEXT: movl 12(%ebp), %ecx
				; AVX512DQ_32-NEXT: addl $5, %eax
				; AVX512DQ_32-NEXT: adcl $0, %ecx
				; AVX512DQ_32-NEXT: vmovd %eax, %xmm0
				; AVX512DQ_32-NEXT: vpinsrd $1, %ecx, %xmm0, %xmm0
				; AVX512DQ_32-NEXT: vcvtqq2pd %zmm0, %zmm0
				; AVX512DQ_32-NEXT: vmovlps %xmm0, (%esp)
				; AVX512DQ_32-NEXT: fldl (%esp)
				; AVX512DQ_32-NEXT: movl %ebp, %esp
				; AVX512DQ_32-NEXT: popl %ebp
				; AVX512DQ_32-NEXT: vzeroupper
				; AVX512DQ_32-NEXT: retl
				;
				; AVX512F_32-LABEL: s64_to_d_2:
				; AVX512F_32: # %bb.0:
				; AVX512F_32-NEXT: pushl %ebp
				; AVX512F_32-NEXT: movl %esp, %ebp
				; AVX512F_32-NEXT: andl $-8, %esp
				; AVX512F_32-NEXT: subl $16, %esp
				; AVX512F_32-NEXT: movl 8(%ebp), %eax
				; AVX512F_32-NEXT: movl 12(%ebp), %ecx
				; AVX512F_32-NEXT: addl $5, %eax
				; AVX512F_32-NEXT: adcl $0, %ecx
				; AVX512F_32-NEXT: vmovd %eax, %xmm0
				; AVX512F_32-NEXT: vpinsrd $1, %ecx, %xmm0, %xmm0
				; AVX512F_32-NEXT: vmovq %xmm0, {{[0-9]+}}(%esp)
				; AVX512F_32-NEXT: fildll {{[0-9]+}}(%esp)
				; AVX512F_32-NEXT: fstpl (%esp)
				; AVX512F_32-NEXT: fldl (%esp)
				; AVX512F_32-NEXT: movl %ebp, %esp
				; AVX512F_32-NEXT: popl %ebp
				; AVX512F_32-NEXT: retl
				;
	; SSE2_32-LABEL: s64_to_d_2:			; SSE2_32-LABEL: s64_to_d_2:
	; SSE2_32: # %bb.0:			; SSE2_32: # %bb.0:
	; SSE2_32-NEXT: pushl %ebp			; SSE2_32-NEXT: pushl %ebp
	; SSE2_32-NEXT: movl %esp, %ebp			; SSE2_32-NEXT: movl %esp, %ebp
	; SSE2_32-NEXT: andl $-8, %esp			; SSE2_32-NEXT: andl $-8, %esp
	; SSE2_32-NEXT: subl $16, %esp			; SSE2_32-NEXT: subl $16, %esp
	; SSE2_32-NEXT: movl 8(%ebp), %eax			; SSE2_32-NEXT: movl 8(%ebp), %eax
	; SSE2_32-NEXT: movl 12(%ebp), %ecx			; SSE2_32-NEXT: movl 12(%ebp), %ecx
	▲ Show 20 Lines • Show All 87 Lines • Show Last 20 Lines

This is an archive of the discontinued LLVM Phabricator instance.

[X86][AVX512DQ] Use packed instructions for scalar FP<->i64 conversions on 32-bit targets (PR31630)
ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 147129

llvm/trunk/lib/Target/X86/X86ISelLowering.cpp

llvm/trunk/test/CodeGen/X86/avx512-regcall-NoMask.ll

llvm/trunk/test/CodeGen/X86/scalar-fp-to-i64.ll

llvm/trunk/test/CodeGen/X86/scalar-int-to-fp.ll

This is an archive of the discontinued LLVM Phabricator instance.

[X86][AVX512DQ] Use packed instructions for scalar FP<->i64 conversions on 32-bit targets (PR31630)ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 147129

llvm/trunk/lib/Target/X86/X86ISelLowering.cpp

llvm/trunk/test/CodeGen/X86/avx512-regcall-NoMask.ll

llvm/trunk/test/CodeGen/X86/scalar-fp-to-i64.ll

llvm/trunk/test/CodeGen/X86/scalar-int-to-fp.ll

[X86][AVX512DQ] Use packed instructions for scalar FP<->i64 conversions on 32-bit targets (PR31630)
ClosedPublic