This is an archive of the discontinued LLVM Phabricator instance.

[AVX-512] Add lowering to cvttpd2udq/cvttps2udq for fptoui v2f64/2f32 to 2i32
ClosedPublic

Authored by craig.topper on Nov 6 2016, 12:53 AM.

Download Raw Diff

Details

Reviewers

RKSimon
zvi
delena

Commits

rGf334ac19adfb: [AVX-512] Add lowering to cvttpd2udq/cvttps2udq for fptoui v2f64/2f32 to 2i32
rL286345: [AVX-512] Add lowering to cvttpd2udq/cvttps2udq for fptoui v2f64/2f32 to 2i32

Summary

This patch adds support for fptoui to 2i32 from both 2f64 and 2f32, building on Simon's change for the signed version in r284459 and using AVX-512 instructions.

If we don't have VLX support we need to use a 512-bit operation for v2f64->v2i32 and extract the result.

It also recognises that cvttpd2udq zeroes the upper 64-bits of the xmm result.

Diff Detail

Repository: rL LLVM

Event Timeline

craig.topper updated this revision to Diff 76980.Nov 6 2016, 12:53 AM

craig.topper retitled this revision from to [AVX-512] Add lowering to cvttpd2udq/cvttps2udq for fptoui v2f64/2f32 to 2i32.

craig.topper updated this object.

craig.topper added reviewers: RKSimon, delena, zvi.

craig.topper added a parent revision: D26330: [X86] Lower AVX512 and SSE intrinsics for CVTTPD2DQ to X86ISD::CVTTPD2DQ..

craig.topper added a subscriber: llvm-commits.

The non-VLX needs testing - add -mattr=+avx512f only tests to vec_fp_to_int.ll?

Updated to show the change for the avx512 without vlx case. I added the command line to the test in r286216 so this only shows the delta for this patch.

LGTM (with1 minor comment tweak).

lib/Target/X86/X86ISelLowering.h
305 ↗	(On Diff #77150)	Vector double to signed/unsigned integer (truncated).

This revision is now accepted and ready to land.Nov 8 2016, 4:39 AM

Closed by commit rL286345: [AVX-512] Add lowering to cvttpd2udq/cvttps2udq for fptoui v2f64/2f32 to 2i32 (authored by ctopper). · Explain WhyNov 8 2016, 11:58 PM

This revision was automatically updated to reflect the committed changes.

Revision Contents

Path

Size

llvm/

trunk/

lib/

Target/

X86/

X86ISelLowering.h

4 lines

X86ISelLowering.cpp

13 lines

X86InstrAVX512.td

12 lines

X86InstrFragmentsSIMD.td

3 lines

X86IntrinsicsInfo.h

2 lines

test/

CodeGen/

X86/

vec_fp_to_int.ll

70 lines

Diff 77312

llvm/trunk/lib/Target/X86/X86ISelLowering.h

Show First 20 Lines • Show All 296 Lines • ▼ Show 20 Lines	enum NodeType : unsigned {
VTRUNCUS, VTRUNCS,		VTRUNCUS, VTRUNCS,

// Vector FP extend.		// Vector FP extend.
VFPEXT, VFPEXT_RND, VFPEXTS_RND,		VFPEXT, VFPEXT_RND, VFPEXTS_RND,

// Vector FP round.		// Vector FP round.
VFPROUND, VFPROUND_RND, VFPROUNDS_RND,		VFPROUND, VFPROUND_RND, VFPROUNDS_RND,

// Vector double to signed integer (truncated).		// Vector double to signed/unsigned integer (truncated).
CVTTPD2DQ,		CVTTPD2DQ, CVTTPD2UDQ,

// Vector signed/unsigned integer to double.		// Vector signed/unsigned integer to double.
CVTDQ2PD, CVTUDQ2PD,		CVTDQ2PD, CVTUDQ2PD,

// Convert a vector to mask, set bits base on MSB.		// Convert a vector to mask, set bits base on MSB.
CVT2MASK,		CVT2MASK,

// 128-bit vector logical left / right shift		// 128-bit vector logical left / right shift
▲ Show 20 Lines • Show All 975 Lines • Show Last 20 Lines

llvm/trunk/lib/Target/X86/X86ISelLowering.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 1,187 Lines • ▼ Show 20 Lines	for (MVT VT : { MVT::v16f32, MVT::v8f64 }) {
setOperationAction(ISD::FABS, VT, Custom);		setOperationAction(ISD::FABS, VT, Custom);
setOperationAction(ISD::FMA, VT, Legal);		setOperationAction(ISD::FMA, VT, Legal);
}		}

setOperationAction(ISD::FP_TO_SINT, MVT::v16i32, Legal);		setOperationAction(ISD::FP_TO_SINT, MVT::v16i32, Legal);
setOperationAction(ISD::FP_TO_UINT, MVT::v16i32, Legal);		setOperationAction(ISD::FP_TO_UINT, MVT::v16i32, Legal);
setOperationAction(ISD::FP_TO_UINT, MVT::v8i32, Legal);		setOperationAction(ISD::FP_TO_UINT, MVT::v8i32, Legal);
setOperationAction(ISD::FP_TO_UINT, MVT::v4i32, Legal);		setOperationAction(ISD::FP_TO_UINT, MVT::v4i32, Legal);
		setOperationAction(ISD::FP_TO_UINT, MVT::v2i32, Custom);
setOperationAction(ISD::SINT_TO_FP, MVT::v16i32, Legal);		setOperationAction(ISD::SINT_TO_FP, MVT::v16i32, Legal);
setOperationAction(ISD::SINT_TO_FP, MVT::v8i1, Custom);		setOperationAction(ISD::SINT_TO_FP, MVT::v8i1, Custom);
setOperationAction(ISD::SINT_TO_FP, MVT::v16i1, Custom);		setOperationAction(ISD::SINT_TO_FP, MVT::v16i1, Custom);
setOperationAction(ISD::SINT_TO_FP, MVT::v16i8, Promote);		setOperationAction(ISD::SINT_TO_FP, MVT::v16i8, Promote);
setOperationAction(ISD::SINT_TO_FP, MVT::v16i16, Promote);		setOperationAction(ISD::SINT_TO_FP, MVT::v16i16, Promote);
setOperationAction(ISD::UINT_TO_FP, MVT::v16i32, Legal);		setOperationAction(ISD::UINT_TO_FP, MVT::v16i32, Legal);
setOperationAction(ISD::UINT_TO_FP, MVT::v8i32, Legal);		setOperationAction(ISD::UINT_TO_FP, MVT::v8i32, Legal);
setOperationAction(ISD::UINT_TO_FP, MVT::v4i32, Legal);		setOperationAction(ISD::UINT_TO_FP, MVT::v4i32, Legal);
▲ Show 20 Lines • Show All 21,149 Lines • ▼ Show 20 Lines	case ISD::UDIVREM: {
SDValue V = LowerWin64_i128OP(SDValue(N,0), DAG);		SDValue V = LowerWin64_i128OP(SDValue(N,0), DAG);
Results.push_back(V);		Results.push_back(V);
return;		return;
}		}
case ISD::FP_TO_SINT:		case ISD::FP_TO_SINT:
case ISD::FP_TO_UINT: {		case ISD::FP_TO_UINT: {
bool IsSigned = N->getOpcode() == ISD::FP_TO_SINT;		bool IsSigned = N->getOpcode() == ISD::FP_TO_SINT;

if (IsSigned && N->getValueType(0) == MVT::v2i32) {		if (N->getValueType(0) == MVT::v2i32) {
		assert((IsSigned \|\| Subtarget.hasAVX512()) &&
		"Can only handle signed conversion without AVX512");
assert(Subtarget.hasSSE2() && "Requires at least SSE2!");		assert(Subtarget.hasSSE2() && "Requires at least SSE2!");
SDValue Src = N->getOperand(0);		SDValue Src = N->getOperand(0);
if (Src.getValueType() == MVT::v2f64) {		if (Src.getValueType() == MVT::v2f64) {
SDValue Idx = DAG.getIntPtrConstant(0, dl);		SDValue Idx = DAG.getIntPtrConstant(0, dl);
SDValue Res = DAG.getNode(X86ISD::CVTTPD2DQ, dl, MVT::v4i32, Src);		SDValue Res = DAG.getNode(IsSigned ? X86ISD::CVTTPD2DQ
		: X86ISD::CVTTPD2UDQ,
		dl, MVT::v4i32, Src);
Res = DAG.getNode(ISD::EXTRACT_SUBVECTOR, dl, MVT::v2i32, Res, Idx);		Res = DAG.getNode(ISD::EXTRACT_SUBVECTOR, dl, MVT::v2i32, Res, Idx);
Results.push_back(Res);		Results.push_back(Res);
return;		return;
}		}
if (Src.getValueType() == MVT::v2f32) {		if (Src.getValueType() == MVT::v2f32) {
SDValue Idx = DAG.getIntPtrConstant(0, dl);		SDValue Idx = DAG.getIntPtrConstant(0, dl);
SDValue Res = DAG.getNode(ISD::CONCAT_VECTORS, dl, MVT::v4f32, Src,		SDValue Res = DAG.getNode(ISD::CONCAT_VECTORS, dl, MVT::v4f32, Src,
DAG.getUNDEF(MVT::v2f32));		DAG.getUNDEF(MVT::v2f32));
Res = DAG.getNode(ISD::FP_TO_SINT, dl, MVT::v4i32, Res);		Res = DAG.getNode(IsSigned ? ISD::FP_TO_SINT
		: ISD::FP_TO_UINT, dl, MVT::v4i32, Res);
Res = DAG.getNode(ISD::EXTRACT_SUBVECTOR, dl, MVT::v2i32, Res, Idx);		Res = DAG.getNode(ISD::EXTRACT_SUBVECTOR, dl, MVT::v2i32, Res, Idx);
Results.push_back(Res);		Results.push_back(Res);
return;		return;
}		}

// The FP_TO_INTHelper below only handles f32/f64/f80 scalar inputs,		// The FP_TO_INTHelper below only handles f32/f64/f80 scalar inputs,
// so early out here.		// so early out here.
return;		return;
▲ Show 20 Lines • Show All 311 Lines • ▼ Show 20 Lines	const char *X86TargetLowering::getTargetNodeName(unsigned Opcode) const {
case X86ISD::VINSERT: return "X86ISD::VINSERT";		case X86ISD::VINSERT: return "X86ISD::VINSERT";
case X86ISD::VFPEXT: return "X86ISD::VFPEXT";		case X86ISD::VFPEXT: return "X86ISD::VFPEXT";
case X86ISD::VFPEXT_RND: return "X86ISD::VFPEXT_RND";		case X86ISD::VFPEXT_RND: return "X86ISD::VFPEXT_RND";
case X86ISD::VFPEXTS_RND: return "X86ISD::VFPEXTS_RND";		case X86ISD::VFPEXTS_RND: return "X86ISD::VFPEXTS_RND";
case X86ISD::VFPROUND: return "X86ISD::VFPROUND";		case X86ISD::VFPROUND: return "X86ISD::VFPROUND";
case X86ISD::VFPROUND_RND: return "X86ISD::VFPROUND_RND";		case X86ISD::VFPROUND_RND: return "X86ISD::VFPROUND_RND";
case X86ISD::VFPROUNDS_RND: return "X86ISD::VFPROUNDS_RND";		case X86ISD::VFPROUNDS_RND: return "X86ISD::VFPROUNDS_RND";
case X86ISD::CVTTPD2DQ: return "X86ISD::CVTTPD2DQ";		case X86ISD::CVTTPD2DQ: return "X86ISD::CVTTPD2DQ";
		case X86ISD::CVTTPD2UDQ: return "X86ISD::CVTTPD2UDQ";
case X86ISD::CVTDQ2PD: return "X86ISD::CVTDQ2PD";		case X86ISD::CVTDQ2PD: return "X86ISD::CVTDQ2PD";
case X86ISD::CVTUDQ2PD: return "X86ISD::CVTUDQ2PD";		case X86ISD::CVTUDQ2PD: return "X86ISD::CVTUDQ2PD";
case X86ISD::CVT2MASK: return "X86ISD::CVT2MASK";		case X86ISD::CVT2MASK: return "X86ISD::CVT2MASK";
case X86ISD::VSHLDQ: return "X86ISD::VSHLDQ";		case X86ISD::VSHLDQ: return "X86ISD::VSHLDQ";
case X86ISD::VSRLDQ: return "X86ISD::VSRLDQ";		case X86ISD::VSRLDQ: return "X86ISD::VSRLDQ";
case X86ISD::VSHL: return "X86ISD::VSHL";		case X86ISD::VSHL: return "X86ISD::VSHL";
case X86ISD::VSRL: return "X86ISD::VSRL";		case X86ISD::VSRL: return "X86ISD::VSRL";
case X86ISD::VSRA: return "X86ISD::VSRA";		case X86ISD::VSRA: return "X86ISD::VSRA";
▲ Show 20 Lines • Show All 10,378 Lines • Show Last 20 Lines

llvm/trunk/lib/Target/X86/X86InstrAVX512.td

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 6,308 Lines • ▼ Show 20 Lines
defm VCVTTPD2DQ : avx512_cvttpd2dq<0xE6, "vcvttpd2dq", fp_to_sint, X86cvttpd2dq,		defm VCVTTPD2DQ : avx512_cvttpd2dq<0xE6, "vcvttpd2dq", fp_to_sint, X86cvttpd2dq,
X86cvttp2siRnd>,		X86cvttp2siRnd>,
PD, VEX_W, EVEX_CD8<64, CD8VF>;		PD, VEX_W, EVEX_CD8<64, CD8VF>;

defm VCVTTPS2UDQ : avx512_cvttps2dq<0x78, "vcvttps2udq", fp_to_uint,		defm VCVTTPS2UDQ : avx512_cvttps2dq<0x78, "vcvttps2udq", fp_to_uint,
X86cvttp2uiRnd>, PS,		X86cvttp2uiRnd>, PS,
EVEX_CD8<32, CD8VF>;		EVEX_CD8<32, CD8VF>;

defm VCVTTPD2UDQ : avx512_cvttpd2dq<0x78, "vcvttpd2udq", fp_to_uint, fp_to_uint,		defm VCVTTPD2UDQ : avx512_cvttpd2dq<0x78, "vcvttpd2udq", fp_to_uint,
X86cvttp2uiRnd>, PS, VEX_W,		X86cvttpd2udq, X86cvttp2uiRnd>, PS, VEX_W,
EVEX_CD8<64, CD8VF>;		EVEX_CD8<64, CD8VF>;

defm VCVTUDQ2PD : avx512_cvtdq2pd<0x7A, "vcvtudq2pd", uint_to_fp, X86cvtudq2pd>,		defm VCVTUDQ2PD : avx512_cvtdq2pd<0x7A, "vcvtudq2pd", uint_to_fp, X86cvtudq2pd>,
XS, EVEX_CD8<32, CD8VH>;		XS, EVEX_CD8<32, CD8VH>;

defm VCVTUDQ2PS : avx512_cvtdq2ps<0x7A, "vcvtudq2ps", uint_to_fp,		defm VCVTUDQ2PS : avx512_cvtdq2ps<0x7A, "vcvtudq2ps", uint_to_fp,
X86VUintToFpRnd>, XD,		X86VUintToFpRnd>, XD,
EVEX_CD8<32, CD8VF>;		EVEX_CD8<32, CD8VF>;
▲ Show 20 Lines • Show All 63 Lines • ▼ Show 20 Lines	def : Pat<(v4i32 (fp_to_uint (v4f32 VR128X:$src1))),
(v16f32 (INSERT_SUBREG (IMPLICIT_DEF),		(v16f32 (INSERT_SUBREG (IMPLICIT_DEF),
VR128X:$src1, sub_xmm)))), sub_xmm)>;		VR128X:$src1, sub_xmm)))), sub_xmm)>;

def : Pat<(v4i32 (fp_to_uint (v4f64 VR256X:$src1))),		def : Pat<(v4i32 (fp_to_uint (v4f64 VR256X:$src1))),
(EXTRACT_SUBREG (v8i32 (VCVTTPD2UDQZrr		(EXTRACT_SUBREG (v8i32 (VCVTTPD2UDQZrr
(v8f64 (INSERT_SUBREG (IMPLICIT_DEF),		(v8f64 (INSERT_SUBREG (IMPLICIT_DEF),
VR256X:$src1, sub_ymm)))), sub_xmm)>;		VR256X:$src1, sub_ymm)))), sub_xmm)>;

		def : Pat<(v4i32 (X86cvttpd2udq (v2f64 VR128X:$src))),
		(EXTRACT_SUBREG (v8i32 (VCVTTPD2UDQZrr
		(v8f64 (INSERT_SUBREG (IMPLICIT_DEF),
		VR128X:$src, sub_xmm)))), sub_xmm)>;

def : Pat<(v8f32 (uint_to_fp (v8i32 VR256X:$src1))),		def : Pat<(v8f32 (uint_to_fp (v8i32 VR256X:$src1))),
(EXTRACT_SUBREG (v16f32 (VCVTUDQ2PSZrr		(EXTRACT_SUBREG (v16f32 (VCVTUDQ2PSZrr
(v16i32 (INSERT_SUBREG (IMPLICIT_DEF),		(v16i32 (INSERT_SUBREG (IMPLICIT_DEF),
VR256X:$src1, sub_ymm)))), sub_ymm)>;		VR256X:$src1, sub_ymm)))), sub_ymm)>;

def : Pat<(v4f32 (uint_to_fp (v4i32 VR128X:$src1))),		def : Pat<(v4f32 (uint_to_fp (v4i32 VR128X:$src1))),
(EXTRACT_SUBREG (v16f32 (VCVTUDQ2PSZrr		(EXTRACT_SUBREG (v16f32 (VCVTUDQ2PSZrr
(v16i32 (INSERT_SUBREG (IMPLICIT_DEF),		(v16i32 (INSERT_SUBREG (IMPLICIT_DEF),
VR128X:$src1, sub_xmm)))), sub_xmm)>;		VR128X:$src1, sub_xmm)))), sub_xmm)>;

def : Pat<(v4f64 (uint_to_fp (v4i32 VR128X:$src1))),		def : Pat<(v4f64 (uint_to_fp (v4i32 VR128X:$src1))),
(EXTRACT_SUBREG (v8f64 (VCVTUDQ2PDZrr		(EXTRACT_SUBREG (v8f64 (VCVTUDQ2PDZrr
(v8i32 (INSERT_SUBREG (IMPLICIT_DEF),		(v8i32 (INSERT_SUBREG (IMPLICIT_DEF),
VR128X:$src1, sub_xmm)))), sub_ymm)>;		VR128X:$src1, sub_xmm)))), sub_ymm)>;
}		}

let Predicates = [HasAVX512, HasVLX] in {		let Predicates = [HasAVX512, HasVLX] in {
let AddedComplexity = 15 in		let AddedComplexity = 15 in
def : Pat<(X86vzmovl (v2i64 (bitconvert		def : Pat<(X86vzmovl (v2i64 (bitconvert
(v4i32 (X86cvttpd2dq (v2f64 VR128X:$src)))))),		(v4i32 (X86cvttpd2dq (v2f64 VR128X:$src)))))),
(VCVTTPD2DQZ128rr VR128:$src)>;		(VCVTTPD2DQZ128rr VR128:$src)>;
		def : Pat<(v4i32 (bitconvert (X86vzmovl (v2i64 (bitconvert
		(v4i32 (X86cvttpd2udq (v2f64 VR128X:$src)))))))),
		(VCVTTPD2UDQZ128rr VR128:$src)>;
}		}

let Predicates = [HasAVX512] in {		let Predicates = [HasAVX512] in {
def : Pat<(v8f32 (fpround (loadv8f64 addr:$src))),		def : Pat<(v8f32 (fpround (loadv8f64 addr:$src))),
(VCVTPD2PSZrm addr:$src)>;		(VCVTPD2PSZrm addr:$src)>;
def : Pat<(v8f64 (extloadv8f32 addr:$src)),		def : Pat<(v8f64 (extloadv8f32 addr:$src)),
(VCVTPS2PDZrm addr:$src)>;		(VCVTPS2PDZrm addr:$src)>;
}		}
▲ Show 20 Lines • Show All 2,485 Lines • Show Last 20 Lines

llvm/trunk/lib/Target/X86/X86InstrFragmentsSIMD.td

	Show First 20 Lines • Show All 64 Lines • ▼ Show 20 Lines
	def X86hadd : SDNode<"X86ISD::HADD", SDTIntBinOp>;			def X86hadd : SDNode<"X86ISD::HADD", SDTIntBinOp>;
	def X86hsub : SDNode<"X86ISD::HSUB", SDTIntBinOp>;			def X86hsub : SDNode<"X86ISD::HSUB", SDTIntBinOp>;
	def X86comi : SDNode<"X86ISD::COMI", SDTX86CmpTest>;			def X86comi : SDNode<"X86ISD::COMI", SDTX86CmpTest>;
	def X86ucomi : SDNode<"X86ISD::UCOMI", SDTX86CmpTest>;			def X86ucomi : SDNode<"X86ISD::UCOMI", SDTX86CmpTest>;
	def X86cmps : SDNode<"X86ISD::FSETCC", SDTX86Cmps>;			def X86cmps : SDNode<"X86ISD::FSETCC", SDTX86Cmps>;
	def X86cvttpd2dq: SDNode<"X86ISD::CVTTPD2DQ",			def X86cvttpd2dq: SDNode<"X86ISD::CVTTPD2DQ",
	SDTypeProfile<1, 1, [SDTCisVT<0, v4i32>,			SDTypeProfile<1, 1, [SDTCisVT<0, v4i32>,
	SDTCisVT<1, v2f64>]>>;			SDTCisVT<1, v2f64>]>>;
				def X86cvttpd2udq: SDNode<"X86ISD::CVTTPD2UDQ",
				SDTypeProfile<1, 1, [SDTCisVT<0, v4i32>,
				SDTCisVT<1, v2f64>]>>;
	def X86cvtdq2pd: SDNode<"X86ISD::CVTDQ2PD",			def X86cvtdq2pd: SDNode<"X86ISD::CVTDQ2PD",
	SDTypeProfile<1, 1, [SDTCisVT<0, v2f64>,			SDTypeProfile<1, 1, [SDTCisVT<0, v2f64>,
	SDTCisVT<1, v4i32>]>>;			SDTCisVT<1, v4i32>]>>;
	def X86cvtudq2pd: SDNode<"X86ISD::CVTUDQ2PD",			def X86cvtudq2pd: SDNode<"X86ISD::CVTUDQ2PD",
	SDTypeProfile<1, 1, [SDTCisVT<0, v2f64>,			SDTypeProfile<1, 1, [SDTCisVT<0, v2f64>,
	SDTCisVT<1, v4i32>]>>;			SDTCisVT<1, v4i32>]>>;
	def X86pshufb : SDNode<"X86ISD::PSHUFB",			def X86pshufb : SDNode<"X86ISD::PSHUFB",
	SDTypeProfile<1, 2, [SDTCVecEltisVT<0, i8>, SDTCisSameAs<0,1>,			SDTypeProfile<1, 2, [SDTCVecEltisVT<0, i8>, SDTCisSameAs<0,1>,
	▲ Show 20 Lines • Show All 938 Lines • Show Last 20 Lines

llvm/trunk/lib/Target/X86/X86IntrinsicsInfo.h

Show First 20 Lines • Show All 580 Lines • ▼ Show 20 Lines	X86_INTRINSIC_DATA(avx512_mask_cvttpd2dq_512, INTR_TYPE_1OP_MASK,
ISD::FP_TO_SINT, X86ISD::CVTTP2SI_RND),		ISD::FP_TO_SINT, X86ISD::CVTTP2SI_RND),
X86_INTRINSIC_DATA(avx512_mask_cvttpd2qq_128, INTR_TYPE_1OP_MASK,		X86_INTRINSIC_DATA(avx512_mask_cvttpd2qq_128, INTR_TYPE_1OP_MASK,
ISD::FP_TO_SINT, 0),		ISD::FP_TO_SINT, 0),
X86_INTRINSIC_DATA(avx512_mask_cvttpd2qq_256, INTR_TYPE_1OP_MASK,		X86_INTRINSIC_DATA(avx512_mask_cvttpd2qq_256, INTR_TYPE_1OP_MASK,
ISD::FP_TO_SINT, 0),		ISD::FP_TO_SINT, 0),
X86_INTRINSIC_DATA(avx512_mask_cvttpd2qq_512, INTR_TYPE_1OP_MASK,		X86_INTRINSIC_DATA(avx512_mask_cvttpd2qq_512, INTR_TYPE_1OP_MASK,
ISD::FP_TO_SINT, X86ISD::CVTTP2SI_RND),		ISD::FP_TO_SINT, X86ISD::CVTTP2SI_RND),
X86_INTRINSIC_DATA(avx512_mask_cvttpd2udq_128, INTR_TYPE_1OP_MASK,		X86_INTRINSIC_DATA(avx512_mask_cvttpd2udq_128, INTR_TYPE_1OP_MASK,
ISD::FP_TO_UINT, 0),		X86ISD::CVTTPD2UDQ, 0),
X86_INTRINSIC_DATA(avx512_mask_cvttpd2udq_256, INTR_TYPE_1OP_MASK,		X86_INTRINSIC_DATA(avx512_mask_cvttpd2udq_256, INTR_TYPE_1OP_MASK,
ISD::FP_TO_UINT, 0),		ISD::FP_TO_UINT, 0),
X86_INTRINSIC_DATA(avx512_mask_cvttpd2udq_512, INTR_TYPE_1OP_MASK,		X86_INTRINSIC_DATA(avx512_mask_cvttpd2udq_512, INTR_TYPE_1OP_MASK,
ISD::FP_TO_UINT, X86ISD::CVTTP2UI_RND),		ISD::FP_TO_UINT, X86ISD::CVTTP2UI_RND),
X86_INTRINSIC_DATA(avx512_mask_cvttpd2uqq_128, INTR_TYPE_1OP_MASK,		X86_INTRINSIC_DATA(avx512_mask_cvttpd2uqq_128, INTR_TYPE_1OP_MASK,
ISD::FP_TO_UINT, 0),		ISD::FP_TO_UINT, 0),
X86_INTRINSIC_DATA(avx512_mask_cvttpd2uqq_256, INTR_TYPE_1OP_MASK,		X86_INTRINSIC_DATA(avx512_mask_cvttpd2uqq_256, INTR_TYPE_1OP_MASK,
ISD::FP_TO_UINT, 0),		ISD::FP_TO_UINT, 0),
▲ Show 20 Lines • Show All 1,168 Lines • Show Last 20 Lines

llvm/trunk/test/CodeGen/X86/vec_fp_to_int.ll

	Show First 20 Lines • Show All 401 Lines • ▼ Show 20 Lines
	; AVX-NEXT: vmovq %rcx, %xmm0			; AVX-NEXT: vmovq %rcx, %xmm0
	; AVX-NEXT: vpunpcklqdq {{.*#+}} xmm0 = xmm2[0],xmm0[0]			; AVX-NEXT: vpunpcklqdq {{.*#+}} xmm0 = xmm2[0],xmm0[0]
	; AVX-NEXT: vpshufd {{.*#+}} xmm0 = xmm0[0,2,2,3]			; AVX-NEXT: vpshufd {{.*#+}} xmm0 = xmm0[0,2,2,3]
	; AVX-NEXT: vmovq {{.*#+}} xmm0 = xmm0[0],zero			; AVX-NEXT: vmovq {{.*#+}} xmm0 = xmm0[0],zero
	; AVX-NEXT: retq			; AVX-NEXT: retq
	;			;
	; AVX512F-LABEL: fptoui_2f64_to_4i32:			; AVX512F-LABEL: fptoui_2f64_to_4i32:
	; AVX512F: # BB#0:			; AVX512F: # BB#0:
	; AVX512F-NEXT: vcvttsd2usi %xmm0, %rax			; AVX512F-NEXT: # kill: %XMM0<def> %XMM0<kill> %ZMM0<def>
	; AVX512F-NEXT: vmovq %rax, %xmm1			; AVX512F-NEXT: vcvttpd2udq %zmm0, %ymm0
	; AVX512F-NEXT: vpermilpd {{.*#+}} xmm0 = xmm0[1,0]
	; AVX512F-NEXT: vcvttsd2usi %xmm0, %rax
	; AVX512F-NEXT: vmovq %rax, %xmm0
	; AVX512F-NEXT: vpunpcklqdq {{.*#+}} xmm0 = xmm1[0],xmm0[0]
	; AVX512F-NEXT: vpshufd {{.*#+}} xmm0 = xmm0[0,2,2,3]
	; AVX512F-NEXT: vmovq {{.*#+}} xmm0 = xmm0[0],zero			; AVX512F-NEXT: vmovq {{.*#+}} xmm0 = xmm0[0],zero
	; AVX512F-NEXT: retq			; AVX512F-NEXT: retq
	;			;
	; AVX512VL-LABEL: fptoui_2f64_to_4i32:			; AVX512VL-LABEL: fptoui_2f64_to_4i32:
	; AVX512VL: # BB#0:			; AVX512VL: # BB#0:
	; AVX512VL-NEXT: vcvttsd2usi %xmm0, %rax			; AVX512VL-NEXT: vcvttpd2udq %xmm0, %xmm0
	; AVX512VL-NEXT: vmovq %rax, %xmm1
	; AVX512VL-NEXT: vpermilpd {{.*#+}} xmm0 = xmm0[1,0]
	; AVX512VL-NEXT: vcvttsd2usi %xmm0, %rax
	; AVX512VL-NEXT: vmovq %rax, %xmm0
	; AVX512VL-NEXT: vpunpcklqdq {{.*#+}} xmm0 = xmm1[0],xmm0[0]
	; AVX512VL-NEXT: vpshufd {{.*#+}} xmm0 = xmm0[0,2,2,3]
	; AVX512VL-NEXT: vmovq {{.*#+}} xmm0 = xmm0[0],zero
	; AVX512VL-NEXT: retq			; AVX512VL-NEXT: retq
	;			;
	; AVX512VLDQ-LABEL: fptoui_2f64_to_4i32:			; AVX512VLDQ-LABEL: fptoui_2f64_to_4i32:
	; AVX512VLDQ: # BB#0:			; AVX512VLDQ: # BB#0:
	; AVX512VLDQ-NEXT: vcvttpd2uqq %xmm0, %xmm0			; AVX512VLDQ-NEXT: vcvttpd2udq %xmm0, %xmm0
	; AVX512VLDQ-NEXT: vpshufd {{.*#+}} xmm0 = xmm0[0,2,2,3]
	; AVX512VLDQ-NEXT: vmovq {{.*#+}} xmm0 = xmm0[0],zero
	; AVX512VLDQ-NEXT: retq			; AVX512VLDQ-NEXT: retq
	%cvt = fptoui <2 x double> %a to <2 x i32>			%cvt = fptoui <2 x double> %a to <2 x i32>
	%ext = shufflevector <2 x i32> %cvt, <2 x i32> zeroinitializer, <4 x i32> <i32 0, i32 1, i32 2, i32 3>			%ext = shufflevector <2 x i32> %cvt, <2 x i32> zeroinitializer, <4 x i32> <i32 0, i32 1, i32 2, i32 3>
	ret <4 x i32> %ext			ret <4 x i32> %ext
	}			}

	define <4 x i32> @fptoui_2f64_to_2i32(<2 x double> %a) {			define <4 x i32> @fptoui_2f64_to_2i32(<2 x double> %a) {
	; SSE-LABEL: fptoui_2f64_to_2i32:			; SSE-LABEL: fptoui_2f64_to_2i32:
	▲ Show 20 Lines • Show All 41 Lines • ▼ Show 20 Lines
	; AVX-NEXT: cmovaeq %rax, %rcx			; AVX-NEXT: cmovaeq %rax, %rcx
	; AVX-NEXT: vmovq %rcx, %xmm0			; AVX-NEXT: vmovq %rcx, %xmm0
	; AVX-NEXT: vpunpcklqdq {{.*#+}} xmm0 = xmm2[0],xmm0[0]			; AVX-NEXT: vpunpcklqdq {{.*#+}} xmm0 = xmm2[0],xmm0[0]
	; AVX-NEXT: vpshufd {{.*#+}} xmm0 = xmm0[0,2,2,3]			; AVX-NEXT: vpshufd {{.*#+}} xmm0 = xmm0[0,2,2,3]
	; AVX-NEXT: retq			; AVX-NEXT: retq
	;			;
	; AVX512F-LABEL: fptoui_2f64_to_2i32:			; AVX512F-LABEL: fptoui_2f64_to_2i32:
	; AVX512F: # BB#0:			; AVX512F: # BB#0:
	; AVX512F-NEXT: vcvttsd2usi %xmm0, %rax			; AVX512F-NEXT: # kill: %XMM0<def> %XMM0<kill> %ZMM0<def>
	; AVX512F-NEXT: vmovq %rax, %xmm1			; AVX512F-NEXT: vcvttpd2udq %zmm0, %ymm0
	; AVX512F-NEXT: vpermilpd {{.*#+}} xmm0 = xmm0[1,0]			; AVX512F-NEXT: # kill: %XMM0<def> %XMM0<kill> %YMM0<kill>
	; AVX512F-NEXT: vcvttsd2usi %xmm0, %rax
	; AVX512F-NEXT: vmovq %rax, %xmm0
	; AVX512F-NEXT: vpunpcklqdq {{.*#+}} xmm0 = xmm1[0],xmm0[0]
	; AVX512F-NEXT: vpshufd {{.*#+}} xmm0 = xmm0[0,2,2,3]
	; AVX512F-NEXT: retq			; AVX512F-NEXT: retq
	;			;
	; AVX512VL-LABEL: fptoui_2f64_to_2i32:			; AVX512VL-LABEL: fptoui_2f64_to_2i32:
	; AVX512VL: # BB#0:			; AVX512VL: # BB#0:
	; AVX512VL-NEXT: vcvttsd2usi %xmm0, %rax			; AVX512VL-NEXT: vcvttpd2udq %xmm0, %xmm0
	; AVX512VL-NEXT: vmovq %rax, %xmm1
	; AVX512VL-NEXT: vpermilpd {{.*#+}} xmm0 = xmm0[1,0]
	; AVX512VL-NEXT: vcvttsd2usi %xmm0, %rax
	; AVX512VL-NEXT: vmovq %rax, %xmm0
	; AVX512VL-NEXT: vpunpcklqdq {{.*#+}} xmm0 = xmm1[0],xmm0[0]
	; AVX512VL-NEXT: vpshufd {{.*#+}} xmm0 = xmm0[0,2,2,3]
	; AVX512VL-NEXT: retq			; AVX512VL-NEXT: retq
	;			;
	; AVX512VLDQ-LABEL: fptoui_2f64_to_2i32:			; AVX512VLDQ-LABEL: fptoui_2f64_to_2i32:
	; AVX512VLDQ: # BB#0:			; AVX512VLDQ: # BB#0:
	; AVX512VLDQ-NEXT: vcvttpd2uqq %xmm0, %xmm0			; AVX512VLDQ-NEXT: vcvttpd2udq %xmm0, %xmm0
	; AVX512VLDQ-NEXT: vpshufd {{.*#+}} xmm0 = xmm0[0,2,2,3]
	; AVX512VLDQ-NEXT: retq			; AVX512VLDQ-NEXT: retq
	%cvt = fptoui <2 x double> %a to <2 x i32>			%cvt = fptoui <2 x double> %a to <2 x i32>
	%ext = shufflevector <2 x i32> %cvt, <2 x i32> undef, <4 x i32> <i32 0, i32 1, i32 undef, i32 undef>			%ext = shufflevector <2 x i32> %cvt, <2 x i32> undef, <4 x i32> <i32 0, i32 1, i32 undef, i32 undef>
	ret <4 x i32> %ext			ret <4 x i32> %ext
	}			}

	define <4 x i32> @fptoui_4f64_to_2i32(<2 x double> %a) {			define <4 x i32> @fptoui_4f64_to_2i32(<2 x double> %a) {
	; SSE-LABEL: fptoui_4f64_to_2i32:			; SSE-LABEL: fptoui_4f64_to_2i32:
	▲ Show 20 Lines • Show All 719 Lines • ▼ Show 20 Lines
	; AVX-NEXT: xorq %rcx, %rax			; AVX-NEXT: xorq %rcx, %rax
	; AVX-NEXT: vcvttss2si %xmm0, %rcx			; AVX-NEXT: vcvttss2si %xmm0, %rcx
	; AVX-NEXT: vucomiss %xmm1, %xmm0			; AVX-NEXT: vucomiss %xmm1, %xmm0
	; AVX-NEXT: cmovaeq %rax, %rcx			; AVX-NEXT: cmovaeq %rax, %rcx
	; AVX-NEXT: vmovq %rcx, %xmm0			; AVX-NEXT: vmovq %rcx, %xmm0
	; AVX-NEXT: vpunpcklqdq {{.*#+}} xmm0 = xmm2[0],xmm0[0]			; AVX-NEXT: vpunpcklqdq {{.*#+}} xmm0 = xmm2[0],xmm0[0]
	; AVX-NEXT: retq			; AVX-NEXT: retq
	;			;
	; AVX512-LABEL: fptoui_2f32_to_2i32:			; AVX512F-LABEL: fptoui_2f32_to_2i32:
	; AVX512: # BB#0:			; AVX512F: # BB#0:
	; AVX512-NEXT: vcvttss2usi %xmm0, %rax			; AVX512F-NEXT: # kill: %XMM0<def> %XMM0<kill> %ZMM0<def>
	; AVX512-NEXT: vmovq %rax, %xmm1			; AVX512F-NEXT: vcvttps2udq %zmm0, %zmm0
	; AVX512-NEXT: vmovshdup {{.*#+}} xmm0 = xmm0[1,1,3,3]			; AVX512F-NEXT: vpmovzxdq {{.*#+}} xmm0 = xmm0[0],zero,xmm0[1],zero
	; AVX512-NEXT: vcvttss2usi %xmm0, %rax			; AVX512F-NEXT: retq
	; AVX512-NEXT: vmovq %rax, %xmm0			;
	; AVX512-NEXT: vpunpcklqdq {{.*#+}} xmm0 = xmm1[0],xmm0[0]			; AVX512VL-LABEL: fptoui_2f32_to_2i32:
	; AVX512-NEXT: retq			; AVX512VL: # BB#0:
				; AVX512VL-NEXT: vcvttps2udq %xmm0, %xmm0
				; AVX512VL-NEXT: vpmovzxdq {{.*#+}} xmm0 = xmm0[0],zero,xmm0[1],zero
				; AVX512VL-NEXT: retq
				;
				; AVX512VLDQ-LABEL: fptoui_2f32_to_2i32:
				; AVX512VLDQ: # BB#0:
				; AVX512VLDQ-NEXT: vcvttps2udq %xmm0, %xmm0
				; AVX512VLDQ-NEXT: vpmovzxdq {{.*#+}} xmm0 = xmm0[0],zero,xmm0[1],zero
				; AVX512VLDQ-NEXT: retq
	%cvt = fptoui <2 x float> %a to <2 x i32>			%cvt = fptoui <2 x float> %a to <2 x i32>
	ret <2 x i32> %cvt			ret <2 x i32> %cvt
	}			}

	define <4 x i32> @fptoui_4f32_to_4i32(<4 x float> %a) {			define <4 x i32> @fptoui_4f32_to_4i32(<4 x float> %a) {
	; SSE-LABEL: fptoui_4f32_to_4i32:			; SSE-LABEL: fptoui_4f32_to_4i32:
	; SSE: # BB#0:			; SSE: # BB#0:
	; SSE-NEXT: movaps %xmm0, %xmm1			; SSE-NEXT: movaps %xmm0, %xmm1
	▲ Show 20 Lines • Show All 1,217 Lines • Show Last 20 Lines