This is an archive of the discontinued LLVM Phabricator instance.

Paths

Table of Contentst

-
include/clang/Basic/
-
clang/
-
Basic/
-
BuiltinsX86.def
-
lib/Headers/
-
Headers/
-
avx512dqintrin.h
-
avx512fintrin.h
-
avx512vldqintrin.h
-
avx512vlintrin.h
-
avxintrin.h
-
emmintrin.h
-
test/CodeGen/
-
CodeGen/
-
avx-builtins.c
-
avx512dq-builtins.c
-
avx512f-builtins.c
-
avx512vl-builtins.c
-
avx512vldq-builtins.c
-
builtins-x86.c
-
sse2-builtins.c

Differential D46863

[X86] Use __builtin_convertvector to implement some of the packed integer to packed float conversion intrinsics.
ClosedPublic

Authored by craig.topper on May 14 2018, 11:30 PM.

Download Raw Diff

Details

Reviewers

RKSimon
spatel
efriedma
hfinkel
DavidKreitzer

Commits

rG842171de3643: [X86] Use __builtin_convertvector to implement some of the packed integer to…
rL332882: [X86] Use __builtin_convertvector to implement some of the packed integer to…
rC332882: [X86] Use __builtin_convertvector to implement some of the packed integer to…

Summary

I believe this is safe assuming default rounding mode. The conversion might be inexact, but it can never overflow the FP type so this shouldn't be undefined behavior for the uitofp/sitofp instructions.

We already do something similar for scalar conversions.

Diff Detail

Repository: rC Clang

Event Timeline

craig.topper created this revision.May 14 2018, 11:30 PM

I'm all for keeping the scalar/vector behaviour the same but I'm concerned about constant folding not taking into account runtime rounding mode:

e,.g. SelectionDAG::getNode - we don't check the return status of convertFromAPInt from *INT_TO_FP - but then again the FP_TO_*INT constant folds only bail on invalid conversions.....

I haven't checked what other passes are doing.

I'm concerned about constant folding not taking into account runtime rounding mode

Changing the rounding mode is UB without FENV_ACCESS. And with FENV_ACCESS, __builtin_convertvector should lower to @llvm.experimental.constrained.sitofp etc., which won't constant-fold. (llvm.experimental.constrained.sitofp doesn't actually exist yet, but I assume it will eventually get added.)

craig.topper retitled this revision from [X86] Use __builtin_convertvector to implement some of the packed integer to packed flow conversion intrinsics. to [X86] Use __builtin_convertvector to implement some of the packed integer to packed float conversion intrinsics..May 15 2018, 11:57 AM

This looks good to me, Craig. I am not worried about the constant folding issue, as I think constant folding these conversion intrinsics (assuming round-to-nearest) is a perfectly valid optimization in the absence of FENV_ACCESS. (FWIW, we don't do this constant folding in icc, but that is only because we have never gotten around to implementing it.) I am also not worried about the spurious 'inexact' exceptions that the changes to the mask intrinsics will cause.

GBuella added subscribers: mike.dvoretsky, GBuella.May 21 2018, 5:36 AM

GBuella added a subscriber: ashlykov.

So I think we've covered the whether this is ok to do questions. If someone can double check signed/unsigned and vector element sizes are all correct and approve this that would be great.

I had actually done that as part of my initial review, so LGTM.

This revision is now accepted and ready to land.May 21 2018, 11:55 AM

Closed by commit rC332882: [X86] Use __builtin_convertvector to implement some of the packed integer to… (authored by ctopper). · Explain WhyMay 21 2018, 1:23 PM

This revision was automatically updated to reflect the committed changes.

Hi Craig,

The __builtin_ia32_cvtdq2ps builtin seems to be supported by gcc, and this change breaks code which has been using this without problems for years. Can we restore it?

Amara

Hi @aemerson, I'm not opposed to adding it back. But the clang policy for vector builtins has always been that we won't support all the builtins that gcc does and to encourage the use of the _mm_* wrappers which are guaranteed to work in both compilers. It possible to change your source code to use the portable intrinsic name?

Revision Contents

Path

Size

include/

clang/

Basic/

BuiltinsX86.def

7 lines

lib/

Headers/

38 lines

38 lines

64 lines

36 lines

2 lines

2 lines

test/

CodeGen/

2 lines

16 lines

16 lines

24 lines

avx512vldq-builtins.c

32 lines

builtins-x86.c

1 line

sse2-builtins.c

2 lines

Diff 147853

include/clang/Basic/BuiltinsX86.def

	Show First 20 Lines • Show All 314 Lines • ▼ Show 20 Lines

	TARGET_BUILTIN(__builtin_ia32_maskmovdqu, "vV16cV16cc*", "n", "sse2")			TARGET_BUILTIN(__builtin_ia32_maskmovdqu, "vV16cV16cc*", "n", "sse2")
	TARGET_BUILTIN(__builtin_ia32_movmskpd, "iV2d", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_movmskpd, "iV2d", "nc", "sse2")
	TARGET_BUILTIN(__builtin_ia32_pmovmskb128, "iV16c", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_pmovmskb128, "iV16c", "nc", "sse2")
	TARGET_BUILTIN(__builtin_ia32_movnti, "vi*i", "n", "sse2")			TARGET_BUILTIN(__builtin_ia32_movnti, "vi*i", "n", "sse2")
	TARGET_BUILTIN(__builtin_ia32_psadbw128, "V2LLiV16cV16c", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_psadbw128, "V2LLiV16cV16c", "nc", "sse2")
	TARGET_BUILTIN(__builtin_ia32_sqrtpd, "V2dV2d", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_sqrtpd, "V2dV2d", "nc", "sse2")
	TARGET_BUILTIN(__builtin_ia32_sqrtsd, "V2dV2d", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_sqrtsd, "V2dV2d", "nc", "sse2")
	TARGET_BUILTIN(__builtin_ia32_cvtdq2ps, "V4fV4i", "nc", "sse2")
	TARGET_BUILTIN(__builtin_ia32_cvtpd2dq, "V2LLiV2d", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_cvtpd2dq, "V2LLiV2d", "nc", "sse2")
	TARGET_BUILTIN(__builtin_ia32_cvtpd2ps, "V4fV2d", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_cvtpd2ps, "V4fV2d", "nc", "sse2")
	TARGET_BUILTIN(__builtin_ia32_cvttpd2dq, "V4iV2d", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_cvttpd2dq, "V4iV2d", "nc", "sse2")
	TARGET_BUILTIN(__builtin_ia32_cvtsd2si, "iV2d", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_cvtsd2si, "iV2d", "nc", "sse2")
	TARGET_BUILTIN(__builtin_ia32_cvttsd2si, "iV2d", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_cvttsd2si, "iV2d", "nc", "sse2")
	TARGET_BUILTIN(__builtin_ia32_cvtsd2ss, "V4fV4fV2d", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_cvtsd2ss, "V4fV4fV2d", "nc", "sse2")
	TARGET_BUILTIN(__builtin_ia32_cvtps2dq, "V4iV4f", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_cvtps2dq, "V4iV4f", "nc", "sse2")
	TARGET_BUILTIN(__builtin_ia32_cvttps2dq, "V4iV4f", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_cvttps2dq, "V4iV4f", "nc", "sse2")
	▲ Show 20 Lines • Show All 863 Lines • ▼ Show 20 Lines
	TARGET_BUILTIN(__builtin_ia32_cvtpd2udq256_mask, "V4iV4dV4iUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_cvtpd2udq256_mask, "V4iV4dV4iUc", "nc", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_cvtps2udq128_mask, "V4iV4fV4iUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_cvtps2udq128_mask, "V4iV4fV4iUc", "nc", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_cvtps2udq256_mask, "V8iV8fV8iUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_cvtps2udq256_mask, "V8iV8fV8iUc", "nc", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_cvttpd2dq128_mask, "V4iV2dV4iUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_cvttpd2dq128_mask, "V4iV2dV4iUc", "nc", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_cvttpd2udq128_mask, "V4iV2dV4iUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_cvttpd2udq128_mask, "V4iV2dV4iUc", "nc", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_cvttpd2udq256_mask, "V4iV4dV4iUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_cvttpd2udq256_mask, "V4iV4dV4iUc", "nc", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_cvttps2udq128_mask, "V4iV4fV4iUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_cvttps2udq128_mask, "V4iV4fV4iUc", "nc", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_cvttps2udq256_mask, "V8iV8fV8iUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_cvttps2udq256_mask, "V8iV8fV8iUc", "nc", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_cvtudq2ps128_mask, "V4fV4iV4fUc", "nc", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_cvtudq2ps256_mask, "V8fV8iV8fUc", "nc", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_expanddf128_mask, "V2dV2dV2dUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_expanddf128_mask, "V2dV2dV2dUc", "nc", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_expanddf256_mask, "V4dV4dV4dUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_expanddf256_mask, "V4dV4dV4dUc", "nc", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_expanddi128_mask, "V2LLiV2LLiV2LLiUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_expanddi128_mask, "V2LLiV2LLiV2LLiUc", "nc", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_expanddi256_mask, "V4LLiV4LLiV4LLiUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_expanddi256_mask, "V4LLiV4LLiV4LLiUc", "nc", "avx512vl")

	TARGET_BUILTIN(__builtin_ia32_expandhi128_mask, "V8sV8sV8sUc", "nc", "avx512vl,avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_expandhi128_mask, "V8sV8sV8sUc", "nc", "avx512vl,avx512vbmi2")
	TARGET_BUILTIN(__builtin_ia32_expandhi256_mask, "V16sV16sV16sUs", "nc", "avx512vl,avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_expandhi256_mask, "V16sV16sV16sUs", "nc", "avx512vl,avx512vbmi2")
	TARGET_BUILTIN(__builtin_ia32_expandqi128_mask, "V16cV16cV16cUs", "nc", "avx512vl,avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_expandqi128_mask, "V16cV16cV16cUs", "nc", "avx512vl,avx512vbmi2")
	▲ Show 20 Lines • Show All 145 Lines • ▼ Show 20 Lines
	TARGET_BUILTIN(__builtin_ia32_cvtpd2qq128_mask, "V2LLiV2dV2LLiUc", "nc", "avx512vl,avx512dq")			TARGET_BUILTIN(__builtin_ia32_cvtpd2qq128_mask, "V2LLiV2dV2LLiUc", "nc", "avx512vl,avx512dq")
	TARGET_BUILTIN(__builtin_ia32_cvtpd2qq256_mask, "V4LLiV4dV4LLiUc", "nc", "avx512vl,avx512dq")			TARGET_BUILTIN(__builtin_ia32_cvtpd2qq256_mask, "V4LLiV4dV4LLiUc", "nc", "avx512vl,avx512dq")
	TARGET_BUILTIN(__builtin_ia32_cvtpd2uqq128_mask, "V2LLiV2dV2LLiUc", "nc", "avx512vl,avx512dq")			TARGET_BUILTIN(__builtin_ia32_cvtpd2uqq128_mask, "V2LLiV2dV2LLiUc", "nc", "avx512vl,avx512dq")
	TARGET_BUILTIN(__builtin_ia32_cvtpd2uqq256_mask, "V4LLiV4dV4LLiUc", "nc", "avx512vl,avx512dq")			TARGET_BUILTIN(__builtin_ia32_cvtpd2uqq256_mask, "V4LLiV4dV4LLiUc", "nc", "avx512vl,avx512dq")
	TARGET_BUILTIN(__builtin_ia32_cvtps2qq128_mask, "V2LLiV4fV2LLiUc", "nc", "avx512vl,avx512dq")			TARGET_BUILTIN(__builtin_ia32_cvtps2qq128_mask, "V2LLiV4fV2LLiUc", "nc", "avx512vl,avx512dq")
	TARGET_BUILTIN(__builtin_ia32_cvtps2qq256_mask, "V4LLiV4fV4LLiUc", "nc", "avx512vl,avx512dq")			TARGET_BUILTIN(__builtin_ia32_cvtps2qq256_mask, "V4LLiV4fV4LLiUc", "nc", "avx512vl,avx512dq")
	TARGET_BUILTIN(__builtin_ia32_cvtps2uqq128_mask, "V2LLiV4fV2LLiUc", "nc", "avx512vl,avx512dq")			TARGET_BUILTIN(__builtin_ia32_cvtps2uqq128_mask, "V2LLiV4fV2LLiUc", "nc", "avx512vl,avx512dq")
	TARGET_BUILTIN(__builtin_ia32_cvtps2uqq256_mask, "V4LLiV4fV4LLiUc", "nc", "avx512vl,avx512dq")			TARGET_BUILTIN(__builtin_ia32_cvtps2uqq256_mask, "V4LLiV4fV4LLiUc", "nc", "avx512vl,avx512dq")
	TARGET_BUILTIN(__builtin_ia32_cvtqq2pd128_mask, "V2dV2LLiV2dUc", "nc", "avx512vl,avx512dq")
	TARGET_BUILTIN(__builtin_ia32_cvtqq2pd256_mask, "V4dV4LLiV4dUc", "nc", "avx512vl,avx512dq")
	TARGET_BUILTIN(__builtin_ia32_cvtqq2ps128_mask, "V4fV2LLiV4fUc", "nc", "avx512vl,avx512dq")			TARGET_BUILTIN(__builtin_ia32_cvtqq2ps128_mask, "V4fV2LLiV4fUc", "nc", "avx512vl,avx512dq")
	TARGET_BUILTIN(__builtin_ia32_cvtqq2ps256_mask, "V4fV4LLiV4fUc", "nc", "avx512vl,avx512dq")			TARGET_BUILTIN(__builtin_ia32_cvtqq2ps256_mask, "V4fV4LLiV4fUc", "nc", "avx512vl,avx512dq")
	TARGET_BUILTIN(__builtin_ia32_cvttpd2qq128_mask, "V2LLiV2dV2LLiUc", "nc", "avx512vl,avx512dq")			TARGET_BUILTIN(__builtin_ia32_cvttpd2qq128_mask, "V2LLiV2dV2LLiUc", "nc", "avx512vl,avx512dq")
	TARGET_BUILTIN(__builtin_ia32_cvttpd2qq256_mask, "V4LLiV4dV4LLiUc", "nc", "avx512vl,avx512dq")			TARGET_BUILTIN(__builtin_ia32_cvttpd2qq256_mask, "V4LLiV4dV4LLiUc", "nc", "avx512vl,avx512dq")
	TARGET_BUILTIN(__builtin_ia32_cvttpd2uqq128_mask, "V2LLiV2dV2LLiUc", "nc", "avx512vl,avx512dq")			TARGET_BUILTIN(__builtin_ia32_cvttpd2uqq128_mask, "V2LLiV2dV2LLiUc", "nc", "avx512vl,avx512dq")
	TARGET_BUILTIN(__builtin_ia32_cvttpd2uqq256_mask, "V4LLiV4dV4LLiUc", "nc", "avx512vl,avx512dq")			TARGET_BUILTIN(__builtin_ia32_cvttpd2uqq256_mask, "V4LLiV4dV4LLiUc", "nc", "avx512vl,avx512dq")
	TARGET_BUILTIN(__builtin_ia32_cvttps2qq128_mask, "V2LLiV4fV2LLiUc", "nc", "avx512vl,avx512dq")			TARGET_BUILTIN(__builtin_ia32_cvttps2qq128_mask, "V2LLiV4fV2LLiUc", "nc", "avx512vl,avx512dq")
	TARGET_BUILTIN(__builtin_ia32_cvttps2qq256_mask, "V4LLiV4fV4LLiUc", "nc", "avx512vl,avx512dq")			TARGET_BUILTIN(__builtin_ia32_cvttps2qq256_mask, "V4LLiV4fV4LLiUc", "nc", "avx512vl,avx512dq")
	TARGET_BUILTIN(__builtin_ia32_cvttps2uqq128_mask, "V2LLiV4fV2LLiUc", "nc", "avx512vl,avx512dq")			TARGET_BUILTIN(__builtin_ia32_cvttps2uqq128_mask, "V2LLiV4fV2LLiUc", "nc", "avx512vl,avx512dq")
	TARGET_BUILTIN(__builtin_ia32_cvttps2uqq256_mask, "V4LLiV4fV4LLiUc", "nc", "avx512vl,avx512dq")			TARGET_BUILTIN(__builtin_ia32_cvttps2uqq256_mask, "V4LLiV4fV4LLiUc", "nc", "avx512vl,avx512dq")
	TARGET_BUILTIN(__builtin_ia32_cvtuqq2pd128_mask, "V2dV2LLiV2dUc", "nc", "avx512vl,avx512dq")
	TARGET_BUILTIN(__builtin_ia32_cvtuqq2pd256_mask, "V4dV4LLiV4dUc", "nc", "avx512vl,avx512dq")
	TARGET_BUILTIN(__builtin_ia32_cvtuqq2ps128_mask, "V4fV2LLiV4fUc", "nc", "avx512vl,avx512dq")			TARGET_BUILTIN(__builtin_ia32_cvtuqq2ps128_mask, "V4fV2LLiV4fUc", "nc", "avx512vl,avx512dq")
	TARGET_BUILTIN(__builtin_ia32_cvtuqq2ps256_mask, "V4fV4LLiV4fUc", "nc", "avx512vl,avx512dq")			TARGET_BUILTIN(__builtin_ia32_cvtuqq2ps256_mask, "V4fV4LLiV4fUc", "nc", "avx512vl,avx512dq")
	TARGET_BUILTIN(__builtin_ia32_rangepd128_mask, "V2dV2dV2dIiV2dUc", "nc", "avx512vl,avx512dq")			TARGET_BUILTIN(__builtin_ia32_rangepd128_mask, "V2dV2dV2dIiV2dUc", "nc", "avx512vl,avx512dq")
	TARGET_BUILTIN(__builtin_ia32_rangepd256_mask, "V4dV4dV4dIiV4dUc", "nc", "avx512vl,avx512dq")			TARGET_BUILTIN(__builtin_ia32_rangepd256_mask, "V4dV4dV4dIiV4dUc", "nc", "avx512vl,avx512dq")
	TARGET_BUILTIN(__builtin_ia32_rangeps128_mask, "V4fV4fV4fIiV4fUc", "nc", "avx512vl,avx512dq")			TARGET_BUILTIN(__builtin_ia32_rangeps128_mask, "V4fV4fV4fIiV4fUc", "nc", "avx512vl,avx512dq")
	TARGET_BUILTIN(__builtin_ia32_rangeps256_mask, "V8fV8fV8fIiV8fUc", "nc", "avx512vl,avx512dq")			TARGET_BUILTIN(__builtin_ia32_rangeps256_mask, "V8fV8fV8fIiV8fUc", "nc", "avx512vl,avx512dq")
	TARGET_BUILTIN(__builtin_ia32_rangesd128_round_mask, "V2dV2dV2dV2dUcIiIi", "nc", "avx512dq")			TARGET_BUILTIN(__builtin_ia32_rangesd128_round_mask, "V2dV2dV2dV2dUcIiIi", "nc", "avx512dq")
	TARGET_BUILTIN(__builtin_ia32_rangess128_round_mask, "V4fV4fV4fV4fUcIiIi", "nc", "avx512dq")			TARGET_BUILTIN(__builtin_ia32_rangess128_round_mask, "V4fV4fV4fV4fUcIiIi", "nc", "avx512dq")
	▲ Show 20 Lines • Show All 520 Lines • Show Last 20 Lines

lib/Headers/avx512dqintrin.h

	Show First 20 Lines • Show All 355 Lines • ▼ Show 20 Lines
	#define _mm512_maskz_cvt_roundps_epu64(U, A, R) __extension__ ({ \			#define _mm512_maskz_cvt_roundps_epu64(U, A, R) __extension__ ({ \
	(__m512i)__builtin_ia32_cvtps2uqq512_mask((__v8sf)(__m256)(A), \			(__m512i)__builtin_ia32_cvtps2uqq512_mask((__v8sf)(__m256)(A), \
	(__v8di)_mm512_setzero_si512(), \			(__v8di)_mm512_setzero_si512(), \
	(__mmask8)(U), (int)(R)); })			(__mmask8)(U), (int)(R)); })


	static __inline__ __m512d __DEFAULT_FN_ATTRS			static __inline__ __m512d __DEFAULT_FN_ATTRS
	_mm512_cvtepi64_pd (__m512i __A) {			_mm512_cvtepi64_pd (__m512i __A) {
	return (__m512d) __builtin_ia32_cvtqq2pd512_mask ((__v8di) __A,			return (__m512d)__builtin_convertvector((__v8di)__A, __v8df);
	(__v8df) _mm512_setzero_pd(),
	(__mmask8) -1,
	_MM_FROUND_CUR_DIRECTION);
	}			}

	static __inline__ __m512d __DEFAULT_FN_ATTRS			static __inline__ __m512d __DEFAULT_FN_ATTRS
	_mm512_mask_cvtepi64_pd (__m512d __W, __mmask8 __U, __m512i __A) {			_mm512_mask_cvtepi64_pd (__m512d __W, __mmask8 __U, __m512i __A) {
	return (__m512d) __builtin_ia32_cvtqq2pd512_mask ((__v8di) __A,			return (__m512d)__builtin_ia32_selectpd_512((__mmask8)__U,
	(__v8df) __W,			(__v8df)_mm512_cvtepi64_pd(__A),
	(__mmask8) __U,			(__v8df)__W);
	_MM_FROUND_CUR_DIRECTION);
	}			}

	static __inline__ __m512d __DEFAULT_FN_ATTRS			static __inline__ __m512d __DEFAULT_FN_ATTRS
	_mm512_maskz_cvtepi64_pd (__mmask8 __U, __m512i __A) {			_mm512_maskz_cvtepi64_pd (__mmask8 __U, __m512i __A) {
	return (__m512d) __builtin_ia32_cvtqq2pd512_mask ((__v8di) __A,			return (__m512d)__builtin_ia32_selectpd_512((__mmask8)__U,
	(__v8df) _mm512_setzero_pd(),			(__v8df)_mm512_cvtepi64_pd(__A),
	(__mmask8) __U,			(__v8df)_mm512_setzero_pd());
	_MM_FROUND_CUR_DIRECTION);
	}			}

	#define _mm512_cvt_roundepi64_pd(A, R) __extension__ ({ \			#define _mm512_cvt_roundepi64_pd(A, R) __extension__ ({ \
	(__m512d)__builtin_ia32_cvtqq2pd512_mask((__v8di)(__m512i)(A), \			(__m512d)__builtin_ia32_cvtqq2pd512_mask((__v8di)(__m512i)(A), \
	(__v8df)_mm512_setzero_pd(), \			(__v8df)_mm512_setzero_pd(), \
	(__mmask8)-1, (int)(R)); })			(__mmask8)-1, (int)(R)); })

	#define _mm512_mask_cvt_roundepi64_pd(W, U, A, R) __extension__ ({ \			#define _mm512_mask_cvt_roundepi64_pd(W, U, A, R) __extension__ ({ \
	▲ Show 20 Lines • Show All 199 Lines • ▼ Show 20 Lines

	#define _mm512_maskz_cvtt_roundps_epu64(U, A, R) __extension__ ({ \			#define _mm512_maskz_cvtt_roundps_epu64(U, A, R) __extension__ ({ \
	(__m512i)__builtin_ia32_cvttps2uqq512_mask((__v8sf)(__m256)(A), \			(__m512i)__builtin_ia32_cvttps2uqq512_mask((__v8sf)(__m256)(A), \
	(__v8di)_mm512_setzero_si512(), \			(__v8di)_mm512_setzero_si512(), \
	(__mmask8)(U), (int)(R)); })			(__mmask8)(U), (int)(R)); })

	static __inline__ __m512d __DEFAULT_FN_ATTRS			static __inline__ __m512d __DEFAULT_FN_ATTRS
	_mm512_cvtepu64_pd (__m512i __A) {			_mm512_cvtepu64_pd (__m512i __A) {
	return (__m512d) __builtin_ia32_cvtuqq2pd512_mask ((__v8di) __A,			return (__m512d)__builtin_convertvector((__v8du)__A, __v8df);
	(__v8df) _mm512_setzero_pd(),
	(__mmask8) -1,
	_MM_FROUND_CUR_DIRECTION);
	}			}

	static __inline__ __m512d __DEFAULT_FN_ATTRS			static __inline__ __m512d __DEFAULT_FN_ATTRS
	_mm512_mask_cvtepu64_pd (__m512d __W, __mmask8 __U, __m512i __A) {			_mm512_mask_cvtepu64_pd (__m512d __W, __mmask8 __U, __m512i __A) {
	return (__m512d) __builtin_ia32_cvtuqq2pd512_mask ((__v8di) __A,			return (__m512d)__builtin_ia32_selectpd_512((__mmask8)__U,
	(__v8df) __W,			(__v8df)_mm512_cvtepu64_pd(__A),
	(__mmask8) __U,			(__v8df)__W);
	_MM_FROUND_CUR_DIRECTION);
	}			}

	static __inline__ __m512d __DEFAULT_FN_ATTRS			static __inline__ __m512d __DEFAULT_FN_ATTRS
	_mm512_maskz_cvtepu64_pd (__mmask8 __U, __m512i __A) {			_mm512_maskz_cvtepu64_pd (__mmask8 __U, __m512i __A) {
	return (__m512d) __builtin_ia32_cvtuqq2pd512_mask ((__v8di) __A,			return (__m512d)__builtin_ia32_selectpd_512((__mmask8)__U,
	(__v8df) _mm512_setzero_pd(),			(__v8df)_mm512_cvtepu64_pd(__A),
	(__mmask8) __U,			(__v8df)_mm512_setzero_pd());
	_MM_FROUND_CUR_DIRECTION);
	}			}

	#define _mm512_cvt_roundepu64_pd(A, R) __extension__ ({ \			#define _mm512_cvt_roundepu64_pd(A, R) __extension__ ({ \
	(__m512d)__builtin_ia32_cvtuqq2pd512_mask((__v8di)(__m512i)(A), \			(__m512d)__builtin_ia32_cvtuqq2pd512_mask((__v8di)(__m512i)(A), \
	(__v8df)_mm512_setzero_pd(), \			(__v8df)_mm512_setzero_pd(), \
	(__mmask8)-1, (int)(R)); })			(__mmask8)-1, (int)(R)); })

	#define _mm512_mask_cvt_roundepu64_pd(W, U, A, R) __extension__ ({ \			#define _mm512_mask_cvt_roundepu64_pd(W, U, A, R) __extension__ ({ \
	▲ Show 20 Lines • Show All 705 Lines • Show Last 20 Lines

lib/Headers/avx512fintrin.h

This file is larger than 256 KB, so syntax highlighting is disabled by default.

	Show First 20 Lines • Show All 3,825 Lines • ▼ Show 20 Lines
	#define _mm512_maskz_cvt_roundepu32_ps(U, A, R) __extension__ ({ \			#define _mm512_maskz_cvt_roundepu32_ps(U, A, R) __extension__ ({ \
	(__m512)__builtin_ia32_cvtudq2ps512_mask((__v16si)(__m512i)(A), \			(__m512)__builtin_ia32_cvtudq2ps512_mask((__v16si)(__m512i)(A), \
	(__v16sf)_mm512_setzero_ps(), \			(__v16sf)_mm512_setzero_ps(), \
	(__mmask16)(U), (int)(R)); })			(__mmask16)(U), (int)(R)); })

	static __inline__ __m512 __DEFAULT_FN_ATTRS			static __inline__ __m512 __DEFAULT_FN_ATTRS
	_mm512_cvtepu32_ps (__m512i __A)			_mm512_cvtepu32_ps (__m512i __A)
	{			{
	return (__m512) __builtin_ia32_cvtudq2ps512_mask ((__v16si) __A,			return (__m512)__builtin_convertvector((__v16su)__A, __v16sf);
	(__v16sf) _mm512_undefined_ps (),
	(__mmask16) -1,
	_MM_FROUND_CUR_DIRECTION);
	}			}

	static __inline__ __m512 __DEFAULT_FN_ATTRS			static __inline__ __m512 __DEFAULT_FN_ATTRS
	_mm512_mask_cvtepu32_ps (__m512 __W, __mmask16 __U, __m512i __A)			_mm512_mask_cvtepu32_ps (__m512 __W, __mmask16 __U, __m512i __A)
	{			{
	return (__m512) __builtin_ia32_cvtudq2ps512_mask ((__v16si) __A,			return (__m512)__builtin_ia32_selectps_512((__mmask16)__U,
	(__v16sf) __W,			(__v16sf)_mm512_cvtepu32_ps(__A),
	(__mmask16) __U,			(__v16sf)__W);
	_MM_FROUND_CUR_DIRECTION);
	}			}

	static __inline__ __m512 __DEFAULT_FN_ATTRS			static __inline__ __m512 __DEFAULT_FN_ATTRS
	_mm512_maskz_cvtepu32_ps (__mmask16 __U, __m512i __A)			_mm512_maskz_cvtepu32_ps (__mmask16 __U, __m512i __A)
	{			{
	return (__m512) __builtin_ia32_cvtudq2ps512_mask ((__v16si) __A,			return (__m512)__builtin_ia32_selectps_512((__mmask16)__U,
	(__v16sf) _mm512_setzero_ps (),			(__v16sf)_mm512_cvtepu32_ps(__A),
	(__mmask16) __U,			(__v16sf)_mm512_setzero_ps());
	_MM_FROUND_CUR_DIRECTION);
	}			}

	static __inline __m512d __DEFAULT_FN_ATTRS			static __inline __m512d __DEFAULT_FN_ATTRS
	_mm512_cvtepi32_pd(__m256i __A)			_mm512_cvtepi32_pd(__m256i __A)
	{			{
	return (__m512d)__builtin_convertvector((__v8si)__A, __v8df);			return (__m512d)__builtin_convertvector((__v8si)__A, __v8df);
	}			}

	Show All 23 Lines
	_mm512_mask_cvtepi32lo_pd(__m512d __W, __mmask8 __U,__m512i __A)			_mm512_mask_cvtepi32lo_pd(__m512d __W, __mmask8 __U,__m512i __A)
	{			{
	return (__m512d) _mm512_mask_cvtepi32_pd(__W, __U, _mm512_castsi512_si256(__A));			return (__m512d) _mm512_mask_cvtepi32_pd(__W, __U, _mm512_castsi512_si256(__A));
	}			}

	static __inline__ __m512 __DEFAULT_FN_ATTRS			static __inline__ __m512 __DEFAULT_FN_ATTRS
	_mm512_cvtepi32_ps (__m512i __A)			_mm512_cvtepi32_ps (__m512i __A)
	{			{
	return (__m512) __builtin_ia32_cvtdq2ps512_mask ((__v16si) __A,			return (__m512)__builtin_convertvector((__v16si)__A, __v16sf);
	(__v16sf) _mm512_undefined_ps (),
	(__mmask16) -1,
	_MM_FROUND_CUR_DIRECTION);
	}			}

	static __inline__ __m512 __DEFAULT_FN_ATTRS			static __inline__ __m512 __DEFAULT_FN_ATTRS
	_mm512_mask_cvtepi32_ps (__m512 __W, __mmask16 __U, __m512i __A)			_mm512_mask_cvtepi32_ps (__m512 __W, __mmask16 __U, __m512i __A)
	{			{
	return (__m512) __builtin_ia32_cvtdq2ps512_mask ((__v16si) __A,			return (__m512)__builtin_ia32_selectps_512((__mmask16)__U,
	(__v16sf) __W,			(__v16sf)_mm512_cvtepi32_ps(__A),
	(__mmask16) __U,			(__v16sf)__W);
	_MM_FROUND_CUR_DIRECTION);
	}			}

	static __inline__ __m512 __DEFAULT_FN_ATTRS			static __inline__ __m512 __DEFAULT_FN_ATTRS
	_mm512_maskz_cvtepi32_ps (__mmask16 __U, __m512i __A)			_mm512_maskz_cvtepi32_ps (__mmask16 __U, __m512i __A)
	{			{
	return (__m512) __builtin_ia32_cvtdq2ps512_mask ((__v16si) __A,			return (__m512)__builtin_ia32_selectps_512((__mmask16)__U,
	(__v16sf) _mm512_setzero_ps (),			(__v16sf)_mm512_cvtepi32_ps(__A),
	(__mmask16) __U,			(__v16sf)_mm512_setzero_ps());
	_MM_FROUND_CUR_DIRECTION);
	}			}

	static __inline __m512d __DEFAULT_FN_ATTRS			static __inline __m512d __DEFAULT_FN_ATTRS
	_mm512_cvtepu32_pd(__m256i __A)			_mm512_cvtepu32_pd(__m256i __A)
	{			{
	return (__m512d)__builtin_convertvector((__v8su)__A, __v8df);			return (__m512d)__builtin_convertvector((__v8su)__A, __v8df);
	}			}

	▲ Show 20 Lines • Show All 6,268 Lines • Show Last 20 Lines

lib/Headers/avx512vldqintrin.h

	Show First 20 Lines • Show All 457 Lines • ▼ Show 20 Lines
	_mm256_maskz_cvtps_epu64 (__mmask8 __U, __m128 __A) {			_mm256_maskz_cvtps_epu64 (__mmask8 __U, __m128 __A) {
	return (__m256i) __builtin_ia32_cvtps2uqq256_mask ((__v4sf) __A,			return (__m256i) __builtin_ia32_cvtps2uqq256_mask ((__v4sf) __A,
	(__v4di) _mm256_setzero_si256(),			(__v4di) _mm256_setzero_si256(),
	(__mmask8) __U);			(__mmask8) __U);
	}			}

	static __inline__ __m128d __DEFAULT_FN_ATTRS			static __inline__ __m128d __DEFAULT_FN_ATTRS
	_mm_cvtepi64_pd (__m128i __A) {			_mm_cvtepi64_pd (__m128i __A) {
	return (__m128d) __builtin_ia32_cvtqq2pd128_mask ((__v2di) __A,			return (__m128d)__builtin_convertvector((__v2di)__A, __v2df);
	(__v2df) _mm_setzero_pd(),
	(__mmask8) -1);
	}			}

	static __inline__ __m128d __DEFAULT_FN_ATTRS			static __inline__ __m128d __DEFAULT_FN_ATTRS
	_mm_mask_cvtepi64_pd (__m128d __W, __mmask8 __U, __m128i __A) {			_mm_mask_cvtepi64_pd (__m128d __W, __mmask8 __U, __m128i __A) {
	return (__m128d) __builtin_ia32_cvtqq2pd128_mask ((__v2di) __A,			return (__m128d)__builtin_ia32_selectpd_128((__mmask8)__U,
	(__v2df) __W,			(__v2df)_mm_cvtepi64_pd(__A),
	(__mmask8) __U);			(__v2df)__W);
	}			}

	static __inline__ __m128d __DEFAULT_FN_ATTRS			static __inline__ __m128d __DEFAULT_FN_ATTRS
	_mm_maskz_cvtepi64_pd (__mmask8 __U, __m128i __A) {			_mm_maskz_cvtepi64_pd (__mmask8 __U, __m128i __A) {
	return (__m128d) __builtin_ia32_cvtqq2pd128_mask ((__v2di) __A,			return (__m128d)__builtin_ia32_selectpd_128((__mmask8)__U,
	(__v2df) _mm_setzero_pd(),			(__v2df)_mm_cvtepi64_pd(__A),
	(__mmask8) __U);			(__v2df)_mm_setzero_pd());
	}			}

	static __inline__ __m256d __DEFAULT_FN_ATTRS			static __inline__ __m256d __DEFAULT_FN_ATTRS
	_mm256_cvtepi64_pd (__m256i __A) {			_mm256_cvtepi64_pd (__m256i __A) {
	return (__m256d) __builtin_ia32_cvtqq2pd256_mask ((__v4di) __A,			return (__m256d)__builtin_convertvector((__v4di)__A, __v4df);
	(__v4df) _mm256_setzero_pd(),
	(__mmask8) -1);
	}			}

	static __inline__ __m256d __DEFAULT_FN_ATTRS			static __inline__ __m256d __DEFAULT_FN_ATTRS
	_mm256_mask_cvtepi64_pd (__m256d __W, __mmask8 __U, __m256i __A) {			_mm256_mask_cvtepi64_pd (__m256d __W, __mmask8 __U, __m256i __A) {
	return (__m256d) __builtin_ia32_cvtqq2pd256_mask ((__v4di) __A,			return (__m256d)__builtin_ia32_selectpd_256((__mmask8)__U,
	(__v4df) __W,			(__v4df)_mm256_cvtepi64_pd(__A),
	(__mmask8) __U);			(__v4df)__W);
	}			}

	static __inline__ __m256d __DEFAULT_FN_ATTRS			static __inline__ __m256d __DEFAULT_FN_ATTRS
	_mm256_maskz_cvtepi64_pd (__mmask8 __U, __m256i __A) {			_mm256_maskz_cvtepi64_pd (__mmask8 __U, __m256i __A) {
	return (__m256d) __builtin_ia32_cvtqq2pd256_mask ((__v4di) __A,			return (__m256d)__builtin_ia32_selectpd_256((__mmask8)__U,
	(__v4df) _mm256_setzero_pd(),			(__v4df)_mm256_cvtepi64_pd(__A),
	(__mmask8) __U);			(__v4df)_mm256_setzero_pd());
	}			}

	static __inline__ __m128 __DEFAULT_FN_ATTRS			static __inline__ __m128 __DEFAULT_FN_ATTRS
	_mm_cvtepi64_ps (__m128i __A) {			_mm_cvtepi64_ps (__m128i __A) {
	return (__m128) __builtin_ia32_cvtqq2ps128_mask ((__v2di) __A,			return (__m128) __builtin_ia32_cvtqq2ps128_mask ((__v2di) __A,
	(__v4sf) _mm_setzero_ps(),			(__v4sf) _mm_setzero_ps(),
	(__mmask8) -1);			(__mmask8) -1);
	}			}
	▲ Show 20 Lines • Show All 198 Lines • ▼ Show 20 Lines
	_mm256_maskz_cvttps_epu64 (__mmask8 __U, __m128 __A) {			_mm256_maskz_cvttps_epu64 (__mmask8 __U, __m128 __A) {
	return (__m256i) __builtin_ia32_cvttps2uqq256_mask ((__v4sf) __A,			return (__m256i) __builtin_ia32_cvttps2uqq256_mask ((__v4sf) __A,
	(__v4di) _mm256_setzero_si256(),			(__v4di) _mm256_setzero_si256(),
	(__mmask8) __U);			(__mmask8) __U);
	}			}

	static __inline__ __m128d __DEFAULT_FN_ATTRS			static __inline__ __m128d __DEFAULT_FN_ATTRS
	_mm_cvtepu64_pd (__m128i __A) {			_mm_cvtepu64_pd (__m128i __A) {
	return (__m128d) __builtin_ia32_cvtuqq2pd128_mask ((__v2di) __A,			return (__m128d)__builtin_convertvector((__v2du)__A, __v2df);
	(__v2df) _mm_setzero_pd(),
	(__mmask8) -1);
	}			}

	static __inline__ __m128d __DEFAULT_FN_ATTRS			static __inline__ __m128d __DEFAULT_FN_ATTRS
	_mm_mask_cvtepu64_pd (__m128d __W, __mmask8 __U, __m128i __A) {			_mm_mask_cvtepu64_pd (__m128d __W, __mmask8 __U, __m128i __A) {
	return (__m128d) __builtin_ia32_cvtuqq2pd128_mask ((__v2di) __A,			return (__m128d)__builtin_ia32_selectpd_128((__mmask8)__U,
	(__v2df) __W,			(__v2df)_mm_cvtepu64_pd(__A),
	(__mmask8) __U);			(__v2df)__W);
	}			}

	static __inline__ __m128d __DEFAULT_FN_ATTRS			static __inline__ __m128d __DEFAULT_FN_ATTRS
	_mm_maskz_cvtepu64_pd (__mmask8 __U, __m128i __A) {			_mm_maskz_cvtepu64_pd (__mmask8 __U, __m128i __A) {
	return (__m128d) __builtin_ia32_cvtuqq2pd128_mask ((__v2di) __A,			return (__m128d)__builtin_ia32_selectpd_128((__mmask8)__U,
	(__v2df) _mm_setzero_pd(),			(__v2df)_mm_cvtepu64_pd(__A),
	(__mmask8) __U);			(__v2df)_mm_setzero_pd());
	}			}

	static __inline__ __m256d __DEFAULT_FN_ATTRS			static __inline__ __m256d __DEFAULT_FN_ATTRS
	_mm256_cvtepu64_pd (__m256i __A) {			_mm256_cvtepu64_pd (__m256i __A) {
	return (__m256d) __builtin_ia32_cvtuqq2pd256_mask ((__v4di) __A,			return (__m256d)__builtin_convertvector((__v4du)__A, __v4df);
	(__v4df) _mm256_setzero_pd(),
	(__mmask8) -1);
	}			}

	static __inline__ __m256d __DEFAULT_FN_ATTRS			static __inline__ __m256d __DEFAULT_FN_ATTRS
	_mm256_mask_cvtepu64_pd (__m256d __W, __mmask8 __U, __m256i __A) {			_mm256_mask_cvtepu64_pd (__m256d __W, __mmask8 __U, __m256i __A) {
	return (__m256d) __builtin_ia32_cvtuqq2pd256_mask ((__v4di) __A,			return (__m256d)__builtin_ia32_selectpd_256((__mmask8)__U,
	(__v4df) __W,			(__v4df)_mm256_cvtepu64_pd(__A),
	(__mmask8) __U);			(__v4df)__W);
	}			}

	static __inline__ __m256d __DEFAULT_FN_ATTRS			static __inline__ __m256d __DEFAULT_FN_ATTRS
	_mm256_maskz_cvtepu64_pd (__mmask8 __U, __m256i __A) {			_mm256_maskz_cvtepu64_pd (__mmask8 __U, __m256i __A) {
	return (__m256d) __builtin_ia32_cvtuqq2pd256_mask ((__v4di) __A,			return (__m256d)__builtin_ia32_selectpd_256((__mmask8)__U,
	(__v4df) _mm256_setzero_pd(),			(__v4df)_mm256_cvtepu64_pd(__A),
	(__mmask8) __U);			(__v4df)_mm256_setzero_pd());
	}			}

	static __inline__ __m128 __DEFAULT_FN_ATTRS			static __inline__ __m128 __DEFAULT_FN_ATTRS
	_mm_cvtepu64_ps (__m128i __A) {			_mm_cvtepu64_ps (__m128i __A) {
	return (__m128) __builtin_ia32_cvtuqq2ps128_mask ((__v2di) __A,			return (__m128) __builtin_ia32_cvtuqq2ps128_mask ((__v2di) __A,
	(__v4sf) _mm_setzero_ps(),			(__v4sf) _mm_setzero_ps(),
	(__mmask8) -1);			(__mmask8) -1);
	}			}
	▲ Show 20 Lines • Show All 435 Lines • Show Last 20 Lines

lib/Headers/avx512vlintrin.h

This file is larger than 256 KB, so syntax highlighting is disabled by default.

	Show First 20 Lines • Show All 2,201 Lines • ▼ Show 20 Lines
	_mm256_maskz_cvtepu32_pd (__mmask8 __U, __m128i __A) {			_mm256_maskz_cvtepu32_pd (__mmask8 __U, __m128i __A) {
	return (__m256d)__builtin_ia32_selectpd_256((__mmask8) __U,			return (__m256d)__builtin_ia32_selectpd_256((__mmask8) __U,
	(__v4df)_mm256_cvtepu32_pd(__A),			(__v4df)_mm256_cvtepu32_pd(__A),
	(__v4df)_mm256_setzero_pd());			(__v4df)_mm256_setzero_pd());
	}			}

	static __inline__ __m128 __DEFAULT_FN_ATTRS			static __inline__ __m128 __DEFAULT_FN_ATTRS
	_mm_cvtepu32_ps (__m128i __A) {			_mm_cvtepu32_ps (__m128i __A) {
	return (__m128) __builtin_ia32_cvtudq2ps128_mask ((__v4si) __A,			return (__m128)__builtin_convertvector((__v4su)__A, __v4sf);
	(__v4sf)
	_mm_setzero_ps (),
	(__mmask8) -1);
	}			}

	static __inline__ __m128 __DEFAULT_FN_ATTRS			static __inline__ __m128 __DEFAULT_FN_ATTRS
	_mm_mask_cvtepu32_ps (__m128 __W, __mmask8 __U, __m128i __A) {			_mm_mask_cvtepu32_ps (__m128 __W, __mmask8 __U, __m128i __A) {
	return (__m128) __builtin_ia32_cvtudq2ps128_mask ((__v4si) __A,			return (__m128)__builtin_ia32_selectps_128((__mmask8)__U,
	(__v4sf) __W,			(__v4sf)_mm_cvtepu32_ps(__A),
	(__mmask8) __U);			(__v4sf)__W);
	}			}

	static __inline__ __m128 __DEFAULT_FN_ATTRS			static __inline__ __m128 __DEFAULT_FN_ATTRS
	_mm_maskz_cvtepu32_ps (__mmask8 __U, __m128i __A) {			_mm_maskz_cvtepu32_ps (__mmask8 __U, __m128i __A) {
	return (__m128) __builtin_ia32_cvtudq2ps128_mask ((__v4si) __A,			return (__m128)__builtin_ia32_selectps_128((__mmask8)__U,
	(__v4sf)			(__v4sf)_mm_cvtepu32_ps(__A),
	_mm_setzero_ps (),			(__v4sf)_mm_setzero_ps());
	(__mmask8) __U);
	}			}

	static __inline__ __m256 __DEFAULT_FN_ATTRS			static __inline__ __m256 __DEFAULT_FN_ATTRS
	_mm256_cvtepu32_ps (__m256i __A) {			_mm256_cvtepu32_ps (__m256i __A) {
	return (__m256) __builtin_ia32_cvtudq2ps256_mask ((__v8si) __A,			return (__m256)__builtin_convertvector((__v8su)__A, __v8sf);
	(__v8sf)
	_mm256_setzero_ps (),
	(__mmask8) -1);
	}			}

	static __inline__ __m256 __DEFAULT_FN_ATTRS			static __inline__ __m256 __DEFAULT_FN_ATTRS
	_mm256_mask_cvtepu32_ps (__m256 __W, __mmask8 __U, __m256i __A) {			_mm256_mask_cvtepu32_ps (__m256 __W, __mmask8 __U, __m256i __A) {
	return (__m256) __builtin_ia32_cvtudq2ps256_mask ((__v8si) __A,			return (__m256)__builtin_ia32_selectps_256((__mmask8)__U,
	(__v8sf) __W,			(__v8sf)_mm256_cvtepu32_ps(__A),
	(__mmask8) __U);			(__v8sf)__W);
	}			}

	static __inline__ __m256 __DEFAULT_FN_ATTRS			static __inline__ __m256 __DEFAULT_FN_ATTRS
	_mm256_maskz_cvtepu32_ps (__mmask8 __U, __m256i __A) {			_mm256_maskz_cvtepu32_ps (__mmask8 __U, __m256i __A) {
	return (__m256) __builtin_ia32_cvtudq2ps256_mask ((__v8si) __A,			return (__m256)__builtin_ia32_selectps_256((__mmask8)__U,
	(__v8sf)			(__v8sf)_mm256_cvtepu32_ps(__A),
	_mm256_setzero_ps (),			(__v8sf)_mm256_setzero_ps());
	(__mmask8) __U);
	}			}

	static __inline__ __m128d __DEFAULT_FN_ATTRS			static __inline__ __m128d __DEFAULT_FN_ATTRS
	_mm_mask_div_pd(__m128d __W, __mmask8 __U, __m128d __A, __m128d __B) {			_mm_mask_div_pd(__m128d __W, __mmask8 __U, __m128d __A, __m128d __B) {
	return (__m128d)__builtin_ia32_selectpd_128((__mmask8)__U,			return (__m128d)__builtin_ia32_selectpd_128((__mmask8)__U,
	(__v2df)_mm_div_pd(__A, __B),			(__v2df)_mm_div_pd(__A, __B),
	(__v2df)__W);			(__v2df)__W);
	}			}
	▲ Show 20 Lines • Show All 6,242 Lines • Show Last 20 Lines

lib/Headers/avxintrin.h

	Show First 20 Lines • Show All 2,219 Lines • ▼ Show 20 Lines
	/// This intrinsic corresponds to the <c> VCVTDQ2PS </c> instruction.			/// This intrinsic corresponds to the <c> VCVTDQ2PS </c> instruction.
	///			///
	/// \param __a			/// \param __a
	/// A 256-bit integer vector.			/// A 256-bit integer vector.
	/// \returns A 256-bit vector of [8 x float] containing the converted values.			/// \returns A 256-bit vector of [8 x float] containing the converted values.
	static __inline __m256 __DEFAULT_FN_ATTRS			static __inline __m256 __DEFAULT_FN_ATTRS
	_mm256_cvtepi32_ps(__m256i __a)			_mm256_cvtepi32_ps(__m256i __a)
	{			{
	return (__m256)__builtin_ia32_cvtdq2ps256((__v8si) __a);			return (__m256)__builtin_convertvector((__v8si)__a, __v8sf);
	}			}

	/// Converts a 256-bit vector of [4 x double] into a 128-bit vector of			/// Converts a 256-bit vector of [4 x double] into a 128-bit vector of
	/// [4 x float].			/// [4 x float].
	///			///
	/// \headerfile <x86intrin.h>			/// \headerfile <x86intrin.h>
	///			///
	/// This intrinsic corresponds to the <c> VCVTPD2PS </c> instruction.			/// This intrinsic corresponds to the <c> VCVTPD2PS </c> instruction.
	▲ Show 20 Lines • Show All 2,925 Lines • Show Last 20 Lines

lib/Headers/emmintrin.h

	Show First 20 Lines • Show All 3,418 Lines • ▼ Show 20 Lines
	/// This intrinsic corresponds to the <c> VCVTDQ2PS / CVTDQ2PS </c> instruction.			/// This intrinsic corresponds to the <c> VCVTDQ2PS / CVTDQ2PS </c> instruction.
	///			///
	/// \param __a			/// \param __a
	/// A 128-bit integer vector.			/// A 128-bit integer vector.
	/// \returns A 128-bit vector of [4 x float] containing the converted values.			/// \returns A 128-bit vector of [4 x float] containing the converted values.
	static __inline__ __m128 __DEFAULT_FN_ATTRS			static __inline__ __m128 __DEFAULT_FN_ATTRS
	_mm_cvtepi32_ps(__m128i __a)			_mm_cvtepi32_ps(__m128i __a)
	{			{
	return __builtin_ia32_cvtdq2ps((__v4si)__a);			return (__m128)__builtin_convertvector((__v4si)__a, __v4sf);
	}			}

	/// Converts a vector of [4 x float] into a vector of [4 x i32].			/// Converts a vector of [4 x float] into a vector of [4 x i32].
	///			///
	/// \headerfile <x86intrin.h>			/// \headerfile <x86intrin.h>
	///			///
	/// This intrinsic corresponds to the <c> VCVTPS2DQ / CVTPS2DQ </c> instruction.			/// This intrinsic corresponds to the <c> VCVTPS2DQ / CVTPS2DQ </c> instruction.
	///			///
	▲ Show 20 Lines • Show All 1,516 Lines • Show Last 20 Lines

test/CodeGen/avx-builtins.c

	Show First 20 Lines • Show All 250 Lines • ▼ Show 20 Lines
	__m256d test_mm256_cvtepi32_pd(__m128i A) {			__m256d test_mm256_cvtepi32_pd(__m128i A) {
	// CHECK-LABEL: test_mm256_cvtepi32_pd			// CHECK-LABEL: test_mm256_cvtepi32_pd
	// CHECK: sitofp <4 x i32> %{{.*}} to <4 x double>			// CHECK: sitofp <4 x i32> %{{.*}} to <4 x double>
	return _mm256_cvtepi32_pd(A);			return _mm256_cvtepi32_pd(A);
	}			}

	__m256 test_mm256_cvtepi32_ps(__m256i A) {			__m256 test_mm256_cvtepi32_ps(__m256i A) {
	// CHECK-LABEL: test_mm256_cvtepi32_ps			// CHECK-LABEL: test_mm256_cvtepi32_ps
	// CHECK: call <8 x float> @llvm.x86.avx.cvtdq2.ps.256(<8 x i32> %{{.*}})			// CHECK: sitofp <8 x i32> %{{.*}} to <8 x float>
	return _mm256_cvtepi32_ps(A);			return _mm256_cvtepi32_ps(A);
	}			}

	__m128i test_mm256_cvtpd_epi32(__m256d A) {			__m128i test_mm256_cvtpd_epi32(__m256d A) {
	// CHECK-LABEL: test_mm256_cvtpd_epi32			// CHECK-LABEL: test_mm256_cvtpd_epi32
	// CHECK: call <4 x i32> @llvm.x86.avx.cvt.pd2dq.256(<4 x double> %{{.*}})			// CHECK: call <4 x i32> @llvm.x86.avx.cvt.pd2dq.256(<4 x double> %{{.*}})
	return _mm256_cvtpd_epi32(A);			return _mm256_cvtpd_epi32(A);
	}			}
	▲ Show 20 Lines • Show All 1,210 Lines • Show Last 20 Lines

test/CodeGen/avx512dq-builtins.c

	Show First 20 Lines • Show All 341 Lines • ▼ Show 20 Lines
	__m512i test_mm512_maskz_cvt_roundps_epu64(__mmask8 __U, __m256 __A) {			__m512i test_mm512_maskz_cvt_roundps_epu64(__mmask8 __U, __m256 __A) {
	// CHECK-LABEL: @test_mm512_maskz_cvt_roundps_epu64			// CHECK-LABEL: @test_mm512_maskz_cvt_roundps_epu64
	// CHECK: @llvm.x86.avx512.mask.cvtps2uqq.512			// CHECK: @llvm.x86.avx512.mask.cvtps2uqq.512
	return _mm512_maskz_cvt_roundps_epu64(__U, __A, _MM_FROUND_TO_NEAREST_INT \| _MM_FROUND_NO_EXC);			return _mm512_maskz_cvt_roundps_epu64(__U, __A, _MM_FROUND_TO_NEAREST_INT \| _MM_FROUND_NO_EXC);
	}			}

	__m512d test_mm512_cvtepi64_pd(__m512i __A) {			__m512d test_mm512_cvtepi64_pd(__m512i __A) {
	// CHECK-LABEL: @test_mm512_cvtepi64_pd			// CHECK-LABEL: @test_mm512_cvtepi64_pd
	// CHECK: @llvm.x86.avx512.mask.cvtqq2pd.512			// CHECK: sitofp <8 x i64> %{{.*}} to <8 x double>
	return _mm512_cvtepi64_pd(__A);			return _mm512_cvtepi64_pd(__A);
	}			}

	__m512d test_mm512_mask_cvtepi64_pd(__m512d __W, __mmask8 __U, __m512i __A) {			__m512d test_mm512_mask_cvtepi64_pd(__m512d __W, __mmask8 __U, __m512i __A) {
	// CHECK-LABEL: @test_mm512_mask_cvtepi64_pd			// CHECK-LABEL: @test_mm512_mask_cvtepi64_pd
	// CHECK: @llvm.x86.avx512.mask.cvtqq2pd.512			// CHECK: sitofp <8 x i64> %{{.*}} to <8 x double>
				// CHECK: select <8 x i1> %{{.}}, <8 x double> %{{.}}, <8 x double> %{{.*}}
	return _mm512_mask_cvtepi64_pd(__W, __U, __A);			return _mm512_mask_cvtepi64_pd(__W, __U, __A);
	}			}

	__m512d test_mm512_maskz_cvtepi64_pd(__mmask8 __U, __m512i __A) {			__m512d test_mm512_maskz_cvtepi64_pd(__mmask8 __U, __m512i __A) {
	// CHECK-LABEL: @test_mm512_maskz_cvtepi64_pd			// CHECK-LABEL: @test_mm512_maskz_cvtepi64_pd
	// CHECK: @llvm.x86.avx512.mask.cvtqq2pd.512			// CHECK: sitofp <8 x i64> %{{.*}} to <8 x double>
				// CHECK: select <8 x i1> %{{.}}, <8 x double> %{{.}}, <8 x double> %{{.*}}
	return _mm512_maskz_cvtepi64_pd(__U, __A);			return _mm512_maskz_cvtepi64_pd(__U, __A);
	}			}

	__m512d test_mm512_cvt_roundepi64_pd(__m512i __A) {			__m512d test_mm512_cvt_roundepi64_pd(__m512i __A) {
	// CHECK-LABEL: @test_mm512_cvt_roundepi64_pd			// CHECK-LABEL: @test_mm512_cvt_roundepi64_pd
	// CHECK: @llvm.x86.avx512.mask.cvtqq2pd.512			// CHECK: @llvm.x86.avx512.mask.cvtqq2pd.512
	return _mm512_cvt_roundepi64_pd(__A, _MM_FROUND_TO_NEAREST_INT \| _MM_FROUND_NO_EXC);			return _mm512_cvt_roundepi64_pd(__A, _MM_FROUND_TO_NEAREST_INT \| _MM_FROUND_NO_EXC);
	}			}
	▲ Show 20 Lines • Show All 187 Lines • ▼ Show 20 Lines
	__m512i test_mm512_maskz_cvtt_roundps_epu64(__mmask8 __U, __m256 __A) {			__m512i test_mm512_maskz_cvtt_roundps_epu64(__mmask8 __U, __m256 __A) {
	// CHECK-LABEL: @test_mm512_maskz_cvtt_roundps_epu64			// CHECK-LABEL: @test_mm512_maskz_cvtt_roundps_epu64
	// CHECK: @llvm.x86.avx512.mask.cvttps2uqq.512			// CHECK: @llvm.x86.avx512.mask.cvttps2uqq.512
	return _mm512_maskz_cvtt_roundps_epu64(__U, __A, _MM_FROUND_CUR_DIRECTION);			return _mm512_maskz_cvtt_roundps_epu64(__U, __A, _MM_FROUND_CUR_DIRECTION);
	}			}

	__m512d test_mm512_cvtepu64_pd(__m512i __A) {			__m512d test_mm512_cvtepu64_pd(__m512i __A) {
	// CHECK-LABEL: @test_mm512_cvtepu64_pd			// CHECK-LABEL: @test_mm512_cvtepu64_pd
	// CHECK: @llvm.x86.avx512.mask.cvtuqq2pd.512			// CHECK: uitofp <8 x i64> %{{.*}} to <8 x double>
	return _mm512_cvtepu64_pd(__A);			return _mm512_cvtepu64_pd(__A);
	}			}

	__m512d test_mm512_mask_cvtepu64_pd(__m512d __W, __mmask8 __U, __m512i __A) {			__m512d test_mm512_mask_cvtepu64_pd(__m512d __W, __mmask8 __U, __m512i __A) {
	// CHECK-LABEL: @test_mm512_mask_cvtepu64_pd			// CHECK-LABEL: @test_mm512_mask_cvtepu64_pd
	// CHECK: @llvm.x86.avx512.mask.cvtuqq2pd.512			// CHECK: uitofp <8 x i64> %{{.*}} to <8 x double>
				// CHECK: select <8 x i1> %{{.}}, <8 x double> %{{.}}, <8 x double> %{{.*}}
	return _mm512_mask_cvtepu64_pd(__W, __U, __A);			return _mm512_mask_cvtepu64_pd(__W, __U, __A);
	}			}

	__m512d test_mm512_maskz_cvtepu64_pd(__mmask8 __U, __m512i __A) {			__m512d test_mm512_maskz_cvtepu64_pd(__mmask8 __U, __m512i __A) {
	// CHECK-LABEL: @test_mm512_maskz_cvtepu64_pd			// CHECK-LABEL: @test_mm512_maskz_cvtepu64_pd
	// CHECK: @llvm.x86.avx512.mask.cvtuqq2pd.512			// CHECK: uitofp <8 x i64> %{{.*}} to <8 x double>
				// CHECK: select <8 x i1> %{{.}}, <8 x double> %{{.}}, <8 x double> %{{.*}}
	return _mm512_maskz_cvtepu64_pd(__U, __A);			return _mm512_maskz_cvtepu64_pd(__U, __A);
	}			}

	__m512d test_mm512_cvt_roundepu64_pd(__m512i __A) {			__m512d test_mm512_cvt_roundepu64_pd(__m512i __A) {
	// CHECK-LABEL: @test_mm512_cvt_roundepu64_pd			// CHECK-LABEL: @test_mm512_cvt_roundepu64_pd
	// CHECK: @llvm.x86.avx512.mask.cvtuqq2pd.512			// CHECK: @llvm.x86.avx512.mask.cvtuqq2pd.512
	return _mm512_cvt_roundepu64_pd(__A, _MM_FROUND_TO_NEAREST_INT \| _MM_FROUND_NO_EXC);			return _mm512_cvt_roundepu64_pd(__A, _MM_FROUND_TO_NEAREST_INT \| _MM_FROUND_NO_EXC);
	}			}
	▲ Show 20 Lines • Show All 692 Lines • Show Last 20 Lines

test/CodeGen/avx512f-builtins.c

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 7,079 Lines • ▼ Show 20 Lines	__m512i test_mm512_maskz_cvttps_epu32 (__mmask16 __U, __m512 __A)
// CHECK-LABEL: @test_mm512_maskz_cvttps_epu32		// CHECK-LABEL: @test_mm512_maskz_cvttps_epu32
// CHECK: @llvm.x86.avx512.mask.cvttps2udq.512		// CHECK: @llvm.x86.avx512.mask.cvttps2udq.512
return _mm512_maskz_cvttps_epu32 (__U,__A);		return _mm512_maskz_cvttps_epu32 (__U,__A);
}		}

__m512 test_mm512_cvtepu32_ps (__m512i __A)		__m512 test_mm512_cvtepu32_ps (__m512i __A)
{		{
// CHECK-LABEL: @test_mm512_cvtepu32_ps		// CHECK-LABEL: @test_mm512_cvtepu32_ps
// CHECK: @llvm.x86.avx512.mask.cvtudq2ps.512		// CHECK: uitofp <16 x i32> %{{.*}} to <16 x float>
return _mm512_cvtepu32_ps (__A);		return _mm512_cvtepu32_ps (__A);
}		}

__m512 test_mm512_mask_cvtepu32_ps (__m512 __W, __mmask16 __U, __m512i __A)		__m512 test_mm512_mask_cvtepu32_ps (__m512 __W, __mmask16 __U, __m512i __A)
{		{
// CHECK-LABEL: @test_mm512_mask_cvtepu32_ps		// CHECK-LABEL: @test_mm512_mask_cvtepu32_ps
// CHECK: @llvm.x86.avx512.mask.cvtudq2ps.512		// CHECK: uitofp <16 x i32> %{{.*}} to <16 x float>
		// CHECK: select <16 x i1> {{.}}, <16 x float> {{.}}, <16 x float> {{.*}}
return _mm512_mask_cvtepu32_ps (__W,__U,__A);		return _mm512_mask_cvtepu32_ps (__W,__U,__A);
}		}

__m512 test_mm512_maskz_cvtepu32_ps (__mmask16 __U, __m512i __A)		__m512 test_mm512_maskz_cvtepu32_ps (__mmask16 __U, __m512i __A)
{		{
// CHECK-LABEL: @test_mm512_maskz_cvtepu32_ps		// CHECK-LABEL: @test_mm512_maskz_cvtepu32_ps
// CHECK: @llvm.x86.avx512.mask.cvtudq2ps.512		// CHECK: uitofp <16 x i32> %{{.*}} to <16 x float>
		// CHECK: select <16 x i1> {{.}}, <16 x float> {{.}}, <16 x float> {{.*}}
return _mm512_maskz_cvtepu32_ps (__U,__A);		return _mm512_maskz_cvtepu32_ps (__U,__A);
}		}

__m512d test_mm512_cvtepi32_pd (__m256i __A)		__m512d test_mm512_cvtepi32_pd (__m256i __A)
{		{
// CHECK-LABEL: @test_mm512_cvtepi32_pd		// CHECK-LABEL: @test_mm512_cvtepi32_pd
// CHECK: sitofp <8 x i32> %{{.*}} to <8 x double>		// CHECK: sitofp <8 x i32> %{{.*}} to <8 x double>
return _mm512_cvtepi32_pd (__A);		return _mm512_cvtepi32_pd (__A);
Show All 30 Lines	__m512d test_mm512_mask_cvtepi32lo_pd (__m512d __W, __mmask8 __U, __m512i __A)
// CHECK: sitofp <8 x i32> %{{.*}} to <8 x double>		// CHECK: sitofp <8 x i32> %{{.*}} to <8 x double>
// CHECK: select <8 x i1> {{.}}, <8 x double> {{.}}, <8 x double> {{.*}}		// CHECK: select <8 x i1> {{.}}, <8 x double> {{.}}, <8 x double> {{.*}}
return _mm512_mask_cvtepi32lo_pd (__W, __U, __A);		return _mm512_mask_cvtepi32lo_pd (__W, __U, __A);
}		}

__m512 test_mm512_cvtepi32_ps (__m512i __A)		__m512 test_mm512_cvtepi32_ps (__m512i __A)
{		{
// CHECK-LABEL: @test_mm512_cvtepi32_ps		// CHECK-LABEL: @test_mm512_cvtepi32_ps
// CHECK: @llvm.x86.avx512.mask.cvtdq2ps.512		// CHECK: sitofp <16 x i32> %{{.*}} to <16 x float>
return _mm512_cvtepi32_ps (__A);		return _mm512_cvtepi32_ps (__A);
}		}

__m512 test_mm512_mask_cvtepi32_ps (__m512 __W, __mmask16 __U, __m512i __A)		__m512 test_mm512_mask_cvtepi32_ps (__m512 __W, __mmask16 __U, __m512i __A)
{		{
// CHECK-LABEL: @test_mm512_mask_cvtepi32_ps		// CHECK-LABEL: @test_mm512_mask_cvtepi32_ps
// CHECK: @llvm.x86.avx512.mask.cvtdq2ps.512		// CHECK: sitofp <16 x i32> %{{.*}} to <16 x float>
		// CHECK: select <16 x i1> %{{.}}, <16 x float> %{{.}}, <16 x float> %{{.*}}
return _mm512_mask_cvtepi32_ps (__W,__U,__A);		return _mm512_mask_cvtepi32_ps (__W,__U,__A);
}		}

__m512 test_mm512_maskz_cvtepi32_ps (__mmask16 __U, __m512i __A)		__m512 test_mm512_maskz_cvtepi32_ps (__mmask16 __U, __m512i __A)
{		{
// CHECK-LABEL: @test_mm512_maskz_cvtepi32_ps		// CHECK-LABEL: @test_mm512_maskz_cvtepi32_ps
// CHECK: @llvm.x86.avx512.mask.cvtdq2ps.512		// CHECK: sitofp <16 x i32> %{{.*}} to <16 x float>
		// CHECK: select <16 x i1> %{{.}}, <16 x float> %{{.}}, <16 x float> %{{.*}}
return _mm512_maskz_cvtepi32_ps (__U,__A);		return _mm512_maskz_cvtepi32_ps (__U,__A);
}		}

__m512d test_mm512_cvtepu32_pd(__m256i __A)		__m512d test_mm512_cvtepu32_pd(__m256i __A)
{		{
// CHECK-LABEL: @test_mm512_cvtepu32_pd		// CHECK-LABEL: @test_mm512_cvtepu32_pd
// CHECK: uitofp <8 x i32> %{{.*}} to <8 x double>		// CHECK: uitofp <8 x i32> %{{.*}} to <8 x double>
return _mm512_cvtepu32_pd(__A);		return _mm512_cvtepu32_pd(__A);
▲ Show 20 Lines • Show All 1,412 Lines • Show Last 20 Lines

test/CodeGen/avx512vl-builtins.c

This file is larger than 256 KB, so syntax highlighting is disabled by default.

	Show First 20 Lines • Show All 1,785 Lines • ▼ Show 20 Lines
	__m256d test_mm256_maskz_cvtepi32_pd(__mmask8 __U, __m128i __A) {			__m256d test_mm256_maskz_cvtepi32_pd(__mmask8 __U, __m128i __A) {
	// CHECK-LABEL: @test_mm256_maskz_cvtepi32_pd			// CHECK-LABEL: @test_mm256_maskz_cvtepi32_pd
	// CHECK: sitofp <4 x i32> %{{.*}} to <4 x double>			// CHECK: sitofp <4 x i32> %{{.*}} to <4 x double>
	// CHECK: select <4 x i1> {{.}}, <4 x double> {{.}}, <4 x double> {{.*}}			// CHECK: select <4 x i1> {{.}}, <4 x double> {{.}}, <4 x double> {{.*}}
	return _mm256_maskz_cvtepi32_pd(__U,__A);			return _mm256_maskz_cvtepi32_pd(__U,__A);
	}			}
	__m128 test_mm_mask_cvtepi32_ps(__m128 __W, __mmask8 __U, __m128i __A) {			__m128 test_mm_mask_cvtepi32_ps(__m128 __W, __mmask8 __U, __m128i __A) {
	// CHECK-LABEL: @test_mm_mask_cvtepi32_ps			// CHECK-LABEL: @test_mm_mask_cvtepi32_ps
	// CHECK: @llvm.x86.sse2.cvtdq2ps			// CHECK: sitofp <4 x i32> %{{.*}} to <4 x float>
	// CHECK: select <4 x i1> {{.}}, <4 x float> {{.}}, <4 x float> {{.*}}			// CHECK: select <4 x i1> {{.}}, <4 x float> {{.}}, <4 x float> {{.*}}
	return _mm_mask_cvtepi32_ps(__W,__U,__A);			return _mm_mask_cvtepi32_ps(__W,__U,__A);
	}			}
	__m128 test_mm_maskz_cvtepi32_ps(__mmask16 __U, __m128i __A) {			__m128 test_mm_maskz_cvtepi32_ps(__mmask16 __U, __m128i __A) {
	// CHECK-LABEL: @test_mm_maskz_cvtepi32_ps			// CHECK-LABEL: @test_mm_maskz_cvtepi32_ps
	// CHECK: @llvm.x86.sse2.cvtdq2ps			// CHECK: sitofp <4 x i32> %{{.*}} to <4 x float>
	// CHECK: select <4 x i1> {{.}}, <4 x float> {{.}}, <4 x float> {{.*}}			// CHECK: select <4 x i1> {{.}}, <4 x float> {{.}}, <4 x float> {{.*}}
	return _mm_maskz_cvtepi32_ps(__U,__A);			return _mm_maskz_cvtepi32_ps(__U,__A);
	}			}
	__m256 test_mm256_mask_cvtepi32_ps(__m256 __W, __mmask8 __U, __m256i __A) {			__m256 test_mm256_mask_cvtepi32_ps(__m256 __W, __mmask8 __U, __m256i __A) {
	// CHECK-LABEL: @test_mm256_mask_cvtepi32_ps			// CHECK-LABEL: @test_mm256_mask_cvtepi32_ps
	// CHECK: @llvm.x86.avx.cvtdq2.ps.256			// CHECK: sitofp <8 x i32> %{{.*}} to <8 x float>
	// CHECK: select <8 x i1> {{.}}, <8 x float> {{.}}, <8 x float> {{.*}}			// CHECK: select <8 x i1> {{.}}, <8 x float> {{.}}, <8 x float> {{.*}}
	return _mm256_mask_cvtepi32_ps(__W,__U,__A);			return _mm256_mask_cvtepi32_ps(__W,__U,__A);
	}			}
	__m256 test_mm256_maskz_cvtepi32_ps(__mmask16 __U, __m256i __A) {			__m256 test_mm256_maskz_cvtepi32_ps(__mmask16 __U, __m256i __A) {
	// CHECK-LABEL: @test_mm256_maskz_cvtepi32_ps			// CHECK-LABEL: @test_mm256_maskz_cvtepi32_ps
	// CHECK: @llvm.x86.avx.cvtdq2.ps.256			// CHECK: sitofp <8 x i32> %{{.*}} to <8 x float>
	// CHECK: select <8 x i1> {{.}}, <8 x float> {{.}}, <8 x float> {{.*}}			// CHECK: select <8 x i1> {{.}}, <8 x float> {{.}}, <8 x float> {{.*}}
	return _mm256_maskz_cvtepi32_ps(__U,__A);			return _mm256_maskz_cvtepi32_ps(__U,__A);
	}			}
	__m128i test_mm_mask_cvtpd_epi32(__m128i __W, __mmask8 __U, __m128d __A) {			__m128i test_mm_mask_cvtpd_epi32(__m128i __W, __mmask8 __U, __m128d __A) {
	// CHECK-LABEL: @test_mm_mask_cvtpd_epi32			// CHECK-LABEL: @test_mm_mask_cvtpd_epi32
	// CHECK: @llvm.x86.avx512.mask.cvtpd2dq.128			// CHECK: @llvm.x86.avx512.mask.cvtpd2dq.128
	return _mm_mask_cvtpd_epi32(__W,__U,__A);			return _mm_mask_cvtpd_epi32(__W,__U,__A);
	}			}
	▲ Show 20 Lines • Show All 284 Lines • ▼ Show 20 Lines
	__m256d test_mm256_maskz_cvtepu32_pd(__mmask8 __U, __m128i __A) {			__m256d test_mm256_maskz_cvtepu32_pd(__mmask8 __U, __m128i __A) {
	// CHECK-LABEL: @test_mm256_maskz_cvtepu32_pd			// CHECK-LABEL: @test_mm256_maskz_cvtepu32_pd
	// CHECK: uitofp <4 x i32> %{{.*}} to <4 x double>			// CHECK: uitofp <4 x i32> %{{.*}} to <4 x double>
	// CHECK: select <4 x i1> {{.}}, <4 x double> {{.}}, <4 x double> {{.*}}			// CHECK: select <4 x i1> {{.}}, <4 x double> {{.}}, <4 x double> {{.*}}
	return _mm256_maskz_cvtepu32_pd(__U,__A);			return _mm256_maskz_cvtepu32_pd(__U,__A);
	}			}
	__m128 test_mm_cvtepu32_ps(__m128i __A) {			__m128 test_mm_cvtepu32_ps(__m128i __A) {
	// CHECK-LABEL: @test_mm_cvtepu32_ps			// CHECK-LABEL: @test_mm_cvtepu32_ps
	// CHECK: @llvm.x86.avx512.mask.cvtudq2ps.128			// CHECK: uitofp <4 x i32> %{{.*}} to <4 x float>
	return _mm_cvtepu32_ps(__A);			return _mm_cvtepu32_ps(__A);
	}			}
	__m128 test_mm_mask_cvtepu32_ps(__m128 __W, __mmask8 __U, __m128i __A) {			__m128 test_mm_mask_cvtepu32_ps(__m128 __W, __mmask8 __U, __m128i __A) {
	// CHECK-LABEL: @test_mm_mask_cvtepu32_ps			// CHECK-LABEL: @test_mm_mask_cvtepu32_ps
	// CHECK: @llvm.x86.avx512.mask.cvtudq2ps.128			// CHECK: uitofp <4 x i32> %{{.*}} to <4 x float>
				// CHECK: select <4 x i1> %{{.}}, <4 x float> %{{.}}, <4 x float> %{{.*}}
	return _mm_mask_cvtepu32_ps(__W,__U,__A);			return _mm_mask_cvtepu32_ps(__W,__U,__A);
	}			}
	__m128 test_mm_maskz_cvtepu32_ps(__mmask8 __U, __m128i __A) {			__m128 test_mm_maskz_cvtepu32_ps(__mmask8 __U, __m128i __A) {
	// CHECK-LABEL: @test_mm_maskz_cvtepu32_ps			// CHECK-LABEL: @test_mm_maskz_cvtepu32_ps
	// CHECK: @llvm.x86.avx512.mask.cvtudq2ps.128			// CHECK: uitofp <4 x i32> %{{.*}} to <4 x float>
				// CHECK: select <4 x i1> %{{.}}, <4 x float> %{{.}}, <4 x float> %{{.*}}
	return _mm_maskz_cvtepu32_ps(__U,__A);			return _mm_maskz_cvtepu32_ps(__U,__A);
	}			}
	__m256 test_mm256_cvtepu32_ps(__m256i __A) {			__m256 test_mm256_cvtepu32_ps(__m256i __A) {
	// CHECK-LABEL: @test_mm256_cvtepu32_ps			// CHECK-LABEL: @test_mm256_cvtepu32_ps
	// CHECK: @llvm.x86.avx512.mask.cvtudq2ps.256			// CHECK: uitofp <8 x i32> %{{.*}} to <8 x float>
	return _mm256_cvtepu32_ps(__A);			return _mm256_cvtepu32_ps(__A);
	}			}
	__m256 test_mm256_mask_cvtepu32_ps(__m256 __W, __mmask8 __U, __m256i __A) {			__m256 test_mm256_mask_cvtepu32_ps(__m256 __W, __mmask8 __U, __m256i __A) {
	// CHECK-LABEL: @test_mm256_mask_cvtepu32_ps			// CHECK-LABEL: @test_mm256_mask_cvtepu32_ps
	// CHECK: @llvm.x86.avx512.mask.cvtudq2ps.256			// CHECK: uitofp <8 x i32> %{{.*}} to <8 x float>
				// CHECK: select <8 x i1> %{{.}}, <8 x float> %{{.}}, <8 x float> %{{.*}}
	return _mm256_mask_cvtepu32_ps(__W,__U,__A);			return _mm256_mask_cvtepu32_ps(__W,__U,__A);
	}			}
	__m256 test_mm256_maskz_cvtepu32_ps(__mmask8 __U, __m256i __A) {			__m256 test_mm256_maskz_cvtepu32_ps(__mmask8 __U, __m256i __A) {
	// CHECK-LABEL: @test_mm256_maskz_cvtepu32_ps			// CHECK-LABEL: @test_mm256_maskz_cvtepu32_ps
	// CHECK: @llvm.x86.avx512.mask.cvtudq2ps.256			// CHECK: uitofp <8 x i32> %{{.*}} to <8 x float>
				// CHECK: select <8 x i1> %{{.}}, <8 x float> %{{.}}, <8 x float> %{{.*}}
	return _mm256_maskz_cvtepu32_ps(__U,__A);			return _mm256_maskz_cvtepu32_ps(__U,__A);
	}			}
	__m128d test_mm_mask_div_pd(__m128d __W, __mmask8 __U, __m128d __A, __m128d __B) {			__m128d test_mm_mask_div_pd(__m128d __W, __mmask8 __U, __m128d __A, __m128d __B) {
	// CHECK-LABEL: @test_mm_mask_div_pd			// CHECK-LABEL: @test_mm_mask_div_pd
	// CHECK: fdiv <2 x double> %{{.}}, %{{.}}			// CHECK: fdiv <2 x double> %{{.}}, %{{.}}
	// CHECK: select <2 x i1> %{{.}}, <2 x double> %{{.}}, <2 x double> %{{.*}}			// CHECK: select <2 x i1> %{{.}}, <2 x double> %{{.}}, <2 x double> %{{.*}}
	return _mm_mask_div_pd(__W,__U,__A,__B);			return _mm_mask_div_pd(__W,__U,__A,__B);
	}			}
	▲ Show 20 Lines • Show All 5,349 Lines • Show Last 20 Lines

test/CodeGen/avx512vldq-builtins.c

	Show First 20 Lines • Show All 415 Lines • ▼ Show 20 Lines
	__m256i test_mm256_maskz_cvtps_epu64(__mmask8 __U, __m128 __A) {			__m256i test_mm256_maskz_cvtps_epu64(__mmask8 __U, __m128 __A) {
	// CHECK-LABEL: @test_mm256_maskz_cvtps_epu64			// CHECK-LABEL: @test_mm256_maskz_cvtps_epu64
	// CHECK: @llvm.x86.avx512.mask.cvtps2uqq.256			// CHECK: @llvm.x86.avx512.mask.cvtps2uqq.256
	return _mm256_maskz_cvtps_epu64(__U, __A);			return _mm256_maskz_cvtps_epu64(__U, __A);
	}			}

	__m128d test_mm_cvtepi64_pd(__m128i __A) {			__m128d test_mm_cvtepi64_pd(__m128i __A) {
	// CHECK-LABEL: @test_mm_cvtepi64_pd			// CHECK-LABEL: @test_mm_cvtepi64_pd
	// CHECK: @llvm.x86.avx512.mask.cvtqq2pd.128			// CHECK: sitofp <2 x i64> %{{.*}} to <2 x double>
	return _mm_cvtepi64_pd(__A);			return _mm_cvtepi64_pd(__A);
	}			}

	__m128d test_mm_mask_cvtepi64_pd(__m128d __W, __mmask8 __U, __m128i __A) {			__m128d test_mm_mask_cvtepi64_pd(__m128d __W, __mmask8 __U, __m128i __A) {
	// CHECK-LABEL: @test_mm_mask_cvtepi64_pd			// CHECK-LABEL: @test_mm_mask_cvtepi64_pd
	// CHECK: @llvm.x86.avx512.mask.cvtqq2pd.128			// CHECK: sitofp <2 x i64> %{{.*}} to <2 x double>
				// CHECK: select <2 x i1> %{{.}}, <2 x double> %{{.}}, <2 x double> %{{.*}}
	return _mm_mask_cvtepi64_pd(__W, __U, __A);			return _mm_mask_cvtepi64_pd(__W, __U, __A);
	}			}

	__m128d test_mm_maskz_cvtepi64_pd(__mmask8 __U, __m128i __A) {			__m128d test_mm_maskz_cvtepi64_pd(__mmask8 __U, __m128i __A) {
	// CHECK-LABEL: @test_mm_maskz_cvtepi64_pd			// CHECK-LABEL: @test_mm_maskz_cvtepi64_pd
	// CHECK: @llvm.x86.avx512.mask.cvtqq2pd.128			// CHECK: sitofp <2 x i64> %{{.*}} to <2 x double>
				// CHECK: select <2 x i1> %{{.}}, <2 x double> %{{.}}, <2 x double> %{{.*}}
	return _mm_maskz_cvtepi64_pd(__U, __A);			return _mm_maskz_cvtepi64_pd(__U, __A);
	}			}

	__m256d test_mm256_cvtepi64_pd(__m256i __A) {			__m256d test_mm256_cvtepi64_pd(__m256i __A) {
	// CHECK-LABEL: @test_mm256_cvtepi64_pd			// CHECK-LABEL: @test_mm256_cvtepi64_pd
	// CHECK: @llvm.x86.avx512.mask.cvtqq2pd.256			// CHECK: sitofp <4 x i64> %{{.*}} to <4 x double>
	return _mm256_cvtepi64_pd(__A);			return _mm256_cvtepi64_pd(__A);
	}			}

	__m256d test_mm256_mask_cvtepi64_pd(__m256d __W, __mmask8 __U, __m256i __A) {			__m256d test_mm256_mask_cvtepi64_pd(__m256d __W, __mmask8 __U, __m256i __A) {
	// CHECK-LABEL: @test_mm256_mask_cvtepi64_pd			// CHECK-LABEL: @test_mm256_mask_cvtepi64_pd
	// CHECK: @llvm.x86.avx512.mask.cvtqq2pd.256			// CHECK: sitofp <4 x i64> %{{.*}} to <4 x double>
				// CHECK: select <4 x i1> %{{.}}, <4 x double> %{{.}}, <4 x double> %{{.*}}
	return _mm256_mask_cvtepi64_pd(__W, __U, __A);			return _mm256_mask_cvtepi64_pd(__W, __U, __A);
	}			}

	__m256d test_mm256_maskz_cvtepi64_pd(__mmask8 __U, __m256i __A) {			__m256d test_mm256_maskz_cvtepi64_pd(__mmask8 __U, __m256i __A) {
	// CHECK-LABEL: @test_mm256_maskz_cvtepi64_pd			// CHECK-LABEL: @test_mm256_maskz_cvtepi64_pd
	// CHECK: @llvm.x86.avx512.mask.cvtqq2pd.256			// CHECK: sitofp <4 x i64> %{{.*}} to <4 x double>
				// CHECK: select <4 x i1> %{{.}}, <4 x double> %{{.}}, <4 x double> %{{.*}}
	return _mm256_maskz_cvtepi64_pd(__U, __A);			return _mm256_maskz_cvtepi64_pd(__U, __A);
	}			}

	__m128 test_mm_cvtepi64_ps(__m128i __A) {			__m128 test_mm_cvtepi64_ps(__m128i __A) {
	// CHECK-LABEL: @test_mm_cvtepi64_ps			// CHECK-LABEL: @test_mm_cvtepi64_ps
	// CHECK: @llvm.x86.avx512.mask.cvtqq2ps.128			// CHECK: @llvm.x86.avx512.mask.cvtqq2ps.128
	return _mm_cvtepi64_ps(__A);			return _mm_cvtepi64_ps(__A);
	}			}
	▲ Show 20 Lines • Show All 169 Lines • ▼ Show 20 Lines
	__m256i test_mm256_maskz_cvttps_epu64(__mmask8 __U, __m128 __A) {			__m256i test_mm256_maskz_cvttps_epu64(__mmask8 __U, __m128 __A) {
	// CHECK-LABEL: @test_mm256_maskz_cvttps_epu64			// CHECK-LABEL: @test_mm256_maskz_cvttps_epu64
	// CHECK: @llvm.x86.avx512.mask.cvttps2uqq.256			// CHECK: @llvm.x86.avx512.mask.cvttps2uqq.256
	return _mm256_maskz_cvttps_epu64(__U, __A);			return _mm256_maskz_cvttps_epu64(__U, __A);
	}			}

	__m128d test_mm_cvtepu64_pd(__m128i __A) {			__m128d test_mm_cvtepu64_pd(__m128i __A) {
	// CHECK-LABEL: @test_mm_cvtepu64_pd			// CHECK-LABEL: @test_mm_cvtepu64_pd
	// CHECK: @llvm.x86.avx512.mask.cvtuqq2pd.128			// CHECK: uitofp <2 x i64> %{{.*}} to <2 x double>
	return _mm_cvtepu64_pd(__A);			return _mm_cvtepu64_pd(__A);
	}			}

	__m128d test_mm_mask_cvtepu64_pd(__m128d __W, __mmask8 __U, __m128i __A) {			__m128d test_mm_mask_cvtepu64_pd(__m128d __W, __mmask8 __U, __m128i __A) {
	// CHECK-LABEL: @test_mm_mask_cvtepu64_pd			// CHECK-LABEL: @test_mm_mask_cvtepu64_pd
	// CHECK: @llvm.x86.avx512.mask.cvtuqq2pd.128			// CHECK: uitofp <2 x i64> %{{.*}} to <2 x double>
				// CHECK: select <2 x i1> %{{.}}, <2 x double> %{{.}}, <2 x double> %{{.*}}
	return _mm_mask_cvtepu64_pd(__W, __U, __A);			return _mm_mask_cvtepu64_pd(__W, __U, __A);
	}			}

	__m128d test_mm_maskz_cvtepu64_pd(__mmask8 __U, __m128i __A) {			__m128d test_mm_maskz_cvtepu64_pd(__mmask8 __U, __m128i __A) {
	// CHECK-LABEL: @test_mm_maskz_cvtepu64_pd			// CHECK-LABEL: @test_mm_maskz_cvtepu64_pd
	// CHECK: @llvm.x86.avx512.mask.cvtuqq2pd.128			// CHECK: uitofp <2 x i64> %{{.*}} to <2 x double>
				// CHECK: select <2 x i1> %{{.}}, <2 x double> %{{.}}, <2 x double> %{{.*}}
	return _mm_maskz_cvtepu64_pd(__U, __A);			return _mm_maskz_cvtepu64_pd(__U, __A);
	}			}

	__m256d test_mm256_cvtepu64_pd(__m256i __A) {			__m256d test_mm256_cvtepu64_pd(__m256i __A) {
	// CHECK-LABEL: @test_mm256_cvtepu64_pd			// CHECK-LABEL: @test_mm256_cvtepu64_pd
	// CHECK: @llvm.x86.avx512.mask.cvtuqq2pd.256			// CHECK: uitofp <4 x i64> %{{.*}} to <4 x double>
	return _mm256_cvtepu64_pd(__A);			return _mm256_cvtepu64_pd(__A);
	}			}

	__m256d test_mm256_mask_cvtepu64_pd(__m256d __W, __mmask8 __U, __m256i __A) {			__m256d test_mm256_mask_cvtepu64_pd(__m256d __W, __mmask8 __U, __m256i __A) {
	// CHECK-LABEL: @test_mm256_mask_cvtepu64_pd			// CHECK-LABEL: @test_mm256_mask_cvtepu64_pd
	// CHECK: @llvm.x86.avx512.mask.cvtuqq2pd.256			// CHECK: uitofp <4 x i64> %{{.*}} to <4 x double>
				// CHECK: select <4 x i1> %{{.}}, <4 x double> %{{.}}, <4 x double> %{{.*}}
	return _mm256_mask_cvtepu64_pd(__W, __U, __A);			return _mm256_mask_cvtepu64_pd(__W, __U, __A);
	}			}

	__m256d test_mm256_maskz_cvtepu64_pd(__mmask8 __U, __m256i __A) {			__m256d test_mm256_maskz_cvtepu64_pd(__mmask8 __U, __m256i __A) {
	// CHECK-LABEL: @test_mm256_maskz_cvtepu64_pd			// CHECK-LABEL: @test_mm256_maskz_cvtepu64_pd
	// CHECK: @llvm.x86.avx512.mask.cvtuqq2pd.256			// CHECK: uitofp <4 x i64> %{{.*}} to <4 x double>
				// CHECK: select <4 x i1> %{{.}}, <4 x double> %{{.}}, <4 x double> %{{.*}}
	return _mm256_maskz_cvtepu64_pd(__U, __A);			return _mm256_maskz_cvtepu64_pd(__U, __A);
	}			}

	__m128 test_mm_cvtepu64_ps(__m128i __A) {			__m128 test_mm_cvtepu64_ps(__m128i __A) {
	// CHECK-LABEL: @test_mm_cvtepu64_ps			// CHECK-LABEL: @test_mm_cvtepu64_ps
	// CHECK: @llvm.x86.avx512.mask.cvtuqq2ps.128			// CHECK: @llvm.x86.avx512.mask.cvtuqq2ps.128
	return _mm_cvtepu64_ps(__A);			return _mm_cvtepu64_ps(__A);
	}			}
	▲ Show 20 Lines • Show All 465 Lines • Show Last 20 Lines

test/CodeGen/builtins-x86.c

Show First 20 Lines • Show All 332 Lines • ▼ Show 20 Lines	#endif
tmp_i = __builtin_ia32_pmovmskb128(tmp_V16c);		tmp_i = __builtin_ia32_pmovmskb128(tmp_V16c);
(void) __builtin_ia32_movnti(tmp_ip, tmp_i);		(void) __builtin_ia32_movnti(tmp_ip, tmp_i);
#ifdef USE_64		#ifdef USE_64
(void) __builtin_ia32_movnti64(tmp_LLip, tmp_LLi);		(void) __builtin_ia32_movnti64(tmp_LLip, tmp_LLi);
#endif		#endif
tmp_V2LLi = __builtin_ia32_psadbw128(tmp_V16c, tmp_V16c);		tmp_V2LLi = __builtin_ia32_psadbw128(tmp_V16c, tmp_V16c);
tmp_V2d = __builtin_ia32_sqrtpd(tmp_V2d);		tmp_V2d = __builtin_ia32_sqrtpd(tmp_V2d);
tmp_V2d = __builtin_ia32_sqrtsd(tmp_V2d);		tmp_V2d = __builtin_ia32_sqrtsd(tmp_V2d);
tmp_V4f = __builtin_ia32_cvtdq2ps(tmp_V4i);
tmp_V2LLi = __builtin_ia32_cvtpd2dq(tmp_V2d);		tmp_V2LLi = __builtin_ia32_cvtpd2dq(tmp_V2d);
tmp_V2i = __builtin_ia32_cvtpd2pi(tmp_V2d);		tmp_V2i = __builtin_ia32_cvtpd2pi(tmp_V2d);
tmp_V4f = __builtin_ia32_cvtpd2ps(tmp_V2d);		tmp_V4f = __builtin_ia32_cvtpd2ps(tmp_V2d);
tmp_V4i = __builtin_ia32_cvttpd2dq(tmp_V2d);		tmp_V4i = __builtin_ia32_cvttpd2dq(tmp_V2d);
tmp_V2i = __builtin_ia32_cvttpd2pi(tmp_V2d);		tmp_V2i = __builtin_ia32_cvttpd2pi(tmp_V2d);
tmp_V2d = __builtin_ia32_cvtpi2pd(tmp_V2i);		tmp_V2d = __builtin_ia32_cvtpi2pd(tmp_V2i);
tmp_i = __builtin_ia32_cvtsd2si(tmp_V2d);		tmp_i = __builtin_ia32_cvtsd2si(tmp_V2d);
tmp_i = __builtin_ia32_cvttsd2si(tmp_V2d);		tmp_i = __builtin_ia32_cvttsd2si(tmp_V2d);
▲ Show 20 Lines • Show All 169 Lines • Show Last 20 Lines

test/CodeGen/sse2-builtins.c

Show First 20 Lines • Show All 462 Lines • ▼ Show 20 Lines	__m128d test_mm_cvtepi32_pd(__m128i A) {
// CHECK-LABEL: test_mm_cvtepi32_pd		// CHECK-LABEL: test_mm_cvtepi32_pd
// CHECK: shufflevector <4 x i32> %{{.}}, <4 x i32> %{{.}}, <2 x i32> <i32 0, i32 1>		// CHECK: shufflevector <4 x i32> %{{.}}, <4 x i32> %{{.}}, <2 x i32> <i32 0, i32 1>
// CHECK: sitofp <2 x i32> %{{.*}} to <2 x double>		// CHECK: sitofp <2 x i32> %{{.*}} to <2 x double>
return _mm_cvtepi32_pd(A);		return _mm_cvtepi32_pd(A);
}		}

__m128 test_mm_cvtepi32_ps(__m128i A) {		__m128 test_mm_cvtepi32_ps(__m128i A) {
// CHECK-LABEL: test_mm_cvtepi32_ps		// CHECK-LABEL: test_mm_cvtepi32_ps
// CHECK: call <4 x float> @llvm.x86.sse2.cvtdq2ps(<4 x i32> %{{.*}})		// CHECK: sitofp <4 x i32> %{{.*}} to <4 x float>
return _mm_cvtepi32_ps(A);		return _mm_cvtepi32_ps(A);
}		}

__m128i test_mm_cvtpd_epi32(__m128d A) {		__m128i test_mm_cvtpd_epi32(__m128d A) {
// CHECK-LABEL: test_mm_cvtpd_epi32		// CHECK-LABEL: test_mm_cvtpd_epi32
// CHECK: call <4 x i32> @llvm.x86.sse2.cvtpd2dq(<2 x double> %{{.*}})		// CHECK: call <4 x i32> @llvm.x86.sse2.cvtpd2dq(<2 x double> %{{.*}})
return _mm_cvtpd_epi32(A);		return _mm_cvtpd_epi32(A);
}		}
▲ Show 20 Lines • Show All 1,080 Lines • Show Last 20 Lines

This is an archive of the discontinued LLVM Phabricator instance.

[X86] Use __builtin_convertvector to implement some of the packed integer to packed float conversion intrinsics.ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 147853

include/clang/Basic/BuiltinsX86.def

lib/Headers/avx512dqintrin.h

lib/Headers/avx512fintrin.h

lib/Headers/avx512vldqintrin.h

lib/Headers/avx512vlintrin.h

lib/Headers/avxintrin.h

lib/Headers/emmintrin.h

test/CodeGen/avx-builtins.c

test/CodeGen/avx512dq-builtins.c

test/CodeGen/avx512f-builtins.c

test/CodeGen/avx512vl-builtins.c

test/CodeGen/avx512vldq-builtins.c

test/CodeGen/builtins-x86.c

test/CodeGen/sse2-builtins.c

[X86] Use __builtin_convertvector to implement some of the packed integer to packed float conversion intrinsics.
ClosedPublic