Index: cfe/trunk/include/clang/Basic/BuiltinsX86.def =================================================================== --- cfe/trunk/include/clang/Basic/BuiltinsX86.def +++ cfe/trunk/include/clang/Basic/BuiltinsX86.def @@ -1469,7 +1469,6 @@ TARGET_BUILTIN(__builtin_ia32_vpermt2varq128_maskz, "V2LLiV2LLiV2LLiV2LLiUc", "", "avx512vl") TARGET_BUILTIN(__builtin_ia32_vpermt2varq256_mask, "V4LLiV4LLiV4LLiV4LLiUc", "", "avx512vl") TARGET_BUILTIN(__builtin_ia32_vpermt2varq256_maskz, "V4LLiV4LLiV4LLiV4LLiUc", "", "avx512vl") - TARGET_BUILTIN(__builtin_ia32_pmovswb512_mask, "V32cV32sV32cUi", "", "avx512bw") TARGET_BUILTIN(__builtin_ia32_pmovuswb512_mask, "V32cV32sV32cUi", "", "avx512bw") TARGET_BUILTIN(__builtin_ia32_pmovwb512_mask, "V32cV32sV32cUi", "", "avx512bw") @@ -1477,7 +1476,6 @@ TARGET_BUILTIN(__builtin_ia32_punpckhwd512_mask, "V32sV32sV32sV32sUi", "", "avx512bw") TARGET_BUILTIN(__builtin_ia32_punpcklbw512_mask, "V64cV64cV64cV64cULLi", "", "avx512bw") TARGET_BUILTIN(__builtin_ia32_punpcklwd512_mask, "V32sV32sV32sV32sUi", "", "avx512bw") - TARGET_BUILTIN(__builtin_ia32_cvtpd2qq128_mask, "V2LLiV2dV2LLiUc", "", "avx512vl,avx512dq") TARGET_BUILTIN(__builtin_ia32_cvtpd2qq256_mask, "V4LLiV4dV4LLiUc", "", "avx512vl,avx512dq") TARGET_BUILTIN(__builtin_ia32_cvtpd2uqq128_mask, "V2LLiV2dV2LLiUc", "", "avx512vl,avx512dq") @@ -1510,7 +1508,6 @@ TARGET_BUILTIN(__builtin_ia32_reducepd256_mask, "V4dV4dIiV4dUc", "", "avx512vl,avx512dq") TARGET_BUILTIN(__builtin_ia32_reduceps128_mask, "V4fV4fIiV4fUc", "", "avx512vl,avx512dq") TARGET_BUILTIN(__builtin_ia32_reduceps256_mask, "V8fV8fIiV8fUc", "", "avx512vl,avx512dq") - TARGET_BUILTIN(__builtin_ia32_pmaddubsw128_mask, "V8sV16cV16cV8sUc", "", "avx512vl,avx512bw") TARGET_BUILTIN(__builtin_ia32_pmaddubsw256_mask, "V16sV32cV32cV16sUs", "", "avx512vl,avx512bw") TARGET_BUILTIN(__builtin_ia32_pmaddwd128_mask, "V4iV8sV8sV4iUc", "", "avx512vl,avx512bw") @@ -1535,6 +1532,22 @@ TARGET_BUILTIN(__builtin_ia32_punpcklbw256_mask, "V32cV32cV32cV32cUi", "", "avx512vl,avx512bw") TARGET_BUILTIN(__builtin_ia32_punpcklwd128_mask, "V8sV8sV8sV8sUc", "", "avx512vl,avx512bw") TARGET_BUILTIN(__builtin_ia32_punpcklwd256_mask, "V16sV16sV16sV16sUs", "", "avx512vl,avx512bw") +BUILTIN(__builtin_ia32_cvtpd2qq512_mask, "V8LLiV8dV8LLiUcIi", "") +BUILTIN(__builtin_ia32_cvtpd2uqq512_mask, "V8LLiV8dV8LLiUcIi", "") +BUILTIN(__builtin_ia32_cvtps2qq512_mask, "V8LLiV8fV8LLiUcIi", "") +BUILTIN(__builtin_ia32_cvtps2uqq512_mask, "V8LLiV8fV8LLiUcIi", "") +BUILTIN(__builtin_ia32_cvtqq2pd512_mask, "V8dV8LLiV8dUcIi", "") +BUILTIN(__builtin_ia32_cvtqq2ps512_mask, "V8fV8LLiV8fUcIi", "") +BUILTIN(__builtin_ia32_cvttpd2qq512_mask, "V8LLiV8dV8LLiUcIi", "") +BUILTIN(__builtin_ia32_cvttpd2uqq512_mask, "V8LLiV8dV8LLiUcIi", "") +BUILTIN(__builtin_ia32_cvttps2qq512_mask, "V8LLiV8fV8LLiUcIi", "") +BUILTIN(__builtin_ia32_cvttps2uqq512_mask, "V8LLiV8fV8LLiUcIi", "") +BUILTIN(__builtin_ia32_cvtuqq2pd512_mask, "V8dV8LLiV8dUcIi", "") +BUILTIN(__builtin_ia32_cvtuqq2ps512_mask, "V8fV8LLiV8fUcIi", "") +BUILTIN(__builtin_ia32_rangepd512_mask, "V8dV8dV8dIiV8dUcIi", "") +BUILTIN(__builtin_ia32_rangeps512_mask, "V16fV16fV16fIiV16fUsIi", "") +BUILTIN(__builtin_ia32_reducepd512_mask, "V8dV8dIiV8dUcIi", "") +BUILTIN(__builtin_ia32_reduceps512_mask, "V16fV16fIiV16fUsIi", "") #undef BUILTIN #undef TARGET_BUILTIN Index: cfe/trunk/lib/Headers/avx512dqintrin.h =================================================================== --- cfe/trunk/lib/Headers/avx512dqintrin.h +++ cfe/trunk/lib/Headers/avx512dqintrin.h @@ -237,6 +237,542 @@ (__mmask16) __U); } +static __inline__ __m512i __DEFAULT_FN_ATTRS +_mm512_cvtpd_epi64 (__m512d __A) { + return (__m512i) __builtin_ia32_cvtpd2qq512_mask ((__v8df) __A, + (__v8di) _mm512_setzero_si512(), + (__mmask8) -1, + _MM_FROUND_CUR_DIRECTION); +} + +static __inline__ __m512i __DEFAULT_FN_ATTRS +_mm512_mask_cvtpd_epi64 (__m512i __W, __mmask8 __U, __m512d __A) { + return (__m512i) __builtin_ia32_cvtpd2qq512_mask ((__v8df) __A, + (__v8di) __W, + (__mmask8) __U, + _MM_FROUND_CUR_DIRECTION); +} + +static __inline__ __m512i __DEFAULT_FN_ATTRS +_mm512_maskz_cvtpd_epi64 (__mmask8 __U, __m512d __A) { + return (__m512i) __builtin_ia32_cvtpd2qq512_mask ((__v8df) __A, + (__v8di) _mm512_setzero_si512(), + (__mmask8) __U, + _MM_FROUND_CUR_DIRECTION); +} + +#define _mm512_cvt_roundpd_epi64(__A, __R) __extension__ ({ \ + (__m512i) __builtin_ia32_cvtpd2qq512_mask ((__v8df) __A, \ + (__v8di) _mm512_setzero_si512(), (__mmask8) -1, __R);}) + +#define _mm512_mask_cvt_roundpd_epi64(__W, __U, __A, __R) __extension__ ({ \ + (__m512i) __builtin_ia32_cvtpd2qq512_mask ((__v8df) __A, \ + (__v8di) __W, (__mmask8) __U, __R);}) + +#define _mm512_maskz_cvt_roundpd_epi64(__U, __A, __R) __extension__ ({ \ + (__m512i) __builtin_ia32_cvtpd2qq512_mask ((__v8df) __A, \ + (__v8di) _mm512_setzero_si512(), (__mmask8) __U, __R); }) + +static __inline__ __m512i __DEFAULT_FN_ATTRS +_mm512_cvtpd_epu64 (__m512d __A) { + return (__m512i) __builtin_ia32_cvtpd2uqq512_mask ((__v8df) __A, + (__v8di) _mm512_setzero_si512(), + (__mmask8) -1, + _MM_FROUND_CUR_DIRECTION); +} + +static __inline__ __m512i __DEFAULT_FN_ATTRS +_mm512_mask_cvtpd_epu64 (__m512i __W, __mmask8 __U, __m512d __A) { + return (__m512i) __builtin_ia32_cvtpd2uqq512_mask ((__v8df) __A, + (__v8di) __W, + (__mmask8) __U, + _MM_FROUND_CUR_DIRECTION); +} + +static __inline__ __m512i __DEFAULT_FN_ATTRS +_mm512_maskz_cvtpd_epu64 (__mmask8 __U, __m512d __A) { + return (__m512i) __builtin_ia32_cvtpd2uqq512_mask ((__v8df) __A, + (__v8di) _mm512_setzero_si512(), + (__mmask8) __U, + _MM_FROUND_CUR_DIRECTION); +} + +#define _mm512_cvt_roundpd_epu64(__A, __R) __extension__ ({ \ + (__m512i) __builtin_ia32_cvtpd2uqq512_mask ((__v8df) __A, \ + (__v8di) _mm512_setzero_si512(), (__mmask8) -1, __R);}) + +#define _mm512_mask_cvt_roundpd_epu64(__W, __U, __A, __R) __extension__ ({ \ + (__m512i) __builtin_ia32_cvtpd2uqq512_mask ((__v8df) __A, \ + (__v8di) __W, (__mmask8) __U, __R);}) + +#define _mm512_maskz_cvt_roundpd_epu64(__U, __A, __R) __extension__ ({ \ + (__m512i) __builtin_ia32_cvtpd2uqq512_mask ((__v8df) __A, \ + (__v8di) _mm512_setzero_si512(), (__mmask8) __U, __R);}) + +static __inline__ __m512i __DEFAULT_FN_ATTRS +_mm512_cvtps_epi64 (__m256 __A) { + return (__m512i) __builtin_ia32_cvtps2qq512_mask ((__v8sf) __A, + (__v8di) _mm512_setzero_si512(), + (__mmask8) -1, + _MM_FROUND_CUR_DIRECTION); +} + +static __inline__ __m512i __DEFAULT_FN_ATTRS +_mm512_mask_cvtps_epi64 (__m512i __W, __mmask8 __U, __m256 __A) { + return (__m512i) __builtin_ia32_cvtps2qq512_mask ((__v8sf) __A, + (__v8di) __W, + (__mmask8) __U, + _MM_FROUND_CUR_DIRECTION); +} + +static __inline__ __m512i __DEFAULT_FN_ATTRS +_mm512_maskz_cvtps_epi64 (__mmask8 __U, __m256 __A) { + return (__m512i) __builtin_ia32_cvtps2qq512_mask ((__v8sf) __A, + (__v8di) _mm512_setzero_si512(), + (__mmask8) __U, + _MM_FROUND_CUR_DIRECTION); +} + +#define _mm512_cvt_roundps_epi64(__A, __R) __extension__ ({ \ + (__m512i) __builtin_ia32_cvtps2qq512_mask ((__v8sf) __A, \ + (__v8di) _mm512_setzero_si512(), (__mmask8) -1, __R);}) + +#define _mm512_mask_cvt_roundps_epi64(__W, __U, __A, __R) __extension__ ({ \ + (__m512i) __builtin_ia32_cvtps2qq512_mask ((__v8sf) __A, \ + (__v8di) __W, (__mmask8) __U, __R);}) + +#define _mm512_maskz_cvt_roundps_epi64(__U, __A, __R) __extension__ ({ \ + (__m512i) __builtin_ia32_cvtps2qq512_mask ((__v8sf) __A, \ + (__v8di) _mm512_setzero_si512(), (__mmask8) __U, __R);}) + +static __inline__ __m512i __DEFAULT_FN_ATTRS +_mm512_cvtps_epu64 (__m256 __A) { + return (__m512i) __builtin_ia32_cvtps2uqq512_mask ((__v8sf) __A, + (__v8di) _mm512_setzero_si512(), + (__mmask8) -1, + _MM_FROUND_CUR_DIRECTION); +} + +static __inline__ __m512i __DEFAULT_FN_ATTRS +_mm512_mask_cvtps_epu64 (__m512i __W, __mmask8 __U, __m256 __A) { + return (__m512i) __builtin_ia32_cvtps2uqq512_mask ((__v8sf) __A, + (__v8di) __W, + (__mmask8) __U, + _MM_FROUND_CUR_DIRECTION); +} + +static __inline__ __m512i __DEFAULT_FN_ATTRS +_mm512_maskz_cvtps_epu64 (__mmask8 __U, __m256 __A) { + return (__m512i) __builtin_ia32_cvtps2uqq512_mask ((__v8sf) __A, + (__v8di) _mm512_setzero_si512(), + (__mmask8) __U, + _MM_FROUND_CUR_DIRECTION); +} + +#define _mm512_cvt_roundps_epu64(__A, __R) __extension__ ({ \ + (__m512i) __builtin_ia32_cvtps2uqq512_mask ((__v8sf) __A, \ + (__v8di) _mm512_setzero_si512(), (__mmask8) -1, __R);}) + +#define _mm512_mask_cvt_roundps_epu64(__W, __U, __A, __R) __extension__ ({ \ + (__m512i) __builtin_ia32_cvtps2uqq512_mask ((__v8sf) __A, \ + (__v8di) __W, (__mmask8) __U, __R);}) + +#define _mm512_maskz_cvt_roundps_epu64(__U, __A, __R) __extension__ ({ \ + (__m512i) __builtin_ia32_cvtps2uqq512_mask ((__v8sf) __A, \ + (__v8di) _mm512_setzero_si512(), (__mmask8) __U, __R);}) + + +static __inline__ __m512d __DEFAULT_FN_ATTRS +_mm512_cvtepi64_pd (__m512i __A) { + return (__m512d) __builtin_ia32_cvtqq2pd512_mask ((__v8di) __A, + (__v8df) _mm512_setzero_pd(), + (__mmask8) -1, + _MM_FROUND_CUR_DIRECTION); +} + +static __inline__ __m512d __DEFAULT_FN_ATTRS +_mm512_mask_cvtepi64_pd (__m512d __W, __mmask8 __U, __m512i __A) { + return (__m512d) __builtin_ia32_cvtqq2pd512_mask ((__v8di) __A, + (__v8df) __W, + (__mmask8) __U, + _MM_FROUND_CUR_DIRECTION); +} + +static __inline__ __m512d __DEFAULT_FN_ATTRS +_mm512_maskz_cvtepi64_pd (__mmask8 __U, __m512i __A) { + return (__m512d) __builtin_ia32_cvtqq2pd512_mask ((__v8di) __A, + (__v8df) _mm512_setzero_pd(), + (__mmask8) __U, + _MM_FROUND_CUR_DIRECTION); +} + +#define _mm512_cvt_roundepi64_pd(__A, __R) __extension__ ({ \ + (__m512d) __builtin_ia32_cvtqq2pd512_mask ((__v8di) __A, \ + (__v8df) _mm512_setzero_pd(), (__mmask8) -1, __R);}) + +#define _mm512_mask_cvt_roundepi64_pd(__W, __U, __A, __R) __extension__ ({ \ + (__m512d) __builtin_ia32_cvtqq2pd512_mask ((__v8di) __A, \ + (__v8df) __W, (__mmask8) __U, __R);}) + +#define _mm512_maskz_cvt_roundepi64_pd(__U, __A, __R) __extension__ ({ \ + (__m512d) __builtin_ia32_cvtqq2pd512_mask ((__v8di) __A, \ + (__v8df) _mm512_setzero_pd(), (__mmask8) __U, __R);}) + +static __inline__ __m256 __DEFAULT_FN_ATTRS +_mm512_cvtepi64_ps (__m512i __A) { + return (__m256) __builtin_ia32_cvtqq2ps512_mask ((__v8di) __A, + (__v8sf) _mm256_setzero_ps(), + (__mmask8) -1, + _MM_FROUND_CUR_DIRECTION); +} + +static __inline__ __m256 __DEFAULT_FN_ATTRS +_mm512_mask_cvtepi64_ps (__m256 __W, __mmask8 __U, __m512i __A) { + return (__m256) __builtin_ia32_cvtqq2ps512_mask ((__v8di) __A, + (__v8sf) __W, + (__mmask8) __U, + _MM_FROUND_CUR_DIRECTION); +} + +static __inline__ __m256 __DEFAULT_FN_ATTRS +_mm512_maskz_cvtepi64_ps (__mmask8 __U, __m512i __A) { + return (__m256) __builtin_ia32_cvtqq2ps512_mask ((__v8di) __A, + (__v8sf) _mm256_setzero_ps(), + (__mmask8) __U, + _MM_FROUND_CUR_DIRECTION); +} + +#define _mm512_cvt_roundepi64_ps(__A, __R) __extension__ ({ \ + (__m256) __builtin_ia32_cvtqq2ps512_mask ((__v8di) __A, \ + (__v8sf) _mm256_setzero_ps(), (__mmask8) -1, __R);}) + +#define _mm512_mask_cvt_roundepi64_ps(__W, __U, __A, __R) __extension__ ({ \ + (__m256) __builtin_ia32_cvtqq2ps512_mask ((__v8di) __A, \ + (__v8sf) __W, (__mmask8) __U, __R);}) + +#define _mm512_maskz_cvt_roundepi64_ps(__U, __A, __R) __extension__ ({ \ + (__m256) __builtin_ia32_cvtqq2ps512_mask ((__v8di) __A, \ + (__v8sf) _mm256_setzero_ps(), (__mmask8) __U, __R);}) + + +static __inline__ __m512i __DEFAULT_FN_ATTRS +_mm512_cvttpd_epi64 (__m512d __A) { + return (__m512i) __builtin_ia32_cvttpd2qq512_mask ((__v8df) __A, + (__v8di) _mm512_setzero_si512(), + (__mmask8) -1, + _MM_FROUND_CUR_DIRECTION); +} + +static __inline__ __m512i __DEFAULT_FN_ATTRS +_mm512_mask_cvttpd_epi64 (__m512i __W, __mmask8 __U, __m512d __A) { + return (__m512i) __builtin_ia32_cvttpd2qq512_mask ((__v8df) __A, + (__v8di) __W, + (__mmask8) __U, + _MM_FROUND_CUR_DIRECTION); +} + +static __inline__ __m512i __DEFAULT_FN_ATTRS +_mm512_maskz_cvttpd_epi64 (__mmask8 __U, __m512d __A) { + return (__m512i) __builtin_ia32_cvttpd2qq512_mask ((__v8df) __A, + (__v8di) _mm512_setzero_si512(), + (__mmask8) __U, + _MM_FROUND_CUR_DIRECTION); +} + +#define _mm512_cvtt_roundpd_epi64(__A, __R) __extension__ ({ \ + (__m512i) __builtin_ia32_cvttpd2qq512_mask ((__v8df) __A, \ + (__v8di) _mm512_setzero_si512(), (__mmask8) -1, __R);}) + +#define _mm512_mask_cvtt_roundpd_epi64(__W, __U, __A, __R) __extension__ ({ \ + (__m512i) __builtin_ia32_cvttpd2qq512_mask ((__v8df) __A, \ + (__v8di) __W, (__mmask8) __U, __R);}) + +#define _mm512_maskz_cvtt_roundpd_epi64(__U, __A, __R) __extension__ ({ \ + (__m512i) __builtin_ia32_cvttpd2qq512_mask ((__v8df) __A, \ + (__v8di) _mm512_setzero_si512(), (__mmask8) __U, __R);}) + +static __inline__ __m512i __DEFAULT_FN_ATTRS +_mm512_cvttpd_epu64 (__m512d __A) { + return (__m512i) __builtin_ia32_cvttpd2uqq512_mask ((__v8df) __A, + (__v8di) _mm512_setzero_si512(), + (__mmask8) -1, + _MM_FROUND_CUR_DIRECTION); +} + +static __inline__ __m512i __DEFAULT_FN_ATTRS +_mm512_mask_cvttpd_epu64 (__m512i __W, __mmask8 __U, __m512d __A) { + return (__m512i) __builtin_ia32_cvttpd2uqq512_mask ((__v8df) __A, + (__v8di) __W, + (__mmask8) __U, + _MM_FROUND_CUR_DIRECTION); +} + +static __inline__ __m512i __DEFAULT_FN_ATTRS +_mm512_maskz_cvttpd_epu64 (__mmask8 __U, __m512d __A) { + return (__m512i) __builtin_ia32_cvttpd2uqq512_mask ((__v8df) __A, + (__v8di) _mm512_setzero_si512(), + (__mmask8) __U, + _MM_FROUND_CUR_DIRECTION); +} + +#define _mm512_cvtt_roundpd_epu64(__A, __R) __extension__ ({ \ + (__m512i) __builtin_ia32_cvttpd2uqq512_mask ((__v8df) __A, \ + (__v8di) _mm512_setzero_si512(), (__mmask8) -1, __R);}) + +#define _mm512_mask_cvtt_roundpd_epu64(__W, __U, __A, __R) __extension__ ({ \ + (__m512i) __builtin_ia32_cvttpd2uqq512_mask ((__v8df) __A, \ + (__v8di) __W, (__mmask8) __U, __R);}) + +#define _mm512_maskz_cvtt_roundpd_epu64(__U, __A, __R) __extension__ ({ \ + (__m512i) __builtin_ia32_cvttpd2uqq512_mask ((__v8df) __A, \ + (__v8di) _mm512_setzero_si512(), (__mmask8) __U, __R);}) + +static __inline__ __m512i __DEFAULT_FN_ATTRS +_mm512_cvttps_epi64 (__m256 __A) { + return (__m512i) __builtin_ia32_cvttps2qq512_mask ((__v8sf) __A, + (__v8di) _mm512_setzero_si512(), + (__mmask8) -1, + _MM_FROUND_CUR_DIRECTION); +} + +static __inline__ __m512i __DEFAULT_FN_ATTRS +_mm512_mask_cvttps_epi64 (__m512i __W, __mmask8 __U, __m256 __A) { + return (__m512i) __builtin_ia32_cvttps2qq512_mask ((__v8sf) __A, + (__v8di) __W, + (__mmask8) __U, + _MM_FROUND_CUR_DIRECTION); +} + +static __inline__ __m512i __DEFAULT_FN_ATTRS +_mm512_maskz_cvttps_epi64 (__mmask8 __U, __m256 __A) { + return (__m512i) __builtin_ia32_cvttps2qq512_mask ((__v8sf) __A, + (__v8di) _mm512_setzero_si512(), + (__mmask8) __U, + _MM_FROUND_CUR_DIRECTION); +} + +#define _mm512_cvtt_roundps_epi64(__A, __R) __extension__ ({ \ + (__m512i) __builtin_ia32_cvttps2qq512_mask ((__v8sf) __A, \ + (__v8di) _mm512_setzero_si512(), (__mmask8) -1, __R);}) + +#define _mm512_mask_cvtt_roundps_epi64(__W, __U, __A, __R) __extension__ ({ \ + (__m512i) __builtin_ia32_cvttps2qq512_mask ((__v8sf) __A, \ + (__v8di) __W, (__mmask8) __U, __R);}) + +#define _mm512_maskz_cvtt_roundps_epi64(__U, __A, __R) __extension__ ({ \ + (__m512i) __builtin_ia32_cvttps2qq512_mask ((__v8sf) __A, \ + (__v8di) _mm512_setzero_si512(), (__mmask8) __U, __R);}) + +static __inline__ __m512i __DEFAULT_FN_ATTRS +_mm512_cvttps_epu64 (__m256 __A) { + return (__m512i) __builtin_ia32_cvttps2uqq512_mask ((__v8sf) __A, + (__v8di) _mm512_setzero_si512(), + (__mmask8) -1, + _MM_FROUND_CUR_DIRECTION); +} + +static __inline__ __m512i __DEFAULT_FN_ATTRS +_mm512_mask_cvttps_epu64 (__m512i __W, __mmask8 __U, __m256 __A) { + return (__m512i) __builtin_ia32_cvttps2uqq512_mask ((__v8sf) __A, + (__v8di) __W, + (__mmask8) __U, + _MM_FROUND_CUR_DIRECTION); +} + +static __inline__ __m512i __DEFAULT_FN_ATTRS +_mm512_maskz_cvttps_epu64 (__mmask8 __U, __m256 __A) { + return (__m512i) __builtin_ia32_cvttps2uqq512_mask ((__v8sf) __A, + (__v8di) _mm512_setzero_si512(), + (__mmask8) __U, + _MM_FROUND_CUR_DIRECTION); +} + +#define _mm512_cvtt_roundps_epu64(__A, __R) __extension__ ({ \ + (__m512i) __builtin_ia32_cvttps2uqq512_mask ((__v8sf) __A, \ + (__v8di) _mm512_setzero_si512(),(__mmask8) -1, __R);}) + +#define _mm512_mask_cvtt_roundps_epu64(__W, __U, __A, __R) __extension__ ({ \ + (__m512i) __builtin_ia32_cvttps2uqq512_mask ((__v8sf) __A, \ + (__v8di) __W, (__mmask8) __U, __R);}) + +#define _mm512_maskz_cvtt_roundps_epu64(__U, __A, __R) __extension__ ({ \ + (__m512i) __builtin_ia32_cvttps2uqq512_mask ((__v8sf) __A, \ + (__v8di) _mm512_setzero_si512(), (__mmask8) __U, __R);}) + +static __inline__ __m512d __DEFAULT_FN_ATTRS +_mm512_cvtepu64_pd (__m512i __A) { + return (__m512d) __builtin_ia32_cvtuqq2pd512_mask ((__v8di) __A, + (__v8df) _mm512_setzero_pd(), + (__mmask8) -1, + _MM_FROUND_CUR_DIRECTION); +} + +static __inline__ __m512d __DEFAULT_FN_ATTRS +_mm512_mask_cvtepu64_pd (__m512d __W, __mmask8 __U, __m512i __A) { + return (__m512d) __builtin_ia32_cvtuqq2pd512_mask ((__v8di) __A, + (__v8df) __W, + (__mmask8) __U, + _MM_FROUND_CUR_DIRECTION); +} + +static __inline__ __m512d __DEFAULT_FN_ATTRS +_mm512_maskz_cvtepu64_pd (__mmask8 __U, __m512i __A) { + return (__m512d) __builtin_ia32_cvtuqq2pd512_mask ((__v8di) __A, + (__v8df) _mm512_setzero_pd(), + (__mmask8) __U, + _MM_FROUND_CUR_DIRECTION); +} + +#define _mm512_cvt_roundepu64_pd(__A, __R) __extension__ ({ \ + (__m512d) __builtin_ia32_cvtuqq2pd512_mask ((__v8di) __A, \ + (__v8df) _mm512_setzero_pd(), (__mmask8) -1, __R);}) + +#define _mm512_mask_cvt_roundepu64_pd(__W, __U, __A, __R) __extension__ ({ \ + (__m512d) __builtin_ia32_cvtuqq2pd512_mask ((__v8di) __A, \ + (__v8df) __W, (__mmask8) __U, __R);}) + + +#define _mm512_maskz_cvt_roundepu64_pd(__U, __A, __R) __extension__ ({ \ + (__m512d) __builtin_ia32_cvtuqq2pd512_mask ((__v8di) __A, \ + (__v8df) _mm512_setzero_pd(), (__mmask8) __U, __R);}) + + +static __inline__ __m256 __DEFAULT_FN_ATTRS +_mm512_cvtepu64_ps (__m512i __A) { + return (__m256) __builtin_ia32_cvtuqq2ps512_mask ((__v8di) __A, + (__v8sf) _mm256_setzero_ps(), + (__mmask8) -1, + _MM_FROUND_CUR_DIRECTION); +} + +static __inline__ __m256 __DEFAULT_FN_ATTRS +_mm512_mask_cvtepu64_ps (__m256 __W, __mmask8 __U, __m512i __A) { + return (__m256) __builtin_ia32_cvtuqq2ps512_mask ((__v8di) __A, + (__v8sf) __W, + (__mmask8) __U, + _MM_FROUND_CUR_DIRECTION); +} + +static __inline__ __m256 __DEFAULT_FN_ATTRS +_mm512_maskz_cvtepu64_ps (__mmask8 __U, __m512i __A) { + return (__m256) __builtin_ia32_cvtuqq2ps512_mask ((__v8di) __A, + (__v8sf) _mm256_setzero_ps(), + (__mmask8) __U, + _MM_FROUND_CUR_DIRECTION); +} + +#define _mm512_cvt_roundepu64_ps(__A, __R) __extension__ ({ \ + (__m256) __builtin_ia32_cvtuqq2ps512_mask ((__v8di) __A, \ + (__v8sf) _mm256_setzero_ps(), (__mmask8) -1, __R);}) + +#define _mm512_mask_cvt_roundepu64_ps(__W, __U, __A, __R) __extension__ ({ \ + (__m256) __builtin_ia32_cvtuqq2ps512_mask ((__v8di) __A, \ + (__v8sf) __W, (__mmask8) __U, __R);}) + +#define _mm512_maskz_cvt_roundepu64_ps(__U, __A, __R) __extension__ ({ \ + (__m256) __builtin_ia32_cvtuqq2ps512_mask ((__v8di) __A, \ + (__v8sf) _mm256_setzero_ps(), (__mmask8) __U, __R);}) + +#define _mm512_range_pd(__A, __B, __C) __extension__ ({ \ + (__m512d) __builtin_ia32_rangepd512_mask ((__v8df) __A, (__v8df) __B, __C,\ + (__v8df) _mm512_setzero_pd(), (__mmask8) -1, \ + _MM_FROUND_CUR_DIRECTION);}) + +#define _mm512_mask_range_pd(__W, __U, __A, __B, __C) __extension__ ({ \ + (__m512d) __builtin_ia32_rangepd512_mask ((__v8df) __A, (__v8df) __B, __C,\ + (__v8df) __W, (__mmask8) __U, _MM_FROUND_CUR_DIRECTION);}) + +#define _mm512_maskz_range_pd(__U, __A, __B, __C) __extension__ ({ \ + (__m512d) __builtin_ia32_rangepd512_mask ((__v8df) __A, (__v8df) __B, __C, \ + (__v8df) _mm512_setzero_pd(), (__mmask8) __U, \ + _MM_FROUND_CUR_DIRECTION);}) + +#define _mm512_range_round_pd(__A, __B, __C, __R) __extension__ ({ \ + (__m512d) __builtin_ia32_rangepd512_mask ((__v8df) __A, (__v8df) __B, __C, \ + (__v8df) _mm512_setzero_pd(), (__mmask8) -1, __R);}) + +#define _mm512_mask_range_round_pd(__W, __U, __A, __B, __C, __R) __extension__ ({ \ + (__m512d) __builtin_ia32_rangepd512_mask ((__v8df) __A, (__v8df) __B, __C, \ + (__v8df) __W, (__mmask8) __U, __R);}) + +#define _mm512_maskz_range_round_pd(__U, __A, __B, __C, __R) __extension__ ({ \ + (__m512d) __builtin_ia32_rangepd512_mask ((__v8df) __A, (__v8df) __B, __C, \ + (__v8df) _mm512_setzero_pd(), (__mmask8) __U, __R);}) + +#define _mm512_range_ps(__A, __B, __C) __extension__ ({ \ + (__m512) __builtin_ia32_rangeps512_mask ((__v16sf) __A, (__v16sf) __B, __C, \ + (__v16sf) _mm512_setzero_ps(), (__mmask16) -1, \ + _MM_FROUND_CUR_DIRECTION);}) + +#define _mm512_mask_range_ps(__W, __U, __A, __B, __C) __extension__ ({ \ + (__m512) __builtin_ia32_rangeps512_mask ((__v16sf) __A, (__v16sf) __B, \ + __C, (__v16sf) __W, (__mmask16) __U, _MM_FROUND_CUR_DIRECTION);}) + +#define _mm512_maskz_range_ps(__U, __A, __B, __C) __extension__ ({ \ + (__m512) __builtin_ia32_rangeps512_mask ((__v16sf) __A,(__v16sf) __B, \ + __C, (__v16sf) _mm512_setzero_ps(), (__mmask16) __U, \ + _MM_FROUND_CUR_DIRECTION);}) + +#define _mm512_range_round_ps(__A, __B, __C, __R) __extension__ ({ \ + (__m512) __builtin_ia32_rangeps512_mask ((__v16sf) __A, (__v16sf) __B, \ + __C, (__v16sf) _mm512_setzero_ps(), (__mmask16) -1, __R);}) + +#define _mm512_mask_range_round_ps(__W, __U, __A, __B, __C, __R) __extension__ ({ \ + (__m512) __builtin_ia32_rangeps512_mask ((__v16sf) __A, (__v16sf) __B, \ + __C, (__v16sf) __W, (__mmask16) __U, __R);}) + +#define _mm512_maskz_range_round_ps(__U, __A, __B, __C, __R) __extension__ ({ \ + (__m512) __builtin_ia32_rangeps512_mask ((__v16sf) __A, (__v16sf) __B, \ + __C, (__v16sf) _mm512_setzero_ps(), (__mmask16) __U, __R);}) + +#define _mm512_reduce_pd(__A, __B) __extension__ ({ \ + (__m512d) __builtin_ia32_reducepd512_mask ((__v8df) __A, __B, \ + (__v8df) _mm512_setzero_pd(), (__mmask8) -1, _MM_FROUND_CUR_DIRECTION);}) + +#define _mm512_mask_reduce_pd(__W, __U, __A, __B) __extension__ ({ \ + (__m512d) __builtin_ia32_reducepd512_mask ((__v8df) __A, __B, \ + (__v8df) __W,(__mmask8) __U, _MM_FROUND_CUR_DIRECTION);}) + +#define _mm512_maskz_reduce_pd(__U, __A, __B) __extension__ ({ \ + (__m512d) __builtin_ia32_reducepd512_mask ((__v8df) __A, __B, \ + (__v8df) _mm512_setzero_pd(), (__mmask8) __U, _MM_FROUND_CUR_DIRECTION);}) + +#define _mm512_reduce_ps(__A, __B) __extension__ ({ \ + (__m512) __builtin_ia32_reduceps512_mask ((__v16sf) __A, __B, \ + (__v16sf) _mm512_setzero_ps(), (__mmask16) -1, _MM_FROUND_CUR_DIRECTION);}) + +#define _mm512_mask_reduce_ps(__W, __U, __A, __B) __extension__ ({ \ + (__m512) __builtin_ia32_reduceps512_mask ((__v16sf) __A, __B, \ + (__v16sf) __W, (__mmask16) __U, _MM_FROUND_CUR_DIRECTION);}) + +#define _mm512_maskz_reduce_ps(__U, __A, __B) __extension__ ({ \ + (__m512) __builtin_ia32_reduceps512_mask ((__v16sf) __A, __B, \ + (__v16sf) _mm512_setzero_ps(), (__mmask16) __U, _MM_FROUND_CUR_DIRECTION);}) + +#define _mm512_reduce_round_pd(__A, __B, __R) __extension__ ({\ + (__m512d) __builtin_ia32_reducepd512_mask ((__v8df) __A, __B, \ + (__v8df) _mm512_setzero_pd(), (__mmask8) -1, __R);}) + +#define _mm512_mask_reduce_round_pd(__W, __U, __A, __B, __R) __extension__ ({\ + (__m512d) __builtin_ia32_reducepd512_mask ((__v8df) __A, __B, \ + (__v8df) __W,(__mmask8) __U, __R);}) + +#define _mm512_maskz_reduce_round_pd(__U, __A, __B, __R) __extension__ ({\ + (__m512d) __builtin_ia32_reducepd512_mask ((__v8df) __A, __B, \ + (__v8df) _mm512_setzero_pd(), (__mmask8) __U, __R);}) + +#define _mm512_reduce_round_ps(__A, __B, __R) __extension__ ({\ + (__m512) __builtin_ia32_reduceps512_mask ((__v16sf) __A, __B, \ + (__v16sf) _mm512_setzero_ps(), (__mmask16) -1, __R);}) + +#define _mm512_mask_reduce_round_ps(__W, __U, __A, __B, __R) __extension__ ({\ + (__m512) __builtin_ia32_reduceps512_mask ((__v16sf) __A, __B, \ + (__v16sf) __W, (__mmask16) __U, __R);}) + +#define _mm512_maskz_reduce_round_ps(__U, __A, __B, __R) __extension__ ({\ + (__m512) __builtin_ia32_reduceps512_mask ((__v16sf) __A, __B, \ + (__v16sf) _mm512_setzero_ps(), (__mmask16) __U, __R);}) + #undef __DEFAULT_FN_ATTRS #endif Index: cfe/trunk/test/CodeGen/avx512dq-builtins.c =================================================================== --- cfe/trunk/test/CodeGen/avx512dq-builtins.c +++ cfe/trunk/test/CodeGen/avx512dq-builtins.c @@ -162,3 +162,580 @@ // CHECK: @llvm.x86.avx512.mask.andn.ps.512 return (__m512) _mm512_maskz_andnot_ps(__U, __A, __B); } + +__m512i test_mm512_cvtpd_epi64(__m512d __A) { + // CHECK-LABEL: @test_mm512_cvtpd_epi64 + // CHECK: @llvm.x86.avx512.mask.cvtpd.512 + return _mm512_cvtpd_epi64(__A); +} + +__m512i test_mm512_mask_cvtpd_epi64(__m512i __W, __mmask8 __U, __m512d __A) { + // CHECK-LABEL: @test_mm512_mask_cvtpd_epi64 + // CHECK: @llvm.x86.avx512.mask.cvtpd.512 + return _mm512_mask_cvtpd_epi64(__W, __U, __A); +} + +__m512i test_mm512_maskz_cvtpd_epi64(__mmask8 __U, __m512d __A) { + // CHECK-LABEL: @test_mm512_maskz_cvtpd_epi64 + // CHECK: @llvm.x86.avx512.mask.cvtpd.512 + return _mm512_maskz_cvtpd_epi64(__U, __A); +} + +__m512i test_mm512_cvt_roundpd_epi64(__m512d __A) { + // CHECK-LABEL: @test_mm512_cvt_roundpd_epi64 + // CHECK: @llvm.x86.avx512.mask.cvt.512 + return _mm512_cvt_roundpd_epi64(__A, _MM_FROUND_TO_NEAREST_INT); +} + +__m512i test_mm512_mask_cvt_roundpd_epi64(__m512i __W, __mmask8 __U, __m512d __A) { + // CHECK-LABEL: @test_mm512_mask_cvt_roundpd_epi64 + // CHECK: @llvm.x86.avx512.mask.cvt.512 + return _mm512_mask_cvt_roundpd_epi64(__W, __U, __A, _MM_FROUND_TO_NEAREST_INT); +} + +__m512i test_mm512_maskz_cvt_roundpd_epi64(__mmask8 __U, __m512d __A) { + // CHECK-LABEL: @test_mm512_maskz_cvt_roundpd_epi64 + // CHECK: @llvm.x86.avx512.mask.cvt.512 + return _mm512_maskz_cvt_roundpd_epi64(__U, __A, _MM_FROUND_TO_NEAREST_INT); +} + +__m512i test_mm512_cvtpd_epu64(__m512d __A) { + // CHECK-LABEL: @test_mm512_cvtpd_epu64 + // CHECK: @llvm.x86.avx512.mask.cvtpd.512 + return _mm512_cvtpd_epu64(__A); +} + +__m512i test_mm512_mask_cvtpd_epu64(__m512i __W, __mmask8 __U, __m512d __A) { + // CHECK-LABEL: @test_mm512_mask_cvtpd_epu64 + // CHECK: @llvm.x86.avx512.mask.cvtpd.512 + return _mm512_mask_cvtpd_epu64(__W, __U, __A); +} + +__m512i test_mm512_maskz_cvtpd_epu64(__mmask8 __U, __m512d __A) { + // CHECK-LABEL: @test_mm512_maskz_cvtpd_epu64 + // CHECK: @llvm.x86.avx512.mask.cvtpd.512 + return _mm512_maskz_cvtpd_epu64(__U, __A); +} + +__m512i test_mm512_cvt_roundpd_epu64(__m512d __A) { + // CHECK-LABEL: @test_mm512_cvt_roundpd_epu64 + // CHECK: @llvm.x86.avx512.mask.cvt.512 + return _mm512_cvt_roundpd_epu64(__A, _MM_FROUND_TO_NEAREST_INT); +} + +__m512i test_mm512_mask_cvt_roundpd_epu64(__m512i __W, __mmask8 __U, __m512d __A) { + // CHECK-LABEL: @test_mm512_mask_cvt_roundpd_epu64 + // CHECK: @llvm.x86.avx512.mask.cvt.512 + return _mm512_mask_cvt_roundpd_epu64(__W, __U, __A, _MM_FROUND_TO_NEAREST_INT); +} + +__m512i test_mm512_maskz_cvt_roundpd_epu64(__mmask8 __U, __m512d __A) { + // CHECK-LABEL: @test_mm512_maskz_cvt_roundpd_epu64 + // CHECK: @llvm.x86.avx512.mask.cvt.512 + return _mm512_maskz_cvt_roundpd_epu64(__U, __A, _MM_FROUND_TO_NEAREST_INT); +} + +__m512i test_mm512_cvtps_epi64(__m256 __A) { + // CHECK-LABEL: @test_mm512_cvtps_epi64 + // CHECK: @llvm.x86.avx512.mask.cvtps.512 + return _mm512_cvtps_epi64(__A); +} + +__m512i test_mm512_mask_cvtps_epi64(__m512i __W, __mmask8 __U, __m256 __A) { + // CHECK-LABEL: @test_mm512_mask_cvtps_epi64 + // CHECK: @llvm.x86.avx512.mask.cvtps.512 + return _mm512_mask_cvtps_epi64(__W, __U, __A); +} + +__m512i test_mm512_maskz_cvtps_epi64(__mmask8 __U, __m256 __A) { + // CHECK-LABEL: @test_mm512_maskz_cvtps_epi64 + // CHECK: @llvm.x86.avx512.mask.cvtps.512 + return _mm512_maskz_cvtps_epi64(__U, __A); +} + +__m512i test_mm512_cvt_roundps_epi64(__m256 __A) { + // CHECK-LABEL: @test_mm512_cvt_roundps_epi64 + // CHECK: @llvm.x86.avx512.mask.cvt.512 + return _mm512_cvt_roundps_epi64(__A, _MM_FROUND_TO_NEAREST_INT); +} + +__m512i test_mm512_mask_cvt_roundps_epi64(__m512i __W, __mmask8 __U, __m256 __A) { + // CHECK-LABEL: @test_mm512_mask_cvt_roundps_epi64 + // CHECK: @llvm.x86.avx512.mask.cvt.512 + return _mm512_mask_cvt_roundps_epi64(__W, __U, __A, _MM_FROUND_TO_NEAREST_INT); +} + +__m512i test_mm512_maskz_cvt_roundps_epi64(__mmask8 __U, __m256 __A) { + // CHECK-LABEL: @test_mm512_maskz_cvt_roundps_epi64 + // CHECK: @llvm.x86.avx512.mask.cvt.512 + return _mm512_maskz_cvt_roundps_epi64(__U, __A, _MM_FROUND_TO_NEAREST_INT); +} + +__m512i test_mm512_cvtps_epu64(__m256 __A) { + // CHECK-LABEL: @test_mm512_cvtps_epu64 + // CHECK: @llvm.x86.avx512.mask.cvtps.512 + return _mm512_cvtps_epu64(__A); +} + +__m512i test_mm512_mask_cvtps_epu64(__m512i __W, __mmask8 __U, __m256 __A) { + // CHECK-LABEL: @test_mm512_mask_cvtps_epu64 + // CHECK: @llvm.x86.avx512.mask.cvtps.512 + return _mm512_mask_cvtps_epu64(__W, __U, __A); +} + +__m512i test_mm512_maskz_cvtps_epu64(__mmask8 __U, __m256 __A) { + // CHECK-LABEL: @test_mm512_maskz_cvtps_epu64 + // CHECK: @llvm.x86.avx512.mask.cvtps.512 + return _mm512_maskz_cvtps_epu64(__U, __A); +} + +__m512i test_mm512_cvt_roundps_epu64(__m256 __A) { + // CHECK-LABEL: @test_mm512_cvt_roundps_epu64 + // CHECK: @llvm.x86.avx512.mask.cvt.512 + return _mm512_cvt_roundps_epu64(__A, _MM_FROUND_TO_NEAREST_INT); +} + +__m512i test_mm512_mask_cvt_roundps_epu64(__m512i __W, __mmask8 __U, __m256 __A) { + // CHECK-LABEL: @test_mm512_mask_cvt_roundps_epu64 + // CHECK: @llvm.x86.avx512.mask.cvt.512 + return _mm512_mask_cvt_roundps_epu64(__W, __U, __A, _MM_FROUND_TO_NEAREST_INT); +} + +__m512i test_mm512_maskz_cvt_roundps_epu64(__mmask8 __U, __m256 __A) { + // CHECK-LABEL: @test_mm512_maskz_cvt_roundps_epu64 + // CHECK: @llvm.x86.avx512.mask.cvt.512 + return _mm512_maskz_cvt_roundps_epu64(__U, __A, _MM_FROUND_TO_NEAREST_INT); +} + +__m512d test_mm512_cvtepi64_pd(__m512i __A) { + // CHECK-LABEL: @test_mm512_cvtepi64_pd + // CHECK: @llvm.x86.avx512.mask.cvtqq2.pd.512 + return _mm512_cvtepi64_pd(__A); +} + +__m512d test_mm512_mask_cvtepi64_pd(__m512d __W, __mmask8 __U, __m512i __A) { + // CHECK-LABEL: @test_mm512_mask_cvtepi64_pd + // CHECK: @llvm.x86.avx512.mask.cvtqq2.pd.512 + return _mm512_mask_cvtepi64_pd(__W, __U, __A); +} + +__m512d test_mm512_maskz_cvtepi64_pd(__mmask8 __U, __m512i __A) { + // CHECK-LABEL: @test_mm512_maskz_cvtepi64_pd + // CHECK: @llvm.x86.avx512.mask.cvtqq2.pd.512 + return _mm512_maskz_cvtepi64_pd(__U, __A); +} + +__m512d test_mm512_cvt_roundepi64_pd(__m512i __A) { + // CHECK-LABEL: @test_mm512_cvt_roundepi64_pd + // CHECK: @llvm.x86.avx512.mask.cvt.512 + return _mm512_cvt_roundepi64_pd(__A, _MM_FROUND_TO_NEAREST_INT); +} + +__m512d test_mm512_mask_cvt_roundepi64_pd(__m512d __W, __mmask8 __U, __m512i __A) { + // CHECK-LABEL: @test_mm512_mask_cvt_roundepi64_pd + // CHECK: @llvm.x86.avx512.mask.cvt.512 + return _mm512_mask_cvt_roundepi64_pd(__W, __U, __A, _MM_FROUND_TO_NEAREST_INT); +} + +__m512d test_mm512_maskz_cvt_roundepi64_pd(__mmask8 __U, __m512i __A) { + // CHECK-LABEL: @test_mm512_maskz_cvt_roundepi64_pd + // CHECK: @llvm.x86.avx512.mask.cvt.512 + return _mm512_maskz_cvt_roundepi64_pd(__U, __A, _MM_FROUND_TO_NEAREST_INT); +} + +__m256 test_mm512_cvtepi64_ps(__m512i __A) { + // CHECK-LABEL: @test_mm512_cvtepi64_ps + // CHECK: @llvm.x86.avx512.mask.cvtqq2.ps.512 + return _mm512_cvtepi64_ps(__A); +} + +__m256 test_mm512_mask_cvtepi64_ps(__m256 __W, __mmask8 __U, __m512i __A) { + // CHECK-LABEL: @test_mm512_mask_cvtepi64_ps + // CHECK: @llvm.x86.avx512.mask.cvtqq2.ps.512 + return _mm512_mask_cvtepi64_ps(__W, __U, __A); +} + +__m256 test_mm512_maskz_cvtepi64_ps(__mmask8 __U, __m512i __A) { + // CHECK-LABEL: @test_mm512_maskz_cvtepi64_ps + // CHECK: @llvm.x86.avx512.mask.cvtqq2.ps.512 + return _mm512_maskz_cvtepi64_ps(__U, __A); +} + +__m256 test_mm512_cvt_roundepi64_ps(__m512i __A) { + // CHECK-LABEL: @test_mm512_cvt_roundepi64_ps + // CHECK: @llvm.x86.avx512.mask.cvt.512 + return _mm512_cvt_roundepi64_ps(__A, _MM_FROUND_TO_NEAREST_INT); +} + +__m256 test_mm512_mask_cvt_roundepi64_ps(__m256 __W, __mmask8 __U, __m512i __A) { + // CHECK-LABEL: @test_mm512_mask_cvt_roundepi64_ps + // CHECK: @llvm.x86.avx512.mask.cvt.512 + return _mm512_mask_cvt_roundepi64_ps(__W, __U, __A, _MM_FROUND_TO_NEAREST_INT); +} + +__m256 test_mm512_maskz_cvt_roundepi64_ps(__mmask8 __U, __m512i __A) { + // CHECK-LABEL: @test_mm512_maskz_cvt_roundepi64_ps + // CHECK: @llvm.x86.avx512.mask.cvt.512 + return _mm512_maskz_cvt_roundepi64_ps(__U, __A, _MM_FROUND_TO_NEAREST_INT); +} + +__m512i test_mm512_cvttpd_epi64(__m512d __A) { + // CHECK-LABEL: @test_mm512_cvttpd_epi64 + // CHECK: @llvm.x86.avx512.mask.cvttpd.512 + return _mm512_cvttpd_epi64(__A); +} + +__m512i test_mm512_mask_cvttpd_epi64(__m512i __W, __mmask8 __U, __m512d __A) { + // CHECK-LABEL: @test_mm512_mask_cvttpd_epi64 + // CHECK: @llvm.x86.avx512.mask.cvttpd.512 + return _mm512_mask_cvttpd_epi64(__W, __U, __A); +} + +__m512i test_mm512_maskz_cvttpd_epi64(__mmask8 __U, __m512d __A) { + // CHECK-LABEL: @test_mm512_maskz_cvttpd_epi64 + // CHECK: @llvm.x86.avx512.mask.cvttpd.512 + return _mm512_maskz_cvttpd_epi64(__U, __A); +} + +__m512i test_mm512_cvtt_roundpd_epi64(__m512d __A) { + // CHECK-LABEL: @test_mm512_cvtt_roundpd_epi64 + // CHECK: @llvm.x86.avx512.mask.cvtt.512 + return _mm512_cvtt_roundpd_epi64(__A, _MM_FROUND_TO_NEAREST_INT); +} + +__m512i test_mm512_mask_cvtt_roundpd_epi64(__m512i __W, __mmask8 __U, __m512d __A) { + // CHECK-LABEL: @test_mm512_mask_cvtt_roundpd_epi64 + // CHECK: @llvm.x86.avx512.mask.cvtt.512 + return _mm512_mask_cvtt_roundpd_epi64(__W, __U, __A, _MM_FROUND_TO_NEAREST_INT); +} + +__m512i test_mm512_maskz_cvtt_roundpd_epi64(__mmask8 __U, __m512d __A) { + // CHECK-LABEL: @test_mm512_maskz_cvtt_roundpd_epi64 + // CHECK: @llvm.x86.avx512.mask.cvtt.512 + return _mm512_maskz_cvtt_roundpd_epi64(__U, __A, _MM_FROUND_TO_NEAREST_INT); +} + +__m512i test_mm512_cvttpd_epu64(__m512d __A) { + // CHECK-LABEL: @test_mm512_cvttpd_epu64 + // CHECK: @llvm.x86.avx512.mask.cvttpd.512 + return _mm512_cvttpd_epu64(__A); +} + +__m512i test_mm512_mask_cvttpd_epu64(__m512i __W, __mmask8 __U, __m512d __A) { + // CHECK-LABEL: @test_mm512_mask_cvttpd_epu64 + // CHECK: @llvm.x86.avx512.mask.cvttpd.512 + return _mm512_mask_cvttpd_epu64(__W, __U, __A); +} + +__m512i test_mm512_maskz_cvttpd_epu64(__mmask8 __U, __m512d __A) { + // CHECK-LABEL: @test_mm512_maskz_cvttpd_epu64 + // CHECK: @llvm.x86.avx512.mask.cvttpd.512 + return _mm512_maskz_cvttpd_epu64(__U, __A); +} + +__m512i test_mm512_cvtt_roundpd_epu64(__m512d __A) { + // CHECK-LABEL: @test_mm512_cvtt_roundpd_epu64 + // CHECK: @llvm.x86.avx512.mask.cvtt.512 + return _mm512_cvtt_roundpd_epu64(__A, _MM_FROUND_TO_NEAREST_INT); +} + +__m512i test_mm512_mask_cvtt_roundpd_epu64(__m512i __W, __mmask8 __U, __m512d __A) { + // CHECK-LABEL: @test_mm512_mask_cvtt_roundpd_epu64 + // CHECK: @llvm.x86.avx512.mask.cvtt.512 + return _mm512_mask_cvtt_roundpd_epu64(__W, __U, __A, _MM_FROUND_TO_NEAREST_INT); +} + +__m512i test_mm512_maskz_cvtt_roundpd_epu64(__mmask8 __U, __m512d __A) { + // CHECK-LABEL: @test_mm512_maskz_cvtt_roundpd_epu64 + // CHECK: @llvm.x86.avx512.mask.cvtt.512 + return _mm512_maskz_cvtt_roundpd_epu64(__U, __A, _MM_FROUND_TO_NEAREST_INT); +} + +__m512i test_mm512_cvttps_epi64(__m256 __A) { + // CHECK-LABEL: @test_mm512_cvttps_epi64 + // CHECK: @llvm.x86.avx512.mask.cvttps.512 + return _mm512_cvttps_epi64(__A); +} + +__m512i test_mm512_mask_cvttps_epi64(__m512i __W, __mmask8 __U, __m256 __A) { + // CHECK-LABEL: @test_mm512_mask_cvttps_epi64 + // CHECK: @llvm.x86.avx512.mask.cvttps.512 + return _mm512_mask_cvttps_epi64(__W, __U, __A); +} + +__m512i test_mm512_maskz_cvttps_epi64(__mmask8 __U, __m256 __A) { + // CHECK-LABEL: @test_mm512_maskz_cvttps_epi64 + // CHECK: @llvm.x86.avx512.mask.cvttps.512 + return _mm512_maskz_cvttps_epi64(__U, __A); +} + +__m512i test_mm512_cvtt_roundps_epi64(__m256 __A) { + // CHECK-LABEL: @test_mm512_cvtt_roundps_epi64 + // CHECK: @llvm.x86.avx512.mask.cvtt.512 + return _mm512_cvtt_roundps_epi64(__A, _MM_FROUND_TO_NEAREST_INT); +} + +__m512i test_mm512_mask_cvtt_roundps_epi64(__m512i __W, __mmask8 __U, __m256 __A) { + // CHECK-LABEL: @test_mm512_mask_cvtt_roundps_epi64 + // CHECK: @llvm.x86.avx512.mask.cvtt.512 + return _mm512_mask_cvtt_roundps_epi64(__W, __U, __A, _MM_FROUND_TO_NEAREST_INT); +} + +__m512i test_mm512_maskz_cvtt_roundps_epi64(__mmask8 __U, __m256 __A) { + // CHECK-LABEL: @test_mm512_maskz_cvtt_roundps_epi64 + // CHECK: @llvm.x86.avx512.mask.cvtt.512 + return _mm512_maskz_cvtt_roundps_epi64(__U, __A, _MM_FROUND_TO_NEAREST_INT); +} + +__m512i test_mm512_cvttps_epu64(__m256 __A) { + // CHECK-LABEL: @test_mm512_cvttps_epu64 + // CHECK: @llvm.x86.avx512.mask.cvttps.512 + return _mm512_cvttps_epu64(__A); +} + +__m512i test_mm512_mask_cvttps_epu64(__m512i __W, __mmask8 __U, __m256 __A) { + // CHECK-LABEL: @test_mm512_mask_cvttps_epu64 + // CHECK: @llvm.x86.avx512.mask.cvttps.512 + return _mm512_mask_cvttps_epu64(__W, __U, __A); +} + +__m512i test_mm512_maskz_cvttps_epu64(__mmask8 __U, __m256 __A) { + // CHECK-LABEL: @test_mm512_maskz_cvttps_epu64 + // CHECK: @llvm.x86.avx512.mask.cvttps.512 + return _mm512_maskz_cvttps_epu64(__U, __A); +} + +__m512i test_mm512_cvtt_roundps_epu64(__m256 __A) { + // CHECK-LABEL: @test_mm512_cvtt_roundps_epu64 + // CHECK: @llvm.x86.avx512.mask.cvtt.512 + return _mm512_cvtt_roundps_epu64(__A, _MM_FROUND_TO_NEAREST_INT); +} + +__m512i test_mm512_mask_cvtt_roundps_epu64(__m512i __W, __mmask8 __U, __m256 __A) { + // CHECK-LABEL: @test_mm512_mask_cvtt_roundps_epu64 + // CHECK: @llvm.x86.avx512.mask.cvtt.512 + return _mm512_mask_cvtt_roundps_epu64(__W, __U, __A, _MM_FROUND_TO_NEAREST_INT); +} + +__m512i test_mm512_maskz_cvtt_roundps_epu64(__mmask8 __U, __m256 __A) { + // CHECK-LABEL: @test_mm512_maskz_cvtt_roundps_epu64 + // CHECK: @llvm.x86.avx512.mask.cvtt.512 + return _mm512_maskz_cvtt_roundps_epu64(__U, __A, _MM_FROUND_TO_NEAREST_INT); +} + +__m512d test_mm512_cvtepu64_pd(__m512i __A) { + // CHECK-LABEL: @test_mm512_cvtepu64_pd + // CHECK: @llvm.x86.avx512.mask.cvtuqq2.pd.512 + return _mm512_cvtepu64_pd(__A); +} + +__m512d test_mm512_mask_cvtepu64_pd(__m512d __W, __mmask8 __U, __m512i __A) { + // CHECK-LABEL: @test_mm512_mask_cvtepu64_pd + // CHECK: @llvm.x86.avx512.mask.cvtuqq2.pd.512 + return _mm512_mask_cvtepu64_pd(__W, __U, __A); +} + +__m512d test_mm512_maskz_cvtepu64_pd(__mmask8 __U, __m512i __A) { + // CHECK-LABEL: @test_mm512_maskz_cvtepu64_pd + // CHECK: @llvm.x86.avx512.mask.cvtuqq2.pd.512 + return _mm512_maskz_cvtepu64_pd(__U, __A); +} + +__m512d test_mm512_cvt_roundepu64_pd(__m512i __A) { + // CHECK-LABEL: @test_mm512_cvt_roundepu64_pd + // CHECK: @llvm.x86.avx512.mask.cvt.512 + return _mm512_cvt_roundepu64_pd(__A, _MM_FROUND_TO_NEAREST_INT); +} + +__m512d test_mm512_mask_cvt_roundepu64_pd(__m512d __W, __mmask8 __U, __m512i __A) { + // CHECK-LABEL: @test_mm512_mask_cvt_roundepu64_pd + // CHECK: @llvm.x86.avx512.mask.cvt.512 + return _mm512_mask_cvt_roundepu64_pd(__W, __U, __A, _MM_FROUND_TO_NEAREST_INT); +} + +__m512d test_mm512_maskz_cvt_roundepu64_pd(__mmask8 __U, __m512i __A) { + // CHECK-LABEL: @test_mm512_maskz_cvt_roundepu64_pd + // CHECK: @llvm.x86.avx512.mask.cvt.512 + return _mm512_maskz_cvt_roundepu64_pd(__U, __A, _MM_FROUND_TO_NEAREST_INT); +} + +__m256 test_mm512_cvtepu64_ps(__m512i __A) { + // CHECK-LABEL: @test_mm512_cvtepu64_ps + // CHECK: @llvm.x86.avx512.mask.cvtuqq2.ps.512 + return _mm512_cvtepu64_ps(__A); +} + +__m256 test_mm512_mask_cvtepu64_ps(__m256 __W, __mmask8 __U, __m512i __A) { + // CHECK-LABEL: @test_mm512_mask_cvtepu64_ps + // CHECK: @llvm.x86.avx512.mask.cvtuqq2.ps.512 + return _mm512_mask_cvtepu64_ps(__W, __U, __A); +} + +__m256 test_mm512_maskz_cvtepu64_ps(__mmask8 __U, __m512i __A) { + // CHECK-LABEL: @test_mm512_maskz_cvtepu64_ps + // CHECK: @llvm.x86.avx512.mask.cvtuqq2.ps.512 + return _mm512_maskz_cvtepu64_ps(__U, __A); +} + +__m256 test_mm512_cvt_roundepu64_ps(__m512i __A) { + // CHECK-LABEL: @test_mm512_cvt_roundepu64_ps + // CHECK: @llvm.x86.avx512.mask.cvt.512 + return _mm512_cvt_roundepu64_ps(__A, _MM_FROUND_TO_NEAREST_INT); +} + +__m256 test_mm512_mask_cvt_roundepu64_ps(__m256 __W, __mmask8 __U, __m512i __A) { + // CHECK-LABEL: @test_mm512_mask_cvt_roundepu64_ps + // CHECK: @llvm.x86.avx512.mask.cvt.512 + return _mm512_mask_cvt_roundepu64_ps(__W, __U, __A, _MM_FROUND_TO_NEAREST_INT); +} + +__m256 test_mm512_maskz_cvt_roundepu64_ps(__mmask8 __U, __m512i __A) { + // CHECK-LABEL: @test_mm512_maskz_cvt_roundepu64_ps + // CHECK: @llvm.x86.avx512.mask.cvt.512 + return _mm512_maskz_cvt_roundepu64_ps(__U, __A, _MM_FROUND_TO_NEAREST_INT); +} + +__m512d test_mm512_range_pd(__m512d __A, __m512d __B) { + // CHECK-LABEL: @test_mm512_range_pd + // CHECK: @llvm.x86.avx512.mask.range.pd.512 + return _mm512_range_pd(__A, __B, 4); +} + +__m512d test_mm512_mask_range_pd(__m512d __W, __mmask8 __U, __m512d __A, __m512d __B) { + // CHECK-LABEL: @test_mm512_mask_range_pd + // CHECK: @llvm.x86.avx512.mask.range.pd.512 + return _mm512_mask_range_pd(__W, __U, __A, __B, 4); +} + +__m512d test_mm512_maskz_range_pd(__mmask8 __U, __m512d __A, __m512d __B) { + // CHECK-LABEL: @test_mm512_maskz_range_pd + // CHECK: @llvm.x86.avx512.mask.range.pd.512 + return _mm512_maskz_range_pd(__U, __A, __B, 4); +} + +__m512d test_mm512_range_round_pd(__m512d __A, __m512d __B) { + // CHECK-LABEL: @test_mm512_range_round_pd + // CHECK: @llvm.x86.avx512.mask.range.pd.512 + return _mm512_range_round_pd(__A, __B, 4, 8); +} + +__m512d test_mm512_mask_range_round_pd(__m512d __W, __mmask8 __U, __m512d __A, __m512d __B) { + // CHECK-LABEL: @test_mm512_mask_range_round_pd + // CHECK: @llvm.x86.avx512.mask.range.pd.512 + return _mm512_mask_range_round_pd(__W, __U, __A, __B, 4, 8); +} + +__m512d test_mm512_maskz_range_round_pd(__mmask8 __U, __m512d __A, __m512d __B) { + // CHECK-LABEL: @test_mm512_maskz_range_round_pd + // CHECK: @llvm.x86.avx512.mask.range.pd.512 + return _mm512_maskz_range_round_pd(__U, __A, __B, 4, 8); +} + +__m512 test_mm512_range_ps(__m512 __A, __m512 __B) { + // CHECK-LABEL: @test_mm512_range_ps + // CHECK: @llvm.x86.avx512.mask.range.ps.512 + return _mm512_range_ps(__A, __B, 4); +} + +__m512 test_mm512_mask_range_ps(__m512 __W, __mmask16 __U, __m512 __A, __m512 __B) { + // CHECK-LABEL: @test_mm512_mask_range_ps + // CHECK: @llvm.x86.avx512.mask.range.ps.512 + return _mm512_mask_range_ps(__W, __U, __A, __B, 4); +} + +__m512 test_mm512_maskz_range_ps(__mmask16 __U, __m512 __A, __m512 __B) { + // CHECK-LABEL: @test_mm512_maskz_range_ps + // CHECK: @llvm.x86.avx512.mask.range.ps.512 + return _mm512_maskz_range_ps(__U, __A, __B, 4); +} + +__m512 test_mm512_range_round_ps(__m512 __A, __m512 __B) { + // CHECK-LABEL: @test_mm512_range_round_ps + // CHECK: @llvm.x86.avx512.mask.range.ps.512 + return _mm512_range_round_ps(__A, __B, 4, 8); +} + +__m512 test_mm512_mask_range_round_ps(__m512 __W, __mmask16 __U, __m512 __A, __m512 __B) { + // CHECK-LABEL: @test_mm512_mask_range_round_ps + // CHECK: @llvm.x86.avx512.mask.range.ps.512 + return _mm512_mask_range_round_ps(__W, __U, __A, __B, 4, 8); +} + +__m512 test_mm512_maskz_range_round_ps(__mmask16 __U, __m512 __A, __m512 __B) { + // CHECK-LABEL: @test_mm512_maskz_range_round_ps + // CHECK: @llvm.x86.avx512.mask.range.ps.512 + return _mm512_maskz_range_round_ps(__U, __A, __B, 4, 8); +} + +__m512d test_mm512_reduce_pd(__m512d __A) { + // CHECK-LABEL: @test_mm512_reduce_pd + // CHECK: @llvm.x86.avx512.mask.reduce.pd.512 + return _mm512_reduce_pd(__A, 4); +} + +__m512d test_mm512_mask_reduce_pd(__m512d __W, __mmask8 __U, __m512d __A) { + // CHECK-LABEL: @test_mm512_mask_reduce_pd + // CHECK: @llvm.x86.avx512.mask.reduce.pd.512 + return _mm512_mask_reduce_pd(__W, __U, __A, 4); +} + +__m512d test_mm512_maskz_reduce_pd(__mmask8 __U, __m512d __A) { + // CHECK-LABEL: @test_mm512_maskz_reduce_pd + // CHECK: @llvm.x86.avx512.mask.reduce.pd.512 + return _mm512_maskz_reduce_pd(__U, __A, 4); +} + +__m512 test_mm512_reduce_ps(__m512 __A) { + // CHECK-LABEL: @test_mm512_reduce_ps + // CHECK: @llvm.x86.avx512.mask.reduce.ps.512 + return _mm512_reduce_ps(__A, 4); +} + +__m512 test_mm512_mask_reduce_ps(__m512 __W, __mmask16 __U, __m512 __A) { + // CHECK-LABEL: @test_mm512_mask_reduce_ps + // CHECK: @llvm.x86.avx512.mask.reduce.ps.512 + return _mm512_mask_reduce_ps(__W, __U, __A, 4); +} + +__m512 test_mm512_maskz_reduce_ps(__mmask16 __U, __m512 __A) { + // CHECK-LABEL: @test_mm512_maskz_reduce_ps + // CHECK: @llvm.x86.avx512.mask.reduce.ps.512 + return _mm512_maskz_reduce_ps(__U, __A, 4); +} + +__m512d test_mm512_reduce_round_pd(__m512d __A) { + // CHECK-LABEL: @test_mm512_reduce_round_pd + // CHECK: @llvm.x86.avx512.mask.reduce.pd.512 + return _mm512_reduce_round_pd(__A, 4, 8); +} + +__m512d test_mm512_mask_reduce_round_pd(__m512d __W, __mmask8 __U, __m512d __A) { + // CHECK-LABEL: @test_mm512_mask_reduce_round_pd + // CHECK: @llvm.x86.avx512.mask.reduce.pd.512 + return _mm512_mask_reduce_round_pd(__W, __U, __A, 4, 8); +} + +__m512d test_mm512_maskz_reduce_round_pd(__mmask8 __U, __m512d __A) { + // CHECK-LABEL: @test_mm512_maskz_reduce_round_pd + // CHECK: @llvm.x86.avx512.mask.reduce.pd.512 + return _mm512_maskz_reduce_round_pd(__U, __A, 4, 8); +} + +__m512 test_mm512_reduce_round_ps(__m512 __A) { + // CHECK-LABEL: @test_mm512_reduce_round_ps + // CHECK: @llvm.x86.avx512.mask.reduce.ps.512 + return _mm512_reduce_round_ps(__A, 4, 8); +} + +__m512 test_mm512_mask_reduce_round_ps(__m512 __W, __mmask16 __U, __m512 __A) { + // CHECK-LABEL: @test_mm512_mask_reduce_round_ps + // CHECK: @llvm.x86.avx512.mask.reduce.ps.512 + return _mm512_mask_reduce_round_ps(__W, __U, __A, 4, 8); +} + +__m512 test_mm512_maskz_reduce_round_ps(__mmask16 __U, __m512 __A) { + // CHECK-LABEL: @test_mm512_maskz_reduce_round_ps + // CHECK: @llvm.x86.avx512.mask.reduce.ps.512 + return _mm512_maskz_reduce_round_ps(__U, __A, 4, 8); +} +