Index: include/clang/Basic/BuiltinsX86.def =================================================================== --- include/clang/Basic/BuiltinsX86.def +++ include/clang/Basic/BuiltinsX86.def @@ -1572,6 +1572,24 @@ TARGET_BUILTIN(__builtin_ia32_rangeps512_mask, "V16fV16fV16fIiV16fUsIi", "", "avx512dq") TARGET_BUILTIN(__builtin_ia32_reducepd512_mask, "V8dV8dIiV8dUcIi", "", "avx512dq") TARGET_BUILTIN(__builtin_ia32_reduceps512_mask, "V16fV16fIiV16fUsIi", "", "avx512dq") +TARGET_BUILTIN(__builtin_ia32_pmovzxbw512_mask, "V32sV32cV32sUi","","avx512bw") +TARGET_BUILTIN(__builtin_ia32_pmovzxbd512_mask, "V16iV16cV16iUs","","avx512f") +TARGET_BUILTIN(__builtin_ia32_pmovzxbq512_mask, "V8LLiV16cV8LLiUc","","avx512f") +TARGET_BUILTIN(__builtin_ia32_pmovzxdq512_mask, "V8LLiV8iV8LLiUc","","avx512f") +TARGET_BUILTIN(__builtin_ia32_pmovzxwd512_mask, "V16iV16sV16iUs","","avx512f") +TARGET_BUILTIN(__builtin_ia32_pmovzxwq512_mask, "V8LLiV8sV8LLiUc","","avx512f") +TARGET_BUILTIN(__builtin_ia32_pmovzxbw128_mask, "V8sV16cV8sUc","","avx512bw,avx512vl") +TARGET_BUILTIN(__builtin_ia32_pmovzxbw256_mask, "V16sV16cV16sUs","","avx512bw,avx512vl") +TARGET_BUILTIN(__builtin_ia32_pmovzxbd128_mask, "V4iV16cV4iUc","","avx512vl") +TARGET_BUILTIN(__builtin_ia32_pmovzxbd256_mask, "V8iV16cV8iUc","","avx512vl") +TARGET_BUILTIN(__builtin_ia32_pmovzxbq128_mask, "V2LLiV16cV2LLiUc","","avx512vl") +TARGET_BUILTIN(__builtin_ia32_pmovzxbq256_mask, "V4LLiV16cV4LLiUc","","avx512vl") +TARGET_BUILTIN(__builtin_ia32_pmovzxdq128_mask, "V2LLiV4iV2LLiUc","","avx512vl") +TARGET_BUILTIN(__builtin_ia32_pmovzxdq256_mask, "V4LLiV4iV4LLiUc","","avx512vl") +TARGET_BUILTIN(__builtin_ia32_pmovzxwd128_mask, "V4iV8sV4iUc","","avx512vl") +TARGET_BUILTIN(__builtin_ia32_pmovzxwd256_mask, "V8iV8sV8iUc","","avx512vl") +TARGET_BUILTIN(__builtin_ia32_pmovzxwq128_mask, "V2LLiV8sV2LLiUc","","avx512vl") +TARGET_BUILTIN(__builtin_ia32_pmovzxwq256_mask, "V4LLiV8sV4LLiUc","","avx512vl") #undef BUILTIN #undef TARGET_BUILTIN Index: lib/Headers/avx512bwintrin.h =================================================================== --- lib/Headers/avx512bwintrin.h +++ lib/Headers/avx512bwintrin.h @@ -1496,6 +1496,33 @@ (__mmask32) __U); } +static __inline__ __m512i __DEFAULT_FN_ATTRS +_mm512_cvtepu8_epi16 (__m256i __A) +{ + return (__m512i) __builtin_ia32_pmovzxbw512_mask ((__v32qi) __A, + (__v32hi) + _mm512_setzero_hi (), + (__mmask32) -1); +} + +static __inline__ __m512i __DEFAULT_FN_ATTRS +_mm512_mask_cvtepu8_epi16 (__m512i __W, __mmask32 __U, __m256i __A) +{ + return (__m512i) __builtin_ia32_pmovzxbw512_mask ((__v32qi) __A, + (__v32hi) __W, + (__mmask32) __U); +} + +static __inline__ __m512i __DEFAULT_FN_ATTRS +_mm512_maskz_cvtepu8_epi16 (__mmask32 __U, __m256i __A) +{ + return (__m512i) __builtin_ia32_pmovzxbw512_mask ((__v32qi) __A, + (__v32hi) + _mm512_setzero_hi(), + (__mmask32) __U); +} + + #define _mm512_cmp_epi8_mask(a, b, p) __extension__ ({ \ (__mmask16)__builtin_ia32_cmpb512_mask((__v64qi)(__m512i)(a), \ (__v64qi)(__m512i)(b), \ Index: lib/Headers/avx512fintrin.h =================================================================== --- lib/Headers/avx512fintrin.h +++ lib/Headers/avx512fintrin.h @@ -3029,6 +3029,137 @@ __u); } +static __inline__ __m512i __DEFAULT_FN_ATTRS +_mm512_cvtepu8_epi32 (__m128i __A) +{ + return (__m512i) __builtin_ia32_pmovzxbd512_mask ((__v16qi) __A, + (__v16si) + _mm512_setzero_si512 (), + (__mmask16) -1); +} + +static __inline__ __m512i __DEFAULT_FN_ATTRS +_mm512_mask_cvtepu8_epi32 (__m512i __W, __mmask16 __U, __m128i __A) +{ + return (__m512i) __builtin_ia32_pmovzxbd512_mask ((__v16qi) __A, + (__v16si) __W, + (__mmask16) __U); +} + +static __inline__ __m512i __DEFAULT_FN_ATTRS +_mm512_maskz_cvtepu8_epi32 (__mmask16 __U, __m128i __A) +{ + return (__m512i) __builtin_ia32_pmovzxbd512_mask ((__v16qi) __A, + (__v16si) + _mm512_setzero_si512 (), + (__mmask16) __U); +} + +static __inline__ __m512i __DEFAULT_FN_ATTRS +_mm512_cvtepu8_epi64 (__m128i __A) +{ + return (__m512i) __builtin_ia32_pmovzxbq512_mask ((__v16qi) __A, + (__v8di) + _mm512_setzero_si512 (), + (__mmask8) -1); +} + +static __inline__ __m512i __DEFAULT_FN_ATTRS +_mm512_mask_cvtepu8_epi64 (__m512i __W, __mmask8 __U, __m128i __A) +{ + return (__m512i) __builtin_ia32_pmovzxbq512_mask ((__v16qi) __A, + (__v8di) __W, + (__mmask8) __U); +} + +static __inline__ __m512i __DEFAULT_FN_ATTRS +_mm512_maskz_cvtepu8_epi64 (__mmask8 __U, __m128i __A) +{ + return (__m512i) __builtin_ia32_pmovzxbq512_mask ((__v16qi) __A, + (__v8di) + _mm512_setzero_si512 (), + (__mmask8) __U); +} + +static __inline__ __m512i __DEFAULT_FN_ATTRS +_mm512_cvtepu32_epi64 (__m256i __X) +{ + return (__m512i) __builtin_ia32_pmovzxdq512_mask ((__v8si) __X, + (__v8di) + _mm512_setzero_si512 (), + (__mmask8) -1); +} + +static __inline__ __m512i __DEFAULT_FN_ATTRS +_mm512_mask_cvtepu32_epi64 (__m512i __W, __mmask8 __U, __m256i __X) +{ + return (__m512i) __builtin_ia32_pmovzxdq512_mask ((__v8si) __X, + (__v8di) __W, + (__mmask8) __U); +} + +static __inline__ __m512i __DEFAULT_FN_ATTRS +_mm512_maskz_cvtepu32_epi64 (__mmask8 __U, __m256i __X) +{ + return (__m512i) __builtin_ia32_pmovzxdq512_mask ((__v8si) __X, + (__v8di) + _mm512_setzero_si512 (), + (__mmask8) __U); +} + +static __inline__ __m512i __DEFAULT_FN_ATTRS +_mm512_cvtepu16_epi32 (__m256i __A) +{ + return (__m512i) __builtin_ia32_pmovzxwd512_mask ((__v16hi) __A, + (__v16si) + _mm512_setzero_si512 (), + (__mmask16) -1); +} + +static __inline__ __m512i __DEFAULT_FN_ATTRS +_mm512_mask_cvtepu16_epi32 (__m512i __W, __mmask16 __U, __m256i __A) +{ + return (__m512i) __builtin_ia32_pmovzxwd512_mask ((__v16hi) __A, + (__v16si) __W, + (__mmask16) __U); +} + +static __inline__ __m512i __DEFAULT_FN_ATTRS +_mm512_maskz_cvtepu16_epi32 (__mmask16 __U, __m256i __A) +{ + return (__m512i) __builtin_ia32_pmovzxwd512_mask ((__v16hi) __A, + (__v16si) + _mm512_setzero_si512 (), + (__mmask16) __U); +} + +static __inline__ __m512i __DEFAULT_FN_ATTRS +_mm512_cvtepu16_epi64 (__m128i __A) +{ + return (__m512i) __builtin_ia32_pmovzxwq512_mask ((__v8hi) __A, + (__v8di) + _mm512_setzero_si512 (), + (__mmask8) -1); +} + +static __inline__ __m512i __DEFAULT_FN_ATTRS +_mm512_mask_cvtepu16_epi64 (__m512i __W, __mmask8 __U, __m128i __A) +{ + return (__m512i) __builtin_ia32_pmovzxwq512_mask ((__v8hi) __A, + (__v8di) __W, + (__mmask8) __U); +} + +static __inline__ __m512i __DEFAULT_FN_ATTRS +_mm512_maskz_cvtepu16_epi64 (__mmask8 __U, __m128i __A) +{ + return (__m512i) __builtin_ia32_pmovzxwq512_mask ((__v8hi) __A, + (__v8di) + _mm512_setzero_si512 (), + (__mmask8) __U); +} + + #define _mm512_cmp_epi32_mask(a, b, p) __extension__ ({ \ (__mmask16)__builtin_ia32_cmpd512_mask((__v16si)(__m512i)(a), \ (__v16si)(__m512i)(b), (p), \ Index: lib/Headers/avx512vlbwintrin.h =================================================================== --- lib/Headers/avx512vlbwintrin.h +++ lib/Headers/avx512vlbwintrin.h @@ -2251,6 +2251,41 @@ (__mmask16) __U); } +static __inline__ __m128i __DEFAULT_FN_ATTRS +_mm_mask_cvtepu8_epi16 (__m128i __W, __mmask32 __U, __m128i __A) +{ + return (__m128i) __builtin_ia32_pmovzxbw128_mask ((__v16qi) __A, + (__v8hi) __W, + (__mmask8) __U); +} + +static __inline__ __m128i __DEFAULT_FN_ATTRS +_mm_maskz_cvtepu8_epi16 (__mmask8 __U, __m128i __A) +{ + return (__m128i) __builtin_ia32_pmovzxbw128_mask ((__v16qi) __A, + (__v8hi) + _mm_setzero_si128 (), + (__mmask8) __U); +} + +static __inline__ __m256i __DEFAULT_FN_ATTRS +_mm256_mask_cvtepu8_epi16 (__m256i __W, __mmask32 __U, __m128i __A) +{ + return (__m256i) __builtin_ia32_pmovzxbw256_mask ((__v16qi) __A, + (__v16hi) __W, + (__mmask16) __U); +} + +static __inline__ __m256i __DEFAULT_FN_ATTRS +_mm256_maskz_cvtepu8_epi16 (__mmask16 __U, __m128i __A) +{ + return (__m256i) __builtin_ia32_pmovzxbw256_mask ((__v16qi) __A, + (__v16hi) + _mm256_setzero_si256 (), + (__mmask16) __U); +} + + #define _mm_cmp_epi8_mask(a, b, p) __extension__ ({ \ (__mmask16)__builtin_ia32_cmpb128_mask((__v16qi)(__m128i)(a), \ (__v16qi)(__m128i)(b), \ Index: lib/Headers/avx512vlintrin.h =================================================================== --- lib/Headers/avx512vlintrin.h +++ lib/Headers/avx512vlintrin.h @@ -4600,6 +4600,177 @@ __U); } +static __inline__ __m128i __DEFAULT_FN_ATTRS +_mm_mask_cvtepu8_epi32 (__m128i __W, __mmask8 __U, __m128i __A) +{ + return (__m128i) __builtin_ia32_pmovzxbd128_mask ((__v16qi) __A, + (__v4si) __W, + (__mmask8) __U); +} + +static __inline__ __m128i __DEFAULT_FN_ATTRS +_mm_maskz_cvtepu8_epi32 (__mmask8 __U, __m128i __A) +{ + return (__m128i) __builtin_ia32_pmovzxbd128_mask ((__v16qi) __A, + (__v4si) + _mm_setzero_si128 (), + (__mmask8) __U); +} + +static __inline__ __m256i __DEFAULT_FN_ATTRS +_mm256_mask_cvtepu8_epi32 (__m256i __W, __mmask8 __U, __m128i __A) +{ + return (__m256i) __builtin_ia32_pmovzxbd256_mask ((__v16qi) __A, + (__v8si) __W, + (__mmask8) __U); +} + +static __inline__ __m256i __DEFAULT_FN_ATTRS +_mm256_maskz_cvtepu8_epi32 (__mmask8 __U, __m128i __A) +{ + return (__m256i) __builtin_ia32_pmovzxbd256_mask ((__v16qi) __A, + (__v8si) + _mm256_setzero_si256 (), + (__mmask8) __U); +} + +static __inline__ __m128i __DEFAULT_FN_ATTRS +_mm_mask_cvtepu8_epi64 (__m128i __W, __mmask8 __U, __m128i __A) +{ + return (__m128i) __builtin_ia32_pmovzxbq128_mask ((__v16qi) __A, + (__v2di) __W, + (__mmask8) __U); +} + +static __inline__ __m128i __DEFAULT_FN_ATTRS +_mm_maskz_cvtepu8_epi64 (__mmask8 __U, __m128i __A) +{ + return (__m128i) __builtin_ia32_pmovzxbq128_mask ((__v16qi) __A, + (__v2di) + _mm_setzero_si128 (), + (__mmask8) __U); +} + +static __inline__ __m256i __DEFAULT_FN_ATTRS +_mm256_mask_cvtepu8_epi64 (__m256i __W, __mmask8 __U, __m128i __A) +{ + return (__m256i) __builtin_ia32_pmovzxbq256_mask ((__v16qi) __A, + (__v4di) __W, + (__mmask8) __U); +} + +static __inline__ __m256i __DEFAULT_FN_ATTRS +_mm256_maskz_cvtepu8_epi64 (__mmask8 __U, __m128i __A) +{ + return (__m256i) __builtin_ia32_pmovzxbq256_mask ((__v16qi) __A, + (__v4di) + _mm256_setzero_si256 (), + (__mmask8) __U); +} + +static __inline__ __m128i __DEFAULT_FN_ATTRS +_mm_mask_cvtepu32_epi64 (__m128i __W, __mmask8 __U, __m128i __X) +{ + return (__m128i) __builtin_ia32_pmovzxdq128_mask ((__v4si) __X, + (__v2di) __W, + (__mmask8) __U); +} + +static __inline__ __m128i __DEFAULT_FN_ATTRS +_mm_maskz_cvtepu32_epi64 (__mmask8 __U, __m128i __X) +{ + return (__m128i) __builtin_ia32_pmovzxdq128_mask ((__v4si) __X, + (__v2di) + _mm_setzero_si128 (), + (__mmask8) __U); +} + +static __inline__ __m256i __DEFAULT_FN_ATTRS +_mm256_mask_cvtepu32_epi64 (__m256i __W, __mmask8 __U, __m128i __X) +{ + return (__m256i) __builtin_ia32_pmovzxdq256_mask ((__v4si) __X, + (__v4di) __W, + (__mmask8) __U); +} + +static __inline__ __m256i __DEFAULT_FN_ATTRS +_mm256_maskz_cvtepu32_epi64 (__mmask8 __U, __m128i __X) +{ + return (__m256i) __builtin_ia32_pmovzxdq256_mask ((__v4si) __X, + (__v4di) + _mm256_setzero_si256 (), + (__mmask8) __U); +} + +static __inline__ __m128i __DEFAULT_FN_ATTRS +_mm_mask_cvtepu16_epi32 (__m128i __W, __mmask8 __U, __m128i __A) +{ + return (__m128i) __builtin_ia32_pmovzxwd128_mask ((__v8hi) __A, + (__v4si) __W, + (__mmask8) __U); +} + +static __inline__ __m128i __DEFAULT_FN_ATTRS +_mm_maskz_cvtepu16_epi32 (__mmask8 __U, __m128i __A) +{ + return (__m128i) __builtin_ia32_pmovzxwd128_mask ((__v8hi) __A, + (__v4si) + _mm_setzero_si128 (), + (__mmask8) __U); +} + +static __inline__ __m256i __DEFAULT_FN_ATTRS +_mm256_mask_cvtepu16_epi32 (__m256i __W, __mmask8 __U, __m128i __A) +{ + return (__m256i) __builtin_ia32_pmovzxwd256_mask ((__v8hi) __A, + (__v8si) __W, + (__mmask8) __U); +} + +static __inline__ __m256i __DEFAULT_FN_ATTRS +_mm256_maskz_cvtepu16_epi32 (__mmask8 __U, __m128i __A) +{ + return (__m256i) __builtin_ia32_pmovzxwd256_mask ((__v8hi) __A, + (__v8si) + _mm256_setzero_si256 (), + (__mmask8) __U); +} + +static __inline__ __m128i __DEFAULT_FN_ATTRS +_mm_mask_cvtepu16_epi64 (__m128i __W, __mmask8 __U, __m128i __A) +{ + return (__m128i) __builtin_ia32_pmovzxwq128_mask ((__v8hi) __A, + (__v2di) __W, + (__mmask8) __U); +} + +static __inline__ __m128i __DEFAULT_FN_ATTRS +_mm_maskz_cvtepu16_epi64 (__mmask8 __U, __m128i __A) +{ + return (__m128i) __builtin_ia32_pmovzxwq128_mask ((__v8hi) __A, + (__v2di) + _mm_setzero_si128 (), + (__mmask8) __U); +} + +static __inline__ __m256i __DEFAULT_FN_ATTRS +_mm256_mask_cvtepu16_epi64 (__m256i __W, __mmask8 __U, __m128i __A) +{ + return (__m256i) __builtin_ia32_pmovzxwq256_mask ((__v8hi) __A, + (__v4di) __W, + (__mmask8) __U); +} + +static __inline__ __m256i __DEFAULT_FN_ATTRS +_mm256_maskz_cvtepu16_epi64 (__mmask8 __U, __m128i __A) +{ + return (__m256i) __builtin_ia32_pmovzxwq256_mask ((__v8hi) __A, + (__v4di) + _mm256_setzero_si256 (), + (__mmask8) __U); +} + + #undef __DEFAULT_FN_ATTRS #undef __DEFAULT_FN_ATTRS_BOTH Index: test/CodeGen/avx512bw-builtins.c =================================================================== --- test/CodeGen/avx512bw-builtins.c +++ test/CodeGen/avx512bw-builtins.c @@ -1041,3 +1041,20 @@ return _mm512_maskz_unpacklo_epi16(__U, __A, __B); } +__m512i test_mm512_cvtepu8_epi16(__m256i __A) { + // CHECK-LABEL: @test_mm512_cvtepu8_epi16 + // CHECK: @llvm.x86.avx512.mask.pmovzxb.w.512 + return _mm512_cvtepu8_epi16(__A); +} + +__m512i test_mm512_mask_cvtepu8_epi16(__m512i __W, __mmask32 __U, __m256i __A) { + // CHECK-LABEL: @test_mm512_mask_cvtepu8_epi16 + // CHECK: @llvm.x86.avx512.mask.pmovzxb.w.512 + return _mm512_mask_cvtepu8_epi16(__W, __U, __A); +} + +__m512i test_mm512_maskz_cvtepu8_epi16(__mmask32 __U, __m256i __A) { + // CHECK-LABEL: @test_mm512_maskz_cvtepu8_epi16 + // CHECK: @llvm.x86.avx512.mask.pmovzxb.w.512 + return _mm512_maskz_cvtepu8_epi16(__U, __A); +} Index: test/CodeGen/avx512f-builtins.c =================================================================== --- test/CodeGen/avx512f-builtins.c +++ test/CodeGen/avx512f-builtins.c @@ -1899,3 +1899,94 @@ // CHECK: ret <8 x i64> undef return _mm512_undefined_epi32(); } + +__m512i test_mm512_cvtepu8_epi32(__m128i __A) { + // CHECK-LABEL: @test_mm512_cvtepu8_epi32 + // CHECK: @llvm.x86.avx512.mask.pmovzxb.d.512 + return _mm512_cvtepu8_epi32(__A); +} + +__m512i test_mm512_mask_cvtepu8_epi32(__m512i __W, __mmask16 __U, __m128i __A) { + // CHECK-LABEL: @test_mm512_mask_cvtepu8_epi32 + // CHECK: @llvm.x86.avx512.mask.pmovzxb.d.512 + return _mm512_mask_cvtepu8_epi32(__W, __U, __A); +} + +__m512i test_mm512_maskz_cvtepu8_epi32(__mmask16 __U, __m128i __A) { + // CHECK-LABEL: @test_mm512_maskz_cvtepu8_epi32 + // CHECK: @llvm.x86.avx512.mask.pmovzxb.d.512 + return _mm512_maskz_cvtepu8_epi32(__U, __A); +} + +__m512i test_mm512_cvtepu8_epi64(__m128i __A) { + // CHECK-LABEL: @test_mm512_cvtepu8_epi64 + // CHECK: @llvm.x86.avx512.mask.pmovzxb.q.512 + return _mm512_cvtepu8_epi64(__A); +} + +__m512i test_mm512_mask_cvtepu8_epi64(__m512i __W, __mmask8 __U, __m128i __A) { + // CHECK-LABEL: @test_mm512_mask_cvtepu8_epi64 + // CHECK: @llvm.x86.avx512.mask.pmovzxb.q.512 + return _mm512_mask_cvtepu8_epi64(__W, __U, __A); +} + +__m512i test_mm512_maskz_cvtepu8_epi64(__mmask8 __U, __m128i __A) { + // CHECK-LABEL: @test_mm512_maskz_cvtepu8_epi64 + // CHECK: @llvm.x86.avx512.mask.pmovzxb.q.512 + return _mm512_maskz_cvtepu8_epi64(__U, __A); +} + +__m512i test_mm512_cvtepu32_epi64(__m256i __X) { + // CHECK-LABEL: @test_mm512_cvtepu32_epi64 + // CHECK: @llvm.x86.avx512.mask.pmovzxd.q.512 + return _mm512_cvtepu32_epi64(__X); +} + +__m512i test_mm512_mask_cvtepu32_epi64(__m512i __W, __mmask8 __U, __m256i __X) { + // CHECK-LABEL: @test_mm512_mask_cvtepu32_epi64 + // CHECK: @llvm.x86.avx512.mask.pmovzxd.q.512 + return _mm512_mask_cvtepu32_epi64(__W, __U, __X); +} + +__m512i test_mm512_maskz_cvtepu32_epi64(__mmask8 __U, __m256i __X) { + // CHECK-LABEL: @test_mm512_maskz_cvtepu32_epi64 + // CHECK: @llvm.x86.avx512.mask.pmovzxd.q.512 + return _mm512_maskz_cvtepu32_epi64(__U, __X); +} + +__m512i test_mm512_cvtepu16_epi32(__m256i __A) { + // CHECK-LABEL: @test_mm512_cvtepu16_epi32 + // CHECK: @llvm.x86.avx512.mask.pmovzxw.d.512 + return _mm512_cvtepu16_epi32(__A); +} + +__m512i test_mm512_mask_cvtepu16_epi32(__m512i __W, __mmask16 __U, __m256i __A) { + // CHECK-LABEL: @test_mm512_mask_cvtepu16_epi32 + // CHECK: @llvm.x86.avx512.mask.pmovzxw.d.512 + return _mm512_mask_cvtepu16_epi32(__W, __U, __A); +} + +__m512i test_mm512_maskz_cvtepu16_epi32(__mmask16 __U, __m256i __A) { + // CHECK-LABEL: @test_mm512_maskz_cvtepu16_epi32 + // CHECK: @llvm.x86.avx512.mask.pmovzxw.d.512 + return _mm512_maskz_cvtepu16_epi32(__U, __A); +} + +__m512i test_mm512_cvtepu16_epi64(__m128i __A) { + // CHECK-LABEL: @test_mm512_cvtepu16_epi64 + // CHECK: @llvm.x86.avx512.mask.pmovzxw.q.512 + return _mm512_cvtepu16_epi64(__A); +} + +__m512i test_mm512_mask_cvtepu16_epi64(__m512i __W, __mmask8 __U, __m128i __A) { + // CHECK-LABEL: @test_mm512_mask_cvtepu16_epi64 + // CHECK: @llvm.x86.avx512.mask.pmovzxw.q.512 + return _mm512_mask_cvtepu16_epi64(__W, __U, __A); +} + +__m512i test_mm512_maskz_cvtepu16_epi64(__mmask8 __U, __m128i __A) { + // CHECK-LABEL: @test_mm512_maskz_cvtepu16_epi64 + // CHECK: @llvm.x86.avx512.mask.pmovzxw.q.512 + return _mm512_maskz_cvtepu16_epi64(__U, __A); +} + Index: test/CodeGen/avx512vl-builtins.c =================================================================== --- test/CodeGen/avx512vl-builtins.c +++ test/CodeGen/avx512vl-builtins.c @@ -3154,3 +3154,124 @@ // CHECK: @llvm.x86.avx512.maskz.vpermt2var.q.256 return _mm256_maskz_permutex2var_epi64(__U,__A,__I,__B); } + +__m128i test_mm_mask_cvtepu8_epi32(__m128i __W, __mmask8 __U, __m128i __A) { + // CHECK-LABEL: @test_mm_mask_cvtepu8_epi32 + // CHECK: @llvm.x86.avx512.mask.pmovzxb.d.128 + return _mm_mask_cvtepu8_epi32(__W, __U, __A); +} + +__m128i test_mm_maskz_cvtepu8_epi32(__mmask8 __U, __m128i __A) { + // CHECK-LABEL: @test_mm_maskz_cvtepu8_epi32 + // CHECK: @llvm.x86.avx512.mask.pmovzxb.d.128 + return _mm_maskz_cvtepu8_epi32(__U, __A); +} + +__m256i test_mm256_mask_cvtepu8_epi32(__m256i __W, __mmask8 __U, __m128i __A) { + // CHECK-LABEL: @test_mm256_mask_cvtepu8_epi32 + // CHECK: @llvm.x86.avx512.mask.pmovzxb.d.256 + return _mm256_mask_cvtepu8_epi32(__W, __U, __A); +} + +__m256i test_mm256_maskz_cvtepu8_epi32(__mmask8 __U, __m128i __A) { + // CHECK-LABEL: @test_mm256_maskz_cvtepu8_epi32 + // CHECK: @llvm.x86.avx512.mask.pmovzxb.d.256 + return _mm256_maskz_cvtepu8_epi32(__U, __A); +} + +__m128i test_mm_mask_cvtepu8_epi64(__m128i __W, __mmask8 __U, __m128i __A) { + // CHECK-LABEL: @test_mm_mask_cvtepu8_epi64 + // CHECK: @llvm.x86.avx512.mask.pmovzxb.q.128 + return _mm_mask_cvtepu8_epi64(__W, __U, __A); +} + +__m128i test_mm_maskz_cvtepu8_epi64(__mmask8 __U, __m128i __A) { + // CHECK-LABEL: @test_mm_maskz_cvtepu8_epi64 + // CHECK: @llvm.x86.avx512.mask.pmovzxb.q.128 + return _mm_maskz_cvtepu8_epi64(__U, __A); +} + +__m256i test_mm256_mask_cvtepu8_epi64(__m256i __W, __mmask8 __U, __m128i __A) { + // CHECK-LABEL: @test_mm256_mask_cvtepu8_epi64 + // CHECK: @llvm.x86.avx512.mask.pmovzxb.q.256 + return _mm256_mask_cvtepu8_epi64(__W, __U, __A); +} + +__m256i test_mm256_maskz_cvtepu8_epi64(__mmask8 __U, __m128i __A) { + // CHECK-LABEL: @test_mm256_maskz_cvtepu8_epi64 + // CHECK: @llvm.x86.avx512.mask.pmovzxb.q.256 + return _mm256_maskz_cvtepu8_epi64(__U, __A); +} + +__m128i test_mm_mask_cvtepu32_epi64(__m128i __W, __mmask8 __U, __m128i __X) { + // CHECK-LABEL: @test_mm_mask_cvtepu32_epi64 + // CHECK: @llvm.x86.avx512.mask.pmovzxd.q.128 + return _mm_mask_cvtepu32_epi64(__W, __U, __X); +} + +__m128i test_mm_maskz_cvtepu32_epi64(__mmask8 __U, __m128i __X) { + // CHECK-LABEL: @test_mm_maskz_cvtepu32_epi64 + // CHECK: @llvm.x86.avx512.mask.pmovzxd.q.128 + return _mm_maskz_cvtepu32_epi64(__U, __X); +} + +__m256i test_mm256_mask_cvtepu32_epi64(__m256i __W, __mmask8 __U, __m128i __X) { + // CHECK-LABEL: @test_mm256_mask_cvtepu32_epi64 + // CHECK: @llvm.x86.avx512.mask.pmovzxd.q.256 + return _mm256_mask_cvtepu32_epi64(__W, __U, __X); +} + +__m256i test_mm256_maskz_cvtepu32_epi64(__mmask8 __U, __m128i __X) { + // CHECK-LABEL: @test_mm256_maskz_cvtepu32_epi64 + // CHECK: @llvm.x86.avx512.mask.pmovzxd.q.256 + return _mm256_maskz_cvtepu32_epi64(__U, __X); +} + +__m128i test_mm_mask_cvtepu16_epi32(__m128i __W, __mmask8 __U, __m128i __A) { + // CHECK-LABEL: @test_mm_mask_cvtepu16_epi32 + // CHECK: @llvm.x86.avx512.mask.pmovzxw.d.128 + return _mm_mask_cvtepu16_epi32(__W, __U, __A); +} + +__m128i test_mm_maskz_cvtepu16_epi32(__mmask8 __U, __m128i __A) { + // CHECK-LABEL: @test_mm_maskz_cvtepu16_epi32 + // CHECK: @llvm.x86.avx512.mask.pmovzxw.d.128 + return _mm_maskz_cvtepu16_epi32(__U, __A); +} + +__m256i test_mm256_mask_cvtepu16_epi32(__m256i __W, __mmask8 __U, __m128i __A) { + // CHECK-LABEL: @test_mm256_mask_cvtepu16_epi32 + // CHECK: @llvm.x86.avx512.mask.pmovzxw.d.256 + return _mm256_mask_cvtepu16_epi32(__W, __U, __A); +} + +__m256i test_mm256_maskz_cvtepu16_epi32(__mmask8 __U, __m128i __A) { + // CHECK-LABEL: @test_mm256_maskz_cvtepu16_epi32 + // CHECK: @llvm.x86.avx512.mask.pmovzxw.d.256 + return _mm256_maskz_cvtepu16_epi32(__U, __A); +} + +__m128i test_mm_mask_cvtepu16_epi64(__m128i __W, __mmask8 __U, __m128i __A) { + // CHECK-LABEL: @test_mm_mask_cvtepu16_epi64 + // CHECK: @llvm.x86.avx512.mask.pmovzxw.q.128 + return _mm_mask_cvtepu16_epi64(__W, __U, __A); +} + +__m128i test_mm_maskz_cvtepu16_epi64(__mmask8 __U, __m128i __A) { + // CHECK-LABEL: @test_mm_maskz_cvtepu16_epi64 + // CHECK: @llvm.x86.avx512.mask.pmovzxw.q.128 + return _mm_maskz_cvtepu16_epi64(__U, __A); +} + +__m256i test_mm256_mask_cvtepu16_epi64(__m256i __W, __mmask8 __U, __m128i __A) { + // CHECK-LABEL: @test_mm256_mask_cvtepu16_epi64 + // CHECK: @llvm.x86.avx512.mask.pmovzxw.q.256 + return _mm256_mask_cvtepu16_epi64(__W, __U, __A); +} + +__m256i test_mm256_maskz_cvtepu16_epi64(__mmask8 __U, __m128i __A) { + // CHECK-LABEL: @test_mm256_maskz_cvtepu16_epi64 + // CHECK: @llvm.x86.avx512.mask.pmovzxw.q.256 + return _mm256_maskz_cvtepu16_epi64(__U, __A); +} + Index: test/CodeGen/avx512vlbw-builtins.c =================================================================== --- test/CodeGen/avx512vlbw-builtins.c +++ test/CodeGen/avx512vlbw-builtins.c @@ -1705,3 +1705,146 @@ return _mm256_maskz_unpacklo_epi16(__U, __A, __B); } +__m128i test_mm_mask_cvtepu8_epi32(__m128i __W, __mmask8 __U, __m128i __A) { + // CHECK-LABEL: @test_mm_mask_cvtepu8_epi32 + // CHECK: @llvm.x86.avx512.mask.pmovzxb.d.128 + return _mm_mask_cvtepu8_epi32(__W, __U, __A); +} + +__m128i test_mm_maskz_cvtepu8_epi32(__mmask8 __U, __m128i __A) { + // CHECK-LABEL: @test_mm_maskz_cvtepu8_epi32 + // CHECK: @llvm.x86.avx512.mask.pmovzxb.d.128 + return _mm_maskz_cvtepu8_epi32(__U, __A); +} + +__m256i test_mm256_mask_cvtepu8_epi32(__m256i __W, __mmask8 __U, __m128i __A) { + // CHECK-LABEL: @test_mm256_mask_cvtepu8_epi32 + // CHECK: @llvm.x86.avx512.mask.pmovzxb.d.256 + return _mm256_mask_cvtepu8_epi32(__W, __U, __A); +} + +__m256i test_mm256_maskz_cvtepu8_epi32(__mmask8 __U, __m128i __A) { + // CHECK-LABEL: @test_mm256_maskz_cvtepu8_epi32 + // CHECK: @llvm.x86.avx512.mask.pmovzxb.d.256 + return _mm256_maskz_cvtepu8_epi32(__U, __A); +} + +__m128i test_mm_mask_cvtepu8_epi64(__m128i __W, __mmask8 __U, __m128i __A) { + // CHECK-LABEL: @test_mm_mask_cvtepu8_epi64 + // CHECK: @llvm.x86.avx512.mask.pmovzxb.q.128 + return _mm_mask_cvtepu8_epi64(__W, __U, __A); +} + +__m128i test_mm_maskz_cvtepu8_epi64(__mmask8 __U, __m128i __A) { + // CHECK-LABEL: @test_mm_maskz_cvtepu8_epi64 + // CHECK: @llvm.x86.avx512.mask.pmovzxb.q.128 + return _mm_maskz_cvtepu8_epi64(__U, __A); +} + +__m256i test_mm256_mask_cvtepu8_epi64(__m256i __W, __mmask8 __U, __m128i __A) { + // CHECK-LABEL: @test_mm256_mask_cvtepu8_epi64 + // CHECK: @llvm.x86.avx512.mask.pmovzxb.q.256 + return _mm256_mask_cvtepu8_epi64(__W, __U, __A); +} + +__m256i test_mm256_maskz_cvtepu8_epi64(__mmask8 __U, __m128i __A) { + // CHECK-LABEL: @test_mm256_maskz_cvtepu8_epi64 + // CHECK: @llvm.x86.avx512.mask.pmovzxb.q.256 + return _mm256_maskz_cvtepu8_epi64(__U, __A); +} + +__m128i test_mm_mask_cvtepu32_epi64(__m128i __W, __mmask8 __U, __m128i __X) { + // CHECK-LABEL: @test_mm_mask_cvtepu32_epi64 + // CHECK: @llvm.x86.avx512.mask.pmovzxd.q.128 + return _mm_mask_cvtepu32_epi64(__W, __U, __X); +} + +__m128i test_mm_maskz_cvtepu32_epi64(__mmask8 __U, __m128i __X) { + // CHECK-LABEL: @test_mm_maskz_cvtepu32_epi64 + // CHECK: @llvm.x86.avx512.mask.pmovzxd.q.128 + return _mm_maskz_cvtepu32_epi64(__U, __X); +} + +__m256i test_mm256_mask_cvtepu32_epi64(__m256i __W, __mmask8 __U, __m128i __X) { + // CHECK-LABEL: @test_mm256_mask_cvtepu32_epi64 + // CHECK: @llvm.x86.avx512.mask.pmovzxd.q.256 + return _mm256_mask_cvtepu32_epi64(__W, __U, __X); +} + +__m256i test_mm256_maskz_cvtepu32_epi64(__mmask8 __U, __m128i __X) { + // CHECK-LABEL: @test_mm256_maskz_cvtepu32_epi64 + // CHECK: @llvm.x86.avx512.mask.pmovzxd.q.256 + return _mm256_maskz_cvtepu32_epi64(__U, __X); +} + +__m128i test_mm_mask_cvtepu16_epi32(__m128i __W, __mmask8 __U, __m128i __A) { + // CHECK-LABEL: @test_mm_mask_cvtepu16_epi32 + // CHECK: @llvm.x86.avx512.mask.pmovzxw.d.128 + return _mm_mask_cvtepu16_epi32(__W, __U, __A); +} + +__m128i test_mm_maskz_cvtepu16_epi32(__mmask8 __U, __m128i __A) { + // CHECK-LABEL: @test_mm_maskz_cvtepu16_epi32 + // CHECK: @llvm.x86.avx512.mask.pmovzxw.d.128 + return _mm_maskz_cvtepu16_epi32(__U, __A); +} + +__m256i test_mm256_mask_cvtepu16_epi32(__m256i __W, __mmask8 __U, __m128i __A) { + // CHECK-LABEL: @test_mm256_mask_cvtepu16_epi32 + // CHECK: @llvm.x86.avx512.mask.pmovzxw.d.256 + return _mm256_mask_cvtepu16_epi32(__W, __U, __A); +} + +__m256i test_mm256_maskz_cvtepu16_epi32(__mmask8 __U, __m128i __A) { + // CHECK-LABEL: @test_mm256_maskz_cvtepu16_epi32 + // CHECK: @llvm.x86.avx512.mask.pmovzxw.d.256 + return _mm256_maskz_cvtepu16_epi32(__U, __A); +} + +__m128i test_mm_mask_cvtepu16_epi64(__m128i __W, __mmask8 __U, __m128i __A) { + // CHECK-LABEL: @test_mm_mask_cvtepu16_epi64 + // CHECK: @llvm.x86.avx512.mask.pmovzxw.q.128 + return _mm_mask_cvtepu16_epi64(__W, __U, __A); +} + +__m128i test_mm_maskz_cvtepu16_epi64(__mmask8 __U, __m128i __A) { + // CHECK-LABEL: @test_mm_maskz_cvtepu16_epi64 + // CHECK: @llvm.x86.avx512.mask.pmovzxw.q.128 + return _mm_maskz_cvtepu16_epi64(__U, __A); +} + +__m256i test_mm256_mask_cvtepu16_epi64(__m256i __W, __mmask8 __U, __m128i __A) { + // CHECK-LABEL: @test_mm256_mask_cvtepu16_epi64 + // CHECK: @llvm.x86.avx512.mask.pmovzxw.q.256 + return _mm256_mask_cvtepu16_epi64(__W, __U, __A); +} + +__m256i test_mm256_maskz_cvtepu16_epi64(__mmask8 __U, __m128i __A) { + // CHECK-LABEL: @test_mm256_maskz_cvtepu16_epi64 + // CHECK: @llvm.x86.avx512.mask.pmovzxw.q.256 + return _mm256_maskz_cvtepu16_epi64(__U, __A); +} + +__m128i test_mm_mask_cvtepu8_epi16(__m128i __W, __mmask32 __U, __m128i __A) { + // CHECK-LABEL: @test_mm_mask_cvtepu8_epi16 + // CHECK: @llvm.x86.avx512.mask.pmovzxb.w.128 + return _mm_mask_cvtepu8_epi16(__W, __U, __A); +} + +__m128i test_mm_maskz_cvtepu8_epi16(__mmask8 __U, __m128i __A) { + // CHECK-LABEL: @test_mm_maskz_cvtepu8_epi16 + // CHECK: @llvm.x86.avx512.mask.pmovzxb.w.128 + return _mm_maskz_cvtepu8_epi16(__U, __A); +} + +__m256i test_mm256_mask_cvtepu8_epi16(__m256i __W, __mmask32 __U, __m128i __A) { + // CHECK-LABEL: @test_mm256_mask_cvtepu8_epi16 + // CHECK: @llvm.x86.avx512.mask.pmovzxb.w.256 + return _mm256_mask_cvtepu8_epi16(__W, __U, __A); +} + +__m256i test_mm256_maskz_cvtepu8_epi16(__mmask16 __U, __m128i __A) { + // CHECK-LABEL: @test_mm256_maskz_cvtepu8_epi16 + // CHECK: @llvm.x86.avx512.mask.pmovzxb.w.256 + return _mm256_maskz_cvtepu8_epi16(__U, __A); +}