Index: lib/Headers/avx512bwintrin.h =================================================================== --- lib/Headers/avx512bwintrin.h +++ lib/Headers/avx512bwintrin.h @@ -2028,18 +2028,17 @@ static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_set1_epi8 (__m512i __O, __mmask64 __M, char __A) { - return (__m512i) __builtin_ia32_pbroadcastb512_gpr_mask (__A, - (__v64qi) __O, - __M); + __m512i __V = _mm512_set1_epi8(__A); + return (__m512i) __builtin_ia32_selectb_512(__M,(__v64qi)__V,(__v64qi) __O); + } static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_set1_epi8 (__mmask64 __M, char __A) { - return (__m512i) __builtin_ia32_pbroadcastb512_gpr_mask (__A, - (__v64qi) - _mm512_setzero_qi(), - __M); + __m512i __O = _mm512_setzero_si512(); + __m512i __V = _mm512_set1_epi8(__A); + return (__m512i) __builtin_ia32_selectb_512(__M,(__v64qi) __V,(__v64qi) __O); } static __inline__ __mmask64 __DEFAULT_FN_ATTRS @@ -2219,17 +2218,18 @@ static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_set1_epi16 (__m512i __O, __mmask32 __M, short __A) { - return (__m512i) __builtin_ia32_pbroadcastw512_gpr_mask (__A, - (__v32hi) __O, - __M); + __m512i __V = _mm512_set1_epi16(__A); + return (__m512i) __builtin_ia32_selectw_512(__M,(__v32hi) __V,(__v32hi) __O); + } static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_set1_epi16 (__mmask32 __M, short __A) { - return (__m512i) __builtin_ia32_pbroadcastw512_gpr_mask (__A, - (__v32hi) _mm512_setzero_hi(), - __M); + __m512i __O = _mm512_setzero_si512(); + __m512i __V = _mm512_set1_epi16(__A); + return (__m512i) __builtin_ia32_selectw_512(__M,(__v32hi) __V,(__v32hi) __O); + } static __inline__ __m512i __DEFAULT_FN_ATTRS Index: lib/Headers/avx512fintrin.h =================================================================== --- lib/Headers/avx512fintrin.h +++ lib/Headers/avx512fintrin.h @@ -258,30 +258,6 @@ (__v8di) _mm512_setzero_si512()); } -static __inline __m512i __DEFAULT_FN_ATTRS -_mm512_maskz_set1_epi32(__mmask16 __M, int __A) -{ - return (__m512i) __builtin_ia32_pbroadcastd512_gpr_mask (__A, - (__v16si) - _mm512_setzero_si512 (), - __M); -} - -static __inline __m512i __DEFAULT_FN_ATTRS -_mm512_maskz_set1_epi64(__mmask8 __M, long long __A) -{ -#ifdef __x86_64__ - return (__m512i) __builtin_ia32_pbroadcastq512_gpr_mask (__A, - (__v8di) - _mm512_setzero_si512 (), - __M); -#else - return (__m512i) __builtin_ia32_pbroadcastq512_mem_mask (__A, - (__v8di) - _mm512_setzero_si512 (), - __M); -#endif -} static __inline __m512 __DEFAULT_FN_ATTRS _mm512_setzero_ps(void) @@ -340,12 +316,30 @@ __s, __s, __s, __s, __s, __s, __s, __s }; } + static __inline __m512i __DEFAULT_FN_ATTRS + _mm512_maskz_set1_epi32(__mmask16 __M, int __A) + { + __m512i __O = _mm512_setzero_si512(); + __m512i __V = _mm512_set1_epi32(__A); + return (__m512i) __builtin_ia32_selectd_512(__M,(__v16si) __V,(__v16si) __O); + } + static __inline __m512i __DEFAULT_FN_ATTRS _mm512_set1_epi64(long long __d) { return (__m512i)(__v8di){ __d, __d, __d, __d, __d, __d, __d, __d }; } +static __inline __m512i __DEFAULT_FN_ATTRS + _mm512_maskz_set1_epi64(__mmask8 __M, long long __A) + { + __m512i __O = _mm512_setzero_si512(); + __m512i __V = _mm512_set1_epi64(__A); + return (__m512i) __builtin_ia32_selectq_512(__M,(__v8di) __V,(__v8di) __O); + + } + + static __inline__ __m512 __DEFAULT_FN_ATTRS _mm512_broadcastss_ps(__m128 __A) { @@ -9742,16 +9736,17 @@ static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_set1_epi32 (__m512i __O, __mmask16 __M, int __A) { - return (__m512i) __builtin_ia32_pbroadcastd512_gpr_mask (__A, (__v16si) __O, - __M); + __m512i __V = _mm512_set1_epi32(__A); + return (__m512i) __builtin_ia32_selectd_512(__M,(__v16si) __V,(__v16si) __O); } #ifdef __x86_64__ static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_set1_epi64 (__m512i __O, __mmask8 __M, long long __A) { - return (__m512i) __builtin_ia32_pbroadcastq512_gpr_mask (__A, (__v8di) __O, - __M); + __m512i __V = _mm512_set1_epi64(__A); + return (__m512i) __builtin_ia32_selectq_512(__M,(__v8di) __V,(__v8di) __O); + } #endif Index: lib/Headers/avx512vlbwintrin.h =================================================================== --- lib/Headers/avx512vlbwintrin.h +++ lib/Headers/avx512vlbwintrin.h @@ -2660,35 +2660,31 @@ static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_mask_set1_epi8 (__m128i __O, __mmask16 __M, char __A) { - return (__m128i) __builtin_ia32_pbroadcastb128_gpr_mask (__A, - (__v16qi) __O, - __M); + __m128i __V = _mm_set1_epi8(__A); + return (__m128i) __builtin_ia32_selectb_128(__M,(__v16qi) __V,(__v16qi) __O); } static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_maskz_set1_epi8 (__mmask16 __M, char __A) { - return (__m128i) __builtin_ia32_pbroadcastb128_gpr_mask (__A, - (__v16qi) - _mm_setzero_si128 (), - __M); + __m128i __O = _mm_setzero_si128(); + __m128i __V = _mm_set1_epi8(__A); + return (__m128i) __builtin_ia32_selectb_128(__M,(__v16qi) __V,(__v16qi) __O); } static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_mask_set1_epi8 (__m256i __O, __mmask32 __M, char __A) { - return (__m256i) __builtin_ia32_pbroadcastb256_gpr_mask (__A, - (__v32qi) __O, - __M); + __m256i __V = _mm256_set1_epi8(__A); + return (__m256i) __builtin_ia32_selectb_256(__M,(__v32qi) __V,(__v32qi) __O); } static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_maskz_set1_epi8 (__mmask32 __M, char __A) { - return (__m256i) __builtin_ia32_pbroadcastb256_gpr_mask (__A, - (__v32qi) - _mm256_setzero_si256 (), - __M); + __m256i __O = _mm256_setzero_si256(); + __m256i __V = _mm256_set1_epi8(__A); + return (__m256i) __builtin_ia32_selectb_256(__M,(__v32qi) __V, (__v32qi)__O); } static __inline__ __m128i __DEFAULT_FN_ATTRS @@ -3025,33 +3021,32 @@ static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_mask_set1_epi16 (__m256i __O, __mmask16 __M, short __A) { - return (__m256i) __builtin_ia32_pbroadcastw256_gpr_mask (__A, - (__v16hi) __O, - __M); + __m256i __V=_mm256_set1_epi16(__A); + return (__m256i) __builtin_ia32_selectw_256 (__M,(__v16hi) __V,(__v16hi) __O); } static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_maskz_set1_epi16 (__mmask16 __M, short __A) { - return (__m256i) __builtin_ia32_pbroadcastw256_gpr_mask (__A, - (__v16hi) _mm256_setzero_si256 (), - __M); + __m256i __O = _mm256_setzero_si256(); + __m256i __V = _mm256_set1_epi16(__A); + return (__m256i) __builtin_ia32_selectw_256(__M,(__v16hi)__V,(__v16hi) __O); } static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_mask_set1_epi16 (__m128i __O, __mmask8 __M, short __A) { - return (__m128i) __builtin_ia32_pbroadcastw128_gpr_mask (__A, - (__v8hi) __O, - __M); + __m128i __V = _mm_set1_epi16(__A); + return (__m128i) __builtin_ia32_selectw_128(__M,(__v8hi) __V,(__v8hi) __O); + } static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_maskz_set1_epi16 (__mmask8 __M, short __A) { - return (__m128i) __builtin_ia32_pbroadcastw128_gpr_mask (__A, - (__v8hi) _mm_setzero_si128 (), - __M); + __m128i __O = _mm_setzero_si128(); + __m128i __V = _mm_set1_epi16(__A); + return (__m128i) __builtin_ia32_selectw_128(__M,(__v8hi) __V,(__v8hi) __O); } static __inline__ __m128i __DEFAULT_FN_ATTRS Index: lib/Headers/avx512vlintrin.h =================================================================== --- lib/Headers/avx512vlintrin.h +++ lib/Headers/avx512vlintrin.h @@ -5723,59 +5723,59 @@ (__v4df)_mm256_setzero_pd()); } +static __inline__ __m128i __DEFAULT_FN_ATTRS + _mm_mask_set1_epi32(__m128i __O, __mmask8 __M, int __A) { + return (__m128i)__builtin_ia32_selectd_128(__M, (__v4si) _mm_set1_epi32(__A), (__v4si)__O); + } -#define _mm_mask_set1_epi32(O, M, A) __extension__ ({ \ - (__m128i)__builtin_ia32_pbroadcastd128_gpr_mask((int)(A), \ - (__v4si)(__m128i)(O), \ - (__mmask8)(M)); }) +static __inline__ __m128i __DEFAULT_FN_ATTRS + _mm_maskz_set1_epi32( __mmask8 __M, int __A) { + return (__m128i)__builtin_ia32_selectd_128(__M, (__v4si) _mm_set1_epi32(__A), (__v4si)_mm_setzero_si128()); + } -#define _mm_maskz_set1_epi32(M, A) __extension__ ({ \ - (__m128i)__builtin_ia32_pbroadcastd128_gpr_mask((int)(A), \ - (__v4si)_mm_setzero_si128(), \ - (__mmask8)(M)); }) +static __inline__ __m256i __DEFAULT_FN_ATTRS + _mm256_mask_set1_epi32(__m256i __O, __mmask8 __M, int __A) { + return (__m256i)__builtin_ia32_selectd_256(__M, (__v8si) _mm256_set1_epi32(__A), (__v8si)__O); + } -#define _mm256_mask_set1_epi32(O, M, A) __extension__ ({ \ - (__m256i)__builtin_ia32_pbroadcastd256_gpr_mask((int)(A), \ - (__v8si)(__m256i)(O), \ - (__mmask8)(M)); }) +static __inline__ __m256i __DEFAULT_FN_ATTRS + _mm256_maskz_set1_epi32( __mmask8 __M, int __A) { + return (__m256i)__builtin_ia32_selectd_256(__M, (__v8si) _mm256_set1_epi32(__A), (__v8si)_mm256_setzero_si256()); + } -#define _mm256_maskz_set1_epi32(M, A) __extension__ ({ \ - (__m256i)__builtin_ia32_pbroadcastd256_gpr_mask((int)(A), \ - (__v8si)_mm256_setzero_si256(), \ - (__mmask8)(M)); }) #ifdef __x86_64__ static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_mask_set1_epi64 (__m128i __O, __mmask8 __M, long long __A) { - return (__m128i) __builtin_ia32_pbroadcastq128_gpr_mask (__A, (__v2di) __O, - __M); + __m128i __V = _mm_set1_epi8(__A); + return (__m128i) __builtin_ia32_selectq_128(__M,(__v2di) __V,(__v2di) __O); } static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_maskz_set1_epi64 (__mmask8 __M, long long __A) { - return (__m128i) __builtin_ia32_pbroadcastq128_gpr_mask (__A, - (__v2di) - _mm_setzero_si128 (), - __M); + __m128i __O = _mm_setzero_si128(); + __m128i __V = _mm_set1_epi8(__A); + return (__m128i) __builtin_ia32_selectq_128(__M,(__v2di) __V,(__v2di) __O); } static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_mask_set1_epi64 (__m256i __O, __mmask8 __M, long long __A) { - return (__m256i) __builtin_ia32_pbroadcastq256_gpr_mask (__A, (__v4di) __O, - __M); + __m256i __V=_mm256_set1_epi64x(__A); + + return (__m256i) __builtin_ia32_selectq_256( __M, (__v4di) __V, (__v4di) __O) ; } static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_maskz_set1_epi64 (__mmask8 __M, long long __A) { - return (__m256i) __builtin_ia32_pbroadcastq256_gpr_mask (__A, - (__v4di) - _mm256_setzero_si256 (), - __M); + __m256i __V = _mm256_set1_epi64x(__A); + __m256i __O = _mm256_setzero_si256(); + return (__m256i) __builtin_ia32_selectq_256(__M,(__v4di) __V, (__v4di) __O); } + #endif #define _mm_fixupimm_pd(A, B, C, imm) __extension__ ({ \ Index: test/CodeGen/avx512bw-builtins.c =================================================================== --- test/CodeGen/avx512bw-builtins.c +++ test/CodeGen/avx512bw-builtins.c @@ -1432,13 +1432,139 @@ __m512i test_mm512_mask_set1_epi8(__m512i __O, __mmask64 __M, char __A) { // CHECK-LABEL: @test_mm512_mask_set1_epi8 - // CHECK: @llvm.x86.avx512.mask.pbroadcast.b.gpr.512 + // CHECK: insertelement <64 x i8> undef, i8 %{{.*}}, i32 0 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 1 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 2 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 3 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 4 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 5 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 6 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 7 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 8 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 9 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 10 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 11 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 12 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 13 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 14 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 15 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 16 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 17 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 18 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 19 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 20 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 21 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 22 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 23 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 24 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 25 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 26 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 27 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 28 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 29 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 30 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 31 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 34 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 35 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 36 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 37 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 38 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 39 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 40 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 41 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 42 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 43 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 44 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 45 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 46 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 47 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 48 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 49 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 50 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 51 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 52 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 53 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 54 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 55 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 56 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 57 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 58 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 59 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 60 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 61 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 62 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 63 + // CHECK: select <64 x i1> %{{.*}}, <64 x i8> %{{.*}}, <64 x i8> %{{.*}} return _mm512_mask_set1_epi8(__O, __M, __A); } __m512i test_mm512_maskz_set1_epi8(__mmask64 __M, char __A) { // CHECK-LABEL: @test_mm512_maskz_set1_epi8 - // CHECK: @llvm.x86.avx512.mask.pbroadcast.b.gpr.512 + // CHECK: insertelement <64 x i8> undef, i8 %{{.*}}, i32 0 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 1 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 2 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 3 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 4 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 5 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 6 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 7 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 8 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 9 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 10 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 11 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 12 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 13 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 14 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 15 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 16 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 17 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 18 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 19 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 20 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 21 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 22 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 23 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 24 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 25 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 26 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 27 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 28 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 29 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 30 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 31 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 32 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 33 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 34 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 35 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 36 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 37 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 38 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 39 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 40 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 41 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 42 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 43 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 44 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 45 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 46 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 47 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 48 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 49 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 50 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 51 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 52 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 53 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 54 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 55 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 56 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 57 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 58 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 59 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 60 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 61 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 62 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 63 + // CHECK: select <64 x i1> %{{.*}}, <64 x i8> %{{.*}}, <64 x i8> %{{.*}} return _mm512_maskz_set1_epi8(__M, __A); } @@ -1597,13 +1723,77 @@ __m512i test_mm512_mask_set1_epi16(__m512i __O, __mmask32 __M, short __A) { // CHECK-LABEL: @test_mm512_mask_set1_epi16 - // CHECK: @llvm.x86.avx512.mask.pbroadcast.w.gpr.512 + // CHECK: insertelement <32 x i16> undef, i16 %{{.*}}, i32 0 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 1 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 2 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 3 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 4 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 5 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 6 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 7 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 8 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 9 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 10 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 11 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 12 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 13 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 14 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 15 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 16 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 17 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 18 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 19 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 20 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 21 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 22 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 23 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 24 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 25 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 26 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 27 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 28 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 29 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 30 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 31 + // CHECK: select <32 x i1> %{{.*}}, <32 x i16> %{{.*}}, <32 x i16> %{{.*}} return _mm512_mask_set1_epi16(__O, __M, __A); } __m512i test_mm512_maskz_set1_epi16(__mmask32 __M, short __A) { // CHECK-LABEL: @test_mm512_maskz_set1_epi16 - // CHECK: @llvm.x86.avx512.mask.pbroadcast.w.gpr.512 + // CHECK: insertelement <32 x i16> undef, i16 %{{.*}}, i32 0 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 1 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 2 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 3 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 4 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 5 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 6 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 7 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 8 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 9 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 10 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 11 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 12 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 13 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 14 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 15 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 16 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 17 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 18 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 19 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 20 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 21 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 22 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 23 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 24 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 25 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 26 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 27 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 28 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 29 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 30 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 31 + // CHECK: select <32 x i1> %{{.*}}, <32 x i16> %{{.*}}, <32 x i16> %{{.*}} return _mm512_maskz_set1_epi16(__M, __A); } __m512i test_mm512_permutexvar_epi16(__m512i __A, __m512i __B) { Index: test/CodeGen/avx512f-builtins.c =================================================================== --- test/CodeGen/avx512f-builtins.c +++ test/CodeGen/avx512f-builtins.c @@ -7722,11 +7722,51 @@ __m512i test_mm512_mask_set1_epi32 (__m512i __O, __mmask16 __M, int __A) { - //CHECK-LABEL: @test_mm512_mask_set1_epi32 - //CHECK: @llvm.x86.avx512.mask.pbroadcast.d.gpr.512 + // CHECK-LABEL: @test_mm512_mask_set1_epi32 + // CHECK: insertelement <16 x i32> undef, i32 %{{.*}}, i32 0 + // CHECK: insertelement <16 x i32> %{{.*}}, i32 %{{.*}}, i32 1 + // CHECK: insertelement <16 x i32> %{{.*}}, i32 %{{.*}}, i32 2 + // CHECK: insertelement <16 x i32> %{{.*}}, i32 %{{.*}}, i32 3 + // CHECK: insertelement <16 x i32> %{{.*}}, i32 %{{.*}}, i32 4 + // CHECK: insertelement <16 x i32> %{{.*}}, i32 %{{.*}}, i32 5 + // CHECK: insertelement <16 x i32> %{{.*}}, i32 %{{.*}}, i32 6 + // CHECK: insertelement <16 x i32> %{{.*}}, i32 %{{.*}}, i32 7 + // CHECK: insertelement <16 x i32> %{{.*}}, i32 %{{.*}}, i32 8 + // CHECK: insertelement <16 x i32> %{{.*}}, i32 %{{.*}}, i32 9 + // CHECK: insertelement <16 x i32> %{{.*}}, i32 %{{.*}}, i32 10 + // CHECK: insertelement <16 x i32> %{{.*}}, i32 %{{.*}}, i32 11 + // CHECK: insertelement <16 x i32> %{{.*}}, i32 %{{.*}}, i32 12 + // CHECK: insertelement <16 x i32> %{{.*}}, i32 %{{.*}}, i32 13 + // CHECK: insertelement <16 x i32> %{{.*}}, i32 %{{.*}}, i32 14 + // CHECK: insertelement <16 x i32> %{{.*}}, i32 %{{.*}}, i32 15 + // CHECK: select <16 x i1> %{{.*}}, <16 x i32> %{{.*}}, <16 x i32> %{{.*}} return _mm512_mask_set1_epi32 ( __O, __M, __A); } +__m512i test_mm512_maskz_set1_epi32(__mmask16 __M, int __A) +{ + // CHECK-LABEL: @test_mm512_maskz_set1_epi32 + // CHECK: insertelement <16 x i32> undef, i32 %{{.*}}, i32 0 + // CHECK: insertelement <16 x i32> %{{.*}}, i32 %{{.*}}, i32 1 + // CHECK: insertelement <16 x i32> %{{.*}}, i32 %{{.*}}, i32 2 + // CHECK: insertelement <16 x i32> %{{.*}}, i32 %{{.*}}, i32 3 + // CHECK: insertelement <16 x i32> %{{.*}}, i32 %{{.*}}, i32 4 + // CHECK: insertelement <16 x i32> %{{.*}}, i32 %{{.*}}, i32 5 + // CHECK: insertelement <16 x i32> %{{.*}}, i32 %{{.*}}, i32 6 + // CHECK: insertelement <16 x i32> %{{.*}}, i32 %{{.*}}, i32 7 + // CHECK: insertelement <16 x i32> %{{.*}}, i32 %{{.*}}, i32 8 + // CHECK: insertelement <16 x i32> %{{.*}}, i32 %{{.*}}, i32 9 + // CHECK: insertelement <16 x i32> %{{.*}}, i32 %{{.*}}, i32 10 + // CHECK: insertelement <16 x i32> %{{.*}}, i32 %{{.*}}, i32 11 + // CHECK: insertelement <16 x i32> %{{.*}}, i32 %{{.*}}, i32 12 + // CHECK: insertelement <16 x i32> %{{.*}}, i32 %{{.*}}, i32 13 + // CHECK: insertelement <16 x i32> %{{.*}}, i32 %{{.*}}, i32 14 + // CHECK: insertelement <16 x i32> %{{.*}}, i32 %{{.*}}, i32 15 + // CHECK: select <16 x i1> %{{.*}}, <16 x i32> %{{.*}}, <16 x i32> %{{.*}} + return _mm512_maskz_set1_epi32(__M, __A); +} + + __m512i test_mm512_set_epi8(char e63, char e62, char e61, char e60, char e59, char e58, char e57, char e56, char e55, char e54, char e53, char e52, char e51, char e50, char e49, char e48, char e47, char e46, char e45, @@ -7925,12 +7965,35 @@ #ifdef __x86_64__ __m512i test_mm512_mask_set1_epi64 (__m512i __O, __mmask8 __M, long long __A) { - //CHECK-LABEL: @test_mm512_mask_set1_epi64 - //CHECK: @llvm.x86.avx512.mask.pbroadcast.q.gpr.512 + //CHECK-LABEL: @test_mm512_mask_set1_epi64 + // CHECK: insertelement <8 x i64> undef, i64 %{{.*}}, i32 0 + // CHECK: insertelement <8 x i64> %{{.*}}, i64 %{{.*}}, i32 1 + // CHECK: insertelement <8 x i64> %{{.*}}, i64 %{{.*}}, i32 2 + // CHECK: insertelement <8 x i64> %{{.*}}, i64 %{{.*}}, i32 3 + // CHECK: insertelement <8 x i64> %{{.*}}, i64 %{{.*}}, i32 4 + // CHECK: insertelement <8 x i64> %{{.*}}, i64 %{{.*}}, i32 5 + // CHECK: insertelement <8 x i64> %{{.*}}, i64 %{{.*}}, i32 6 + // CHECK: insertelement <8 x i64> %{{.*}}, i64 %{{.*}}, i32 7 + // CHECK: select <8 x i1> %{{.*}}, <8 x i64> %{{.*}}, <8 x i64> %{{.*}} return _mm512_mask_set1_epi64 (__O, __M, __A); } #endif +__m512i test_mm512_maskz_set1_epi64(__mmask8 __M, long long __A) { + // CHECK-LABEL: @test_mm512_maskz_set1_epi64 + // CHECK: insertelement <8 x i64> undef, i64 %{{.*}}, i32 0 + // CHECK: insertelement <8 x i64> %{{.*}}, i64 %{{.*}}, i32 1 + // CHECK: insertelement <8 x i64> %{{.*}}, i64 %{{.*}}, i32 2 + // CHECK: insertelement <8 x i64> %{{.*}}, i64 %{{.*}}, i32 3 + // CHECK: insertelement <8 x i64> %{{.*}}, i64 %{{.*}}, i32 4 + // CHECK: insertelement <8 x i64> %{{.*}}, i64 %{{.*}}, i32 5 + // CHECK: insertelement <8 x i64> %{{.*}}, i64 %{{.*}}, i32 6 + // CHECK: insertelement <8 x i64> %{{.*}}, i64 %{{.*}}, i32 7 + // CHECK: select <8 x i1> %{{.*}}, <8 x i64> %{{.*}}, <8 x i64> %{{.*}} + return _mm512_maskz_set1_epi64(__M, __A); +} + + __m512i test_mm512_set_epi64 (long long __A, long long __B, long long __C, long long __D, long long __E, long long __F, long long __G, long long __H) Index: test/CodeGen/avx512vl-builtins.c =================================================================== --- test/CodeGen/avx512vl-builtins.c +++ test/CodeGen/avx512vl-builtins.c @@ -4486,50 +4486,120 @@ __m128i test_mm_mask_set1_epi32(__m128i __O, __mmask8 __M) { // CHECK-LABEL: @test_mm_mask_set1_epi32 - // CHECK: @llvm.x86.avx512.mask.pbroadcast.d.gpr.128 + // CHECK: insertelement <4 x i32> undef, i32 %{{.*}}, i32 0 + // CHECK: insertelement <4 x i32> %{{.*}}32 1 + // CHECK: insertelement <4 x i32> %{{.*}}32 2 + // CHECK: insertelement <4 x i32> %{{.*}}32 3 + // CHECK: shufflevector <8 x i1> %{{.*}}, <8 x i1> %{{.*}}, <4 x i32> + // CHECK: select <4 x i1> %{{.*}}, <4 x i32> %{{.*}}, <4 x i32> %{{.*}} return _mm_mask_set1_epi32(__O, __M, 5); } __m128i test_mm_maskz_set1_epi32(__mmask8 __M) { // CHECK-LABEL: @test_mm_maskz_set1_epi32 - // CHECK: @llvm.x86.avx512.mask.pbroadcast.d.gpr.128 + // CHECK: insertelement <4 x i32> undef, i32 %{{.*}}, i32 0 + // CHECK: insertelement <4 x i32> %{{.*}}32 1 + // CHECK: insertelement <4 x i32> %{{.*}}32 2 + // CHECK: insertelement <4 x i32> %{{.*}}32 3 + // CHECK: shufflevector <8 x i1> %{{.*}}, <8 x i1> %{{.*}}, <4 x i32> + // CHECK: select <4 x i1> %{{.*}}, <4 x i32> %{{.*}}, <4 x i32> %{{.*}} return _mm_maskz_set1_epi32(__M, 5); } __m256i test_mm256_mask_set1_epi32(__m256i __O, __mmask8 __M) { // CHECK-LABEL: @test_mm256_mask_set1_epi32 - // CHECK: @llvm.x86.avx512.mask.pbroadcast.d.gpr.256 + // CHECK: insertelement <8 x i32> undef, i32 %{{.*}}, i32 0 + // CHECK: insertelement <8 x i32> %{{.*}}, i32 %{{.*}}, i32 1 + // CHECK: insertelement <8 x i32> %{{.*}}, i32 %{{.*}}, i32 2 + // CHECK: insertelement <8 x i32> %{{.*}}, i32 %{{.*}}, i32 3 + // CHECK: insertelement <8 x i32> %{{.*}}, i32 %{{.*}}, i32 4 + // CHECK: insertelement <8 x i32> %{{.*}}, i32 %{{.*}}, i32 5 + // CHECK: insertelement <8 x i32> %{{.*}}, i32 %{{.*}}, i32 6 + // CHECK: insertelement <8 x i32> %{{.*}}, i32 %{{.*}}, i32 7 + // CHECK: select <8 x i1> %{{.*}}, <8 x i32> %{{.*}}, <8 x i32> %{{.*}} return _mm256_mask_set1_epi32(__O, __M, 5); } __m256i test_mm256_maskz_set1_epi32(__mmask8 __M) { // CHECK-LABEL: @test_mm256_maskz_set1_epi32 - // CHECK: @llvm.x86.avx512.mask.pbroadcast.d.gpr.256 + // CHECK: insertelement <8 x i32> undef, i32 %{{.*}}, i32 0 + // CHECK: insertelement <8 x i32> %{{.*}}, i32 %{{.*}}, i32 1 + // CHECK: insertelement <8 x i32> %{{.*}}, i32 %{{.*}}, i32 2 + // CHECK: insertelement <8 x i32> %{{.*}}, i32 %{{.*}}, i32 3 + // CHECK: insertelement <8 x i32> %{{.*}}, i32 %{{.*}}, i32 4 + // CHECK: insertelement <8 x i32> %{{.*}}, i32 %{{.*}}, i32 5 + // CHECK: insertelement <8 x i32> %{{.*}}, i32 %{{.*}}, i32 6 + // CHECK: insertelement <8 x i32> %{{.*}}, i32 %{{.*}}, i32 7 + // CHECK: select <8 x i1> %{{.*}}, <8 x i32> %{{.*}}, <8 x i32> %{{.*}} return _mm256_maskz_set1_epi32(__M, 5); } #ifdef __x86_64__ __m128i test_mm_mask_set1_epi64(__m128i __O, __mmask8 __M, long long __A) { // CHECK-LABEL: @test_mm_mask_set1_epi64 - // CHECK: @llvm.x86.avx512.mask.pbroadcast.q.gpr.128 + // CHECK: insertelement <16 x i8> undef, i8 %{{.*}}, i32 0 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 1 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 2 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 3 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 4 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 5 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 6 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 7 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 8 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 9 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 10 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 11 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 12 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 13 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 14 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 15 + // CHECK: shufflevector <8 x i1> %{{.*}}, <8 x i1> %{{.*}}, <2 x i32> + // CHECK: select <2 x i1> %{{.*}}, <2 x i64> %{{.*}}, <2 x i64> %{{.*}} return _mm_mask_set1_epi64(__O, __M, __A); } __m128i test_mm_maskz_set1_epi64(__mmask8 __M, long long __A) { // CHECK-LABEL: @test_mm_maskz_set1_epi64 - // CHECK: @llvm.x86.avx512.mask.pbroadcast.q.gpr.128 + // CHECK: insertelement <16 x i8> undef, i8 %{{.*}}, i32 0 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 1 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 2 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 3 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 4 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 5 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 6 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 7 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 8 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 9 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 10 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 11 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 12 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 13 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 14 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 15 + // CHECK: shufflevector <8 x i1> %{{.*}}, <8 x i1> %{{.*}}, <2 x i32> + // CHECK: select <2 x i1> %{{.*}}, <2 x i64> %{{.*}}, <2 x i64> %{{.*}} return _mm_maskz_set1_epi64(__M, __A); } __m256i test_mm256_mask_set1_epi64(__m256i __O, __mmask8 __M, long long __A) { - // CHECK-LABEL: @test_mm256_mask_set1_epi64 - // CHECK: @llvm.x86.avx512.mask.pbroadcast.q.gpr.256 + // CHECK-LABEL: @test_mm256_mask_set1_epi64 + // CHECK: insertelement <4 x i64> undef, i64 %{{.*}}, i32 0 + // CHECK: insertelement <4 x i64> %{{.*}}, i64 %{{.*}}, i32 1 + // CHECK: insertelement <4 x i64> %{{.*}}, i64 %{{.*}}, i32 2 + // CHECK: insertelement <4 x i64> %{{.*}}, i64 %{{.*}}, i32 3 + // CHECK: shufflevector <8 x i1> %{{.*}}, <8 x i1> %{{.*}}, <4 x i32> + // CHECK: select <4 x i1> %{{.*}}, <4 x i64> %{{.*}}, <4 x i64> %{{.*}} return _mm256_mask_set1_epi64(__O, __M, __A); } __m256i test_mm256_maskz_set1_epi64(__mmask8 __M, long long __A) { // CHECK-LABEL: @test_mm256_maskz_set1_epi64 - // CHECK: @llvm.x86.avx512.mask.pbroadcast.q.gpr.256 + // CHECK: insertelement <4 x i64> undef, i64 %{{.*}}, i32 0 + // CHECK: insertelement <4 x i64> %{{.*}}, i64 %{{.*}}, i32 1 + // CHECK: insertelement <4 x i64> %{{.*}}, i64 %{{.*}}, i32 2 + // CHECK: insertelement <4 x i64> %{{.*}}, i64 %{{.*}}, i32 3 + // CHECK: shufflevector <8 x i1> %{{.*}}, <8 x i1> %{{.*}}, <4 x i32> + // CHECK: select <4 x i1> %{{.*}}, <4 x i64> %{{.*}}, <4 x i64> %{{.*}} return _mm256_maskz_set1_epi64(__M, __A); } #endif Index: test/CodeGen/avx512vlbw-builtins.c =================================================================== --- test/CodeGen/avx512vlbw-builtins.c +++ test/CodeGen/avx512vlbw-builtins.c @@ -2602,28 +2602,196 @@ // CHECK: select <16 x i1> %{{.*}}, <16 x i16> %{{.*}}, <16 x i16> %{{.*}} return _mm256_maskz_broadcastw_epi16(__M, __A); } + __m128i test_mm_mask_set1_epi8 (__m128i __O, __mmask16 __M, char __A){ + // CHECK-LABEL: @test_mm_mask_set1_epi8 + // CHECK: insertelement <16 x i8> undef, i8 %{{.*}}, i32 0 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 1 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 2 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 3 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 4 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 5 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 6 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 7 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 8 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 9 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 10 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 11 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 12 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 13 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 14 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 15 + // CHECK: select <16 x i1> %{{.*}}, <16 x i8> %{{.*}}, <16 x i8> %{{.*}} + return _mm_mask_set1_epi8(__O, __M, __A); + } + + __m128i test_mm_maskz_set1_epi8 ( __mmask16 __M, char __A){ + // CHECK-LABEL: @test_mm_maskz_set1_epi8 + // CHECK: insertelement <16 x i8> undef, i8 %{{.*}}, i32 0 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 1 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 2 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 3 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 4 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 5 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 6 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 7 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 8 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 9 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 10 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 11 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 12 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 13 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 14 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 15 + // CHECK: select <16 x i1> %{{.*}}, <16 x i8> %{{.*}}, <16 x i8> %{{.*}} + return _mm_maskz_set1_epi8( __M, __A); + } + +__m256i test_mm256_mask_set1_epi8(__m256i __O, __mmask32 __M, char __A) { + // CHECK-LABEL: @test_mm256_mask_set1_epi8 + // CHECK: insertelement <32 x i8> undef, i8 %{{.*}}, i32 0 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 1 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 2 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 3 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 4 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 5 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 6 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 7 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 8 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 9 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 10 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 11 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 12 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 13 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 14 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 15 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 16 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 17 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 18 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 19 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 20 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 21 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 22 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 23 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 24 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 25 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 26 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 27 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 28 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 29 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 30 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 31 + // CHECK: select <32 x i1> %{{.*}}, <32 x i8> %{{.*}}, <32 x i8> %{{.*}} + return _mm256_mask_set1_epi8(__O, __M, __A); +} + +__m256i test_mm256_maskz_set1_epi8( __mmask32 __M, char __A) { + // CHECK-LABEL: @test_mm256_maskz_set1_epi8 + // CHECK: insertelement <32 x i8> undef, i8 %{{.*}}, i32 0 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 1 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 2 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 3 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 4 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 5 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 6 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 7 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 8 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 9 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 10 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 11 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 12 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 13 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 14 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 15 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 16 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 17 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 18 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 19 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 20 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 21 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 22 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 23 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 24 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 25 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 26 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 27 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 28 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 29 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 30 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 31 + // CHECK: select <32 x i1> %{{.*}}, <32 x i8> %{{.*}}, <32 x i8> %{{.*}} + return _mm256_maskz_set1_epi8( __M, __A); +} + __m256i test_mm256_mask_set1_epi16(__m256i __O, __mmask16 __M, short __A) { // CHECK-LABEL: @test_mm256_mask_set1_epi16 - // CHECK: @llvm.x86.avx512.mask.pbroadcast.w.gpr.256 + // CHECK: insertelement <16 x i16> undef, i16 %{{.*}}, i32 0 + // CHECK: insertelement <16 x i16> %{{.*}}, i16 %{{.*}}, i32 1 + // CHECK: insertelement <16 x i16> %{{.*}}, i16 %{{.*}}, i32 2 + // CHECK: insertelement <16 x i16> %{{.*}}, i16 %{{.*}}, i32 3 + // CHECK: insertelement <16 x i16> %{{.*}}, i16 %{{.*}}, i32 4 + // CHECK: insertelement <16 x i16> %{{.*}}, i16 %{{.*}}, i32 5 + // CHECK: insertelement <16 x i16> %{{.*}}, i16 %{{.*}}, i32 6 + // CHECK: insertelement <16 x i16> %{{.*}}, i16 %{{.*}}, i32 7 + // CHECK: insertelement <16 x i16> %{{.*}}, i16 %{{.*}}, i32 8 + // CHECK: insertelement <16 x i16> %{{.*}}, i16 %{{.*}}, i32 9 + // CHECK: insertelement <16 x i16> %{{.*}}, i16 %{{.*}}, i32 10 + // CHECK: insertelement <16 x i16> %{{.*}}, i16 %{{.*}}, i32 11 + // CHECK: insertelement <16 x i16> %{{.*}}, i16 %{{.*}}, i32 12 + // CHECK: insertelement <16 x i16> %{{.*}}, i16 %{{.*}}, i32 13 + // CHECK: insertelement <16 x i16> %{{.*}}, i16 %{{.*}}, i32 14 + // CHECK: insertelement <16 x i16> %{{.*}}, i16 %{{.*}}, i32 15 + // CHECK: select <16 x i1> %{{.*}}, <16 x i16> %{{.*}}, <16 x i16> %{{.*}} return _mm256_mask_set1_epi16(__O, __M, __A); } __m256i test_mm256_maskz_set1_epi16(__mmask16 __M, short __A) { // CHECK-LABEL: @test_mm256_maskz_set1_epi16 - // CHECK: @llvm.x86.avx512.mask.pbroadcast.w.gpr.256 + // CHECK: insertelement <16 x i16> undef, i16 %{{.*}}, i32 0 + // CHECK: insertelement <16 x i16> %{{.*}}, i16 %{{.*}}, i32 1 + // CHECK: insertelement <16 x i16> %{{.*}}, i16 %{{.*}}, i32 2 + // CHECK: insertelement <16 x i16> %{{.*}}, i16 %{{.*}}, i32 3 + // CHECK: insertelement <16 x i16> %{{.*}}, i16 %{{.*}}, i32 4 + // CHECK: insertelement <16 x i16> %{{.*}}, i16 %{{.*}}, i32 5 + // CHECK: insertelement <16 x i16> %{{.*}}, i16 %{{.*}}, i32 6 + // CHECK: insertelement <16 x i16> %{{.*}}, i16 %{{.*}}, i32 7 + // CHECK: insertelement <16 x i16> %{{.*}}, i16 %{{.*}}, i32 8 + // CHECK: insertelement <16 x i16> %{{.*}}, i16 %{{.*}}, i32 9 + // CHECK: insertelement <16 x i16> %{{.*}}, i16 %{{.*}}, i32 10 + // CHECK: insertelement <16 x i16> %{{.*}}, i16 %{{.*}}, i32 11 + // CHECK: insertelement <16 x i16> %{{.*}}, i16 %{{.*}}, i32 12 + // CHECK: insertelement <16 x i16> %{{.*}}, i16 %{{.*}}, i32 13 + // CHECK: insertelement <16 x i16> %{{.*}}, i16 %{{.*}}, i32 14 + // CHECK: insertelement <16 x i16> %{{.*}}, i16 %{{.*}}, i32 15 + // CHECK: select <16 x i1> %{{.*}}, <16 x i16> %{{.*}}, <16 x i16> %{{.*}} return _mm256_maskz_set1_epi16(__M, __A); } __m128i test_mm_mask_set1_epi16(__m128i __O, __mmask8 __M, short __A) { // CHECK-LABEL: @test_mm_mask_set1_epi16 - // CHECK: @llvm.x86.avx512.mask.pbroadcast.w.gpr.128 + // CHECK: insertelement <8 x i16> undef, i16 %{{.*}}, i32 0 + // CHECK: insertelement <8 x i16> %{{.*}}, i16 %{{.*}}, i32 1 + // CHECK: insertelement <8 x i16> %{{.*}}, i16 %{{.*}}, i32 2 + // CHECK: insertelement <8 x i16> %{{.*}}, i16 %{{.*}}, i32 3 + // CHECK: insertelement <8 x i16> %{{.*}}, i16 %{{.*}}, i32 4 + // CHECK: insertelement <8 x i16> %{{.*}}, i16 %{{.*}}, i32 5 + // CHECK: insertelement <8 x i16> %{{.*}}, i16 %{{.*}}, i32 6 + // CHECK: insertelement <8 x i16> %{{.*}}, i16 %{{.*}}, i32 7 + // CHECK: select <8 x i1> %{{.*}}, <8 x i16> %{{.*}}, <8 x i16> %{{.*}} return _mm_mask_set1_epi16(__O, __M, __A); } __m128i test_mm_maskz_set1_epi16(__mmask8 __M, short __A) { // CHECK-LABEL: @test_mm_maskz_set1_epi16 - // CHECK: @llvm.x86.avx512.mask.pbroadcast.w.gpr.128 + // CHECK: insertelement <8 x i16> undef, i16 %{{.*}}, i32 0 + // CHECK: insertelement <8 x i16> %{{.*}}, i16 %{{.*}}, i32 1 + // CHECK: insertelement <8 x i16> %{{.*}}, i16 %{{.*}}, i32 2 + // CHECK: insertelement <8 x i16> %{{.*}}, i16 %{{.*}}, i32 3 + // CHECK: insertelement <8 x i16> %{{.*}}, i16 %{{.*}}, i32 4 + // CHECK: insertelement <8 x i16> %{{.*}}, i16 %{{.*}}, i32 5 + // CHECK: insertelement <8 x i16> %{{.*}}, i16 %{{.*}}, i32 6 + // CHECK: insertelement <8 x i16> %{{.*}}, i16 %{{.*}}, i32 7 + // CHECK: select <8 x i1> %{{.*}}, <8 x i16> %{{.*}}, <8 x i16> %{{.*}} return _mm_maskz_set1_epi16(__M, __A); } __m128i test_mm_permutexvar_epi16(__m128i __A, __m128i __B) {