Index: cfe/trunk/lib/Headers/avx512fintrin.h =================================================================== --- cfe/trunk/lib/Headers/avx512fintrin.h +++ cfe/trunk/lib/Headers/avx512fintrin.h @@ -813,6 +813,29 @@ (__mmask16) __U); } +#define _mm512_mask_max_round_pd( __W, __U, __A, __B, __R) __extension__ ({ \ +__builtin_ia32_maxpd512_mask ((__v8df)( __A),\ + (__v8df)( __B),\ + (__v8df)( __W),\ + (__mmask8)( __U),( __R));\ +}) + +#define _mm512_maskz_max_round_pd( __U, __A, __B, __R) __extension__ ({ \ +__builtin_ia32_maxpd512_mask ((__v8df)( __A),\ + (__v8df)( __B),\ + (__v8df)\ + _mm512_setzero_pd (),\ + (__mmask8)( __U),( __R));\ +}) + +#define _mm512_max_round_pd( __A, __B, __R) __extension__ ({ \ +__builtin_ia32_maxpd512_mask ((__v8df)( __A),\ + (__v8df)( __B),\ + (__v8df)\ + _mm512_undefined_pd (),\ + (__mmask8) -1,( __R));\ +}) + static __inline__ __m512d __DEFAULT_FN_ATTRS _mm512_max_pd(__m512d __A, __m512d __B) { @@ -845,6 +868,29 @@ _MM_FROUND_CUR_DIRECTION); } +#define _mm512_mask_max_round_ps( __W, __U, __A, __B, __R) __extension__ ({ \ +__builtin_ia32_maxps512_mask ((__v16sf)( __A),\ + (__v16sf)( __B),\ + (__v16sf)( __W),\ + (__mmask16)( __U),( __R));\ +}) + +#define _mm512_maskz_max_round_ps( __U, __A, __B, __R) __extension__ ({ \ +__builtin_ia32_maxps512_mask ((__v16sf)( __A),\ + (__v16sf)( __B),\ + (__v16sf)\ + _mm512_setzero_ps (),\ + (__mmask16)( __U),( __R));\ +}) + +#define _mm512_max_round_ps( __A, __B, __R) __extension__ ({ \ +__builtin_ia32_maxps512_mask ((__v16sf)( __A),\ + (__v16sf)( __B),\ + (__v16sf)\ + _mm512_undefined_ps (),\ + (__mmask16) -1,( __R));\ +}) + static __inline__ __m512 __DEFAULT_FN_ATTRS _mm512_max_ps(__m512 __A, __m512 __B) { @@ -1062,6 +1108,29 @@ __M); } +#define _mm512_mask_min_round_pd( __W, __U, __A, __B, __R) __extension__ ({ \ +__builtin_ia32_minpd512_mask ((__v8df)( __A),\ + (__v8df)( __B),\ + (__v8df)( __W),\ + (__mmask8)( __U),( __R));\ +}) + +#define _mm512_maskz_min_round_pd( __U, __A, __B, __R) __extension__ ({ \ +__builtin_ia32_minpd512_mask ((__v8df)( __A),\ + (__v8df)( __B),\ + (__v8df)\ + _mm512_setzero_pd (),\ + (__mmask8)( __U),( __R));\ +}) + +#define _mm512_min_round_pd( __A, __B, __R) __extension__ ({ \ +__builtin_ia32_minpd512_mask ((__v8df)( __A),\ + (__v8df)( __B),\ + (__v8df)\ + _mm512_undefined_pd (),\ + (__mmask8) -1,( __R));\ +}) + static __inline__ __m512d __DEFAULT_FN_ATTRS _mm512_min_pd(__m512d __A, __m512d __B) { @@ -1083,6 +1152,29 @@ _MM_FROUND_CUR_DIRECTION); } +#define _mm512_mask_min_round_ps( __W, __U, __A, __B, __R) __extension__ ({ \ +__builtin_ia32_minps512_mask ((__v16sf)( __A),\ + (__v16sf)( __B),\ + (__v16sf)( __W),\ + (__mmask16)( __U),( __R));\ +}) + +#define _mm512_maskz_min_round_ps( __U, __A, __B, __R) __extension__ ({ \ +__builtin_ia32_minps512_mask ((__v16sf)( __A),\ + (__v16sf)( __B),\ + (__v16sf)\ + _mm512_setzero_ps (),\ + (__mmask16)( __U),( __R));\ +}) + +#define _mm512_min_round_ps( __A, __B, __R) __extension__ ({ \ +__builtin_ia32_minps512_mask ((__v16sf)( __A),\ + (__v16sf)( __B),\ + (__v16sf)\ + _mm512_undefined_ps (),\ + (__mmask16) -1,( __R));\ +}) + static __inline__ __m512d __DEFAULT_FN_ATTRS _mm512_maskz_min_pd (__mmask8 __U, __m512d __A, __m512d __B) { @@ -1391,6 +1483,26 @@ (__v16si) __W, __M); } +#define _mm512_mask_sqrt_round_pd( __W, __U, __A, __R) __extension__ ({ \ +__builtin_ia32_sqrtpd512_mask ((__v8df)( __A),\ + (__v8df)( __W),\ + (__mmask8)( __U),( __R));\ +}) + +#define _mm512_maskz_sqrt_round_pd( __U, __A, __R) __extension__ ({ \ +__builtin_ia32_sqrtpd512_mask ((__v8df)( __A),\ + (__v8df)\ + _mm512_setzero_pd (),\ + (__mmask8)( __U),( __R));\ +}) + +#define _mm512_sqrt_round_pd( __A, __R) __extension__ ({ \ +__builtin_ia32_sqrtpd512_mask ((__v8df)( __A),\ + (__v8df)\ + _mm512_undefined_pd (),\ + (__mmask8) -1,( __R));\ +}) + static __inline__ __m512d __DEFAULT_FN_ATTRS _mm512_sqrt_pd(__m512d __a) { @@ -1419,6 +1531,26 @@ _MM_FROUND_CUR_DIRECTION); } +#define _mm512_mask_sqrt_round_ps( __W, __U, __A, __R) __extension__ ({ \ +__builtin_ia32_sqrtps512_mask ((__v16sf)( __A),\ + (__v16sf)( __W),\ + (__mmask16)( __U),( __R));\ +}) + +#define _mm512_maskz_sqrt_round_ps( __U, __A, __R) __extension__ ({ \ +__builtin_ia32_sqrtps512_mask ((__v16sf)( __A),\ + (__v16sf)\ + _mm512_setzero_ps (),\ + (__mmask16)( __U),( __R));\ +}) + +#define _mm512_sqrt_round_ps( __A, __R) __extension__ ({ \ +__builtin_ia32_sqrtps512_mask ((__v16sf)( __A),\ + (__v16sf)\ + _mm512_undefined_ps (),\ + (__mmask16) -1,( __R));\ +}) + static __inline__ __m512 __DEFAULT_FN_ATTRS _mm512_sqrt_ps(__m512 __a) { @@ -1679,7 +1811,6 @@ _MM_FROUND_CUR_DIRECTION); } - static __inline __m512d __DEFAULT_FN_ATTRS _mm512_floor_pd(__m512d __A) { @@ -1698,7 +1829,6 @@ _MM_FROUND_CUR_DIRECTION); } - static __inline__ __m512 __DEFAULT_FN_ATTRS _mm512_mask_ceil_ps (__m512 __W, __mmask16 __U, __m512 __A) { @@ -3679,8 +3809,7 @@ (__m256i)__builtin_ia32_vcvtps2ph512_mask((__v16sf)(__m512)(A), (int)(I), \ (__v16hi)_mm256_setzero_si256(), \ (__mmask16)(W)); }) - - + static __inline __m512 __DEFAULT_FN_ATTRS _mm512_cvtph_ps(__m256i __A) { Index: cfe/trunk/test/CodeGen/avx512f-builtins.c =================================================================== --- cfe/trunk/test/CodeGen/avx512f-builtins.c +++ cfe/trunk/test/CodeGen/avx512f-builtins.c @@ -26,6 +26,27 @@ return _mm512_maskz_sqrt_pd (__U,__A); } +__m512d test_mm512_mask_sqrt_round_pd(__m512d __W,__mmask8 __U,__m512d __A) +{ + // CHECK-LABEL: @test_mm512_mask_sqrt_round_pd + // CHECK: @llvm.x86.avx512.mask.sqrt.pd.512 + return _mm512_mask_sqrt_round_pd(__W,__U,__A,_MM_FROUND_CUR_DIRECTION); +} + +__m512d test_mm512_maskz_sqrt_round_pd(__mmask8 __U,__m512d __A) +{ + // CHECK-LABEL: @test_mm512_maskz_sqrt_round_pd + // CHECK: @llvm.x86.avx512.mask.sqrt.pd.512 + return _mm512_maskz_sqrt_round_pd(__U,__A,_MM_FROUND_CUR_DIRECTION); +} + +__m512d test_mm512_sqrt_round_pd(__m512d __A) +{ + // CHECK-LABEL: @test_mm512_sqrt_round_pd + // CHECK: @llvm.x86.avx512.mask.sqrt.pd.512 + return _mm512_sqrt_round_pd(__A,_MM_FROUND_CUR_DIRECTION); +} + __m512 test_mm512_sqrt_ps(__m512 a) { // CHECK-LABEL: @test_mm512_sqrt_ps @@ -47,6 +68,27 @@ return _mm512_maskz_sqrt_ps(__U ,__A); } +__m512 test_mm512_mask_sqrt_round_ps(__m512 __W,__mmask16 __U,__m512 __A) +{ + // CHECK-LABEL: @test_mm512_mask_sqrt_round_ps + // CHECK: @llvm.x86.avx512.mask.sqrt.ps.512 + return _mm512_mask_sqrt_round_ps(__W,__U,__A,_MM_FROUND_CUR_DIRECTION); +} + +__m512 test_mm512_maskz_sqrt_round_ps(__mmask16 __U,__m512 __A) +{ + // CHECK-LABEL: @test_mm512_maskz_sqrt_round_ps + // CHECK: @llvm.x86.avx512.mask.sqrt.ps.512 + return _mm512_maskz_sqrt_round_ps(__U,__A,_MM_FROUND_CUR_DIRECTION); +} + +__m512 test_mm512_sqrt_round_ps(__m512 __A) +{ + // CHECK-LABEL: @test_mm512_sqrt_round_ps + // CHECK: @llvm.x86.avx512.mask.sqrt.ps.512 + return _mm512_sqrt_round_ps(__A,_MM_FROUND_CUR_DIRECTION); +} + __m512d test_mm512_rsqrt14_pd(__m512d a) { // CHECK-LABEL: @test_mm512_rsqrt14_pd @@ -6576,6 +6618,27 @@ return _mm512_mask_max_ps (__W,__U,__A,__B); } +__m512d test_mm512_mask_max_round_pd(__m512d __W,__mmask8 __U,__m512d __A,__m512d __B) +{ + // CHECK-LABEL: @test_mm512_mask_max_round_pd + // CHECK: @llvm.x86.avx512.mask.max.pd.512 + return _mm512_mask_max_round_pd(__W,__U,__A,__B,_MM_FROUND_CUR_DIRECTION); +} + +__m512d test_mm512_maskz_max_round_pd(__mmask8 __U,__m512d __A,__m512d __B) +{ + // CHECK-LABEL: @test_mm512_maskz_max_round_pd + // CHECK: @llvm.x86.avx512.mask.max.pd.512 + return _mm512_maskz_max_round_pd(__U,__A,__B,_MM_FROUND_CUR_DIRECTION); +} + +__m512d test_mm512_max_round_pd(__m512d __A,__m512d __B) +{ + // CHECK-LABEL: @test_mm512_max_round_pd + // CHECK: @llvm.x86.avx512.mask.max.pd.512 + return _mm512_max_round_pd(__A,__B,_MM_FROUND_CUR_DIRECTION); +} + __m512 test_mm512_maskz_max_ps (__mmask16 __U, __m512 __A, __m512 __B) { // CHECK-LABEL: @test_mm512_maskz_max_ps @@ -6583,6 +6646,27 @@ return _mm512_maskz_max_ps (__U,__A,__B); } +__m512 test_mm512_mask_max_round_ps(__m512 __W,__mmask16 __U,__m512 __A,__m512 __B) +{ + // CHECK-LABEL: @test_mm512_mask_max_round_ps + // CHECK: @llvm.x86.avx512.mask.max.ps.512 + return _mm512_mask_max_round_ps(__W,__U,__A,__B,_MM_FROUND_CUR_DIRECTION); +} + +__m512 test_mm512_maskz_max_round_ps(__mmask16 __U,__m512 __A,__m512 __B) +{ + // CHECK-LABEL: @test_mm512_maskz_max_round_ps + // CHECK: @llvm.x86.avx512.mask.max.ps.512 + return _mm512_maskz_max_round_ps(__U,__A,__B,_MM_FROUND_CUR_DIRECTION); +} + +__m512 test_mm512_max_round_ps(__m512 __A,__m512 __B) +{ + // CHECK-LABEL: @test_mm512_max_round_ps + // CHECK: @llvm.x86.avx512.mask.max.ps.512 + return _mm512_max_round_ps(__A,__B,_MM_FROUND_CUR_DIRECTION); +} + __m512d test_mm512_mask_min_pd (__m512d __W, __mmask8 __U, __m512d __A, __m512d __B) { // CHECK-LABEL: @test_mm512_mask_min_pd @@ -6597,6 +6681,27 @@ return _mm512_maskz_min_pd (__U,__A,__B); } +__m512d test_mm512_mask_min_round_pd(__m512d __W,__mmask8 __U,__m512d __A,__m512d __B) +{ + // CHECK-LABEL: @test_mm512_mask_min_round_pd + // CHECK: @llvm.x86.avx512.mask.min.pd.512 + return _mm512_mask_min_round_pd(__W,__U,__A,__B,_MM_FROUND_CUR_DIRECTION); +} + +__m512d test_mm512_maskz_min_round_pd(__mmask8 __U,__m512d __A,__m512d __B) +{ + // CHECK-LABEL: @test_mm512_maskz_min_round_pd + // CHECK: @llvm.x86.avx512.mask.min.pd.512 + return _mm512_maskz_min_round_pd(__U,__A,__B,_MM_FROUND_CUR_DIRECTION); +} + +__m512d test_mm512_min_round_pd( __m512d __A,__m512d __B) +{ + // CHECK-LABEL: @test_mm512_min_round_pd + // CHECK: @llvm.x86.avx512.mask.min.pd.512 + return _mm512_min_round_pd(__A,__B,_MM_FROUND_CUR_DIRECTION); +} + __m512 test_mm512_mask_min_ps (__m512 __W, __mmask16 __U, __m512 __A, __m512 __B) { // CHECK-LABEL: @test_mm512_mask_min_ps @@ -6611,6 +6716,27 @@ return _mm512_maskz_min_ps (__U,__A,__B); } +__m512 test_mm512_mask_min_round_ps(__m512 __W,__mmask16 __U,__m512 __A,__m512 __B) +{ + // CHECK-LABEL: @test_mm512_mask_min_round_ps + // CHECK: @llvm.x86.avx512.mask.min.ps.512 + return _mm512_mask_min_round_ps(__W,__U,__A,__B,_MM_FROUND_CUR_DIRECTION); +} + +__m512 test_mm512_maskz_min_round_ps(__mmask16 __U,__m512 __A,__m512 __B) +{ + // CHECK-LABEL: @test_mm512_maskz_min_round_ps + // CHECK: @llvm.x86.avx512.mask.min.ps.512 + return _mm512_maskz_min_round_ps(__U,__A,__B,_MM_FROUND_CUR_DIRECTION); +} + +__m512 test_mm512_min_round_ps(__m512 __A,__m512 __B) +{ + // CHECK-LABEL: @test_mm512_min_round_ps + // CHECK: @llvm.x86.avx512.mask.min.ps.512 + return _mm512_min_round_ps(__A,__B,_MM_FROUND_CUR_DIRECTION); +} + __m512 test_mm512_mask_floor_ps (__m512 __W, __mmask16 __U, __m512 __A) { // CHECK-LABEL: @test_mm512_mask_floor_ps