This is an archive of the discontinued LLVM Phabricator instance.

[Clang][AVX512][BuiltIn]Adding intrinsics move_{sd|ss} to clang
ClosedPublic

Authored by m_zuckerman on Jun 6 2016, 7:35 AM.

Download Raw Diff

Details

Reviewers

AsafBadouh
delena
igorb

Commits

rG9e43ccfe6828: [Clang][AVX512][BuiltIn]Adding missing intrinsics move_{sd|ss} to clang
rC283314: [Clang][AVX512][BuiltIn]Adding missing intrinsics move_{sd|ss} to clang
rL283314: [Clang][AVX512][BuiltIn]Adding missing intrinsics move_{sd|ss} to clang

Diff Detail

Repository: rL LLVM

Event Timeline

m_zuckerman updated this revision to Diff 59720.Jun 6 2016, 7:35 AM

m_zuckerman retitled this revision from to [Clang][AVX512][BuiltIn]Adding intrinsics move_{sd|ss} to clang.

m_zuckerman updated this object.

m_zuckerman added reviewers: AsafBadouh, igorb, delena.

m_zuckerman added a subscriber: cfe-commits.

delena added inline comments.Jun 7 2016, 2:15 AM

lib/Headers/avx512fintrin.h
9124 ↗	(On Diff #59720)	please try the following: if (__U) return __builtin_shuffle(A, B, (0, 5, 6, 7)); // may be you need to swap A and B return W; I know that the immediate code will be less optimal, but we can optimize it later.

delena accepted this revision.Jun 19 2016, 12:44 AM

delena edited edge metadata.

This revision is now accepted and ready to land.Jun 19 2016, 12:44 AM

RKSimon added a subscriber: RKSimon.Sep 16 2016, 12:32 PM

RKSimon added inline comments.

lib/Headers/avx512fintrin.h
9124 ↗	(On Diff #59720)	Any update on this? I currently have a patch (D24653) looking at removing the movss/movsd mask intrinsics as we should be able to do this with purely generic shuffles. I can help with the optimization if necessary.

m_zuckerman mentioned this in D24653: [X86][AVX512] Drop unused avx512_mask_move_sd/avx512_mask_move_ss intrinsics.Sep 18 2016, 7:03 AM

Closed by commit rL283314: [Clang][AVX512][BuiltIn]Adding missing intrinsics move_{sd|ss} to clang (authored by mzuckerm). · Explain WhyOct 5 2016, 6:05 AM

This revision was automatically updated to reflect the committed changes.

Revision Contents

Path

Size

cfe/

trunk/

include/

clang/

Basic/

BuiltinsX86.def

2 lines

lib/

Headers/

avx512fintrin.h

34 lines

test/

CodeGen/

avx512f-builtins.c

28 lines

Diff 73638

cfe/trunk/include/clang/Basic/BuiltinsX86.def

	Show First 20 Lines • Show All 2,015 Lines • ▼ Show 20 Lines
	TARGET_BUILTIN(__builtin_ia32_expanddi512_mask, "V8LLiV8LLiV8LLiUc","","avx512f")			TARGET_BUILTIN(__builtin_ia32_expanddi512_mask, "V8LLiV8LLiV8LLiUc","","avx512f")
	TARGET_BUILTIN(__builtin_ia32_expandloaddf512_mask, "V8dV8dC*V8dUc","","avx512f")			TARGET_BUILTIN(__builtin_ia32_expandloaddf512_mask, "V8dV8dC*V8dUc","","avx512f")
	TARGET_BUILTIN(__builtin_ia32_expandloaddi512_mask, "V8LLiV8LLiC*V8LLiUc","","avx512f")			TARGET_BUILTIN(__builtin_ia32_expandloaddi512_mask, "V8LLiV8LLiC*V8LLiUc","","avx512f")
	TARGET_BUILTIN(__builtin_ia32_expandloadsf512_mask, "V16fV16fC*V16fUs","","avx512f")			TARGET_BUILTIN(__builtin_ia32_expandloadsf512_mask, "V16fV16fC*V16fUs","","avx512f")
	TARGET_BUILTIN(__builtin_ia32_expandloadsi512_mask, "V16iV16iC*V16iUs","","avx512f")			TARGET_BUILTIN(__builtin_ia32_expandloadsi512_mask, "V16iV16iC*V16iUs","","avx512f")
	TARGET_BUILTIN(__builtin_ia32_expandsf512_mask, "V16fV16fV16fUs","","avx512f")			TARGET_BUILTIN(__builtin_ia32_expandsf512_mask, "V16fV16fV16fUs","","avx512f")
	TARGET_BUILTIN(__builtin_ia32_expandsi512_mask, "V16iV16iV16iUs","","avx512f")			TARGET_BUILTIN(__builtin_ia32_expandsi512_mask, "V16iV16iV16iUs","","avx512f")
	TARGET_BUILTIN(__builtin_ia32_cvtps2pd512_mask, "V8dV8fV8dUcIi","","avx512f")			TARGET_BUILTIN(__builtin_ia32_cvtps2pd512_mask, "V8dV8fV8dUcIi","","avx512f")
				TARGET_BUILTIN(__builtin_ia32_movss_mask, "V4fV4fV4fV4fUc","","avx512f")
				TARGET_BUILTIN(__builtin_ia32_movsd_mask, "V2dV2dV2dV2dUc","","avx512f")
	TARGET_BUILTIN(__builtin_ia32_compressstoredf512_mask, "vV8d*V8dUc","","avx512f")			TARGET_BUILTIN(__builtin_ia32_compressstoredf512_mask, "vV8d*V8dUc","","avx512f")
	TARGET_BUILTIN(__builtin_ia32_compressstoredi512_mask, "vV8LLi*V8LLiUc","","avx512f")			TARGET_BUILTIN(__builtin_ia32_compressstoredi512_mask, "vV8LLi*V8LLiUc","","avx512f")
	TARGET_BUILTIN(__builtin_ia32_compressstoresf512_mask, "vV16f*V16fUs","","avx512f")			TARGET_BUILTIN(__builtin_ia32_compressstoresf512_mask, "vV16f*V16fUs","","avx512f")
	TARGET_BUILTIN(__builtin_ia32_compressstoresi512_mask, "vV16i*V16iUs","","avx512f")			TARGET_BUILTIN(__builtin_ia32_compressstoresi512_mask, "vV16i*V16iUs","","avx512f")
	TARGET_BUILTIN(__builtin_ia32_vcvtph2ps_mask, "V4fV8sV4fUc","","avx512vl")			TARGET_BUILTIN(__builtin_ia32_vcvtph2ps_mask, "V4fV8sV4fUc","","avx512vl")
	TARGET_BUILTIN(__builtin_ia32_vcvtph2ps256_mask, "V8fV8sV8fUc","","avx512vl")			TARGET_BUILTIN(__builtin_ia32_vcvtph2ps256_mask, "V8fV8sV8fUc","","avx512vl")
	TARGET_BUILTIN(__builtin_ia32_vcvtps2ph_mask, "V8sV4fIiV8sUc","","avx512vl")			TARGET_BUILTIN(__builtin_ia32_vcvtps2ph_mask, "V8sV4fIiV8sUc","","avx512vl")
	TARGET_BUILTIN(__builtin_ia32_vcvtps2ph256_mask, "V8sV8fIiV8sUc","","avx512vl")			TARGET_BUILTIN(__builtin_ia32_vcvtps2ph256_mask, "V8sV8fIiV8sUc","","avx512vl")
	▲ Show 20 Lines • Show All 43 Lines • Show Last 20 Lines

cfe/trunk/lib/Headers/avx512fintrin.h

This file is larger than 256 KB, so syntax highlighting is disabled by default.

	Show First 20 Lines • Show All 9,134 Lines • ▼ Show 20 Lines
	static __inline__ __m512 __DEFAULT_FN_ATTRS			static __inline__ __m512 __DEFAULT_FN_ATTRS
	_mm512_maskz_moveldup_ps (__mmask16 __U, __m512 __A)			_mm512_maskz_moveldup_ps (__mmask16 __U, __m512 __A)
	{			{
	return (__m512)__builtin_ia32_selectps_512((__mmask16)__U,			return (__m512)__builtin_ia32_selectps_512((__mmask16)__U,
	(__v16sf)_mm512_moveldup_ps(__A),			(__v16sf)_mm512_moveldup_ps(__A),
	(__v16sf)_mm512_setzero_ps());			(__v16sf)_mm512_setzero_ps());
	}			}

				static __inline__ __m128 __DEFAULT_FN_ATTRS
				_mm_mask_move_ss (__m128 __W, __mmask8 __U, __m128 __A, __m128 __B)
				{
				return (__m128) __builtin_ia32_movss_mask ((__v4sf) __A, (__v4sf) __B,
				(__v4sf) __W,
				(__mmask8) __U);
				}

				static __inline__ __m128 __DEFAULT_FN_ATTRS
				_mm_maskz_move_ss (__mmask8 __U, __m128 __A, __m128 __B)
				{
				return (__m128) __builtin_ia32_movss_mask ((__v4sf) __A, (__v4sf) __B,
				(__v4sf)
				_mm_setzero_si128(),
				(__mmask8) __U);
				}

				static __inline__ __m128d __DEFAULT_FN_ATTRS
				_mm_mask_move_sd (__m128d __W, __mmask8 __U, __m128d __A, __m128d __B)
				{
				return (__m128d) __builtin_ia32_movsd_mask ((__v2df) __A, (__v2df) __B,
				(__v2df) __W,
				(__mmask8) __U);
				}

				static __inline__ __m128d __DEFAULT_FN_ATTRS
				_mm_maskz_move_sd (__mmask8 __U, __m128d __A, __m128d __B)
				{
				return (__m128d) __builtin_ia32_movsd_mask ((__v2df) __A, (__v2df) __B,
				(__v2df)
				_mm_setzero_pd (),
				(__mmask8) __U);
				}

	#define _mm512_shuffle_epi32(A, I) __extension__ ({ \			#define _mm512_shuffle_epi32(A, I) __extension__ ({ \
	(__m512i)__builtin_shufflevector((__v16si)(__m512i)(A), \			(__m512i)__builtin_shufflevector((__v16si)(__m512i)(A), \
	(__v16si)_mm512_undefined_epi32(), \			(__v16si)_mm512_undefined_epi32(), \
	0 + (((I) >> 0) & 0x3), \			0 + (((I) >> 0) & 0x3), \
	0 + (((I) >> 2) & 0x3), \			0 + (((I) >> 2) & 0x3), \
	0 + (((I) >> 4) & 0x3), \			0 + (((I) >> 4) & 0x3), \
	0 + (((I) >> 6) & 0x3), \			0 + (((I) >> 6) & 0x3), \
	4 + (((I) >> 0) & 0x3), \			4 + (((I) >> 0) & 0x3), \
	▲ Show 20 Lines • Show All 515 Lines • Show Last 20 Lines

cfe/trunk/test/CodeGen/avx512f-builtins.c

This file is larger than 256 KB, so syntax highlighting is disabled by default.

	Show First 20 Lines • Show All 7,857 Lines • ▼ Show 20 Lines

	__m512d test_mm512_setzero_pd()			__m512d test_mm512_setzero_pd()
	{			{
	// CHECK-LABEL: @test_mm512_setzero_pd			// CHECK-LABEL: @test_mm512_setzero_pd
	// CHECK: zeroinitializer			// CHECK: zeroinitializer
	return _mm512_setzero_pd();			return _mm512_setzero_pd();
	}			}

				__m128 test_mm_mask_move_ss (__m128 __W, __mmask8 __U, __m128 __A, __m128 __B)
				{
				// CHECK-LABEL: @test_mm_mask_move_ss
				// CHECK: @llvm.x86.avx512.mask.move.ss
				return _mm_mask_move_ss ( __W, __U, __A, __B);
				}

				__m128 test_mm_maskz_move_ss (__mmask8 __U, __m128 __A, __m128 __B)
				{
				// CHECK-LABEL: @test_mm_maskz_move_ss
				// CHECK: @llvm.x86.avx512.mask.move.ss
				return _mm_maskz_move_ss (__U, __A, __B);
				}

				__m128d test_mm_mask_move_sd (__m128 __W, __mmask8 __U, __m128d __A, __m128d __B)
				{
				// CHECK-LABEL: @test_mm_mask_move_sd
				// CHECK: @llvm.x86.avx512.mask.move.sd
				return _mm_mask_move_sd ( __W, __U, __A, __B);
				}

				__m128d test_mm_maskz_move_sd (__mmask8 __U, __m128d __A, __m128d __B)
				{
				// CHECK-LABEL: @test_mm_maskz_move_sd
				// CHECK: @llvm.x86.avx512.mask.move.sd
				return _mm_maskz_move_sd (__U, __A, __B);
				}

	__m512d test_mm512_abs_pd(__m512d a){			__m512d test_mm512_abs_pd(__m512d a){
	// CHECK-LABEL: @test_mm512_abs_pd			// CHECK-LABEL: @test_mm512_abs_pd
	// CHECK: and <8 x i64>			// CHECK: and <8 x i64>
	return _mm512_abs_pd(a);			return _mm512_abs_pd(a);
	}			}

	__m512d test_mm512_mask_abs_pd (__m512d __W, __mmask8 __U, __m512d __A){			__m512d test_mm512_mask_abs_pd (__m512d __W, __mmask8 __U, __m512d __A){
	// CHECK-LABEL: @test_mm512_mask_abs_pd			// CHECK-LABEL: @test_mm512_mask_abs_pd
	Show All 20 Lines