This is an archive of the discontinued LLVM Phabricator instance.

[X86][AVX512] Lowering _mm512_[max|min]_p[s|d] to native IR
AbandonedPublic

Authored by GBuella on Jun 22 2018, 8:08 AM.

Download Raw Diff

Details

Reviewers

craig.topper
uriel.k
RKSimon
andrew.w.kaylor
spatel
scanon
efriedma

Diff Detail

Repository

rC Clang

Build Status

Buildable 19625
Build 19625: arc lint + arc unit

Event Timeline

GBuella created this revision.Jun 22 2018, 8:08 AM

Herald added a subscriber: cfe-commits. · View Herald TranscriptJun 22 2018, 8:08 AM

I haven't used the AVX512 versions, but I do know plenty of cases that rely on the 'use the second op if there is a NAN or both zeros' special cases in the SSE version of these FMIN/FMAX intrinsics.

The Intel docs state:

If the values being compared are both 0.0s (of either sign), the value in the second operand (source operand) is returned. If a value in the second operand is an SNaN, then SNaN is forwarded unchanged to the destination (that is, a QNaN version of the SNaN is not returned).

If only one value is a NaN (SNaN or QNaN) for this instruction, the second operand (source operand), either a NaN or a valid floating-point value, is written to the result. If instead of this behavior, it is required that the NaN source operand (from either the first or second operand) be returned, the action of MAXPS can be emulated using a sequence of instructions, such as, a comparison followed by AND, ANDN and OR.

In D48487#1140703, @RKSimon wrote:

I haven't used the AVX512 versions, but I do know plenty of cases that rely on the 'use the second op if there is a NAN or both zeros' special cases in the SSE version of these FMIN/FMAX intrinsics.

Yes, this behavior is important for AVX512 as well. Any lowering must preserve the full semantics of the intrinsics.

GBuella abandoned this revision.Jul 5 2018, 2:50 PM

Revision Contents

Path

Size

lib/

Headers/

avx512fintrin.h

240 lines

test/

CodeGen/

avx512f-builtins.c

33 lines

Diff 152482

lib/Headers/avx512fintrin.h

This file is larger than 256 KB, so syntax highlighting is disabled by default.

	Show First 20 Lines • Show All 812 Lines • ▼ Show 20 Lines
	}			}

	static __inline__ __m512i __DEFAULT_FN_ATTRS			static __inline__ __m512i __DEFAULT_FN_ATTRS
	_mm512_xor_si512(__m512i __a, __m512i __b)			_mm512_xor_si512(__m512i __a, __m512i __b)
	{			{
	return (__m512i)((__v8du)__a ^ (__v8du)__b);			return (__m512i)((__v8du)__a ^ (__v8du)__b);
	}			}

				/* Compare */

				#define _mm512_cmp_round_ps_mask(A, B, P, R) \
				(__mmask16)__builtin_ia32_cmpps512_mask((__v16sf)(__m512)(A), \
				(__v16sf)(__m512)(B), (int)(P), \
				(__mmask16)-1, (int)(R))

				#define _mm512_mask_cmp_round_ps_mask(U, A, B, P, R) \
				(__mmask16)__builtin_ia32_cmpps512_mask((__v16sf)(__m512)(A), \
				(__v16sf)(__m512)(B), (int)(P), \
				(__mmask16)(U), (int)(R))

				#define _mm512_cmp_ps_mask(A, B, P) \
				_mm512_cmp_round_ps_mask((A), (B), (P), _MM_FROUND_CUR_DIRECTION)
				#define _mm512_mask_cmp_ps_mask(U, A, B, P) \
				_mm512_mask_cmp_round_ps_mask((U), (A), (B), (P), _MM_FROUND_CUR_DIRECTION)

				#define _mm512_cmpeq_ps_mask(A, B) \
				_mm512_cmp_ps_mask((A), (B), _CMP_EQ_OQ)
				#define _mm512_mask_cmpeq_ps_mask(k, A, B) \
				_mm512_mask_cmp_ps_mask((k), (A), (B), _CMP_EQ_OQ)

				#define _mm512_cmplt_ps_mask(A, B) \
				_mm512_cmp_ps_mask((A), (B), _CMP_LT_OS)
				#define _mm512_mask_cmplt_ps_mask(k, A, B) \
				_mm512_mask_cmp_ps_mask((k), (A), (B), _CMP_LT_OS)

				#define _mm512_cmple_ps_mask(A, B) \
				_mm512_cmp_ps_mask((A), (B), _CMP_LE_OS)
				#define _mm512_mask_cmple_ps_mask(k, A, B) \
				_mm512_mask_cmp_ps_mask((k), (A), (B), _CMP_LE_OS)

				#define _mm512_cmpunord_ps_mask(A, B) \
				_mm512_cmp_ps_mask((A), (B), _CMP_UNORD_Q)
				#define _mm512_mask_cmpunord_ps_mask(k, A, B) \
				_mm512_mask_cmp_ps_mask((k), (A), (B), _CMP_UNORD_Q)

				#define _mm512_cmpneq_ps_mask(A, B) \
				_mm512_cmp_ps_mask((A), (B), _CMP_NEQ_UQ)
				#define _mm512_mask_cmpneq_ps_mask(k, A, B) \
				_mm512_mask_cmp_ps_mask((k), (A), (B), _CMP_NEQ_UQ)

				#define _mm512_cmpnlt_ps_mask(A, B) \
				_mm512_cmp_ps_mask((A), (B), _CMP_NLT_US)
				#define _mm512_mask_cmpnlt_ps_mask(k, A, B) \
				_mm512_mask_cmp_ps_mask((k), (A), (B), _CMP_NLT_US)

				#define _mm512_cmpnle_ps_mask(A, B) \
				_mm512_cmp_ps_mask((A), (B), _CMP_NLE_US)
				#define _mm512_mask_cmpnle_ps_mask(k, A, B) \
				_mm512_mask_cmp_ps_mask((k), (A), (B), _CMP_NLE_US)

				#define _mm512_cmpord_ps_mask(A, B) \
				_mm512_cmp_ps_mask((A), (B), _CMP_ORD_Q)
				#define _mm512_mask_cmpord_ps_mask(k, A, B) \
				_mm512_mask_cmp_ps_mask((k), (A), (B), _CMP_ORD_Q)

				#define _mm512_cmp_round_pd_mask(A, B, P, R) \
				(__mmask8)__builtin_ia32_cmppd512_mask((__v8df)(__m512d)(A), \
				(__v8df)(__m512d)(B), (int)(P), \
				(__mmask8)-1, (int)(R))

				#define _mm512_mask_cmp_round_pd_mask(U, A, B, P, R) \
				(__mmask8)__builtin_ia32_cmppd512_mask((__v8df)(__m512d)(A), \
				(__v8df)(__m512d)(B), (int)(P), \
				(__mmask8)(U), (int)(R))

				#define _mm512_cmp_pd_mask(A, B, P) \
				_mm512_cmp_round_pd_mask((A), (B), (P), _MM_FROUND_CUR_DIRECTION)
				#define _mm512_mask_cmp_pd_mask(U, A, B, P) \
				_mm512_mask_cmp_round_pd_mask((U), (A), (B), (P), _MM_FROUND_CUR_DIRECTION)

				#define _mm512_cmpeq_pd_mask(A, B) \
				_mm512_cmp_pd_mask((A), (B), _CMP_EQ_OQ)
				#define _mm512_mask_cmpeq_pd_mask(k, A, B) \
				_mm512_mask_cmp_pd_mask((k), (A), (B), _CMP_EQ_OQ)

				#define _mm512_cmplt_pd_mask(A, B) \
				_mm512_cmp_pd_mask((A), (B), _CMP_LT_OS)
				#define _mm512_mask_cmplt_pd_mask(k, A, B) \
				_mm512_mask_cmp_pd_mask((k), (A), (B), _CMP_LT_OS)

				#define _mm512_cmple_pd_mask(A, B) \
				_mm512_cmp_pd_mask((A), (B), _CMP_LE_OS)
				#define _mm512_mask_cmple_pd_mask(k, A, B) \
				_mm512_mask_cmp_pd_mask((k), (A), (B), _CMP_LE_OS)

				#define _mm512_cmpunord_pd_mask(A, B) \
				_mm512_cmp_pd_mask((A), (B), _CMP_UNORD_Q)
				#define _mm512_mask_cmpunord_pd_mask(k, A, B) \
				_mm512_mask_cmp_pd_mask((k), (A), (B), _CMP_UNORD_Q)

				#define _mm512_cmpneq_pd_mask(A, B) \
				_mm512_cmp_pd_mask((A), (B), _CMP_NEQ_UQ)
				#define _mm512_mask_cmpneq_pd_mask(k, A, B) \
				_mm512_mask_cmp_pd_mask((k), (A), (B), _CMP_NEQ_UQ)

				#define _mm512_cmpnlt_pd_mask(A, B) \
				_mm512_cmp_pd_mask((A), (B), _CMP_NLT_US)
				#define _mm512_mask_cmpnlt_pd_mask(k, A, B) \
				_mm512_mask_cmp_pd_mask((k), (A), (B), _CMP_NLT_US)

				#define _mm512_cmpnle_pd_mask(A, B) \
				_mm512_cmp_pd_mask((A), (B), _CMP_NLE_US)
				#define _mm512_mask_cmpnle_pd_mask(k, A, B) \
				_mm512_mask_cmp_pd_mask((k), (A), (B), _CMP_NLE_US)

				#define _mm512_cmpord_pd_mask(A, B) \
				_mm512_cmp_pd_mask((A), (B), _CMP_ORD_Q)
				#define _mm512_mask_cmpord_pd_mask(k, A, B) \
				_mm512_mask_cmp_pd_mask((k), (A), (B), _CMP_ORD_Q)

	/* Arithmetic */			/* Arithmetic */

	static __inline __m512d __DEFAULT_FN_ATTRS			static __inline __m512d __DEFAULT_FN_ATTRS
	_mm512_add_pd(__m512d __a, __m512d __b)			_mm512_add_pd(__m512d __a, __m512d __b)
	{			{
	return (__m512d)((__v8df)__a + (__v8df)__b);			return (__m512d)((__v8df)__a + (__v8df)__b);
	}			}

	▲ Show 20 Lines • Show All 127 Lines • ▼ Show 20 Lines
	#define _mm512_maskz_max_round_pd(U, A, B, R) \			#define _mm512_maskz_max_round_pd(U, A, B, R) \
	(__m512d)__builtin_ia32_selectpd_512((__mmask8)(U), \			(__m512d)__builtin_ia32_selectpd_512((__mmask8)(U), \
	(__v8df)_mm512_max_round_pd((A), (B), (R)), \			(__v8df)_mm512_max_round_pd((A), (B), (R)), \
	(__v8df)_mm512_setzero_pd())			(__v8df)_mm512_setzero_pd())

	static __inline__ __m512d __DEFAULT_FN_ATTRS			static __inline__ __m512d __DEFAULT_FN_ATTRS
	_mm512_max_pd(__m512d __A, __m512d __B)			_mm512_max_pd(__m512d __A, __m512d __B)
	{			{
	return (__m512d) __builtin_ia32_maxpd512((__v8df) __A, (__v8df) __B,			return (__m512d) __builtin_ia32_selectpd_512 (
	_MM_FROUND_CUR_DIRECTION);			_mm512_cmpnlt_pd_mask(__A, __B), __A, __B);
	}			}

	static __inline__ __m512d __DEFAULT_FN_ATTRS			static __inline__ __m512d __DEFAULT_FN_ATTRS
	_mm512_mask_max_pd (__m512d __W, __mmask8 __U, __m512d __A, __m512d __B)			_mm512_mask_max_pd (__m512d __W, __mmask8 __U, __m512d __A, __m512d __B)
	{			{
	return (__m512d)__builtin_ia32_selectpd_512(__U,			return (__m512d)__builtin_ia32_selectpd_512(__U,
	(__v8df)_mm512_max_pd(__A, __B),			(__v8df)_mm512_max_pd(__A, __B),
	(__v8df)__W);			(__v8df)__W);
	Show All 19 Lines
	#define _mm512_maskz_max_round_ps(U, A, B, R) \			#define _mm512_maskz_max_round_ps(U, A, B, R) \
	(__m512)__builtin_ia32_selectps_512((__mmask16)(U), \			(__m512)__builtin_ia32_selectps_512((__mmask16)(U), \
	(__v16sf)_mm512_max_round_ps((A), (B), (R)), \			(__v16sf)_mm512_max_round_ps((A), (B), (R)), \
	(__v16sf)_mm512_setzero_ps())			(__v16sf)_mm512_setzero_ps())

	static __inline__ __m512 __DEFAULT_FN_ATTRS			static __inline__ __m512 __DEFAULT_FN_ATTRS
	_mm512_max_ps(__m512 __A, __m512 __B)			_mm512_max_ps(__m512 __A, __m512 __B)
	{			{
	return (__m512) __builtin_ia32_maxps512((__v16sf) __A, (__v16sf) __B,			return (__m512) __builtin_ia32_selectps_512 (
	_MM_FROUND_CUR_DIRECTION);			_mm512_cmpnlt_ps_mask(__A, __B), __A, __B);
	}			}

	static __inline__ __m512 __DEFAULT_FN_ATTRS			static __inline__ __m512 __DEFAULT_FN_ATTRS
	_mm512_mask_max_ps (__m512 __W, __mmask16 __U, __m512 __A, __m512 __B)			_mm512_mask_max_ps (__m512 __W, __mmask16 __U, __m512 __A, __m512 __B)
	{			{
	return (__m512)__builtin_ia32_selectps_512(__U,			return (__m512)__builtin_ia32_selectps_512(__U,
	(__v16sf)_mm512_max_ps(__A, __B),			(__v16sf)_mm512_max_ps(__A, __B),
	(__v16sf)__W);			(__v16sf)__W);
	▲ Show 20 Lines • Show All 180 Lines • ▼ Show 20 Lines
	#define _mm512_maskz_min_round_pd(U, A, B, R) \			#define _mm512_maskz_min_round_pd(U, A, B, R) \
	(__m512d)__builtin_ia32_selectpd_512((__mmask8)(U), \			(__m512d)__builtin_ia32_selectpd_512((__mmask8)(U), \
	(__v8df)_mm512_min_round_pd((A), (B), (R)), \			(__v8df)_mm512_min_round_pd((A), (B), (R)), \
	(__v8df)_mm512_setzero_pd())			(__v8df)_mm512_setzero_pd())

	static __inline__ __m512d __DEFAULT_FN_ATTRS			static __inline__ __m512d __DEFAULT_FN_ATTRS
	_mm512_min_pd(__m512d __A, __m512d __B)			_mm512_min_pd(__m512d __A, __m512d __B)
	{			{
	return (__m512d) __builtin_ia32_minpd512((__v8df) __A, (__v8df) __B,			return (__m512d) __builtin_ia32_selectpd_512 (
	_MM_FROUND_CUR_DIRECTION);			_mm512_cmplt_pd_mask(__A, __B), __A, __B);
	}			}

	static __inline__ __m512d __DEFAULT_FN_ATTRS			static __inline__ __m512d __DEFAULT_FN_ATTRS
	_mm512_mask_min_pd (__m512d __W, __mmask8 __U, __m512d __A, __m512d __B)			_mm512_mask_min_pd (__m512d __W, __mmask8 __U, __m512d __A, __m512d __B)
	{			{
	return (__m512d)__builtin_ia32_selectpd_512(__U,			return (__m512d)__builtin_ia32_selectpd_512(__U,
	(__v8df)_mm512_min_pd(__A, __B),			(__v8df)_mm512_min_pd(__A, __B),
	(__v8df)__W);			(__v8df)__W);
	Show All 19 Lines
	#define _mm512_maskz_min_round_ps(U, A, B, R) \			#define _mm512_maskz_min_round_ps(U, A, B, R) \
	(__m512)__builtin_ia32_selectps_512((__mmask16)(U), \			(__m512)__builtin_ia32_selectps_512((__mmask16)(U), \
	(__v16sf)_mm512_min_round_ps((A), (B), (R)), \			(__v16sf)_mm512_min_round_ps((A), (B), (R)), \
	(__v16sf)_mm512_setzero_ps())			(__v16sf)_mm512_setzero_ps())

	static __inline__ __m512 __DEFAULT_FN_ATTRS			static __inline__ __m512 __DEFAULT_FN_ATTRS
	_mm512_min_ps(__m512 __A, __m512 __B)			_mm512_min_ps(__m512 __A, __m512 __B)
	{			{
	return (__m512) __builtin_ia32_minps512((__v16sf) __A, (__v16sf) __B,			return (__m512) __builtin_ia32_selectps_512 (
	_MM_FROUND_CUR_DIRECTION);			_mm512_cmplt_ps_mask(__A, __B), __A, __B);
	}			}

	static __inline__ __m512 __DEFAULT_FN_ATTRS			static __inline__ __m512 __DEFAULT_FN_ATTRS
	_mm512_mask_min_ps (__m512 __W, __mmask16 __U, __m512 __A, __m512 __B)			_mm512_mask_min_ps (__m512 __W, __mmask16 __U, __m512 __A, __m512 __B)
	{			{
	return (__m512)__builtin_ia32_selectps_512(__U,			return (__m512)__builtin_ia32_selectps_512(__U,
	(__v16sf)_mm512_min_ps(__A, __B),			(__v16sf)_mm512_min_ps(__A, __B),
	(__v16sf)__W);			(__v16sf)__W);
	▲ Show 20 Lines • Show All 2,198 Lines • ▼ Show 20 Lines
	static __inline __m512i __DEFAULT_FN_ATTRS			static __inline __m512i __DEFAULT_FN_ATTRS
	_mm512_mask_blend_epi32(__mmask16 __U, __m512i __A, __m512i __W)			_mm512_mask_blend_epi32(__mmask16 __U, __m512i __A, __m512i __W)
	{			{
	return (__m512i) __builtin_ia32_selectd_512 ((__mmask16) __U,			return (__m512i) __builtin_ia32_selectd_512 ((__mmask16) __U,
	(__v16si) __W,			(__v16si) __W,
	(__v16si) __A);			(__v16si) __A);
	}			}

	/* Compare */

	#define _mm512_cmp_round_ps_mask(A, B, P, R) \
	(__mmask16)__builtin_ia32_cmpps512_mask((__v16sf)(__m512)(A), \
	(__v16sf)(__m512)(B), (int)(P), \
	(__mmask16)-1, (int)(R))

	#define _mm512_mask_cmp_round_ps_mask(U, A, B, P, R) \
	(__mmask16)__builtin_ia32_cmpps512_mask((__v16sf)(__m512)(A), \
	(__v16sf)(__m512)(B), (int)(P), \
	(__mmask16)(U), (int)(R))

	#define _mm512_cmp_ps_mask(A, B, P) \
	_mm512_cmp_round_ps_mask((A), (B), (P), _MM_FROUND_CUR_DIRECTION)
	#define _mm512_mask_cmp_ps_mask(U, A, B, P) \
	_mm512_mask_cmp_round_ps_mask((U), (A), (B), (P), _MM_FROUND_CUR_DIRECTION)

	#define _mm512_cmpeq_ps_mask(A, B) \
	_mm512_cmp_ps_mask((A), (B), _CMP_EQ_OQ)
	#define _mm512_mask_cmpeq_ps_mask(k, A, B) \
	_mm512_mask_cmp_ps_mask((k), (A), (B), _CMP_EQ_OQ)

	#define _mm512_cmplt_ps_mask(A, B) \
	_mm512_cmp_ps_mask((A), (B), _CMP_LT_OS)
	#define _mm512_mask_cmplt_ps_mask(k, A, B) \
	_mm512_mask_cmp_ps_mask((k), (A), (B), _CMP_LT_OS)

	#define _mm512_cmple_ps_mask(A, B) \
	_mm512_cmp_ps_mask((A), (B), _CMP_LE_OS)
	#define _mm512_mask_cmple_ps_mask(k, A, B) \
	_mm512_mask_cmp_ps_mask((k), (A), (B), _CMP_LE_OS)

	#define _mm512_cmpunord_ps_mask(A, B) \
	_mm512_cmp_ps_mask((A), (B), _CMP_UNORD_Q)
	#define _mm512_mask_cmpunord_ps_mask(k, A, B) \
	_mm512_mask_cmp_ps_mask((k), (A), (B), _CMP_UNORD_Q)

	#define _mm512_cmpneq_ps_mask(A, B) \
	_mm512_cmp_ps_mask((A), (B), _CMP_NEQ_UQ)
	#define _mm512_mask_cmpneq_ps_mask(k, A, B) \
	_mm512_mask_cmp_ps_mask((k), (A), (B), _CMP_NEQ_UQ)

	#define _mm512_cmpnlt_ps_mask(A, B) \
	_mm512_cmp_ps_mask((A), (B), _CMP_NLT_US)
	#define _mm512_mask_cmpnlt_ps_mask(k, A, B) \
	_mm512_mask_cmp_ps_mask((k), (A), (B), _CMP_NLT_US)

	#define _mm512_cmpnle_ps_mask(A, B) \
	_mm512_cmp_ps_mask((A), (B), _CMP_NLE_US)
	#define _mm512_mask_cmpnle_ps_mask(k, A, B) \
	_mm512_mask_cmp_ps_mask((k), (A), (B), _CMP_NLE_US)

	#define _mm512_cmpord_ps_mask(A, B) \
	_mm512_cmp_ps_mask((A), (B), _CMP_ORD_Q)
	#define _mm512_mask_cmpord_ps_mask(k, A, B) \
	_mm512_mask_cmp_ps_mask((k), (A), (B), _CMP_ORD_Q)

	#define _mm512_cmp_round_pd_mask(A, B, P, R) \
	(__mmask8)__builtin_ia32_cmppd512_mask((__v8df)(__m512d)(A), \
	(__v8df)(__m512d)(B), (int)(P), \
	(__mmask8)-1, (int)(R))

	#define _mm512_mask_cmp_round_pd_mask(U, A, B, P, R) \
	(__mmask8)__builtin_ia32_cmppd512_mask((__v8df)(__m512d)(A), \
	(__v8df)(__m512d)(B), (int)(P), \
	(__mmask8)(U), (int)(R))

	#define _mm512_cmp_pd_mask(A, B, P) \
	_mm512_cmp_round_pd_mask((A), (B), (P), _MM_FROUND_CUR_DIRECTION)
	#define _mm512_mask_cmp_pd_mask(U, A, B, P) \
	_mm512_mask_cmp_round_pd_mask((U), (A), (B), (P), _MM_FROUND_CUR_DIRECTION)

	#define _mm512_cmpeq_pd_mask(A, B) \
	_mm512_cmp_pd_mask((A), (B), _CMP_EQ_OQ)
	#define _mm512_mask_cmpeq_pd_mask(k, A, B) \
	_mm512_mask_cmp_pd_mask((k), (A), (B), _CMP_EQ_OQ)

	#define _mm512_cmplt_pd_mask(A, B) \
	_mm512_cmp_pd_mask((A), (B), _CMP_LT_OS)
	#define _mm512_mask_cmplt_pd_mask(k, A, B) \
	_mm512_mask_cmp_pd_mask((k), (A), (B), _CMP_LT_OS)

	#define _mm512_cmple_pd_mask(A, B) \
	_mm512_cmp_pd_mask((A), (B), _CMP_LE_OS)
	#define _mm512_mask_cmple_pd_mask(k, A, B) \
	_mm512_mask_cmp_pd_mask((k), (A), (B), _CMP_LE_OS)

	#define _mm512_cmpunord_pd_mask(A, B) \
	_mm512_cmp_pd_mask((A), (B), _CMP_UNORD_Q)
	#define _mm512_mask_cmpunord_pd_mask(k, A, B) \
	_mm512_mask_cmp_pd_mask((k), (A), (B), _CMP_UNORD_Q)

	#define _mm512_cmpneq_pd_mask(A, B) \
	_mm512_cmp_pd_mask((A), (B), _CMP_NEQ_UQ)
	#define _mm512_mask_cmpneq_pd_mask(k, A, B) \
	_mm512_mask_cmp_pd_mask((k), (A), (B), _CMP_NEQ_UQ)

	#define _mm512_cmpnlt_pd_mask(A, B) \
	_mm512_cmp_pd_mask((A), (B), _CMP_NLT_US)
	#define _mm512_mask_cmpnlt_pd_mask(k, A, B) \
	_mm512_mask_cmp_pd_mask((k), (A), (B), _CMP_NLT_US)

	#define _mm512_cmpnle_pd_mask(A, B) \
	_mm512_cmp_pd_mask((A), (B), _CMP_NLE_US)
	#define _mm512_mask_cmpnle_pd_mask(k, A, B) \
	_mm512_mask_cmp_pd_mask((k), (A), (B), _CMP_NLE_US)

	#define _mm512_cmpord_pd_mask(A, B) \
	_mm512_cmp_pd_mask((A), (B), _CMP_ORD_Q)
	#define _mm512_mask_cmpord_pd_mask(k, A, B) \
	_mm512_mask_cmp_pd_mask((k), (A), (B), _CMP_ORD_Q)

	/* Conversion */			/* Conversion */

	#define _mm512_cvtt_roundps_epu32(A, R) \			#define _mm512_cvtt_roundps_epu32(A, R) \
	(__m512i)__builtin_ia32_cvttps2udq512_mask((__v16sf)(__m512)(A), \			(__m512i)__builtin_ia32_cvttps2udq512_mask((__v16sf)(__m512)(A), \
	(__v16si)_mm512_undefined_epi32(), \			(__v16si)_mm512_undefined_epi32(), \
	(__mmask16)-1, (int)(R))			(__mmask16)-1, (int)(R))

	#define _mm512_mask_cvtt_roundps_epu32(W, U, A, R) \			#define _mm512_mask_cvtt_roundps_epu32(W, U, A, R) \
	▲ Show 20 Lines • Show All 6,077 Lines • Show Last 20 Lines

test/CodeGen/avx512f-builtins.c

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 8,420 Lines • ▼ Show 20 Lines	float test_mm512_cvtss_f32(__m512 A) {
// CHECK-LABEL: test_mm512_cvtss_f32		// CHECK-LABEL: test_mm512_cvtss_f32
// CHECK: extractelement <16 x float> %{{.*}}, i32 0		// CHECK: extractelement <16 x float> %{{.*}}, i32 0
return _mm512_cvtss_f32(A);		return _mm512_cvtss_f32(A);
}		}

__m512d test_mm512_mask_max_pd (__m512d __W, __mmask8 __U, __m512d __A, __m512d __B)		__m512d test_mm512_mask_max_pd (__m512d __W, __mmask8 __U, __m512d __A, __m512d __B)
{		{
// CHECK-LABEL: @test_mm512_mask_max_pd		// CHECK-LABEL: @test_mm512_mask_max_pd
// CHECK: @llvm.x86.avx512.max.pd.512		// CHECK: fcmp uge <8 x double> %{{.}}, %{{.}}
		// CHECK: select <8 x i1> %{{.}}, <8 x double> %{{.}}, <8 x double> %{{.*}}
// CHECK: select <8 x i1> %{{.}}, <8 x double> %{{.}}, <8 x double> %{{.*}}		// CHECK: select <8 x i1> %{{.}}, <8 x double> %{{.}}, <8 x double> %{{.*}}
return _mm512_mask_max_pd (__W,__U,__A,__B);		return _mm512_mask_max_pd (__W,__U,__A,__B);
}		}

__m512d test_mm512_maskz_max_pd (__mmask8 __U, __m512d __A, __m512d __B)		__m512d test_mm512_maskz_max_pd (__mmask8 __U, __m512d __A, __m512d __B)
{		{
// CHECK-LABEL: @test_mm512_maskz_max_pd		// CHECK-LABEL: @test_mm512_maskz_max_pd
// CHECK: @llvm.x86.avx512.max.pd.512		// CHECK: fcmp uge <8 x double> %{{.}}, %{{.}}
		// CHECK: select <8 x i1> %{{.}}, <8 x double> %{{.}}, <8 x double> %{{.*}}
		// CHECK: store <8 x double> zeroinitializer, <8 x double>* %.compoundliteral.i.i, align 64
		// CHECK: load <8 x double>, <8 x double>* %.compoundliteral.i.i, align 64
// CHECK: select <8 x i1> %{{.}}, <8 x double> %{{.}}, <8 x double> %{{.*}}		// CHECK: select <8 x i1> %{{.}}, <8 x double> %{{.}}, <8 x double> %{{.*}}
return _mm512_maskz_max_pd (__U,__A,__B);		return _mm512_maskz_max_pd (__U,__A,__B);
}		}

__m512 test_mm512_mask_max_ps (__m512 __W, __mmask16 __U, __m512 __A, __m512 __B)		__m512 test_mm512_mask_max_ps (__m512 __W, __mmask16 __U, __m512 __A, __m512 __B)
{		{
// CHECK-LABEL: @test_mm512_mask_max_ps		// CHECK-LABEL: @test_mm512_mask_max_ps
// CHECK: @llvm.x86.avx512.max.ps.512		// CHECK: fcmp uge <16 x float> %{{.}}, %{{.}}
		// CHECK: select <16 x i1> %{{.}}, <16 x float> %{{.}}, <16 x float> %{{.*}}
// CHECK: select <16 x i1> %{{.}}, <16 x float> %{{.}}, <16 x float> %{{.*}}		// CHECK: select <16 x i1> %{{.}}, <16 x float> %{{.}}, <16 x float> %{{.*}}
return _mm512_mask_max_ps (__W,__U,__A,__B);		return _mm512_mask_max_ps (__W,__U,__A,__B);
}		}

__m512d test_mm512_mask_max_round_pd(__m512d __W,__mmask8 __U,__m512d __A,__m512d __B)		__m512d test_mm512_mask_max_round_pd(__m512d __W,__mmask8 __U,__m512d __A,__m512d __B)
{		{
// CHECK-LABEL: @test_mm512_mask_max_round_pd		// CHECK-LABEL: @test_mm512_mask_max_round_pd
// CHECK: @llvm.x86.avx512.max.pd.512		// CHECK: @llvm.x86.avx512.max.pd.512
Show All 14 Lines	__m512d test_mm512_max_round_pd(__m512d __A,__m512d __B)
// CHECK-LABEL: @test_mm512_max_round_pd		// CHECK-LABEL: @test_mm512_max_round_pd
// CHECK: @llvm.x86.avx512.max.pd.512		// CHECK: @llvm.x86.avx512.max.pd.512
return _mm512_max_round_pd(__A,__B,_MM_FROUND_CUR_DIRECTION);		return _mm512_max_round_pd(__A,__B,_MM_FROUND_CUR_DIRECTION);
}		}

__m512 test_mm512_maskz_max_ps (__mmask16 __U, __m512 __A, __m512 __B)		__m512 test_mm512_maskz_max_ps (__mmask16 __U, __m512 __A, __m512 __B)
{		{
// CHECK-LABEL: @test_mm512_maskz_max_ps		// CHECK-LABEL: @test_mm512_maskz_max_ps
// CHECK: @llvm.x86.avx512.max.ps.512		// CHECK: fcmp uge <16 x float> %{{.}}, %{{.}}
		// CHECK: select <16 x i1> %{{.}}, <16 x float> %{{.}}, <16 x float> %{{.*}}
		// CHECK: store <16 x float> zeroinitializer, <16 x float>* %.compoundliteral.i.i, align 64
		// CHECK: load <16 x float>, <16 x float>* %.compoundliteral.i.i, align 64
// CHECK: select <16 x i1> %{{.}}, <16 x float> %{{.}}, <16 x float> %{{.*}}		// CHECK: select <16 x i1> %{{.}}, <16 x float> %{{.}}, <16 x float> %{{.*}}
return _mm512_maskz_max_ps (__U,__A,__B);		return _mm512_maskz_max_ps (__U,__A,__B);
}		}

__m512 test_mm512_mask_max_round_ps(__m512 __W,__mmask16 __U,__m512 __A,__m512 __B)		__m512 test_mm512_mask_max_round_ps(__m512 __W,__mmask16 __U,__m512 __A,__m512 __B)
{		{
// CHECK-LABEL: @test_mm512_mask_max_round_ps		// CHECK-LABEL: @test_mm512_mask_max_round_ps
// CHECK: @llvm.x86.avx512.max.ps.512		// CHECK: @llvm.x86.avx512.max.ps.512
Show All 14 Lines	__m512 test_mm512_max_round_ps(__m512 __A,__m512 __B)
// CHECK-LABEL: @test_mm512_max_round_ps		// CHECK-LABEL: @test_mm512_max_round_ps
// CHECK: @llvm.x86.avx512.max.ps.512		// CHECK: @llvm.x86.avx512.max.ps.512
return _mm512_max_round_ps(__A,__B,_MM_FROUND_CUR_DIRECTION);		return _mm512_max_round_ps(__A,__B,_MM_FROUND_CUR_DIRECTION);
}		}

__m512d test_mm512_mask_min_pd (__m512d __W, __mmask8 __U, __m512d __A, __m512d __B)		__m512d test_mm512_mask_min_pd (__m512d __W, __mmask8 __U, __m512d __A, __m512d __B)
{		{
// CHECK-LABEL: @test_mm512_mask_min_pd		// CHECK-LABEL: @test_mm512_mask_min_pd
// CHECK: @llvm.x86.avx512.min.pd.512		// CHECK: fcmp olt <8 x double> %{{.}}, %{{.}}
		// CHECK: select <8 x i1> %{{.}}, <8 x double> %{{.}}, <8 x double> %{{.*}}
// CHECK: select <8 x i1> %{{.}}, <8 x double> %{{.}}, <8 x double> %{{.*}}		// CHECK: select <8 x i1> %{{.}}, <8 x double> %{{.}}, <8 x double> %{{.*}}
return _mm512_mask_min_pd (__W,__U,__A,__B);		return _mm512_mask_min_pd (__W,__U,__A,__B);
}		}

__m512d test_mm512_maskz_min_pd (__mmask8 __U, __m512d __A, __m512d __B)		__m512d test_mm512_maskz_min_pd (__mmask8 __U, __m512d __A, __m512d __B)
{		{
// CHECK-LABEL: @test_mm512_maskz_min_pd		// CHECK-LABEL: @test_mm512_maskz_min_pd
// CHECK: @llvm.x86.avx512.min.pd.512		// CHECK: fcmp olt <8 x double> %{{.}}, %{{.}}
		// CHECK: select <8 x i1> %{{.}}, <8 x double> %{{.}}, <8 x double> %{{.*}}
		// CHECK: store <8 x double> zeroinitializer, <8 x double>* %.compoundliteral.i.i, align 64
		// CHECK: load <8 x double>, <8 x double>* %.compoundliteral.i.i, align 64
		// CHECK: select <8 x i1> %{{.}}, <8 x double> %{{.}}, <8 x double> %{{.*}}
return _mm512_maskz_min_pd (__U,__A,__B);		return _mm512_maskz_min_pd (__U,__A,__B);
}		}

__m512d test_mm512_mask_min_round_pd(__m512d __W,__mmask8 __U,__m512d __A,__m512d __B)		__m512d test_mm512_mask_min_round_pd(__m512d __W,__mmask8 __U,__m512d __A,__m512d __B)
{		{
// CHECK-LABEL: @test_mm512_mask_min_round_pd		// CHECK-LABEL: @test_mm512_mask_min_round_pd
// CHECK: @llvm.x86.avx512.min.pd.512		// CHECK: @llvm.x86.avx512.min.pd.512
// CHECK: select <8 x i1> %{{.}}, <8 x double> %{{.}}, <8 x double> %{{.*}}		// CHECK: select <8 x i1> %{{.}}, <8 x double> %{{.}}, <8 x double> %{{.*}}
Show All 13 Lines	__m512d test_mm512_min_round_pd( __m512d __A,__m512d __B)
// CHECK-LABEL: @test_mm512_min_round_pd		// CHECK-LABEL: @test_mm512_min_round_pd
// CHECK: @llvm.x86.avx512.min.pd.512		// CHECK: @llvm.x86.avx512.min.pd.512
return _mm512_min_round_pd(__A,__B,_MM_FROUND_CUR_DIRECTION);		return _mm512_min_round_pd(__A,__B,_MM_FROUND_CUR_DIRECTION);
}		}

__m512 test_mm512_mask_min_ps (__m512 __W, __mmask16 __U, __m512 __A, __m512 __B)		__m512 test_mm512_mask_min_ps (__m512 __W, __mmask16 __U, __m512 __A, __m512 __B)
{		{
// CHECK-LABEL: @test_mm512_mask_min_ps		// CHECK-LABEL: @test_mm512_mask_min_ps
// CHECK: @llvm.x86.avx512.min.ps.512		// CHECK: fcmp olt <16 x float> %{{.}}, %{{.}}
		// CHECK: select <16 x i1> %{{.}}, <16 x float> %{{.}}, <16 x float> %{{.*}}
// CHECK: select <16 x i1> %{{.}}, <16 x float> %{{.}}, <16 x float> %{{.*}}		// CHECK: select <16 x i1> %{{.}}, <16 x float> %{{.}}, <16 x float> %{{.*}}
return _mm512_mask_min_ps (__W,__U,__A,__B);		return _mm512_mask_min_ps (__W,__U,__A,__B);
}		}

__m512 test_mm512_maskz_min_ps (__mmask16 __U, __m512 __A, __m512 __B)		__m512 test_mm512_maskz_min_ps (__mmask16 __U, __m512 __A, __m512 __B)
{		{
// CHECK-LABEL: @test_mm512_maskz_min_ps		// CHECK-LABEL: @test_mm512_maskz_min_ps
// CHECK: @llvm.x86.avx512.min.ps.512		// CHECK: fcmp olt <16 x float> %{{.}}, %{{.}}
		// CHECK: select <16 x i1> %{{.}}, <16 x float> %{{.}}, <16 x float> %{{.*}}
		// CHECK: store <16 x float> zeroinitializer, <16 x float>* %.compoundliteral.i.i, align 64
		// CHECK: load <16 x float>, <16 x float>* %.compoundliteral.i.i, align 64
// CHECK: select <16 x i1> %{{.}}, <16 x float> %{{.}}, <16 x float> %{{.*}}		// CHECK: select <16 x i1> %{{.}}, <16 x float> %{{.}}, <16 x float> %{{.*}}
return _mm512_maskz_min_ps (__U,__A,__B);		return _mm512_maskz_min_ps (__U,__A,__B);
}		}

__m512 test_mm512_mask_min_round_ps(__m512 __W,__mmask16 __U,__m512 __A,__m512 __B)		__m512 test_mm512_mask_min_round_ps(__m512 __W,__mmask16 __U,__m512 __A,__m512 __B)
{		{
// CHECK-LABEL: @test_mm512_mask_min_round_ps		// CHECK-LABEL: @test_mm512_mask_min_round_ps
// CHECK: @llvm.x86.avx512.min.ps.512		// CHECK: @llvm.x86.avx512.min.ps.512
▲ Show 20 Lines • Show All 1,067 Lines • Show Last 20 Lines