This is an archive of the discontinued LLVM Phabricator instance.

Paths

Table of Contentst

-
include/clang/Basic/
-
clang/
-
Basic/
-
BuiltinsX86.def
-
lib/Headers/
-
Headers/
-
avx512bwintrin.h
-
avx512fintrin.h
-
avx512vlbwintrin.h
-
avx512vlintrin.h
-
test/CodeGen/
-
CodeGen/
-
avx512bw-builtins.c
-
avx512f-builtins.c
-
avx512vl-builtins.c
-
avx512vlbw-builtins.c

Differential D46742

[X86] Use __builtin_convertvector to replace some of the avx512 truncate builtins.
ClosedPublic

Authored by craig.topper on May 10 2018, 11:44 PM.

Download Raw Diff

Details

Reviewers

RKSimon
GBuella
tkrupa

Commits

rG25de41cfbcb6: [X86] Use __builtin_convertvector to replace some of the avx512 truncate…
rL332266: [X86] Use __builtin_convertvector to replace some of the avx512 truncate…
rC332266: [X86] Use __builtin_convertvector to replace some of the avx512 truncate…

Summary

As long as the destination type is a 256 or 128 bit vector we can use __builtin_convertvector to directly generate trunc IR instruction which will be handled natively by the backend.

Diff Detail

Repository: rC Clang

Event Timeline

craig.topper created this revision.May 10 2018, 11:44 PM

Harbormaster completed remote builds in B17981: Diff 146286.May 10 2018, 11:44 PM

There are four other similar intrinsics which convert to 128/256-bit vectors:

m128i _mm256_cvtepi32_epi8 (m256i a)
m128i _mm256_cvtepi64_epi16 (m256i a)
m128i _mm256_cvtepi64_epi8 (m256i a)
m128i _mm512_cvtepi64_epi8 (m512i a)

Can you also include them?

Nevermind - these four are not strictly truncating. Sorry for the confusion.

In D46742#1095658, @tkrupa wrote:

There are four other similar intrinsics which convert to 128/256-bit vectors:

m128i _mm256_cvtepi32_epi8 (m256i a)
m128i _mm256_cvtepi64_epi16 (m256i a)
m128i _mm256_cvtepi64_epi8 (m256i a)
m128i _mm512_cvtepi64_epi8 (m512i a)

Can you also include them?

Probably these should be possible, but e.g. with the _mm256_cvtepi32_epi8 case, I can only get this far:

vpmovdw %ymm0, %xmm0
vpshufb .LCPI2_0(%rip), %xmm0, %xmm0 # xmm0 = xmm0[0,2,4,6,8,10,12,14],zero,zero,zero,zero,zero,zero,zero,zero
vzeroupper
retq

While the expected result is a vpmovdb instruction, without the extra shuffling.

Yeah the others will need codegen work. So I'm starting with the easy cases.

LGTM

This revision is now accepted and ready to land.May 14 2018, 3:46 AM

Closed by commit rC332266: [X86] Use __builtin_convertvector to replace some of the avx512 truncate… (authored by ctopper). · Explain WhyMay 14 2018, 10:54 AM

This revision was automatically updated to reflect the committed changes.

GBuella added a subscriber: mike.dvoretsky.May 21 2018, 5:36 AM

GBuella added a subscriber: ashlykov.

Revision Contents

Path

Size

include/

clang/

Basic/

BuiltinsX86.def

8 lines

lib/

Headers/

16 lines

60 lines

16 lines

30 lines

test/

CodeGen/

avx512bw-builtins.c

8 lines

avx512f-builtins.c

32 lines

avx512vl-builtins.c

16 lines

avx512vlbw-builtins.c

8 lines

Diff 146645

include/clang/Basic/BuiltinsX86.def

	Show First 20 Lines • Show All 1,349 Lines • ▼ Show 20 Lines
	TARGET_BUILTIN(__builtin_ia32_vpshrdq256_mask, "V4LLiV4LLiV4LLiIiV4LLiUc", "nc", "avx512vl,avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_vpshrdq256_mask, "V4LLiV4LLiV4LLiIiV4LLiUc", "nc", "avx512vl,avx512vbmi2")
	TARGET_BUILTIN(__builtin_ia32_vpshrdq512_mask, "V8LLiV8LLiV8LLiIiV8LLiUc", "nc", "avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_vpshrdq512_mask, "V8LLiV8LLiV8LLiIiV8LLiUc", "nc", "avx512vbmi2")
	TARGET_BUILTIN(__builtin_ia32_vpshrdw128_mask, "V8sV8sV8sIiV8sUc", "nc", "avx512vl,avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_vpshrdw128_mask, "V8sV8sV8sIiV8sUc", "nc", "avx512vl,avx512vbmi2")
	TARGET_BUILTIN(__builtin_ia32_vpshrdw256_mask, "V16sV16sV16sIiV16sUs", "nc", "avx512vl,avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_vpshrdw256_mask, "V16sV16sV16sIiV16sUs", "nc", "avx512vl,avx512vbmi2")
	TARGET_BUILTIN(__builtin_ia32_vpshrdw512_mask, "V32sV32sV32sIiV32sUi", "nc", "avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_vpshrdw512_mask, "V32sV32sV32sIiV32sUi", "nc", "avx512vbmi2")

	TARGET_BUILTIN(__builtin_ia32_pmovswb512_mask, "V32cV32sV32cUi", "nc", "avx512bw")			TARGET_BUILTIN(__builtin_ia32_pmovswb512_mask, "V32cV32sV32cUi", "nc", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_pmovuswb512_mask, "V32cV32sV32cUi", "nc", "avx512bw")			TARGET_BUILTIN(__builtin_ia32_pmovuswb512_mask, "V32cV32sV32cUi", "nc", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_pmovwb512_mask, "V32cV32sV32cUi", "nc", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_cvtpd2qq128_mask, "V2LLiV2dV2LLiUc", "nc", "avx512vl,avx512dq")			TARGET_BUILTIN(__builtin_ia32_cvtpd2qq128_mask, "V2LLiV2dV2LLiUc", "nc", "avx512vl,avx512dq")
	TARGET_BUILTIN(__builtin_ia32_cvtpd2qq256_mask, "V4LLiV4dV4LLiUc", "nc", "avx512vl,avx512dq")			TARGET_BUILTIN(__builtin_ia32_cvtpd2qq256_mask, "V4LLiV4dV4LLiUc", "nc", "avx512vl,avx512dq")
	TARGET_BUILTIN(__builtin_ia32_cvtpd2uqq128_mask, "V2LLiV2dV2LLiUc", "nc", "avx512vl,avx512dq")			TARGET_BUILTIN(__builtin_ia32_cvtpd2uqq128_mask, "V2LLiV2dV2LLiUc", "nc", "avx512vl,avx512dq")
	TARGET_BUILTIN(__builtin_ia32_cvtpd2uqq256_mask, "V4LLiV4dV4LLiUc", "nc", "avx512vl,avx512dq")			TARGET_BUILTIN(__builtin_ia32_cvtpd2uqq256_mask, "V4LLiV4dV4LLiUc", "nc", "avx512vl,avx512dq")
	TARGET_BUILTIN(__builtin_ia32_cvtps2qq128_mask, "V2LLiV4fV2LLiUc", "nc", "avx512vl,avx512dq")			TARGET_BUILTIN(__builtin_ia32_cvtps2qq128_mask, "V2LLiV4fV2LLiUc", "nc", "avx512vl,avx512dq")
	TARGET_BUILTIN(__builtin_ia32_cvtps2qq256_mask, "V4LLiV4fV4LLiUc", "nc", "avx512vl,avx512dq")			TARGET_BUILTIN(__builtin_ia32_cvtps2qq256_mask, "V4LLiV4fV4LLiUc", "nc", "avx512vl,avx512dq")
	TARGET_BUILTIN(__builtin_ia32_cvtps2uqq128_mask, "V2LLiV4fV2LLiUc", "nc", "avx512vl,avx512dq")			TARGET_BUILTIN(__builtin_ia32_cvtps2uqq128_mask, "V2LLiV4fV2LLiUc", "nc", "avx512vl,avx512dq")
	TARGET_BUILTIN(__builtin_ia32_cvtps2uqq256_mask, "V4LLiV4fV4LLiUc", "nc", "avx512vl,avx512dq")			TARGET_BUILTIN(__builtin_ia32_cvtps2uqq256_mask, "V4LLiV4fV4LLiUc", "nc", "avx512vl,avx512dq")
	Show All 25 Lines
	TARGET_BUILTIN(__builtin_ia32_reduceps256_mask, "V8fV8fIiV8fUc", "nc", "avx512vl,avx512dq")			TARGET_BUILTIN(__builtin_ia32_reduceps256_mask, "V8fV8fIiV8fUc", "nc", "avx512vl,avx512dq")
	TARGET_BUILTIN(__builtin_ia32_reducesd_mask, "V2dV2dV2dV2dUcIiIi", "nc", "avx512dq")			TARGET_BUILTIN(__builtin_ia32_reducesd_mask, "V2dV2dV2dV2dUcIiIi", "nc", "avx512dq")
	TARGET_BUILTIN(__builtin_ia32_reducess_mask, "V4fV4fV4fV4fUcIiIi", "nc", "avx512dq")			TARGET_BUILTIN(__builtin_ia32_reducess_mask, "V4fV4fV4fV4fUcIiIi", "nc", "avx512dq")
	TARGET_BUILTIN(__builtin_ia32_pmovswb128_mask, "V16cV8sV16cUc", "nc", "avx512vl,avx512bw")			TARGET_BUILTIN(__builtin_ia32_pmovswb128_mask, "V16cV8sV16cUc", "nc", "avx512vl,avx512bw")
	TARGET_BUILTIN(__builtin_ia32_pmovswb256_mask, "V16cV16sV16cUs", "nc", "avx512vl,avx512bw")			TARGET_BUILTIN(__builtin_ia32_pmovswb256_mask, "V16cV16sV16cUs", "nc", "avx512vl,avx512bw")
	TARGET_BUILTIN(__builtin_ia32_pmovuswb128_mask, "V16cV8sV16cUc", "nc", "avx512vl,avx512bw")			TARGET_BUILTIN(__builtin_ia32_pmovuswb128_mask, "V16cV8sV16cUc", "nc", "avx512vl,avx512bw")
	TARGET_BUILTIN(__builtin_ia32_pmovuswb256_mask, "V16cV16sV16cUs", "nc", "avx512vl,avx512bw")			TARGET_BUILTIN(__builtin_ia32_pmovuswb256_mask, "V16cV16sV16cUs", "nc", "avx512vl,avx512bw")
	TARGET_BUILTIN(__builtin_ia32_pmovwb128_mask, "V16cV8sV16cUc", "nc", "avx512vl,avx512bw")			TARGET_BUILTIN(__builtin_ia32_pmovwb128_mask, "V16cV8sV16cUc", "nc", "avx512vl,avx512bw")
	TARGET_BUILTIN(__builtin_ia32_pmovwb256_mask, "V16cV16sV16cUs", "nc", "avx512vl,avx512bw")
	TARGET_BUILTIN(__builtin_ia32_cvtpd2qq512_mask, "V8LLiV8dV8LLiUcIi", "nc", "avx512dq")			TARGET_BUILTIN(__builtin_ia32_cvtpd2qq512_mask, "V8LLiV8dV8LLiUcIi", "nc", "avx512dq")
	TARGET_BUILTIN(__builtin_ia32_cvtpd2uqq512_mask, "V8LLiV8dV8LLiUcIi", "nc", "avx512dq")			TARGET_BUILTIN(__builtin_ia32_cvtpd2uqq512_mask, "V8LLiV8dV8LLiUcIi", "nc", "avx512dq")
	TARGET_BUILTIN(__builtin_ia32_cvtps2qq512_mask, "V8LLiV8fV8LLiUcIi", "nc", "avx512dq")			TARGET_BUILTIN(__builtin_ia32_cvtps2qq512_mask, "V8LLiV8fV8LLiUcIi", "nc", "avx512dq")
	TARGET_BUILTIN(__builtin_ia32_cvtps2uqq512_mask, "V8LLiV8fV8LLiUcIi", "nc", "avx512dq")			TARGET_BUILTIN(__builtin_ia32_cvtps2uqq512_mask, "V8LLiV8fV8LLiUcIi", "nc", "avx512dq")
	TARGET_BUILTIN(__builtin_ia32_cvtqq2pd512_mask, "V8dV8LLiV8dUcIi", "nc", "avx512dq")			TARGET_BUILTIN(__builtin_ia32_cvtqq2pd512_mask, "V8dV8LLiV8dUcIi", "nc", "avx512dq")
	TARGET_BUILTIN(__builtin_ia32_cvtqq2ps512_mask, "V8fV8LLiV8fUcIi", "nc", "avx512dq")			TARGET_BUILTIN(__builtin_ia32_cvtqq2ps512_mask, "V8fV8LLiV8fUcIi", "nc", "avx512dq")
	TARGET_BUILTIN(__builtin_ia32_cvttpd2qq512_mask, "V8LLiV8dV8LLiUcIi", "nc", "avx512dq")			TARGET_BUILTIN(__builtin_ia32_cvttpd2qq512_mask, "V8LLiV8dV8LLiUcIi", "nc", "avx512dq")
	TARGET_BUILTIN(__builtin_ia32_cvttpd2uqq512_mask, "V8LLiV8dV8LLiUcIi", "nc", "avx512dq")			TARGET_BUILTIN(__builtin_ia32_cvttpd2uqq512_mask, "V8LLiV8dV8LLiUcIi", "nc", "avx512dq")
	▲ Show 20 Lines • Show All 305 Lines • ▼ Show 20 Lines
	TARGET_BUILTIN(__builtin_ia32_pmovusqd128_mask, "V4iV2LLiV4iUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmovusqd128_mask, "V4iV2LLiV4iUc", "nc", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovusqd128mem_mask, "vV4i*V2LLiUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmovusqd128mem_mask, "vV4i*V2LLiUc", "n", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovusqd256_mask, "V4iV4LLiV4iUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmovusqd256_mask, "V4iV4LLiV4iUc", "nc", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovusqd256mem_mask, "vV4i*V4LLiUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmovusqd256mem_mask, "vV4i*V4LLiUc", "n", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovusqw128_mask, "V8sV2LLiV8sUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmovusqw128_mask, "V8sV2LLiV8sUc", "nc", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovusqw128mem_mask, "vV8s*V2LLiUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmovusqw128mem_mask, "vV8s*V2LLiUc", "n", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovusqw256_mask, "V8sV4LLiV8sUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmovusqw256_mask, "V8sV4LLiV8sUc", "nc", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovusqw256mem_mask, "vV8s*V4LLiUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmovusqw256mem_mask, "vV8s*V4LLiUc", "n", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovdb512_mask, "V16cV16iV16cUs", "nc", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_pmovdb512mem_mask, "vV16c*V16iUs", "n", "avx512f")			TARGET_BUILTIN(__builtin_ia32_pmovdb512mem_mask, "vV16c*V16iUs", "n", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_pmovwb512mem_mask, "vV32c*V32sUi", "n", "avx512bw")			TARGET_BUILTIN(__builtin_ia32_pmovwb512mem_mask, "vV32c*V32sUi", "n", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_pmovdw512_mask, "V16sV16iV16sUs", "nc", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_pmovdw512mem_mask, "vV16s*V16iUs", "n", "avx512f")			TARGET_BUILTIN(__builtin_ia32_pmovdw512mem_mask, "vV16s*V16iUs", "n", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_pmovqb512_mask, "V16cV8LLiV16cUc", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_pmovqb512_mask, "V16cV8LLiV16cUc", "nc", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_pmovqb512mem_mask, "vV16c*V8LLiUc", "n", "avx512f")			TARGET_BUILTIN(__builtin_ia32_pmovqb512mem_mask, "vV16c*V8LLiUc", "n", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_pmovqd512_mask, "V8iV8LLiV8iUc", "nc", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_pmovqd512mem_mask, "vV8i*V8LLiUc", "n", "avx512f")			TARGET_BUILTIN(__builtin_ia32_pmovqd512mem_mask, "vV8i*V8LLiUc", "n", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_pmovqw512_mask, "V8sV8LLiV8sUc", "nc", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_pmovqw512mem_mask, "vV8s*V8LLiUc", "n", "avx512f")			TARGET_BUILTIN(__builtin_ia32_pmovqw512mem_mask, "vV8s*V8LLiUc", "n", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_pmovdb128_mask, "V16cV4iV16cUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmovdb128_mask, "V16cV4iV16cUc", "nc", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovwb128mem_mask, "vV16c*V8sUc", "n", "avx512vl,avx512bw")			TARGET_BUILTIN(__builtin_ia32_pmovwb128mem_mask, "vV16c*V8sUc", "n", "avx512vl,avx512bw")
	TARGET_BUILTIN(__builtin_ia32_pmovdb128mem_mask, "vV16c*V4iUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmovdb128mem_mask, "vV16c*V4iUc", "n", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovdb256_mask, "V16cV8iV16cUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmovdb256_mask, "V16cV8iV16cUc", "nc", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovdb256mem_mask, "vV16c*V8iUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmovdb256mem_mask, "vV16c*V8iUc", "n", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovwb256mem_mask, "vV16c*V16sUs", "n", "avx512vl,avx512bw")			TARGET_BUILTIN(__builtin_ia32_pmovwb256mem_mask, "vV16c*V16sUs", "n", "avx512vl,avx512bw")
	TARGET_BUILTIN(__builtin_ia32_pmovdw128_mask, "V8sV4iV8sUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmovdw128_mask, "V8sV4iV8sUc", "nc", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovdw128mem_mask, "vV8s*V4iUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmovdw128mem_mask, "vV8s*V4iUc", "n", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovdw256_mask, "V8sV8iV8sUc", "nc", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovdw256mem_mask, "vV8s*V8iUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmovdw256mem_mask, "vV8s*V8iUc", "n", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovqb128_mask, "V16cV2LLiV16cUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmovqb128_mask, "V16cV2LLiV16cUc", "nc", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovqb128mem_mask, "vV16c*V2LLiUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmovqb128mem_mask, "vV16c*V2LLiUc", "n", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovqb256_mask, "V16cV4LLiV16cUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmovqb256_mask, "V16cV4LLiV16cUc", "nc", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovqb256mem_mask, "vV16c*V4LLiUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmovqb256mem_mask, "vV16c*V4LLiUc", "n", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovqd128_mask, "V4iV2LLiV4iUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmovqd128_mask, "V4iV2LLiV4iUc", "nc", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovqd128mem_mask, "vV4i*V2LLiUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmovqd128mem_mask, "vV4i*V2LLiUc", "n", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovqd256_mask, "V4iV4LLiV4iUc", "nc", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovqd256mem_mask, "vV4i*V4LLiUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmovqd256mem_mask, "vV4i*V4LLiUc", "n", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovqw128_mask, "V8sV2LLiV8sUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmovqw128_mask, "V8sV2LLiV8sUc", "nc", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovqw128mem_mask, "vV8s*V2LLiUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmovqw128mem_mask, "vV8s*V2LLiUc", "n", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovqw256_mask, "V8sV4LLiV8sUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmovqw256_mask, "V8sV4LLiV8sUc", "nc", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovqw256mem_mask, "vV8s*V4LLiUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmovqw256mem_mask, "vV8s*V4LLiUc", "n", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_getmantpd128_mask, "V2dV2diV2dUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_getmantpd128_mask, "V2dV2diV2dUc", "nc", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_getmantpd256_mask, "V4dV4diV4dUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_getmantpd256_mask, "V4dV4diV4dUc", "nc", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_getmantps128_mask, "V4fV4fiV4fUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_getmantps128_mask, "V4fV4fiV4fUc", "nc", "avx512vl")
	▲ Show 20 Lines • Show All 162 Lines • Show Last 20 Lines

lib/Headers/avx512bwintrin.h

	Show First 20 Lines • Show All 1,151 Lines • ▼ Show 20 Lines
	_mm512_maskz_cvtusepi16_epi8 (__mmask32 __M, __m512i __A) {			_mm512_maskz_cvtusepi16_epi8 (__mmask32 __M, __m512i __A) {
	return (__m256i) __builtin_ia32_pmovuswb512_mask ((__v32hi) __A,			return (__m256i) __builtin_ia32_pmovuswb512_mask ((__v32hi) __A,
	(__v32qi) _mm256_setzero_si256(),			(__v32qi) _mm256_setzero_si256(),
	__M);			__M);
	}			}

	static __inline__ __m256i __DEFAULT_FN_ATTRS			static __inline__ __m256i __DEFAULT_FN_ATTRS
	_mm512_cvtepi16_epi8 (__m512i __A) {			_mm512_cvtepi16_epi8 (__m512i __A) {
	return (__m256i) __builtin_ia32_pmovwb512_mask ((__v32hi) __A,			return (__m256i)__builtin_convertvector((__v32hi)__A, __v32qi);
	(__v32qi) _mm256_setzero_si256(),
	(__mmask32) -1);
	}			}

	static __inline__ __m256i __DEFAULT_FN_ATTRS			static __inline__ __m256i __DEFAULT_FN_ATTRS
	_mm512_mask_cvtepi16_epi8 (__m256i __O, __mmask32 __M, __m512i __A) {			_mm512_mask_cvtepi16_epi8 (__m256i __O, __mmask32 __M, __m512i __A) {
	return (__m256i) __builtin_ia32_pmovwb512_mask ((__v32hi) __A,			return (__m256i)__builtin_ia32_selectb_256((__mmask32)__M,
	(__v32qi) __O,			(__v32qi)_mm512_cvtepi16_epi8(__A),
	__M);			(__v32qi)__O);
	}			}

	static __inline__ __m256i __DEFAULT_FN_ATTRS			static __inline__ __m256i __DEFAULT_FN_ATTRS
	_mm512_maskz_cvtepi16_epi8 (__mmask32 __M, __m512i __A) {			_mm512_maskz_cvtepi16_epi8 (__mmask32 __M, __m512i __A) {
	return (__m256i) __builtin_ia32_pmovwb512_mask ((__v32hi) __A,			return (__m256i)__builtin_ia32_selectb_256((__mmask32)__M,
	(__v32qi) _mm256_setzero_si256(),			(__v32qi)_mm512_cvtepi16_epi8(__A),
	__M);			(__v32qi)_mm256_setzero_si256());
	}			}

	static __inline__ void __DEFAULT_FN_ATTRS			static __inline__ void __DEFAULT_FN_ATTRS
	_mm512_mask_cvtepi16_storeu_epi8 (void * __P, __mmask32 __M, __m512i __A)			_mm512_mask_cvtepi16_storeu_epi8 (void * __P, __mmask32 __M, __m512i __A)
	{			{
	__builtin_ia32_pmovwb512mem_mask ((__v32qi *) __P, (__v32hi) __A, __M);			__builtin_ia32_pmovwb512mem_mask ((__v32qi *) __P, (__v32hi) __A, __M);
	}			}

	▲ Show 20 Lines • Show All 928 Lines • Show Last 20 Lines

lib/Headers/avx512fintrin.h

This file is larger than 256 KB, so syntax highlighting is disabled by default.

	Show First 20 Lines • Show All 7,595 Lines • ▼ Show 20 Lines
	_mm512_mask_cvtusepi64_storeu_epi16 (void *__P, __mmask8 __M, __m512i __A)			_mm512_mask_cvtusepi64_storeu_epi16 (void *__P, __mmask8 __M, __m512i __A)
	{			{
	__builtin_ia32_pmovusqw512mem_mask ((__v8hi*) __P, (__v8di) __A, __M);			__builtin_ia32_pmovusqw512mem_mask ((__v8hi*) __P, (__v8di) __A, __M);
	}			}

	static __inline__ __m128i __DEFAULT_FN_ATTRS			static __inline__ __m128i __DEFAULT_FN_ATTRS
	_mm512_cvtepi32_epi8 (__m512i __A)			_mm512_cvtepi32_epi8 (__m512i __A)
	{			{
	return (__m128i) __builtin_ia32_pmovdb512_mask ((__v16si) __A,			return (__m128i)__builtin_convertvector((__v16si)__A, __v16qi);
	(__v16qi) _mm_undefined_si128 (),
	(__mmask16) -1);
	}			}

	static __inline__ __m128i __DEFAULT_FN_ATTRS			static __inline__ __m128i __DEFAULT_FN_ATTRS
	_mm512_mask_cvtepi32_epi8 (__m128i __O, __mmask16 __M, __m512i __A)			_mm512_mask_cvtepi32_epi8 (__m128i __O, __mmask16 __M, __m512i __A)
	{			{
	return (__m128i) __builtin_ia32_pmovdb512_mask ((__v16si) __A,			return (__m128i)__builtin_ia32_selectb_128((__mmask8)__M,
	(__v16qi) __O, __M);			(__v16qi)_mm512_cvtepi32_epi8(__A),
				(__v16qi)__O);
	}			}

	static __inline__ __m128i __DEFAULT_FN_ATTRS			static __inline__ __m128i __DEFAULT_FN_ATTRS
	_mm512_maskz_cvtepi32_epi8 (__mmask16 __M, __m512i __A)			_mm512_maskz_cvtepi32_epi8 (__mmask16 __M, __m512i __A)
	{			{
	return (__m128i) __builtin_ia32_pmovdb512_mask ((__v16si) __A,			return (__m128i)__builtin_ia32_selectb_128((__mmask8)__M,
	(__v16qi) _mm_setzero_si128 (),			(__v16qi)_mm512_cvtepi32_epi8(__A),
	__M);			(__v16qi)_mm_setzero_si128());
	}			}

	static __inline__ void __DEFAULT_FN_ATTRS			static __inline__ void __DEFAULT_FN_ATTRS
	_mm512_mask_cvtepi32_storeu_epi8 (void * __P, __mmask16 __M, __m512i __A)			_mm512_mask_cvtepi32_storeu_epi8 (void * __P, __mmask16 __M, __m512i __A)
	{			{
	__builtin_ia32_pmovdb512mem_mask ((__v16qi *) __P, (__v16si) __A, __M);			__builtin_ia32_pmovdb512mem_mask ((__v16qi *) __P, (__v16si) __A, __M);
	}			}

	static __inline__ __m256i __DEFAULT_FN_ATTRS			static __inline__ __m256i __DEFAULT_FN_ATTRS
	_mm512_cvtepi32_epi16 (__m512i __A)			_mm512_cvtepi32_epi16 (__m512i __A)
	{			{
	return (__m256i) __builtin_ia32_pmovdw512_mask ((__v16si) __A,			return (__m256i)__builtin_convertvector((__v16si)__A, __v16hi);
	(__v16hi) _mm256_undefined_si256 (),
	(__mmask16) -1);
	}			}

	static __inline__ __m256i __DEFAULT_FN_ATTRS			static __inline__ __m256i __DEFAULT_FN_ATTRS
	_mm512_mask_cvtepi32_epi16 (__m256i __O, __mmask16 __M, __m512i __A)			_mm512_mask_cvtepi32_epi16 (__m256i __O, __mmask16 __M, __m512i __A)
	{			{
	return (__m256i) __builtin_ia32_pmovdw512_mask ((__v16si) __A,			return (__m256i)__builtin_ia32_selectw_256((__mmask16)__M,
	(__v16hi) __O, __M);			(__v16hi)_mm512_cvtepi32_epi16(__A),
				(__v16hi)__O);
	}			}

	static __inline__ __m256i __DEFAULT_FN_ATTRS			static __inline__ __m256i __DEFAULT_FN_ATTRS
	_mm512_maskz_cvtepi32_epi16 (__mmask16 __M, __m512i __A)			_mm512_maskz_cvtepi32_epi16 (__mmask16 __M, __m512i __A)
	{			{
	return (__m256i) __builtin_ia32_pmovdw512_mask ((__v16si) __A,			return (__m256i)__builtin_ia32_selectw_256((__mmask16)__M,
	(__v16hi) _mm256_setzero_si256 (),			(__v16hi)_mm512_cvtepi32_epi16(__A),
	__M);			(__v16hi)_mm256_setzero_si256());
	}			}

	static __inline__ void __DEFAULT_FN_ATTRS			static __inline__ void __DEFAULT_FN_ATTRS
	_mm512_mask_cvtepi32_storeu_epi16 (void * __P, __mmask16 __M, __m512i __A)			_mm512_mask_cvtepi32_storeu_epi16 (void * __P, __mmask16 __M, __m512i __A)
	{			{
	__builtin_ia32_pmovdw512mem_mask ((__v16hi *) __P, (__v16si) __A, __M);			__builtin_ia32_pmovdw512mem_mask ((__v16hi *) __P, (__v16si) __A, __M);
	}			}

	Show All 24 Lines
	_mm512_mask_cvtepi64_storeu_epi8 (void * __P, __mmask8 __M, __m512i __A)			_mm512_mask_cvtepi64_storeu_epi8 (void * __P, __mmask8 __M, __m512i __A)
	{			{
	__builtin_ia32_pmovqb512mem_mask ((__v16qi *) __P, (__v8di) __A, __M);			__builtin_ia32_pmovqb512mem_mask ((__v16qi *) __P, (__v8di) __A, __M);
	}			}

	static __inline__ __m256i __DEFAULT_FN_ATTRS			static __inline__ __m256i __DEFAULT_FN_ATTRS
	_mm512_cvtepi64_epi32 (__m512i __A)			_mm512_cvtepi64_epi32 (__m512i __A)
	{			{
	return (__m256i) __builtin_ia32_pmovqd512_mask ((__v8di) __A,			return (__m256i)__builtin_convertvector((__v8di) __A, __v8si);
	(__v8si) _mm256_undefined_si256 (),
	(__mmask8) -1);
	}			}

	static __inline__ __m256i __DEFAULT_FN_ATTRS			static __inline__ __m256i __DEFAULT_FN_ATTRS
	_mm512_mask_cvtepi64_epi32 (__m256i __O, __mmask8 __M, __m512i __A)			_mm512_mask_cvtepi64_epi32 (__m256i __O, __mmask8 __M, __m512i __A)
	{			{
	return (__m256i) __builtin_ia32_pmovqd512_mask ((__v8di) __A,			return (__m256i)__builtin_ia32_selectd_256((__mmask8)__M,
	(__v8si) __O, __M);			(__v8si)_mm512_cvtepi64_epi32(__A),
				(__v8si)__O);
	}			}

	static __inline__ __m256i __DEFAULT_FN_ATTRS			static __inline__ __m256i __DEFAULT_FN_ATTRS
	_mm512_maskz_cvtepi64_epi32 (__mmask8 __M, __m512i __A)			_mm512_maskz_cvtepi64_epi32 (__mmask8 __M, __m512i __A)
	{			{
	return (__m256i) __builtin_ia32_pmovqd512_mask ((__v8di) __A,			return (__m256i)__builtin_ia32_selectd_256((__mmask8)__M,
	(__v8si) _mm256_setzero_si256 (),			(__v8si)_mm512_cvtepi64_epi32(__A),
	__M);			(__v8si)_mm256_setzero_si256());
	}			}

	static __inline__ void __DEFAULT_FN_ATTRS			static __inline__ void __DEFAULT_FN_ATTRS
	_mm512_mask_cvtepi64_storeu_epi32 (void* __P, __mmask8 __M, __m512i __A)			_mm512_mask_cvtepi64_storeu_epi32 (void* __P, __mmask8 __M, __m512i __A)
	{			{
	__builtin_ia32_pmovqd512mem_mask ((__v8si *) __P, (__v8di) __A, __M);			__builtin_ia32_pmovqd512mem_mask ((__v8si *) __P, (__v8di) __A, __M);
	}			}

	static __inline__ __m128i __DEFAULT_FN_ATTRS			static __inline__ __m128i __DEFAULT_FN_ATTRS
	_mm512_cvtepi64_epi16 (__m512i __A)			_mm512_cvtepi64_epi16 (__m512i __A)
	{			{
	return (__m128i) __builtin_ia32_pmovqw512_mask ((__v8di) __A,			return (__m128i)__builtin_convertvector((__v8di)__A, __v8hi);
	(__v8hi) _mm_undefined_si128 (),
	(__mmask8) -1);
	}			}

	static __inline__ __m128i __DEFAULT_FN_ATTRS			static __inline__ __m128i __DEFAULT_FN_ATTRS
	_mm512_mask_cvtepi64_epi16 (__m128i __O, __mmask8 __M, __m512i __A)			_mm512_mask_cvtepi64_epi16 (__m128i __O, __mmask8 __M, __m512i __A)
	{			{
	return (__m128i) __builtin_ia32_pmovqw512_mask ((__v8di) __A,			return (__m128i)__builtin_ia32_selectw_128((__mmask8)__M,
	(__v8hi) __O, __M);			(__v8hi)_mm512_cvtepi64_epi16(__A),
				(__v8hi)__O);
	}			}

	static __inline__ __m128i __DEFAULT_FN_ATTRS			static __inline__ __m128i __DEFAULT_FN_ATTRS
	_mm512_maskz_cvtepi64_epi16 (__mmask8 __M, __m512i __A)			_mm512_maskz_cvtepi64_epi16 (__mmask8 __M, __m512i __A)
	{			{
	return (__m128i) __builtin_ia32_pmovqw512_mask ((__v8di) __A,			return (__m128i)__builtin_ia32_selectw_128((__mmask8)__M,
	(__v8hi) _mm_setzero_si128 (),			(__v8hi)_mm512_cvtepi64_epi16(__A),
	__M);			(__v8hi)_mm_setzero_si128());
	}			}

	static __inline__ void __DEFAULT_FN_ATTRS			static __inline__ void __DEFAULT_FN_ATTRS
	_mm512_mask_cvtepi64_storeu_epi16 (void *__P, __mmask8 __M, __m512i __A)			_mm512_mask_cvtepi64_storeu_epi16 (void *__P, __mmask8 __M, __m512i __A)
	{			{
	__builtin_ia32_pmovqw512mem_mask ((__v8hi *) __P, (__v8di) __A, __M);			__builtin_ia32_pmovqw512mem_mask ((__v8hi *) __P, (__v8di) __A, __M);
	}			}

	▲ Show 20 Lines • Show All 2,474 Lines • Show Last 20 Lines

lib/Headers/avx512vlbwintrin.h

	Show First 20 Lines • Show All 1,545 Lines • ▼ Show 20 Lines
	static __inline__ void __DEFAULT_FN_ATTRS			static __inline__ void __DEFAULT_FN_ATTRS
	_mm_mask_cvtusepi16_storeu_epi8 (void * __P, __mmask8 __M, __m128i __A)			_mm_mask_cvtusepi16_storeu_epi8 (void * __P, __mmask8 __M, __m128i __A)
	{			{
	__builtin_ia32_pmovuswb128mem_mask ((__v16qi *) __P, (__v8hi) __A, __M);			__builtin_ia32_pmovuswb128mem_mask ((__v16qi *) __P, (__v8hi) __A, __M);
	}			}

	static __inline__ __m128i __DEFAULT_FN_ATTRS			static __inline__ __m128i __DEFAULT_FN_ATTRS
	_mm256_cvtepi16_epi8 (__m256i __A) {			_mm256_cvtepi16_epi8 (__m256i __A) {
	return (__m128i) __builtin_ia32_pmovwb256_mask ((__v16hi) __A,			return (__m128i)__builtin_convertvector((__v16hi) __A, __v16qi);
	(__v16qi) _mm_setzero_si128(),
	(__mmask16) -1);
	}			}

	static __inline__ __m128i __DEFAULT_FN_ATTRS			static __inline__ __m128i __DEFAULT_FN_ATTRS
	_mm256_mask_cvtepi16_epi8 (__m128i __O, __mmask16 __M, __m256i __A) {			_mm256_mask_cvtepi16_epi8 (__m128i __O, __mmask16 __M, __m256i __A) {
	return (__m128i) __builtin_ia32_pmovwb256_mask ((__v16hi) __A,			return (__m128i)__builtin_ia32_selectb_128((__mmask8)__M,
	(__v16qi) __O,			(__v16qi)_mm256_cvtepi16_epi8(__A),
	__M);			(__v16qi)__O);
	}			}

	static __inline__ __m128i __DEFAULT_FN_ATTRS			static __inline__ __m128i __DEFAULT_FN_ATTRS
	_mm256_maskz_cvtepi16_epi8 (__mmask16 __M, __m256i __A) {			_mm256_maskz_cvtepi16_epi8 (__mmask16 __M, __m256i __A) {
	return (__m128i) __builtin_ia32_pmovwb256_mask ((__v16hi) __A,			return (__m128i)__builtin_ia32_selectb_128((__mmask8)__M,
	(__v16qi) _mm_setzero_si128(),			(__v16qi)_mm256_cvtepi16_epi8(__A),
	__M);			(__v16qi)_mm_setzero_si128());
	}			}

	static __inline__ void __DEFAULT_FN_ATTRS			static __inline__ void __DEFAULT_FN_ATTRS
	_mm256_mask_cvtepi16_storeu_epi8 (void * __P, __mmask16 __M, __m256i __A)			_mm256_mask_cvtepi16_storeu_epi8 (void * __P, __mmask16 __M, __m256i __A)
	{			{
	__builtin_ia32_pmovwb256mem_mask ((__v16qi *) __P, (__v16hi) __A, __M);			__builtin_ia32_pmovwb256mem_mask ((__v16qi *) __P, (__v16hi) __A, __M);
	}			}

	▲ Show 20 Lines • Show All 1,203 Lines • Show Last 20 Lines

lib/Headers/avx512vlintrin.h

This file is larger than 256 KB, so syntax highlighting is disabled by default.

	Show First 20 Lines • Show All 7,621 Lines • ▼ Show 20 Lines
	_mm_mask_cvtepi32_storeu_epi16 (void * __P, __mmask8 __M, __m128i __A)			_mm_mask_cvtepi32_storeu_epi16 (void * __P, __mmask8 __M, __m128i __A)
	{			{
	__builtin_ia32_pmovdw128mem_mask ((__v8hi *) __P, (__v4si) __A, __M);			__builtin_ia32_pmovdw128mem_mask ((__v8hi *) __P, (__v4si) __A, __M);
	}			}

	static __inline__ __m128i __DEFAULT_FN_ATTRS			static __inline__ __m128i __DEFAULT_FN_ATTRS
	_mm256_cvtepi32_epi16 (__m256i __A)			_mm256_cvtepi32_epi16 (__m256i __A)
	{			{
	return (__m128i) __builtin_ia32_pmovdw256_mask ((__v8si) __A,			return (__m128i)__builtin_convertvector((__v8si)__A, __v8hi);
	(__v8hi)_mm_setzero_si128 (),
	(__mmask8) -1);
	}			}

	static __inline__ __m128i __DEFAULT_FN_ATTRS			static __inline__ __m128i __DEFAULT_FN_ATTRS
	_mm256_mask_cvtepi32_epi16 (__m128i __O, __mmask8 __M, __m256i __A)			_mm256_mask_cvtepi32_epi16 (__m128i __O, __mmask8 __M, __m256i __A)
	{			{
	return (__m128i) __builtin_ia32_pmovdw256_mask ((__v8si) __A,			return (__m128i)__builtin_ia32_selectw_128((__mmask8)__M,
	(__v8hi) __O, __M);			(__v8hi)_mm256_cvtepi32_epi16(__A),
				(__v8hi)__O);
	}			}

	static __inline__ __m128i __DEFAULT_FN_ATTRS			static __inline__ __m128i __DEFAULT_FN_ATTRS
	_mm256_maskz_cvtepi32_epi16 (__mmask8 __M, __m256i __A)			_mm256_maskz_cvtepi32_epi16 (__mmask8 __M, __m256i __A)
	{			{
	return (__m128i) __builtin_ia32_pmovdw256_mask ((__v8si) __A,			return (__m128i)__builtin_ia32_selectw_128((__mmask8)__M,
	(__v8hi) _mm_setzero_si128 (),			(__v8hi)_mm256_cvtepi32_epi16(__A),
	__M);			(__v8hi)_mm_setzero_si128());
	}			}

	static __inline__ void __DEFAULT_FN_ATTRS			static __inline__ void __DEFAULT_FN_ATTRS
	_mm256_mask_cvtepi32_storeu_epi16 (void * __P, __mmask8 __M, __m256i __A)			_mm256_mask_cvtepi32_storeu_epi16 (void * __P, __mmask8 __M, __m256i __A)
	{			{
	__builtin_ia32_pmovdw256mem_mask ((__v8hi *) __P, (__v8si) __A, __M);			__builtin_ia32_pmovdw256mem_mask ((__v8hi *) __P, (__v8si) __A, __M);
	}			}

	▲ Show 20 Lines • Show All 82 Lines • ▼ Show 20 Lines
	_mm_mask_cvtepi64_storeu_epi32 (void * __P, __mmask8 __M, __m128i __A)			_mm_mask_cvtepi64_storeu_epi32 (void * __P, __mmask8 __M, __m128i __A)
	{			{
	__builtin_ia32_pmovqd128mem_mask ((__v4si *) __P, (__v2di) __A, __M);			__builtin_ia32_pmovqd128mem_mask ((__v4si *) __P, (__v2di) __A, __M);
	}			}

	static __inline__ __m128i __DEFAULT_FN_ATTRS			static __inline__ __m128i __DEFAULT_FN_ATTRS
	_mm256_cvtepi64_epi32 (__m256i __A)			_mm256_cvtepi64_epi32 (__m256i __A)
	{			{
	return (__m128i) __builtin_ia32_pmovqd256_mask ((__v4di) __A,			return (__m128i)__builtin_convertvector((__v4di)__A, __v4si);
	(__v4si) _mm_undefined_si128(),
	(__mmask8) -1);
	}			}

	static __inline__ __m128i __DEFAULT_FN_ATTRS			static __inline__ __m128i __DEFAULT_FN_ATTRS
	_mm256_mask_cvtepi64_epi32 (__m128i __O, __mmask8 __M, __m256i __A)			_mm256_mask_cvtepi64_epi32 (__m128i __O, __mmask8 __M, __m256i __A)
	{			{
	return (__m128i) __builtin_ia32_pmovqd256_mask ((__v4di) __A,			return (__m128i)__builtin_ia32_selectd_128((__mmask8)__M,
	(__v4si) __O, __M);			(__v4si)_mm256_cvtepi64_epi32(__A),
				(__v4si)__O);
	}			}

	static __inline__ __m128i __DEFAULT_FN_ATTRS			static __inline__ __m128i __DEFAULT_FN_ATTRS
	_mm256_maskz_cvtepi64_epi32 (__mmask8 __M, __m256i __A)			_mm256_maskz_cvtepi64_epi32 (__mmask8 __M, __m256i __A)
	{			{
	return (__m128i) __builtin_ia32_pmovqd256_mask ((__v4di) __A,			return (__m128i)__builtin_ia32_selectd_128((__mmask8)__M,
	(__v4si) _mm_setzero_si128 (),			(__v4si)_mm256_cvtepi64_epi32(__A),
	__M);			(__v4si)_mm_setzero_si128());
	}			}

	static __inline__ void __DEFAULT_FN_ATTRS			static __inline__ void __DEFAULT_FN_ATTRS
	_mm256_mask_cvtepi64_storeu_epi32 (void * __P, __mmask8 __M, __m256i __A)			_mm256_mask_cvtepi64_storeu_epi32 (void * __P, __mmask8 __M, __m256i __A)
	{			{
	__builtin_ia32_pmovqd256mem_mask ((__v4si *) __P, (__v4di) __A, __M);			__builtin_ia32_pmovqd256mem_mask ((__v4si *) __P, (__v4di) __A, __M);
	}			}

	▲ Show 20 Lines • Show All 743 Lines • Show Last 20 Lines

test/CodeGen/avx512bw-builtins.c

	Show First 20 Lines • Show All 1,101 Lines • ▼ Show 20 Lines
	__m256i test_mm512_maskz_cvtusepi16_epi8(__mmask32 __M, __m512i __A) {			__m256i test_mm512_maskz_cvtusepi16_epi8(__mmask32 __M, __m512i __A) {
	// CHECK-LABEL: @test_mm512_maskz_cvtusepi16_epi8			// CHECK-LABEL: @test_mm512_maskz_cvtusepi16_epi8
	// CHECK: @llvm.x86.avx512.mask.pmovus.wb.512			// CHECK: @llvm.x86.avx512.mask.pmovus.wb.512
	return _mm512_maskz_cvtusepi16_epi8(__M, __A);			return _mm512_maskz_cvtusepi16_epi8(__M, __A);
	}			}

	__m256i test_mm512_cvtepi16_epi8(__m512i __A) {			__m256i test_mm512_cvtepi16_epi8(__m512i __A) {
	// CHECK-LABEL: @test_mm512_cvtepi16_epi8			// CHECK-LABEL: @test_mm512_cvtepi16_epi8
	// CHECK: @llvm.x86.avx512.mask.pmov.wb.512			// CHECK: trunc <32 x i16> %{{.*}} to <32 x i8>
	return _mm512_cvtepi16_epi8(__A);			return _mm512_cvtepi16_epi8(__A);
	}			}

	__m256i test_mm512_mask_cvtepi16_epi8(__m256i __O, __mmask32 __M, __m512i __A) {			__m256i test_mm512_mask_cvtepi16_epi8(__m256i __O, __mmask32 __M, __m512i __A) {
	// CHECK-LABEL: @test_mm512_mask_cvtepi16_epi8			// CHECK-LABEL: @test_mm512_mask_cvtepi16_epi8
	// CHECK: @llvm.x86.avx512.mask.pmov.wb.512			// CHECK: trunc <32 x i16> %{{.*}} to <32 x i8>
				// CHECK: select <32 x i1> %{{.}}, <32 x i8> %{{.}}, <32 x i8> %{{.*}}
	return _mm512_mask_cvtepi16_epi8(__O, __M, __A);			return _mm512_mask_cvtepi16_epi8(__O, __M, __A);
	}			}

	__m256i test_mm512_maskz_cvtepi16_epi8(__mmask32 __M, __m512i __A) {			__m256i test_mm512_maskz_cvtepi16_epi8(__mmask32 __M, __m512i __A) {
	// CHECK-LABEL: @test_mm512_maskz_cvtepi16_epi8			// CHECK-LABEL: @test_mm512_maskz_cvtepi16_epi8
	// CHECK: @llvm.x86.avx512.mask.pmov.wb.512			// CHECK: trunc <32 x i16> %{{.*}} to <32 x i8>
				// CHECK: select <32 x i1> %{{.}}, <32 x i8> %{{.}}, <32 x i8> %{{.*}}
	return _mm512_maskz_cvtepi16_epi8(__M, __A);			return _mm512_maskz_cvtepi16_epi8(__M, __A);
	}			}

	__m512i test_mm512_unpackhi_epi8(__m512i __A, __m512i __B) {			__m512i test_mm512_unpackhi_epi8(__m512i __A, __m512i __B) {
	// CHECK-LABEL: @test_mm512_unpackhi_epi8			// CHECK-LABEL: @test_mm512_unpackhi_epi8
	// CHECK: shufflevector <64 x i8> %{{.}}, <64 x i8> %{{.}}, <64 x i32> <i32 8, i32 72, i32 9, i32 73, i32 10, i32 74, i32 11, i32 75, i32 12, i32 76, i32 13, i32 77, i32 14, i32 78, i32 15, i32 79, i32 24, i32 88, i32 25, i32 89, i32 26, i32 90, i32 27, i32 91, i32 28, i32 92, i32 29, i32 93, i32 30, i32 94, i32 31, i32 95, i32 40, i32 104, i32 41, i32 105, i32 42, i32 106, i32 43, i32 107, i32 44, i32 108, i32 45, i32 109, i32 46, i32 110, i32 47, i32 111, i32 56, i32 120, i32 57, i32 121, i32 58, i32 122, i32 59, i32 123, i32 60, i32 124, i32 61, i32 125, i32 62, i32 126, i32 63, i32 127>			// CHECK: shufflevector <64 x i8> %{{.}}, <64 x i8> %{{.}}, <64 x i32> <i32 8, i32 72, i32 9, i32 73, i32 10, i32 74, i32 11, i32 75, i32 12, i32 76, i32 13, i32 77, i32 14, i32 78, i32 15, i32 79, i32 24, i32 88, i32 25, i32 89, i32 26, i32 90, i32 27, i32 91, i32 28, i32 92, i32 29, i32 93, i32 30, i32 94, i32 31, i32 95, i32 40, i32 104, i32 41, i32 105, i32 42, i32 106, i32 43, i32 107, i32 44, i32 108, i32 45, i32 109, i32 46, i32 110, i32 47, i32 111, i32 56, i32 120, i32 57, i32 121, i32 58, i32 122, i32 59, i32 123, i32 60, i32 124, i32 61, i32 125, i32 62, i32 126, i32 63, i32 127>
	return _mm512_unpackhi_epi8(__A, __B);			return _mm512_unpackhi_epi8(__A, __B);
	}			}
	▲ Show 20 Lines • Show All 848 Lines • Show Last 20 Lines

test/CodeGen/avx512f-builtins.c

This file is larger than 256 KB, so syntax highlighting is disabled by default.

	Show First 20 Lines • Show All 5,096 Lines • ▼ Show 20 Lines
	void test_mm512_mask_cvtusepi64_storeu_epi16(void *__P, __mmask8 __M, __m512i __A) {			void test_mm512_mask_cvtusepi64_storeu_epi16(void *__P, __mmask8 __M, __m512i __A) {
	// CHECK-LABEL: @test_mm512_mask_cvtusepi64_storeu_epi16			// CHECK-LABEL: @test_mm512_mask_cvtusepi64_storeu_epi16
	// CHECK: @llvm.x86.avx512.mask.pmovus.qw.mem.512			// CHECK: @llvm.x86.avx512.mask.pmovus.qw.mem.512
	return _mm512_mask_cvtusepi64_storeu_epi16(__P, __M, __A);			return _mm512_mask_cvtusepi64_storeu_epi16(__P, __M, __A);
	}			}

	__m128i test_mm512_cvtepi32_epi8(__m512i __A) {			__m128i test_mm512_cvtepi32_epi8(__m512i __A) {
	// CHECK-LABEL: @test_mm512_cvtepi32_epi8			// CHECK-LABEL: @test_mm512_cvtepi32_epi8
	// CHECK: @llvm.x86.avx512.mask.pmov.db.512			// CHECK: trunc <16 x i32> %{{.*}} to <16 x i8>
	return _mm512_cvtepi32_epi8(__A);			return _mm512_cvtepi32_epi8(__A);
	}			}

	__m128i test_mm512_mask_cvtepi32_epi8(__m128i __O, __mmask16 __M, __m512i __A) {			__m128i test_mm512_mask_cvtepi32_epi8(__m128i __O, __mmask16 __M, __m512i __A) {
	// CHECK-LABEL: @test_mm512_mask_cvtepi32_epi8			// CHECK-LABEL: @test_mm512_mask_cvtepi32_epi8
	// CHECK: @llvm.x86.avx512.mask.pmov.db.512			// CHECK: trunc <16 x i32> %{{.*}} to <16 x i8>
				// CHECK: select <16 x i1> %{{.}}, <16 x i8> %{{.}}, <16 x i8> %{{.*}}
	return _mm512_mask_cvtepi32_epi8(__O, __M, __A);			return _mm512_mask_cvtepi32_epi8(__O, __M, __A);
	}			}

	__m128i test_mm512_maskz_cvtepi32_epi8(__mmask16 __M, __m512i __A) {			__m128i test_mm512_maskz_cvtepi32_epi8(__mmask16 __M, __m512i __A) {
	// CHECK-LABEL: @test_mm512_maskz_cvtepi32_epi8			// CHECK-LABEL: @test_mm512_maskz_cvtepi32_epi8
	// CHECK: @llvm.x86.avx512.mask.pmov.db.512			// CHECK: trunc <16 x i32> %{{.*}} to <16 x i8>
				// CHECK: select <16 x i1> %{{.}}, <16 x i8> %{{.}}, <16 x i8> %{{.*}}
	return _mm512_maskz_cvtepi32_epi8(__M, __A);			return _mm512_maskz_cvtepi32_epi8(__M, __A);
	}			}

	void test_mm512_mask_cvtepi32_storeu_epi8(void * __P, __mmask16 __M, __m512i __A) {			void test_mm512_mask_cvtepi32_storeu_epi8(void * __P, __mmask16 __M, __m512i __A) {
	// CHECK-LABEL: @test_mm512_mask_cvtepi32_storeu_epi8			// CHECK-LABEL: @test_mm512_mask_cvtepi32_storeu_epi8
	// CHECK: @llvm.x86.avx512.mask.pmov.db.mem.512			// CHECK: @llvm.x86.avx512.mask.pmov.db.mem.512
	return _mm512_mask_cvtepi32_storeu_epi8(__P, __M, __A);			return _mm512_mask_cvtepi32_storeu_epi8(__P, __M, __A);
	}			}

	__m256i test_mm512_cvtepi32_epi16(__m512i __A) {			__m256i test_mm512_cvtepi32_epi16(__m512i __A) {
	// CHECK-LABEL: @test_mm512_cvtepi32_epi16			// CHECK-LABEL: @test_mm512_cvtepi32_epi16
	// CHECK: @llvm.x86.avx512.mask.pmov.dw.512			// CHECK: trunc <16 x i32> %{{.*}} to <16 x i16>
	return _mm512_cvtepi32_epi16(__A);			return _mm512_cvtepi32_epi16(__A);
	}			}

	__m256i test_mm512_mask_cvtepi32_epi16(__m256i __O, __mmask16 __M, __m512i __A) {			__m256i test_mm512_mask_cvtepi32_epi16(__m256i __O, __mmask16 __M, __m512i __A) {
	// CHECK-LABEL: @test_mm512_mask_cvtepi32_epi16			// CHECK-LABEL: @test_mm512_mask_cvtepi32_epi16
	// CHECK: @llvm.x86.avx512.mask.pmov.dw.512			// CHECK: trunc <16 x i32> %{{.*}} to <16 x i16>
				// CHECK: select <16 x i1> %{{.}}, <16 x i16> %{{.}}, <16 x i16> %{{.*}}
	return _mm512_mask_cvtepi32_epi16(__O, __M, __A);			return _mm512_mask_cvtepi32_epi16(__O, __M, __A);
	}			}

	__m256i test_mm512_maskz_cvtepi32_epi16(__mmask16 __M, __m512i __A) {			__m256i test_mm512_maskz_cvtepi32_epi16(__mmask16 __M, __m512i __A) {
	// CHECK-LABEL: @test_mm512_maskz_cvtepi32_epi16			// CHECK-LABEL: @test_mm512_maskz_cvtepi32_epi16
	// CHECK: @llvm.x86.avx512.mask.pmov.dw.512			// CHECK: trunc <16 x i32> %{{.*}} to <16 x i16>
				// CHECK: select <16 x i1> %{{.}}, <16 x i16> %{{.}}, <16 x i16> %{{.*}}
	return _mm512_maskz_cvtepi32_epi16(__M, __A);			return _mm512_maskz_cvtepi32_epi16(__M, __A);
	}			}

	void test_mm512_mask_cvtepi32_storeu_epi16(void * __P, __mmask16 __M, __m512i __A) {			void test_mm512_mask_cvtepi32_storeu_epi16(void * __P, __mmask16 __M, __m512i __A) {
	// CHECK-LABEL: @test_mm512_mask_cvtepi32_storeu_epi16			// CHECK-LABEL: @test_mm512_mask_cvtepi32_storeu_epi16
	// CHECK: @llvm.x86.avx512.mask.pmov.dw.mem.512			// CHECK: @llvm.x86.avx512.mask.pmov.dw.mem.512
	return _mm512_mask_cvtepi32_storeu_epi16(__P, __M, __A);			return _mm512_mask_cvtepi32_storeu_epi16(__P, __M, __A);
	}			}
	Show All 19 Lines
	void test_mm512_mask_cvtepi64_storeu_epi8(void * __P, __mmask8 __M, __m512i __A) {			void test_mm512_mask_cvtepi64_storeu_epi8(void * __P, __mmask8 __M, __m512i __A) {
	// CHECK-LABEL: @test_mm512_mask_cvtepi64_storeu_epi8			// CHECK-LABEL: @test_mm512_mask_cvtepi64_storeu_epi8
	// CHECK: @llvm.x86.avx512.mask.pmov.qb.mem.512			// CHECK: @llvm.x86.avx512.mask.pmov.qb.mem.512
	return _mm512_mask_cvtepi64_storeu_epi8(__P, __M, __A);			return _mm512_mask_cvtepi64_storeu_epi8(__P, __M, __A);
	}			}

	__m256i test_mm512_cvtepi64_epi32(__m512i __A) {			__m256i test_mm512_cvtepi64_epi32(__m512i __A) {
	// CHECK-LABEL: @test_mm512_cvtepi64_epi32			// CHECK-LABEL: @test_mm512_cvtepi64_epi32
	// CHECK: @llvm.x86.avx512.mask.pmov.qd.512			// CHECK: trunc <8 x i64> %{{.*}} to <8 x i32>
	return _mm512_cvtepi64_epi32(__A);			return _mm512_cvtepi64_epi32(__A);
	}			}

	__m256i test_mm512_mask_cvtepi64_epi32(__m256i __O, __mmask8 __M, __m512i __A) {			__m256i test_mm512_mask_cvtepi64_epi32(__m256i __O, __mmask8 __M, __m512i __A) {
	// CHECK-LABEL: @test_mm512_mask_cvtepi64_epi32			// CHECK-LABEL: @test_mm512_mask_cvtepi64_epi32
	// CHECK: @llvm.x86.avx512.mask.pmov.qd.512			// CHECK: trunc <8 x i64> %{{.*}} to <8 x i32>
				// CHECK: select <8 x i1> %{{.}}, <8 x i32> %{{.}}, <8 x i32> %{{.*}}
	return _mm512_mask_cvtepi64_epi32(__O, __M, __A);			return _mm512_mask_cvtepi64_epi32(__O, __M, __A);
	}			}

	__m256i test_mm512_maskz_cvtepi64_epi32(__mmask8 __M, __m512i __A) {			__m256i test_mm512_maskz_cvtepi64_epi32(__mmask8 __M, __m512i __A) {
	// CHECK-LABEL: @test_mm512_maskz_cvtepi64_epi32			// CHECK-LABEL: @test_mm512_maskz_cvtepi64_epi32
	// CHECK: @llvm.x86.avx512.mask.pmov.qd.512			// CHECK: trunc <8 x i64> %{{.*}} to <8 x i32>
				// CHECK: select <8 x i1> %{{.}}, <8 x i32> %{{.}}, <8 x i32> %{{.*}}
	return _mm512_maskz_cvtepi64_epi32(__M, __A);			return _mm512_maskz_cvtepi64_epi32(__M, __A);
	}			}

	void test_mm512_mask_cvtepi64_storeu_epi32(void* __P, __mmask8 __M, __m512i __A) {			void test_mm512_mask_cvtepi64_storeu_epi32(void* __P, __mmask8 __M, __m512i __A) {
	// CHECK-LABEL: @test_mm512_mask_cvtepi64_storeu_epi32			// CHECK-LABEL: @test_mm512_mask_cvtepi64_storeu_epi32
	// CHECK: @llvm.x86.avx512.mask.pmov.qd.mem.512			// CHECK: @llvm.x86.avx512.mask.pmov.qd.mem.512
	return _mm512_mask_cvtepi64_storeu_epi32(__P, __M, __A);			return _mm512_mask_cvtepi64_storeu_epi32(__P, __M, __A);
	}			}

	__m128i test_mm512_cvtepi64_epi16(__m512i __A) {			__m128i test_mm512_cvtepi64_epi16(__m512i __A) {
	// CHECK-LABEL: @test_mm512_cvtepi64_epi16			// CHECK-LABEL: @test_mm512_cvtepi64_epi16
	// CHECK: @llvm.x86.avx512.mask.pmov.qw.512			// CHECK: trunc <8 x i64> %{{.*}} to <8 x i16>
	return _mm512_cvtepi64_epi16(__A);			return _mm512_cvtepi64_epi16(__A);
	}			}

	__m128i test_mm512_mask_cvtepi64_epi16(__m128i __O, __mmask8 __M, __m512i __A) {			__m128i test_mm512_mask_cvtepi64_epi16(__m128i __O, __mmask8 __M, __m512i __A) {
	// CHECK-LABEL: @test_mm512_mask_cvtepi64_epi16			// CHECK-LABEL: @test_mm512_mask_cvtepi64_epi16
	// CHECK: @llvm.x86.avx512.mask.pmov.qw.512			// CHECK: trunc <8 x i64> %{{.*}} to <8 x i16>
				// CHECK: select <8 x i1> %{{.}}, <8 x i16> %{{.}}, <8 x i16> %{{.*}}
	return _mm512_mask_cvtepi64_epi16(__O, __M, __A);			return _mm512_mask_cvtepi64_epi16(__O, __M, __A);
	}			}

	__m128i test_mm512_maskz_cvtepi64_epi16(__mmask8 __M, __m512i __A) {			__m128i test_mm512_maskz_cvtepi64_epi16(__mmask8 __M, __m512i __A) {
	// CHECK-LABEL: @test_mm512_maskz_cvtepi64_epi16			// CHECK-LABEL: @test_mm512_maskz_cvtepi64_epi16
	// CHECK: @llvm.x86.avx512.mask.pmov.qw.512			// CHECK: trunc <8 x i64> %{{.*}} to <8 x i16>
				// CHECK: select <8 x i1> %{{.}}, <8 x i16> %{{.}}, <8 x i16> %{{.*}}
	return _mm512_maskz_cvtepi64_epi16(__M, __A);			return _mm512_maskz_cvtepi64_epi16(__M, __A);
	}			}

	void test_mm512_mask_cvtepi64_storeu_epi16(void *__P, __mmask8 __M, __m512i __A) {			void test_mm512_mask_cvtepi64_storeu_epi16(void *__P, __mmask8 __M, __m512i __A) {
	// CHECK-LABEL: @test_mm512_mask_cvtepi64_storeu_epi16			// CHECK-LABEL: @test_mm512_mask_cvtepi64_storeu_epi16
	// CHECK: @llvm.x86.avx512.mask.pmov.qw.mem.512			// CHECK: @llvm.x86.avx512.mask.pmov.qw.mem.512
	return _mm512_mask_cvtepi64_storeu_epi16(__P, __M, __A);			return _mm512_mask_cvtepi64_storeu_epi16(__P, __M, __A);
	}			}
	▲ Show 20 Lines • Show All 3,352 Lines • Show Last 20 Lines

test/CodeGen/avx512vl-builtins.c

This file is larger than 256 KB, so syntax highlighting is disabled by default.

	Show First 20 Lines • Show All 6,571 Lines • ▼ Show 20 Lines
	void test_mm_mask_cvtepi32_storeu_epi16(void * __P, __mmask8 __M, __m128i __A) {			void test_mm_mask_cvtepi32_storeu_epi16(void * __P, __mmask8 __M, __m128i __A) {
	// CHECK-LABEL: @test_mm_mask_cvtepi32_storeu_epi16			// CHECK-LABEL: @test_mm_mask_cvtepi32_storeu_epi16
	// CHECK: @llvm.x86.avx512.mask.pmov.dw.mem.128			// CHECK: @llvm.x86.avx512.mask.pmov.dw.mem.128
	return _mm_mask_cvtepi32_storeu_epi16(__P, __M, __A);			return _mm_mask_cvtepi32_storeu_epi16(__P, __M, __A);
	}			}

	__m128i test_mm256_cvtepi32_epi16(__m256i __A) {			__m128i test_mm256_cvtepi32_epi16(__m256i __A) {
	// CHECK-LABEL: @test_mm256_cvtepi32_epi16			// CHECK-LABEL: @test_mm256_cvtepi32_epi16
	// CHECK: @llvm.x86.avx512.mask.pmov.dw.256			// CHECK: trunc <8 x i32> %{{.*}} to <8 x i16>
	return _mm256_cvtepi32_epi16(__A);			return _mm256_cvtepi32_epi16(__A);
	}			}

	__m128i test_mm256_mask_cvtepi32_epi16(__m128i __O, __mmask8 __M, __m256i __A) {			__m128i test_mm256_mask_cvtepi32_epi16(__m128i __O, __mmask8 __M, __m256i __A) {
	// CHECK-LABEL: @test_mm256_mask_cvtepi32_epi16			// CHECK-LABEL: @test_mm256_mask_cvtepi32_epi16
	// CHECK: @llvm.x86.avx512.mask.pmov.dw.256			// CHECK: trunc <8 x i32> %{{.*}} to <8 x i16>
				// CHECK: select <8 x i1> %{{.}}, <8 x i16> %{{.}}, <8 x i16> %{{.*}}
	return _mm256_mask_cvtepi32_epi16(__O, __M, __A);			return _mm256_mask_cvtepi32_epi16(__O, __M, __A);
	}			}

	__m128i test_mm256_maskz_cvtepi32_epi16(__mmask8 __M, __m256i __A) {			__m128i test_mm256_maskz_cvtepi32_epi16(__mmask8 __M, __m256i __A) {
	// CHECK-LABEL: @test_mm256_maskz_cvtepi32_epi16			// CHECK-LABEL: @test_mm256_maskz_cvtepi32_epi16
	// CHECK: @llvm.x86.avx512.mask.pmov.dw.256			// CHECK: trunc <8 x i32> %{{.*}} to <8 x i16>
				// CHECK: select <8 x i1> %{{.}}, <8 x i16> %{{.}}, <8 x i16> %{{.*}}
	return _mm256_maskz_cvtepi32_epi16(__M, __A);			return _mm256_maskz_cvtepi32_epi16(__M, __A);
	}			}

	void test_mm256_mask_cvtepi32_storeu_epi16(void * __P, __mmask8 __M, __m256i __A) {			void test_mm256_mask_cvtepi32_storeu_epi16(void * __P, __mmask8 __M, __m256i __A) {
	// CHECK-LABEL: @test_mm256_mask_cvtepi32_storeu_epi16			// CHECK-LABEL: @test_mm256_mask_cvtepi32_storeu_epi16
	// CHECK: @llvm.x86.avx512.mask.pmov.dw.mem.256			// CHECK: @llvm.x86.avx512.mask.pmov.dw.mem.256
	return _mm256_mask_cvtepi32_storeu_epi16(__P, __M, __A);			return _mm256_mask_cvtepi32_storeu_epi16(__P, __M, __A);
	}			}
	▲ Show 20 Lines • Show All 67 Lines • ▼ Show 20 Lines
	void test_mm_mask_cvtepi64_storeu_epi32(void * __P, __mmask8 __M, __m128i __A) {			void test_mm_mask_cvtepi64_storeu_epi32(void * __P, __mmask8 __M, __m128i __A) {
	// CHECK-LABEL: @test_mm_mask_cvtepi64_storeu_epi32			// CHECK-LABEL: @test_mm_mask_cvtepi64_storeu_epi32
	// CHECK: @llvm.x86.avx512.mask.pmov.qd.mem.128			// CHECK: @llvm.x86.avx512.mask.pmov.qd.mem.128
	return _mm_mask_cvtepi64_storeu_epi32(__P, __M, __A);			return _mm_mask_cvtepi64_storeu_epi32(__P, __M, __A);
	}			}

	__m128i test_mm256_cvtepi64_epi32(__m256i __A) {			__m128i test_mm256_cvtepi64_epi32(__m256i __A) {
	// CHECK-LABEL: @test_mm256_cvtepi64_epi32			// CHECK-LABEL: @test_mm256_cvtepi64_epi32
	// CHECK: @llvm.x86.avx512.mask.pmov.qd.256			// CHECK: trunc <4 x i64> %{{.*}} to <4 x i32>
	return _mm256_cvtepi64_epi32(__A);			return _mm256_cvtepi64_epi32(__A);
	}			}

	__m128i test_mm256_mask_cvtepi64_epi32(__m128i __O, __mmask8 __M, __m256i __A) {			__m128i test_mm256_mask_cvtepi64_epi32(__m128i __O, __mmask8 __M, __m256i __A) {
	// CHECK-LABEL: @test_mm256_mask_cvtepi64_epi32			// CHECK-LABEL: @test_mm256_mask_cvtepi64_epi32
	// CHECK: @llvm.x86.avx512.mask.pmov.qd.256			// CHECK: trunc <4 x i64> %{{.*}} to <4 x i32>
				// CHECK: select <4 x i1> %{{.}}, <4 x i32> %{{.}}, <4 x i32> %{{.*}}
	return _mm256_mask_cvtepi64_epi32(__O, __M, __A);			return _mm256_mask_cvtepi64_epi32(__O, __M, __A);
	}			}

	__m128i test_mm256_maskz_cvtepi64_epi32(__mmask8 __M, __m256i __A) {			__m128i test_mm256_maskz_cvtepi64_epi32(__mmask8 __M, __m256i __A) {
	// CHECK-LABEL: @test_mm256_maskz_cvtepi64_epi32			// CHECK-LABEL: @test_mm256_maskz_cvtepi64_epi32
	// CHECK: @llvm.x86.avx512.mask.pmov.qd.256			// CHECK: trunc <4 x i64> %{{.*}} to <4 x i32>
				// CHECK: select <4 x i1> %{{.}}, <4 x i32> %{{.}}, <4 x i32> %{{.*}}
	return _mm256_maskz_cvtepi64_epi32(__M, __A);			return _mm256_maskz_cvtepi64_epi32(__M, __A);
	}			}

	void test_mm256_mask_cvtepi64_storeu_epi32(void * __P, __mmask8 __M, __m256i __A) {			void test_mm256_mask_cvtepi64_storeu_epi32(void * __P, __mmask8 __M, __m256i __A) {
	// CHECK-LABEL: @test_mm256_mask_cvtepi64_storeu_epi32			// CHECK-LABEL: @test_mm256_mask_cvtepi64_storeu_epi32
	// CHECK: @llvm.x86.avx512.mask.pmov.qd.mem.256			// CHECK: @llvm.x86.avx512.mask.pmov.qd.mem.256
	return _mm256_mask_cvtepi64_storeu_epi32(__P, __M, __A);			return _mm256_mask_cvtepi64_storeu_epi32(__P, __M, __A);
	}			}
	▲ Show 20 Lines • Show All 793 Lines • Show Last 20 Lines

test/CodeGen/avx512vlbw-builtins.c

	Show First 20 Lines • Show All 1,798 Lines • ▼ Show 20 Lines
	__m128i test_mm_maskz_cvtepi16_epi8(__mmask8 __M, __m128i __A) {			__m128i test_mm_maskz_cvtepi16_epi8(__mmask8 __M, __m128i __A) {
	// CHECK-LABEL: @test_mm_maskz_cvtepi16_epi8			// CHECK-LABEL: @test_mm_maskz_cvtepi16_epi8
	// CHECK: @llvm.x86.avx512.mask.pmov.wb.128			// CHECK: @llvm.x86.avx512.mask.pmov.wb.128
	return _mm_maskz_cvtepi16_epi8(__M, __A);			return _mm_maskz_cvtepi16_epi8(__M, __A);
	}			}

	__m128i test_mm256_cvtepi16_epi8(__m256i __A) {			__m128i test_mm256_cvtepi16_epi8(__m256i __A) {
	// CHECK-LABEL: @test_mm256_cvtepi16_epi8			// CHECK-LABEL: @test_mm256_cvtepi16_epi8
	// CHECK: @llvm.x86.avx512.mask.pmov.wb.256			// CHECK: trunc <16 x i16> %{{.*}} to <16 x i8>
	return _mm256_cvtepi16_epi8(__A);			return _mm256_cvtepi16_epi8(__A);
	}			}

	__m128i test_mm256_mask_cvtepi16_epi8(__m128i __O, __mmask16 __M, __m256i __A) {			__m128i test_mm256_mask_cvtepi16_epi8(__m128i __O, __mmask16 __M, __m256i __A) {
	// CHECK-LABEL: @test_mm256_mask_cvtepi16_epi8			// CHECK-LABEL: @test_mm256_mask_cvtepi16_epi8
	// CHECK: @llvm.x86.avx512.mask.pmov.wb.256			// CHECK: trunc <16 x i16> %{{.*}} to <16 x i8>
				// CHECK: select <16 x i1> %{{.}}, <16 x i8> %{{.}}, <16 x i8> %{{.*}}
	return _mm256_mask_cvtepi16_epi8(__O, __M, __A);			return _mm256_mask_cvtepi16_epi8(__O, __M, __A);
	}			}

	__m128i test_mm256_maskz_cvtepi16_epi8(__mmask16 __M, __m256i __A) {			__m128i test_mm256_maskz_cvtepi16_epi8(__mmask16 __M, __m256i __A) {
	// CHECK-LABEL: @test_mm256_maskz_cvtepi16_epi8			// CHECK-LABEL: @test_mm256_maskz_cvtepi16_epi8
	// CHECK: @llvm.x86.avx512.mask.pmov.wb.256			// CHECK: trunc <16 x i16> %{{.*}} to <16 x i8>
				// CHECK: select <16 x i1> %{{.}}, <16 x i8> %{{.}}, <16 x i8> %{{.*}}
	return _mm256_maskz_cvtepi16_epi8(__M, __A);			return _mm256_maskz_cvtepi16_epi8(__M, __A);
	}			}

	__m128i test_mm_mask_mulhrs_epi16(__m128i __W, __mmask8 __U, __m128i __X, __m128i __Y) {			__m128i test_mm_mask_mulhrs_epi16(__m128i __W, __mmask8 __U, __m128i __X, __m128i __Y) {
	// CHECK-LABEL: @test_mm_mask_mulhrs_epi16			// CHECK-LABEL: @test_mm_mask_mulhrs_epi16
	// CHECK: @llvm.x86.ssse3.pmul.hr.sw			// CHECK: @llvm.x86.ssse3.pmul.hr.sw
	// CHECK: select <8 x i1> %{{.}}, <8 x i16> %{{.}}, <8 x i16> %{{.*}}			// CHECK: select <8 x i1> %{{.}}, <8 x i16> %{{.}}, <8 x i16> %{{.*}}
	return _mm_mask_mulhrs_epi16(__W, __U, __X, __Y);			return _mm_mask_mulhrs_epi16(__W, __U, __X, __Y);
	▲ Show 20 Lines • Show All 1,271 Lines • Show Last 20 Lines

This is an archive of the discontinued LLVM Phabricator instance.

[X86] Use __builtin_convertvector to replace some of the avx512 truncate builtins.ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 146645

include/clang/Basic/BuiltinsX86.def

lib/Headers/avx512bwintrin.h

lib/Headers/avx512fintrin.h

lib/Headers/avx512vlbwintrin.h

lib/Headers/avx512vlintrin.h

test/CodeGen/avx512bw-builtins.c

test/CodeGen/avx512f-builtins.c

test/CodeGen/avx512vl-builtins.c

test/CodeGen/avx512vlbw-builtins.c

[X86] Use __builtin_convertvector to replace some of the avx512 truncate builtins.
ClosedPublic