This is an archive of the discontinued LLVM Phabricator instance.

Paths

Table of Contentst

-
clang/
-
include/clang/Basic/
-
clang/
-
Basic/
-
BuiltinsX86.def
-
lib/
-
CodeGen/
-
CGBuiltin.cpp
-
Headers/
-
avx2intrin.h
2
avx512bwintrin.h
-
avx512fintrin.h
-
avx512vlintrin.h
-
emmintrin.h
-
smmintrin.h
-
test/CodeGen/
-
CodeGen/
-
builtins-x86.c

Differential D117798

[X86] Remove __builtin_ia32_pmax/min intrinsics and use generic __builtin_elementwise_max/min
ClosedPublic

Authored by RKSimon on Jan 20 2022, 9:08 AM.

Download Raw Diff

Details

Reviewers

pengfei
craig.topper
fhahn

Commits

rG3e50593b1884: [X86] Remove `__builtin_ia32_pmax/min` intrinsics and use generic…
rG8ee135dcf8ff: [X86] Remove `__builtin_ia32_pmax/min` intrinsics and use generic…

Summary

D111985 added the generic __builtin_elementwise_max and __builtin_elementwise_min intrinsics with the same integer behaviour as the SSE/AVX instructions

This patch removes the __builtin_ia32_pmax/min intrinsics and just uses __builtin_elementwise_max/min - the existing tests see no changes:

__m256i test_mm256_max_epu32(__m256i a, __m256i b) {
  // CHECK-LABEL: test_mm256_max_epu32
  // CHECK: call <8 x i32> @llvm.umax.v8i32(<8 x i32> %{{.*}}, <8 x i32> %{{.*}})
  return _mm256_max_epu32(a, b);
}

This requires us to add a __v64qs explicitly signed char vector type (we already have __v16qs and __v32qs).

Sibling patch to D117791

Diff Detail

Repository: rG LLVM Github Monorepo

Event Timeline

RKSimon requested review of this revision.Jan 20 2022, 9:08 AM

RKSimon created this revision.

Herald added a project: Restricted Project. · View Herald TranscriptJan 20 2022, 9:08 AM

LGTM

This revision is now accepted and ready to land.Jan 20 2022, 9:13 AM

Harbormaster completed remote builds in B144603: Diff 401661.Jan 20 2022, 10:16 AM

pengfei accepted this revision.Jan 20 2022, 5:24 PM

pengfei added inline comments.

clang/lib/Headers/avx512bwintrin.h
894	Should we change the type here too? The same below.

Thanks!

clang/lib/Headers/avx512bwintrin.h
894	I don't think so - `__builtin_ia32_selectb_512` uses `__v64qi` everywhere else, and ignores signedness. It only matters inside the min/max builtins

Thanks for the patch, it's great to see!

This revision was landed with ongoing or failed builds.Jan 21 2022, 4:25 AM

Closed by commit rG8ee135dcf8ff: [X86] Remove `__builtin_ia32_pmax/min` intrinsics and use generic… (authored by RKSimon). · Explain Why

This revision was automatically updated to reflect the committed changes.

RKSimon added a commit: rG8ee135dcf8ff: [X86] Remove `__builtin_ia32_pmax/min` intrinsics and use generic….

RKSimon added a reverting change: rG3ef88b31843e: Revert rG8ee135dcf8ff060656ad481c3e980fe8763576f5 "[X86] Remove….Jan 21 2022, 4:36 AM

RKSimon added a commit: rG3e50593b1884: [X86] Remove `__builtin_ia32_pmax/min` intrinsics and use generic….Jan 24 2022, 3:40 AM

Revision Contents

Path

Size

clang/

include/

clang/

Basic/

BuiltinsX86.def

48 lines

lib/

CodeGen/

CGBuiltin.cpp

52 lines

Headers/

24 lines

16 lines

20 lines

16 lines

8 lines

16 lines

test/

CodeGen/

builtins-x86.c

12 lines

Diff 401661

clang/include/clang/Basic/BuiltinsX86.def

	Show First 20 Lines • Show All 259 Lines • ▼ Show 20 Lines
	TARGET_BUILTIN(__builtin_ia32_psubsw128, "V8sV8sV8s", "ncV:128:", "sse2")			TARGET_BUILTIN(__builtin_ia32_psubsw128, "V8sV8sV8s", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_paddusb128, "V16cV16cV16c", "ncV:128:", "sse2")			TARGET_BUILTIN(__builtin_ia32_paddusb128, "V16cV16cV16c", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_paddusw128, "V8sV8sV8s", "ncV:128:", "sse2")			TARGET_BUILTIN(__builtin_ia32_paddusw128, "V8sV8sV8s", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_psubusb128, "V16cV16cV16c", "ncV:128:", "sse2")			TARGET_BUILTIN(__builtin_ia32_psubusb128, "V16cV16cV16c", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_psubusw128, "V8sV8sV8s", "ncV:128:", "sse2")			TARGET_BUILTIN(__builtin_ia32_psubusw128, "V8sV8sV8s", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_pmulhw128, "V8sV8sV8s", "ncV:128:", "sse2")			TARGET_BUILTIN(__builtin_ia32_pmulhw128, "V8sV8sV8s", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_pavgb128, "V16cV16cV16c", "ncV:128:", "sse2")			TARGET_BUILTIN(__builtin_ia32_pavgb128, "V16cV16cV16c", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_pavgw128, "V8sV8sV8s", "ncV:128:", "sse2")			TARGET_BUILTIN(__builtin_ia32_pavgw128, "V8sV8sV8s", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_pmaxub128, "V16cV16cV16c", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_pmaxsw128, "V8sV8sV8s", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_pminub128, "V16cV16cV16c", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_pminsw128, "V8sV8sV8s", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_packsswb128, "V16cV8sV8s", "ncV:128:", "sse2")			TARGET_BUILTIN(__builtin_ia32_packsswb128, "V16cV8sV8s", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_packssdw128, "V8sV4iV4i", "ncV:128:", "sse2")			TARGET_BUILTIN(__builtin_ia32_packssdw128, "V8sV4iV4i", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_packuswb128, "V16cV8sV8s", "ncV:128:", "sse2")			TARGET_BUILTIN(__builtin_ia32_packuswb128, "V16cV8sV8s", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_pmulhuw128, "V8sV8sV8s", "ncV:128:", "sse2")			TARGET_BUILTIN(__builtin_ia32_pmulhuw128, "V8sV8sV8s", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_vec_ext_v4si, "iV4iIi", "ncV:128:", "sse2")			TARGET_BUILTIN(__builtin_ia32_vec_ext_v4si, "iV4iIi", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_vec_ext_v4sf, "fV4fIi", "ncV:128:", "sse2")			TARGET_BUILTIN(__builtin_ia32_vec_ext_v4sf, "fV4fIi", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_vec_ext_v8hi, "sV8sIi", "ncV:128:", "sse2")			TARGET_BUILTIN(__builtin_ia32_vec_ext_v8hi, "sV8sIi", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_vec_set_v8hi, "V8sV8ssIi", "ncV:128:", "sse2")			TARGET_BUILTIN(__builtin_ia32_vec_set_v8hi, "V8sV8ssIi", "ncV:128:", "sse2")
	▲ Show 20 Lines • Show All 95 Lines • ▼ Show 20 Lines
	TARGET_BUILTIN(__builtin_ia32_pblendvb128, "V16cV16cV16cV16c", "ncV:128:", "sse4.1")			TARGET_BUILTIN(__builtin_ia32_pblendvb128, "V16cV16cV16cV16c", "ncV:128:", "sse4.1")
	TARGET_BUILTIN(__builtin_ia32_pblendw128, "V8sV8sV8sIi", "ncV:128:", "sse4.1")			TARGET_BUILTIN(__builtin_ia32_pblendw128, "V8sV8sV8sIi", "ncV:128:", "sse4.1")
	TARGET_BUILTIN(__builtin_ia32_blendpd, "V2dV2dV2dIi", "ncV:128:", "sse4.1")			TARGET_BUILTIN(__builtin_ia32_blendpd, "V2dV2dV2dIi", "ncV:128:", "sse4.1")
	TARGET_BUILTIN(__builtin_ia32_blendps, "V4fV4fV4fIi", "ncV:128:", "sse4.1")			TARGET_BUILTIN(__builtin_ia32_blendps, "V4fV4fV4fIi", "ncV:128:", "sse4.1")
	TARGET_BUILTIN(__builtin_ia32_blendvpd, "V2dV2dV2dV2d", "ncV:128:", "sse4.1")			TARGET_BUILTIN(__builtin_ia32_blendvpd, "V2dV2dV2dV2d", "ncV:128:", "sse4.1")
	TARGET_BUILTIN(__builtin_ia32_blendvps, "V4fV4fV4fV4f", "ncV:128:", "sse4.1")			TARGET_BUILTIN(__builtin_ia32_blendvps, "V4fV4fV4fV4f", "ncV:128:", "sse4.1")
	TARGET_BUILTIN(__builtin_ia32_packusdw128, "V8sV4iV4i", "ncV:128:", "sse4.1")			TARGET_BUILTIN(__builtin_ia32_packusdw128, "V8sV4iV4i", "ncV:128:", "sse4.1")

	TARGET_BUILTIN(__builtin_ia32_pmaxsb128, "V16cV16cV16c", "ncV:128:", "sse4.1")
	TARGET_BUILTIN(__builtin_ia32_pmaxsd128, "V4iV4iV4i", "ncV:128:", "sse4.1")
	TARGET_BUILTIN(__builtin_ia32_pmaxud128, "V4iV4iV4i", "ncV:128:", "sse4.1")
	TARGET_BUILTIN(__builtin_ia32_pmaxuw128, "V8sV8sV8s", "ncV:128:", "sse4.1")
	TARGET_BUILTIN(__builtin_ia32_pminsb128, "V16cV16cV16c", "ncV:128:", "sse4.1")
	TARGET_BUILTIN(__builtin_ia32_pminsd128, "V4iV4iV4i", "ncV:128:", "sse4.1")
	TARGET_BUILTIN(__builtin_ia32_pminud128, "V4iV4iV4i", "ncV:128:", "sse4.1")
	TARGET_BUILTIN(__builtin_ia32_pminuw128, "V8sV8sV8s", "ncV:128:", "sse4.1")
	TARGET_BUILTIN(__builtin_ia32_pmuldq128, "V2OiV4iV4i", "ncV:128:", "sse4.1")			TARGET_BUILTIN(__builtin_ia32_pmuldq128, "V2OiV4iV4i", "ncV:128:", "sse4.1")
	TARGET_BUILTIN(__builtin_ia32_roundps, "V4fV4fIi", "ncV:128:", "sse4.1")			TARGET_BUILTIN(__builtin_ia32_roundps, "V4fV4fIi", "ncV:128:", "sse4.1")
	TARGET_BUILTIN(__builtin_ia32_roundss, "V4fV4fV4fIi", "ncV:128:", "sse4.1")			TARGET_BUILTIN(__builtin_ia32_roundss, "V4fV4fV4fIi", "ncV:128:", "sse4.1")
	TARGET_BUILTIN(__builtin_ia32_roundsd, "V2dV2dV2dIi", "ncV:128:", "sse4.1")			TARGET_BUILTIN(__builtin_ia32_roundsd, "V2dV2dV2dIi", "ncV:128:", "sse4.1")
	TARGET_BUILTIN(__builtin_ia32_roundpd, "V2dV2dIi", "ncV:128:", "sse4.1")			TARGET_BUILTIN(__builtin_ia32_roundpd, "V2dV2dIi", "ncV:128:", "sse4.1")
	TARGET_BUILTIN(__builtin_ia32_dpps, "V4fV4fV4fIc", "ncV:128:", "sse4.1")			TARGET_BUILTIN(__builtin_ia32_dpps, "V4fV4fV4fIc", "ncV:128:", "sse4.1")
	TARGET_BUILTIN(__builtin_ia32_dppd, "V2dV2dV2dIc", "ncV:128:", "sse4.1")			TARGET_BUILTIN(__builtin_ia32_dppd, "V2dV2dV2dIc", "ncV:128:", "sse4.1")
	TARGET_BUILTIN(__builtin_ia32_ptestz128, "iV2OiV2Oi", "ncV:128:", "sse4.1")			TARGET_BUILTIN(__builtin_ia32_ptestz128, "iV2OiV2Oi", "ncV:128:", "sse4.1")
	▲ Show 20 Lines • Show All 182 Lines • ▼ Show 20 Lines
	TARGET_BUILTIN(__builtin_ia32_phaddw256, "V16sV16sV16s", "ncV:256:", "avx2")			TARGET_BUILTIN(__builtin_ia32_phaddw256, "V16sV16sV16s", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_phaddd256, "V8iV8iV8i", "ncV:256:", "avx2")			TARGET_BUILTIN(__builtin_ia32_phaddd256, "V8iV8iV8i", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_phaddsw256, "V16sV16sV16s", "ncV:256:", "avx2")			TARGET_BUILTIN(__builtin_ia32_phaddsw256, "V16sV16sV16s", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_phsubw256, "V16sV16sV16s", "ncV:256:", "avx2")			TARGET_BUILTIN(__builtin_ia32_phsubw256, "V16sV16sV16s", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_phsubd256, "V8iV8iV8i", "ncV:256:", "avx2")			TARGET_BUILTIN(__builtin_ia32_phsubd256, "V8iV8iV8i", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_phsubsw256, "V16sV16sV16s", "ncV:256:", "avx2")			TARGET_BUILTIN(__builtin_ia32_phsubsw256, "V16sV16sV16s", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_pmaddubsw256, "V16sV32cV32c", "ncV:256:", "avx2")			TARGET_BUILTIN(__builtin_ia32_pmaddubsw256, "V16sV32cV32c", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_pmaddwd256, "V8iV16sV16s", "ncV:256:", "avx2")			TARGET_BUILTIN(__builtin_ia32_pmaddwd256, "V8iV16sV16s", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_pmaxub256, "V32cV32cV32c", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_pmaxuw256, "V16sV16sV16s", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_pmaxud256, "V8iV8iV8i", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_pmaxsb256, "V32cV32cV32c", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_pmaxsw256, "V16sV16sV16s", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_pmaxsd256, "V8iV8iV8i", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_pminub256, "V32cV32cV32c", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_pminuw256, "V16sV16sV16s", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_pminud256, "V8iV8iV8i", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_pminsb256, "V32cV32cV32c", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_pminsw256, "V16sV16sV16s", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_pminsd256, "V8iV8iV8i", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_pmovmskb256, "iV32c", "ncV:256:", "avx2")			TARGET_BUILTIN(__builtin_ia32_pmovmskb256, "iV32c", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_pmuldq256, "V4OiV8iV8i", "ncV:256:", "avx2")			TARGET_BUILTIN(__builtin_ia32_pmuldq256, "V4OiV8iV8i", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_pmulhrsw256, "V16sV16sV16s", "ncV:256:", "avx2")			TARGET_BUILTIN(__builtin_ia32_pmulhrsw256, "V16sV16sV16s", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_pmulhuw256, "V16sV16sV16s", "ncV:256:", "avx2")			TARGET_BUILTIN(__builtin_ia32_pmulhuw256, "V16sV16sV16s", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_pmulhw256, "V16sV16sV16s", "ncV:256:", "avx2")			TARGET_BUILTIN(__builtin_ia32_pmulhw256, "V16sV16sV16s", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_pmuludq256, "V4OiV8iV8i", "ncV:256:", "avx2")			TARGET_BUILTIN(__builtin_ia32_pmuludq256, "V4OiV8iV8i", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_psadbw256, "V4OiV32cV32c", "ncV:256:", "avx2")			TARGET_BUILTIN(__builtin_ia32_psadbw256, "V4OiV32cV32c", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_pshufb256, "V32cV32cV32c", "ncV:256:", "avx2")			TARGET_BUILTIN(__builtin_ia32_pshufb256, "V32cV32cV32c", "ncV:256:", "avx2")
	▲ Show 20 Lines • Show All 315 Lines • ▼ Show 20 Lines
	TARGET_BUILTIN(__builtin_ia32_maxpd512, "V8dV8dV8dIi", "ncV:512:", "avx512f")			TARGET_BUILTIN(__builtin_ia32_maxpd512, "V8dV8dV8dIi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_cvtdq2ps512_mask, "V16fV16iV16fUsIi", "ncV:512:", "avx512f")			TARGET_BUILTIN(__builtin_ia32_cvtdq2ps512_mask, "V16fV16iV16fUsIi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_cvtudq2ps512_mask, "V16fV16iV16fUsIi", "ncV:512:", "avx512f")			TARGET_BUILTIN(__builtin_ia32_cvtudq2ps512_mask, "V16fV16iV16fUsIi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_cvtpd2ps512_mask, "V8fV8dV8fUcIi", "ncV:512:", "avx512f")			TARGET_BUILTIN(__builtin_ia32_cvtpd2ps512_mask, "V8fV8dV8fUcIi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_vcvtps2ph512_mask, "V16sV16fIiV16sUs", "ncV:512:", "avx512f")			TARGET_BUILTIN(__builtin_ia32_vcvtps2ph512_mask, "V16sV16fIiV16sUs", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_vcvtph2ps512_mask, "V16fV16sV16fUsIi", "ncV:512:", "avx512f")			TARGET_BUILTIN(__builtin_ia32_vcvtph2ps512_mask, "V16fV16sV16fUsIi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_pabsd512, "V16iV16i", "ncV:512:", "avx512f")			TARGET_BUILTIN(__builtin_ia32_pabsd512, "V16iV16i", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_pabsq512, "V8OiV8Oi", "ncV:512:", "avx512f")			TARGET_BUILTIN(__builtin_ia32_pabsq512, "V8OiV8Oi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_pmaxsd512, "V16iV16iV16i", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_pmaxsq512, "V8OiV8OiV8Oi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_pmaxud512, "V16iV16iV16i", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_pmaxuq512, "V8OiV8OiV8Oi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_pminsd512, "V16iV16iV16i", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_pminsq512, "V8OiV8OiV8Oi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_pminud512, "V16iV16iV16i", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_pminuq512, "V8OiV8OiV8Oi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_pmuldq512, "V8OiV16iV16i", "ncV:512:", "avx512f")			TARGET_BUILTIN(__builtin_ia32_pmuldq512, "V8OiV16iV16i", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_pmuludq512, "V8OiV16iV16i", "ncV:512:", "avx512f")			TARGET_BUILTIN(__builtin_ia32_pmuludq512, "V8OiV16iV16i", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_loaddqusi512_mask, "V16iiC*V16iUs", "nV:512:", "avx512f")			TARGET_BUILTIN(__builtin_ia32_loaddqusi512_mask, "V16iiC*V16iUs", "nV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_loaddqudi512_mask, "V8OiOiC*V8OiUc", "nV:512:", "avx512f")			TARGET_BUILTIN(__builtin_ia32_loaddqudi512_mask, "V8OiOiC*V8OiUc", "nV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_loadups512_mask, "V16ffC*V16fUs", "nV:512:", "avx512f")			TARGET_BUILTIN(__builtin_ia32_loadups512_mask, "V16ffC*V16fUs", "nV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_loadaps512_mask, "V16fV16fC*V16fUs", "nV:512:", "avx512f")			TARGET_BUILTIN(__builtin_ia32_loadaps512_mask, "V16fV16fC*V16fUs", "nV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_loadupd512_mask, "V8ddC*V8dUc", "nV:512:", "avx512f")			TARGET_BUILTIN(__builtin_ia32_loadupd512_mask, "V8ddC*V8dUc", "nV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_loadapd512_mask, "V8dV8dC*V8dUc", "nV:512:", "avx512f")			TARGET_BUILTIN(__builtin_ia32_loadapd512_mask, "V8dV8dC*V8dUc", "nV:512:", "avx512f")
	▲ Show 20 Lines • Show All 104 Lines • ▼ Show 20 Lines
	TARGET_BUILTIN(__builtin_ia32_packusdw512, "V32sV16iV16i", "ncV:512:", "avx512bw")			TARGET_BUILTIN(__builtin_ia32_packusdw512, "V32sV16iV16i", "ncV:512:", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_packuswb512, "V64cV32sV32s", "ncV:512:", "avx512bw")			TARGET_BUILTIN(__builtin_ia32_packuswb512, "V64cV32sV32s", "ncV:512:", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_paddsb512, "V64cV64cV64c", "ncV:512:", "avx512bw")			TARGET_BUILTIN(__builtin_ia32_paddsb512, "V64cV64cV64c", "ncV:512:", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_paddsw512, "V32sV32sV32s", "ncV:512:", "avx512bw")			TARGET_BUILTIN(__builtin_ia32_paddsw512, "V32sV32sV32s", "ncV:512:", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_paddusb512, "V64cV64cV64c", "ncV:512:", "avx512bw")			TARGET_BUILTIN(__builtin_ia32_paddusb512, "V64cV64cV64c", "ncV:512:", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_paddusw512, "V32sV32sV32s", "ncV:512:", "avx512bw")			TARGET_BUILTIN(__builtin_ia32_paddusw512, "V32sV32sV32s", "ncV:512:", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_pavgb512, "V64cV64cV64c", "ncV:512:", "avx512bw")			TARGET_BUILTIN(__builtin_ia32_pavgb512, "V64cV64cV64c", "ncV:512:", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_pavgw512, "V32sV32sV32s", "ncV:512:", "avx512bw")			TARGET_BUILTIN(__builtin_ia32_pavgw512, "V32sV32sV32s", "ncV:512:", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_pmaxsb512, "V64cV64cV64c", "ncV:512:", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_pmaxsw512, "V32sV32sV32s", "ncV:512:", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_pmaxub512, "V64cV64cV64c", "ncV:512:", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_pmaxuw512, "V32sV32sV32s", "ncV:512:", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_pminsb512, "V64cV64cV64c", "ncV:512:", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_pminsw512, "V32sV32sV32s", "ncV:512:", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_pminub512, "V64cV64cV64c", "ncV:512:", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_pminuw512, "V32sV32sV32s", "ncV:512:", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_pshufb512, "V64cV64cV64c", "ncV:512:", "avx512bw")			TARGET_BUILTIN(__builtin_ia32_pshufb512, "V64cV64cV64c", "ncV:512:", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_psubsb512, "V64cV64cV64c", "ncV:512:", "avx512bw")			TARGET_BUILTIN(__builtin_ia32_psubsb512, "V64cV64cV64c", "ncV:512:", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_psubsw512, "V32sV32sV32s", "ncV:512:", "avx512bw")			TARGET_BUILTIN(__builtin_ia32_psubsw512, "V32sV32sV32s", "ncV:512:", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_psubusb512, "V64cV64cV64c", "ncV:512:", "avx512bw")			TARGET_BUILTIN(__builtin_ia32_psubusb512, "V64cV64cV64c", "ncV:512:", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_psubusw512, "V32sV32sV32s", "ncV:512:", "avx512bw")			TARGET_BUILTIN(__builtin_ia32_psubusw512, "V32sV32sV32s", "ncV:512:", "avx512bw")

	TARGET_BUILTIN(__builtin_ia32_vpconflictdi_128, "V2OiV2Oi", "ncV:128:", "avx512cd,avx512vl")			TARGET_BUILTIN(__builtin_ia32_vpconflictdi_128, "V2OiV2Oi", "ncV:128:", "avx512cd,avx512vl")
	TARGET_BUILTIN(__builtin_ia32_vpconflictdi_256, "V4OiV4Oi", "ncV:256:", "avx512cd,avx512vl")			TARGET_BUILTIN(__builtin_ia32_vpconflictdi_256, "V4OiV4Oi", "ncV:256:", "avx512cd,avx512vl")
	▲ Show 20 Lines • Show All 119 Lines • ▼ Show 20 Lines
	TARGET_BUILTIN(__builtin_ia32_expandsi128_mask, "V4iV4iV4iUc", "ncV:128:", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_expandsi128_mask, "V4iV4iV4iUc", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_expandsi256_mask, "V8iV8iV8iUc", "ncV:256:", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_expandsi256_mask, "V8iV8iV8iUc", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_getexppd128_mask, "V2dV2dV2dUc", "ncV:128:", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_getexppd128_mask, "V2dV2dV2dUc", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_getexppd256_mask, "V4dV4dV4dUc", "ncV:256:", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_getexppd256_mask, "V4dV4dV4dUc", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_getexpps128_mask, "V4fV4fV4fUc", "ncV:128:", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_getexpps128_mask, "V4fV4fV4fUc", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_getexpps256_mask, "V8fV8fV8fUc", "ncV:256:", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_getexpps256_mask, "V8fV8fV8fUc", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pabsq128, "V2OiV2Oi", "ncV:128:", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pabsq128, "V2OiV2Oi", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pabsq256, "V4OiV4Oi", "ncV:256:", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pabsq256, "V4OiV4Oi", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmaxsq128, "V2OiV2OiV2Oi", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmaxsq256, "V4OiV4OiV4Oi", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmaxuq128, "V2OiV2OiV2Oi", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmaxuq256, "V4OiV4OiV4Oi", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pminsq128, "V2OiV2OiV2Oi", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pminsq256, "V4OiV4OiV4Oi", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pminuq128, "V2OiV2OiV2Oi", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pminuq256, "V4OiV4OiV4Oi", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_rndscalepd_128_mask, "V2dV2dIiV2dUc", "ncV:128:", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_rndscalepd_128_mask, "V2dV2dIiV2dUc", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_rndscalepd_256_mask, "V4dV4dIiV4dUc", "ncV:256:", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_rndscalepd_256_mask, "V4dV4dIiV4dUc", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_rndscaleps_128_mask, "V4fV4fIiV4fUc", "ncV:128:", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_rndscaleps_128_mask, "V4fV4fIiV4fUc", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_rndscaleps_256_mask, "V8fV8fIiV8fUc", "ncV:256:", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_rndscaleps_256_mask, "V8fV8fIiV8fUc", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_scalefpd128_mask, "V2dV2dV2dV2dUc", "ncV:128:", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_scalefpd128_mask, "V2dV2dV2dV2dUc", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_scalefpd256_mask, "V4dV4dV4dV4dUc", "ncV:256:", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_scalefpd256_mask, "V4dV4dV4dV4dUc", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_scalefps128_mask, "V4fV4fV4fV4fUc", "ncV:128:", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_scalefps128_mask, "V4fV4fV4fV4fUc", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_scalefps256_mask, "V8fV8fV8fV8fUc", "ncV:256:", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_scalefps256_mask, "V8fV8fV8fV8fUc", "ncV:256:", "avx512vl")
	▲ Show 20 Lines • Show All 982 Lines • Show Last 20 Lines

clang/lib/CodeGen/CGBuiltin.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

	Show First 20 Lines • Show All 9,991 Lines • ▼ Show 20 Lines
	case X86::BI__builtin_ia32_pabsq256:			case X86::BI__builtin_ia32_pabsq256:
	case X86::BI__builtin_ia32_pabsb512:			case X86::BI__builtin_ia32_pabsb512:
	case X86::BI__builtin_ia32_pabsw512:			case X86::BI__builtin_ia32_pabsw512:
	case X86::BI__builtin_ia32_pabsd512:			case X86::BI__builtin_ia32_pabsd512:
	case X86::BI__builtin_ia32_pabsq512: {			case X86::BI__builtin_ia32_pabsq512: {
	Function *F = CGM.getIntrinsic(Intrinsic::abs, Ops[0]->getType());			Function *F = CGM.getIntrinsic(Intrinsic::abs, Ops[0]->getType());
	return Builder.CreateCall(F, {Ops[0], Builder.getInt1(false)});			return Builder.CreateCall(F, {Ops[0], Builder.getInt1(false)});
	}			}
	case X86::BI__builtin_ia32_pmaxsb128:
	case X86::BI__builtin_ia32_pmaxsw128:
	case X86::BI__builtin_ia32_pmaxsd128:
	case X86::BI__builtin_ia32_pmaxsq128:
	case X86::BI__builtin_ia32_pmaxsb256:
	case X86::BI__builtin_ia32_pmaxsw256:
	case X86::BI__builtin_ia32_pmaxsd256:
	case X86::BI__builtin_ia32_pmaxsq256:
	case X86::BI__builtin_ia32_pmaxsb512:
	case X86::BI__builtin_ia32_pmaxsw512:
	case X86::BI__builtin_ia32_pmaxsd512:
	case X86::BI__builtin_ia32_pmaxsq512:
	return EmitX86BinaryIntrinsic(*this, Ops, Intrinsic::smax);
	case X86::BI__builtin_ia32_pmaxub128:
	case X86::BI__builtin_ia32_pmaxuw128:
	case X86::BI__builtin_ia32_pmaxud128:
	case X86::BI__builtin_ia32_pmaxuq128:
	case X86::BI__builtin_ia32_pmaxub256:
	case X86::BI__builtin_ia32_pmaxuw256:
	case X86::BI__builtin_ia32_pmaxud256:
	case X86::BI__builtin_ia32_pmaxuq256:
	case X86::BI__builtin_ia32_pmaxub512:
	case X86::BI__builtin_ia32_pmaxuw512:
	case X86::BI__builtin_ia32_pmaxud512:
	case X86::BI__builtin_ia32_pmaxuq512:
	return EmitX86BinaryIntrinsic(*this, Ops, Intrinsic::umax);
	case X86::BI__builtin_ia32_pminsb128:
	case X86::BI__builtin_ia32_pminsw128:
	case X86::BI__builtin_ia32_pminsd128:
	case X86::BI__builtin_ia32_pminsq128:
	case X86::BI__builtin_ia32_pminsb256:
	case X86::BI__builtin_ia32_pminsw256:
	case X86::BI__builtin_ia32_pminsd256:
	case X86::BI__builtin_ia32_pminsq256:
	case X86::BI__builtin_ia32_pminsb512:
	case X86::BI__builtin_ia32_pminsw512:
	case X86::BI__builtin_ia32_pminsd512:
	case X86::BI__builtin_ia32_pminsq512:
	return EmitX86BinaryIntrinsic(*this, Ops, Intrinsic::smin);
	case X86::BI__builtin_ia32_pminub128:
	case X86::BI__builtin_ia32_pminuw128:
	case X86::BI__builtin_ia32_pminud128:
	case X86::BI__builtin_ia32_pminuq128:
	case X86::BI__builtin_ia32_pminub256:
	case X86::BI__builtin_ia32_pminuw256:
	case X86::BI__builtin_ia32_pminud256:
	case X86::BI__builtin_ia32_pminuq256:
	case X86::BI__builtin_ia32_pminub512:
	case X86::BI__builtin_ia32_pminuw512:
	case X86::BI__builtin_ia32_pminud512:
	case X86::BI__builtin_ia32_pminuq512:
	return EmitX86BinaryIntrinsic(*this, Ops, Intrinsic::umin);

	case X86::BI__builtin_ia32_pmuludq128:			case X86::BI__builtin_ia32_pmuludq128:
	case X86::BI__builtin_ia32_pmuludq256:			case X86::BI__builtin_ia32_pmuludq256:
	case X86::BI__builtin_ia32_pmuludq512:			case X86::BI__builtin_ia32_pmuludq512:
	return EmitX86Muldq(this, /IsSigned*/false, Ops);			return EmitX86Muldq(this, /IsSigned*/false, Ops);

	case X86::BI__builtin_ia32_pmuldq128:			case X86::BI__builtin_ia32_pmuldq128:
	case X86::BI__builtin_ia32_pmuldq256:			case X86::BI__builtin_ia32_pmuldq256:
	▲ Show 20 Lines • Show All 4,612 Lines • Show Last 20 Lines

clang/lib/Headers/avx2intrin.h

	Show First 20 Lines • Show All 247 Lines • ▼ Show 20 Lines
	_mm256_madd_epi16(__m256i __a, __m256i __b)			_mm256_madd_epi16(__m256i __a, __m256i __b)
	{			{
	return (__m256i)__builtin_ia32_pmaddwd256((__v16hi)__a, (__v16hi)__b);			return (__m256i)__builtin_ia32_pmaddwd256((__v16hi)__a, (__v16hi)__b);
	}			}

	static __inline__ __m256i __DEFAULT_FN_ATTRS256			static __inline__ __m256i __DEFAULT_FN_ATTRS256
	_mm256_max_epi8(__m256i __a, __m256i __b)			_mm256_max_epi8(__m256i __a, __m256i __b)
	{			{
	return (__m256i)__builtin_ia32_pmaxsb256((__v32qi)__a, (__v32qi)__b);			return (__m256i)__builtin_elementwise_max((__v32qs)__a, (__v32qs)__b);
	}			}

	static __inline__ __m256i __DEFAULT_FN_ATTRS256			static __inline__ __m256i __DEFAULT_FN_ATTRS256
	_mm256_max_epi16(__m256i __a, __m256i __b)			_mm256_max_epi16(__m256i __a, __m256i __b)
	{			{
	return (__m256i)__builtin_ia32_pmaxsw256((__v16hi)__a, (__v16hi)__b);			return (__m256i)__builtin_elementwise_max((__v16hi)__a, (__v16hi)__b);
	}			}

	static __inline__ __m256i __DEFAULT_FN_ATTRS256			static __inline__ __m256i __DEFAULT_FN_ATTRS256
	_mm256_max_epi32(__m256i __a, __m256i __b)			_mm256_max_epi32(__m256i __a, __m256i __b)
	{			{
	return (__m256i)__builtin_ia32_pmaxsd256((__v8si)__a, (__v8si)__b);			return (__m256i)__builtin_elementwise_max((__v8si)__a, (__v8si)__b);
	}			}

	static __inline__ __m256i __DEFAULT_FN_ATTRS256			static __inline__ __m256i __DEFAULT_FN_ATTRS256
	_mm256_max_epu8(__m256i __a, __m256i __b)			_mm256_max_epu8(__m256i __a, __m256i __b)
	{			{
	return (__m256i)__builtin_ia32_pmaxub256((__v32qi)__a, (__v32qi)__b);			return (__m256i)__builtin_elementwise_max((__v32qu)__a, (__v32qu)__b);
	}			}

	static __inline__ __m256i __DEFAULT_FN_ATTRS256			static __inline__ __m256i __DEFAULT_FN_ATTRS256
	_mm256_max_epu16(__m256i __a, __m256i __b)			_mm256_max_epu16(__m256i __a, __m256i __b)
	{			{
	return (__m256i)__builtin_ia32_pmaxuw256((__v16hi)__a, (__v16hi)__b);			return (__m256i)__builtin_elementwise_max((__v16hu)__a, (__v16hu)__b);
	}			}

	static __inline__ __m256i __DEFAULT_FN_ATTRS256			static __inline__ __m256i __DEFAULT_FN_ATTRS256
	_mm256_max_epu32(__m256i __a, __m256i __b)			_mm256_max_epu32(__m256i __a, __m256i __b)
	{			{
	return (__m256i)__builtin_ia32_pmaxud256((__v8si)__a, (__v8si)__b);			return (__m256i)__builtin_elementwise_max((__v8su)__a, (__v8su)__b);
	}			}

	static __inline__ __m256i __DEFAULT_FN_ATTRS256			static __inline__ __m256i __DEFAULT_FN_ATTRS256
	_mm256_min_epi8(__m256i __a, __m256i __b)			_mm256_min_epi8(__m256i __a, __m256i __b)
	{			{
	return (__m256i)__builtin_ia32_pminsb256((__v32qi)__a, (__v32qi)__b);			return (__m256i)__builtin_elementwise_min((__v32qs)__a, (__v32qs)__b);
	}			}

	static __inline__ __m256i __DEFAULT_FN_ATTRS256			static __inline__ __m256i __DEFAULT_FN_ATTRS256
	_mm256_min_epi16(__m256i __a, __m256i __b)			_mm256_min_epi16(__m256i __a, __m256i __b)
	{			{
	return (__m256i)__builtin_ia32_pminsw256((__v16hi)__a, (__v16hi)__b);			return (__m256i)__builtin_elementwise_min((__v16hi)__a, (__v16hi)__b);
	}			}

	static __inline__ __m256i __DEFAULT_FN_ATTRS256			static __inline__ __m256i __DEFAULT_FN_ATTRS256
	_mm256_min_epi32(__m256i __a, __m256i __b)			_mm256_min_epi32(__m256i __a, __m256i __b)
	{			{
	return (__m256i)__builtin_ia32_pminsd256((__v8si)__a, (__v8si)__b);			return (__m256i)__builtin_elementwise_min((__v8si)__a, (__v8si)__b);
	}			}

	static __inline__ __m256i __DEFAULT_FN_ATTRS256			static __inline__ __m256i __DEFAULT_FN_ATTRS256
	_mm256_min_epu8(__m256i __a, __m256i __b)			_mm256_min_epu8(__m256i __a, __m256i __b)
	{			{
	return (__m256i)__builtin_ia32_pminub256((__v32qi)__a, (__v32qi)__b);			return (__m256i)__builtin_elementwise_min((__v32qu)__a, (__v32qu)__b);
	}			}

	static __inline__ __m256i __DEFAULT_FN_ATTRS256			static __inline__ __m256i __DEFAULT_FN_ATTRS256
	_mm256_min_epu16(__m256i __a, __m256i __b)			_mm256_min_epu16(__m256i __a, __m256i __b)
	{			{
	return (__m256i)__builtin_ia32_pminuw256 ((__v16hi)__a, (__v16hi)__b);			return (__m256i)__builtin_elementwise_min((__v16hu)__a, (__v16hu)__b);
	}			}

	static __inline__ __m256i __DEFAULT_FN_ATTRS256			static __inline__ __m256i __DEFAULT_FN_ATTRS256
	_mm256_min_epu32(__m256i __a, __m256i __b)			_mm256_min_epu32(__m256i __a, __m256i __b)
	{			{
	return (__m256i)__builtin_ia32_pminud256((__v8si)__a, (__v8si)__b);			return (__m256i)__builtin_elementwise_min((__v8su)__a, (__v8su)__b);
	}			}

	static __inline__ int __DEFAULT_FN_ATTRS256			static __inline__ int __DEFAULT_FN_ATTRS256
	_mm256_movemask_epi8(__m256i __a)			_mm256_movemask_epi8(__m256i __a)
	{			{
	return __builtin_ia32_pmovmskb256((__v32qi)__a);			return __builtin_ia32_pmovmskb256((__v32qi)__a);
	}			}

	▲ Show 20 Lines • Show All 818 Lines • Show Last 20 Lines

clang/lib/Headers/avx512bwintrin.h

Show First 20 Lines • Show All 745 Lines • ▼ Show 20 Lines	_mm512_maskz_avg_epu16 (__mmask32 __U, __m512i __A, __m512i __B)
return (__m512i)__builtin_ia32_selectw_512((__mmask32)__U,		return (__m512i)__builtin_ia32_selectw_512((__mmask32)__U,
(__v32hi)_mm512_avg_epu16(__A, __B),		(__v32hi)_mm512_avg_epu16(__A, __B),
(__v32hi) _mm512_setzero_si512());		(__v32hi) _mm512_setzero_si512());
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS512		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_max_epi8 (__m512i __A, __m512i __B)		_mm512_max_epi8 (__m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_pmaxsb512((__v64qi) __A, (__v64qi) __B);		return (__m512i)__builtin_elementwise_max((__v64qs) __A, (__v64qs) __B);
		Lint: Pre-merge checks Inline Actions clang-format: please reformat the code - return (__m512i)__builtin_elementwise_max((__v64qs) __A, (__v64qs) __B); + return (__m512i)__builtin_elementwise_max((__v64qs)__A, (__v64qs)__B); Lint: Pre-merge checks: clang-format: please reformat the code ``` - return (__m512i)__builtin_elementwise_max…
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS512		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_max_epi8 (__mmask64 __M, __m512i __A, __m512i __B)		_mm512_maskz_max_epi8 (__mmask64 __M, __m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_selectb_512((__mmask64)__M,		return (__m512i)__builtin_ia32_selectb_512((__mmask64)__M,
(__v64qi)_mm512_max_epi8(__A, __B),		(__v64qi)_mm512_max_epi8(__A, __B),
(__v64qi)_mm512_setzero_si512());		(__v64qi)_mm512_setzero_si512());
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS512		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_max_epi8 (__m512i __W, __mmask64 __M, __m512i __A, __m512i __B)		_mm512_mask_max_epi8 (__m512i __W, __mmask64 __M, __m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_selectb_512((__mmask64)__M,		return (__m512i)__builtin_ia32_selectb_512((__mmask64)__M,
(__v64qi)_mm512_max_epi8(__A, __B),		(__v64qi)_mm512_max_epi8(__A, __B),
(__v64qi)__W);		(__v64qi)__W);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS512		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_max_epi16 (__m512i __A, __m512i __B)		_mm512_max_epi16 (__m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_pmaxsw512((__v32hi) __A, (__v32hi) __B);		return (__m512i)__builtin_elementwise_max((__v32hi) __A, (__v32hi) __B);
		Lint: Pre-merge checks Inline Actions clang-format: please reformat the code - return (__m512i)__builtin_elementwise_max((__v32hi) __A, (__v32hi) __B); + return (__m512i)__builtin_elementwise_max((__v32hi)__A, (__v32hi)__B); Lint: Pre-merge checks: clang-format: please reformat the code ``` - return (__m512i)__builtin_elementwise_max…
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS512		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_max_epi16 (__mmask32 __M, __m512i __A, __m512i __B)		_mm512_maskz_max_epi16 (__mmask32 __M, __m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_selectw_512((__mmask32)__M,		return (__m512i)__builtin_ia32_selectw_512((__mmask32)__M,
(__v32hi)_mm512_max_epi16(__A, __B),		(__v32hi)_mm512_max_epi16(__A, __B),
(__v32hi)_mm512_setzero_si512());		(__v32hi)_mm512_setzero_si512());
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS512		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_max_epi16 (__m512i __W, __mmask32 __M, __m512i __A,		_mm512_mask_max_epi16 (__m512i __W, __mmask32 __M, __m512i __A,
__m512i __B)		__m512i __B)
{		{
return (__m512i)__builtin_ia32_selectw_512((__mmask32)__M,		return (__m512i)__builtin_ia32_selectw_512((__mmask32)__M,
(__v32hi)_mm512_max_epi16(__A, __B),		(__v32hi)_mm512_max_epi16(__A, __B),
(__v32hi)__W);		(__v32hi)__W);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS512		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_max_epu8 (__m512i __A, __m512i __B)		_mm512_max_epu8 (__m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_pmaxub512((__v64qi)__A, (__v64qi)__B);		return (__m512i)__builtin_elementwise_max((__v64qu)__A, (__v64qu)__B);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS512		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_max_epu8 (__mmask64 __M, __m512i __A, __m512i __B)		_mm512_maskz_max_epu8 (__mmask64 __M, __m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_selectb_512((__mmask64)__M,		return (__m512i)__builtin_ia32_selectb_512((__mmask64)__M,
(__v64qi)_mm512_max_epu8(__A, __B),		(__v64qi)_mm512_max_epu8(__A, __B),
(__v64qi)_mm512_setzero_si512());		(__v64qi)_mm512_setzero_si512());
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS512		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_max_epu8 (__m512i __W, __mmask64 __M, __m512i __A, __m512i __B)		_mm512_mask_max_epu8 (__m512i __W, __mmask64 __M, __m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_selectb_512((__mmask64)__M,		return (__m512i)__builtin_ia32_selectb_512((__mmask64)__M,
(__v64qi)_mm512_max_epu8(__A, __B),		(__v64qi)_mm512_max_epu8(__A, __B),
(__v64qi)__W);		(__v64qi)__W);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS512		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_max_epu16 (__m512i __A, __m512i __B)		_mm512_max_epu16 (__m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_pmaxuw512((__v32hi)__A, (__v32hi)__B);		return (__m512i)__builtin_elementwise_max((__v32hu)__A, (__v32hu)__B);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS512		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_max_epu16 (__mmask32 __M, __m512i __A, __m512i __B)		_mm512_maskz_max_epu16 (__mmask32 __M, __m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_selectw_512((__mmask32)__M,		return (__m512i)__builtin_ia32_selectw_512((__mmask32)__M,
(__v32hi)_mm512_max_epu16(__A, __B),		(__v32hi)_mm512_max_epu16(__A, __B),
(__v32hi)_mm512_setzero_si512());		(__v32hi)_mm512_setzero_si512());
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS512		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_max_epu16 (__m512i __W, __mmask32 __M, __m512i __A, __m512i __B)		_mm512_mask_max_epu16 (__m512i __W, __mmask32 __M, __m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_selectw_512((__mmask32)__M,		return (__m512i)__builtin_ia32_selectw_512((__mmask32)__M,
(__v32hi)_mm512_max_epu16(__A, __B),		(__v32hi)_mm512_max_epu16(__A, __B),
(__v32hi)__W);		(__v32hi)__W);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS512		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_min_epi8 (__m512i __A, __m512i __B)		_mm512_min_epi8 (__m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_pminsb512((__v64qi) __A, (__v64qi) __B);		return (__m512i)__builtin_elementwise_min((__v64qs) __A, (__v64qs) __B);
		Lint: Pre-merge checks Inline Actions clang-format: please reformat the code - return (__m512i)__builtin_elementwise_min((__v64qs) __A, (__v64qs) __B); + return (__m512i)__builtin_elementwise_min((__v64qs)__A, (__v64qs)__B); Lint: Pre-merge checks: clang-format: please reformat the code ``` - return (__m512i)__builtin_elementwise_min…
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS512		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_min_epi8 (__mmask64 __M, __m512i __A, __m512i __B)		_mm512_maskz_min_epi8 (__mmask64 __M, __m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_selectb_512((__mmask64)__M,		return (__m512i)__builtin_ia32_selectb_512((__mmask64)__M,
(__v64qi)_mm512_min_epi8(__A, __B),		(__v64qi)_mm512_min_epi8(__A, __B),
(__v64qi)_mm512_setzero_si512());		(__v64qi)_mm512_setzero_si512());
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS512		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_min_epi8 (__m512i __W, __mmask64 __M, __m512i __A, __m512i __B)		_mm512_mask_min_epi8 (__m512i __W, __mmask64 __M, __m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_selectb_512((__mmask64)__M,		return (__m512i)__builtin_ia32_selectb_512((__mmask64)__M,
(__v64qi)_mm512_min_epi8(__A, __B),		(__v64qi)_mm512_min_epi8(__A, __B),
(__v64qi)__W);		(__v64qi)__W);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS512		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_min_epi16 (__m512i __A, __m512i __B)		_mm512_min_epi16 (__m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_pminsw512((__v32hi) __A, (__v32hi) __B);		return (__m512i)__builtin_elementwise_min((__v32hi) __A, (__v32hi) __B);
		Lint: Pre-merge checks Inline Actions clang-format: please reformat the code - return (__m512i)__builtin_elementwise_min((__v32hi) __A, (__v32hi) __B); + return (__m512i)__builtin_elementwise_min((__v32hi)__A, (__v32hi)__B); Lint: Pre-merge checks: clang-format: please reformat the code ``` - return (__m512i)__builtin_elementwise_min…
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS512		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_min_epi16 (__mmask32 __M, __m512i __A, __m512i __B)		_mm512_maskz_min_epi16 (__mmask32 __M, __m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_selectw_512((__mmask32)__M,		return (__m512i)__builtin_ia32_selectw_512((__mmask32)__M,
(__v32hi)_mm512_min_epi16(__A, __B),		(__v32hi)_mm512_min_epi16(__A, __B),
(__v32hi)_mm512_setzero_si512());		(__v32hi)_mm512_setzero_si512());
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS512		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_min_epi16 (__m512i __W, __mmask32 __M, __m512i __A, __m512i __B)		_mm512_mask_min_epi16 (__m512i __W, __mmask32 __M, __m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_selectw_512((__mmask32)__M,		return (__m512i)__builtin_ia32_selectw_512((__mmask32)__M,
(__v32hi)_mm512_min_epi16(__A, __B),		(__v32hi)_mm512_min_epi16(__A, __B),
(__v32hi)__W);		(__v32hi)__W);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS512		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_min_epu8 (__m512i __A, __m512i __B)		_mm512_min_epu8 (__m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_pminub512((__v64qi)__A, (__v64qi)__B);		return (__m512i)__builtin_elementwise_min((__v64qu)__A, (__v64qu)__B);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS512		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_min_epu8 (__mmask64 __M, __m512i __A, __m512i __B)		_mm512_maskz_min_epu8 (__mmask64 __M, __m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_selectb_512((__mmask64)__M,		return (__m512i)__builtin_ia32_selectb_512((__mmask64)__M,
(__v64qi)_mm512_min_epu8(__A, __B),		(__v64qi)_mm512_min_epu8(__A, __B),
		pengfeiUnsubmitted Not Done Reply Inline Actions Should we change the type here too? The same below. pengfei: Should we change the type here too? The same below.
		RKSimonAuthorUnsubmitted Not Done Reply Inline Actions I don't think so - `__builtin_ia32_selectb_512` uses `__v64qi` everywhere else, and ignores signedness. It only matters inside the min/max builtins RKSimon: I don't think so - `__builtin_ia32_selectb_512` uses `__v64qi` everywhere else, and ignores…
(__v64qi)_mm512_setzero_si512());		(__v64qi)_mm512_setzero_si512());
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS512		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_min_epu8 (__m512i __W, __mmask64 __M, __m512i __A, __m512i __B)		_mm512_mask_min_epu8 (__m512i __W, __mmask64 __M, __m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_selectb_512((__mmask64)__M,		return (__m512i)__builtin_ia32_selectb_512((__mmask64)__M,
(__v64qi)_mm512_min_epu8(__A, __B),		(__v64qi)_mm512_min_epu8(__A, __B),
(__v64qi)__W);		(__v64qi)__W);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS512		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_min_epu16 (__m512i __A, __m512i __B)		_mm512_min_epu16 (__m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_pminuw512((__v32hi)__A, (__v32hi)__B);		return (__m512i)__builtin_elementwise_min((__v32hu)__A, (__v32hu)__B);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS512		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_min_epu16 (__mmask32 __M, __m512i __A, __m512i __B)		_mm512_maskz_min_epu16 (__mmask32 __M, __m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_selectw_512((__mmask32)__M,		return (__m512i)__builtin_ia32_selectw_512((__mmask32)__M,
(__v32hi)_mm512_min_epu16(__A, __B),		(__v32hi)_mm512_min_epu16(__A, __B),
(__v32hi)_mm512_setzero_si512());		(__v32hi)_mm512_setzero_si512());
▲ Show 20 Lines • Show All 1,107 Lines • Show Last 20 Lines

clang/lib/Headers/avx512fintrin.h

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show All 20 Lines
typedef int __v16si __attribute__((__vector_size__(64)));		typedef int __v16si __attribute__((__vector_size__(64)));

/* Unsigned types */		/* Unsigned types */
typedef unsigned char __v64qu __attribute__((__vector_size__(64)));		typedef unsigned char __v64qu __attribute__((__vector_size__(64)));
typedef unsigned short __v32hu __attribute__((__vector_size__(64)));		typedef unsigned short __v32hu __attribute__((__vector_size__(64)));
typedef unsigned long long __v8du __attribute__((__vector_size__(64)));		typedef unsigned long long __v8du __attribute__((__vector_size__(64)));
typedef unsigned int __v16su __attribute__((__vector_size__(64)));		typedef unsigned int __v16su __attribute__((__vector_size__(64)));

		/* We need an explicitly signed variant for char. Note that this shouldn't
		* appear in the interface though. */
		typedef signed char __v64qs __attribute__((__vector_size__(64)));

typedef float __m512 __attribute__((__vector_size__(64), __aligned__(64)));		typedef float __m512 __attribute__((__vector_size__(64), __aligned__(64)));
typedef double __m512d __attribute__((__vector_size__(64), __aligned__(64)));		typedef double __m512d __attribute__((__vector_size__(64), __aligned__(64)));
typedef long long __m512i __attribute__((__vector_size__(64), __aligned__(64)));		typedef long long __m512i __attribute__((__vector_size__(64), __aligned__(64)));

typedef float __m512_u __attribute__((__vector_size__(64), __aligned__(1)));		typedef float __m512_u __attribute__((__vector_size__(64), __aligned__(1)));
typedef double __m512d_u __attribute__((__vector_size__(64), __aligned__(1)));		typedef double __m512d_u __attribute__((__vector_size__(64), __aligned__(1)));
typedef long long __m512i_u __attribute__((__vector_size__(64), __aligned__(1)));		typedef long long __m512i_u __attribute__((__vector_size__(64), __aligned__(1)));

▲ Show 20 Lines • Show All 1,044 Lines • ▼ Show 20 Lines	((__m128d)__builtin_ia32_maxsd_round_mask((__v2df)(__m128d)(A), \
(__v2df)(__m128d)(B), \		(__v2df)(__m128d)(B), \
(__v2df)_mm_setzero_pd(), \		(__v2df)_mm_setzero_pd(), \
(__mmask8)(U), (int)(R)))		(__mmask8)(U), (int)(R)))

static __inline __m512i		static __inline __m512i
__DEFAULT_FN_ATTRS512		__DEFAULT_FN_ATTRS512
_mm512_max_epi32(__m512i __A, __m512i __B)		_mm512_max_epi32(__m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_pmaxsd512((__v16si)__A, (__v16si)__B);		return (__m512i)__builtin_elementwise_max((__v16si)__A, (__v16si)__B);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS512		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_max_epi32 (__m512i __W, __mmask16 __M, __m512i __A, __m512i __B)		_mm512_mask_max_epi32 (__m512i __W, __mmask16 __M, __m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_selectd_512((__mmask16)__M,		return (__m512i)__builtin_ia32_selectd_512((__mmask16)__M,
(__v16si)_mm512_max_epi32(__A, __B),		(__v16si)_mm512_max_epi32(__A, __B),
(__v16si)__W);		(__v16si)__W);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS512		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_max_epi32 (__mmask16 __M, __m512i __A, __m512i __B)		_mm512_maskz_max_epi32 (__mmask16 __M, __m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_selectd_512((__mmask16)__M,		return (__m512i)__builtin_ia32_selectd_512((__mmask16)__M,
(__v16si)_mm512_max_epi32(__A, __B),		(__v16si)_mm512_max_epi32(__A, __B),
(__v16si)_mm512_setzero_si512());		(__v16si)_mm512_setzero_si512());
}		}

static __inline __m512i __DEFAULT_FN_ATTRS512		static __inline __m512i __DEFAULT_FN_ATTRS512
_mm512_max_epu32(__m512i __A, __m512i __B)		_mm512_max_epu32(__m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_pmaxud512((__v16si)__A, (__v16si)__B);		return (__m512i)__builtin_elementwise_max((__v16su)__A, (__v16su)__B);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS512		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_max_epu32 (__m512i __W, __mmask16 __M, __m512i __A, __m512i __B)		_mm512_mask_max_epu32 (__m512i __W, __mmask16 __M, __m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_selectd_512((__mmask16)__M,		return (__m512i)__builtin_ia32_selectd_512((__mmask16)__M,
(__v16si)_mm512_max_epu32(__A, __B),		(__v16si)_mm512_max_epu32(__A, __B),
(__v16si)__W);		(__v16si)__W);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS512		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_max_epu32 (__mmask16 __M, __m512i __A, __m512i __B)		_mm512_maskz_max_epu32 (__mmask16 __M, __m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_selectd_512((__mmask16)__M,		return (__m512i)__builtin_ia32_selectd_512((__mmask16)__M,
(__v16si)_mm512_max_epu32(__A, __B),		(__v16si)_mm512_max_epu32(__A, __B),
(__v16si)_mm512_setzero_si512());		(__v16si)_mm512_setzero_si512());
}		}

static __inline __m512i __DEFAULT_FN_ATTRS512		static __inline __m512i __DEFAULT_FN_ATTRS512
_mm512_max_epi64(__m512i __A, __m512i __B)		_mm512_max_epi64(__m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_pmaxsq512((__v8di)__A, (__v8di)__B);		return (__m512i)__builtin_elementwise_max((__v8di)__A, (__v8di)__B);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS512		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_max_epi64 (__m512i __W, __mmask8 __M, __m512i __A, __m512i __B)		_mm512_mask_max_epi64 (__m512i __W, __mmask8 __M, __m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_selectq_512((__mmask8)__M,		return (__m512i)__builtin_ia32_selectq_512((__mmask8)__M,
(__v8di)_mm512_max_epi64(__A, __B),		(__v8di)_mm512_max_epi64(__A, __B),
(__v8di)__W);		(__v8di)__W);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS512		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_max_epi64 (__mmask8 __M, __m512i __A, __m512i __B)		_mm512_maskz_max_epi64 (__mmask8 __M, __m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_selectq_512((__mmask8)__M,		return (__m512i)__builtin_ia32_selectq_512((__mmask8)__M,
(__v8di)_mm512_max_epi64(__A, __B),		(__v8di)_mm512_max_epi64(__A, __B),
(__v8di)_mm512_setzero_si512());		(__v8di)_mm512_setzero_si512());
}		}

static __inline __m512i __DEFAULT_FN_ATTRS512		static __inline __m512i __DEFAULT_FN_ATTRS512
_mm512_max_epu64(__m512i __A, __m512i __B)		_mm512_max_epu64(__m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_pmaxuq512((__v8di)__A, (__v8di)__B);		return (__m512i)__builtin_elementwise_max((__v8du)__A, (__v8du)__B);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS512		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_max_epu64 (__m512i __W, __mmask8 __M, __m512i __A, __m512i __B)		_mm512_mask_max_epu64 (__m512i __W, __mmask8 __M, __m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_selectq_512((__mmask8)__M,		return (__m512i)__builtin_ia32_selectq_512((__mmask8)__M,
(__v8di)_mm512_max_epu64(__A, __B),		(__v8di)_mm512_max_epu64(__A, __B),
(__v8di)__W);		(__v8di)__W);
▲ Show 20 Lines • Show All 152 Lines • ▼ Show 20 Lines	((__m128d)__builtin_ia32_minsd_round_mask((__v2df)(__m128d)(A), \
(__v2df)(__m128d)(B), \		(__v2df)(__m128d)(B), \
(__v2df)_mm_setzero_pd(), \		(__v2df)_mm_setzero_pd(), \
(__mmask8)(U), (int)(R)))		(__mmask8)(U), (int)(R)))

static __inline __m512i		static __inline __m512i
__DEFAULT_FN_ATTRS512		__DEFAULT_FN_ATTRS512
_mm512_min_epi32(__m512i __A, __m512i __B)		_mm512_min_epi32(__m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_pminsd512((__v16si)__A, (__v16si)__B);		return (__m512i)__builtin_elementwise_min((__v16si)__A, (__v16si)__B);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS512		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_min_epi32 (__m512i __W, __mmask16 __M, __m512i __A, __m512i __B)		_mm512_mask_min_epi32 (__m512i __W, __mmask16 __M, __m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_selectd_512((__mmask16)__M,		return (__m512i)__builtin_ia32_selectd_512((__mmask16)__M,
(__v16si)_mm512_min_epi32(__A, __B),		(__v16si)_mm512_min_epi32(__A, __B),
(__v16si)__W);		(__v16si)__W);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS512		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_min_epi32 (__mmask16 __M, __m512i __A, __m512i __B)		_mm512_maskz_min_epi32 (__mmask16 __M, __m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_selectd_512((__mmask16)__M,		return (__m512i)__builtin_ia32_selectd_512((__mmask16)__M,
(__v16si)_mm512_min_epi32(__A, __B),		(__v16si)_mm512_min_epi32(__A, __B),
(__v16si)_mm512_setzero_si512());		(__v16si)_mm512_setzero_si512());
}		}

static __inline __m512i __DEFAULT_FN_ATTRS512		static __inline __m512i __DEFAULT_FN_ATTRS512
_mm512_min_epu32(__m512i __A, __m512i __B)		_mm512_min_epu32(__m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_pminud512((__v16si)__A, (__v16si)__B);		return (__m512i)__builtin_elementwise_min((__v16su)__A, (__v16su)__B);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS512		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_min_epu32 (__m512i __W, __mmask16 __M, __m512i __A, __m512i __B)		_mm512_mask_min_epu32 (__m512i __W, __mmask16 __M, __m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_selectd_512((__mmask16)__M,		return (__m512i)__builtin_ia32_selectd_512((__mmask16)__M,
(__v16si)_mm512_min_epu32(__A, __B),		(__v16si)_mm512_min_epu32(__A, __B),
(__v16si)__W);		(__v16si)__W);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS512		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_min_epu32 (__mmask16 __M, __m512i __A, __m512i __B)		_mm512_maskz_min_epu32 (__mmask16 __M, __m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_selectd_512((__mmask16)__M,		return (__m512i)__builtin_ia32_selectd_512((__mmask16)__M,
(__v16si)_mm512_min_epu32(__A, __B),		(__v16si)_mm512_min_epu32(__A, __B),
(__v16si)_mm512_setzero_si512());		(__v16si)_mm512_setzero_si512());
}		}

static __inline __m512i __DEFAULT_FN_ATTRS512		static __inline __m512i __DEFAULT_FN_ATTRS512
_mm512_min_epi64(__m512i __A, __m512i __B)		_mm512_min_epi64(__m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_pminsq512((__v8di)__A, (__v8di)__B);		return (__m512i)__builtin_elementwise_min((__v8di)__A, (__v8di)__B);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS512		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_min_epi64 (__m512i __W, __mmask8 __M, __m512i __A, __m512i __B)		_mm512_mask_min_epi64 (__m512i __W, __mmask8 __M, __m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_selectq_512((__mmask8)__M,		return (__m512i)__builtin_ia32_selectq_512((__mmask8)__M,
(__v8di)_mm512_min_epi64(__A, __B),		(__v8di)_mm512_min_epi64(__A, __B),
(__v8di)__W);		(__v8di)__W);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS512		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_min_epi64 (__mmask8 __M, __m512i __A, __m512i __B)		_mm512_maskz_min_epi64 (__mmask8 __M, __m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_selectq_512((__mmask8)__M,		return (__m512i)__builtin_ia32_selectq_512((__mmask8)__M,
(__v8di)_mm512_min_epi64(__A, __B),		(__v8di)_mm512_min_epi64(__A, __B),
(__v8di)_mm512_setzero_si512());		(__v8di)_mm512_setzero_si512());
}		}

static __inline __m512i __DEFAULT_FN_ATTRS512		static __inline __m512i __DEFAULT_FN_ATTRS512
_mm512_min_epu64(__m512i __A, __m512i __B)		_mm512_min_epu64(__m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_pminuq512((__v8di)__A, (__v8di)__B);		return (__m512i)__builtin_elementwise_min((__v8du)__A, (__v8du)__B);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS512		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_min_epu64 (__m512i __W, __mmask8 __M, __m512i __A, __m512i __B)		_mm512_mask_min_epu64 (__m512i __W, __mmask8 __M, __m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_selectq_512((__mmask8)__M,		return (__m512i)__builtin_ia32_selectq_512((__mmask8)__M,
(__v8di)_mm512_min_epu64(__A, __B),		(__v8di)_mm512_min_epu64(__A, __B),
(__v8di)__W);		(__v8di)__W);
▲ Show 20 Lines • Show All 8,360 Lines • Show Last 20 Lines

clang/lib/Headers/avx512vlintrin.h

This file is larger than 256 KB, so syntax highlighting is disabled by default.

	Show First 20 Lines • Show All 3,048 Lines • ▼ Show 20 Lines
	_mm256_mask_max_epi32(__m256i __W, __mmask8 __M, __m256i __A, __m256i __B) {			_mm256_mask_max_epi32(__m256i __W, __mmask8 __M, __m256i __A, __m256i __B) {
	return (__m256i)__builtin_ia32_selectd_256((__mmask8)__M,			return (__m256i)__builtin_ia32_selectd_256((__mmask8)__M,
	(__v8si)_mm256_max_epi32(__A, __B),			(__v8si)_mm256_max_epi32(__A, __B),
	(__v8si)__W);			(__v8si)__W);
	}			}

	static __inline__ __m128i __DEFAULT_FN_ATTRS128			static __inline__ __m128i __DEFAULT_FN_ATTRS128
	_mm_max_epi64 (__m128i __A, __m128i __B) {			_mm_max_epi64 (__m128i __A, __m128i __B) {
	return (__m128i)__builtin_ia32_pmaxsq128((__v2di)__A, (__v2di)__B);			return (__m128i)__builtin_elementwise_max((__v2di)__A, (__v2di)__B);
	}			}

	static __inline__ __m128i __DEFAULT_FN_ATTRS128			static __inline__ __m128i __DEFAULT_FN_ATTRS128
	_mm_maskz_max_epi64 (__mmask8 __M, __m128i __A, __m128i __B) {			_mm_maskz_max_epi64 (__mmask8 __M, __m128i __A, __m128i __B) {
	return (__m128i)__builtin_ia32_selectq_128((__mmask8)__M,			return (__m128i)__builtin_ia32_selectq_128((__mmask8)__M,
	(__v2di)_mm_max_epi64(__A, __B),			(__v2di)_mm_max_epi64(__A, __B),
	(__v2di)_mm_setzero_si128());			(__v2di)_mm_setzero_si128());
	}			}

	static __inline__ __m128i __DEFAULT_FN_ATTRS128			static __inline__ __m128i __DEFAULT_FN_ATTRS128
	_mm_mask_max_epi64 (__m128i __W, __mmask8 __M, __m128i __A, __m128i __B) {			_mm_mask_max_epi64 (__m128i __W, __mmask8 __M, __m128i __A, __m128i __B) {
	return (__m128i)__builtin_ia32_selectq_128((__mmask8)__M,			return (__m128i)__builtin_ia32_selectq_128((__mmask8)__M,
	(__v2di)_mm_max_epi64(__A, __B),			(__v2di)_mm_max_epi64(__A, __B),
	(__v2di)__W);			(__v2di)__W);
	}			}

	static __inline__ __m256i __DEFAULT_FN_ATTRS256			static __inline__ __m256i __DEFAULT_FN_ATTRS256
	_mm256_max_epi64 (__m256i __A, __m256i __B) {			_mm256_max_epi64 (__m256i __A, __m256i __B) {
	return (__m256i)__builtin_ia32_pmaxsq256((__v4di)__A, (__v4di)__B);			return (__m256i)__builtin_elementwise_max((__v4di)__A, (__v4di)__B);
	}			}

	static __inline__ __m256i __DEFAULT_FN_ATTRS256			static __inline__ __m256i __DEFAULT_FN_ATTRS256
	_mm256_maskz_max_epi64 (__mmask8 __M, __m256i __A, __m256i __B) {			_mm256_maskz_max_epi64 (__mmask8 __M, __m256i __A, __m256i __B) {
	return (__m256i)__builtin_ia32_selectq_256((__mmask8)__M,			return (__m256i)__builtin_ia32_selectq_256((__mmask8)__M,
	(__v4di)_mm256_max_epi64(__A, __B),			(__v4di)_mm256_max_epi64(__A, __B),
	(__v4di)_mm256_setzero_si256());			(__v4di)_mm256_setzero_si256());
	}			}
	Show All 30 Lines
	_mm256_mask_max_epu32(__m256i __W, __mmask8 __M, __m256i __A, __m256i __B) {			_mm256_mask_max_epu32(__m256i __W, __mmask8 __M, __m256i __A, __m256i __B) {
	return (__m256i)__builtin_ia32_selectd_256((__mmask8)__M,			return (__m256i)__builtin_ia32_selectd_256((__mmask8)__M,
	(__v8si)_mm256_max_epu32(__A, __B),			(__v8si)_mm256_max_epu32(__A, __B),
	(__v8si)__W);			(__v8si)__W);
	}			}

	static __inline__ __m128i __DEFAULT_FN_ATTRS128			static __inline__ __m128i __DEFAULT_FN_ATTRS128
	_mm_max_epu64 (__m128i __A, __m128i __B) {			_mm_max_epu64 (__m128i __A, __m128i __B) {
	return (__m128i)__builtin_ia32_pmaxuq128((__v2di)__A, (__v2di)__B);			return (__m128i)__builtin_elementwise_max((__v2du)__A, (__v2du)__B);
	}			}

	static __inline__ __m128i __DEFAULT_FN_ATTRS128			static __inline__ __m128i __DEFAULT_FN_ATTRS128
	_mm_maskz_max_epu64 (__mmask8 __M, __m128i __A, __m128i __B) {			_mm_maskz_max_epu64 (__mmask8 __M, __m128i __A, __m128i __B) {
	return (__m128i)__builtin_ia32_selectq_128((__mmask8)__M,			return (__m128i)__builtin_ia32_selectq_128((__mmask8)__M,
	(__v2di)_mm_max_epu64(__A, __B),			(__v2di)_mm_max_epu64(__A, __B),
	(__v2di)_mm_setzero_si128());			(__v2di)_mm_setzero_si128());
	}			}

	static __inline__ __m128i __DEFAULT_FN_ATTRS128			static __inline__ __m128i __DEFAULT_FN_ATTRS128
	_mm_mask_max_epu64 (__m128i __W, __mmask8 __M, __m128i __A, __m128i __B) {			_mm_mask_max_epu64 (__m128i __W, __mmask8 __M, __m128i __A, __m128i __B) {
	return (__m128i)__builtin_ia32_selectq_128((__mmask8)__M,			return (__m128i)__builtin_ia32_selectq_128((__mmask8)__M,
	(__v2di)_mm_max_epu64(__A, __B),			(__v2di)_mm_max_epu64(__A, __B),
	(__v2di)__W);			(__v2di)__W);
	}			}

	static __inline__ __m256i __DEFAULT_FN_ATTRS256			static __inline__ __m256i __DEFAULT_FN_ATTRS256
	_mm256_max_epu64 (__m256i __A, __m256i __B) {			_mm256_max_epu64 (__m256i __A, __m256i __B) {
	return (__m256i)__builtin_ia32_pmaxuq256((__v4di)__A, (__v4di)__B);			return (__m256i)__builtin_elementwise_max((__v4du)__A, (__v4du)__B);
	}			}

	static __inline__ __m256i __DEFAULT_FN_ATTRS256			static __inline__ __m256i __DEFAULT_FN_ATTRS256
	_mm256_maskz_max_epu64 (__mmask8 __M, __m256i __A, __m256i __B) {			_mm256_maskz_max_epu64 (__mmask8 __M, __m256i __A, __m256i __B) {
	return (__m256i)__builtin_ia32_selectq_256((__mmask8)__M,			return (__m256i)__builtin_ia32_selectq_256((__mmask8)__M,
	(__v4di)_mm256_max_epu64(__A, __B),			(__v4di)_mm256_max_epu64(__A, __B),
	(__v4di)_mm256_setzero_si256());			(__v4di)_mm256_setzero_si256());
	}			}
	Show All 30 Lines
	_mm256_mask_min_epi32(__m256i __W, __mmask8 __M, __m256i __A, __m256i __B) {			_mm256_mask_min_epi32(__m256i __W, __mmask8 __M, __m256i __A, __m256i __B) {
	return (__m256i)__builtin_ia32_selectd_256((__mmask8)__M,			return (__m256i)__builtin_ia32_selectd_256((__mmask8)__M,
	(__v8si)_mm256_min_epi32(__A, __B),			(__v8si)_mm256_min_epi32(__A, __B),
	(__v8si)__W);			(__v8si)__W);
	}			}

	static __inline__ __m128i __DEFAULT_FN_ATTRS128			static __inline__ __m128i __DEFAULT_FN_ATTRS128
	_mm_min_epi64 (__m128i __A, __m128i __B) {			_mm_min_epi64 (__m128i __A, __m128i __B) {
	return (__m128i)__builtin_ia32_pminsq128((__v2di)__A, (__v2di)__B);			return (__m128i)__builtin_elementwise_min((__v2di)__A, (__v2di)__B);
	}			}

	static __inline__ __m128i __DEFAULT_FN_ATTRS128			static __inline__ __m128i __DEFAULT_FN_ATTRS128
	_mm_mask_min_epi64 (__m128i __W, __mmask8 __M, __m128i __A, __m128i __B) {			_mm_mask_min_epi64 (__m128i __W, __mmask8 __M, __m128i __A, __m128i __B) {
	return (__m128i)__builtin_ia32_selectq_128((__mmask8)__M,			return (__m128i)__builtin_ia32_selectq_128((__mmask8)__M,
	(__v2di)_mm_min_epi64(__A, __B),			(__v2di)_mm_min_epi64(__A, __B),
	(__v2di)__W);			(__v2di)__W);
	}			}

	static __inline__ __m128i __DEFAULT_FN_ATTRS128			static __inline__ __m128i __DEFAULT_FN_ATTRS128
	_mm_maskz_min_epi64 (__mmask8 __M, __m128i __A, __m128i __B) {			_mm_maskz_min_epi64 (__mmask8 __M, __m128i __A, __m128i __B) {
	return (__m128i)__builtin_ia32_selectq_128((__mmask8)__M,			return (__m128i)__builtin_ia32_selectq_128((__mmask8)__M,
	(__v2di)_mm_min_epi64(__A, __B),			(__v2di)_mm_min_epi64(__A, __B),
	(__v2di)_mm_setzero_si128());			(__v2di)_mm_setzero_si128());
	}			}

	static __inline__ __m256i __DEFAULT_FN_ATTRS256			static __inline__ __m256i __DEFAULT_FN_ATTRS256
	_mm256_min_epi64 (__m256i __A, __m256i __B) {			_mm256_min_epi64 (__m256i __A, __m256i __B) {
	return (__m256i)__builtin_ia32_pminsq256((__v4di)__A, (__v4di)__B);			return (__m256i)__builtin_elementwise_min((__v4di)__A, (__v4di)__B);
	}			}

	static __inline__ __m256i __DEFAULT_FN_ATTRS256			static __inline__ __m256i __DEFAULT_FN_ATTRS256
	_mm256_mask_min_epi64 (__m256i __W, __mmask8 __M, __m256i __A, __m256i __B) {			_mm256_mask_min_epi64 (__m256i __W, __mmask8 __M, __m256i __A, __m256i __B) {
	return (__m256i)__builtin_ia32_selectq_256((__mmask8)__M,			return (__m256i)__builtin_ia32_selectq_256((__mmask8)__M,
	(__v4di)_mm256_min_epi64(__A, __B),			(__v4di)_mm256_min_epi64(__A, __B),
	(__v4di)__W);			(__v4di)__W);
	}			}
	Show All 30 Lines
	_mm256_mask_min_epu32(__m256i __W, __mmask8 __M, __m256i __A, __m256i __B) {			_mm256_mask_min_epu32(__m256i __W, __mmask8 __M, __m256i __A, __m256i __B) {
	return (__m256i)__builtin_ia32_selectd_256((__mmask8)__M,			return (__m256i)__builtin_ia32_selectd_256((__mmask8)__M,
	(__v8si)_mm256_min_epu32(__A, __B),			(__v8si)_mm256_min_epu32(__A, __B),
	(__v8si)__W);			(__v8si)__W);
	}			}

	static __inline__ __m128i __DEFAULT_FN_ATTRS128			static __inline__ __m128i __DEFAULT_FN_ATTRS128
	_mm_min_epu64 (__m128i __A, __m128i __B) {			_mm_min_epu64 (__m128i __A, __m128i __B) {
	return (__m128i)__builtin_ia32_pminuq128((__v2di)__A, (__v2di)__B);			return (__m128i)__builtin_elementwise_min((__v2du)__A, (__v2du)__B);
	}			}

	static __inline__ __m128i __DEFAULT_FN_ATTRS128			static __inline__ __m128i __DEFAULT_FN_ATTRS128
	_mm_mask_min_epu64 (__m128i __W, __mmask8 __M, __m128i __A, __m128i __B) {			_mm_mask_min_epu64 (__m128i __W, __mmask8 __M, __m128i __A, __m128i __B) {
	return (__m128i)__builtin_ia32_selectq_128((__mmask8)__M,			return (__m128i)__builtin_ia32_selectq_128((__mmask8)__M,
	(__v2di)_mm_min_epu64(__A, __B),			(__v2di)_mm_min_epu64(__A, __B),
	(__v2di)__W);			(__v2di)__W);
	}			}

	static __inline__ __m128i __DEFAULT_FN_ATTRS128			static __inline__ __m128i __DEFAULT_FN_ATTRS128
	_mm_maskz_min_epu64 (__mmask8 __M, __m128i __A, __m128i __B) {			_mm_maskz_min_epu64 (__mmask8 __M, __m128i __A, __m128i __B) {
	return (__m128i)__builtin_ia32_selectq_128((__mmask8)__M,			return (__m128i)__builtin_ia32_selectq_128((__mmask8)__M,
	(__v2di)_mm_min_epu64(__A, __B),			(__v2di)_mm_min_epu64(__A, __B),
	(__v2di)_mm_setzero_si128());			(__v2di)_mm_setzero_si128());
	}			}

	static __inline__ __m256i __DEFAULT_FN_ATTRS256			static __inline__ __m256i __DEFAULT_FN_ATTRS256
	_mm256_min_epu64 (__m256i __A, __m256i __B) {			_mm256_min_epu64 (__m256i __A, __m256i __B) {
	return (__m256i)__builtin_ia32_pminuq256((__v4di)__A, (__v4di)__B);			return (__m256i)__builtin_elementwise_min((__v4du)__A, (__v4du)__B);
	}			}

	static __inline__ __m256i __DEFAULT_FN_ATTRS256			static __inline__ __m256i __DEFAULT_FN_ATTRS256
	_mm256_mask_min_epu64 (__m256i __W, __mmask8 __M, __m256i __A, __m256i __B) {			_mm256_mask_min_epu64 (__m256i __W, __mmask8 __M, __m256i __A, __m256i __B) {
	return (__m256i)__builtin_ia32_selectq_256((__mmask8)__M,			return (__m256i)__builtin_ia32_selectq_256((__mmask8)__M,
	(__v4di)_mm256_min_epu64(__A, __B),			(__v4di)_mm256_min_epu64(__A, __B),
	(__v4di)__W);			(__v4di)__W);
	}			}
	▲ Show 20 Lines • Show All 5,163 Lines • Show Last 20 Lines

clang/lib/Headers/emmintrin.h

	Show First 20 Lines • Show All 2,369 Lines • ▼ Show 20 Lines
	/// A 128-bit signed [8 x i16] vector.			/// A 128-bit signed [8 x i16] vector.
	/// \param __b			/// \param __b
	/// A 128-bit signed [8 x i16] vector.			/// A 128-bit signed [8 x i16] vector.
	/// \returns A 128-bit signed [8 x i16] vector containing the greater value of			/// \returns A 128-bit signed [8 x i16] vector containing the greater value of
	/// each comparison.			/// each comparison.
	static __inline__ __m128i __DEFAULT_FN_ATTRS			static __inline__ __m128i __DEFAULT_FN_ATTRS
	_mm_max_epi16(__m128i __a, __m128i __b)			_mm_max_epi16(__m128i __a, __m128i __b)
	{			{
	return (__m128i)__builtin_ia32_pmaxsw128((__v8hi)__a, (__v8hi)__b);			return (__m128i)__builtin_elementwise_max((__v8hi)__a, (__v8hi)__b);
	}			}

	/// Compares corresponding elements of two 128-bit unsigned [16 x i8]			/// Compares corresponding elements of two 128-bit unsigned [16 x i8]
	/// vectors, saving the greater value from each comparison in the			/// vectors, saving the greater value from each comparison in the
	/// corresponding element of a 128-bit result vector of [16 x i8].			/// corresponding element of a 128-bit result vector of [16 x i8].
	///			///
	/// \headerfile <x86intrin.h>			/// \headerfile <x86intrin.h>
	///			///
	/// This intrinsic corresponds to the <c> VPMAXUB / PMAXUB </c> instruction.			/// This intrinsic corresponds to the <c> VPMAXUB / PMAXUB </c> instruction.
	///			///
	/// \param __a			/// \param __a
	/// A 128-bit unsigned [16 x i8] vector.			/// A 128-bit unsigned [16 x i8] vector.
	/// \param __b			/// \param __b
	/// A 128-bit unsigned [16 x i8] vector.			/// A 128-bit unsigned [16 x i8] vector.
	/// \returns A 128-bit unsigned [16 x i8] vector containing the greater value of			/// \returns A 128-bit unsigned [16 x i8] vector containing the greater value of
	/// each comparison.			/// each comparison.
	static __inline__ __m128i __DEFAULT_FN_ATTRS			static __inline__ __m128i __DEFAULT_FN_ATTRS
	_mm_max_epu8(__m128i __a, __m128i __b)			_mm_max_epu8(__m128i __a, __m128i __b)
	{			{
	return (__m128i)__builtin_ia32_pmaxub128((__v16qi)__a, (__v16qi)__b);			return (__m128i)__builtin_elementwise_max((__v16qu)__a, (__v16qu)__b);
	}			}

	/// Compares corresponding elements of two 128-bit signed [8 x i16]			/// Compares corresponding elements of two 128-bit signed [8 x i16]
	/// vectors, saving the smaller value from each comparison in the			/// vectors, saving the smaller value from each comparison in the
	/// corresponding element of a 128-bit result vector of [8 x i16].			/// corresponding element of a 128-bit result vector of [8 x i16].
	///			///
	/// \headerfile <x86intrin.h>			/// \headerfile <x86intrin.h>
	///			///
	/// This intrinsic corresponds to the <c> VPMINSW / PMINSW </c> instruction.			/// This intrinsic corresponds to the <c> VPMINSW / PMINSW </c> instruction.
	///			///
	/// \param __a			/// \param __a
	/// A 128-bit signed [8 x i16] vector.			/// A 128-bit signed [8 x i16] vector.
	/// \param __b			/// \param __b
	/// A 128-bit signed [8 x i16] vector.			/// A 128-bit signed [8 x i16] vector.
	/// \returns A 128-bit signed [8 x i16] vector containing the smaller value of			/// \returns A 128-bit signed [8 x i16] vector containing the smaller value of
	/// each comparison.			/// each comparison.
	static __inline__ __m128i __DEFAULT_FN_ATTRS			static __inline__ __m128i __DEFAULT_FN_ATTRS
	_mm_min_epi16(__m128i __a, __m128i __b)			_mm_min_epi16(__m128i __a, __m128i __b)
	{			{
	return (__m128i)__builtin_ia32_pminsw128((__v8hi)__a, (__v8hi)__b);			return (__m128i)__builtin_elementwise_min((__v8hi)__a, (__v8hi)__b);
	}			}

	/// Compares corresponding elements of two 128-bit unsigned [16 x i8]			/// Compares corresponding elements of two 128-bit unsigned [16 x i8]
	/// vectors, saving the smaller value from each comparison in the			/// vectors, saving the smaller value from each comparison in the
	/// corresponding element of a 128-bit result vector of [16 x i8].			/// corresponding element of a 128-bit result vector of [16 x i8].
	///			///
	/// \headerfile <x86intrin.h>			/// \headerfile <x86intrin.h>
	///			///
	/// This intrinsic corresponds to the <c> VPMINUB / PMINUB </c> instruction.			/// This intrinsic corresponds to the <c> VPMINUB / PMINUB </c> instruction.
	///			///
	/// \param __a			/// \param __a
	/// A 128-bit unsigned [16 x i8] vector.			/// A 128-bit unsigned [16 x i8] vector.
	/// \param __b			/// \param __b
	/// A 128-bit unsigned [16 x i8] vector.			/// A 128-bit unsigned [16 x i8] vector.
	/// \returns A 128-bit unsigned [16 x i8] vector containing the smaller value of			/// \returns A 128-bit unsigned [16 x i8] vector containing the smaller value of
	/// each comparison.			/// each comparison.
	static __inline__ __m128i __DEFAULT_FN_ATTRS			static __inline__ __m128i __DEFAULT_FN_ATTRS
	_mm_min_epu8(__m128i __a, __m128i __b)			_mm_min_epu8(__m128i __a, __m128i __b)
	{			{
	return (__m128i)__builtin_ia32_pminub128((__v16qi)__a, (__v16qi)__b);			return (__m128i)__builtin_elementwise_min((__v16qu)__a, (__v16qu)__b);
	}			}

	/// Multiplies the corresponding elements of two signed [8 x i16]			/// Multiplies the corresponding elements of two signed [8 x i16]
	/// vectors, saving the upper 16 bits of each 32-bit product in the			/// vectors, saving the upper 16 bits of each 32-bit product in the
	/// corresponding element of a 128-bit signed [8 x i16] result vector.			/// corresponding element of a 128-bit signed [8 x i16] result vector.
	///			///
	/// \headerfile <x86intrin.h>			/// \headerfile <x86intrin.h>
	///			///
	▲ Show 20 Lines • Show All 2,539 Lines • Show Last 20 Lines

clang/lib/Headers/smmintrin.h

	Show First 20 Lines • Show All 662 Lines • ▼ Show 20 Lines
	/// \param __V1			/// \param __V1
	/// A 128-bit vector of [16 x i8].			/// A 128-bit vector of [16 x i8].
	/// \param __V2			/// \param __V2
	/// A 128-bit vector of [16 x i8]			/// A 128-bit vector of [16 x i8]
	/// \returns A 128-bit vector of [16 x i8] containing the lesser values.			/// \returns A 128-bit vector of [16 x i8] containing the lesser values.
	static __inline__ __m128i __DEFAULT_FN_ATTRS			static __inline__ __m128i __DEFAULT_FN_ATTRS
	_mm_min_epi8 (__m128i __V1, __m128i __V2)			_mm_min_epi8 (__m128i __V1, __m128i __V2)
	{			{
	return (__m128i) __builtin_ia32_pminsb128 ((__v16qi) __V1, (__v16qi) __V2);			return (__m128i) __builtin_elementwise_min((__v16qs) __V1, (__v16qs) __V2);
				Lint: Pre-merge checks Inline Actions clang-format: please reformat the code - return (__m128i) __builtin_elementwise_min((__v16qs) __V1, (__v16qs) __V2); + return (__m128i)__builtin_elementwise_min((__v16qs)__V1, (__v16qs)__V2); Lint: Pre-merge checks: clang-format: please reformat the code ``` - return (__m128i) __builtin_elementwise_min…
	}			}

	/// Compares the corresponding elements of two 128-bit vectors of			/// Compares the corresponding elements of two 128-bit vectors of
	/// [16 x i8] and returns a 128-bit vector of [16 x i8] containing the			/// [16 x i8] and returns a 128-bit vector of [16 x i8] containing the
	/// greater value of the two.			/// greater value of the two.
	///			///
	/// \headerfile <x86intrin.h>			/// \headerfile <x86intrin.h>
	///			///
	/// This intrinsic corresponds to the <c> VPMAXSB / PMAXSB </c> instruction.			/// This intrinsic corresponds to the <c> VPMAXSB / PMAXSB </c> instruction.
	///			///
	/// \param __V1			/// \param __V1
	/// A 128-bit vector of [16 x i8].			/// A 128-bit vector of [16 x i8].
	/// \param __V2			/// \param __V2
	/// A 128-bit vector of [16 x i8].			/// A 128-bit vector of [16 x i8].
	/// \returns A 128-bit vector of [16 x i8] containing the greater values.			/// \returns A 128-bit vector of [16 x i8] containing the greater values.
	static __inline__ __m128i __DEFAULT_FN_ATTRS			static __inline__ __m128i __DEFAULT_FN_ATTRS
	_mm_max_epi8 (__m128i __V1, __m128i __V2)			_mm_max_epi8 (__m128i __V1, __m128i __V2)
	{			{
	return (__m128i) __builtin_ia32_pmaxsb128 ((__v16qi) __V1, (__v16qi) __V2);			return (__m128i) __builtin_elementwise_max((__v16qs) __V1, (__v16qs) __V2);
				Lint: Pre-merge checks Inline Actions clang-format: please reformat the code - return (__m128i) __builtin_elementwise_max((__v16qs) __V1, (__v16qs) __V2); + return (__m128i)__builtin_elementwise_max((__v16qs)__V1, (__v16qs)__V2); Lint: Pre-merge checks: clang-format: please reformat the code ``` - return (__m128i) __builtin_elementwise_max…
	}			}

	/// Compares the corresponding elements of two 128-bit vectors of			/// Compares the corresponding elements of two 128-bit vectors of
	/// [8 x u16] and returns a 128-bit vector of [8 x u16] containing the lesser			/// [8 x u16] and returns a 128-bit vector of [8 x u16] containing the lesser
	/// value of the two.			/// value of the two.
	///			///
	/// \headerfile <x86intrin.h>			/// \headerfile <x86intrin.h>
	///			///
	/// This intrinsic corresponds to the <c> VPMINUW / PMINUW </c> instruction.			/// This intrinsic corresponds to the <c> VPMINUW / PMINUW </c> instruction.
	///			///
	/// \param __V1			/// \param __V1
	/// A 128-bit vector of [8 x u16].			/// A 128-bit vector of [8 x u16].
	/// \param __V2			/// \param __V2
	/// A 128-bit vector of [8 x u16].			/// A 128-bit vector of [8 x u16].
	/// \returns A 128-bit vector of [8 x u16] containing the lesser values.			/// \returns A 128-bit vector of [8 x u16] containing the lesser values.
	static __inline__ __m128i __DEFAULT_FN_ATTRS			static __inline__ __m128i __DEFAULT_FN_ATTRS
	_mm_min_epu16 (__m128i __V1, __m128i __V2)			_mm_min_epu16 (__m128i __V1, __m128i __V2)
	{			{
	return (__m128i) __builtin_ia32_pminuw128 ((__v8hi) __V1, (__v8hi) __V2);			return (__m128i) __builtin_elementwise_min((__v8hu) __V1, (__v8hu) __V2);
				Lint: Pre-merge checks Inline Actions clang-format: please reformat the code - return (__m128i) __builtin_elementwise_min((__v8hu) __V1, (__v8hu) __V2); + return (__m128i)__builtin_elementwise_min((__v8hu)__V1, (__v8hu)__V2); Lint: Pre-merge checks: clang-format: please reformat the code ``` - return (__m128i) __builtin_elementwise_min…
	}			}

	/// Compares the corresponding elements of two 128-bit vectors of			/// Compares the corresponding elements of two 128-bit vectors of
	/// [8 x u16] and returns a 128-bit vector of [8 x u16] containing the			/// [8 x u16] and returns a 128-bit vector of [8 x u16] containing the
	/// greater value of the two.			/// greater value of the two.
	///			///
	/// \headerfile <x86intrin.h>			/// \headerfile <x86intrin.h>
	///			///
	/// This intrinsic corresponds to the <c> VPMAXUW / PMAXUW </c> instruction.			/// This intrinsic corresponds to the <c> VPMAXUW / PMAXUW </c> instruction.
	///			///
	/// \param __V1			/// \param __V1
	/// A 128-bit vector of [8 x u16].			/// A 128-bit vector of [8 x u16].
	/// \param __V2			/// \param __V2
	/// A 128-bit vector of [8 x u16].			/// A 128-bit vector of [8 x u16].
	/// \returns A 128-bit vector of [8 x u16] containing the greater values.			/// \returns A 128-bit vector of [8 x u16] containing the greater values.
	static __inline__ __m128i __DEFAULT_FN_ATTRS			static __inline__ __m128i __DEFAULT_FN_ATTRS
	_mm_max_epu16 (__m128i __V1, __m128i __V2)			_mm_max_epu16 (__m128i __V1, __m128i __V2)
	{			{
	return (__m128i) __builtin_ia32_pmaxuw128 ((__v8hi) __V1, (__v8hi) __V2);			return (__m128i) __builtin_elementwise_max((__v8hu) __V1, (__v8hu) __V2);
				Lint: Pre-merge checks Inline Actions clang-format: please reformat the code - return (__m128i) __builtin_elementwise_max((__v8hu) __V1, (__v8hu) __V2); + return (__m128i)__builtin_elementwise_max((__v8hu)__V1, (__v8hu)__V2); Lint: Pre-merge checks: clang-format: please reformat the code ``` - return (__m128i) __builtin_elementwise_max…
	}			}

	/// Compares the corresponding elements of two 128-bit vectors of			/// Compares the corresponding elements of two 128-bit vectors of
	/// [4 x i32] and returns a 128-bit vector of [4 x i32] containing the lesser			/// [4 x i32] and returns a 128-bit vector of [4 x i32] containing the lesser
	/// value of the two.			/// value of the two.
	///			///
	/// \headerfile <x86intrin.h>			/// \headerfile <x86intrin.h>
	///			///
	/// This intrinsic corresponds to the <c> VPMINSD / PMINSD </c> instruction.			/// This intrinsic corresponds to the <c> VPMINSD / PMINSD </c> instruction.
	///			///
	/// \param __V1			/// \param __V1
	/// A 128-bit vector of [4 x i32].			/// A 128-bit vector of [4 x i32].
	/// \param __V2			/// \param __V2
	/// A 128-bit vector of [4 x i32].			/// A 128-bit vector of [4 x i32].
	/// \returns A 128-bit vector of [4 x i32] containing the lesser values.			/// \returns A 128-bit vector of [4 x i32] containing the lesser values.
	static __inline__ __m128i __DEFAULT_FN_ATTRS			static __inline__ __m128i __DEFAULT_FN_ATTRS
	_mm_min_epi32 (__m128i __V1, __m128i __V2)			_mm_min_epi32 (__m128i __V1, __m128i __V2)
	{			{
	return (__m128i) __builtin_ia32_pminsd128 ((__v4si) __V1, (__v4si) __V2);			return (__m128i) __builtin_elementwise_min((__v4si) __V1, (__v4si) __V2);
				Lint: Pre-merge checks Inline Actions clang-format: please reformat the code - return (__m128i) __builtin_elementwise_min((__v4si) __V1, (__v4si) __V2); + return (__m128i)__builtin_elementwise_min((__v4si)__V1, (__v4si)__V2); Lint: Pre-merge checks: clang-format: please reformat the code ``` - return (__m128i) __builtin_elementwise_min…
	}			}

	/// Compares the corresponding elements of two 128-bit vectors of			/// Compares the corresponding elements of two 128-bit vectors of
	/// [4 x i32] and returns a 128-bit vector of [4 x i32] containing the			/// [4 x i32] and returns a 128-bit vector of [4 x i32] containing the
	/// greater value of the two.			/// greater value of the two.
	///			///
	/// \headerfile <x86intrin.h>			/// \headerfile <x86intrin.h>
	///			///
	/// This intrinsic corresponds to the <c> VPMAXSD / PMAXSD </c> instruction.			/// This intrinsic corresponds to the <c> VPMAXSD / PMAXSD </c> instruction.
	///			///
	/// \param __V1			/// \param __V1
	/// A 128-bit vector of [4 x i32].			/// A 128-bit vector of [4 x i32].
	/// \param __V2			/// \param __V2
	/// A 128-bit vector of [4 x i32].			/// A 128-bit vector of [4 x i32].
	/// \returns A 128-bit vector of [4 x i32] containing the greater values.			/// \returns A 128-bit vector of [4 x i32] containing the greater values.
	static __inline__ __m128i __DEFAULT_FN_ATTRS			static __inline__ __m128i __DEFAULT_FN_ATTRS
	_mm_max_epi32 (__m128i __V1, __m128i __V2)			_mm_max_epi32 (__m128i __V1, __m128i __V2)
	{			{
	return (__m128i) __builtin_ia32_pmaxsd128 ((__v4si) __V1, (__v4si) __V2);			return (__m128i) __builtin_elementwise_max((__v4si) __V1, (__v4si) __V2);
				Lint: Pre-merge checks Inline Actions clang-format: please reformat the code - return (__m128i) __builtin_elementwise_max((__v4si) __V1, (__v4si) __V2); + return (__m128i)__builtin_elementwise_max((__v4si)__V1, (__v4si)__V2); Lint: Pre-merge checks: clang-format: please reformat the code ``` - return (__m128i) __builtin_elementwise_max…
	}			}

	/// Compares the corresponding elements of two 128-bit vectors of			/// Compares the corresponding elements of two 128-bit vectors of
	/// [4 x u32] and returns a 128-bit vector of [4 x u32] containing the lesser			/// [4 x u32] and returns a 128-bit vector of [4 x u32] containing the lesser
	/// value of the two.			/// value of the two.
	///			///
	/// \headerfile <x86intrin.h>			/// \headerfile <x86intrin.h>
	///			///
	/// This intrinsic corresponds to the <c> VPMINUD / PMINUD </c> instruction.			/// This intrinsic corresponds to the <c> VPMINUD / PMINUD </c> instruction.
	///			///
	/// \param __V1			/// \param __V1
	/// A 128-bit vector of [4 x u32].			/// A 128-bit vector of [4 x u32].
	/// \param __V2			/// \param __V2
	/// A 128-bit vector of [4 x u32].			/// A 128-bit vector of [4 x u32].
	/// \returns A 128-bit vector of [4 x u32] containing the lesser values.			/// \returns A 128-bit vector of [4 x u32] containing the lesser values.
	static __inline__ __m128i __DEFAULT_FN_ATTRS			static __inline__ __m128i __DEFAULT_FN_ATTRS
	_mm_min_epu32 (__m128i __V1, __m128i __V2)			_mm_min_epu32 (__m128i __V1, __m128i __V2)
	{			{
	return (__m128i) __builtin_ia32_pminud128((__v4si) __V1, (__v4si) __V2);			return (__m128i) __builtin_elementwise_min((__v4su) __V1, (__v4su) __V2);
				Lint: Pre-merge checks Inline Actions clang-format: please reformat the code - return (__m128i) __builtin_elementwise_min((__v4su) __V1, (__v4su) __V2); + return (__m128i)__builtin_elementwise_min((__v4su)__V1, (__v4su)__V2); Lint: Pre-merge checks: clang-format: please reformat the code ``` - return (__m128i) __builtin_elementwise_min…
	}			}

	/// Compares the corresponding elements of two 128-bit vectors of			/// Compares the corresponding elements of two 128-bit vectors of
	/// [4 x u32] and returns a 128-bit vector of [4 x u32] containing the			/// [4 x u32] and returns a 128-bit vector of [4 x u32] containing the
	/// greater value of the two.			/// greater value of the two.
	///			///
	/// \headerfile <x86intrin.h>			/// \headerfile <x86intrin.h>
	///			///
	/// This intrinsic corresponds to the <c> VPMAXUD / PMAXUD </c> instruction.			/// This intrinsic corresponds to the <c> VPMAXUD / PMAXUD </c> instruction.
	///			///
	/// \param __V1			/// \param __V1
	/// A 128-bit vector of [4 x u32].			/// A 128-bit vector of [4 x u32].
	/// \param __V2			/// \param __V2
	/// A 128-bit vector of [4 x u32].			/// A 128-bit vector of [4 x u32].
	/// \returns A 128-bit vector of [4 x u32] containing the greater values.			/// \returns A 128-bit vector of [4 x u32] containing the greater values.
	static __inline__ __m128i __DEFAULT_FN_ATTRS			static __inline__ __m128i __DEFAULT_FN_ATTRS
	_mm_max_epu32 (__m128i __V1, __m128i __V2)			_mm_max_epu32 (__m128i __V1, __m128i __V2)
	{			{
	return (__m128i) __builtin_ia32_pmaxud128((__v4si) __V1, (__v4si) __V2);			return (__m128i) __builtin_elementwise_max((__v4su) __V1, (__v4su) __V2);
				Lint: Pre-merge checks Inline Actions clang-format: please reformat the code - return (__m128i) __builtin_elementwise_max((__v4su) __V1, (__v4su) __V2); + return (__m128i)__builtin_elementwise_max((__v4su)__V1, (__v4su)__V2); Lint: Pre-merge checks: clang-format: please reformat the code ``` - return (__m128i) __builtin_elementwise_max…
	}			}

	/* SSE4 Insertion and Extraction from XMM Register Instructions. */			/* SSE4 Insertion and Extraction from XMM Register Instructions. */
	/// Takes the first argument \a X and inserts an element from the second			/// Takes the first argument \a X and inserts an element from the second
	/// argument \a Y as selected by the third argument \a N. That result then			/// argument \a Y as selected by the third argument \a N. That result then
	/// has elements zeroed out also as selected by the third argument \a N. The			/// has elements zeroed out also as selected by the third argument \a N. The
	/// resulting 128-bit vector of [4 x float] is then returned.			/// resulting 128-bit vector of [4 x float] is then returned.
	///			///
	▲ Show 20 Lines • Show All 1,539 Lines • Show Last 20 Lines

clang/test/CodeGen/builtins-x86.c

Show First 20 Lines • Show All 215 Lines • ▼ Show 20 Lines	#endif
tmp_V8s = __builtin_ia32_paddsw128(tmp_V8s, tmp_V8s);		tmp_V8s = __builtin_ia32_paddsw128(tmp_V8s, tmp_V8s);
tmp_V16c = __builtin_ia32_psubsb128(tmp_V16c, tmp_V16c);		tmp_V16c = __builtin_ia32_psubsb128(tmp_V16c, tmp_V16c);
tmp_V8s = __builtin_ia32_psubsw128(tmp_V8s, tmp_V8s);		tmp_V8s = __builtin_ia32_psubsw128(tmp_V8s, tmp_V8s);
tmp_V16c = __builtin_ia32_paddusb128(tmp_V16c, tmp_V16c);		tmp_V16c = __builtin_ia32_paddusb128(tmp_V16c, tmp_V16c);
tmp_V8s = __builtin_ia32_paddusw128(tmp_V8s, tmp_V8s);		tmp_V8s = __builtin_ia32_paddusw128(tmp_V8s, tmp_V8s);
tmp_V16c = __builtin_ia32_psubusb128(tmp_V16c, tmp_V16c);		tmp_V16c = __builtin_ia32_psubusb128(tmp_V16c, tmp_V16c);
tmp_V8s = __builtin_ia32_psubusw128(tmp_V8s, tmp_V8s);		tmp_V8s = __builtin_ia32_psubusw128(tmp_V8s, tmp_V8s);
tmp_V8s = __builtin_ia32_pmulhw128(tmp_V8s, tmp_V8s);		tmp_V8s = __builtin_ia32_pmulhw128(tmp_V8s, tmp_V8s);
tmp_V16c = __builtin_ia32_pmaxub128(tmp_V16c, tmp_V16c);
tmp_V8s = __builtin_ia32_pmaxsw128(tmp_V8s, tmp_V8s);
tmp_V16c = __builtin_ia32_pminub128(tmp_V16c, tmp_V16c);
tmp_V8s = __builtin_ia32_pminsw128(tmp_V8s, tmp_V8s);
tmp_V16c = __builtin_ia32_packsswb128(tmp_V8s, tmp_V8s);		tmp_V16c = __builtin_ia32_packsswb128(tmp_V8s, tmp_V8s);
tmp_V8s = __builtin_ia32_packssdw128(tmp_V4i, tmp_V4i);		tmp_V8s = __builtin_ia32_packssdw128(tmp_V4i, tmp_V4i);
tmp_V16c = __builtin_ia32_packuswb128(tmp_V8s, tmp_V8s);		tmp_V16c = __builtin_ia32_packuswb128(tmp_V8s, tmp_V8s);
tmp_V8s = __builtin_ia32_pmulhuw128(tmp_V8s, tmp_V8s);		tmp_V8s = __builtin_ia32_pmulhuw128(tmp_V8s, tmp_V8s);
tmp_V4f = __builtin_ia32_addsubps(tmp_V4f, tmp_V4f);		tmp_V4f = __builtin_ia32_addsubps(tmp_V4f, tmp_V4f);
tmp_V2d = __builtin_ia32_addsubpd(tmp_V2d, tmp_V2d);		tmp_V2d = __builtin_ia32_addsubpd(tmp_V2d, tmp_V2d);
tmp_V4f = __builtin_ia32_haddps(tmp_V4f, tmp_V4f);		tmp_V4f = __builtin_ia32_haddps(tmp_V4f, tmp_V4f);
tmp_V2d = __builtin_ia32_haddpd(tmp_V2d, tmp_V2d);		tmp_V2d = __builtin_ia32_haddpd(tmp_V2d, tmp_V2d);
▲ Show 20 Lines • Show All 217 Lines • ▼ Show 20 Lines	#endif
tmp_V16c = __builtin_ia32_lddqu(tmp_cCp);		tmp_V16c = __builtin_ia32_lddqu(tmp_cCp);
tmp_V16c = __builtin_ia32_palignr128(tmp_V16c, tmp_V16c, imm_i);		tmp_V16c = __builtin_ia32_palignr128(tmp_V16c, tmp_V16c, imm_i);
tmp_V8c = __builtin_ia32_palignr(tmp_V8c, tmp_V8c, imm_i);		tmp_V8c = __builtin_ia32_palignr(tmp_V8c, tmp_V8c, imm_i);
#ifdef USE_SSE4		#ifdef USE_SSE4
tmp_V16c = __builtin_ia32_pblendvb128(tmp_V16c, tmp_V16c, tmp_V16c);		tmp_V16c = __builtin_ia32_pblendvb128(tmp_V16c, tmp_V16c, tmp_V16c);
tmp_V2d = __builtin_ia32_blendvpd(tmp_V2d, tmp_V2d, tmp_V2d);		tmp_V2d = __builtin_ia32_blendvpd(tmp_V2d, tmp_V2d, tmp_V2d);
tmp_V4f = __builtin_ia32_blendvps(tmp_V4f, tmp_V4f, tmp_V4f);		tmp_V4f = __builtin_ia32_blendvps(tmp_V4f, tmp_V4f, tmp_V4f);
tmp_V8s = __builtin_ia32_packusdw128(tmp_V4i, tmp_V4i);		tmp_V8s = __builtin_ia32_packusdw128(tmp_V4i, tmp_V4i);
tmp_V16c = __builtin_ia32_pmaxsb128(tmp_V16c, tmp_V16c);
tmp_V4i = __builtin_ia32_pmaxsd128(tmp_V4i, tmp_V4i);
tmp_V4i = __builtin_ia32_pmaxud128(tmp_V4i, tmp_V4i);
tmp_V8s = __builtin_ia32_pmaxuw128(tmp_V8s, tmp_V8s);
tmp_V16c = __builtin_ia32_pminsb128(tmp_V16c, tmp_V16c);
tmp_V4i = __builtin_ia32_pminsd128(tmp_V4i, tmp_V4i);
tmp_V4i = __builtin_ia32_pminud128(tmp_V4i, tmp_V4i);
tmp_V8s = __builtin_ia32_pminuw128(tmp_V8s, tmp_V8s);
tmp_V2LLi = __builtin_ia32_pmuldq128(tmp_V4i, tmp_V4i);		tmp_V2LLi = __builtin_ia32_pmuldq128(tmp_V4i, tmp_V4i);
tmp_V4f = __builtin_ia32_roundps(tmp_V4f, imm_i_0_16);		tmp_V4f = __builtin_ia32_roundps(tmp_V4f, imm_i_0_16);
tmp_V4f = __builtin_ia32_roundss(tmp_V4f, tmp_V4f, imm_i_0_16);		tmp_V4f = __builtin_ia32_roundss(tmp_V4f, tmp_V4f, imm_i_0_16);
tmp_V2d = __builtin_ia32_roundsd(tmp_V2d, tmp_V2d, imm_i_0_16);		tmp_V2d = __builtin_ia32_roundsd(tmp_V2d, tmp_V2d, imm_i_0_16);
tmp_V2d = __builtin_ia32_roundpd(tmp_V2d, imm_i_0_16);		tmp_V2d = __builtin_ia32_roundpd(tmp_V2d, imm_i_0_16);
tmp_V4f = __builtin_ia32_insertps128(tmp_V4f, tmp_V4f, imm_i_0_256);		tmp_V4f = __builtin_ia32_insertps128(tmp_V4f, tmp_V4f, imm_i_0_256);
#endif		#endif

▲ Show 20 Lines • Show All 98 Lines • Show Last 20 Lines

This is an archive of the discontinued LLVM Phabricator instance.

[X86] Remove __builtin_ia32_pmax/min intrinsics and use generic __builtin_elementwise_max/minClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 401661

clang/include/clang/Basic/BuiltinsX86.def

clang/lib/CodeGen/CGBuiltin.cpp

clang/lib/Headers/avx2intrin.h

clang/lib/Headers/avx512bwintrin.h

clang/lib/Headers/avx512fintrin.h

clang/lib/Headers/avx512vlintrin.h

clang/lib/Headers/emmintrin.h

clang/lib/Headers/smmintrin.h

clang/test/CodeGen/builtins-x86.c

[X86] Remove __builtin_ia32_pmax/min intrinsics and use generic __builtin_elementwise_max/min
ClosedPublic