This is an archive of the discontinued LLVM Phabricator instance.

Paths

Table of Contentst

-
include/clang/Basic/
-
clang/
-
Basic/
-
Attr.td
-
Builtins.h
-
Builtins.def
-
BuiltinsX86.def
-
BuiltinsX86_64.def
-
lib/
-
Basic/
1
Builtins.cpp
-
CodeGen/
-
CGBuiltin.cpp
-
CodeGenFunction.h
1
CodeGenFunction.cpp
-
Headers/
-
__wmmintrin_aes.h
-
ammintrin.h
1
avx2intrin.h
-
avx512bitalgintrin.h
-
avx512bwintrin.h
-
avx512cdintrin.h
-
avx512dqintrin.h
1
avx512fintrin.h
-
avx512ifmaintrin.h
-
avx512ifmavlintrin.h
-
avx512vbmi2intrin.h
-
avx512vbmiintrin.h
-
avx512vbmivlintrin.h
-
avx512vlbitalgintrin.h
-
avx512vlbwintrin.h
-
avx512vlcdintrin.h
-
avx512vldqintrin.h
-
avx512vlintrin.h
-
avx512vlvbmi2intrin.h
-
avx512vlvnniintrin.h
-
avx512vnniintrin.h
-
avx512vpopcntdqintrin.h
-
avx512vpopcntdqvlintrin.h
-
avxintrin.h
-
emmintrin.h
-
f16cintrin.h
-
fma4intrin.h
-
fmaintrin.h
-
gfniintrin.h
-
mm3dnow.h
-
mmintrin.h
-
pmmintrin.h
-
shaintrin.h
-
smmintrin.h
-
tmmintrin.h
-
vaesintrin.h
-
xmmintrin.h
-
xopintrin.h
-
Sema/
-
SemaDeclAttr.cpp
-
test/
-
CodeGen/
-
function-min-vector-width.c
-
x86-builtins-vector-width.c
-
Sema/
-
attr-min-vector-width.c

Differential D46711

[private] Add min_vector_width function attribute. Use it to annotate all of the x86 intrinsic header files. Emit a attribute in IR
AbandonedPublic

Authored by craig.topper on May 10 2018, 11:56 AM.

Download Raw Diff

Details

Reviewers

chandlerc
rsmith
rnk
echristo

Summary

I believe this is what we talked about on IRC. If you would prefer a different name for the attributes I'm happy to change it.

There are a bunch of intrinsics that are implemented as macros so there's no place to put the attribute other than user's code. But that would be a compatibility issue. Should use of a target specific builtin automatically imply the minimum vector width required by that builtin?

There are also a bunch of intrinsics that are implemented as macros using target independent builtins like builtin_shufflevector. For those intrinsics I have no way of expressing a vector width requirement unless we want to make builtin_shufflevector require the vector width of its arguments. Or we could make x86 specific builtins that generate the correct shuffles using custom code in CGBuiltin.cpp

How do we want to encode the required vector width for a builtin? Do we want to parse the type string for the builtins and infer for that? Or should we encode it in the attribute string for the builtin?

Diff Detail

Repository

rC Clang

Build Status

Buildable 19565
Build 19565: arc lint + arc unit

Event Timeline

craig.topper created this revision.May 10 2018, 11:56 AM

I suspect you want at least one of Reid or Richard to look at this from the Clang side, but this is definitely the direction I was thinking.

No strong opinions about the name of the attribute here.

lib/Headers/avx2intrin.h
32–33	Does it make sense to call this 256?

I'd really like to discuss this. I was speaking with Ori cc'd the other day
and he doesn't think vector width is sufficient for some of the various
slowdowns. I'll let him speak up, but we may need to rethink some of this.

In D46711#1105523, @echristo wrote:

I'd really like to discuss this. I was speaking with Ori cc'd the other day
and he doesn't think vector width is sufficient for some of the various
slowdowns. I'll let him speak up, but we may need to rethink some of this.

I don't have all the context, but since Eric is looping me in, I assume this change is in some way related to the work of adding a -mprefer-avx128 flag, or some other mechanism that would prevent LLVM's vectorizers from using power-hungry vector instructions that can hurt performance by forcing the CPU into a lower frequency band. If this is the intent, then Eric is correct: an instruction's register width is not a reliable proxy for its power requirements.

While it is true that none of the 128-bit AVX instructions are dangerous, neither are the majority of 256-bit AVX instructions.

My conclusions are based on analysis of each AVX and AVX2 instruction, in which I measured the maximum ratio of CPU cycles to reference cycles while the processor is executing the instruction in a tight loop. A higher ratio indicates more "extra" cycles delivered by TurboBoost. The ratio allows us to estimate how many extra cycles we are getting from TurboBoost. I found that only a subset of 256-bit instructions were associated with frequency reductions.

On Haswell, the instructions that cause frequency reductions include most (but not all) floating-point operations, as well as integer multiplication. On Broadwell, a few more floating-point operations become "safe". On Skylake I haven't observed loss of Turbo cycles with any 256-bit instructions except VMOV* (store).

https://docs.google.com/a/google.com/spreadsheets/d/e/2PACX-1vSqPiY9GZStOzH7yCgmHIqOzuazDrdDm0ORu127Eauu16IhHEqaQvwz243fBZN13IO0LN2b4fggJMMr/pubhtml?gid=1023319529&single=true

The smattering of publicly-available information on this topic agrees with my findings. The descriptions Intel provided for new Turbo license PMU events on Skylake X includes references to "high-current" and "low-current" AVX 256-bit codes. Something like "-mprefer-low-current-avx" seems like the right approach here, but the set of instructions it disables would have to vary somewhat by architecture if it is to be precise (i.e., not disable more instructions than necessary).

@atdt How can I access that document?

My main focus was on preventing 512 bit instructions on Skylake X. Do you have measurements for that?

@craig.topper, I don't have measurements for AVX-512, but the Intel-provided descriptions for CORE_POWER.LVL#_TURBO_LICENSE PMU events on SkylakeX implies that "low current AVX 512-bit instructions" execute with power-deliver license level 1, whereas "high-current" 512-bit instructions execute with license level 2. So it sounds like the low-current / high-current distinction applies to AVX-512 as well.

In D46711#1105520, @chandlerc wrote:

I suspect you want at least one of Reid or Richard to look at this from the Clang side, but this is definitely the direction I was thinking.

Sorry, I have no context for this, and the description of this review doesn't seem to provide any either. Can someone explain what this patch is about?

Sorry @rsmith, this patch was created only to go to Chandler for a preliminary review. I didn't expect it to get a wider audience.

My ultimate goal is stop the backend from generating 512 bit vector instructions on Skylake Server to avoid a frequency penalty unless the user passes -mprefer-vector-width=512 or the user explicitly uses one of the intrinsics that corresponds to a 512 bit instruction. If we don't see one of those things, the backend type legalizer will be told that 512 bit types are illegal and will split any IR with types wider than 256 bits. This allows the vectorizer to use wider types as it does already with AVX2 and rely on the type legalizer to make everything fit into a legal vector size. But if the user wrote code we need to allow that to be legalized to 512 bits.

To capture the use of 512 bit intrinsics, Chandler proposed on IRC that I add a new function attribute that we can tag all the intrinsics with that will be passed along to an IR attribute. This patch adds that attribute and annotates what intrinsics I could. I still had questions about the macro intrinsics which is why I created this review for Chandler.

@atdt and @echristo, the hypothetical -mprefer-low-current-avx[=<uarch>] would be certainly more precise, but that comes with a much higher design/implementation cost in the areas of TTI/vectorizer cost model, vector type legalizer, and CodeGen, at least.

-mprefer-vector-width=256 provides a common denominator of the more precise flag at a much lower implementation cost, readily available (subject to community review approval), easy for the programmers to understand, and serves much of the purposes for many programmers ---- while waiting for -mprefer-low-current-avx alternative becomes viable, if ever.

egarcia added a subscriber: egarcia.May 21 2018, 4:28 PM

In D46711#1107080, @hsaito wrote:

@atdt and @echristo, the hypothetical -mprefer-low-current-avx[=<uarch>] would be certainly more precise, but that comes with a much higher design/implementation cost in the areas of TTI/vectorizer cost model, vector type legalizer, and CodeGen, at least.

-mprefer-vector-width=256 provides a common denominator of the more precise flag at a much lower implementation cost, readily available (subject to community review approval), easy for the programmers to understand, and serves much of the purposes for many programmers ---- while waiting for -mprefer-low-current-avx alternative becomes viable, if ever.

Makes sense. I agree that -mprefer-vector-width=256 would be an improvement.

Tag every X86 vector builtin with a new attribute to indicate its required vector width. I thought about inferring it from the type string, but this makes it explicit and leaves out other targets.

If a builtin is used by a function we will now infer that the required vector width is at least as large as the builtin requires. This way existing user code won't have to change to adapt this vector width concept.

Rebase due to recent builtin and intrinsic changes

Rebase the builtins file again

Harbormaster completed remote builds in B19115: Diff 150583.Jun 8 2018, 3:56 PM

I think this looks really nice.

The only other big thing I think we should add is some docs. Because of the somewhat subtle semantics here, I think it'll be important to explain to people the programming model -- all the stuff you test for, that essentially the max of the builtin/intrinsic you use and the attribute you specify wins.

Honestly, we'll even want to discuss the inlining strategy here to make it really clear how this will work in practice.

I'm OK if you want that in a separate follow-up patch of course, I just want to make sure we get there.

lib/Basic/Builtins.cpp
111	To avoid confusion with the actual width returning, maybe WidthPos? or just Pos?
lib/CodeGen/CodeGenFunction.cpp
1195–1196	FWIW, I have no idea. I'd ask Eric or Richard.
lib/Headers/avx512fintrin.h
176–177	Want this to be suffixed with 512? No strong opinion here.

Rebase the builtins file again. Address Chandler's comments.

I intend to post a real review that CCs cfe-commits. This was originally intended to get initial feedback from Chandler before going to the full community.

Harbormaster completed remote builds in B19565: Diff 152229.Jun 21 2018, 12:11 AM

craig.topper abandoned this revision.Sep 10 2018, 7:35 PM

Revision Contents

Path

Size

include/

clang/

Basic/

7 lines

2 lines

1 line

3196 lines

40 lines

lib/

Basic/

Builtins.cpp

15 lines

CodeGen/

CGBuiltin.cpp

3 lines

CodeGenFunction.h

4 lines

CodeGenFunction.cpp

13 lines

Headers/

2 lines

2 lines

288 lines

2 lines

2 lines

2 lines

2 lines

1630 lines

2 lines

30 lines

2 lines

2 lines

46 lines

avx512vlbitalgintrin.h

38 lines

622 lines

62 lines

272 lines

1786 lines

avx512vlvbmi2intrin.h

134 lines

avx512vlvnniintrin.h

54 lines

avx512vnniintrin.h

2 lines

avx512vpopcntdqintrin.h

3 lines

avx512vpopcntdqvlintrin.h

37 lines

34 lines

8 lines

15 lines

70 lines

70 lines

20 lines

6 lines

4 lines

2 lines

2 lines

2 lines

4 lines

4 lines

4 lines

10 lines

Sema/

SemaDeclAttr.cpp

20 lines

test/

CodeGen/

function-min-vector-width.c

7 lines

x86-builtins-vector-width.c

32 lines

Sema/

attr-min-vector-width.c

8 lines

Diff 152229

include/clang/Basic/Attr.td

Show First 20 Lines • Show All 1,937 Lines • ▼ Show 20 Lines	continue;
else		else
Ret.Features.push_back("+" + Feature.str());		Ret.Features.push_back("+" + Feature.str());
}		}
return Ret;		return Ret;
}		}
}];		}];
}		}

		def MinVectorWidth : InheritableAttr {
		let Spellings = [Clang<"min_vector_width">];
		let Args = [UnsignedArgument<"VectorWidth">];
		let Subjects = SubjectList<[Function], ErrorDiag>;
		let Documentation = [Undocumented];
		}

def TransparentUnion : InheritableAttr {		def TransparentUnion : InheritableAttr {
let Spellings = [GCC<"transparent_union">];		let Spellings = [GCC<"transparent_union">];
// let Subjects = SubjectList<[Record, TypedefName]>;		// let Subjects = SubjectList<[Record, TypedefName]>;
let Documentation = [TransparentUnionDocs];		let Documentation = [TransparentUnionDocs];
let LangOpts = [COnly];		let LangOpts = [COnly];
}		}

def Unavailable : InheritableAttr {		def Unavailable : InheritableAttr {
▲ Show 20 Lines • Show All 948 Lines • Show Last 20 Lines

include/clang/Basic/Builtins.h

Show First 20 Lines • Show All 200 Lines • ▼ Show 20 Lines	public:
bool isConstWithoutErrno(unsigned ID) const {		bool isConstWithoutErrno(unsigned ID) const {
return strchr(getRecord(ID).Attributes, 'e') != nullptr;		return strchr(getRecord(ID).Attributes, 'e') != nullptr;
}		}

const char *getRequiredFeatures(unsigned ID) const {		const char *getRequiredFeatures(unsigned ID) const {
return getRecord(ID).Features;		return getRecord(ID).Features;
}		}

		unsigned getRequiredVectorWidth(unsigned ID) const;

/// Return true if builtin ID belongs to AuxTarget.		/// Return true if builtin ID belongs to AuxTarget.
bool isAuxBuiltinID(unsigned ID) const {		bool isAuxBuiltinID(unsigned ID) const {
return ID >= (Builtin::FirstTSBuiltin + TSRecords.size());		return ID >= (Builtin::FirstTSBuiltin + TSRecords.size());
}		}

/// Return real builtin ID (i.e. ID it would have during compilation		/// Return real builtin ID (i.e. ID it would have during compilation
/// for AuxTarget).		/// for AuxTarget).
unsigned getAuxBuiltinID(unsigned ID) const { return ID - TSRecords.size(); }		unsigned getAuxBuiltinID(unsigned ID) const { return ID - TSRecords.size(); }
Show All 34 Lines

include/clang/Basic/Builtins.def

	Show First 20 Lines • Show All 86 Lines • ▼ Show 20 Lines
	// s:N: -> this is a scanf-like function whose Nth argument is the format			// s:N: -> this is a scanf-like function whose Nth argument is the format
	// string.			// string.
	// S:N: -> similar to the s:N: attribute, but the function is like vscanf			// S:N: -> similar to the s:N: attribute, but the function is like vscanf
	// in that it accepts its arguments as a va_list rather than			// in that it accepts its arguments as a va_list rather than
	// through an ellipsis			// through an ellipsis
	// e -> const, but only when -fno-math-errno			// e -> const, but only when -fno-math-errno
	// j -> returns_twice (like setjmp)			// j -> returns_twice (like setjmp)
	// u -> arguments are not evaluated for their side-effects			// u -> arguments are not evaluated for their side-effects
				// V:N: -> requires vectors of at least N bits to be legal
	// FIXME: gcc has nonnull			// FIXME: gcc has nonnull

	#if defined(BUILTIN) && !defined(LIBBUILTIN)			#if defined(BUILTIN) && !defined(LIBBUILTIN)
	# define LIBBUILTIN(ID, TYPE, ATTRS, HEADER, BUILTIN_LANG) BUILTIN(ID, TYPE, ATTRS)			# define LIBBUILTIN(ID, TYPE, ATTRS, HEADER, BUILTIN_LANG) BUILTIN(ID, TYPE, ATTRS)
	#endif			#endif

	#if defined(BUILTIN) && !defined(LANGBUILTIN)			#if defined(BUILTIN) && !defined(LANGBUILTIN)
	# define LANGBUILTIN(ID, TYPE, ATTRS, BUILTIN_LANG) BUILTIN(ID, TYPE, ATTRS)			# define LANGBUILTIN(ID, TYPE, ATTRS, BUILTIN_LANG) BUILTIN(ID, TYPE, ATTRS)
	▲ Show 20 Lines • Show All 1,398 Lines • Show Last 20 Lines

include/clang/Basic/BuiltinsX86.def

	Show All 30 Lines
	// TODO: Make this somewhat generic so that other backends			// TODO: Make this somewhat generic so that other backends
	// can use it?			// can use it?
	BUILTIN(__builtin_cpu_init, "v", "n")			BUILTIN(__builtin_cpu_init, "v", "n")
	BUILTIN(__builtin_cpu_supports, "bcC*", "nc")			BUILTIN(__builtin_cpu_supports, "bcC*", "nc")
	BUILTIN(__builtin_cpu_is, "bcC*", "nc")			BUILTIN(__builtin_cpu_is, "bcC*", "nc")

	// Undefined Values			// Undefined Values
	//			//
	TARGET_BUILTIN(__builtin_ia32_undef128, "V2d", "nc", "")			TARGET_BUILTIN(__builtin_ia32_undef128, "V2d", "ncV:128:", "")
	TARGET_BUILTIN(__builtin_ia32_undef256, "V4d", "nc", "")			TARGET_BUILTIN(__builtin_ia32_undef256, "V4d", "ncV:256:", "")
	TARGET_BUILTIN(__builtin_ia32_undef512, "V8d", "nc", "")			TARGET_BUILTIN(__builtin_ia32_undef512, "V8d", "ncV:512:", "")

	// FLAGS			// FLAGS
	//			//
	TARGET_BUILTIN(__builtin_ia32_readeflags_u32, "Ui", "n", "")			TARGET_BUILTIN(__builtin_ia32_readeflags_u32, "Ui", "n", "")
	TARGET_BUILTIN(__builtin_ia32_writeeflags_u32, "vUi", "n", "")			TARGET_BUILTIN(__builtin_ia32_writeeflags_u32, "vUi", "n", "")

	// 3DNow!			// 3DNow!
	//			//
	TARGET_BUILTIN(__builtin_ia32_femms, "v", "n", "3dnow")			TARGET_BUILTIN(__builtin_ia32_femms, "v", "n", "3dnow")
	TARGET_BUILTIN(__builtin_ia32_pavgusb, "V8cV8cV8c", "nc", "3dnow")			TARGET_BUILTIN(__builtin_ia32_pavgusb, "V8cV8cV8c", "ncV:64:", "3dnow")
	TARGET_BUILTIN(__builtin_ia32_pf2id, "V2iV2f", "nc", "3dnow")			TARGET_BUILTIN(__builtin_ia32_pf2id, "V2iV2f", "ncV:64:", "3dnow")
	TARGET_BUILTIN(__builtin_ia32_pfacc, "V2fV2fV2f", "nc", "3dnow")			TARGET_BUILTIN(__builtin_ia32_pfacc, "V2fV2fV2f", "ncV:64:", "3dnow")
	TARGET_BUILTIN(__builtin_ia32_pfadd, "V2fV2fV2f", "nc", "3dnow")			TARGET_BUILTIN(__builtin_ia32_pfadd, "V2fV2fV2f", "ncV:64:", "3dnow")
	TARGET_BUILTIN(__builtin_ia32_pfcmpeq, "V2iV2fV2f", "nc", "3dnow")			TARGET_BUILTIN(__builtin_ia32_pfcmpeq, "V2iV2fV2f", "ncV:64:", "3dnow")
	TARGET_BUILTIN(__builtin_ia32_pfcmpge, "V2iV2fV2f", "nc", "3dnow")			TARGET_BUILTIN(__builtin_ia32_pfcmpge, "V2iV2fV2f", "ncV:64:", "3dnow")
	TARGET_BUILTIN(__builtin_ia32_pfcmpgt, "V2iV2fV2f", "nc", "3dnow")			TARGET_BUILTIN(__builtin_ia32_pfcmpgt, "V2iV2fV2f", "ncV:64:", "3dnow")
	TARGET_BUILTIN(__builtin_ia32_pfmax, "V2fV2fV2f", "nc", "3dnow")			TARGET_BUILTIN(__builtin_ia32_pfmax, "V2fV2fV2f", "ncV:64:", "3dnow")
	TARGET_BUILTIN(__builtin_ia32_pfmin, "V2fV2fV2f", "nc", "3dnow")			TARGET_BUILTIN(__builtin_ia32_pfmin, "V2fV2fV2f", "ncV:64:", "3dnow")
	TARGET_BUILTIN(__builtin_ia32_pfmul, "V2fV2fV2f", "nc", "3dnow")			TARGET_BUILTIN(__builtin_ia32_pfmul, "V2fV2fV2f", "ncV:64:", "3dnow")
	TARGET_BUILTIN(__builtin_ia32_pfrcp, "V2fV2f", "nc", "3dnow")			TARGET_BUILTIN(__builtin_ia32_pfrcp, "V2fV2f", "ncV:64:", "3dnow")
	TARGET_BUILTIN(__builtin_ia32_pfrcpit1, "V2fV2fV2f", "nc", "3dnow")			TARGET_BUILTIN(__builtin_ia32_pfrcpit1, "V2fV2fV2f", "ncV:64:", "3dnow")
	TARGET_BUILTIN(__builtin_ia32_pfrcpit2, "V2fV2fV2f", "nc", "3dnow")			TARGET_BUILTIN(__builtin_ia32_pfrcpit2, "V2fV2fV2f", "ncV:64:", "3dnow")
	TARGET_BUILTIN(__builtin_ia32_pfrsqrt, "V2fV2f", "nc", "3dnow")			TARGET_BUILTIN(__builtin_ia32_pfrsqrt, "V2fV2f", "ncV:64:", "3dnow")
	TARGET_BUILTIN(__builtin_ia32_pfrsqit1, "V2fV2fV2f", "nc", "3dnow")			TARGET_BUILTIN(__builtin_ia32_pfrsqit1, "V2fV2fV2f", "ncV:64:", "3dnow")
	TARGET_BUILTIN(__builtin_ia32_pfsub, "V2fV2fV2f", "nc", "3dnow")			TARGET_BUILTIN(__builtin_ia32_pfsub, "V2fV2fV2f", "ncV:64:", "3dnow")
	TARGET_BUILTIN(__builtin_ia32_pfsubr, "V2fV2fV2f", "nc", "3dnow")			TARGET_BUILTIN(__builtin_ia32_pfsubr, "V2fV2fV2f", "ncV:64:", "3dnow")
	TARGET_BUILTIN(__builtin_ia32_pi2fd, "V2fV2i", "nc", "3dnow")			TARGET_BUILTIN(__builtin_ia32_pi2fd, "V2fV2i", "ncV:64:", "3dnow")
	TARGET_BUILTIN(__builtin_ia32_pmulhrw, "V4sV4sV4s", "nc", "3dnow")			TARGET_BUILTIN(__builtin_ia32_pmulhrw, "V4sV4sV4s", "ncV:64:", "3dnow")
	// 3DNow! Extensions (3dnowa).			// 3DNow! Extensions (3dnowa).
	TARGET_BUILTIN(__builtin_ia32_pf2iw, "V2iV2f", "nc", "3dnowa")			TARGET_BUILTIN(__builtin_ia32_pf2iw, "V2iV2f", "ncV:64:", "3dnowa")
	TARGET_BUILTIN(__builtin_ia32_pfnacc, "V2fV2fV2f", "nc", "3dnowa")			TARGET_BUILTIN(__builtin_ia32_pfnacc, "V2fV2fV2f", "ncV:64:", "3dnowa")
	TARGET_BUILTIN(__builtin_ia32_pfpnacc, "V2fV2fV2f", "nc", "3dnowa")			TARGET_BUILTIN(__builtin_ia32_pfpnacc, "V2fV2fV2f", "ncV:64:", "3dnowa")
	TARGET_BUILTIN(__builtin_ia32_pi2fw, "V2fV2i", "nc", "3dnowa")			TARGET_BUILTIN(__builtin_ia32_pi2fw, "V2fV2i", "ncV:64:", "3dnowa")
	TARGET_BUILTIN(__builtin_ia32_pswapdsf, "V2fV2f", "nc", "3dnowa")			TARGET_BUILTIN(__builtin_ia32_pswapdsf, "V2fV2f", "ncV:64:", "3dnowa")
	TARGET_BUILTIN(__builtin_ia32_pswapdsi, "V2iV2i", "nc", "3dnowa")			TARGET_BUILTIN(__builtin_ia32_pswapdsi, "V2iV2i", "ncV:64:", "3dnowa")

	// MMX			// MMX
	//			//
	// All MMX instructions will be generated via builtins. Any MMX vector			// All MMX instructions will be generated via builtins. Any MMX vector
	// types (<1 x i64>, <2 x i32>, etc.) that aren't used by these builtins will be			// types (<1 x i64>, <2 x i32>, etc.) that aren't used by these builtins will be
	// expanded by the back-end.			// expanded by the back-end.
	// FIXME: _mm_prefetch must be a built-in because it takes a compile-time constant			// FIXME: _mm_prefetch must be a built-in because it takes a compile-time constant
	// argument and our prior approach of using a #define to the current built-in			// argument and our prior approach of using a #define to the current built-in
	// doesn't work in the presence of re-declaration of _mm_prefetch for windows.			// doesn't work in the presence of re-declaration of _mm_prefetch for windows.
	TARGET_BUILTIN(_mm_prefetch, "vcC*i", "nc", "mmx")			TARGET_BUILTIN(_mm_prefetch, "vcC*i", "nc", "mmx")
	TARGET_BUILTIN(__builtin_ia32_emms, "v", "n", "mmx")			TARGET_BUILTIN(__builtin_ia32_emms, "v", "n", "mmx")
	TARGET_BUILTIN(__builtin_ia32_paddb, "V8cV8cV8c", "nc", "mmx")			TARGET_BUILTIN(__builtin_ia32_paddb, "V8cV8cV8c", "ncV:64:", "mmx")
	TARGET_BUILTIN(__builtin_ia32_paddw, "V4sV4sV4s", "nc", "mmx")			TARGET_BUILTIN(__builtin_ia32_paddw, "V4sV4sV4s", "ncV:64:", "mmx")
	TARGET_BUILTIN(__builtin_ia32_paddd, "V2iV2iV2i", "nc", "mmx")			TARGET_BUILTIN(__builtin_ia32_paddd, "V2iV2iV2i", "ncV:64:", "mmx")
	TARGET_BUILTIN(__builtin_ia32_paddsb, "V8cV8cV8c", "nc", "mmx")			TARGET_BUILTIN(__builtin_ia32_paddsb, "V8cV8cV8c", "ncV:64:", "mmx")
	TARGET_BUILTIN(__builtin_ia32_paddsw, "V4sV4sV4s", "nc", "mmx")			TARGET_BUILTIN(__builtin_ia32_paddsw, "V4sV4sV4s", "ncV:64:", "mmx")
	TARGET_BUILTIN(__builtin_ia32_paddusb, "V8cV8cV8c", "nc", "mmx")			TARGET_BUILTIN(__builtin_ia32_paddusb, "V8cV8cV8c", "ncV:64:", "mmx")
	TARGET_BUILTIN(__builtin_ia32_paddusw, "V4sV4sV4s", "nc", "mmx")			TARGET_BUILTIN(__builtin_ia32_paddusw, "V4sV4sV4s", "ncV:64:", "mmx")
	TARGET_BUILTIN(__builtin_ia32_psubb, "V8cV8cV8c", "nc", "mmx")			TARGET_BUILTIN(__builtin_ia32_psubb, "V8cV8cV8c", "ncV:64:", "mmx")
	TARGET_BUILTIN(__builtin_ia32_psubw, "V4sV4sV4s", "nc", "mmx")			TARGET_BUILTIN(__builtin_ia32_psubw, "V4sV4sV4s", "ncV:64:", "mmx")
	TARGET_BUILTIN(__builtin_ia32_psubd, "V2iV2iV2i", "nc", "mmx")			TARGET_BUILTIN(__builtin_ia32_psubd, "V2iV2iV2i", "ncV:64:", "mmx")
	TARGET_BUILTIN(__builtin_ia32_psubsb, "V8cV8cV8c", "nc", "mmx")			TARGET_BUILTIN(__builtin_ia32_psubsb, "V8cV8cV8c", "ncV:64:", "mmx")
	TARGET_BUILTIN(__builtin_ia32_psubsw, "V4sV4sV4s", "nc", "mmx")			TARGET_BUILTIN(__builtin_ia32_psubsw, "V4sV4sV4s", "ncV:64:", "mmx")
	TARGET_BUILTIN(__builtin_ia32_psubusb, "V8cV8cV8c", "nc", "mmx")			TARGET_BUILTIN(__builtin_ia32_psubusb, "V8cV8cV8c", "ncV:64:", "mmx")
	TARGET_BUILTIN(__builtin_ia32_psubusw, "V4sV4sV4s", "nc", "mmx")			TARGET_BUILTIN(__builtin_ia32_psubusw, "V4sV4sV4s", "ncV:64:", "mmx")
	TARGET_BUILTIN(__builtin_ia32_pmulhw, "V4sV4sV4s", "nc", "mmx")			TARGET_BUILTIN(__builtin_ia32_pmulhw, "V4sV4sV4s", "ncV:64:", "mmx")
	TARGET_BUILTIN(__builtin_ia32_pmullw, "V4sV4sV4s", "nc", "mmx")			TARGET_BUILTIN(__builtin_ia32_pmullw, "V4sV4sV4s", "ncV:64:", "mmx")
	TARGET_BUILTIN(__builtin_ia32_pmaddwd, "V2iV4sV4s", "nc", "mmx")			TARGET_BUILTIN(__builtin_ia32_pmaddwd, "V2iV4sV4s", "ncV:64:", "mmx")
	TARGET_BUILTIN(__builtin_ia32_pand, "V1LLiV1LLiV1LLi", "nc", "mmx")			TARGET_BUILTIN(__builtin_ia32_pand, "V1LLiV1LLiV1LLi", "ncV:64:", "mmx")
	TARGET_BUILTIN(__builtin_ia32_pandn, "V1LLiV1LLiV1LLi", "nc", "mmx")			TARGET_BUILTIN(__builtin_ia32_pandn, "V1LLiV1LLiV1LLi", "ncV:64:", "mmx")
	TARGET_BUILTIN(__builtin_ia32_por, "V1LLiV1LLiV1LLi", "nc", "mmx")			TARGET_BUILTIN(__builtin_ia32_por, "V1LLiV1LLiV1LLi", "ncV:64:", "mmx")
	TARGET_BUILTIN(__builtin_ia32_pxor, "V1LLiV1LLiV1LLi", "nc", "mmx")			TARGET_BUILTIN(__builtin_ia32_pxor, "V1LLiV1LLiV1LLi", "ncV:64:", "mmx")
	TARGET_BUILTIN(__builtin_ia32_psllw, "V4sV4sV1LLi", "nc", "mmx")			TARGET_BUILTIN(__builtin_ia32_psllw, "V4sV4sV1LLi", "ncV:64:", "mmx")
	TARGET_BUILTIN(__builtin_ia32_pslld, "V2iV2iV1LLi", "nc", "mmx")			TARGET_BUILTIN(__builtin_ia32_pslld, "V2iV2iV1LLi", "ncV:64:", "mmx")
	TARGET_BUILTIN(__builtin_ia32_psllq, "V1LLiV1LLiV1LLi", "nc", "mmx")			TARGET_BUILTIN(__builtin_ia32_psllq, "V1LLiV1LLiV1LLi", "ncV:64:", "mmx")
	TARGET_BUILTIN(__builtin_ia32_psrlw, "V4sV4sV1LLi", "nc", "mmx")			TARGET_BUILTIN(__builtin_ia32_psrlw, "V4sV4sV1LLi", "ncV:64:", "mmx")
	TARGET_BUILTIN(__builtin_ia32_psrld, "V2iV2iV1LLi", "nc", "mmx")			TARGET_BUILTIN(__builtin_ia32_psrld, "V2iV2iV1LLi", "ncV:64:", "mmx")
	TARGET_BUILTIN(__builtin_ia32_psrlq, "V1LLiV1LLiV1LLi", "nc", "mmx")			TARGET_BUILTIN(__builtin_ia32_psrlq, "V1LLiV1LLiV1LLi", "ncV:64:", "mmx")
	TARGET_BUILTIN(__builtin_ia32_psraw, "V4sV4sV1LLi", "nc", "mmx")			TARGET_BUILTIN(__builtin_ia32_psraw, "V4sV4sV1LLi", "ncV:64:", "mmx")
	TARGET_BUILTIN(__builtin_ia32_psrad, "V2iV2iV1LLi", "nc", "mmx")			TARGET_BUILTIN(__builtin_ia32_psrad, "V2iV2iV1LLi", "ncV:64:", "mmx")
	TARGET_BUILTIN(__builtin_ia32_psllwi, "V4sV4si", "nc", "mmx")			TARGET_BUILTIN(__builtin_ia32_psllwi, "V4sV4si", "ncV:64:", "mmx")
	TARGET_BUILTIN(__builtin_ia32_pslldi, "V2iV2ii", "nc", "mmx")			TARGET_BUILTIN(__builtin_ia32_pslldi, "V2iV2ii", "ncV:64:", "mmx")
	TARGET_BUILTIN(__builtin_ia32_psllqi, "V1LLiV1LLii", "nc", "mmx")			TARGET_BUILTIN(__builtin_ia32_psllqi, "V1LLiV1LLii", "ncV:64:", "mmx")
	TARGET_BUILTIN(__builtin_ia32_psrlwi, "V4sV4si", "nc", "mmx")			TARGET_BUILTIN(__builtin_ia32_psrlwi, "V4sV4si", "ncV:64:", "mmx")
	TARGET_BUILTIN(__builtin_ia32_psrldi, "V2iV2ii", "nc", "mmx")			TARGET_BUILTIN(__builtin_ia32_psrldi, "V2iV2ii", "ncV:64:", "mmx")
	TARGET_BUILTIN(__builtin_ia32_psrlqi, "V1LLiV1LLii", "nc", "mmx")			TARGET_BUILTIN(__builtin_ia32_psrlqi, "V1LLiV1LLii", "ncV:64:", "mmx")
	TARGET_BUILTIN(__builtin_ia32_psrawi, "V4sV4si", "nc", "mmx")			TARGET_BUILTIN(__builtin_ia32_psrawi, "V4sV4si", "ncV:64:", "mmx")
	TARGET_BUILTIN(__builtin_ia32_psradi, "V2iV2ii", "nc", "mmx")			TARGET_BUILTIN(__builtin_ia32_psradi, "V2iV2ii", "ncV:64:", "mmx")
	TARGET_BUILTIN(__builtin_ia32_packsswb, "V8cV4sV4s", "nc", "mmx")			TARGET_BUILTIN(__builtin_ia32_packsswb, "V8cV4sV4s", "ncV:64:", "mmx")
	TARGET_BUILTIN(__builtin_ia32_packssdw, "V4sV2iV2i", "nc", "mmx")			TARGET_BUILTIN(__builtin_ia32_packssdw, "V4sV2iV2i", "ncV:64:", "mmx")
	TARGET_BUILTIN(__builtin_ia32_packuswb, "V8cV4sV4s", "nc", "mmx")			TARGET_BUILTIN(__builtin_ia32_packuswb, "V8cV4sV4s", "ncV:64:", "mmx")
	TARGET_BUILTIN(__builtin_ia32_punpckhbw, "V8cV8cV8c", "nc", "mmx")			TARGET_BUILTIN(__builtin_ia32_punpckhbw, "V8cV8cV8c", "ncV:64:", "mmx")
	TARGET_BUILTIN(__builtin_ia32_punpckhwd, "V4sV4sV4s", "nc", "mmx")			TARGET_BUILTIN(__builtin_ia32_punpckhwd, "V4sV4sV4s", "ncV:64:", "mmx")
	TARGET_BUILTIN(__builtin_ia32_punpckhdq, "V2iV2iV2i", "nc", "mmx")			TARGET_BUILTIN(__builtin_ia32_punpckhdq, "V2iV2iV2i", "ncV:64:", "mmx")
	TARGET_BUILTIN(__builtin_ia32_punpcklbw, "V8cV8cV8c", "nc", "mmx")			TARGET_BUILTIN(__builtin_ia32_punpcklbw, "V8cV8cV8c", "ncV:64:", "mmx")
	TARGET_BUILTIN(__builtin_ia32_punpcklwd, "V4sV4sV4s", "nc", "mmx")			TARGET_BUILTIN(__builtin_ia32_punpcklwd, "V4sV4sV4s", "ncV:64:", "mmx")
	TARGET_BUILTIN(__builtin_ia32_punpckldq, "V2iV2iV2i", "nc", "mmx")			TARGET_BUILTIN(__builtin_ia32_punpckldq, "V2iV2iV2i", "ncV:64:", "mmx")
	TARGET_BUILTIN(__builtin_ia32_pcmpeqb, "V8cV8cV8c", "nc", "mmx")			TARGET_BUILTIN(__builtin_ia32_pcmpeqb, "V8cV8cV8c", "ncV:64:", "mmx")
	TARGET_BUILTIN(__builtin_ia32_pcmpeqw, "V4sV4sV4s", "nc", "mmx")			TARGET_BUILTIN(__builtin_ia32_pcmpeqw, "V4sV4sV4s", "ncV:64:", "mmx")
	TARGET_BUILTIN(__builtin_ia32_pcmpeqd, "V2iV2iV2i", "nc", "mmx")			TARGET_BUILTIN(__builtin_ia32_pcmpeqd, "V2iV2iV2i", "ncV:64:", "mmx")
	TARGET_BUILTIN(__builtin_ia32_pcmpgtb, "V8cV8cV8c", "nc", "mmx")			TARGET_BUILTIN(__builtin_ia32_pcmpgtb, "V8cV8cV8c", "ncV:64:", "mmx")
	TARGET_BUILTIN(__builtin_ia32_pcmpgtw, "V4sV4sV4s", "nc", "mmx")			TARGET_BUILTIN(__builtin_ia32_pcmpgtw, "V4sV4sV4s", "ncV:64:", "mmx")
	TARGET_BUILTIN(__builtin_ia32_pcmpgtd, "V2iV2iV2i", "nc", "mmx")			TARGET_BUILTIN(__builtin_ia32_pcmpgtd, "V2iV2iV2i", "ncV:64:", "mmx")
	TARGET_BUILTIN(__builtin_ia32_maskmovq, "vV8cV8cc*", "n", "mmx")			TARGET_BUILTIN(__builtin_ia32_maskmovq, "vV8cV8cc*", "nV:64:", "mmx")
	TARGET_BUILTIN(__builtin_ia32_movntq, "vV1LLi*V1LLi", "n", "mmx")			TARGET_BUILTIN(__builtin_ia32_movntq, "vV1LLi*V1LLi", "nV:64:", "mmx")
	TARGET_BUILTIN(__builtin_ia32_vec_init_v2si, "V2iii", "nc", "mmx")			TARGET_BUILTIN(__builtin_ia32_vec_init_v2si, "V2iii", "ncV:64:", "mmx")
	TARGET_BUILTIN(__builtin_ia32_vec_init_v4hi, "V4sssss", "nc", "mmx")			TARGET_BUILTIN(__builtin_ia32_vec_init_v4hi, "V4sssss", "ncV:64:", "mmx")
	TARGET_BUILTIN(__builtin_ia32_vec_init_v8qi, "V8ccccccccc", "nc", "mmx")			TARGET_BUILTIN(__builtin_ia32_vec_init_v8qi, "V8ccccccccc", "ncV:64:", "mmx")
	TARGET_BUILTIN(__builtin_ia32_vec_ext_v2si, "iV2iIi", "nc", "mmx")			TARGET_BUILTIN(__builtin_ia32_vec_ext_v2si, "iV2ii", "ncV:64:", "mmx")

	// MMX2 (MMX+SSE) intrinsics			// MMX2 (MMX+SSE) intrinsics
	TARGET_BUILTIN(__builtin_ia32_cvtpi2ps, "V4fV4fV2i", "nc", "mmx,sse")			TARGET_BUILTIN(__builtin_ia32_cvtpi2ps, "V4fV4fV2i", "ncV:64:", "mmx,sse")
	TARGET_BUILTIN(__builtin_ia32_cvtps2pi, "V2iV4f", "nc", "mmx,sse")			TARGET_BUILTIN(__builtin_ia32_cvtps2pi, "V2iV4f", "ncV:64:", "mmx,sse")
	TARGET_BUILTIN(__builtin_ia32_cvttps2pi, "V2iV4f", "nc", "mmx,sse")			TARGET_BUILTIN(__builtin_ia32_cvttps2pi, "V2iV4f", "ncV:64:", "mmx,sse")
	TARGET_BUILTIN(__builtin_ia32_pavgb, "V8cV8cV8c", "nc", "mmx,sse")			TARGET_BUILTIN(__builtin_ia32_pavgb, "V8cV8cV8c", "ncV:64:", "mmx,sse")
	TARGET_BUILTIN(__builtin_ia32_pavgw, "V4sV4sV4s", "nc", "mmx,sse")			TARGET_BUILTIN(__builtin_ia32_pavgw, "V4sV4sV4s", "ncV:64:", "mmx,sse")
	TARGET_BUILTIN(__builtin_ia32_pmaxsw, "V4sV4sV4s", "nc", "mmx,sse")			TARGET_BUILTIN(__builtin_ia32_pmaxsw, "V4sV4sV4s", "ncV:64:", "mmx,sse")
	TARGET_BUILTIN(__builtin_ia32_pmaxub, "V8cV8cV8c", "nc", "mmx,sse")			TARGET_BUILTIN(__builtin_ia32_pmaxub, "V8cV8cV8c", "ncV:64:", "mmx,sse")
	TARGET_BUILTIN(__builtin_ia32_pminsw, "V4sV4sV4s", "nc", "mmx,sse")			TARGET_BUILTIN(__builtin_ia32_pminsw, "V4sV4sV4s", "ncV:64:", "mmx,sse")
	TARGET_BUILTIN(__builtin_ia32_pminub, "V8cV8cV8c", "nc", "mmx,sse")			TARGET_BUILTIN(__builtin_ia32_pminub, "V8cV8cV8c", "ncV:64:", "mmx,sse")
	TARGET_BUILTIN(__builtin_ia32_pmovmskb, "iV8c", "nc", "mmx,sse")			TARGET_BUILTIN(__builtin_ia32_pmovmskb, "iV8c", "ncV:64:", "mmx,sse")
	TARGET_BUILTIN(__builtin_ia32_pmulhuw, "V4sV4sV4s", "nc", "mmx,sse")			TARGET_BUILTIN(__builtin_ia32_pmulhuw, "V4sV4sV4s", "ncV:64:", "mmx,sse")
	TARGET_BUILTIN(__builtin_ia32_psadbw, "V4sV8cV8c", "nc", "mmx,sse")			TARGET_BUILTIN(__builtin_ia32_psadbw, "V4sV8cV8c", "ncV:64:", "mmx,sse")
	TARGET_BUILTIN(__builtin_ia32_pshufw, "V4sV4sIc", "nc", "mmx,sse")			TARGET_BUILTIN(__builtin_ia32_pshufw, "V4sV4sIc", "ncV:64:", "mmx,sse")
	TARGET_BUILTIN(__builtin_ia32_vec_ext_v4hi, "iV4sIi", "nc", "mmx,sse")			TARGET_BUILTIN(__builtin_ia32_vec_ext_v4hi, "iV4sIi", "ncV:64:", "mmx,sse")
	TARGET_BUILTIN(__builtin_ia32_vec_set_v4hi, "V4sV4siIi", "nc", "mmx,sse")			TARGET_BUILTIN(__builtin_ia32_vec_set_v4hi, "V4sV4siIi", "ncV:64:", "mmx,sse")

	// MMX+SSE2			// MMX+SSE2
	TARGET_BUILTIN(__builtin_ia32_cvtpd2pi, "V2iV2d", "nc", "mmx,sse2")			TARGET_BUILTIN(__builtin_ia32_cvtpd2pi, "V2iV2d", "ncV:64:", "mmx,sse2")
	TARGET_BUILTIN(__builtin_ia32_cvtpi2pd, "V2dV2i", "nc", "mmx,sse2")			TARGET_BUILTIN(__builtin_ia32_cvtpi2pd, "V2dV2i", "ncV:64:", "mmx,sse2")
	TARGET_BUILTIN(__builtin_ia32_cvttpd2pi, "V2iV2d", "nc", "mmx,sse2")			TARGET_BUILTIN(__builtin_ia32_cvttpd2pi, "V2iV2d", "ncV:64:", "mmx,sse2")
	TARGET_BUILTIN(__builtin_ia32_paddq, "V1LLiV1LLiV1LLi", "nc", "mmx,sse2")			TARGET_BUILTIN(__builtin_ia32_paddq, "V1LLiV1LLiV1LLi", "ncV:64:", "mmx,sse2")
	TARGET_BUILTIN(__builtin_ia32_pmuludq, "V1LLiV2iV2i", "nc", "mmx,sse2")			TARGET_BUILTIN(__builtin_ia32_pmuludq, "V1LLiV2iV2i", "ncV:64:", "mmx,sse2")
	TARGET_BUILTIN(__builtin_ia32_psubq, "V1LLiV1LLiV1LLi", "nc", "mmx,sse2")			TARGET_BUILTIN(__builtin_ia32_psubq, "V1LLiV1LLiV1LLi", "ncV:64:", "mmx,sse2")

	// MMX+SSSE3			// MMX+SSSE3
	TARGET_BUILTIN(__builtin_ia32_pabsb, "V8cV8c", "nc", "mmx,ssse3")			TARGET_BUILTIN(__builtin_ia32_pabsb, "V8cV8c", "ncV:64:", "mmx,ssse3")
	TARGET_BUILTIN(__builtin_ia32_pabsd, "V2iV2i", "nc", "mmx,ssse3")			TARGET_BUILTIN(__builtin_ia32_pabsd, "V2iV2i", "ncV:64:", "mmx,ssse3")
	TARGET_BUILTIN(__builtin_ia32_pabsw, "V4sV4s", "nc", "mmx,ssse3")			TARGET_BUILTIN(__builtin_ia32_pabsw, "V4sV4s", "ncV:64:", "mmx,ssse3")
	TARGET_BUILTIN(__builtin_ia32_palignr, "V8cV8cV8cIc", "nc", "mmx,ssse3")			TARGET_BUILTIN(__builtin_ia32_palignr, "V8cV8cV8cIc", "ncV:64:", "mmx,ssse3")
	TARGET_BUILTIN(__builtin_ia32_phaddd, "V2iV2iV2i", "nc", "mmx,ssse3")			TARGET_BUILTIN(__builtin_ia32_phaddd, "V2iV2iV2i", "ncV:64:", "mmx,ssse3")
	TARGET_BUILTIN(__builtin_ia32_phaddsw, "V4sV4sV4s", "nc", "mmx,ssse3")			TARGET_BUILTIN(__builtin_ia32_phaddsw, "V4sV4sV4s", "ncV:64:", "mmx,ssse3")
	TARGET_BUILTIN(__builtin_ia32_phaddw, "V4sV4sV4s", "nc", "mmx,ssse3")			TARGET_BUILTIN(__builtin_ia32_phaddw, "V4sV4sV4s", "ncV:64:", "mmx,ssse3")
	TARGET_BUILTIN(__builtin_ia32_phsubd, "V2iV2iV2i", "nc", "mmx,ssse3")			TARGET_BUILTIN(__builtin_ia32_phsubd, "V2iV2iV2i", "ncV:64:", "mmx,ssse3")
	TARGET_BUILTIN(__builtin_ia32_phsubsw, "V4sV4sV4s", "nc", "mmx,ssse3")			TARGET_BUILTIN(__builtin_ia32_phsubsw, "V4sV4sV4s", "ncV:64:", "mmx,ssse3")
	TARGET_BUILTIN(__builtin_ia32_phsubw, "V4sV4sV4s", "nc", "mmx,ssse3")			TARGET_BUILTIN(__builtin_ia32_phsubw, "V4sV4sV4s", "ncV:64:", "mmx,ssse3")
	TARGET_BUILTIN(__builtin_ia32_pmaddubsw, "V8cV8cV8c", "nc", "mmx,ssse3")			TARGET_BUILTIN(__builtin_ia32_pmaddubsw, "V8cV8cV8c", "ncV:64:", "mmx,ssse3")
	TARGET_BUILTIN(__builtin_ia32_pmulhrsw, "V4sV4sV4s", "nc", "mmx,ssse3")			TARGET_BUILTIN(__builtin_ia32_pmulhrsw, "V4sV4sV4s", "ncV:64:", "mmx,ssse3")
	TARGET_BUILTIN(__builtin_ia32_pshufb, "V8cV8cV8c", "nc", "mmx,ssse3")			TARGET_BUILTIN(__builtin_ia32_pshufb, "V8cV8cV8c", "ncV:64:", "mmx,ssse3")
	TARGET_BUILTIN(__builtin_ia32_psignw, "V4sV4sV4s", "nc", "mmx,ssse3")			TARGET_BUILTIN(__builtin_ia32_psignw, "V4sV4sV4s", "ncV:64:", "mmx,ssse3")
	TARGET_BUILTIN(__builtin_ia32_psignb, "V8cV8cV8c", "nc", "mmx,ssse3")			TARGET_BUILTIN(__builtin_ia32_psignb, "V8cV8cV8c", "ncV:64:", "mmx,ssse3")
	TARGET_BUILTIN(__builtin_ia32_psignd, "V2iV2iV2i", "nc", "mmx,ssse3")			TARGET_BUILTIN(__builtin_ia32_psignd, "V2iV2iV2i", "ncV:64:", "mmx,ssse3")

	// SSE intrinsics.			// SSE intrinsics.
	TARGET_BUILTIN(__builtin_ia32_comieq, "iV4fV4f", "nc", "sse")			TARGET_BUILTIN(__builtin_ia32_comieq, "iV4fV4f", "ncV:128:", "sse")
	TARGET_BUILTIN(__builtin_ia32_comilt, "iV4fV4f", "nc", "sse")			TARGET_BUILTIN(__builtin_ia32_comilt, "iV4fV4f", "ncV:128:", "sse")
	TARGET_BUILTIN(__builtin_ia32_comile, "iV4fV4f", "nc", "sse")			TARGET_BUILTIN(__builtin_ia32_comile, "iV4fV4f", "ncV:128:", "sse")
	TARGET_BUILTIN(__builtin_ia32_comigt, "iV4fV4f", "nc", "sse")			TARGET_BUILTIN(__builtin_ia32_comigt, "iV4fV4f", "ncV:128:", "sse")
	TARGET_BUILTIN(__builtin_ia32_comige, "iV4fV4f", "nc", "sse")			TARGET_BUILTIN(__builtin_ia32_comige, "iV4fV4f", "ncV:128:", "sse")
	TARGET_BUILTIN(__builtin_ia32_comineq, "iV4fV4f", "nc", "sse")			TARGET_BUILTIN(__builtin_ia32_comineq, "iV4fV4f", "ncV:128:", "sse")
	TARGET_BUILTIN(__builtin_ia32_ucomieq, "iV4fV4f", "nc", "sse")			TARGET_BUILTIN(__builtin_ia32_ucomieq, "iV4fV4f", "ncV:128:", "sse")
	TARGET_BUILTIN(__builtin_ia32_ucomilt, "iV4fV4f", "nc", "sse")			TARGET_BUILTIN(__builtin_ia32_ucomilt, "iV4fV4f", "ncV:128:", "sse")
	TARGET_BUILTIN(__builtin_ia32_ucomile, "iV4fV4f", "nc", "sse")			TARGET_BUILTIN(__builtin_ia32_ucomile, "iV4fV4f", "ncV:128:", "sse")
	TARGET_BUILTIN(__builtin_ia32_ucomigt, "iV4fV4f", "nc", "sse")			TARGET_BUILTIN(__builtin_ia32_ucomigt, "iV4fV4f", "ncV:128:", "sse")
	TARGET_BUILTIN(__builtin_ia32_ucomige, "iV4fV4f", "nc", "sse")			TARGET_BUILTIN(__builtin_ia32_ucomige, "iV4fV4f", "ncV:128:", "sse")
	TARGET_BUILTIN(__builtin_ia32_ucomineq, "iV4fV4f", "nc", "sse")			TARGET_BUILTIN(__builtin_ia32_ucomineq, "iV4fV4f", "ncV:128:", "sse")

	TARGET_BUILTIN(__builtin_ia32_comisdeq, "iV2dV2d", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_comisdeq, "iV2dV2d", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_comisdlt, "iV2dV2d", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_comisdlt, "iV2dV2d", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_comisdle, "iV2dV2d", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_comisdle, "iV2dV2d", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_comisdgt, "iV2dV2d", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_comisdgt, "iV2dV2d", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_comisdge, "iV2dV2d", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_comisdge, "iV2dV2d", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_comisdneq, "iV2dV2d", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_comisdneq, "iV2dV2d", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_ucomisdeq, "iV2dV2d", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_ucomisdeq, "iV2dV2d", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_ucomisdlt, "iV2dV2d", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_ucomisdlt, "iV2dV2d", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_ucomisdle, "iV2dV2d", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_ucomisdle, "iV2dV2d", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_ucomisdgt, "iV2dV2d", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_ucomisdgt, "iV2dV2d", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_ucomisdge, "iV2dV2d", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_ucomisdge, "iV2dV2d", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_ucomisdneq, "iV2dV2d", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_ucomisdneq, "iV2dV2d", "ncV:128:", "sse2")

	TARGET_BUILTIN(__builtin_ia32_cmpeqps, "V4fV4fV4f", "nc", "sse")			TARGET_BUILTIN(__builtin_ia32_cmpeqps, "V4fV4fV4f", "ncV:128:", "sse")
	TARGET_BUILTIN(__builtin_ia32_cmpltps, "V4fV4fV4f", "nc", "sse")			TARGET_BUILTIN(__builtin_ia32_cmpltps, "V4fV4fV4f", "ncV:128:", "sse")
	TARGET_BUILTIN(__builtin_ia32_cmpleps, "V4fV4fV4f", "nc", "sse")			TARGET_BUILTIN(__builtin_ia32_cmpleps, "V4fV4fV4f", "ncV:128:", "sse")
	TARGET_BUILTIN(__builtin_ia32_cmpunordps, "V4fV4fV4f", "nc", "sse")			TARGET_BUILTIN(__builtin_ia32_cmpunordps, "V4fV4fV4f", "ncV:128:", "sse")
	TARGET_BUILTIN(__builtin_ia32_cmpneqps, "V4fV4fV4f", "nc", "sse")			TARGET_BUILTIN(__builtin_ia32_cmpneqps, "V4fV4fV4f", "ncV:128:", "sse")
	TARGET_BUILTIN(__builtin_ia32_cmpnltps, "V4fV4fV4f", "nc", "sse")			TARGET_BUILTIN(__builtin_ia32_cmpnltps, "V4fV4fV4f", "ncV:128:", "sse")
	TARGET_BUILTIN(__builtin_ia32_cmpnleps, "V4fV4fV4f", "nc", "sse")			TARGET_BUILTIN(__builtin_ia32_cmpnleps, "V4fV4fV4f", "ncV:128:", "sse")
	TARGET_BUILTIN(__builtin_ia32_cmpordps, "V4fV4fV4f", "nc", "sse")			TARGET_BUILTIN(__builtin_ia32_cmpordps, "V4fV4fV4f", "ncV:128:", "sse")
	TARGET_BUILTIN(__builtin_ia32_cmpeqss, "V4fV4fV4f", "nc", "sse")			TARGET_BUILTIN(__builtin_ia32_cmpeqss, "V4fV4fV4f", "ncV:128:", "sse")
	TARGET_BUILTIN(__builtin_ia32_cmpltss, "V4fV4fV4f", "nc", "sse")			TARGET_BUILTIN(__builtin_ia32_cmpltss, "V4fV4fV4f", "ncV:128:", "sse")
	TARGET_BUILTIN(__builtin_ia32_cmpless, "V4fV4fV4f", "nc", "sse")			TARGET_BUILTIN(__builtin_ia32_cmpless, "V4fV4fV4f", "ncV:128:", "sse")
	TARGET_BUILTIN(__builtin_ia32_cmpunordss, "V4fV4fV4f", "nc", "sse")			TARGET_BUILTIN(__builtin_ia32_cmpunordss, "V4fV4fV4f", "ncV:128:", "sse")
	TARGET_BUILTIN(__builtin_ia32_cmpneqss, "V4fV4fV4f", "nc", "sse")			TARGET_BUILTIN(__builtin_ia32_cmpneqss, "V4fV4fV4f", "ncV:128:", "sse")
	TARGET_BUILTIN(__builtin_ia32_cmpnltss, "V4fV4fV4f", "nc", "sse")			TARGET_BUILTIN(__builtin_ia32_cmpnltss, "V4fV4fV4f", "ncV:128:", "sse")
	TARGET_BUILTIN(__builtin_ia32_cmpnless, "V4fV4fV4f", "nc", "sse")			TARGET_BUILTIN(__builtin_ia32_cmpnless, "V4fV4fV4f", "ncV:128:", "sse")
	TARGET_BUILTIN(__builtin_ia32_cmpordss, "V4fV4fV4f", "nc", "sse")			TARGET_BUILTIN(__builtin_ia32_cmpordss, "V4fV4fV4f", "ncV:128:", "sse")
	TARGET_BUILTIN(__builtin_ia32_minps, "V4fV4fV4f", "nc", "sse")			TARGET_BUILTIN(__builtin_ia32_minps, "V4fV4fV4f", "ncV:128:", "sse")
	TARGET_BUILTIN(__builtin_ia32_maxps, "V4fV4fV4f", "nc", "sse")			TARGET_BUILTIN(__builtin_ia32_maxps, "V4fV4fV4f", "ncV:128:", "sse")
	TARGET_BUILTIN(__builtin_ia32_minss, "V4fV4fV4f", "nc", "sse")			TARGET_BUILTIN(__builtin_ia32_minss, "V4fV4fV4f", "ncV:128:", "sse")
	TARGET_BUILTIN(__builtin_ia32_maxss, "V4fV4fV4f", "nc", "sse")			TARGET_BUILTIN(__builtin_ia32_maxss, "V4fV4fV4f", "ncV:128:", "sse")

	TARGET_BUILTIN(__builtin_ia32_cmpeqpd, "V2dV2dV2d", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_cmpeqpd, "V2dV2dV2d", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_cmpltpd, "V2dV2dV2d", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_cmpltpd, "V2dV2dV2d", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_cmplepd, "V2dV2dV2d", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_cmplepd, "V2dV2dV2d", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_cmpunordpd, "V2dV2dV2d", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_cmpunordpd, "V2dV2dV2d", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_cmpneqpd, "V2dV2dV2d", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_cmpneqpd, "V2dV2dV2d", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_cmpnltpd, "V2dV2dV2d", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_cmpnltpd, "V2dV2dV2d", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_cmpnlepd, "V2dV2dV2d", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_cmpnlepd, "V2dV2dV2d", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_cmpordpd, "V2dV2dV2d", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_cmpordpd, "V2dV2dV2d", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_cmpeqsd, "V2dV2dV2d", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_cmpeqsd, "V2dV2dV2d", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_cmpltsd, "V2dV2dV2d", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_cmpltsd, "V2dV2dV2d", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_cmplesd, "V2dV2dV2d", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_cmplesd, "V2dV2dV2d", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_cmpunordsd, "V2dV2dV2d", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_cmpunordsd, "V2dV2dV2d", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_cmpneqsd, "V2dV2dV2d", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_cmpneqsd, "V2dV2dV2d", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_cmpnltsd, "V2dV2dV2d", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_cmpnltsd, "V2dV2dV2d", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_cmpnlesd, "V2dV2dV2d", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_cmpnlesd, "V2dV2dV2d", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_cmpordsd, "V2dV2dV2d", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_cmpordsd, "V2dV2dV2d", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_minpd, "V2dV2dV2d", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_minpd, "V2dV2dV2d", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_maxpd, "V2dV2dV2d", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_maxpd, "V2dV2dV2d", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_minsd, "V2dV2dV2d", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_minsd, "V2dV2dV2d", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_maxsd, "V2dV2dV2d", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_maxsd, "V2dV2dV2d", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_paddsb128, "V16cV16cV16c", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_paddsb128, "V16cV16cV16c", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_paddsw128, "V8sV8sV8s", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_paddsw128, "V8sV8sV8s", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_psubsb128, "V16cV16cV16c", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_psubsb128, "V16cV16cV16c", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_psubsw128, "V8sV8sV8s", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_psubsw128, "V8sV8sV8s", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_paddusb128, "V16cV16cV16c", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_paddusb128, "V16cV16cV16c", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_paddusw128, "V8sV8sV8s", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_paddusw128, "V8sV8sV8s", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_psubusb128, "V16cV16cV16c", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_psubusb128, "V16cV16cV16c", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_psubusw128, "V8sV8sV8s", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_psubusw128, "V8sV8sV8s", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_pmulhw128, "V8sV8sV8s", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_pmulhw128, "V8sV8sV8s", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_pmaxub128, "V16cV16cV16c", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_pmaxub128, "V16cV16cV16c", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_pmaxsw128, "V8sV8sV8s", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_pmaxsw128, "V8sV8sV8s", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_pminub128, "V16cV16cV16c", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_pminub128, "V16cV16cV16c", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_pminsw128, "V8sV8sV8s", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_pminsw128, "V8sV8sV8s", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_packsswb128, "V16cV8sV8s", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_packsswb128, "V16cV8sV8s", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_packssdw128, "V8sV4iV4i", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_packssdw128, "V8sV4iV4i", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_packuswb128, "V16cV8sV8s", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_packuswb128, "V16cV8sV8s", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_pmulhuw128, "V8sV8sV8s", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_pmulhuw128, "V8sV8sV8s", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_vec_ext_v4si, "iV4iIi", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_vec_ext_v4si, "iV4iIi", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_vec_ext_v4sf, "fV4fIi", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_vec_ext_v4sf, "fV4fIi", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_vec_ext_v8hi, "sV8sIi", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_vec_ext_v8hi, "sV8sIi", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_vec_set_v8hi, "V8sV8ssIi", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_vec_set_v8hi, "V8sV8ssIi", "ncV:128:", "sse2")

	TARGET_BUILTIN(__builtin_ia32_addsubps, "V4fV4fV4f", "nc", "sse3")			TARGET_BUILTIN(__builtin_ia32_addsubps, "V4fV4fV4f", "ncV:128:", "sse3")
	TARGET_BUILTIN(__builtin_ia32_addsubpd, "V2dV2dV2d", "nc", "sse3")			TARGET_BUILTIN(__builtin_ia32_addsubpd, "V2dV2dV2d", "ncV:128:", "sse3")
	TARGET_BUILTIN(__builtin_ia32_haddps, "V4fV4fV4f", "nc", "sse3")			TARGET_BUILTIN(__builtin_ia32_haddps, "V4fV4fV4f", "ncV:128:", "sse3")
	TARGET_BUILTIN(__builtin_ia32_haddpd, "V2dV2dV2d", "nc", "sse3")			TARGET_BUILTIN(__builtin_ia32_haddpd, "V2dV2dV2d", "ncV:128:", "sse3")
	TARGET_BUILTIN(__builtin_ia32_hsubps, "V4fV4fV4f", "nc", "sse3")			TARGET_BUILTIN(__builtin_ia32_hsubps, "V4fV4fV4f", "ncV:128:", "sse3")
	TARGET_BUILTIN(__builtin_ia32_hsubpd, "V2dV2dV2d", "nc", "sse3")			TARGET_BUILTIN(__builtin_ia32_hsubpd, "V2dV2dV2d", "ncV:128:", "sse3")
	TARGET_BUILTIN(__builtin_ia32_phaddw128, "V8sV8sV8s", "nc", "ssse3")			TARGET_BUILTIN(__builtin_ia32_phaddw128, "V8sV8sV8s", "ncV:128:", "ssse3")
	TARGET_BUILTIN(__builtin_ia32_phaddd128, "V4iV4iV4i", "nc", "ssse3")			TARGET_BUILTIN(__builtin_ia32_phaddd128, "V4iV4iV4i", "ncV:128:", "ssse3")
	TARGET_BUILTIN(__builtin_ia32_phaddsw128, "V8sV8sV8s", "nc", "ssse3")			TARGET_BUILTIN(__builtin_ia32_phaddsw128, "V8sV8sV8s", "ncV:128:", "ssse3")
	TARGET_BUILTIN(__builtin_ia32_phsubw128, "V8sV8sV8s", "nc", "ssse3")			TARGET_BUILTIN(__builtin_ia32_phsubw128, "V8sV8sV8s", "ncV:128:", "ssse3")
	TARGET_BUILTIN(__builtin_ia32_phsubd128, "V4iV4iV4i", "nc", "ssse3")			TARGET_BUILTIN(__builtin_ia32_phsubd128, "V4iV4iV4i", "ncV:128:", "ssse3")
	TARGET_BUILTIN(__builtin_ia32_phsubsw128, "V8sV8sV8s", "nc", "ssse3")			TARGET_BUILTIN(__builtin_ia32_phsubsw128, "V8sV8sV8s", "ncV:128:", "ssse3")
	TARGET_BUILTIN(__builtin_ia32_pmaddubsw128, "V8sV16cV16c", "nc", "ssse3")			TARGET_BUILTIN(__builtin_ia32_pmaddubsw128, "V8sV16cV16c", "ncV:128:", "ssse3")
	TARGET_BUILTIN(__builtin_ia32_pmulhrsw128, "V8sV8sV8s", "nc", "ssse3")			TARGET_BUILTIN(__builtin_ia32_pmulhrsw128, "V8sV8sV8s", "ncV:128:", "ssse3")
	TARGET_BUILTIN(__builtin_ia32_pshufb128, "V16cV16cV16c", "nc", "ssse3")			TARGET_BUILTIN(__builtin_ia32_pshufb128, "V16cV16cV16c", "ncV:128:", "ssse3")
	TARGET_BUILTIN(__builtin_ia32_psignb128, "V16cV16cV16c", "nc", "ssse3")			TARGET_BUILTIN(__builtin_ia32_psignb128, "V16cV16cV16c", "ncV:128:", "ssse3")
	TARGET_BUILTIN(__builtin_ia32_psignw128, "V8sV8sV8s", "nc", "ssse3")			TARGET_BUILTIN(__builtin_ia32_psignw128, "V8sV8sV8s", "ncV:128:", "ssse3")
	TARGET_BUILTIN(__builtin_ia32_psignd128, "V4iV4iV4i", "nc", "ssse3")			TARGET_BUILTIN(__builtin_ia32_psignd128, "V4iV4iV4i", "ncV:128:", "ssse3")
	TARGET_BUILTIN(__builtin_ia32_pabsb128, "V16cV16c", "nc", "ssse3")			TARGET_BUILTIN(__builtin_ia32_pabsb128, "V16cV16c", "ncV:128:", "ssse3")
	TARGET_BUILTIN(__builtin_ia32_pabsw128, "V8sV8s", "nc", "ssse3")			TARGET_BUILTIN(__builtin_ia32_pabsw128, "V8sV8s", "ncV:128:", "ssse3")
	TARGET_BUILTIN(__builtin_ia32_pabsd128, "V4iV4i", "nc", "ssse3")			TARGET_BUILTIN(__builtin_ia32_pabsd128, "V4iV4i", "ncV:128:", "ssse3")

	TARGET_BUILTIN(__builtin_ia32_ldmxcsr, "vUi", "n", "sse")			TARGET_BUILTIN(__builtin_ia32_ldmxcsr, "vUi", "n", "sse")
	TARGET_HEADER_BUILTIN(_mm_setcsr, "vUi", "nh","xmmintrin.h", ALL_LANGUAGES, "sse")			TARGET_HEADER_BUILTIN(_mm_setcsr, "vUi", "nh","xmmintrin.h", ALL_LANGUAGES, "sse")
	TARGET_BUILTIN(__builtin_ia32_stmxcsr, "Ui", "n", "sse")			TARGET_BUILTIN(__builtin_ia32_stmxcsr, "Ui", "n", "sse")
	TARGET_HEADER_BUILTIN(_mm_getcsr, "Ui", "nh", "xmmintrin.h", ALL_LANGUAGES, "sse")			TARGET_HEADER_BUILTIN(_mm_getcsr, "Ui", "nh", "xmmintrin.h", ALL_LANGUAGES, "sse")
	TARGET_BUILTIN(__builtin_ia32_cvtss2si, "iV4f", "nc", "sse")			TARGET_BUILTIN(__builtin_ia32_cvtss2si, "iV4f", "ncV:128:", "sse")
	TARGET_BUILTIN(__builtin_ia32_cvttss2si, "iV4f", "nc", "sse")			TARGET_BUILTIN(__builtin_ia32_cvttss2si, "iV4f", "ncV:128:", "sse")
	TARGET_BUILTIN(__builtin_ia32_storehps, "vV2i*V4f", "n", "sse")			TARGET_BUILTIN(__builtin_ia32_storehps, "vV2i*V4f", "nV:128:", "sse")
	TARGET_BUILTIN(__builtin_ia32_storelps, "vV2i*V4f", "n", "sse")			TARGET_BUILTIN(__builtin_ia32_storelps, "vV2i*V4f", "nV:128:", "sse")
	TARGET_BUILTIN(__builtin_ia32_movmskps, "iV4f", "n", "sse")			TARGET_BUILTIN(__builtin_ia32_movmskps, "iV4f", "nV:128:", "sse")
	TARGET_BUILTIN(__builtin_ia32_sfence, "v", "n", "sse")			TARGET_BUILTIN(__builtin_ia32_sfence, "v", "n", "sse")
	TARGET_HEADER_BUILTIN(_mm_sfence, "v", "nh", "xmmintrin.h", ALL_LANGUAGES, "sse")			TARGET_HEADER_BUILTIN(_mm_sfence, "v", "nh", "xmmintrin.h", ALL_LANGUAGES, "sse")
	TARGET_BUILTIN(__builtin_ia32_rcpps, "V4fV4f", "nc", "sse")			TARGET_BUILTIN(__builtin_ia32_rcpps, "V4fV4f", "ncV:128:", "sse")
	TARGET_BUILTIN(__builtin_ia32_rcpss, "V4fV4f", "nc", "sse")			TARGET_BUILTIN(__builtin_ia32_rcpss, "V4fV4f", "ncV:128:", "sse")
	TARGET_BUILTIN(__builtin_ia32_rsqrtps, "V4fV4f", "nc", "sse")			TARGET_BUILTIN(__builtin_ia32_rsqrtps, "V4fV4f", "ncV:128:", "sse")
	TARGET_BUILTIN(__builtin_ia32_rsqrtss, "V4fV4f", "nc", "sse")			TARGET_BUILTIN(__builtin_ia32_rsqrtss, "V4fV4f", "ncV:128:", "sse")
	TARGET_BUILTIN(__builtin_ia32_sqrtps, "V4fV4f", "nc", "sse")			TARGET_BUILTIN(__builtin_ia32_sqrtps, "V4fV4f", "ncV:128:", "sse")
	TARGET_BUILTIN(__builtin_ia32_sqrtss, "V4fV4f", "nc", "sse")			TARGET_BUILTIN(__builtin_ia32_sqrtss, "V4fV4f", "ncV:128:", "sse")
	TARGET_BUILTIN(__builtin_ia32_shufps, "V4fV4fV4fIi", "nc", "sse")			TARGET_BUILTIN(__builtin_ia32_shufps, "V4fV4fV4fIi", "ncV:128:", "sse")

	TARGET_BUILTIN(__builtin_ia32_maskmovdqu, "vV16cV16cc*", "n", "sse2")			TARGET_BUILTIN(__builtin_ia32_maskmovdqu, "vV16cV16cc*", "nV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_movmskpd, "iV2d", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_movmskpd, "iV2d", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_pmovmskb128, "iV16c", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_pmovmskb128, "iV16c", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_movnti, "vi*i", "n", "sse2")			TARGET_BUILTIN(__builtin_ia32_movnti, "vi*i", "n", "sse2")
	TARGET_BUILTIN(__builtin_ia32_pshufd, "V4iV4iIi", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_pshufd, "V4iV4iIi", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_pshuflw, "V8sV8sIi", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_pshuflw, "V8sV8sIi", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_pshufhw, "V8sV8sIi", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_pshufhw, "V8sV8sIi", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_psadbw128, "V2LLiV16cV16c", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_psadbw128, "V2LLiV16cV16c", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_sqrtpd, "V2dV2d", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_sqrtpd, "V2dV2d", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_sqrtsd, "V2dV2d", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_sqrtsd, "V2dV2d", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_shufpd, "V2dV2dV2dIi", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_shufpd, "V2dV2dV2dIi", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_cvtpd2dq, "V2LLiV2d", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_cvtpd2dq, "V2LLiV2d", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_cvtpd2ps, "V4fV2d", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_cvtpd2ps, "V4fV2d", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_cvttpd2dq, "V4iV2d", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_cvttpd2dq, "V4iV2d", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_cvtsd2si, "iV2d", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_cvtsd2si, "iV2d", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_cvttsd2si, "iV2d", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_cvttsd2si, "iV2d", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_cvtsd2ss, "V4fV4fV2d", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_cvtsd2ss, "V4fV4fV2d", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_cvtps2dq, "V4iV4f", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_cvtps2dq, "V4iV4f", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_cvttps2dq, "V4iV4f", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_cvttps2dq, "V4iV4f", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_clflush, "vvC*", "n", "sse2")			TARGET_BUILTIN(__builtin_ia32_clflush, "vvC*", "n", "sse2")
	TARGET_HEADER_BUILTIN(_mm_clflush, "vvC*", "nh", "emmintrin.h", ALL_LANGUAGES, "sse2")			TARGET_HEADER_BUILTIN(_mm_clflush, "vvC*", "nh", "emmintrin.h", ALL_LANGUAGES, "sse2")
	TARGET_BUILTIN(__builtin_ia32_lfence, "v", "n", "sse2")			TARGET_BUILTIN(__builtin_ia32_lfence, "v", "n", "sse2")
	TARGET_HEADER_BUILTIN(_mm_lfence, "v", "nh", "emmintrin.h", ALL_LANGUAGES, "sse2")			TARGET_HEADER_BUILTIN(_mm_lfence, "v", "nh", "emmintrin.h", ALL_LANGUAGES, "sse2")
	TARGET_BUILTIN(__builtin_ia32_mfence, "v", "n", "sse2")			TARGET_BUILTIN(__builtin_ia32_mfence, "v", "n", "sse2")
	TARGET_HEADER_BUILTIN(_mm_mfence, "v", "nh", "emmintrin.h", ALL_LANGUAGES, "sse2")			TARGET_HEADER_BUILTIN(_mm_mfence, "v", "nh", "emmintrin.h", ALL_LANGUAGES, "sse2")
	TARGET_BUILTIN(__builtin_ia32_pause, "v", "n", "")			TARGET_BUILTIN(__builtin_ia32_pause, "v", "n", "")
	TARGET_HEADER_BUILTIN(_mm_pause, "v", "nh", "emmintrin.h", ALL_LANGUAGES, "")			TARGET_HEADER_BUILTIN(_mm_pause, "v", "nh", "emmintrin.h", ALL_LANGUAGES, "")
	TARGET_BUILTIN(__builtin_ia32_pmuludq128, "V2LLiV4iV4i", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_pmuludq128, "V2LLiV4iV4i", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_psraw128, "V8sV8sV8s", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_psraw128, "V8sV8sV8s", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_psrad128, "V4iV4iV4i", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_psrad128, "V4iV4iV4i", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_psrlw128, "V8sV8sV8s", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_psrlw128, "V8sV8sV8s", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_psrld128, "V4iV4iV4i", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_psrld128, "V4iV4iV4i", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_psrlq128, "V2LLiV2LLiV2LLi", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_psrlq128, "V2LLiV2LLiV2LLi", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_psllw128, "V8sV8sV8s", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_psllw128, "V8sV8sV8s", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_pslld128, "V4iV4iV4i", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_pslld128, "V4iV4iV4i", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_psllq128, "V2LLiV2LLiV2LLi", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_psllq128, "V2LLiV2LLiV2LLi", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_psllwi128, "V8sV8si", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_psllwi128, "V8sV8si", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_pslldi128, "V4iV4ii", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_pslldi128, "V4iV4ii", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_psllqi128, "V2LLiV2LLii", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_psllqi128, "V2LLiV2LLii", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_psrlwi128, "V8sV8si", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_psrlwi128, "V8sV8si", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_psrldi128, "V4iV4ii", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_psrldi128, "V4iV4ii", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_psrlqi128, "V2LLiV2LLii", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_psrlqi128, "V2LLiV2LLii", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_psrawi128, "V8sV8si", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_psrawi128, "V8sV8si", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_psradi128, "V4iV4ii", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_psradi128, "V4iV4ii", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_pmaddwd128, "V4iV8sV8s", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_pmaddwd128, "V4iV8sV8s", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_pslldqi128_byteshift, "V2LLiV2LLiIi", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_pslldqi128_byteshift, "V2LLiV2LLiIi", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_psrldqi128_byteshift, "V2LLiV2LLiIi", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_psrldqi128_byteshift, "V2LLiV2LLiIi", "ncV:128:", "sse2")

	TARGET_BUILTIN(__builtin_ia32_monitor, "vv*UiUi", "n", "sse3")			TARGET_BUILTIN(__builtin_ia32_monitor, "vv*UiUi", "n", "sse3")
	TARGET_BUILTIN(__builtin_ia32_mwait, "vUiUi", "n", "sse3")			TARGET_BUILTIN(__builtin_ia32_mwait, "vUiUi", "n", "sse3")
	TARGET_BUILTIN(__builtin_ia32_lddqu, "V16ccC*", "n", "sse3")			TARGET_BUILTIN(__builtin_ia32_lddqu, "V16ccC*", "nV:128:", "sse3")

	TARGET_BUILTIN(__builtin_ia32_palignr128, "V16cV16cV16cIi", "nc", "ssse3")			TARGET_BUILTIN(__builtin_ia32_palignr128, "V16cV16cV16cIi", "ncV:128:", "ssse3")

	TARGET_BUILTIN(__builtin_ia32_insertps128, "V4fV4fV4fIc", "nc", "sse4.1")			TARGET_BUILTIN(__builtin_ia32_insertps128, "V4fV4fV4fIc", "ncV:128:", "sse4.1")
	TARGET_BUILTIN(__builtin_ia32_pblendvb128, "V16cV16cV16cV16c", "nc", "sse4.1")			TARGET_BUILTIN(__builtin_ia32_pblendvb128, "V16cV16cV16cV16c", "ncV:128:", "sse4.1")
	TARGET_BUILTIN(__builtin_ia32_pblendw128, "V8sV8sV8sIi", "nc", "sse4.1")			TARGET_BUILTIN(__builtin_ia32_pblendw128, "V8sV8sV8sIi", "ncV:128:", "sse4.1")
	TARGET_BUILTIN(__builtin_ia32_blendpd, "V2dV2dV2dIi", "nc", "sse4.1")			TARGET_BUILTIN(__builtin_ia32_blendpd, "V2dV2dV2dIi", "ncV:128:", "sse4.1")
	TARGET_BUILTIN(__builtin_ia32_blendps, "V4fV4fV4fIi", "nc", "sse4.1")			TARGET_BUILTIN(__builtin_ia32_blendps, "V4fV4fV4fIi", "ncV:128:", "sse4.1")
	TARGET_BUILTIN(__builtin_ia32_blendvpd, "V2dV2dV2dV2d", "nc", "sse4.1")			TARGET_BUILTIN(__builtin_ia32_blendvpd, "V2dV2dV2dV2d", "ncV:128:", "sse4.1")
	TARGET_BUILTIN(__builtin_ia32_blendvps, "V4fV4fV4fV4f", "nc", "sse4.1")			TARGET_BUILTIN(__builtin_ia32_blendvps, "V4fV4fV4fV4f", "ncV:128:", "sse4.1")
	TARGET_BUILTIN(__builtin_ia32_packusdw128, "V8sV4iV4i", "nc", "sse4.1")			TARGET_BUILTIN(__builtin_ia32_packusdw128, "V8sV4iV4i", "ncV:128:", "sse4.1")

	TARGET_BUILTIN(__builtin_ia32_pmaxsb128, "V16cV16cV16c", "nc", "sse4.1")			TARGET_BUILTIN(__builtin_ia32_pmaxsb128, "V16cV16cV16c", "ncV:128:", "sse4.1")
	TARGET_BUILTIN(__builtin_ia32_pmaxsd128, "V4iV4iV4i", "nc", "sse4.1")			TARGET_BUILTIN(__builtin_ia32_pmaxsd128, "V4iV4iV4i", "ncV:128:", "sse4.1")
	TARGET_BUILTIN(__builtin_ia32_pmaxud128, "V4iV4iV4i", "nc", "sse4.1")			TARGET_BUILTIN(__builtin_ia32_pmaxud128, "V4iV4iV4i", "ncV:128:", "sse4.1")
	TARGET_BUILTIN(__builtin_ia32_pmaxuw128, "V8sV8sV8s", "nc", "sse4.1")			TARGET_BUILTIN(__builtin_ia32_pmaxuw128, "V8sV8sV8s", "ncV:128:", "sse4.1")
	TARGET_BUILTIN(__builtin_ia32_pminsb128, "V16cV16cV16c", "nc", "sse4.1")			TARGET_BUILTIN(__builtin_ia32_pminsb128, "V16cV16cV16c", "ncV:128:", "sse4.1")
	TARGET_BUILTIN(__builtin_ia32_pminsd128, "V4iV4iV4i", "nc", "sse4.1")			TARGET_BUILTIN(__builtin_ia32_pminsd128, "V4iV4iV4i", "ncV:128:", "sse4.1")
	TARGET_BUILTIN(__builtin_ia32_pminud128, "V4iV4iV4i", "nc", "sse4.1")			TARGET_BUILTIN(__builtin_ia32_pminud128, "V4iV4iV4i", "ncV:128:", "sse4.1")
	TARGET_BUILTIN(__builtin_ia32_pminuw128, "V8sV8sV8s", "nc", "sse4.1")			TARGET_BUILTIN(__builtin_ia32_pminuw128, "V8sV8sV8s", "ncV:128:", "sse4.1")
	TARGET_BUILTIN(__builtin_ia32_pmuldq128, "V2LLiV4iV4i", "nc", "sse4.1")			TARGET_BUILTIN(__builtin_ia32_pmuldq128, "V2LLiV4iV4i", "ncV:128:", "sse4.1")
	TARGET_BUILTIN(__builtin_ia32_roundps, "V4fV4fIi", "nc", "sse4.1")			TARGET_BUILTIN(__builtin_ia32_roundps, "V4fV4fIi", "ncV:128:", "sse4.1")
	TARGET_BUILTIN(__builtin_ia32_roundss, "V4fV4fV4fIi", "nc", "sse4.1")			TARGET_BUILTIN(__builtin_ia32_roundss, "V4fV4fV4fIi", "ncV:128:", "sse4.1")
	TARGET_BUILTIN(__builtin_ia32_roundsd, "V2dV2dV2dIi", "nc", "sse4.1")			TARGET_BUILTIN(__builtin_ia32_roundsd, "V2dV2dV2dIi", "ncV:128:", "sse4.1")
	TARGET_BUILTIN(__builtin_ia32_roundpd, "V2dV2dIi", "nc", "sse4.1")			TARGET_BUILTIN(__builtin_ia32_roundpd, "V2dV2dIi", "ncV:128:", "sse4.1")
	TARGET_BUILTIN(__builtin_ia32_dpps, "V4fV4fV4fIc", "nc", "sse4.1")			TARGET_BUILTIN(__builtin_ia32_dpps, "V4fV4fV4fIc", "ncV:128:", "sse4.1")
	TARGET_BUILTIN(__builtin_ia32_dppd, "V2dV2dV2dIc", "nc", "sse4.1")			TARGET_BUILTIN(__builtin_ia32_dppd, "V2dV2dV2dIc", "ncV:128:", "sse4.1")
	TARGET_BUILTIN(__builtin_ia32_ptestz128, "iV2LLiV2LLi", "nc", "sse4.1")			TARGET_BUILTIN(__builtin_ia32_ptestz128, "iV2LLiV2LLi", "ncV:128:", "sse4.1")
	TARGET_BUILTIN(__builtin_ia32_ptestc128, "iV2LLiV2LLi", "nc", "sse4.1")			TARGET_BUILTIN(__builtin_ia32_ptestc128, "iV2LLiV2LLi", "ncV:128:", "sse4.1")
	TARGET_BUILTIN(__builtin_ia32_ptestnzc128, "iV2LLiV2LLi", "nc", "sse4.1")			TARGET_BUILTIN(__builtin_ia32_ptestnzc128, "iV2LLiV2LLi", "ncV:128:", "sse4.1")
	TARGET_BUILTIN(__builtin_ia32_mpsadbw128, "V16cV16cV16cIc", "nc", "sse4.1")			TARGET_BUILTIN(__builtin_ia32_mpsadbw128, "V16cV16cV16cIc", "ncV:128:", "sse4.1")
	TARGET_BUILTIN(__builtin_ia32_phminposuw128, "V8sV8s", "nc", "sse4.1")			TARGET_BUILTIN(__builtin_ia32_phminposuw128, "V8sV8s", "ncV:128:", "sse4.1")
	TARGET_BUILTIN(__builtin_ia32_vec_ext_v16qi, "cV16cIi", "nc", "sse4.1")			TARGET_BUILTIN(__builtin_ia32_vec_ext_v16qi, "cV16cIi", "ncV:128:", "sse4.1")
	TARGET_BUILTIN(__builtin_ia32_vec_set_v16qi, "V16cV16ccIi", "nc", "sse4.1")			TARGET_BUILTIN(__builtin_ia32_vec_set_v16qi, "V16cV16ccIi", "ncV:128:", "sse4.1")
	TARGET_BUILTIN(__builtin_ia32_vec_set_v4si, "V4iV4iiIi", "nc", "sse4.1")			TARGET_BUILTIN(__builtin_ia32_vec_set_v4si, "V4iV4iiIi", "ncV:128:", "sse4.1")

	// SSE 4.2			// SSE 4.2
	TARGET_BUILTIN(__builtin_ia32_pcmpistrm128, "V16cV16cV16cIc", "nc", "sse4.2")			TARGET_BUILTIN(__builtin_ia32_pcmpistrm128, "V16cV16cV16cIc", "ncV:128:", "sse4.2")
	TARGET_BUILTIN(__builtin_ia32_pcmpistri128, "iV16cV16cIc", "nc", "sse4.2")			TARGET_BUILTIN(__builtin_ia32_pcmpistri128, "iV16cV16cIc", "ncV:128:", "sse4.2")
	TARGET_BUILTIN(__builtin_ia32_pcmpestrm128, "V16cV16ciV16ciIc", "nc", "sse4.2")			TARGET_BUILTIN(__builtin_ia32_pcmpestrm128, "V16cV16ciV16ciIc", "ncV:128:", "sse4.2")
	TARGET_BUILTIN(__builtin_ia32_pcmpestri128, "iV16ciV16ciIc","nc", "sse4.2")			TARGET_BUILTIN(__builtin_ia32_pcmpestri128, "iV16ciV16ciIc","ncV:128:", "sse4.2")

	TARGET_BUILTIN(__builtin_ia32_pcmpistria128, "iV16cV16cIc","nc", "sse4.2")			TARGET_BUILTIN(__builtin_ia32_pcmpistria128, "iV16cV16cIc","ncV:128:", "sse4.2")
	TARGET_BUILTIN(__builtin_ia32_pcmpistric128, "iV16cV16cIc","nc", "sse4.2")			TARGET_BUILTIN(__builtin_ia32_pcmpistric128, "iV16cV16cIc","ncV:128:", "sse4.2")
	TARGET_BUILTIN(__builtin_ia32_pcmpistrio128, "iV16cV16cIc","nc", "sse4.2")			TARGET_BUILTIN(__builtin_ia32_pcmpistrio128, "iV16cV16cIc","ncV:128:", "sse4.2")
	TARGET_BUILTIN(__builtin_ia32_pcmpistris128, "iV16cV16cIc","nc", "sse4.2")			TARGET_BUILTIN(__builtin_ia32_pcmpistris128, "iV16cV16cIc","ncV:128:", "sse4.2")
	TARGET_BUILTIN(__builtin_ia32_pcmpistriz128, "iV16cV16cIc","nc", "sse4.2")			TARGET_BUILTIN(__builtin_ia32_pcmpistriz128, "iV16cV16cIc","ncV:128:", "sse4.2")
	TARGET_BUILTIN(__builtin_ia32_pcmpestria128, "iV16ciV16ciIc","nc", "sse4.2")			TARGET_BUILTIN(__builtin_ia32_pcmpestria128, "iV16ciV16ciIc","ncV:128:", "sse4.2")
	TARGET_BUILTIN(__builtin_ia32_pcmpestric128, "iV16ciV16ciIc","nc", "sse4.2")			TARGET_BUILTIN(__builtin_ia32_pcmpestric128, "iV16ciV16ciIc","ncV:128:", "sse4.2")
	TARGET_BUILTIN(__builtin_ia32_pcmpestrio128, "iV16ciV16ciIc","nc", "sse4.2")			TARGET_BUILTIN(__builtin_ia32_pcmpestrio128, "iV16ciV16ciIc","ncV:128:", "sse4.2")
	TARGET_BUILTIN(__builtin_ia32_pcmpestris128, "iV16ciV16ciIc","nc", "sse4.2")			TARGET_BUILTIN(__builtin_ia32_pcmpestris128, "iV16ciV16ciIc","ncV:128:", "sse4.2")
	TARGET_BUILTIN(__builtin_ia32_pcmpestriz128, "iV16ciV16ciIc","nc", "sse4.2")			TARGET_BUILTIN(__builtin_ia32_pcmpestriz128, "iV16ciV16ciIc","ncV:128:", "sse4.2")

	TARGET_BUILTIN(__builtin_ia32_crc32qi, "UiUiUc", "nc", "sse4.2")			TARGET_BUILTIN(__builtin_ia32_crc32qi, "UiUiUc", "nc", "sse4.2")
	TARGET_BUILTIN(__builtin_ia32_crc32hi, "UiUiUs", "nc", "sse4.2")			TARGET_BUILTIN(__builtin_ia32_crc32hi, "UiUiUs", "nc", "sse4.2")
	TARGET_BUILTIN(__builtin_ia32_crc32si, "UiUiUi", "nc", "sse4.2")			TARGET_BUILTIN(__builtin_ia32_crc32si, "UiUiUi", "nc", "sse4.2")

	// SSE4a			// SSE4a
	TARGET_BUILTIN(__builtin_ia32_extrqi, "V2LLiV2LLiIcIc", "nc", "sse4a")			TARGET_BUILTIN(__builtin_ia32_extrqi, "V2LLiV2LLiIcIc", "ncV:128:", "sse4a")
	TARGET_BUILTIN(__builtin_ia32_extrq, "V2LLiV2LLiV16c", "nc", "sse4a")			TARGET_BUILTIN(__builtin_ia32_extrq, "V2LLiV2LLiV16c", "ncV:128:", "sse4a")
	TARGET_BUILTIN(__builtin_ia32_insertqi, "V2LLiV2LLiV2LLiIcIc", "nc", "sse4a")			TARGET_BUILTIN(__builtin_ia32_insertqi, "V2LLiV2LLiV2LLiIcIc", "ncV:128:", "sse4a")
	TARGET_BUILTIN(__builtin_ia32_insertq, "V2LLiV2LLiV2LLi", "nc", "sse4a")			TARGET_BUILTIN(__builtin_ia32_insertq, "V2LLiV2LLiV2LLi", "ncV:128:", "sse4a")
	TARGET_BUILTIN(__builtin_ia32_movntsd, "vd*V2d", "n", "sse4a")			TARGET_BUILTIN(__builtin_ia32_movntsd, "vd*V2d", "nV:128:", "sse4a")
	TARGET_BUILTIN(__builtin_ia32_movntss, "vf*V4f", "n", "sse4a")			TARGET_BUILTIN(__builtin_ia32_movntss, "vf*V4f", "nV:128:", "sse4a")

	// AES			// AES
	TARGET_BUILTIN(__builtin_ia32_aesenc128, "V2LLiV2LLiV2LLi", "nc", "aes")			TARGET_BUILTIN(__builtin_ia32_aesenc128, "V2LLiV2LLiV2LLi", "ncV:128:", "aes")
	TARGET_BUILTIN(__builtin_ia32_aesenclast128, "V2LLiV2LLiV2LLi", "nc", "aes")			TARGET_BUILTIN(__builtin_ia32_aesenclast128, "V2LLiV2LLiV2LLi", "ncV:128:", "aes")
	TARGET_BUILTIN(__builtin_ia32_aesdec128, "V2LLiV2LLiV2LLi", "nc", "aes")			TARGET_BUILTIN(__builtin_ia32_aesdec128, "V2LLiV2LLiV2LLi", "ncV:128:", "aes")
	TARGET_BUILTIN(__builtin_ia32_aesdeclast128, "V2LLiV2LLiV2LLi", "nc", "aes")			TARGET_BUILTIN(__builtin_ia32_aesdeclast128, "V2LLiV2LLiV2LLi", "ncV:128:", "aes")
	TARGET_BUILTIN(__builtin_ia32_aesimc128, "V2LLiV2LLi", "nc", "aes")			TARGET_BUILTIN(__builtin_ia32_aesimc128, "V2LLiV2LLi", "ncV:128:", "aes")
	TARGET_BUILTIN(__builtin_ia32_aeskeygenassist128, "V2LLiV2LLiIc", "nc", "aes")			TARGET_BUILTIN(__builtin_ia32_aeskeygenassist128, "V2LLiV2LLiIc", "ncV:128:", "aes")

	// VAES			// VAES
	TARGET_BUILTIN(__builtin_ia32_aesenc256, "V4LLiV4LLiV4LLi", "nc", "vaes")			TARGET_BUILTIN(__builtin_ia32_aesenc256, "V4LLiV4LLiV4LLi", "ncV:256:", "vaes")
	TARGET_BUILTIN(__builtin_ia32_aesenc512, "V8LLiV8LLiV8LLi", "nc", "avx512f,vaes")			TARGET_BUILTIN(__builtin_ia32_aesenc512, "V8LLiV8LLiV8LLi", "ncV:512:", "avx512f,vaes")
	TARGET_BUILTIN(__builtin_ia32_aesenclast256, "V4LLiV4LLiV4LLi", "nc", "vaes")			TARGET_BUILTIN(__builtin_ia32_aesenclast256, "V4LLiV4LLiV4LLi", "ncV:256:", "vaes")
	TARGET_BUILTIN(__builtin_ia32_aesenclast512, "V8LLiV8LLiV8LLi", "nc", "avx512f,vaes")			TARGET_BUILTIN(__builtin_ia32_aesenclast512, "V8LLiV8LLiV8LLi", "ncV:512:", "avx512f,vaes")
	TARGET_BUILTIN(__builtin_ia32_aesdec256, "V4LLiV4LLiV4LLi", "nc", "vaes")			TARGET_BUILTIN(__builtin_ia32_aesdec256, "V4LLiV4LLiV4LLi", "ncV:256:", "vaes")
	TARGET_BUILTIN(__builtin_ia32_aesdec512, "V8LLiV8LLiV8LLi", "nc", "avx512f,vaes")			TARGET_BUILTIN(__builtin_ia32_aesdec512, "V8LLiV8LLiV8LLi", "ncV:512:", "avx512f,vaes")
	TARGET_BUILTIN(__builtin_ia32_aesdeclast256, "V4LLiV4LLiV4LLi", "nc", "vaes")			TARGET_BUILTIN(__builtin_ia32_aesdeclast256, "V4LLiV4LLiV4LLi", "ncV:256:", "vaes")
	TARGET_BUILTIN(__builtin_ia32_aesdeclast512, "V8LLiV8LLiV8LLi", "nc", "avx512f,vaes")			TARGET_BUILTIN(__builtin_ia32_aesdeclast512, "V8LLiV8LLiV8LLi", "ncV:512:", "avx512f,vaes")

	// GFNI			// GFNI
	TARGET_BUILTIN(__builtin_ia32_vgf2p8affineinvqb_v16qi, "V16cV16cV16cIc", "nc", "gfni")			TARGET_BUILTIN(__builtin_ia32_vgf2p8affineinvqb_v16qi, "V16cV16cV16cIc", "ncV:128:", "gfni")
	TARGET_BUILTIN(__builtin_ia32_vgf2p8affineinvqb_v32qi, "V32cV32cV32cIc", "nc", "avx,gfni")			TARGET_BUILTIN(__builtin_ia32_vgf2p8affineinvqb_v32qi, "V32cV32cV32cIc", "ncV:256:", "avx,gfni")
	TARGET_BUILTIN(__builtin_ia32_vgf2p8affineinvqb_v64qi, "V64cV64cV64cIc", "nc", "avx512bw,gfni")			TARGET_BUILTIN(__builtin_ia32_vgf2p8affineinvqb_v64qi, "V64cV64cV64cIc", "ncV:512:", "avx512bw,gfni")
	TARGET_BUILTIN(__builtin_ia32_vgf2p8affineqb_v16qi, "V16cV16cV16cIc", "nc", "gfni")			TARGET_BUILTIN(__builtin_ia32_vgf2p8affineqb_v16qi, "V16cV16cV16cIc", "ncV:128:", "gfni")
	TARGET_BUILTIN(__builtin_ia32_vgf2p8affineqb_v32qi, "V32cV32cV32cIc", "nc", "avx,gfni")			TARGET_BUILTIN(__builtin_ia32_vgf2p8affineqb_v32qi, "V32cV32cV32cIc", "ncV:256:", "avx,gfni")
	TARGET_BUILTIN(__builtin_ia32_vgf2p8affineqb_v64qi, "V64cV64cV64cIc", "nc", "avx512bw,gfni")			TARGET_BUILTIN(__builtin_ia32_vgf2p8affineqb_v64qi, "V64cV64cV64cIc", "ncV:512:", "avx512bw,gfni")
	TARGET_BUILTIN(__builtin_ia32_vgf2p8mulb_v16qi, "V16cV16cV16c", "nc", "gfni")			TARGET_BUILTIN(__builtin_ia32_vgf2p8mulb_v16qi, "V16cV16cV16c", "ncV:128:", "gfni")
	TARGET_BUILTIN(__builtin_ia32_vgf2p8mulb_v32qi, "V32cV32cV32c", "nc", "avx,gfni")			TARGET_BUILTIN(__builtin_ia32_vgf2p8mulb_v32qi, "V32cV32cV32c", "ncV:256:", "avx,gfni")
	TARGET_BUILTIN(__builtin_ia32_vgf2p8mulb_v64qi, "V64cV64cV64c", "nc", "avx512bw,gfni")			TARGET_BUILTIN(__builtin_ia32_vgf2p8mulb_v64qi, "V64cV64cV64c", "ncV:512:", "avx512bw,gfni")

	// CLMUL			// CLMUL
	TARGET_BUILTIN(__builtin_ia32_pclmulqdq128, "V2LLiV2LLiV2LLiIc", "nc", "pclmul")			TARGET_BUILTIN(__builtin_ia32_pclmulqdq128, "V2LLiV2LLiV2LLiIc", "ncV:128:", "pclmul")

	// VPCLMULQDQ			// VPCLMULQDQ
	TARGET_BUILTIN(__builtin_ia32_pclmulqdq256, "V4LLiV4LLiV4LLiIc", "nc", "vpclmulqdq")			TARGET_BUILTIN(__builtin_ia32_pclmulqdq256, "V4LLiV4LLiV4LLiIc", "ncV:256:", "vpclmulqdq")
	TARGET_BUILTIN(__builtin_ia32_pclmulqdq512, "V8LLiV8LLiV8LLiIc", "nc", "avx512f,vpclmulqdq")			TARGET_BUILTIN(__builtin_ia32_pclmulqdq512, "V8LLiV8LLiV8LLiIc", "ncV:512:", "avx512f,vpclmulqdq")

	// AVX			// AVX
	TARGET_BUILTIN(__builtin_ia32_addsubpd256, "V4dV4dV4d", "nc", "avx")			TARGET_BUILTIN(__builtin_ia32_addsubpd256, "V4dV4dV4d", "ncV:256:", "avx")
	TARGET_BUILTIN(__builtin_ia32_addsubps256, "V8fV8fV8f", "nc", "avx")			TARGET_BUILTIN(__builtin_ia32_addsubps256, "V8fV8fV8f", "ncV:256:", "avx")
	TARGET_BUILTIN(__builtin_ia32_haddpd256, "V4dV4dV4d", "nc", "avx")			TARGET_BUILTIN(__builtin_ia32_haddpd256, "V4dV4dV4d", "ncV:256:", "avx")
	TARGET_BUILTIN(__builtin_ia32_hsubps256, "V8fV8fV8f", "nc", "avx")			TARGET_BUILTIN(__builtin_ia32_hsubps256, "V8fV8fV8f", "ncV:256:", "avx")
	TARGET_BUILTIN(__builtin_ia32_hsubpd256, "V4dV4dV4d", "nc", "avx")			TARGET_BUILTIN(__builtin_ia32_hsubpd256, "V4dV4dV4d", "ncV:256:", "avx")
	TARGET_BUILTIN(__builtin_ia32_haddps256, "V8fV8fV8f", "nc", "avx")			TARGET_BUILTIN(__builtin_ia32_haddps256, "V8fV8fV8f", "ncV:256:", "avx")
	TARGET_BUILTIN(__builtin_ia32_maxpd256, "V4dV4dV4d", "nc", "avx")			TARGET_BUILTIN(__builtin_ia32_maxpd256, "V4dV4dV4d", "ncV:256:", "avx")
	TARGET_BUILTIN(__builtin_ia32_maxps256, "V8fV8fV8f", "nc", "avx")			TARGET_BUILTIN(__builtin_ia32_maxps256, "V8fV8fV8f", "ncV:256:", "avx")
	TARGET_BUILTIN(__builtin_ia32_minpd256, "V4dV4dV4d", "nc", "avx")			TARGET_BUILTIN(__builtin_ia32_minpd256, "V4dV4dV4d", "ncV:256:", "avx")
	TARGET_BUILTIN(__builtin_ia32_minps256, "V8fV8fV8f", "nc", "avx")			TARGET_BUILTIN(__builtin_ia32_minps256, "V8fV8fV8f", "ncV:256:", "avx")
	TARGET_BUILTIN(__builtin_ia32_vpermilvarpd, "V2dV2dV2LLi", "nc", "avx")			TARGET_BUILTIN(__builtin_ia32_vpermilvarpd, "V2dV2dV2LLi", "ncV:256:", "avx")
	TARGET_BUILTIN(__builtin_ia32_vpermilvarps, "V4fV4fV4i", "nc", "avx")			TARGET_BUILTIN(__builtin_ia32_vpermilvarps, "V4fV4fV4i", "ncV:256:", "avx")
	TARGET_BUILTIN(__builtin_ia32_vpermilvarpd256, "V4dV4dV4LLi", "nc", "avx")			TARGET_BUILTIN(__builtin_ia32_vpermilvarpd256, "V4dV4dV4LLi", "ncV:256:", "avx")
	TARGET_BUILTIN(__builtin_ia32_vpermilvarps256, "V8fV8fV8i", "nc", "avx")			TARGET_BUILTIN(__builtin_ia32_vpermilvarps256, "V8fV8fV8i", "ncV:256:", "avx")
	TARGET_BUILTIN(__builtin_ia32_blendpd256, "V4dV4dV4dIi", "nc", "avx")			TARGET_BUILTIN(__builtin_ia32_blendpd256, "V4dV4dV4dIi", "ncV:256:", "avx")
	TARGET_BUILTIN(__builtin_ia32_blendps256, "V8fV8fV8fIi", "nc", "avx")			TARGET_BUILTIN(__builtin_ia32_blendps256, "V8fV8fV8fIi", "ncV:256:", "avx")
	TARGET_BUILTIN(__builtin_ia32_blendvpd256, "V4dV4dV4dV4d", "nc", "avx")			TARGET_BUILTIN(__builtin_ia32_blendvpd256, "V4dV4dV4dV4d", "ncV:256:", "avx")
	TARGET_BUILTIN(__builtin_ia32_blendvps256, "V8fV8fV8fV8f", "nc", "avx")			TARGET_BUILTIN(__builtin_ia32_blendvps256, "V8fV8fV8fV8f", "ncV:256:", "avx")
	TARGET_BUILTIN(__builtin_ia32_shufpd256, "V4dV4dV4dIi", "nc", "avx")			TARGET_BUILTIN(__builtin_ia32_shufpd256, "V4dV4dV4dIi", "ncV:256:", "avx")
	TARGET_BUILTIN(__builtin_ia32_shufps256, "V8fV8fV8fIi", "nc", "avx")			TARGET_BUILTIN(__builtin_ia32_shufps256, "V8fV8fV8fIi", "ncV:256:", "avx")
	TARGET_BUILTIN(__builtin_ia32_dpps256, "V8fV8fV8fIc", "nc", "avx")			TARGET_BUILTIN(__builtin_ia32_dpps256, "V8fV8fV8fIc", "ncV:256:", "avx")
	TARGET_BUILTIN(__builtin_ia32_cmppd, "V2dV2dV2dIc", "nc", "avx")			TARGET_BUILTIN(__builtin_ia32_cmppd, "V2dV2dV2dIc", "ncV:128:", "avx")
	TARGET_BUILTIN(__builtin_ia32_cmppd256, "V4dV4dV4dIc", "nc", "avx")			TARGET_BUILTIN(__builtin_ia32_cmppd256, "V4dV4dV4dIc", "ncV:256:", "avx")
	TARGET_BUILTIN(__builtin_ia32_cmpps, "V4fV4fV4fIc", "nc", "avx")			TARGET_BUILTIN(__builtin_ia32_cmpps, "V4fV4fV4fIc", "ncV:128:", "avx")
	TARGET_BUILTIN(__builtin_ia32_cmpps256, "V8fV8fV8fIc", "nc", "avx")			TARGET_BUILTIN(__builtin_ia32_cmpps256, "V8fV8fV8fIc", "ncV:256:", "avx")
	TARGET_BUILTIN(__builtin_ia32_cmpsd, "V2dV2dV2dIc", "nc", "avx")			TARGET_BUILTIN(__builtin_ia32_cmpsd, "V2dV2dV2dIc", "ncV:128:", "avx")
	TARGET_BUILTIN(__builtin_ia32_cmpss, "V4fV4fV4fIc", "nc", "avx")			TARGET_BUILTIN(__builtin_ia32_cmpss, "V4fV4fV4fIc", "ncV:128:", "avx")
	TARGET_BUILTIN(__builtin_ia32_vextractf128_pd256, "V2dV4dIi", "nc", "avx")			TARGET_BUILTIN(__builtin_ia32_vextractf128_pd256, "V2dV4dIi", "ncV:256:", "avx")
	TARGET_BUILTIN(__builtin_ia32_vextractf128_ps256, "V4fV8fIi", "nc", "avx")			TARGET_BUILTIN(__builtin_ia32_vextractf128_ps256, "V4fV8fIi", "ncV:256:", "avx")
	TARGET_BUILTIN(__builtin_ia32_vextractf128_si256, "V4iV8iIi", "nc", "avx")			TARGET_BUILTIN(__builtin_ia32_vextractf128_si256, "V4iV8iIi", "ncV:256:", "avx")
	TARGET_BUILTIN(__builtin_ia32_cvtpd2ps256, "V4fV4d", "nc", "avx")			TARGET_BUILTIN(__builtin_ia32_cvtpd2ps256, "V4fV4d", "ncV:256:", "avx")
	TARGET_BUILTIN(__builtin_ia32_cvtps2dq256, "V8iV8f", "nc", "avx")			TARGET_BUILTIN(__builtin_ia32_cvtps2dq256, "V8iV8f", "ncV:256:", "avx")
	TARGET_BUILTIN(__builtin_ia32_cvttpd2dq256, "V4iV4d", "nc", "avx")			TARGET_BUILTIN(__builtin_ia32_cvttpd2dq256, "V4iV4d", "ncV:256:", "avx")
	TARGET_BUILTIN(__builtin_ia32_cvtpd2dq256, "V4iV4d", "nc", "avx")			TARGET_BUILTIN(__builtin_ia32_cvtpd2dq256, "V4iV4d", "ncV:256:", "avx")
	TARGET_BUILTIN(__builtin_ia32_cvttps2dq256, "V8iV8f", "nc", "avx")			TARGET_BUILTIN(__builtin_ia32_cvttps2dq256, "V8iV8f", "ncV:256:", "avx")
	TARGET_BUILTIN(__builtin_ia32_vperm2f128_pd256, "V4dV4dV4dIi", "nc", "avx")			TARGET_BUILTIN(__builtin_ia32_vperm2f128_pd256, "V4dV4dV4dIi", "ncV:256:", "avx")
	TARGET_BUILTIN(__builtin_ia32_vperm2f128_ps256, "V8fV8fV8fIi", "nc", "avx")			TARGET_BUILTIN(__builtin_ia32_vperm2f128_ps256, "V8fV8fV8fIi", "ncV:256:", "avx")
	TARGET_BUILTIN(__builtin_ia32_vperm2f128_si256, "V8iV8iV8iIi", "nc", "avx")			TARGET_BUILTIN(__builtin_ia32_vperm2f128_si256, "V8iV8iV8iIi", "ncV:256:", "avx")
	TARGET_BUILTIN(__builtin_ia32_vpermilpd, "V2dV2dIi", "nc", "avx")			TARGET_BUILTIN(__builtin_ia32_vpermilpd, "V2dV2dIi", "ncV:128:", "avx")
	TARGET_BUILTIN(__builtin_ia32_vpermilps, "V4fV4fIi", "nc", "avx")			TARGET_BUILTIN(__builtin_ia32_vpermilps, "V4fV4fIi", "ncV:128:", "avx")
	TARGET_BUILTIN(__builtin_ia32_vpermilpd256, "V4dV4dIi", "nc", "avx")			TARGET_BUILTIN(__builtin_ia32_vpermilpd256, "V4dV4dIi", "ncV:256:", "avx")
	TARGET_BUILTIN(__builtin_ia32_vpermilps256, "V8fV8fIi", "nc", "avx")			TARGET_BUILTIN(__builtin_ia32_vpermilps256, "V8fV8fIi", "ncV:256:", "avx")
	TARGET_BUILTIN(__builtin_ia32_vinsertf128_pd256, "V4dV4dV2dIi", "nc", "avx")			TARGET_BUILTIN(__builtin_ia32_vinsertf128_pd256, "V4dV4dV2dIi", "ncV:256:", "avx")
	TARGET_BUILTIN(__builtin_ia32_vinsertf128_ps256, "V8fV8fV4fIi", "nc", "avx")			TARGET_BUILTIN(__builtin_ia32_vinsertf128_ps256, "V8fV8fV4fIi", "ncV:256:", "avx")
	TARGET_BUILTIN(__builtin_ia32_vinsertf128_si256, "V8iV8iV4iIi", "nc", "avx")			TARGET_BUILTIN(__builtin_ia32_vinsertf128_si256, "V8iV8iV4iIi", "ncV:256:", "avx")
	TARGET_BUILTIN(__builtin_ia32_sqrtpd256, "V4dV4d", "nc", "avx")			TARGET_BUILTIN(__builtin_ia32_sqrtpd256, "V4dV4d", "ncV:256:", "avx")
	TARGET_BUILTIN(__builtin_ia32_sqrtps256, "V8fV8f", "nc", "avx")			TARGET_BUILTIN(__builtin_ia32_sqrtps256, "V8fV8f", "ncV:256:", "avx")
	TARGET_BUILTIN(__builtin_ia32_rsqrtps256, "V8fV8f", "nc", "avx")			TARGET_BUILTIN(__builtin_ia32_rsqrtps256, "V8fV8f", "ncV:256:", "avx")
	TARGET_BUILTIN(__builtin_ia32_rcpps256, "V8fV8f", "nc", "avx")			TARGET_BUILTIN(__builtin_ia32_rcpps256, "V8fV8f", "ncV:256:", "avx")
	TARGET_BUILTIN(__builtin_ia32_roundpd256, "V4dV4dIi", "nc", "avx")			TARGET_BUILTIN(__builtin_ia32_roundpd256, "V4dV4dIi", "ncV:256:", "avx")
	TARGET_BUILTIN(__builtin_ia32_roundps256, "V8fV8fIi", "nc", "avx")			TARGET_BUILTIN(__builtin_ia32_roundps256, "V8fV8fIi", "ncV:256:", "avx")
	TARGET_BUILTIN(__builtin_ia32_vtestzpd, "iV2dV2d", "nc", "avx")			TARGET_BUILTIN(__builtin_ia32_vtestzpd, "iV2dV2d", "ncV:128:", "avx")
	TARGET_BUILTIN(__builtin_ia32_vtestcpd, "iV2dV2d", "nc", "avx")			TARGET_BUILTIN(__builtin_ia32_vtestcpd, "iV2dV2d", "ncV:128:", "avx")
	TARGET_BUILTIN(__builtin_ia32_vtestnzcpd, "iV2dV2d", "nc", "avx")			TARGET_BUILTIN(__builtin_ia32_vtestnzcpd, "iV2dV2d", "ncV:128:", "avx")
	TARGET_BUILTIN(__builtin_ia32_vtestzps, "iV4fV4f", "nc", "avx")			TARGET_BUILTIN(__builtin_ia32_vtestzps, "iV4fV4f", "ncV:128:", "avx")
	TARGET_BUILTIN(__builtin_ia32_vtestcps, "iV4fV4f", "nc", "avx")			TARGET_BUILTIN(__builtin_ia32_vtestcps, "iV4fV4f", "ncV:128:", "avx")
	TARGET_BUILTIN(__builtin_ia32_vtestnzcps, "iV4fV4f", "nc", "avx")			TARGET_BUILTIN(__builtin_ia32_vtestnzcps, "iV4fV4f", "ncV:128:", "avx")
	TARGET_BUILTIN(__builtin_ia32_vtestzpd256, "iV4dV4d", "nc", "avx")			TARGET_BUILTIN(__builtin_ia32_vtestzpd256, "iV4dV4d", "ncV:256:", "avx")
	TARGET_BUILTIN(__builtin_ia32_vtestcpd256, "iV4dV4d", "nc", "avx")			TARGET_BUILTIN(__builtin_ia32_vtestcpd256, "iV4dV4d", "ncV:256:", "avx")
	TARGET_BUILTIN(__builtin_ia32_vtestnzcpd256, "iV4dV4d", "nc", "avx")			TARGET_BUILTIN(__builtin_ia32_vtestnzcpd256, "iV4dV4d", "ncV:256:", "avx")
	TARGET_BUILTIN(__builtin_ia32_vtestzps256, "iV8fV8f", "nc", "avx")			TARGET_BUILTIN(__builtin_ia32_vtestzps256, "iV8fV8f", "ncV:256:", "avx")
	TARGET_BUILTIN(__builtin_ia32_vtestcps256, "iV8fV8f", "nc", "avx")			TARGET_BUILTIN(__builtin_ia32_vtestcps256, "iV8fV8f", "ncV:256:", "avx")
	TARGET_BUILTIN(__builtin_ia32_vtestnzcps256, "iV8fV8f", "nc", "avx")			TARGET_BUILTIN(__builtin_ia32_vtestnzcps256, "iV8fV8f", "ncV:256:", "avx")
	TARGET_BUILTIN(__builtin_ia32_ptestz256, "iV4LLiV4LLi", "nc", "avx")			TARGET_BUILTIN(__builtin_ia32_ptestz256, "iV4LLiV4LLi", "ncV:256:", "avx")
	TARGET_BUILTIN(__builtin_ia32_ptestc256, "iV4LLiV4LLi", "nc", "avx")			TARGET_BUILTIN(__builtin_ia32_ptestc256, "iV4LLiV4LLi", "ncV:256:", "avx")
	TARGET_BUILTIN(__builtin_ia32_ptestnzc256, "iV4LLiV4LLi", "nc", "avx")			TARGET_BUILTIN(__builtin_ia32_ptestnzc256, "iV4LLiV4LLi", "ncV:256:", "avx")
	TARGET_BUILTIN(__builtin_ia32_movmskpd256, "iV4d", "nc", "avx")			TARGET_BUILTIN(__builtin_ia32_movmskpd256, "iV4d", "ncV:256:", "avx")
	TARGET_BUILTIN(__builtin_ia32_movmskps256, "iV8f", "nc", "avx")			TARGET_BUILTIN(__builtin_ia32_movmskps256, "iV8f", "ncV:256:", "avx")
	TARGET_BUILTIN(__builtin_ia32_vzeroall, "v", "n", "avx")			TARGET_BUILTIN(__builtin_ia32_vzeroall, "v", "n", "avx")
	TARGET_BUILTIN(__builtin_ia32_vzeroupper, "v", "n", "avx")			TARGET_BUILTIN(__builtin_ia32_vzeroupper, "v", "n", "avx")
	TARGET_BUILTIN(__builtin_ia32_lddqu256, "V32ccC*", "n", "avx")			TARGET_BUILTIN(__builtin_ia32_lddqu256, "V32ccC*", "nV:256:", "avx")
	TARGET_BUILTIN(__builtin_ia32_maskloadpd, "V2dV2dC*V2LLi", "n", "avx")			TARGET_BUILTIN(__builtin_ia32_maskloadpd, "V2dV2dC*V2LLi", "nV:128:", "avx")
	TARGET_BUILTIN(__builtin_ia32_maskloadps, "V4fV4fC*V4i", "n", "avx")			TARGET_BUILTIN(__builtin_ia32_maskloadps, "V4fV4fC*V4i", "nV:128:", "avx")
	TARGET_BUILTIN(__builtin_ia32_maskloadpd256, "V4dV4dC*V4LLi", "n", "avx")			TARGET_BUILTIN(__builtin_ia32_maskloadpd256, "V4dV4dC*V4LLi", "nV:256:", "avx")
	TARGET_BUILTIN(__builtin_ia32_maskloadps256, "V8fV8fC*V8i", "n", "avx")			TARGET_BUILTIN(__builtin_ia32_maskloadps256, "V8fV8fC*V8i", "nV:256:", "avx")
	TARGET_BUILTIN(__builtin_ia32_maskstorepd, "vV2d*V2LLiV2d", "n", "avx")			TARGET_BUILTIN(__builtin_ia32_maskstorepd, "vV2d*V2LLiV2d", "nV:128:", "avx")
	TARGET_BUILTIN(__builtin_ia32_maskstoreps, "vV4f*V4iV4f", "n", "avx")			TARGET_BUILTIN(__builtin_ia32_maskstoreps, "vV4f*V4iV4f", "nV:128:", "avx")
	TARGET_BUILTIN(__builtin_ia32_maskstorepd256, "vV4d*V4LLiV4d", "n", "avx")			TARGET_BUILTIN(__builtin_ia32_maskstorepd256, "vV4d*V4LLiV4d", "nV:256:", "avx")
	TARGET_BUILTIN(__builtin_ia32_maskstoreps256, "vV8f*V8iV8f", "n", "avx")			TARGET_BUILTIN(__builtin_ia32_maskstoreps256, "vV8f*V8iV8f", "nV:256:", "avx")
	TARGET_BUILTIN(__builtin_ia32_vec_ext_v32qi, "cV32cIi", "nc", "avx")			TARGET_BUILTIN(__builtin_ia32_vec_ext_v32qi, "cV32cIi", "ncV:256:", "avx")
	TARGET_BUILTIN(__builtin_ia32_vec_ext_v16hi, "sV16sIi", "nc", "avx")			TARGET_BUILTIN(__builtin_ia32_vec_ext_v16hi, "sV16sIi", "ncV:256:", "avx")
	TARGET_BUILTIN(__builtin_ia32_vec_ext_v8si, "iV8iIi", "nc", "avx")			TARGET_BUILTIN(__builtin_ia32_vec_ext_v8si, "iV8iIi", "ncV:256:", "avx")
	TARGET_BUILTIN(__builtin_ia32_vec_set_v32qi, "V32cV32ccIi", "nc", "avx")			TARGET_BUILTIN(__builtin_ia32_vec_set_v32qi, "V32cV32ccIi", "ncV:256:", "avx")
	TARGET_BUILTIN(__builtin_ia32_vec_set_v16hi, "V16sV16ssIi", "nc", "avx")			TARGET_BUILTIN(__builtin_ia32_vec_set_v16hi, "V16sV16ssIi", "ncV:256:", "avx")
	TARGET_BUILTIN(__builtin_ia32_vec_set_v8si, "V8iV8iiIi", "nc", "avx")			TARGET_BUILTIN(__builtin_ia32_vec_set_v8si, "V8iV8iiIi", "ncV:256:", "avx")

	// AVX2			// AVX2
	TARGET_BUILTIN(__builtin_ia32_mpsadbw256, "V32cV32cV32cIc", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_mpsadbw256, "V32cV32cV32cIc", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_pabsb256, "V32cV32c", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_pabsb256, "V32cV32c", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_pabsw256, "V16sV16s", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_pabsw256, "V16sV16s", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_pabsd256, "V8iV8i", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_pabsd256, "V8iV8i", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_packsswb256, "V32cV16sV16s", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_packsswb256, "V32cV16sV16s", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_packssdw256, "V16sV8iV8i", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_packssdw256, "V16sV8iV8i", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_packuswb256, "V32cV16sV16s", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_packuswb256, "V32cV16sV16s", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_packusdw256, "V16sV8iV8i", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_packusdw256, "V16sV8iV8i", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_paddsb256, "V32cV32cV32c", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_paddsb256, "V32cV32cV32c", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_paddsw256, "V16sV16sV16s", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_paddsw256, "V16sV16sV16s", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_psubsb256, "V32cV32cV32c", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_psubsb256, "V32cV32cV32c", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_psubsw256, "V16sV16sV16s", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_psubsw256, "V16sV16sV16s", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_paddusb256, "V32cV32cV32c", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_paddusb256, "V32cV32cV32c", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_paddusw256, "V16sV16sV16s", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_paddusw256, "V16sV16sV16s", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_psubusb256, "V32cV32cV32c", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_psubusb256, "V32cV32cV32c", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_psubusw256, "V16sV16sV16s", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_psubusw256, "V16sV16sV16s", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_palignr256, "V32cV32cV32cIi", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_palignr256, "V32cV32cV32cIi", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_pblendvb256, "V32cV32cV32cV32c", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_pblendvb256, "V32cV32cV32cV32c", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_pblendw256, "V16sV16sV16sIi", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_pblendw256, "V16sV16sV16sIi", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_phaddw256, "V16sV16sV16s", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_phaddw256, "V16sV16sV16s", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_phaddd256, "V8iV8iV8i", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_phaddd256, "V8iV8iV8i", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_phaddsw256, "V16sV16sV16s", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_phaddsw256, "V16sV16sV16s", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_phsubw256, "V16sV16sV16s", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_phsubw256, "V16sV16sV16s", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_phsubd256, "V8iV8iV8i", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_phsubd256, "V8iV8iV8i", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_phsubsw256, "V16sV16sV16s", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_phsubsw256, "V16sV16sV16s", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_pmaddubsw256, "V16sV32cV32c", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_pmaddubsw256, "V16sV32cV32c", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_pmaddwd256, "V8iV16sV16s", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_pmaddwd256, "V8iV16sV16s", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_pmaxub256, "V32cV32cV32c", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_pmaxub256, "V32cV32cV32c", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_pmaxuw256, "V16sV16sV16s", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_pmaxuw256, "V16sV16sV16s", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_pmaxud256, "V8iV8iV8i", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_pmaxud256, "V8iV8iV8i", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_pmaxsb256, "V32cV32cV32c", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_pmaxsb256, "V32cV32cV32c", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_pmaxsw256, "V16sV16sV16s", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_pmaxsw256, "V16sV16sV16s", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_pmaxsd256, "V8iV8iV8i", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_pmaxsd256, "V8iV8iV8i", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_pminub256, "V32cV32cV32c", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_pminub256, "V32cV32cV32c", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_pminuw256, "V16sV16sV16s", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_pminuw256, "V16sV16sV16s", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_pminud256, "V8iV8iV8i", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_pminud256, "V8iV8iV8i", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_pminsb256, "V32cV32cV32c", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_pminsb256, "V32cV32cV32c", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_pminsw256, "V16sV16sV16s", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_pminsw256, "V16sV16sV16s", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_pminsd256, "V8iV8iV8i", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_pminsd256, "V8iV8iV8i", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_pmovmskb256, "iV32c", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_pmovmskb256, "iV32c", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_pmuldq256, "V4LLiV8iV8i", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_pmuldq256, "V4LLiV8iV8i", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_pmulhrsw256, "V16sV16sV16s", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_pmulhrsw256, "V16sV16sV16s", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_pmulhuw256, "V16sV16sV16s", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_pmulhuw256, "V16sV16sV16s", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_pmulhw256, "V16sV16sV16s", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_pmulhw256, "V16sV16sV16s", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_pmuludq256, "V4LLiV8iV8i", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_pmuludq256, "V4LLiV8iV8i", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_psadbw256, "V4LLiV32cV32c", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_psadbw256, "V4LLiV32cV32c", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_pshufb256, "V32cV32cV32c", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_pshufb256, "V32cV32cV32c", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_pshufd256, "V8iV8iIi", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_pshufd256, "V8iV8iIi", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_pshuflw256, "V16sV16sIi", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_pshuflw256, "V16sV16sIi", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_pshufhw256, "V16sV16sIi", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_pshufhw256, "V16sV16sIi", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_psignb256, "V32cV32cV32c", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_psignb256, "V32cV32cV32c", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_psignw256, "V16sV16sV16s", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_psignw256, "V16sV16sV16s", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_psignd256, "V8iV8iV8i", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_psignd256, "V8iV8iV8i", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_psllwi256, "V16sV16si", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_psllwi256, "V16sV16si", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_psllw256, "V16sV16sV8s", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_psllw256, "V16sV16sV8s", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_pslldqi256_byteshift, "V4LLiV4LLiIi", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_pslldqi256_byteshift, "V4LLiV4LLiIi", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_pslldi256, "V8iV8ii", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_pslldi256, "V8iV8ii", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_pslld256, "V8iV8iV4i", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_pslld256, "V8iV8iV4i", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_psllqi256, "V4LLiV4LLii", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_psllqi256, "V4LLiV4LLii", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_psllq256, "V4LLiV4LLiV2LLi", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_psllq256, "V4LLiV4LLiV2LLi", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_psrawi256, "V16sV16si", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_psrawi256, "V16sV16si", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_psraw256, "V16sV16sV8s", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_psraw256, "V16sV16sV8s", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_psradi256, "V8iV8ii", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_psradi256, "V8iV8ii", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_psrad256, "V8iV8iV4i", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_psrad256, "V8iV8iV4i", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_psrldqi256_byteshift, "V4LLiV4LLiIi", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_psrldqi256_byteshift, "V4LLiV4LLiIi", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_psrlwi256, "V16sV16si", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_psrlwi256, "V16sV16si", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_psrlw256, "V16sV16sV8s", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_psrlw256, "V16sV16sV8s", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_psrldi256, "V8iV8ii", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_psrldi256, "V8iV8ii", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_psrld256, "V8iV8iV4i", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_psrld256, "V8iV8iV4i", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_psrlqi256, "V4LLiV4LLii", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_psrlqi256, "V4LLiV4LLii", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_psrlq256, "V4LLiV4LLiV2LLi", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_psrlq256, "V4LLiV4LLiV2LLi", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_pblendd128, "V4iV4iV4iIi", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_pblendd128, "V4iV4iV4iIi", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_pblendd256, "V8iV8iV8iIi", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_pblendd256, "V8iV8iV8iIi", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_permvarsi256, "V8iV8iV8i", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_permvarsi256, "V8iV8iV8i", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_permdf256, "V4dV4dIi", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_permdf256, "V4dV4dIi", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_permvarsf256, "V8fV8fV8i", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_permvarsf256, "V8fV8fV8i", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_permti256, "V4LLiV4LLiV4LLiIi", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_permti256, "V4LLiV4LLiV4LLiIi", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_permdi256, "V4LLiV4LLiIi", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_permdi256, "V4LLiV4LLiIi", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_extract128i256, "V2LLiV4LLiIi", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_extract128i256, "V2LLiV4LLiIi", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_insert128i256, "V4LLiV4LLiV2LLiIi", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_insert128i256, "V4LLiV4LLiV2LLiIi", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_maskloadd256, "V8iV8iC*V8i", "n", "avx2")			TARGET_BUILTIN(__builtin_ia32_maskloadd256, "V8iV8iC*V8i", "nV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_maskloadq256, "V4LLiV4LLiC*V4LLi", "n", "avx2")			TARGET_BUILTIN(__builtin_ia32_maskloadq256, "V4LLiV4LLiC*V4LLi", "nV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_maskloadd, "V4iV4iC*V4i", "n", "avx2")			TARGET_BUILTIN(__builtin_ia32_maskloadd, "V4iV4iC*V4i", "nV:128:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_maskloadq, "V2LLiV2LLiC*V2LLi", "n", "avx2")			TARGET_BUILTIN(__builtin_ia32_maskloadq, "V2LLiV2LLiC*V2LLi", "nV:128:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_maskstored256, "vV8i*V8iV8i", "n", "avx2")			TARGET_BUILTIN(__builtin_ia32_maskstored256, "vV8i*V8iV8i", "nV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_maskstoreq256, "vV4LLi*V4LLiV4LLi", "n", "avx2")			TARGET_BUILTIN(__builtin_ia32_maskstoreq256, "vV4LLi*V4LLiV4LLi", "nV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_maskstored, "vV4i*V4iV4i", "n", "avx2")			TARGET_BUILTIN(__builtin_ia32_maskstored, "vV4i*V4iV4i", "nV:128:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_maskstoreq, "vV2LLi*V2LLiV2LLi", "n", "avx2")			TARGET_BUILTIN(__builtin_ia32_maskstoreq, "vV2LLi*V2LLiV2LLi", "nV:128:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_psllv8si, "V8iV8iV8i", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_psllv8si, "V8iV8iV8i", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_psllv4si, "V4iV4iV4i", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_psllv4si, "V4iV4iV4i", "ncV:128:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_psllv4di, "V4LLiV4LLiV4LLi", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_psllv4di, "V4LLiV4LLiV4LLi", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_psllv2di, "V2LLiV2LLiV2LLi", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_psllv2di, "V2LLiV2LLiV2LLi", "ncV:128:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_psrav8si, "V8iV8iV8i", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_psrav8si, "V8iV8iV8i", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_psrav4si, "V4iV4iV4i", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_psrav4si, "V4iV4iV4i", "ncV:128:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_psrlv8si, "V8iV8iV8i", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_psrlv8si, "V8iV8iV8i", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_psrlv4si, "V4iV4iV4i", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_psrlv4si, "V4iV4iV4i", "ncV:128:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_psrlv4di, "V4LLiV4LLiV4LLi", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_psrlv4di, "V4LLiV4LLiV4LLi", "ncV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_psrlv2di, "V2LLiV2LLiV2LLi", "nc", "avx2")			TARGET_BUILTIN(__builtin_ia32_psrlv2di, "V2LLiV2LLiV2LLi", "ncV:128:", "avx2")

	// GATHER			// GATHER
	TARGET_BUILTIN(__builtin_ia32_gatherd_pd, "V2dV2ddC*V4iV2dIc", "n", "avx2")			TARGET_BUILTIN(__builtin_ia32_gatherd_pd, "V2dV2ddC*V4iV2dIc", "nV:128:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_gatherd_pd256, "V4dV4ddC*V4iV4dIc", "n", "avx2")			TARGET_BUILTIN(__builtin_ia32_gatherd_pd256, "V4dV4ddC*V4iV4dIc", "nV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_gatherq_pd, "V2dV2ddC*V2LLiV2dIc", "n", "avx2")			TARGET_BUILTIN(__builtin_ia32_gatherq_pd, "V2dV2ddC*V2LLiV2dIc", "nV:128:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_gatherq_pd256, "V4dV4ddC*V4LLiV4dIc", "n", "avx2")			TARGET_BUILTIN(__builtin_ia32_gatherq_pd256, "V4dV4ddC*V4LLiV4dIc", "nV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_gatherd_ps, "V4fV4ffC*V4iV4fIc", "n", "avx2")			TARGET_BUILTIN(__builtin_ia32_gatherd_ps, "V4fV4ffC*V4iV4fIc", "nV:128:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_gatherd_ps256, "V8fV8ffC*V8iV8fIc", "n", "avx2")			TARGET_BUILTIN(__builtin_ia32_gatherd_ps256, "V8fV8ffC*V8iV8fIc", "nV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_gatherq_ps, "V4fV4ffC*V2LLiV4fIc", "n", "avx2")			TARGET_BUILTIN(__builtin_ia32_gatherq_ps, "V4fV4ffC*V2LLiV4fIc", "nV:128:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_gatherq_ps256, "V4fV4ffC*V4LLiV4fIc", "n", "avx2")			TARGET_BUILTIN(__builtin_ia32_gatherq_ps256, "V4fV4ffC*V4LLiV4fIc", "nV:256:", "avx2")

	TARGET_BUILTIN(__builtin_ia32_gatherd_q, "V2LLiV2LLiLLiC*V4iV2LLiIc", "n", "avx2")			TARGET_BUILTIN(__builtin_ia32_gatherd_q, "V2LLiV2LLiLLiC*V4iV2LLiIc", "nV:128:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_gatherd_q256, "V4LLiV4LLiLLiC*V4iV4LLiIc", "n", "avx2")			TARGET_BUILTIN(__builtin_ia32_gatherd_q256, "V4LLiV4LLiLLiC*V4iV4LLiIc", "nV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_gatherq_q, "V2LLiV2LLiLLiC*V2LLiV2LLiIc", "n", "avx2")			TARGET_BUILTIN(__builtin_ia32_gatherq_q, "V2LLiV2LLiLLiC*V2LLiV2LLiIc", "nV:128:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_gatherq_q256, "V4LLiV4LLiLLiC*V4LLiV4LLiIc", "n", "avx2")			TARGET_BUILTIN(__builtin_ia32_gatherq_q256, "V4LLiV4LLiLLiC*V4LLiV4LLiIc", "nV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_gatherd_d, "V4iV4iiC*V4iV4iIc", "n", "avx2")			TARGET_BUILTIN(__builtin_ia32_gatherd_d, "V4iV4iiC*V4iV4iIc", "nV:128:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_gatherd_d256, "V8iV8iiC*V8iV8iIc", "n", "avx2")			TARGET_BUILTIN(__builtin_ia32_gatherd_d256, "V8iV8iiC*V8iV8iIc", "nV:256:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_gatherq_d, "V4iV4iiC*V2LLiV4iIc", "n", "avx2")			TARGET_BUILTIN(__builtin_ia32_gatherq_d, "V4iV4iiC*V2LLiV4iIc", "nV:128:", "avx2")
	TARGET_BUILTIN(__builtin_ia32_gatherq_d256, "V4iV4iiC*V4LLiV4iIc", "n", "avx2")			TARGET_BUILTIN(__builtin_ia32_gatherq_d256, "V4iV4iiC*V4LLiV4iIc", "nV:256:", "avx2")

	// F16C			// F16C
	TARGET_BUILTIN(__builtin_ia32_vcvtps2ph, "V8sV4fIi", "nc", "f16c")			TARGET_BUILTIN(__builtin_ia32_vcvtps2ph, "V8sV4fIi", "ncV:128:", "f16c")
	TARGET_BUILTIN(__builtin_ia32_vcvtps2ph256, "V8sV8fIi", "nc", "f16c")			TARGET_BUILTIN(__builtin_ia32_vcvtps2ph256, "V8sV8fIi", "ncV:256:", "f16c")
	TARGET_BUILTIN(__builtin_ia32_vcvtph2ps, "V4fV8s", "nc", "f16c")			TARGET_BUILTIN(__builtin_ia32_vcvtph2ps, "V4fV8s", "ncV:128:", "f16c")
	TARGET_BUILTIN(__builtin_ia32_vcvtph2ps256, "V8fV8s", "nc", "f16c")			TARGET_BUILTIN(__builtin_ia32_vcvtph2ps256, "V8fV8s", "ncV:256:", "f16c")

	// RDRAND			// RDRAND
	TARGET_BUILTIN(__builtin_ia32_rdrand16_step, "UiUs*", "n", "rdrnd")			TARGET_BUILTIN(__builtin_ia32_rdrand16_step, "UiUs*", "n", "rdrnd")
	TARGET_BUILTIN(__builtin_ia32_rdrand32_step, "UiUi*", "n", "rdrnd")			TARGET_BUILTIN(__builtin_ia32_rdrand32_step, "UiUi*", "n", "rdrnd")

	// FXSR			// FXSR
	TARGET_BUILTIN(__builtin_ia32_fxrstor, "vv*", "n", "fxsr")			TARGET_BUILTIN(__builtin_ia32_fxrstor, "vv*", "n", "fxsr")
	TARGET_BUILTIN(__builtin_ia32_fxsave, "vv*", "n", "fxsr")			TARGET_BUILTIN(__builtin_ia32_fxsave, "vv*", "n", "fxsr")
	▲ Show 20 Lines • Show All 48 Lines • ▼ Show 20 Lines

	// LWP			// LWP
	TARGET_BUILTIN(__builtin_ia32_llwpcb, "vv*", "n", "lwp")			TARGET_BUILTIN(__builtin_ia32_llwpcb, "vv*", "n", "lwp")
	TARGET_BUILTIN(__builtin_ia32_slwpcb, "v*", "n", "lwp")			TARGET_BUILTIN(__builtin_ia32_slwpcb, "v*", "n", "lwp")
	TARGET_BUILTIN(__builtin_ia32_lwpins32, "UcUiUiUi", "n", "lwp")			TARGET_BUILTIN(__builtin_ia32_lwpins32, "UcUiUiUi", "n", "lwp")
	TARGET_BUILTIN(__builtin_ia32_lwpval32, "vUiUiUi", "n", "lwp")			TARGET_BUILTIN(__builtin_ia32_lwpval32, "vUiUiUi", "n", "lwp")

	// SHA			// SHA
	TARGET_BUILTIN(__builtin_ia32_sha1rnds4, "V4iV4iV4iIc", "nc", "sha")			TARGET_BUILTIN(__builtin_ia32_sha1rnds4, "V4iV4iV4iIc", "ncV:128:", "sha")
	TARGET_BUILTIN(__builtin_ia32_sha1nexte, "V4iV4iV4i", "nc", "sha")			TARGET_BUILTIN(__builtin_ia32_sha1nexte, "V4iV4iV4i", "ncV:128:", "sha")
	TARGET_BUILTIN(__builtin_ia32_sha1msg1, "V4iV4iV4i", "nc", "sha")			TARGET_BUILTIN(__builtin_ia32_sha1msg1, "V4iV4iV4i", "ncV:128:", "sha")
	TARGET_BUILTIN(__builtin_ia32_sha1msg2, "V4iV4iV4i", "nc", "sha")			TARGET_BUILTIN(__builtin_ia32_sha1msg2, "V4iV4iV4i", "ncV:128:", "sha")
	TARGET_BUILTIN(__builtin_ia32_sha256rnds2, "V4iV4iV4iV4i", "nc", "sha")			TARGET_BUILTIN(__builtin_ia32_sha256rnds2, "V4iV4iV4iV4i", "ncV:128:", "sha")
	TARGET_BUILTIN(__builtin_ia32_sha256msg1, "V4iV4iV4i", "nc", "sha")			TARGET_BUILTIN(__builtin_ia32_sha256msg1, "V4iV4iV4i", "ncV:128:", "sha")
	TARGET_BUILTIN(__builtin_ia32_sha256msg2, "V4iV4iV4i", "nc", "sha")			TARGET_BUILTIN(__builtin_ia32_sha256msg2, "V4iV4iV4i", "ncV:128:", "sha")

	// FMA			// FMA
	TARGET_BUILTIN(__builtin_ia32_vfmaddps, "V4fV4fV4fV4f", "nc", "fma\|fma4")			TARGET_BUILTIN(__builtin_ia32_vfmaddps, "V4fV4fV4fV4f", "ncV:128:", "fma\|fma4")
	TARGET_BUILTIN(__builtin_ia32_vfmaddpd, "V2dV2dV2dV2d", "nc", "fma\|fma4")			TARGET_BUILTIN(__builtin_ia32_vfmaddpd, "V2dV2dV2dV2d", "ncV:128:", "fma\|fma4")
	TARGET_BUILTIN(__builtin_ia32_vfmaddss3, "V4fV4fV4fV4f", "nc", "fma")			TARGET_BUILTIN(__builtin_ia32_vfmaddss3, "V4fV4fV4fV4f", "ncV:128:", "fma")
	TARGET_BUILTIN(__builtin_ia32_vfmaddsd3, "V2dV2dV2dV2d", "nc", "fma")			TARGET_BUILTIN(__builtin_ia32_vfmaddsd3, "V2dV2dV2dV2d", "ncV:128:", "fma")
	TARGET_BUILTIN(__builtin_ia32_vfmaddss, "V4fV4fV4fV4f", "nc", "fma4")			TARGET_BUILTIN(__builtin_ia32_vfmaddss, "V4fV4fV4fV4f", "ncV:128:", "fma4")
	TARGET_BUILTIN(__builtin_ia32_vfmaddsd, "V2dV2dV2dV2d", "nc", "fma4")			TARGET_BUILTIN(__builtin_ia32_vfmaddsd, "V2dV2dV2dV2d", "ncV:128:", "fma4")
	TARGET_BUILTIN(__builtin_ia32_vfmaddsubps, "V4fV4fV4fV4f", "nc", "fma\|fma4")			TARGET_BUILTIN(__builtin_ia32_vfmaddsubps, "V4fV4fV4fV4f", "ncV:128:", "fma\|fma4")
	TARGET_BUILTIN(__builtin_ia32_vfmaddsubpd, "V2dV2dV2dV2d", "nc", "fma\|fma4")			TARGET_BUILTIN(__builtin_ia32_vfmaddsubpd, "V2dV2dV2dV2d", "ncV:128:", "fma\|fma4")
	TARGET_BUILTIN(__builtin_ia32_vfmaddps256, "V8fV8fV8fV8f", "nc", "fma\|fma4")			TARGET_BUILTIN(__builtin_ia32_vfmaddps256, "V8fV8fV8fV8f", "ncV:256:", "fma\|fma4")
	TARGET_BUILTIN(__builtin_ia32_vfmaddpd256, "V4dV4dV4dV4d", "nc", "fma\|fma4")			TARGET_BUILTIN(__builtin_ia32_vfmaddpd256, "V4dV4dV4dV4d", "ncV:256:", "fma\|fma4")
	TARGET_BUILTIN(__builtin_ia32_vfmaddsubps256, "V8fV8fV8fV8f", "nc", "fma\|fma4")			TARGET_BUILTIN(__builtin_ia32_vfmaddsubps256, "V8fV8fV8fV8f", "ncV:256:", "fma\|fma4")
	TARGET_BUILTIN(__builtin_ia32_vfmaddsubpd256, "V4dV4dV4dV4d", "nc", "fma\|fma4")			TARGET_BUILTIN(__builtin_ia32_vfmaddsubpd256, "V4dV4dV4dV4d", "ncV:256:", "fma\|fma4")

	TARGET_BUILTIN(__builtin_ia32_vfmaddpd512_mask, "V8dV8dV8dV8dUcIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_vfmaddpd512_mask, "V8dV8dV8dV8dUcIi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_vfmaddpd512_maskz, "V8dV8dV8dV8dUcIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_vfmaddpd512_maskz, "V8dV8dV8dV8dUcIi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_vfmaddpd512_mask3, "V8dV8dV8dV8dUcIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_vfmaddpd512_mask3, "V8dV8dV8dV8dUcIi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_vfmsubpd512_mask3, "V8dV8dV8dV8dUcIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_vfmsubpd512_mask3, "V8dV8dV8dV8dUcIi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_vfmaddps512_mask, "V16fV16fV16fV16fUsIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_vfmaddps512_mask, "V16fV16fV16fV16fUsIi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_vfmaddps512_maskz, "V16fV16fV16fV16fUsIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_vfmaddps512_maskz, "V16fV16fV16fV16fUsIi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_vfmaddps512_mask3, "V16fV16fV16fV16fUsIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_vfmaddps512_mask3, "V16fV16fV16fV16fUsIi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_vfmsubps512_mask3, "V16fV16fV16fV16fUsIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_vfmsubps512_mask3, "V16fV16fV16fV16fUsIi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_vfmaddsubpd512_mask, "V8dV8dV8dV8dUcIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_vfmaddsubpd512_mask, "V8dV8dV8dV8dUcIi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_vfmaddsubpd512_maskz, "V8dV8dV8dV8dUcIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_vfmaddsubpd512_maskz, "V8dV8dV8dV8dUcIi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_vfmaddsubpd512_mask3, "V8dV8dV8dV8dUcIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_vfmaddsubpd512_mask3, "V8dV8dV8dV8dUcIi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_vfmsubaddpd512_mask3, "V8dV8dV8dV8dUcIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_vfmsubaddpd512_mask3, "V8dV8dV8dV8dUcIi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_vfmaddsubps512_mask, "V16fV16fV16fV16fUsIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_vfmaddsubps512_mask, "V16fV16fV16fV16fUsIi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_vfmaddsubps512_maskz, "V16fV16fV16fV16fUsIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_vfmaddsubps512_maskz, "V16fV16fV16fV16fUsIi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_vfmaddsubps512_mask3, "V16fV16fV16fV16fUsIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_vfmaddsubps512_mask3, "V16fV16fV16fV16fUsIi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_vfmsubaddps512_mask3, "V16fV16fV16fV16fUsIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_vfmsubaddps512_mask3, "V16fV16fV16fV16fUsIi", "ncV:512:", "avx512f")

	// XOP			// XOP
	TARGET_BUILTIN(__builtin_ia32_vpmacssww, "V8sV8sV8sV8s", "nc", "xop")			TARGET_BUILTIN(__builtin_ia32_vpmacssww, "V8sV8sV8sV8s", "ncV:128:", "xop")
	TARGET_BUILTIN(__builtin_ia32_vpmacsww, "V8sV8sV8sV8s", "nc", "xop")			TARGET_BUILTIN(__builtin_ia32_vpmacsww, "V8sV8sV8sV8s", "ncV:128:", "xop")
	TARGET_BUILTIN(__builtin_ia32_vpmacsswd, "V4iV8sV8sV4i", "nc", "xop")			TARGET_BUILTIN(__builtin_ia32_vpmacsswd, "V4iV8sV8sV4i", "ncV:128:", "xop")
	TARGET_BUILTIN(__builtin_ia32_vpmacswd, "V4iV8sV8sV4i", "nc", "xop")			TARGET_BUILTIN(__builtin_ia32_vpmacswd, "V4iV8sV8sV4i", "ncV:128:", "xop")
	TARGET_BUILTIN(__builtin_ia32_vpmacssdd, "V4iV4iV4iV4i", "nc", "xop")			TARGET_BUILTIN(__builtin_ia32_vpmacssdd, "V4iV4iV4iV4i", "ncV:128:", "xop")
	TARGET_BUILTIN(__builtin_ia32_vpmacsdd, "V4iV4iV4iV4i", "nc", "xop")			TARGET_BUILTIN(__builtin_ia32_vpmacsdd, "V4iV4iV4iV4i", "ncV:128:", "xop")
	TARGET_BUILTIN(__builtin_ia32_vpmacssdql, "V2LLiV4iV4iV2LLi", "nc", "xop")			TARGET_BUILTIN(__builtin_ia32_vpmacssdql, "V2LLiV4iV4iV2LLi", "ncV:128:", "xop")
	TARGET_BUILTIN(__builtin_ia32_vpmacsdql, "V2LLiV4iV4iV2LLi", "nc", "xop")			TARGET_BUILTIN(__builtin_ia32_vpmacsdql, "V2LLiV4iV4iV2LLi", "ncV:128:", "xop")
	TARGET_BUILTIN(__builtin_ia32_vpmacssdqh, "V2LLiV4iV4iV2LLi", "nc", "xop")			TARGET_BUILTIN(__builtin_ia32_vpmacssdqh, "V2LLiV4iV4iV2LLi", "ncV:128:", "xop")
	TARGET_BUILTIN(__builtin_ia32_vpmacsdqh, "V2LLiV4iV4iV2LLi", "nc", "xop")			TARGET_BUILTIN(__builtin_ia32_vpmacsdqh, "V2LLiV4iV4iV2LLi", "ncV:128:", "xop")
	TARGET_BUILTIN(__builtin_ia32_vpmadcsswd, "V4iV8sV8sV4i", "nc", "xop")			TARGET_BUILTIN(__builtin_ia32_vpmadcsswd, "V4iV8sV8sV4i", "ncV:128:", "xop")
	TARGET_BUILTIN(__builtin_ia32_vpmadcswd, "V4iV8sV8sV4i", "nc", "xop")			TARGET_BUILTIN(__builtin_ia32_vpmadcswd, "V4iV8sV8sV4i", "ncV:128:", "xop")

	TARGET_BUILTIN(__builtin_ia32_vphaddbw, "V8sV16c", "nc", "xop")			TARGET_BUILTIN(__builtin_ia32_vphaddbw, "V8sV16c", "ncV:128:", "xop")
	TARGET_BUILTIN(__builtin_ia32_vphaddbd, "V4iV16c", "nc", "xop")			TARGET_BUILTIN(__builtin_ia32_vphaddbd, "V4iV16c", "ncV:128:", "xop")
	TARGET_BUILTIN(__builtin_ia32_vphaddbq, "V2LLiV16c", "nc", "xop")			TARGET_BUILTIN(__builtin_ia32_vphaddbq, "V2LLiV16c", "ncV:128:", "xop")
	TARGET_BUILTIN(__builtin_ia32_vphaddwd, "V4iV8s", "nc", "xop")			TARGET_BUILTIN(__builtin_ia32_vphaddwd, "V4iV8s", "ncV:128:", "xop")
	TARGET_BUILTIN(__builtin_ia32_vphaddwq, "V2LLiV8s", "nc", "xop")			TARGET_BUILTIN(__builtin_ia32_vphaddwq, "V2LLiV8s", "ncV:128:", "xop")
	TARGET_BUILTIN(__builtin_ia32_vphadddq, "V2LLiV4i", "nc", "xop")			TARGET_BUILTIN(__builtin_ia32_vphadddq, "V2LLiV4i", "ncV:128:", "xop")
	TARGET_BUILTIN(__builtin_ia32_vphaddubw, "V8sV16c", "nc", "xop")			TARGET_BUILTIN(__builtin_ia32_vphaddubw, "V8sV16c", "ncV:128:", "xop")
	TARGET_BUILTIN(__builtin_ia32_vphaddubd, "V4iV16c", "nc", "xop")			TARGET_BUILTIN(__builtin_ia32_vphaddubd, "V4iV16c", "ncV:128:", "xop")
	TARGET_BUILTIN(__builtin_ia32_vphaddubq, "V2LLiV16c", "nc", "xop")			TARGET_BUILTIN(__builtin_ia32_vphaddubq, "V2LLiV16c", "ncV:128:", "xop")
	TARGET_BUILTIN(__builtin_ia32_vphadduwd, "V4iV8s", "nc", "xop")			TARGET_BUILTIN(__builtin_ia32_vphadduwd, "V4iV8s", "ncV:128:", "xop")
	TARGET_BUILTIN(__builtin_ia32_vphadduwq, "V2LLiV8s", "nc", "xop")			TARGET_BUILTIN(__builtin_ia32_vphadduwq, "V2LLiV8s", "ncV:128:", "xop")
	TARGET_BUILTIN(__builtin_ia32_vphaddudq, "V2LLiV4i", "nc", "xop")			TARGET_BUILTIN(__builtin_ia32_vphaddudq, "V2LLiV4i", "ncV:128:", "xop")
	TARGET_BUILTIN(__builtin_ia32_vphsubbw, "V8sV16c", "nc", "xop")			TARGET_BUILTIN(__builtin_ia32_vphsubbw, "V8sV16c", "ncV:128:", "xop")
	TARGET_BUILTIN(__builtin_ia32_vphsubwd, "V4iV8s", "nc", "xop")			TARGET_BUILTIN(__builtin_ia32_vphsubwd, "V4iV8s", "ncV:128:", "xop")
	TARGET_BUILTIN(__builtin_ia32_vphsubdq, "V2LLiV4i", "nc", "xop")			TARGET_BUILTIN(__builtin_ia32_vphsubdq, "V2LLiV4i", "ncV:128:", "xop")
	TARGET_BUILTIN(__builtin_ia32_vpperm, "V16cV16cV16cV16c", "nc", "xop")			TARGET_BUILTIN(__builtin_ia32_vpperm, "V16cV16cV16cV16c", "ncV:128:", "xop")
	TARGET_BUILTIN(__builtin_ia32_vprotb, "V16cV16cV16c", "nc", "xop")			TARGET_BUILTIN(__builtin_ia32_vprotb, "V16cV16cV16c", "ncV:128:", "xop")
	TARGET_BUILTIN(__builtin_ia32_vprotw, "V8sV8sV8s", "nc", "xop")			TARGET_BUILTIN(__builtin_ia32_vprotw, "V8sV8sV8s", "ncV:128:", "xop")
	TARGET_BUILTIN(__builtin_ia32_vprotd, "V4iV4iV4i", "nc", "xop")			TARGET_BUILTIN(__builtin_ia32_vprotd, "V4iV4iV4i", "ncV:128:", "xop")
	TARGET_BUILTIN(__builtin_ia32_vprotq, "V2LLiV2LLiV2LLi", "nc", "xop")			TARGET_BUILTIN(__builtin_ia32_vprotq, "V2LLiV2LLiV2LLi", "ncV:128:", "xop")
	TARGET_BUILTIN(__builtin_ia32_vprotbi, "V16cV16cIc", "nc", "xop")			TARGET_BUILTIN(__builtin_ia32_vprotbi, "V16cV16cIc", "ncV:128:", "xop")
	TARGET_BUILTIN(__builtin_ia32_vprotwi, "V8sV8sIc", "nc", "xop")			TARGET_BUILTIN(__builtin_ia32_vprotwi, "V8sV8sIc", "ncV:128:", "xop")
	TARGET_BUILTIN(__builtin_ia32_vprotdi, "V4iV4iIc", "nc", "xop")			TARGET_BUILTIN(__builtin_ia32_vprotdi, "V4iV4iIc", "ncV:128:", "xop")
	TARGET_BUILTIN(__builtin_ia32_vprotqi, "V2LLiV2LLiIc", "nc", "xop")			TARGET_BUILTIN(__builtin_ia32_vprotqi, "V2LLiV2LLiIc", "ncV:128:", "xop")
	TARGET_BUILTIN(__builtin_ia32_vpshlb, "V16cV16cV16c", "nc", "xop")			TARGET_BUILTIN(__builtin_ia32_vpshlb, "V16cV16cV16c", "ncV:128:", "xop")
	TARGET_BUILTIN(__builtin_ia32_vpshlw, "V8sV8sV8s", "nc", "xop")			TARGET_BUILTIN(__builtin_ia32_vpshlw, "V8sV8sV8s", "ncV:128:", "xop")
	TARGET_BUILTIN(__builtin_ia32_vpshld, "V4iV4iV4i", "nc", "xop")			TARGET_BUILTIN(__builtin_ia32_vpshld, "V4iV4iV4i", "ncV:128:", "xop")
	TARGET_BUILTIN(__builtin_ia32_vpshlq, "V2LLiV2LLiV2LLi", "nc", "xop")			TARGET_BUILTIN(__builtin_ia32_vpshlq, "V2LLiV2LLiV2LLi", "ncV:128:", "xop")
	TARGET_BUILTIN(__builtin_ia32_vpshab, "V16cV16cV16c", "nc", "xop")			TARGET_BUILTIN(__builtin_ia32_vpshab, "V16cV16cV16c", "ncV:128:", "xop")
	TARGET_BUILTIN(__builtin_ia32_vpshaw, "V8sV8sV8s", "nc", "xop")			TARGET_BUILTIN(__builtin_ia32_vpshaw, "V8sV8sV8s", "ncV:128:", "xop")
	TARGET_BUILTIN(__builtin_ia32_vpshad, "V4iV4iV4i", "nc", "xop")			TARGET_BUILTIN(__builtin_ia32_vpshad, "V4iV4iV4i", "ncV:128:", "xop")
	TARGET_BUILTIN(__builtin_ia32_vpshaq, "V2LLiV2LLiV2LLi", "nc", "xop")			TARGET_BUILTIN(__builtin_ia32_vpshaq, "V2LLiV2LLiV2LLi", "ncV:128:", "xop")
	TARGET_BUILTIN(__builtin_ia32_vpcomub, "V16cV16cV16cIc", "nc", "xop")			TARGET_BUILTIN(__builtin_ia32_vpcomub, "V16cV16cV16cIc", "ncV:128:", "xop")
	TARGET_BUILTIN(__builtin_ia32_vpcomuw, "V8sV8sV8sIc", "nc", "xop")			TARGET_BUILTIN(__builtin_ia32_vpcomuw, "V8sV8sV8sIc", "ncV:128:", "xop")
	TARGET_BUILTIN(__builtin_ia32_vpcomud, "V4iV4iV4iIc", "nc", "xop")			TARGET_BUILTIN(__builtin_ia32_vpcomud, "V4iV4iV4iIc", "ncV:128:", "xop")
	TARGET_BUILTIN(__builtin_ia32_vpcomuq, "V2LLiV2LLiV2LLiIc", "nc", "xop")			TARGET_BUILTIN(__builtin_ia32_vpcomuq, "V2LLiV2LLiV2LLiIc", "ncV:128:", "xop")
	TARGET_BUILTIN(__builtin_ia32_vpcomb, "V16cV16cV16cIc", "nc", "xop")			TARGET_BUILTIN(__builtin_ia32_vpcomb, "V16cV16cV16cIc", "ncV:128:", "xop")
	TARGET_BUILTIN(__builtin_ia32_vpcomw, "V8sV8sV8sIc", "nc", "xop")			TARGET_BUILTIN(__builtin_ia32_vpcomw, "V8sV8sV8sIc", "ncV:128:", "xop")
	TARGET_BUILTIN(__builtin_ia32_vpcomd, "V4iV4iV4iIc", "nc", "xop")			TARGET_BUILTIN(__builtin_ia32_vpcomd, "V4iV4iV4iIc", "ncV:128:", "xop")
	TARGET_BUILTIN(__builtin_ia32_vpcomq, "V2LLiV2LLiV2LLiIc", "nc", "xop")			TARGET_BUILTIN(__builtin_ia32_vpcomq, "V2LLiV2LLiV2LLiIc", "ncV:128:", "xop")
	TARGET_BUILTIN(__builtin_ia32_vpermil2pd, "V2dV2dV2dV2LLiIc", "nc", "xop")			TARGET_BUILTIN(__builtin_ia32_vpermil2pd, "V2dV2dV2dV2LLiIc", "ncV:128:", "xop")
	TARGET_BUILTIN(__builtin_ia32_vpermil2pd256, "V4dV4dV4dV4LLiIc", "nc", "xop")			TARGET_BUILTIN(__builtin_ia32_vpermil2pd256, "V4dV4dV4dV4LLiIc", "ncV:256:", "xop")
	TARGET_BUILTIN(__builtin_ia32_vpermil2ps, "V4fV4fV4fV4iIc", "nc", "xop")			TARGET_BUILTIN(__builtin_ia32_vpermil2ps, "V4fV4fV4fV4iIc", "ncV:128:", "xop")
	TARGET_BUILTIN(__builtin_ia32_vpermil2ps256, "V8fV8fV8fV8iIc", "nc", "xop")			TARGET_BUILTIN(__builtin_ia32_vpermil2ps256, "V8fV8fV8fV8iIc", "ncV:256:", "xop")
	TARGET_BUILTIN(__builtin_ia32_vfrczss, "V4fV4f", "nc", "xop")			TARGET_BUILTIN(__builtin_ia32_vfrczss, "V4fV4f", "ncV:128:", "xop")
	TARGET_BUILTIN(__builtin_ia32_vfrczsd, "V2dV2d", "nc", "xop")			TARGET_BUILTIN(__builtin_ia32_vfrczsd, "V2dV2d", "ncV:128:", "xop")
	TARGET_BUILTIN(__builtin_ia32_vfrczps, "V4fV4f", "nc", "xop")			TARGET_BUILTIN(__builtin_ia32_vfrczps, "V4fV4f", "ncV:128:", "xop")
	TARGET_BUILTIN(__builtin_ia32_vfrczpd, "V2dV2d", "nc", "xop")			TARGET_BUILTIN(__builtin_ia32_vfrczpd, "V2dV2d", "ncV:128:", "xop")
	TARGET_BUILTIN(__builtin_ia32_vfrczps256, "V8fV8f", "nc", "xop")			TARGET_BUILTIN(__builtin_ia32_vfrczps256, "V8fV8f", "ncV:256:", "xop")
	TARGET_BUILTIN(__builtin_ia32_vfrczpd256, "V4dV4d", "nc", "xop")			TARGET_BUILTIN(__builtin_ia32_vfrczpd256, "V4dV4d", "ncV:256:", "xop")

	TARGET_BUILTIN(__builtin_ia32_xbegin, "i", "n", "rtm")			TARGET_BUILTIN(__builtin_ia32_xbegin, "i", "n", "rtm")
	TARGET_BUILTIN(__builtin_ia32_xend, "v", "n", "rtm")			TARGET_BUILTIN(__builtin_ia32_xend, "v", "n", "rtm")
	TARGET_BUILTIN(__builtin_ia32_xabort, "vIc", "n", "rtm")			TARGET_BUILTIN(__builtin_ia32_xabort, "vIc", "n", "rtm")
	TARGET_BUILTIN(__builtin_ia32_xtest, "i", "n", "rtm")			TARGET_BUILTIN(__builtin_ia32_xtest, "i", "n", "rtm")

	BUILTIN(__builtin_ia32_rdpmc, "ULLii", "")			BUILTIN(__builtin_ia32_rdpmc, "ULLii", "")
	BUILTIN(__builtin_ia32_rdtsc, "ULLi", "")			BUILTIN(__builtin_ia32_rdtsc, "ULLi", "")
	BUILTIN(__rdtsc, "ULLi", "")			BUILTIN(__rdtsc, "ULLi", "")
	BUILTIN(__builtin_ia32_rdtscp, "ULLiUi*", "")			BUILTIN(__builtin_ia32_rdtscp, "ULLiUi*", "")

	TARGET_BUILTIN(__builtin_ia32_rdpid, "Ui", "n", "rdpid")			TARGET_BUILTIN(__builtin_ia32_rdpid, "Ui", "n", "rdpid")

	// PKU			// PKU
	TARGET_BUILTIN(__builtin_ia32_rdpkru, "Ui", "n", "pku")			TARGET_BUILTIN(__builtin_ia32_rdpkru, "Ui", "n", "pku")
	TARGET_BUILTIN(__builtin_ia32_wrpkru, "vUi", "n", "pku")			TARGET_BUILTIN(__builtin_ia32_wrpkru, "vUi", "n", "pku")

	// AVX-512			// AVX-512
	TARGET_BUILTIN(__builtin_ia32_sqrtpd512_mask, "V8dV8dV8dUcIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_sqrtpd512_mask, "V8dV8dV8dUcIi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_sqrtps512_mask, "V16fV16fV16fUsIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_sqrtps512_mask, "V16fV16fV16fUsIi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_rsqrt14sd_mask, "V2dV2dV2dV2dUc", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_rsqrt14sd_mask, "V2dV2dV2dV2dUc", "ncV:128:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_rsqrt14ss_mask, "V4fV4fV4fV4fUc", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_rsqrt14ss_mask, "V4fV4fV4fV4fUc", "ncV:128:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_rsqrt14pd512_mask, "V8dV8dV8dUc", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_rsqrt14pd512_mask, "V8dV8dV8dUc", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_rsqrt14ps512_mask, "V16fV16fV16fUs", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_rsqrt14ps512_mask, "V16fV16fV16fUs", "ncV:512:", "avx512f")

	TARGET_BUILTIN(__builtin_ia32_rsqrt28sd_round_mask, "V2dV2dV2dV2dUcIi", "nc", "avx512er")			TARGET_BUILTIN(__builtin_ia32_rsqrt28sd_round_mask, "V2dV2dV2dV2dUcIi", "ncV:128:", "avx512er")
	TARGET_BUILTIN(__builtin_ia32_rsqrt28ss_round_mask, "V4fV4fV4fV4fUcIi", "nc", "avx512er")			TARGET_BUILTIN(__builtin_ia32_rsqrt28ss_round_mask, "V4fV4fV4fV4fUcIi", "ncV:128:", "avx512er")
	TARGET_BUILTIN(__builtin_ia32_rsqrt28pd_mask, "V8dV8dV8dUcIi", "nc", "avx512er")			TARGET_BUILTIN(__builtin_ia32_rsqrt28pd_mask, "V8dV8dV8dUcIi", "ncV:512:", "avx512er")
	TARGET_BUILTIN(__builtin_ia32_rsqrt28ps_mask, "V16fV16fV16fUsIi", "nc", "avx512er")			TARGET_BUILTIN(__builtin_ia32_rsqrt28ps_mask, "V16fV16fV16fUsIi", "ncV:512:", "avx512er")

	TARGET_BUILTIN(__builtin_ia32_rcp14sd_mask, "V2dV2dV2dV2dUc", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_rcp14sd_mask, "V2dV2dV2dV2dUc", "ncV:128:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_rcp14ss_mask, "V4fV4fV4fV4fUc", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_rcp14ss_mask, "V4fV4fV4fV4fUc", "ncV:128:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_rcp14pd512_mask, "V8dV8dV8dUc", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_rcp14pd512_mask, "V8dV8dV8dUc", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_rcp14ps512_mask, "V16fV16fV16fUs", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_rcp14ps512_mask, "V16fV16fV16fUs", "ncV:512:", "avx512f")

	TARGET_BUILTIN(__builtin_ia32_rcp28sd_round_mask, "V2dV2dV2dV2dUcIi", "nc", "avx512er")			TARGET_BUILTIN(__builtin_ia32_rcp28sd_round_mask, "V2dV2dV2dV2dUcIi", "ncV:128:", "avx512er")
	TARGET_BUILTIN(__builtin_ia32_rcp28ss_round_mask, "V4fV4fV4fV4fUcIi", "nc", "avx512er")			TARGET_BUILTIN(__builtin_ia32_rcp28ss_round_mask, "V4fV4fV4fV4fUcIi", "ncV:128:", "avx512er")
	TARGET_BUILTIN(__builtin_ia32_rcp28pd_mask, "V8dV8dV8dUcIi", "nc", "avx512er")			TARGET_BUILTIN(__builtin_ia32_rcp28pd_mask, "V8dV8dV8dUcIi", "ncV:512:", "avx512er")
	TARGET_BUILTIN(__builtin_ia32_rcp28ps_mask, "V16fV16fV16fUsIi", "nc", "avx512er")			TARGET_BUILTIN(__builtin_ia32_rcp28ps_mask, "V16fV16fV16fUsIi", "ncV:512:", "avx512er")
	TARGET_BUILTIN(__builtin_ia32_exp2pd_mask, "V8dV8dV8dUcIi", "nc", "avx512er")			TARGET_BUILTIN(__builtin_ia32_exp2pd_mask, "V8dV8dV8dUcIi", "ncV:512:", "avx512er")
	TARGET_BUILTIN(__builtin_ia32_exp2ps_mask, "V16fV16fV16fUsIi", "nc", "avx512er")			TARGET_BUILTIN(__builtin_ia32_exp2ps_mask, "V16fV16fV16fUsIi", "ncV:512:", "avx512er")

	TARGET_BUILTIN(__builtin_ia32_cvttps2dq512_mask, "V16iV16fV16iUsIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_cvttps2dq512_mask, "V16iV16fV16iUsIi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_cvttps2udq512_mask, "V16iV16fV16iUsIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_cvttps2udq512_mask, "V16iV16fV16iUsIi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_cvttpd2dq512_mask, "V8iV8dV8iUcIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_cvttpd2dq512_mask, "V8iV8dV8iUcIi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_cvttpd2udq512_mask, "V8iV8dV8iUcIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_cvttpd2udq512_mask, "V8iV8dV8iUcIi", "ncV:512:", "avx512f")

	TARGET_BUILTIN(__builtin_ia32_cmpps512_mask, "UsV16fV16fIiUsIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_cmpps512_mask, "UsV16fV16fIiUsIi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_cmpps256_mask, "UcV8fV8fIiUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_cmpps256_mask, "UcV8fV8fIiUc", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_cmpps128_mask, "UcV4fV4fIiUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_cmpps128_mask, "UcV4fV4fIiUc", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_cmppd512_mask, "UcV8dV8dIiUcIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_cmppd512_mask, "UcV8dV8dIiUcIi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_cmppd256_mask, "UcV4dV4dIiUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_cmppd256_mask, "UcV4dV4dIiUc", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_cmppd128_mask, "UcV2dV2dIiUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_cmppd128_mask, "UcV2dV2dIiUc", "ncV:128:", "avx512vl")

	TARGET_BUILTIN(__builtin_ia32_rndscaleps_mask, "V16fV16fIiV16fUsIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_rndscaleps_mask, "V16fV16fIiV16fUsIi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_rndscalepd_mask, "V8dV8dIiV8dUcIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_rndscalepd_mask, "V8dV8dIiV8dUcIi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_cvtps2dq512_mask, "V16iV16fV16iUsIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_cvtps2dq512_mask, "V16iV16fV16iUsIi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_cvtpd2dq512_mask, "V8iV8dV8iUcIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_cvtpd2dq512_mask, "V8iV8dV8iUcIi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_cvtps2udq512_mask, "V16iV16fV16iUsIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_cvtps2udq512_mask, "V16iV16fV16iUsIi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_cvtpd2udq512_mask, "V8iV8dV8iUcIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_cvtpd2udq512_mask, "V8iV8dV8iUcIi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_minps512, "V16fV16fV16fIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_minps512, "V16fV16fV16fIi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_minpd512, "V8dV8dV8dIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_minpd512, "V8dV8dV8dIi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_maxps512, "V16fV16fV16fIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_maxps512, "V16fV16fV16fIi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_maxpd512, "V8dV8dV8dIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_maxpd512, "V8dV8dV8dIi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_cvtdq2ps512_mask, "V16fV16iV16fUsIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_cvtdq2ps512_mask, "V16fV16iV16fUsIi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_cvtudq2ps512_mask, "V16fV16iV16fUsIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_cvtudq2ps512_mask, "V16fV16iV16fUsIi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_cvtpd2ps512_mask, "V8fV8dV8fUcIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_cvtpd2ps512_mask, "V8fV8dV8fUcIi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_vcvtps2ph512_mask, "V16sV16fIiV16sUs", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_vcvtps2ph512_mask, "V16sV16fIiV16sUs", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_vcvtph2ps512_mask, "V16fV16sV16fUsIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_vcvtph2ps512_mask, "V16fV16sV16fUsIi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_pabsd512, "V16iV16i", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_pabsd512, "V16iV16i", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_pabsq512, "V8LLiV8LLi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_pabsq512, "V8LLiV8LLi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_pmaxsd512, "V16iV16iV16i", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_pmaxsd512, "V16iV16iV16i", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_pmaxsq512, "V8LLiV8LLiV8LLi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_pmaxsq512, "V8LLiV8LLiV8LLi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_pmaxud512, "V16iV16iV16i", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_pmaxud512, "V16iV16iV16i", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_pmaxuq512, "V8LLiV8LLiV8LLi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_pmaxuq512, "V8LLiV8LLiV8LLi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_pminsd512, "V16iV16iV16i", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_pminsd512, "V16iV16iV16i", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_pminsq512, "V8LLiV8LLiV8LLi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_pminsq512, "V8LLiV8LLiV8LLi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_pminud512, "V16iV16iV16i", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_pminud512, "V16iV16iV16i", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_pminuq512, "V8LLiV8LLiV8LLi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_pminuq512, "V8LLiV8LLiV8LLi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_pmuldq512, "V8LLiV16iV16i", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_pmuldq512, "V8LLiV16iV16i", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_pmuludq512, "V8LLiV16iV16i", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_pmuludq512, "V8LLiV16iV16i", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_loaddqusi512_mask, "V16iiC*V16iUs", "n", "avx512f")			TARGET_BUILTIN(__builtin_ia32_loaddqusi512_mask, "V16iiC*V16iUs", "nV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_loaddqudi512_mask, "V8LLiLLiC*V8LLiUc", "n", "avx512f")			TARGET_BUILTIN(__builtin_ia32_loaddqudi512_mask, "V8LLiLLiC*V8LLiUc", "nV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_loadups512_mask, "V16ffC*V16fUs", "n", "avx512f")			TARGET_BUILTIN(__builtin_ia32_loadups512_mask, "V16ffC*V16fUs", "nV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_loadaps512_mask, "V16fV16fC*V16fUs", "n", "avx512f")			TARGET_BUILTIN(__builtin_ia32_loadaps512_mask, "V16fV16fC*V16fUs", "nV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_loadupd512_mask, "V8ddC*V8dUc", "n", "avx512f")			TARGET_BUILTIN(__builtin_ia32_loadupd512_mask, "V8ddC*V8dUc", "nV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_loadapd512_mask, "V8dV8dC*V8dUc", "n", "avx512f")			TARGET_BUILTIN(__builtin_ia32_loadapd512_mask, "V8dV8dC*V8dUc", "nV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_storedqudi512_mask, "vLLi*V8LLiUc", "n", "avx512f")			TARGET_BUILTIN(__builtin_ia32_storedqudi512_mask, "vLLi*V8LLiUc", "nV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_storedqusi512_mask, "vi*V16iUs", "n", "avx512f")			TARGET_BUILTIN(__builtin_ia32_storedqusi512_mask, "vi*V16iUs", "nV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_storeupd512_mask, "vd*V8dUc", "n", "avx512f")			TARGET_BUILTIN(__builtin_ia32_storeupd512_mask, "vd*V8dUc", "nV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_storeapd512_mask, "vV8d*V8dUc", "n", "avx512f")			TARGET_BUILTIN(__builtin_ia32_storeapd512_mask, "vV8d*V8dUc", "nV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_storeups512_mask, "vf*V16fUs", "n", "avx512f")			TARGET_BUILTIN(__builtin_ia32_storeups512_mask, "vf*V16fUs", "nV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_storeaps512_mask, "vV16f*V16fUs", "n", "avx512f")			TARGET_BUILTIN(__builtin_ia32_storeaps512_mask, "vV16f*V16fUs", "nV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_alignq512, "V8LLiV8LLiV8LLiIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_alignq512, "V8LLiV8LLiV8LLiIi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_alignd512, "V16iV16iV16iIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_alignd512, "V16iV16iV16iIi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_alignd128, "V4iV4iV4iIi", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_alignd128, "V4iV4iV4iIi", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_alignd256, "V8iV8iV8iIi", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_alignd256, "V8iV8iV8iIi", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_alignq128, "V2LLiV2LLiV2LLiIi", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_alignq128, "V2LLiV2LLiV2LLiIi", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_alignq256, "V4LLiV4LLiV4LLiIi", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_alignq256, "V4LLiV4LLiV4LLiIi", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_extractf64x4_mask, "V4dV8dIiV4dUc", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_extractf64x4_mask, "V4dV8dIiV4dUc", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_extractf32x4_mask, "V4fV16fIiV4fUc", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_extractf32x4_mask, "V4fV16fIiV4fUc", "ncV:512:", "avx512f")

	TARGET_BUILTIN(__builtin_ia32_vpdpbusd128, "V4iV4iV4iV4i", "nc", "avx512vl,avx512vnni")			TARGET_BUILTIN(__builtin_ia32_vpdpbusd128, "V4iV4iV4iV4i", "ncV:128:", "avx512vl,avx512vnni")
	TARGET_BUILTIN(__builtin_ia32_vpdpbusd256, "V8iV8iV8iV8i", "nc", "avx512vl,avx512vnni")			TARGET_BUILTIN(__builtin_ia32_vpdpbusd256, "V8iV8iV8iV8i", "ncV:256:", "avx512vl,avx512vnni")
	TARGET_BUILTIN(__builtin_ia32_vpdpbusd512, "V16iV16iV16iV16i", "nc", "avx512vnni")			TARGET_BUILTIN(__builtin_ia32_vpdpbusd512, "V16iV16iV16iV16i", "ncV:512:", "avx512vnni")
	TARGET_BUILTIN(__builtin_ia32_vpdpbusds128, "V4iV4iV4iV4i", "nc", "avx512vl,avx512vnni")			TARGET_BUILTIN(__builtin_ia32_vpdpbusds128, "V4iV4iV4iV4i", "ncV:128:", "avx512vl,avx512vnni")
	TARGET_BUILTIN(__builtin_ia32_vpdpbusds256, "V8iV8iV8iV8i", "nc", "avx512vl,avx512vnni")			TARGET_BUILTIN(__builtin_ia32_vpdpbusds256, "V8iV8iV8iV8i", "ncV:256:", "avx512vl,avx512vnni")
	TARGET_BUILTIN(__builtin_ia32_vpdpbusds512, "V16iV16iV16iV16i", "nc", "avx512vnni")			TARGET_BUILTIN(__builtin_ia32_vpdpbusds512, "V16iV16iV16iV16i", "ncV:512:", "avx512vnni")
	TARGET_BUILTIN(__builtin_ia32_vpdpwssd128, "V4iV4iV4iV4i", "nc", "avx512vl,avx512vnni")			TARGET_BUILTIN(__builtin_ia32_vpdpwssd128, "V4iV4iV4iV4i", "ncV:128:", "avx512vl,avx512vnni")
	TARGET_BUILTIN(__builtin_ia32_vpdpwssd256, "V8iV8iV8iV8i", "nc", "avx512vl,avx512vnni")			TARGET_BUILTIN(__builtin_ia32_vpdpwssd256, "V8iV8iV8iV8i", "ncV:256:", "avx512vl,avx512vnni")
	TARGET_BUILTIN(__builtin_ia32_vpdpwssd512, "V16iV16iV16iV16i", "nc", "avx512vnni")			TARGET_BUILTIN(__builtin_ia32_vpdpwssd512, "V16iV16iV16iV16i", "ncV:512:", "avx512vnni")
	TARGET_BUILTIN(__builtin_ia32_vpdpwssds128, "V4iV4iV4iV4i", "nc", "avx512vl,avx512vnni")			TARGET_BUILTIN(__builtin_ia32_vpdpwssds128, "V4iV4iV4iV4i", "ncV:128:", "avx512vl,avx512vnni")
	TARGET_BUILTIN(__builtin_ia32_vpdpwssds256, "V8iV8iV8iV8i", "nc", "avx512vl,avx512vnni")			TARGET_BUILTIN(__builtin_ia32_vpdpwssds256, "V8iV8iV8iV8i", "ncV:256:", "avx512vl,avx512vnni")
	TARGET_BUILTIN(__builtin_ia32_vpdpwssds512, "V16iV16iV16iV16i", "nc", "avx512vnni")			TARGET_BUILTIN(__builtin_ia32_vpdpwssds512, "V16iV16iV16iV16i", "ncV:512:", "avx512vnni")

	TARGET_BUILTIN(__builtin_ia32_gather3div2df, "V2dV2ddC*V2LLiUcIi", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_gather3div2df, "V2dV2ddC*V2LLiUcIi", "nV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_gather3div2di, "V2LLiV2LLiLLiC*V2LLiUcIi", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_gather3div2di, "V2LLiV2LLiLLiC*V2LLiUcIi", "nV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_gather3div4df, "V4dV4ddC*V4LLiUcIi", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_gather3div4df, "V4dV4ddC*V4LLiUcIi", "nV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_gather3div4di, "V4LLiV4LLiLLiC*V4LLiUcIi", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_gather3div4di, "V4LLiV4LLiLLiC*V4LLiUcIi", "nV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_gather3div4sf, "V4fV4ffC*V2LLiUcIi", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_gather3div4sf, "V4fV4ffC*V2LLiUcIi", "nV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_gather3div4si, "V4iV4iiC*V2LLiUcIi", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_gather3div4si, "V4iV4iiC*V2LLiUcIi", "nV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_gather3div8sf, "V4fV4ffC*V4LLiUcIi", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_gather3div8sf, "V4fV4ffC*V4LLiUcIi", "nV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_gather3div8si, "V4iV4iiC*V4LLiUcIi", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_gather3div8si, "V4iV4iiC*V4LLiUcIi", "nV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_gather3siv2df, "V2dV2ddC*V4iUcIi", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_gather3siv2df, "V2dV2ddC*V4iUcIi", "nV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_gather3siv2di, "V2LLiV2LLiLLiC*V4iUcIi", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_gather3siv2di, "V2LLiV2LLiLLiC*V4iUcIi", "nV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_gather3siv4df, "V4dV4ddC*V4iUcIi", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_gather3siv4df, "V4dV4ddC*V4iUcIi", "nV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_gather3siv4di, "V4LLiV4LLiLLiC*V4iUcIi", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_gather3siv4di, "V4LLiV4LLiLLiC*V4iUcIi", "nV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_gather3siv4sf, "V4fV4ffC*V4iUcIi", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_gather3siv4sf, "V4fV4ffC*V4iUcIi", "nV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_gather3siv4si, "V4iV4iiC*V4iUcIi", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_gather3siv4si, "V4iV4iiC*V4iUcIi", "nV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_gather3siv8sf, "V8fV8ffC*V8iUcIi", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_gather3siv8sf, "V8fV8ffC*V8iUcIi", "nV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_gather3siv8si, "V8iV8iiC*V8iUcIi", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_gather3siv8si, "V8iV8iiC*V8iUcIi", "nV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_gathersiv8df, "V8dV8ddC*V8iUcIi", "n", "avx512f")			TARGET_BUILTIN(__builtin_ia32_gathersiv8df, "V8dV8ddC*V8iUcIi", "nV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_gathersiv16sf, "V16fV16ffC*V16fUsIi", "n", "avx512f")			TARGET_BUILTIN(__builtin_ia32_gathersiv16sf, "V16fV16ffC*V16fUsIi", "nV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_gatherdiv8df, "V8dV8ddC*V8LLiUcIi", "n", "avx512f")			TARGET_BUILTIN(__builtin_ia32_gatherdiv8df, "V8dV8ddC*V8LLiUcIi", "nV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_gatherdiv16sf, "V8fV8ffC*V8LLiUcIi", "n", "avx512f")			TARGET_BUILTIN(__builtin_ia32_gatherdiv16sf, "V8fV8ffC*V8LLiUcIi", "nV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_gathersiv8di, "V8LLiV8LLiLLiC*V8iUcIi", "n", "avx512f")			TARGET_BUILTIN(__builtin_ia32_gathersiv8di, "V8LLiV8LLiLLiC*V8iUcIi", "nV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_gathersiv16si, "V16iV16iiC*V16iUsIi", "n", "avx512f")			TARGET_BUILTIN(__builtin_ia32_gathersiv16si, "V16iV16iiC*V16iUsIi", "nV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_gatherdiv8di, "V8LLiV8LLiLLiC*V8LLiUcIi", "n", "avx512f")			TARGET_BUILTIN(__builtin_ia32_gatherdiv8di, "V8LLiV8LLiLLiC*V8LLiUcIi", "nV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_gatherdiv16si, "V8iV8iiC*V8LLiUcIi", "n", "avx512f")			TARGET_BUILTIN(__builtin_ia32_gatherdiv16si, "V8iV8iiC*V8LLiUcIi", "nV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_scattersiv8df, "vd*UcV8iV8dIi", "n", "avx512f")			TARGET_BUILTIN(__builtin_ia32_scattersiv8df, "vd*UcV8iV8dIi", "nV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_scattersiv16sf, "vf*UsV16iV16fIi", "n", "avx512f")			TARGET_BUILTIN(__builtin_ia32_scattersiv16sf, "vf*UsV16iV16fIi", "nV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_scatterdiv8df, "vd*UcV8LLiV8dIi", "n", "avx512f")			TARGET_BUILTIN(__builtin_ia32_scatterdiv8df, "vd*UcV8LLiV8dIi", "nV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_scatterdiv16sf, "vf*UcV8LLiV8fIi", "n", "avx512f")			TARGET_BUILTIN(__builtin_ia32_scatterdiv16sf, "vf*UcV8LLiV8fIi", "nV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_scattersiv8di, "vLLi*UcV8iV8LLiIi", "n", "avx512f")			TARGET_BUILTIN(__builtin_ia32_scattersiv8di, "vLLi*UcV8iV8LLiIi", "nV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_scattersiv16si, "vi*UsV16iV16iIi", "n", "avx512f")			TARGET_BUILTIN(__builtin_ia32_scattersiv16si, "vi*UsV16iV16iIi", "nV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_scatterdiv8di, "vLLi*UcV8LLiV8LLiIi", "n", "avx512f")			TARGET_BUILTIN(__builtin_ia32_scatterdiv8di, "vLLi*UcV8LLiV8LLiIi", "nV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_scatterdiv16si, "vi*UcV8LLiV8iIi", "n", "avx512f")			TARGET_BUILTIN(__builtin_ia32_scatterdiv16si, "vi*UcV8LLiV8iIi", "nV:512:", "avx512f")

	TARGET_BUILTIN(__builtin_ia32_gatherpfdpd, "vUcV8iLLiC*IiIi", "n", "avx512pf")			TARGET_BUILTIN(__builtin_ia32_gatherpfdpd, "vUcV8iLLiC*IiIi", "nV:512:", "avx512pf")
	TARGET_BUILTIN(__builtin_ia32_gatherpfdps, "vUsV16iiC*IiIi", "n", "avx512pf")			TARGET_BUILTIN(__builtin_ia32_gatherpfdps, "vUsV16iiC*IiIi", "nV:512:", "avx512pf")
	TARGET_BUILTIN(__builtin_ia32_gatherpfqpd, "vUcV8LLiLLiC*IiIi", "n", "avx512pf")			TARGET_BUILTIN(__builtin_ia32_gatherpfqpd, "vUcV8LLiLLiC*IiIi", "nV:512:", "avx512pf")
	TARGET_BUILTIN(__builtin_ia32_gatherpfqps, "vUcV8LLiiC*IiIi", "n", "avx512pf")			TARGET_BUILTIN(__builtin_ia32_gatherpfqps, "vUcV8LLiiC*IiIi", "nV:512:", "avx512pf")
	TARGET_BUILTIN(__builtin_ia32_scatterpfdpd, "vUcV8iLLi*IiIi", "n", "avx512pf")			TARGET_BUILTIN(__builtin_ia32_scatterpfdpd, "vUcV8iLLi*IiIi", "nV:512:", "avx512pf")
	TARGET_BUILTIN(__builtin_ia32_scatterpfdps, "vUsV16ii*IiIi", "n", "avx512pf")			TARGET_BUILTIN(__builtin_ia32_scatterpfdps, "vUsV16ii*IiIi", "nV:512:", "avx512pf")
	TARGET_BUILTIN(__builtin_ia32_scatterpfqpd, "vUcV8LLiLLi*IiIi", "n", "avx512pf")			TARGET_BUILTIN(__builtin_ia32_scatterpfqpd, "vUcV8LLiLLi*IiIi", "nV:512:", "avx512pf")
	TARGET_BUILTIN(__builtin_ia32_scatterpfqps, "vUcV8LLii*IiIi", "n", "avx512pf")			TARGET_BUILTIN(__builtin_ia32_scatterpfqps, "vUcV8LLii*IiIi", "nV:512:", "avx512pf")

	TARGET_BUILTIN(__builtin_ia32_knothi, "UsUs", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_knothi, "UsUs", "nc", "avx512f")

	TARGET_BUILTIN(__builtin_ia32_cmpb128_mask, "UsV16cV16cIiUs", "nc", "avx512vl,avx512bw")			TARGET_BUILTIN(__builtin_ia32_cmpb128_mask, "UsV16cV16cIiUs", "ncV:128:", "avx512vl,avx512bw")
	TARGET_BUILTIN(__builtin_ia32_cmpd128_mask, "UcV4iV4iIiUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_cmpd128_mask, "UcV4iV4iIiUc", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_cmpq128_mask, "UcV2LLiV2LLiIiUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_cmpq128_mask, "UcV2LLiV2LLiIiUc", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_cmpw128_mask, "UcV8sV8sIiUc", "nc", "avx512vl,avx512bw")			TARGET_BUILTIN(__builtin_ia32_cmpw128_mask, "UcV8sV8sIiUc", "ncV:128:", "avx512vl,avx512bw")
	TARGET_BUILTIN(__builtin_ia32_cmpb256_mask, "UiV32cV32cIiUi", "nc", "avx512vl,avx512bw")			TARGET_BUILTIN(__builtin_ia32_cmpb256_mask, "UiV32cV32cIiUi", "ncV:256:", "avx512vl,avx512bw")
	TARGET_BUILTIN(__builtin_ia32_cmpd256_mask, "UcV8iV8iIiUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_cmpd256_mask, "UcV8iV8iIiUc", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_cmpq256_mask, "UcV4LLiV4LLiIiUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_cmpq256_mask, "UcV4LLiV4LLiIiUc", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_cmpw256_mask, "UsV16sV16sIiUs", "nc", "avx512vl,avx512bw")			TARGET_BUILTIN(__builtin_ia32_cmpw256_mask, "UsV16sV16sIiUs", "ncV:256:", "avx512vl,avx512bw")
	TARGET_BUILTIN(__builtin_ia32_cmpb512_mask, "ULLiV64cV64cIiULLi", "nc", "avx512bw")			TARGET_BUILTIN(__builtin_ia32_cmpb512_mask, "ULLiV64cV64cIiULLi", "ncV:512:", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_cmpd512_mask, "UsV16iV16iIiUs", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_cmpd512_mask, "UsV16iV16iIiUs", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_cmpq512_mask, "UcV8LLiV8LLiIiUc", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_cmpq512_mask, "UcV8LLiV8LLiIiUc", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_cmpw512_mask, "UiV32sV32sIiUi", "nc", "avx512bw")			TARGET_BUILTIN(__builtin_ia32_cmpw512_mask, "UiV32sV32sIiUi", "ncV:512:", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_ucmpb128_mask, "UsV16cV16cIiUs", "nc", "avx512vl,avx512bw")			TARGET_BUILTIN(__builtin_ia32_ucmpb128_mask, "UsV16cV16cIiUs", "ncV:128:", "avx512vl,avx512bw")
	TARGET_BUILTIN(__builtin_ia32_ucmpd128_mask, "UcV4iV4iIiUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_ucmpd128_mask, "UcV4iV4iIiUc", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_ucmpq128_mask, "UcV2LLiV2LLiIiUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_ucmpq128_mask, "UcV2LLiV2LLiIiUc", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_ucmpw128_mask, "UcV8sV8sIiUc", "nc", "avx512vl,avx512bw")			TARGET_BUILTIN(__builtin_ia32_ucmpw128_mask, "UcV8sV8sIiUc", "ncV:128:", "avx512vl,avx512bw")
	TARGET_BUILTIN(__builtin_ia32_ucmpb256_mask, "UiV32cV32cIiUi", "nc", "avx512vl,avx512bw")			TARGET_BUILTIN(__builtin_ia32_ucmpb256_mask, "UiV32cV32cIiUi", "ncV:256:", "avx512vl,avx512bw")
	TARGET_BUILTIN(__builtin_ia32_ucmpd256_mask, "UcV8iV8iIiUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_ucmpd256_mask, "UcV8iV8iIiUc", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_ucmpq256_mask, "UcV4LLiV4LLiIiUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_ucmpq256_mask, "UcV4LLiV4LLiIiUc", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_ucmpw256_mask, "UsV16sV16sIiUs", "nc", "avx512vl,avx512bw")			TARGET_BUILTIN(__builtin_ia32_ucmpw256_mask, "UsV16sV16sIiUs", "ncV:256:", "avx512vl,avx512bw")
	TARGET_BUILTIN(__builtin_ia32_ucmpb512_mask, "ULLiV64cV64cIiULLi", "nc", "avx512bw")			TARGET_BUILTIN(__builtin_ia32_ucmpb512_mask, "ULLiV64cV64cIiULLi", "ncV:512:", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_ucmpd512_mask, "UsV16iV16iIiUs", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_ucmpd512_mask, "UsV16iV16iIiUs", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_ucmpq512_mask, "UcV8LLiV8LLiIiUc", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_ucmpq512_mask, "UcV8LLiV8LLiIiUc", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_ucmpw512_mask, "UiV32sV32sIiUi", "nc", "avx512bw")			TARGET_BUILTIN(__builtin_ia32_ucmpw512_mask, "UiV32sV32sIiUi", "ncV:512:", "avx512bw")

	TARGET_BUILTIN(__builtin_ia32_pabsb512, "V64cV64c", "nc", "avx512bw")			TARGET_BUILTIN(__builtin_ia32_pabsb512, "V64cV64c", "ncV:512:", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_pabsw512, "V32sV32s", "nc", "avx512bw")			TARGET_BUILTIN(__builtin_ia32_pabsw512, "V32sV32s", "ncV:512:", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_packssdw512, "V32sV16iV16i", "nc", "avx512bw")			TARGET_BUILTIN(__builtin_ia32_packssdw512, "V32sV16iV16i", "ncV:512:", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_packsswb512, "V64cV32sV32s", "nc", "avx512bw")			TARGET_BUILTIN(__builtin_ia32_packsswb512, "V64cV32sV32s", "ncV:512:", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_packusdw512, "V32sV16iV16i", "nc", "avx512bw")			TARGET_BUILTIN(__builtin_ia32_packusdw512, "V32sV16iV16i", "ncV:512:", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_packuswb512, "V64cV32sV32s", "nc", "avx512bw")			TARGET_BUILTIN(__builtin_ia32_packuswb512, "V64cV32sV32s", "ncV:512:", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_paddsb512_mask, "V64cV64cV64cV64cULLi", "nc", "avx512bw")			TARGET_BUILTIN(__builtin_ia32_paddsb512_mask, "V64cV64cV64cV64cULLi", "ncV:512:", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_paddsw512_mask, "V32sV32sV32sV32sUi", "nc", "avx512bw")			TARGET_BUILTIN(__builtin_ia32_paddsw512_mask, "V32sV32sV32sV32sUi", "ncV:512:", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_paddusb512_mask, "V64cV64cV64cV64cULLi", "nc", "avx512bw")			TARGET_BUILTIN(__builtin_ia32_paddusb512_mask, "V64cV64cV64cV64cULLi", "ncV:512:", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_paddusw512_mask, "V32sV32sV32sV32sUi", "nc", "avx512bw")			TARGET_BUILTIN(__builtin_ia32_paddusw512_mask, "V32sV32sV32sV32sUi", "ncV:512:", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_pmaxsb512, "V64cV64cV64c", "nc", "avx512bw")			TARGET_BUILTIN(__builtin_ia32_pmaxsb512, "V64cV64cV64c", "ncV:512:", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_pmaxsw512, "V32sV32sV32s", "nc", "avx512bw")			TARGET_BUILTIN(__builtin_ia32_pmaxsw512, "V32sV32sV32s", "ncV:512:", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_pmaxub512, "V64cV64cV64c", "nc", "avx512bw")			TARGET_BUILTIN(__builtin_ia32_pmaxub512, "V64cV64cV64c", "ncV:512:", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_pmaxuw512, "V32sV32sV32s", "nc", "avx512bw")			TARGET_BUILTIN(__builtin_ia32_pmaxuw512, "V32sV32sV32s", "ncV:512:", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_pminsb512, "V64cV64cV64c", "nc", "avx512bw")			TARGET_BUILTIN(__builtin_ia32_pminsb512, "V64cV64cV64c", "ncV:512:", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_pminsw512, "V32sV32sV32s", "nc", "avx512bw")			TARGET_BUILTIN(__builtin_ia32_pminsw512, "V32sV32sV32s", "ncV:512:", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_pminub512, "V64cV64cV64c", "nc", "avx512bw")			TARGET_BUILTIN(__builtin_ia32_pminub512, "V64cV64cV64c", "ncV:512:", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_pminuw512, "V32sV32sV32s", "nc", "avx512bw")			TARGET_BUILTIN(__builtin_ia32_pminuw512, "V32sV32sV32s", "ncV:512:", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_pshufb512, "V64cV64cV64c", "nc", "avx512bw")			TARGET_BUILTIN(__builtin_ia32_pshufb512, "V64cV64cV64c", "ncV:512:", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_psubsb512_mask, "V64cV64cV64cV64cULLi", "nc", "avx512bw")			TARGET_BUILTIN(__builtin_ia32_psubsb512_mask, "V64cV64cV64cV64cULLi", "ncV:512:", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_psubsw512_mask, "V32sV32sV32sV32sUi", "nc", "avx512bw")			TARGET_BUILTIN(__builtin_ia32_psubsw512_mask, "V32sV32sV32sV32sUi", "ncV:512:", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_psubusb512_mask, "V64cV64cV64cV64cULLi", "nc", "avx512bw")			TARGET_BUILTIN(__builtin_ia32_psubusb512_mask, "V64cV64cV64cV64cULLi", "ncV:512:", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_psubusw512_mask, "V32sV32sV32sV32sUi", "nc", "avx512bw")			TARGET_BUILTIN(__builtin_ia32_psubusw512_mask, "V32sV32sV32sV32sUi", "ncV:512:", "avx512bw")

	TARGET_BUILTIN(__builtin_ia32_vpconflictdi_128_mask, "V2LLiV2LLiV2LLiUc", "nc", "avx512cd,avx512vl")			TARGET_BUILTIN(__builtin_ia32_vpconflictdi_128_mask, "V2LLiV2LLiV2LLiUc", "ncV:128:", "avx512cd,avx512vl")
	TARGET_BUILTIN(__builtin_ia32_vpconflictdi_256_mask, "V4LLiV4LLiV4LLiUc", "nc", "avx512cd,avx512vl")			TARGET_BUILTIN(__builtin_ia32_vpconflictdi_256_mask, "V4LLiV4LLiV4LLiUc", "ncV:256:", "avx512cd,avx512vl")
	TARGET_BUILTIN(__builtin_ia32_vpconflictsi_128_mask, "V4iV4iV4iUc", "nc", "avx512cd,avx512vl")			TARGET_BUILTIN(__builtin_ia32_vpconflictsi_128_mask, "V4iV4iV4iUc", "ncV:128:", "avx512cd,avx512vl")
	TARGET_BUILTIN(__builtin_ia32_vpconflictsi_256_mask, "V8iV8iV8iUc", "nc", "avx512cd,avx512vl")			TARGET_BUILTIN(__builtin_ia32_vpconflictsi_256_mask, "V8iV8iV8iUc", "ncV:256:", "avx512cd,avx512vl")
	TARGET_BUILTIN(__builtin_ia32_vpconflictdi_512_mask, "V8LLiV8LLiV8LLiUc", "nc", "avx512cd")			TARGET_BUILTIN(__builtin_ia32_vpconflictdi_512_mask, "V8LLiV8LLiV8LLiUc", "ncV:512:", "avx512cd")
	TARGET_BUILTIN(__builtin_ia32_vpconflictsi_512_mask, "V16iV16iV16iUs", "nc", "avx512cd")			TARGET_BUILTIN(__builtin_ia32_vpconflictsi_512_mask, "V16iV16iV16iUs", "ncV:512:", "avx512cd")
	TARGET_BUILTIN(__builtin_ia32_vplzcntd_512, "V16iV16i", "nc", "avx512cd")			TARGET_BUILTIN(__builtin_ia32_vplzcntd_512, "V16iV16i", "ncV:512:", "avx512cd")
	TARGET_BUILTIN(__builtin_ia32_vplzcntq_512, "V8LLiV8LLi", "nc", "avx512cd")			TARGET_BUILTIN(__builtin_ia32_vplzcntq_512, "V8LLiV8LLi", "ncV:512:", "avx512cd")

	TARGET_BUILTIN(__builtin_ia32_vpopcntd_128, "V4iV4i", "nc", "avx512vpopcntdq,avx512vl")			TARGET_BUILTIN(__builtin_ia32_vpopcntd_128, "V4iV4i", "ncV:128:", "avx512vpopcntdq,avx512vl")
	TARGET_BUILTIN(__builtin_ia32_vpopcntq_128, "V2LLiV2LLi", "nc", "avx512vpopcntdq,avx512vl")			TARGET_BUILTIN(__builtin_ia32_vpopcntq_128, "V2LLiV2LLi", "ncV:128:", "avx512vpopcntdq,avx512vl")
	TARGET_BUILTIN(__builtin_ia32_vpopcntd_256, "V8iV8i", "nc", "avx512vpopcntdq,avx512vl")			TARGET_BUILTIN(__builtin_ia32_vpopcntd_256, "V8iV8i", "ncV:256:", "avx512vpopcntdq,avx512vl")
	TARGET_BUILTIN(__builtin_ia32_vpopcntq_256, "V4LLiV4LLi", "nc", "avx512vpopcntdq,avx512vl")			TARGET_BUILTIN(__builtin_ia32_vpopcntq_256, "V4LLiV4LLi", "ncV:256:", "avx512vpopcntdq,avx512vl")
	TARGET_BUILTIN(__builtin_ia32_vpopcntd_512, "V16iV16i", "nc", "avx512vpopcntdq")			TARGET_BUILTIN(__builtin_ia32_vpopcntd_512, "V16iV16i", "ncV:512:", "avx512vpopcntdq")
	TARGET_BUILTIN(__builtin_ia32_vpopcntq_512, "V8LLiV8LLi", "nc", "avx512vpopcntdq")			TARGET_BUILTIN(__builtin_ia32_vpopcntq_512, "V8LLiV8LLi", "ncV:512:", "avx512vpopcntdq")

	TARGET_BUILTIN(__builtin_ia32_vpopcntb_128, "V16cV16c", "nc", "avx512vl,avx512bitalg")			TARGET_BUILTIN(__builtin_ia32_vpopcntb_128, "V16cV16c", "ncV:128:", "avx512vl,avx512bitalg")
	TARGET_BUILTIN(__builtin_ia32_vpopcntw_128, "V8sV8s", "nc", "avx512vl,avx512bitalg")			TARGET_BUILTIN(__builtin_ia32_vpopcntw_128, "V8sV8s", "ncV:128:", "avx512vl,avx512bitalg")
	TARGET_BUILTIN(__builtin_ia32_vpopcntb_256, "V32cV32c", "nc", "avx512vl,avx512bitalg")			TARGET_BUILTIN(__builtin_ia32_vpopcntb_256, "V32cV32c", "ncV:256:", "avx512vl,avx512bitalg")
	TARGET_BUILTIN(__builtin_ia32_vpopcntw_256, "V16sV16s", "nc", "avx512vl,avx512bitalg")			TARGET_BUILTIN(__builtin_ia32_vpopcntw_256, "V16sV16s", "ncV:256:", "avx512vl,avx512bitalg")
	TARGET_BUILTIN(__builtin_ia32_vpopcntb_512, "V64cV64c", "nc", "avx512bitalg")			TARGET_BUILTIN(__builtin_ia32_vpopcntb_512, "V64cV64c", "ncV:512:", "avx512bitalg")
	TARGET_BUILTIN(__builtin_ia32_vpopcntw_512, "V32sV32s", "nc", "avx512bitalg")			TARGET_BUILTIN(__builtin_ia32_vpopcntw_512, "V32sV32s", "ncV:512:", "avx512bitalg")

	TARGET_BUILTIN(__builtin_ia32_vpshufbitqmb128_mask, "UsV16cV16cUs", "nc", "avx512vl,avx512bitalg")			TARGET_BUILTIN(__builtin_ia32_vpshufbitqmb128_mask, "UsV16cV16cUs", "ncV:128:", "avx512vl,avx512bitalg")
	TARGET_BUILTIN(__builtin_ia32_vpshufbitqmb256_mask, "UiV32cV32cUi", "nc", "avx512vl,avx512bitalg")			TARGET_BUILTIN(__builtin_ia32_vpshufbitqmb256_mask, "UiV32cV32cUi", "ncV:256:", "avx512vl,avx512bitalg")
	TARGET_BUILTIN(__builtin_ia32_vpshufbitqmb512_mask, "ULLiV64cV64cULLi", "nc", "avx512bitalg")			TARGET_BUILTIN(__builtin_ia32_vpshufbitqmb512_mask, "ULLiV64cV64cULLi", "ncV:512:", "avx512bitalg")

	TARGET_BUILTIN(__builtin_ia32_pmulhrsw512, "V32sV32sV32s", "nc", "avx512bw")			TARGET_BUILTIN(__builtin_ia32_pmulhrsw512, "V32sV32sV32s", "ncV:512:", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_pmulhuw512, "V32sV32sV32s", "nc", "avx512bw")			TARGET_BUILTIN(__builtin_ia32_pmulhuw512, "V32sV32sV32s", "ncV:512:", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_pmulhw512, "V32sV32sV32s", "nc", "avx512bw")			TARGET_BUILTIN(__builtin_ia32_pmulhw512, "V32sV32sV32s", "ncV:512:", "avx512bw")

	TARGET_BUILTIN(__builtin_ia32_addpd512, "V8dV8dV8dIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_addpd512, "V8dV8dV8dIi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_addps512, "V16fV16fV16fIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_addps512, "V16fV16fV16fIi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_divpd512, "V8dV8dV8dIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_divpd512, "V8dV8dV8dIi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_divps512, "V16fV16fV16fIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_divps512, "V16fV16fV16fIi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_mulpd512, "V8dV8dV8dIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_mulpd512, "V8dV8dV8dIi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_mulps512, "V16fV16fV16fIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_mulps512, "V16fV16fV16fIi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_subpd512, "V8dV8dV8dIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_subpd512, "V8dV8dV8dIi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_subps512, "V16fV16fV16fIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_subps512, "V16fV16fV16fIi", "ncV:512:", "avx512f")

	TARGET_BUILTIN(__builtin_ia32_pmaddubsw512, "V32sV64cV64c", "nc", "avx512bw")			TARGET_BUILTIN(__builtin_ia32_pmaddubsw512, "V32sV64cV64c", "ncV:512:", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_pmaddwd512, "V16iV32sV32s", "nc", "avx512bw")			TARGET_BUILTIN(__builtin_ia32_pmaddwd512, "V16iV32sV32s", "ncV:512:", "avx512bw")

	TARGET_BUILTIN(__builtin_ia32_addss_round_mask, "V4fV4fV4fV4fUcIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_addss_round_mask, "V4fV4fV4fV4fUcIi", "ncV:128:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_divss_round_mask, "V4fV4fV4fV4fUcIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_divss_round_mask, "V4fV4fV4fV4fUcIi", "ncV:128:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_mulss_round_mask, "V4fV4fV4fV4fUcIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_mulss_round_mask, "V4fV4fV4fV4fUcIi", "ncV:128:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_subss_round_mask, "V4fV4fV4fV4fUcIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_subss_round_mask, "V4fV4fV4fV4fUcIi", "ncV:128:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_maxss_round_mask, "V4fV4fV4fV4fUcIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_maxss_round_mask, "V4fV4fV4fV4fUcIi", "ncV:128:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_minss_round_mask, "V4fV4fV4fV4fUcIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_minss_round_mask, "V4fV4fV4fV4fUcIi", "ncV:128:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_addsd_round_mask, "V2dV2dV2dV2dUcIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_addsd_round_mask, "V2dV2dV2dV2dUcIi", "ncV:128:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_divsd_round_mask, "V2dV2dV2dV2dUcIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_divsd_round_mask, "V2dV2dV2dV2dUcIi", "ncV:128:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_mulsd_round_mask, "V2dV2dV2dV2dUcIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_mulsd_round_mask, "V2dV2dV2dV2dUcIi", "ncV:128:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_subsd_round_mask, "V2dV2dV2dV2dUcIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_subsd_round_mask, "V2dV2dV2dV2dUcIi", "ncV:128:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_maxsd_round_mask, "V2dV2dV2dV2dUcIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_maxsd_round_mask, "V2dV2dV2dV2dUcIi", "ncV:128:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_minsd_round_mask, "V2dV2dV2dV2dUcIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_minsd_round_mask, "V2dV2dV2dV2dUcIi", "ncV:128:", "avx512f")

	TARGET_BUILTIN(__builtin_ia32_compressdf128_mask, "V2dV2dV2dUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_compressdf128_mask, "V2dV2dV2dUc", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_compressdf256_mask, "V4dV4dV4dUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_compressdf256_mask, "V4dV4dV4dUc", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_compressdi128_mask, "V2LLiV2LLiV2LLiUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_compressdi128_mask, "V2LLiV2LLiV2LLiUc", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_compressdi256_mask, "V4LLiV4LLiV4LLiUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_compressdi256_mask, "V4LLiV4LLiV4LLiUc", "ncV:256:", "avx512vl")

	TARGET_BUILTIN(__builtin_ia32_compresshi128_mask, "V8sV8sV8sUc", "nc", "avx512vl,avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_compresshi128_mask, "V8sV8sV8sUc", "ncV:128:", "avx512vl,avx512vbmi2")
	TARGET_BUILTIN(__builtin_ia32_compresshi256_mask, "V16sV16sV16sUs", "nc", "avx512vl,avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_compresshi256_mask, "V16sV16sV16sUs", "ncV:256:", "avx512vl,avx512vbmi2")
	TARGET_BUILTIN(__builtin_ia32_compressqi128_mask, "V16cV16cV16cUs", "nc", "avx512vl,avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_compressqi128_mask, "V16cV16cV16cUs", "ncV:128:", "avx512vl,avx512vbmi2")
	TARGET_BUILTIN(__builtin_ia32_compressqi256_mask, "V32cV32cV32cUi", "nc", "avx512vl,avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_compressqi256_mask, "V32cV32cV32cUi", "ncV:256:", "avx512vl,avx512vbmi2")

	TARGET_BUILTIN(__builtin_ia32_compresssf128_mask, "V4fV4fV4fUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_compresssf128_mask, "V4fV4fV4fUc", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_compresssf256_mask, "V8fV8fV8fUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_compresssf256_mask, "V8fV8fV8fUc", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_compresssi128_mask, "V4iV4iV4iUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_compresssi128_mask, "V4iV4iV4iUc", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_compresssi256_mask, "V8iV8iV8iUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_compresssi256_mask, "V8iV8iV8iUc", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_compressstoredf128_mask, "vV2d*V2dUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_compressstoredf128_mask, "vV2d*V2dUc", "nV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_compressstoredf256_mask, "vV4d*V4dUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_compressstoredf256_mask, "vV4d*V4dUc", "nV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_compressstoredi128_mask, "vV2LLi*V2LLiUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_compressstoredi128_mask, "vV2LLi*V2LLiUc", "nV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_compressstoredi256_mask, "vV4LLi*V4LLiUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_compressstoredi256_mask, "vV4LLi*V4LLiUc", "nV:256:", "avx512vl")

	TARGET_BUILTIN(__builtin_ia32_compressstorehi128_mask, "vV8s*V8sUc", "n", "avx512vl,avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_compressstorehi128_mask, "vV8s*V8sUc", "nV:128:", "avx512vl,avx512vbmi2")
	TARGET_BUILTIN(__builtin_ia32_compressstorehi256_mask, "vV16s*V16sUs", "n", "avx512vl,avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_compressstorehi256_mask, "vV16s*V16sUs", "nV:256:", "avx512vl,avx512vbmi2")
	TARGET_BUILTIN(__builtin_ia32_compressstoreqi128_mask, "vV16c*V16cUs", "n", "avx512vl,avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_compressstoreqi128_mask, "vV16c*V16cUs", "nV:128:", "avx512vl,avx512vbmi2")
	TARGET_BUILTIN(__builtin_ia32_compressstoreqi256_mask, "vV32c*V32cUi", "n", "avx512vl,avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_compressstoreqi256_mask, "vV32c*V32cUi", "nV:256:", "avx512vl,avx512vbmi2")

	TARGET_BUILTIN(__builtin_ia32_compressstoresf128_mask, "vV4f*V4fUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_compressstoresf128_mask, "vV4f*V4fUc", "nV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_compressstoresf256_mask, "vV8f*V8fUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_compressstoresf256_mask, "vV8f*V8fUc", "nV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_compressstoresi128_mask, "vV4i*V4iUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_compressstoresi128_mask, "vV4i*V4iUc", "nV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_compressstoresi256_mask, "vV8i*V8iUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_compressstoresi256_mask, "vV8i*V8iUc", "nV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_cvtpd2dq128_mask, "V4iV2dV4iUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_cvtpd2dq128_mask, "V4iV2dV4iUc", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_cvtpd2ps_mask, "V4fV2dV4fUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_cvtpd2ps_mask, "V4fV2dV4fUc", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_cvtpd2udq128_mask, "V4iV2dV4iUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_cvtpd2udq128_mask, "V4iV2dV4iUc", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_cvtpd2udq256_mask, "V4iV4dV4iUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_cvtpd2udq256_mask, "V4iV4dV4iUc", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_cvtps2udq128_mask, "V4iV4fV4iUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_cvtps2udq128_mask, "V4iV4fV4iUc", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_cvtps2udq256_mask, "V8iV8fV8iUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_cvtps2udq256_mask, "V8iV8fV8iUc", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_cvttpd2dq128_mask, "V4iV2dV4iUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_cvttpd2dq128_mask, "V4iV2dV4iUc", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_cvttpd2udq128_mask, "V4iV2dV4iUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_cvttpd2udq128_mask, "V4iV2dV4iUc", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_cvttpd2udq256_mask, "V4iV4dV4iUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_cvttpd2udq256_mask, "V4iV4dV4iUc", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_cvttps2udq128_mask, "V4iV4fV4iUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_cvttps2udq128_mask, "V4iV4fV4iUc", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_cvttps2udq256_mask, "V8iV8fV8iUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_cvttps2udq256_mask, "V8iV8fV8iUc", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_expanddf128_mask, "V2dV2dV2dUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_expanddf128_mask, "V2dV2dV2dUc", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_expanddf256_mask, "V4dV4dV4dUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_expanddf256_mask, "V4dV4dV4dUc", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_expanddi128_mask, "V2LLiV2LLiV2LLiUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_expanddi128_mask, "V2LLiV2LLiV2LLiUc", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_expanddi256_mask, "V4LLiV4LLiV4LLiUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_expanddi256_mask, "V4LLiV4LLiV4LLiUc", "ncV:256:", "avx512vl")

	TARGET_BUILTIN(__builtin_ia32_expandhi128_mask, "V8sV8sV8sUc", "nc", "avx512vl,avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_expandhi128_mask, "V8sV8sV8sUc", "ncV:128:", "avx512vl,avx512vbmi2")
	TARGET_BUILTIN(__builtin_ia32_expandhi256_mask, "V16sV16sV16sUs", "nc", "avx512vl,avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_expandhi256_mask, "V16sV16sV16sUs", "ncV:256:", "avx512vl,avx512vbmi2")
	TARGET_BUILTIN(__builtin_ia32_expandqi128_mask, "V16cV16cV16cUs", "nc", "avx512vl,avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_expandqi128_mask, "V16cV16cV16cUs", "ncV:128:", "avx512vl,avx512vbmi2")
	TARGET_BUILTIN(__builtin_ia32_expandqi256_mask, "V32cV32cV32cUi", "nc", "avx512vl,avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_expandqi256_mask, "V32cV32cV32cUi", "ncV:256:", "avx512vl,avx512vbmi2")

	TARGET_BUILTIN(__builtin_ia32_expandloaddf128_mask, "V2dV2dC*V2dUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_expandloaddf128_mask, "V2dV2dC*V2dUc", "nV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_expandloaddf256_mask, "V4dV4dC*V4dUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_expandloaddf256_mask, "V4dV4dC*V4dUc", "nV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_expandloaddi128_mask, "V4iV2LLiC*V2LLiUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_expandloaddi128_mask, "V4iV2LLiC*V2LLiUc", "nV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_expandloaddi256_mask, "V4LLiV4LLiC*V4LLiUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_expandloaddi256_mask, "V4LLiV4LLiC*V4LLiUc", "nV:256:", "avx512vl")

	TARGET_BUILTIN(__builtin_ia32_expandloadhi128_mask, "V8sV8sC*V8sUc", "n", "avx512vl,avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_expandloadhi128_mask, "V8sV8sC*V8sUc", "nV:128:", "avx512vl,avx512vbmi2")
	TARGET_BUILTIN(__builtin_ia32_expandloadhi256_mask, "V16sV16sC*V16sUs", "n", "avx512vl,avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_expandloadhi256_mask, "V16sV16sC*V16sUs", "nV:256:", "avx512vl,avx512vbmi2")
	TARGET_BUILTIN(__builtin_ia32_expandloadqi128_mask, "V16cV16cC*V16cUs", "n", "avx512vl,avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_expandloadqi128_mask, "V16cV16cC*V16cUs", "nV:128:", "avx512vl,avx512vbmi2")
	TARGET_BUILTIN(__builtin_ia32_expandloadqi256_mask, "V32cV32cC*V32cUi", "n", "avx512vl,avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_expandloadqi256_mask, "V32cV32cC*V32cUi", "nV:256:", "avx512vl,avx512vbmi2")

	TARGET_BUILTIN(__builtin_ia32_expandloadsf128_mask, "V4fV4fC*V4fUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_expandloadsf128_mask, "V4fV4fC*V4fUc", "nV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_expandloadsf256_mask, "V8fV8fC*V8fUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_expandloadsf256_mask, "V8fV8fC*V8fUc", "nV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_expandloadsi128_mask, "V4iV4iC*V4iUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_expandloadsi128_mask, "V4iV4iC*V4iUc", "nV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_expandloadsi256_mask, "V8iV8iC*V8iUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_expandloadsi256_mask, "V8iV8iC*V8iUc", "nV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_expandsf128_mask, "V4fV4fV4fUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_expandsf128_mask, "V4fV4fV4fUc", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_expandsf256_mask, "V8fV8fV8fUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_expandsf256_mask, "V8fV8fV8fUc", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_expandsi128_mask, "V4iV4iV4iUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_expandsi128_mask, "V4iV4iV4iUc", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_expandsi256_mask, "V8iV8iV8iUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_expandsi256_mask, "V8iV8iV8iUc", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_getexppd128_mask, "V2dV2dV2dUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_getexppd128_mask, "V2dV2dV2dUc", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_getexppd256_mask, "V4dV4dV4dUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_getexppd256_mask, "V4dV4dV4dUc", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_getexpps128_mask, "V4fV4fV4fUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_getexpps128_mask, "V4fV4fV4fUc", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_getexpps256_mask, "V8fV8fV8fUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_getexpps256_mask, "V8fV8fV8fUc", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pabsq128, "V2LLiV2LLi", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pabsq128, "V2LLiV2LLi", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pabsq256, "V4LLiV4LLi", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pabsq256, "V4LLiV4LLi", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmaxsq128, "V2LLiV2LLiV2LLi", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmaxsq128, "V2LLiV2LLiV2LLi", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmaxsq256, "V4LLiV4LLiV4LLi", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmaxsq256, "V4LLiV4LLiV4LLi", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmaxuq128, "V2LLiV2LLiV2LLi", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmaxuq128, "V2LLiV2LLiV2LLi", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmaxuq256, "V4LLiV4LLiV4LLi", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmaxuq256, "V4LLiV4LLiV4LLi", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pminsq128, "V2LLiV2LLiV2LLi", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pminsq128, "V2LLiV2LLiV2LLi", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pminsq256, "V4LLiV4LLiV4LLi", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pminsq256, "V4LLiV4LLiV4LLi", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pminuq128, "V2LLiV2LLiV2LLi", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pminuq128, "V2LLiV2LLiV2LLi", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pminuq256, "V4LLiV4LLiV4LLi", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pminuq256, "V4LLiV4LLiV4LLi", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_rndscalepd_128_mask, "V2dV2dIiV2dUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_rndscalepd_128_mask, "V2dV2dIiV2dUc", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_rndscalepd_256_mask, "V4dV4dIiV4dUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_rndscalepd_256_mask, "V4dV4dIiV4dUc", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_rndscaleps_128_mask, "V4fV4fIiV4fUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_rndscaleps_128_mask, "V4fV4fIiV4fUc", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_rndscaleps_256_mask, "V8fV8fIiV8fUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_rndscaleps_256_mask, "V8fV8fIiV8fUc", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_scalefpd128_mask, "V2dV2dV2dV2dUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_scalefpd128_mask, "V2dV2dV2dV2dUc", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_scalefpd256_mask, "V4dV4dV4dV4dUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_scalefpd256_mask, "V4dV4dV4dV4dUc", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_scalefps128_mask, "V4fV4fV4fV4fUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_scalefps128_mask, "V4fV4fV4fV4fUc", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_scalefps256_mask, "V8fV8fV8fV8fUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_scalefps256_mask, "V8fV8fV8fV8fUc", "ncV:256:", "avx512vl")

	TARGET_BUILTIN(__builtin_ia32_scatterdiv2df, "vd*UcV2LLiV2dIi", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_scatterdiv2df, "vd*UcV2LLiV2dIi", "nV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_scatterdiv2di, "vLLi*UcV2LLiV2LLiIi", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_scatterdiv2di, "vLLi*UcV2LLiV2LLiIi", "nV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_scatterdiv4df, "vd*UcV4LLiV4dIi", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_scatterdiv4df, "vd*UcV4LLiV4dIi", "nV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_scatterdiv4di, "vLLi*UcV4LLiV4LLiIi", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_scatterdiv4di, "vLLi*UcV4LLiV4LLiIi", "nV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_scatterdiv4sf, "vf*UcV2LLiV4fIi", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_scatterdiv4sf, "vf*UcV2LLiV4fIi", "nV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_scatterdiv4si, "vi*UcV2LLiV4iIi", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_scatterdiv4si, "vi*UcV2LLiV4iIi", "nV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_scatterdiv8sf, "vf*UcV4LLiV4fIi", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_scatterdiv8sf, "vf*UcV4LLiV4fIi", "nV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_scatterdiv8si, "vi*UcV4LLiV4iIi", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_scatterdiv8si, "vi*UcV4LLiV4iIi", "nV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_scattersiv2df, "vd*UcV4iV2dIi", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_scattersiv2df, "vd*UcV4iV2dIi", "nV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_scattersiv2di, "vLLi*UcV4iV2LLiIi", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_scattersiv2di, "vLLi*UcV4iV2LLiIi", "nV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_scattersiv4df, "vd*UcV4iV4dIi", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_scattersiv4df, "vd*UcV4iV4dIi", "nV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_scattersiv4di, "vLLi*UcV4iV4LLiIi", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_scattersiv4di, "vLLi*UcV4iV4LLiIi", "nV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_scattersiv4sf, "vf*UcV4iV4fIi", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_scattersiv4sf, "vf*UcV4iV4fIi", "nV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_scattersiv4si, "vi*UcV4iV4iIi", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_scattersiv4si, "vi*UcV4iV4iIi", "nV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_scattersiv8sf, "vf*UcV8iV8fIi", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_scattersiv8sf, "vf*UcV8iV8fIi", "nV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_scattersiv8si, "vi*UcV8iV8iIi", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_scattersiv8si, "vi*UcV8iV8iIi", "nV:256:", "avx512vl")

	TARGET_BUILTIN(__builtin_ia32_vpermi2vard128, "V4iV4iV4iV4i", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_vpermi2vard128, "V4iV4iV4iV4i", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_vpermi2vard256, "V8iV8iV8iV8i", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_vpermi2vard256, "V8iV8iV8iV8i", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_vpermi2vard512, "V16iV16iV16iV16i", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_vpermi2vard512, "V16iV16iV16iV16i", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_vpermi2varpd128, "V2dV2dV2LLiV2d", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_vpermi2varpd128, "V2dV2dV2LLiV2d", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_vpermi2varpd256, "V4dV4dV4LLiV4d", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_vpermi2varpd256, "V4dV4dV4LLiV4d", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_vpermi2varpd512, "V8dV8dV8LLiV8d", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_vpermi2varpd512, "V8dV8dV8LLiV8d", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_vpermi2varps128, "V4fV4fV4iV4f", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_vpermi2varps128, "V4fV4fV4iV4f", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_vpermi2varps256, "V8fV8fV8iV8f", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_vpermi2varps256, "V8fV8fV8iV8f", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_vpermi2varps512, "V16fV16fV16iV16f", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_vpermi2varps512, "V16fV16fV16iV16f", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_vpermi2varq128, "V2LLiV2LLiV2LLiV2LLi", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_vpermi2varq128, "V2LLiV2LLiV2LLiV2LLi", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_vpermi2varq256, "V4LLiV4LLiV4LLiV4LLi", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_vpermi2varq256, "V4LLiV4LLiV4LLiV4LLi", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_vpermi2varq512, "V8LLiV8LLiV8LLiV8LLi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_vpermi2varq512, "V8LLiV8LLiV8LLiV8LLi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_vpermi2varqi128, "V16cV16cV16cV16c", "nc", "avx512vbmi,avx512vl")			TARGET_BUILTIN(__builtin_ia32_vpermi2varqi128, "V16cV16cV16cV16c", "ncV:128:", "avx512vbmi,avx512vl")
	TARGET_BUILTIN(__builtin_ia32_vpermi2varqi256, "V32cV32cV32cV32c", "nc", "avx512vbmi,avx512vl")			TARGET_BUILTIN(__builtin_ia32_vpermi2varqi256, "V32cV32cV32cV32c", "ncV:256:", "avx512vbmi,avx512vl")
	TARGET_BUILTIN(__builtin_ia32_vpermi2varqi512, "V64cV64cV64cV64c", "nc", "avx512vbmi")			TARGET_BUILTIN(__builtin_ia32_vpermi2varqi512, "V64cV64cV64cV64c", "ncV:512:", "avx512vbmi")
	TARGET_BUILTIN(__builtin_ia32_vpermi2varhi128, "V8sV8sV8sV8s", "nc", "avx512vl,avx512bw")			TARGET_BUILTIN(__builtin_ia32_vpermi2varhi128, "V8sV8sV8sV8s", "ncV:128:", "avx512vl,avx512bw")
	TARGET_BUILTIN(__builtin_ia32_vpermi2varhi256, "V16sV16sV16sV16s", "nc", "avx512vl,avx512bw")			TARGET_BUILTIN(__builtin_ia32_vpermi2varhi256, "V16sV16sV16sV16s", "ncV:256:", "avx512vl,avx512bw")
	TARGET_BUILTIN(__builtin_ia32_vpermi2varhi512, "V32sV32sV32sV32s", "nc", "avx512bw")			TARGET_BUILTIN(__builtin_ia32_vpermi2varhi512, "V32sV32sV32sV32s", "ncV:512:", "avx512bw")

	TARGET_BUILTIN(__builtin_ia32_vpshldd128, "V4iV4iV4iIi", "nc", "avx512vl,avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_vpshldd128, "V4iV4iV4iIi", "ncV:128:", "avx512vl,avx512vbmi2")
	TARGET_BUILTIN(__builtin_ia32_vpshldd256, "V8iV8iV8iIi", "nc", "avx512vl,avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_vpshldd256, "V8iV8iV8iIi", "ncV:256:", "avx512vl,avx512vbmi2")
	TARGET_BUILTIN(__builtin_ia32_vpshldd512, "V16iV16iV16iIi", "nc", "avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_vpshldd512, "V16iV16iV16iIi", "ncV:512:", "avx512vbmi2")
	TARGET_BUILTIN(__builtin_ia32_vpshldq128, "V2LLiV2LLiV2LLiIi", "nc", "avx512vl,avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_vpshldq128, "V2LLiV2LLiV2LLiIi", "ncV:128:", "avx512vl,avx512vbmi2")
	TARGET_BUILTIN(__builtin_ia32_vpshldq256, "V4LLiV4LLiV4LLiIi", "nc", "avx512vl,avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_vpshldq256, "V4LLiV4LLiV4LLiIi", "ncV:256:", "avx512vl,avx512vbmi2")
	TARGET_BUILTIN(__builtin_ia32_vpshldq512, "V8LLiV8LLiV8LLiIi", "nc", "avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_vpshldq512, "V8LLiV8LLiV8LLiIi", "ncV:512:", "avx512vbmi2")
	TARGET_BUILTIN(__builtin_ia32_vpshldw128, "V8sV8sV8sIi", "nc", "avx512vl,avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_vpshldw128, "V8sV8sV8sIi", "ncV:128:", "avx512vl,avx512vbmi2")
	TARGET_BUILTIN(__builtin_ia32_vpshldw256, "V16sV16sV16sIi", "nc", "avx512vl,avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_vpshldw256, "V16sV16sV16sIi", "ncV:256:", "avx512vl,avx512vbmi2")
	TARGET_BUILTIN(__builtin_ia32_vpshldw512, "V32sV32sV32sIi", "nc", "avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_vpshldw512, "V32sV32sV32sIi", "ncV:512:", "avx512vbmi2")

	TARGET_BUILTIN(__builtin_ia32_vpshldvd128_mask, "V4iV4iV4iV4iUc", "nc", "avx512vl,avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_vpshldvd128_mask, "V4iV4iV4iV4iUc", "ncV:128:", "avx512vl,avx512vbmi2")
	TARGET_BUILTIN(__builtin_ia32_vpshldvd256_mask, "V8iV8iV8iV8iUc", "nc", "avx512vl,avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_vpshldvd256_mask, "V8iV8iV8iV8iUc", "ncV:256:", "avx512vl,avx512vbmi2")
	TARGET_BUILTIN(__builtin_ia32_vpshldvd512_mask, "V16iV16iV16iV16iUs", "nc", "avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_vpshldvd512_mask, "V16iV16iV16iV16iUs", "ncV:512:", "avx512vbmi2")
	TARGET_BUILTIN(__builtin_ia32_vpshldvq128_mask, "V2LLiV2LLiV2LLiV2LLiUc", "nc", "avx512vl,avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_vpshldvq128_mask, "V2LLiV2LLiV2LLiV2LLiUc", "ncV:128:", "avx512vl,avx512vbmi2")
	TARGET_BUILTIN(__builtin_ia32_vpshldvq256_mask, "V4LLiV4LLiV4LLiV4LLiUc", "nc", "avx512vl,avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_vpshldvq256_mask, "V4LLiV4LLiV4LLiV4LLiUc", "ncV:256:", "avx512vl,avx512vbmi2")
	TARGET_BUILTIN(__builtin_ia32_vpshldvq512_mask, "V8LLiV8LLiV8LLiV8LLiUc", "nc", "avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_vpshldvq512_mask, "V8LLiV8LLiV8LLiV8LLiUc", "ncV:512:", "avx512vbmi2")
	TARGET_BUILTIN(__builtin_ia32_vpshldvw128_mask, "V8sV8sV8sV8sUc", "nc", "avx512vl,avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_vpshldvw128_mask, "V8sV8sV8sV8sUc", "ncV:128:", "avx512vl,avx512vbmi2")
	TARGET_BUILTIN(__builtin_ia32_vpshldvw256_mask, "V16sV16sV16sV16sUs", "nc", "avx512vl,avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_vpshldvw256_mask, "V16sV16sV16sV16sUs", "ncV:256:", "avx512vl,avx512vbmi2")
	TARGET_BUILTIN(__builtin_ia32_vpshldvw512_mask, "V32sV32sV32sV32sUi", "nc", "avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_vpshldvw512_mask, "V32sV32sV32sV32sUi", "ncV:512:", "avx512vbmi2")
	TARGET_BUILTIN(__builtin_ia32_vpshldvd128_maskz, "V4iV4iV4iV4iUc", "nc", "avx512vl,avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_vpshldvd128_maskz, "V4iV4iV4iV4iUc", "ncV:128:", "avx512vl,avx512vbmi2")
	TARGET_BUILTIN(__builtin_ia32_vpshldvd256_maskz, "V8iV8iV8iV8iUc", "nc", "avx512vl,avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_vpshldvd256_maskz, "V8iV8iV8iV8iUc", "ncV:256:", "avx512vl,avx512vbmi2")
	TARGET_BUILTIN(__builtin_ia32_vpshldvd512_maskz, "V16iV16iV16iV16iUs", "nc", "avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_vpshldvd512_maskz, "V16iV16iV16iV16iUs", "ncV:512:", "avx512vbmi2")
	TARGET_BUILTIN(__builtin_ia32_vpshldvq128_maskz, "V2LLiV2LLiV2LLiV2LLiUc", "nc", "avx512vl,avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_vpshldvq128_maskz, "V2LLiV2LLiV2LLiV2LLiUc", "ncV:128:", "avx512vl,avx512vbmi2")
	TARGET_BUILTIN(__builtin_ia32_vpshldvq256_maskz, "V4LLiV4LLiV4LLiV4LLiUc", "nc", "avx512vl,avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_vpshldvq256_maskz, "V4LLiV4LLiV4LLiV4LLiUc", "ncV:256:", "avx512vl,avx512vbmi2")
	TARGET_BUILTIN(__builtin_ia32_vpshldvq512_maskz, "V8LLiV8LLiV8LLiV8LLiUc", "nc", "avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_vpshldvq512_maskz, "V8LLiV8LLiV8LLiV8LLiUc", "ncV:512:", "avx512vbmi2")
	TARGET_BUILTIN(__builtin_ia32_vpshldvw128_maskz, "V8sV8sV8sV8sUc", "nc", "avx512vl,avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_vpshldvw128_maskz, "V8sV8sV8sV8sUc", "ncV:128:", "avx512vl,avx512vbmi2")
	TARGET_BUILTIN(__builtin_ia32_vpshldvw256_maskz, "V16sV16sV16sV16sUs", "nc", "avx512vl,avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_vpshldvw256_maskz, "V16sV16sV16sV16sUs", "ncV:256:", "avx512vl,avx512vbmi2")
	TARGET_BUILTIN(__builtin_ia32_vpshldvw512_maskz, "V32sV32sV32sV32sUi", "nc", "avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_vpshldvw512_maskz, "V32sV32sV32sV32sUi", "ncV:512:", "avx512vbmi2")

	TARGET_BUILTIN(__builtin_ia32_vpshrdvd128_mask, "V4iV4iV4iV4iUc", "nc", "avx512vl,avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_vpshrdvd128_mask, "V4iV4iV4iV4iUc", "ncV:128:", "avx512vl,avx512vbmi2")
	TARGET_BUILTIN(__builtin_ia32_vpshrdvd256_mask, "V8iV8iV8iV8iUc", "nc", "avx512vl,avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_vpshrdvd256_mask, "V8iV8iV8iV8iUc", "ncV:256:", "avx512vl,avx512vbmi2")
	TARGET_BUILTIN(__builtin_ia32_vpshrdvd512_mask, "V16iV16iV16iV16iUs", "nc", "avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_vpshrdvd512_mask, "V16iV16iV16iV16iUs", "ncV:512:", "avx512vbmi2")
	TARGET_BUILTIN(__builtin_ia32_vpshrdvq128_mask, "V2LLiV2LLiV2LLiV2LLiUc", "nc", "avx512vl,avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_vpshrdvq128_mask, "V2LLiV2LLiV2LLiV2LLiUc", "ncV:128:", "avx512vl,avx512vbmi2")
	TARGET_BUILTIN(__builtin_ia32_vpshrdvq256_mask, "V4LLiV4LLiV4LLiV4LLiUc", "nc", "avx512vl,avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_vpshrdvq256_mask, "V4LLiV4LLiV4LLiV4LLiUc", "ncV:256:", "avx512vl,avx512vbmi2")
	TARGET_BUILTIN(__builtin_ia32_vpshrdvq512_mask, "V8LLiV8LLiV8LLiV8LLiUc", "nc", "avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_vpshrdvq512_mask, "V8LLiV8LLiV8LLiV8LLiUc", "ncV:512:", "avx512vbmi2")
	TARGET_BUILTIN(__builtin_ia32_vpshrdvw128_mask, "V8sV8sV8sV8sUc", "nc", "avx512vl,avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_vpshrdvw128_mask, "V8sV8sV8sV8sUc", "ncV:128:", "avx512vl,avx512vbmi2")
	TARGET_BUILTIN(__builtin_ia32_vpshrdvw256_mask, "V16sV16sV16sV16sUs", "nc", "avx512vl,avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_vpshrdvw256_mask, "V16sV16sV16sV16sUs", "ncV:256:", "avx512vl,avx512vbmi2")
	TARGET_BUILTIN(__builtin_ia32_vpshrdvw512_mask, "V32sV32sV32sV32sUi", "nc", "avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_vpshrdvw512_mask, "V32sV32sV32sV32sUi", "ncV:512:", "avx512vbmi2")
	TARGET_BUILTIN(__builtin_ia32_vpshrdvd128_maskz, "V4iV4iV4iV4iUc", "nc", "avx512vl,avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_vpshrdvd128_maskz, "V4iV4iV4iV4iUc", "ncV:128:", "avx512vl,avx512vbmi2")
	TARGET_BUILTIN(__builtin_ia32_vpshrdvd256_maskz, "V8iV8iV8iV8iUc", "nc", "avx512vl,avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_vpshrdvd256_maskz, "V8iV8iV8iV8iUc", "ncV:256:", "avx512vl,avx512vbmi2")
	TARGET_BUILTIN(__builtin_ia32_vpshrdvd512_maskz, "V16iV16iV16iV16iUs", "nc", "avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_vpshrdvd512_maskz, "V16iV16iV16iV16iUs", "ncV:512:", "avx512vbmi2")
	TARGET_BUILTIN(__builtin_ia32_vpshrdvq128_maskz, "V2LLiV2LLiV2LLiV2LLiUc", "nc", "avx512vl,avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_vpshrdvq128_maskz, "V2LLiV2LLiV2LLiV2LLiUc", "ncV:128:", "avx512vl,avx512vbmi2")
	TARGET_BUILTIN(__builtin_ia32_vpshrdvq256_maskz, "V4LLiV4LLiV4LLiV4LLiUc", "nc", "avx512vl,avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_vpshrdvq256_maskz, "V4LLiV4LLiV4LLiV4LLiUc", "ncV:256:", "avx512vl,avx512vbmi2")
	TARGET_BUILTIN(__builtin_ia32_vpshrdvq512_maskz, "V8LLiV8LLiV8LLiV8LLiUc", "nc", "avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_vpshrdvq512_maskz, "V8LLiV8LLiV8LLiV8LLiUc", "ncV:512:", "avx512vbmi2")
	TARGET_BUILTIN(__builtin_ia32_vpshrdvw128_maskz, "V8sV8sV8sV8sUc", "nc", "avx512vl,avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_vpshrdvw128_maskz, "V8sV8sV8sV8sUc", "ncV:128:", "avx512vl,avx512vbmi2")
	TARGET_BUILTIN(__builtin_ia32_vpshrdvw256_maskz, "V16sV16sV16sV16sUs", "nc", "avx512vl,avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_vpshrdvw256_maskz, "V16sV16sV16sV16sUs", "ncV:256:", "avx512vl,avx512vbmi2")
	TARGET_BUILTIN(__builtin_ia32_vpshrdvw512_maskz, "V32sV32sV32sV32sUi", "nc", "avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_vpshrdvw512_maskz, "V32sV32sV32sV32sUi", "ncV:512:", "avx512vbmi2")

	TARGET_BUILTIN(__builtin_ia32_vpshrdd128, "V4iV4iV4iIi", "nc", "avx512vl,avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_vpshrdd128, "V4iV4iV4iIi", "ncV:128:", "avx512vl,avx512vbmi2")
	TARGET_BUILTIN(__builtin_ia32_vpshrdd256, "V8iV8iV8iIi", "nc", "avx512vl,avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_vpshrdd256, "V8iV8iV8iIi", "ncV:256:", "avx512vl,avx512vbmi2")
	TARGET_BUILTIN(__builtin_ia32_vpshrdd512, "V16iV16iV16iIi", "nc", "avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_vpshrdd512, "V16iV16iV16iIi", "ncV:512:", "avx512vbmi2")
	TARGET_BUILTIN(__builtin_ia32_vpshrdq128, "V2LLiV2LLiV2LLiIi", "nc", "avx512vl,avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_vpshrdq128, "V2LLiV2LLiV2LLiIi", "ncV:128:", "avx512vl,avx512vbmi2")
	TARGET_BUILTIN(__builtin_ia32_vpshrdq256, "V4LLiV4LLiV4LLiIi", "nc", "avx512vl,avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_vpshrdq256, "V4LLiV4LLiV4LLiIi", "ncV:256:", "avx512vl,avx512vbmi2")
	TARGET_BUILTIN(__builtin_ia32_vpshrdq512, "V8LLiV8LLiV8LLiIi", "nc", "avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_vpshrdq512, "V8LLiV8LLiV8LLiIi", "ncV:512:", "avx512vbmi2")
	TARGET_BUILTIN(__builtin_ia32_vpshrdw128, "V8sV8sV8sIi", "nc", "avx512vl,avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_vpshrdw128, "V8sV8sV8sIi", "ncV:128:", "avx512vl,avx512vbmi2")
	TARGET_BUILTIN(__builtin_ia32_vpshrdw256, "V16sV16sV16sIi", "nc", "avx512vl,avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_vpshrdw256, "V16sV16sV16sIi", "ncV:256:", "avx512vl,avx512vbmi2")
	TARGET_BUILTIN(__builtin_ia32_vpshrdw512, "V32sV32sV32sIi", "nc", "avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_vpshrdw512, "V32sV32sV32sIi", "ncV:512:", "avx512vbmi2")

	TARGET_BUILTIN(__builtin_ia32_pmovswb512_mask, "V32cV32sV32cUi", "nc", "avx512bw")			TARGET_BUILTIN(__builtin_ia32_pmovswb512_mask, "V32cV32sV32cUi", "ncV:512:", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_pmovuswb512_mask, "V32cV32sV32cUi", "nc", "avx512bw")			TARGET_BUILTIN(__builtin_ia32_pmovuswb512_mask, "V32cV32sV32cUi", "ncV:512:", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_pmovwb512_mask, "V32cV32sV32cUi", "nc", "avx512bw")			TARGET_BUILTIN(__builtin_ia32_pmovwb512_mask, "V32cV32sV32cUi", "ncV:512:", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_cvtpd2qq128_mask, "V2LLiV2dV2LLiUc", "nc", "avx512vl,avx512dq")			TARGET_BUILTIN(__builtin_ia32_cvtpd2qq128_mask, "V2LLiV2dV2LLiUc", "ncV:128:", "avx512vl,avx512dq")
	TARGET_BUILTIN(__builtin_ia32_cvtpd2qq256_mask, "V4LLiV4dV4LLiUc", "nc", "avx512vl,avx512dq")			TARGET_BUILTIN(__builtin_ia32_cvtpd2qq256_mask, "V4LLiV4dV4LLiUc", "ncV:256:", "avx512vl,avx512dq")
	TARGET_BUILTIN(__builtin_ia32_cvtpd2uqq128_mask, "V2LLiV2dV2LLiUc", "nc", "avx512vl,avx512dq")			TARGET_BUILTIN(__builtin_ia32_cvtpd2uqq128_mask, "V2LLiV2dV2LLiUc", "ncV:128:", "avx512vl,avx512dq")
	TARGET_BUILTIN(__builtin_ia32_cvtpd2uqq256_mask, "V4LLiV4dV4LLiUc", "nc", "avx512vl,avx512dq")			TARGET_BUILTIN(__builtin_ia32_cvtpd2uqq256_mask, "V4LLiV4dV4LLiUc", "ncV:256:", "avx512vl,avx512dq")
	TARGET_BUILTIN(__builtin_ia32_cvtps2qq128_mask, "V2LLiV4fV2LLiUc", "nc", "avx512vl,avx512dq")			TARGET_BUILTIN(__builtin_ia32_cvtps2qq128_mask, "V2LLiV4fV2LLiUc", "ncV:128:", "avx512vl,avx512dq")
	TARGET_BUILTIN(__builtin_ia32_cvtps2qq256_mask, "V4LLiV4fV4LLiUc", "nc", "avx512vl,avx512dq")			TARGET_BUILTIN(__builtin_ia32_cvtps2qq256_mask, "V4LLiV4fV4LLiUc", "ncV:256:", "avx512vl,avx512dq")
	TARGET_BUILTIN(__builtin_ia32_cvtps2uqq128_mask, "V2LLiV4fV2LLiUc", "nc", "avx512vl,avx512dq")			TARGET_BUILTIN(__builtin_ia32_cvtps2uqq128_mask, "V2LLiV4fV2LLiUc", "ncV:128:", "avx512vl,avx512dq")
	TARGET_BUILTIN(__builtin_ia32_cvtps2uqq256_mask, "V4LLiV4fV4LLiUc", "nc", "avx512vl,avx512dq")			TARGET_BUILTIN(__builtin_ia32_cvtps2uqq256_mask, "V4LLiV4fV4LLiUc", "ncV:256:", "avx512vl,avx512dq")
	TARGET_BUILTIN(__builtin_ia32_cvtqq2ps128_mask, "V4fV2LLiV4fUc", "nc", "avx512vl,avx512dq")			TARGET_BUILTIN(__builtin_ia32_cvtqq2ps128_mask, "V4fV2LLiV4fUc", "ncV:128:", "avx512vl,avx512dq")
	TARGET_BUILTIN(__builtin_ia32_cvtqq2ps256_mask, "V4fV4LLiV4fUc", "nc", "avx512vl,avx512dq")			TARGET_BUILTIN(__builtin_ia32_cvtqq2ps256_mask, "V4fV4LLiV4fUc", "ncV:256:", "avx512vl,avx512dq")
	TARGET_BUILTIN(__builtin_ia32_cvttpd2qq128_mask, "V2LLiV2dV2LLiUc", "nc", "avx512vl,avx512dq")			TARGET_BUILTIN(__builtin_ia32_cvttpd2qq128_mask, "V2LLiV2dV2LLiUc", "ncV:128:", "avx512vl,avx512dq")
	TARGET_BUILTIN(__builtin_ia32_cvttpd2qq256_mask, "V4LLiV4dV4LLiUc", "nc", "avx512vl,avx512dq")			TARGET_BUILTIN(__builtin_ia32_cvttpd2qq256_mask, "V4LLiV4dV4LLiUc", "ncV:256:", "avx512vl,avx512dq")
	TARGET_BUILTIN(__builtin_ia32_cvttpd2uqq128_mask, "V2LLiV2dV2LLiUc", "nc", "avx512vl,avx512dq")			TARGET_BUILTIN(__builtin_ia32_cvttpd2uqq128_mask, "V2LLiV2dV2LLiUc", "ncV:128:", "avx512vl,avx512dq")
	TARGET_BUILTIN(__builtin_ia32_cvttpd2uqq256_mask, "V4LLiV4dV4LLiUc", "nc", "avx512vl,avx512dq")			TARGET_BUILTIN(__builtin_ia32_cvttpd2uqq256_mask, "V4LLiV4dV4LLiUc", "ncV:256:", "avx512vl,avx512dq")
	TARGET_BUILTIN(__builtin_ia32_cvttps2qq128_mask, "V2LLiV4fV2LLiUc", "nc", "avx512vl,avx512dq")			TARGET_BUILTIN(__builtin_ia32_cvttps2qq128_mask, "V2LLiV4fV2LLiUc", "ncV:128:", "avx512vl,avx512dq")
	TARGET_BUILTIN(__builtin_ia32_cvttps2qq256_mask, "V4LLiV4fV4LLiUc", "nc", "avx512vl,avx512dq")			TARGET_BUILTIN(__builtin_ia32_cvttps2qq256_mask, "V4LLiV4fV4LLiUc", "ncV:256:", "avx512vl,avx512dq")
	TARGET_BUILTIN(__builtin_ia32_cvttps2uqq128_mask, "V2LLiV4fV2LLiUc", "nc", "avx512vl,avx512dq")			TARGET_BUILTIN(__builtin_ia32_cvttps2uqq128_mask, "V2LLiV4fV2LLiUc", "ncV:128:", "avx512vl,avx512dq")
	TARGET_BUILTIN(__builtin_ia32_cvttps2uqq256_mask, "V4LLiV4fV4LLiUc", "nc", "avx512vl,avx512dq")			TARGET_BUILTIN(__builtin_ia32_cvttps2uqq256_mask, "V4LLiV4fV4LLiUc", "ncV:256:", "avx512vl,avx512dq")
	TARGET_BUILTIN(__builtin_ia32_cvtuqq2ps128_mask, "V4fV2LLiV4fUc", "nc", "avx512vl,avx512dq")			TARGET_BUILTIN(__builtin_ia32_cvtuqq2ps128_mask, "V4fV2LLiV4fUc", "ncV:128:", "avx512vl,avx512dq")
	TARGET_BUILTIN(__builtin_ia32_cvtuqq2ps256_mask, "V4fV4LLiV4fUc", "nc", "avx512vl,avx512dq")			TARGET_BUILTIN(__builtin_ia32_cvtuqq2ps256_mask, "V4fV4LLiV4fUc", "ncV:256:", "avx512vl,avx512dq")
	TARGET_BUILTIN(__builtin_ia32_rangepd128_mask, "V2dV2dV2dIiV2dUc", "nc", "avx512vl,avx512dq")			TARGET_BUILTIN(__builtin_ia32_rangepd128_mask, "V2dV2dV2dIiV2dUc", "ncV:128:", "avx512vl,avx512dq")
	TARGET_BUILTIN(__builtin_ia32_rangepd256_mask, "V4dV4dV4dIiV4dUc", "nc", "avx512vl,avx512dq")			TARGET_BUILTIN(__builtin_ia32_rangepd256_mask, "V4dV4dV4dIiV4dUc", "ncV:256:", "avx512vl,avx512dq")
	TARGET_BUILTIN(__builtin_ia32_rangeps128_mask, "V4fV4fV4fIiV4fUc", "nc", "avx512vl,avx512dq")			TARGET_BUILTIN(__builtin_ia32_rangeps128_mask, "V4fV4fV4fIiV4fUc", "ncV:128:", "avx512vl,avx512dq")
	TARGET_BUILTIN(__builtin_ia32_rangeps256_mask, "V8fV8fV8fIiV8fUc", "nc", "avx512vl,avx512dq")			TARGET_BUILTIN(__builtin_ia32_rangeps256_mask, "V8fV8fV8fIiV8fUc", "ncV:256:", "avx512vl,avx512dq")
	TARGET_BUILTIN(__builtin_ia32_rangesd128_round_mask, "V2dV2dV2dV2dUcIiIi", "nc", "avx512dq")			TARGET_BUILTIN(__builtin_ia32_rangesd128_round_mask, "V2dV2dV2dV2dUcIiIi", "ncV:128:", "avx512dq")
	TARGET_BUILTIN(__builtin_ia32_rangess128_round_mask, "V4fV4fV4fV4fUcIiIi", "nc", "avx512dq")			TARGET_BUILTIN(__builtin_ia32_rangess128_round_mask, "V4fV4fV4fV4fUcIiIi", "ncV:128:", "avx512dq")
	TARGET_BUILTIN(__builtin_ia32_reducepd128_mask, "V2dV2dIiV2dUc", "nc", "avx512vl,avx512dq")			TARGET_BUILTIN(__builtin_ia32_reducepd128_mask, "V2dV2dIiV2dUc", "ncV:128:", "avx512vl,avx512dq")
	TARGET_BUILTIN(__builtin_ia32_reducepd256_mask, "V4dV4dIiV4dUc", "nc", "avx512vl,avx512dq")			TARGET_BUILTIN(__builtin_ia32_reducepd256_mask, "V4dV4dIiV4dUc", "ncV:256:", "avx512vl,avx512dq")
	TARGET_BUILTIN(__builtin_ia32_reduceps128_mask, "V4fV4fIiV4fUc", "nc", "avx512vl,avx512dq")			TARGET_BUILTIN(__builtin_ia32_reduceps128_mask, "V4fV4fIiV4fUc", "ncV:128:", "avx512vl,avx512dq")
	TARGET_BUILTIN(__builtin_ia32_reduceps256_mask, "V8fV8fIiV8fUc", "nc", "avx512vl,avx512dq")			TARGET_BUILTIN(__builtin_ia32_reduceps256_mask, "V8fV8fIiV8fUc", "ncV:256:", "avx512vl,avx512dq")
	TARGET_BUILTIN(__builtin_ia32_reducesd_mask, "V2dV2dV2dV2dUcIiIi", "nc", "avx512dq")			TARGET_BUILTIN(__builtin_ia32_reducesd_mask, "V2dV2dV2dV2dUcIiIi", "ncV:128:", "avx512dq")
	TARGET_BUILTIN(__builtin_ia32_reducess_mask, "V4fV4fV4fV4fUcIiIi", "nc", "avx512dq")			TARGET_BUILTIN(__builtin_ia32_reducess_mask, "V4fV4fV4fV4fUcIiIi", "ncV:128:", "avx512dq")
	TARGET_BUILTIN(__builtin_ia32_pmovswb128_mask, "V16cV8sV16cUc", "nc", "avx512vl,avx512bw")			TARGET_BUILTIN(__builtin_ia32_pmovswb128_mask, "V16cV8sV16cUc", "ncV:128:", "avx512vl,avx512bw")
	TARGET_BUILTIN(__builtin_ia32_pmovswb256_mask, "V16cV16sV16cUs", "nc", "avx512vl,avx512bw")			TARGET_BUILTIN(__builtin_ia32_pmovswb256_mask, "V16cV16sV16cUs", "ncV:256:", "avx512vl,avx512bw")
	TARGET_BUILTIN(__builtin_ia32_pmovuswb128_mask, "V16cV8sV16cUc", "nc", "avx512vl,avx512bw")			TARGET_BUILTIN(__builtin_ia32_pmovuswb128_mask, "V16cV8sV16cUc", "ncV:128:", "avx512vl,avx512bw")
	TARGET_BUILTIN(__builtin_ia32_pmovuswb256_mask, "V16cV16sV16cUs", "nc", "avx512vl,avx512bw")			TARGET_BUILTIN(__builtin_ia32_pmovuswb256_mask, "V16cV16sV16cUs", "ncV:256:", "avx512vl,avx512bw")
	TARGET_BUILTIN(__builtin_ia32_pmovwb128_mask, "V16cV8sV16cUc", "nc", "avx512vl,avx512bw")			TARGET_BUILTIN(__builtin_ia32_pmovwb128_mask, "V16cV8sV16cUc", "ncV:128:", "avx512vl,avx512bw")
	TARGET_BUILTIN(__builtin_ia32_cvtpd2qq512_mask, "V8LLiV8dV8LLiUcIi", "nc", "avx512dq")			TARGET_BUILTIN(__builtin_ia32_cvtpd2qq512_mask, "V8LLiV8dV8LLiUcIi", "ncV:512:", "avx512dq")
	TARGET_BUILTIN(__builtin_ia32_cvtpd2uqq512_mask, "V8LLiV8dV8LLiUcIi", "nc", "avx512dq")			TARGET_BUILTIN(__builtin_ia32_cvtpd2uqq512_mask, "V8LLiV8dV8LLiUcIi", "ncV:512:", "avx512dq")
	TARGET_BUILTIN(__builtin_ia32_cvtps2qq512_mask, "V8LLiV8fV8LLiUcIi", "nc", "avx512dq")			TARGET_BUILTIN(__builtin_ia32_cvtps2qq512_mask, "V8LLiV8fV8LLiUcIi", "ncV:512:", "avx512dq")
	TARGET_BUILTIN(__builtin_ia32_cvtps2uqq512_mask, "V8LLiV8fV8LLiUcIi", "nc", "avx512dq")			TARGET_BUILTIN(__builtin_ia32_cvtps2uqq512_mask, "V8LLiV8fV8LLiUcIi", "ncV:512:", "avx512dq")
	TARGET_BUILTIN(__builtin_ia32_cvtqq2pd512_mask, "V8dV8LLiV8dUcIi", "nc", "avx512dq")			TARGET_BUILTIN(__builtin_ia32_cvtqq2pd512_mask, "V8dV8LLiV8dUcIi", "ncV:512:", "avx512dq")
	TARGET_BUILTIN(__builtin_ia32_cvtqq2ps512_mask, "V8fV8LLiV8fUcIi", "nc", "avx512dq")			TARGET_BUILTIN(__builtin_ia32_cvtqq2ps512_mask, "V8fV8LLiV8fUcIi", "ncV:512:", "avx512dq")
	TARGET_BUILTIN(__builtin_ia32_cvttpd2qq512_mask, "V8LLiV8dV8LLiUcIi", "nc", "avx512dq")			TARGET_BUILTIN(__builtin_ia32_cvttpd2qq512_mask, "V8LLiV8dV8LLiUcIi", "ncV:512:", "avx512dq")
	TARGET_BUILTIN(__builtin_ia32_cvttpd2uqq512_mask, "V8LLiV8dV8LLiUcIi", "nc", "avx512dq")			TARGET_BUILTIN(__builtin_ia32_cvttpd2uqq512_mask, "V8LLiV8dV8LLiUcIi", "ncV:512:", "avx512dq")
	TARGET_BUILTIN(__builtin_ia32_cvttps2qq512_mask, "V8LLiV8fV8LLiUcIi", "nc", "avx512dq")			TARGET_BUILTIN(__builtin_ia32_cvttps2qq512_mask, "V8LLiV8fV8LLiUcIi", "ncV:512:", "avx512dq")
	TARGET_BUILTIN(__builtin_ia32_cvttps2uqq512_mask, "V8LLiV8fV8LLiUcIi", "nc", "avx512dq")			TARGET_BUILTIN(__builtin_ia32_cvttps2uqq512_mask, "V8LLiV8fV8LLiUcIi", "ncV:512:", "avx512dq")
	TARGET_BUILTIN(__builtin_ia32_cvtuqq2pd512_mask, "V8dV8LLiV8dUcIi", "nc", "avx512dq")			TARGET_BUILTIN(__builtin_ia32_cvtuqq2pd512_mask, "V8dV8LLiV8dUcIi", "ncV:512:", "avx512dq")
	TARGET_BUILTIN(__builtin_ia32_cvtuqq2ps512_mask, "V8fV8LLiV8fUcIi", "nc", "avx512dq")			TARGET_BUILTIN(__builtin_ia32_cvtuqq2ps512_mask, "V8fV8LLiV8fUcIi", "ncV:512:", "avx512dq")
	TARGET_BUILTIN(__builtin_ia32_rangepd512_mask, "V8dV8dV8dIiV8dUcIi", "nc", "avx512dq")			TARGET_BUILTIN(__builtin_ia32_rangepd512_mask, "V8dV8dV8dIiV8dUcIi", "ncV:512:", "avx512dq")
	TARGET_BUILTIN(__builtin_ia32_rangeps512_mask, "V16fV16fV16fIiV16fUsIi", "nc", "avx512dq")			TARGET_BUILTIN(__builtin_ia32_rangeps512_mask, "V16fV16fV16fIiV16fUsIi", "ncV:512:", "avx512dq")
	TARGET_BUILTIN(__builtin_ia32_reducepd512_mask, "V8dV8dIiV8dUcIi", "nc", "avx512dq")			TARGET_BUILTIN(__builtin_ia32_reducepd512_mask, "V8dV8dIiV8dUcIi", "ncV:512:", "avx512dq")
	TARGET_BUILTIN(__builtin_ia32_reduceps512_mask, "V16fV16fIiV16fUsIi", "nc", "avx512dq")			TARGET_BUILTIN(__builtin_ia32_reduceps512_mask, "V16fV16fIiV16fUsIi", "ncV:512:", "avx512dq")
	TARGET_BUILTIN(__builtin_ia32_prold512_mask, "V16iV16iIiV16iUs", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_prold512_mask, "V16iV16iIiV16iUs", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_prolq512_mask, "V8LLiV8LLiIiV8LLiUc", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_prolq512_mask, "V8LLiV8LLiIiV8LLiUc", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_prold128_mask, "V4iV4iIiV4iUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_prold128_mask, "V4iV4iIiV4iUc", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_prold256_mask, "V8iV8iIiV8iUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_prold256_mask, "V8iV8iIiV8iUc", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_prolq128_mask, "V2LLiV2LLiIiV2LLiUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_prolq128_mask, "V2LLiV2LLiIiV2LLiUc", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_prolq256_mask, "V4LLiV4LLiIiV4LLiUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_prolq256_mask, "V4LLiV4LLiIiV4LLiUc", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_prolvd512_mask, "V16iV16iV16iV16iUs", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_prolvd512_mask, "V16iV16iV16iV16iUs", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_prolvq512_mask, "V8LLiV8LLiV8LLiV8LLiUc", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_prolvq512_mask, "V8LLiV8LLiV8LLiV8LLiUc", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_prord512_mask, "V16iV16iIiV16iUs", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_prord512_mask, "V16iV16iiV16iUs", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_prorq512_mask, "V8LLiV8LLiIiV8LLiUc", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_prorq512_mask, "V8LLiV8LLiiV8LLiUc", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_prolvd128_mask, "V4iV4iV4iV4iUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_prolvd128_mask, "V4iV4iV4iV4iUc", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_prolvd256_mask, "V8iV8iV8iV8iUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_prolvd256_mask, "V8iV8iV8iV8iUc", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_prolvq128_mask, "V2LLiV2LLiV2LLiV2LLiUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_prolvq128_mask, "V2LLiV2LLiV2LLiV2LLiUc", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_prolvq256_mask, "V4LLiV4LLiV4LLiV4LLiUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_prolvq256_mask, "V4LLiV4LLiV4LLiV4LLiUc", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_prord128_mask, "V4iV4iIiV4iUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_prord128_mask, "V4iV4iIiV4iUc", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_prord256_mask, "V8iV8iIiV8iUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_prord256_mask, "V8iV8iIiV8iUc", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_prorq128_mask, "V2LLiV2LLiIiV2LLiUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_prorq128_mask, "V2LLiV2LLiIiV2LLiUc", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_prorq256_mask, "V4LLiV4LLiIiV4LLiUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_prorq256_mask, "V4LLiV4LLiIiV4LLiUc", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_prorvd512_mask, "V16iV16iV16iV16iUs", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_prorvd512_mask, "V16iV16iV16iV16iUs", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_prorvq512_mask, "V8LLiV8LLiV8LLiV8LLiUc", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_prorvq512_mask, "V8LLiV8LLiV8LLiV8LLiUc", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_prorvd128_mask, "V4iV4iV4iV4iUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_prorvd128_mask, "V4iV4iV4iV4iUc", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_prorvd256_mask, "V8iV8iV8iV8iUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_prorvd256_mask, "V8iV8iV8iV8iUc", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_prorvq128_mask, "V2LLiV2LLiV2LLiV2LLiUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_prorvq128_mask, "V2LLiV2LLiV2LLiV2LLiUc", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_prorvq256_mask, "V4LLiV4LLiV4LLiV4LLiUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_prorvq256_mask, "V4LLiV4LLiV4LLiV4LLiUc", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pshufhw512, "V32sV32sIi", "nc ", "avx512bw")			TARGET_BUILTIN(__builtin_ia32_pshufhw512, "V32sV32sIi", "ncV:512:", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_pshuflw512, "V32sV32sIi", "nc ", "avx512bw")			TARGET_BUILTIN(__builtin_ia32_pshuflw512, "V32sV32sIi", "ncV:512:", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_psllv32hi, "V32sV32sV32s", "nc", "avx512bw")			TARGET_BUILTIN(__builtin_ia32_psllv32hi, "V32sV32sV32s", "ncV:512:", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_psllw512, "V32sV32sV8s", "nc", "avx512bw")			TARGET_BUILTIN(__builtin_ia32_psllw512, "V32sV32sV8s", "ncV:512:", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_psllwi512, "V32sV32si", "nc", "avx512bw")			TARGET_BUILTIN(__builtin_ia32_psllwi512, "V32sV32si", "ncV:512:", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_psllv16hi, "V16sV16sV16s", "nc", "avx512bw,avx512vl")			TARGET_BUILTIN(__builtin_ia32_psllv16hi, "V16sV16sV16s", "ncV:256:", "avx512bw,avx512vl")
	TARGET_BUILTIN(__builtin_ia32_psllv8hi, "V8sV8sV8s", "nc", "avx512bw,avx512vl")			TARGET_BUILTIN(__builtin_ia32_psllv8hi, "V8sV8sV8s", "ncV:128:", "avx512bw,avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pslldi512, "V16iV16ii", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_pslldi512, "V16iV16ii", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_psllqi512, "V8LLiV8LLii", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_psllqi512, "V8LLiV8LLii", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_psrlv32hi, "V32sV32sV32s", "nc", "avx512bw")			TARGET_BUILTIN(__builtin_ia32_psrlv32hi, "V32sV32sV32s", "ncV:512:", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_psrlv16hi, "V16sV16sV16s", "nc", "avx512bw,avx512vl")			TARGET_BUILTIN(__builtin_ia32_psrlv16hi, "V16sV16sV16s", "ncV:256:", "avx512bw,avx512vl")
	TARGET_BUILTIN(__builtin_ia32_psrlv8hi, "V8sV8sV8s", "nc", "avx512bw,avx512vl")			TARGET_BUILTIN(__builtin_ia32_psrlv8hi, "V8sV8sV8s", "ncV:128:", "avx512bw,avx512vl")
	TARGET_BUILTIN(__builtin_ia32_psrldi512, "V16iV16ii", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_psrldi512, "V16iV16ii", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_psrlqi512, "V8LLiV8LLii", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_psrlqi512, "V8LLiV8LLii", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_psrav32hi, "V32sV32sV32s", "nc", "avx512bw")			TARGET_BUILTIN(__builtin_ia32_psrav32hi, "V32sV32sV32s", "ncV:512:", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_psrav16hi, "V16sV16sV16s", "nc", "avx512bw,avx512vl")			TARGET_BUILTIN(__builtin_ia32_psrav16hi, "V16sV16sV16s", "ncV:256:", "avx512bw,avx512vl")
	TARGET_BUILTIN(__builtin_ia32_psrav8hi, "V8sV8sV8s", "nc", "avx512bw,avx512vl")			TARGET_BUILTIN(__builtin_ia32_psrav8hi, "V8sV8sV8s", "ncV:128:", "avx512bw,avx512vl")
	TARGET_BUILTIN(__builtin_ia32_psravq128, "V2LLiV2LLiV2LLi", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_psravq128, "V2LLiV2LLiV2LLi", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_psravq256, "V4LLiV4LLiV4LLi", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_psravq256, "V4LLiV4LLiV4LLi", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_psraw512, "V32sV32sV8s", "nc", "avx512bw")			TARGET_BUILTIN(__builtin_ia32_psraw512, "V32sV32sV8s", "ncV:512:", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_psrawi512, "V32sV32si", "nc", "avx512bw")			TARGET_BUILTIN(__builtin_ia32_psrawi512, "V32sV32si", "ncV:512:", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_psrlw512, "V32sV32sV8s", "nc", "avx512bw")			TARGET_BUILTIN(__builtin_ia32_psrlw512, "V32sV32sV8s", "ncV:512:", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_psrlwi512, "V32sV32si", "nc", "avx512bw")			TARGET_BUILTIN(__builtin_ia32_psrlwi512, "V32sV32si", "ncV:512:", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_pslldqi512_byteshift, "V8LLiV8LLiIi", "nc", "avx512bw")			TARGET_BUILTIN(__builtin_ia32_pslldqi512_byteshift, "V8LLiV8LLiIi", "ncV:512:", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_psrldqi512_byteshift, "V8LLiV8LLiIi", "nc", "avx512bw")			TARGET_BUILTIN(__builtin_ia32_psrldqi512_byteshift, "V8LLiV8LLiIi", "ncV:512:", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_movdqa32load128_mask, "V4iV4i*V4iUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_movdqa32load128_mask, "V4iV4i*V4iUc", "nV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_movdqa32load256_mask, "V8iV8i*V8iUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_movdqa32load256_mask, "V8iV8i*V8iUc", "nV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_movdqa32load512_mask, "V16iV16iC*V16iUs", "n", "avx512f")			TARGET_BUILTIN(__builtin_ia32_movdqa32load512_mask, "V16iV16iC*V16iUs", "nV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_movdqa32store512_mask, "vV16i*V16iUs", "n", "avx512f")			TARGET_BUILTIN(__builtin_ia32_movdqa32store512_mask, "vV16i*V16iUs", "nV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_movdqa64load512_mask, "V8LLiV8LLiC*V8LLiUc", "n", "avx512f")			TARGET_BUILTIN(__builtin_ia32_movdqa64load512_mask, "V8LLiV8LLiC*V8LLiUc", "nV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_movdqa64store512_mask, "vV8LLi*V8LLiUc", "n", "avx512f")			TARGET_BUILTIN(__builtin_ia32_movdqa64store512_mask, "vV8LLi*V8LLiUc", "nV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_movdqa32store128_mask, "vV4i*V4iUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_movdqa32store128_mask, "vV4i*V4iUc", "nV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_movdqa32store256_mask, "vV8i*V8iUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_movdqa32store256_mask, "vV8i*V8iUc", "nV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_movdqa64load128_mask, "V2LLiV2LLiC*V2LLiUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_movdqa64load128_mask, "V2LLiV2LLiC*V2LLiUc", "nV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_movdqa64load256_mask, "V4LLiV4LLiC*V4LLiUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_movdqa64load256_mask, "V4LLiV4LLiC*V4LLiUc", "nV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_movdqa64store128_mask, "vV2LLi*V2LLiUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_movdqa64store128_mask, "vV2LLi*V2LLiUc", "nV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_movdqa64store256_mask, "vV4LLi*V4LLiUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_movdqa64store256_mask, "vV4LLi*V4LLiUc", "nV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_vpmadd52huq512, "V8LLiV8LLiV8LLiV8LLi", "nc", "avx512ifma")			TARGET_BUILTIN(__builtin_ia32_vpmadd52huq512, "V8LLiV8LLiV8LLiV8LLi", "ncV:512:", "avx512ifma")
	TARGET_BUILTIN(__builtin_ia32_vpmadd52luq512, "V8LLiV8LLiV8LLiV8LLi", "nc", "avx512ifma")			TARGET_BUILTIN(__builtin_ia32_vpmadd52luq512, "V8LLiV8LLiV8LLiV8LLi", "ncV:512:", "avx512ifma")
	TARGET_BUILTIN(__builtin_ia32_vpmadd52huq128, "V2LLiV2LLiV2LLiV2LLi", "nc", "avx512ifma,avx512vl")			TARGET_BUILTIN(__builtin_ia32_vpmadd52huq128, "V2LLiV2LLiV2LLiV2LLi", "ncV:128:", "avx512ifma,avx512vl")
	TARGET_BUILTIN(__builtin_ia32_vpmadd52huq256, "V4LLiV4LLiV4LLiV4LLi", "nc", "avx512ifma,avx512vl")			TARGET_BUILTIN(__builtin_ia32_vpmadd52huq256, "V4LLiV4LLiV4LLiV4LLi", "ncV:256:", "avx512ifma,avx512vl")
	TARGET_BUILTIN(__builtin_ia32_vpmadd52luq128, "V2LLiV2LLiV2LLiV2LLi", "nc", "avx512ifma,avx512vl")			TARGET_BUILTIN(__builtin_ia32_vpmadd52luq128, "V2LLiV2LLiV2LLiV2LLi", "ncV:128:", "avx512ifma,avx512vl")
	TARGET_BUILTIN(__builtin_ia32_vpmadd52luq256, "V4LLiV4LLiV4LLiV4LLi", "nc", "avx512ifma,avx512vl")			TARGET_BUILTIN(__builtin_ia32_vpmadd52luq256, "V4LLiV4LLiV4LLiV4LLi", "ncV:256:", "avx512ifma,avx512vl")
	TARGET_BUILTIN(__builtin_ia32_vcomisd, "iV2dV2dIiIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_vcomisd, "iV2dV2dIiIi", "ncV:128:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_vcomiss, "iV4fV4fIiIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_vcomiss, "iV4fV4fIiIi", "ncV:128:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_kunpckdi, "ULLiULLiULLi", "nc", "avx512bw")			TARGET_BUILTIN(__builtin_ia32_kunpckdi, "ULLiULLiULLi", "nc", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_kunpcksi, "UiUiUi", "nc", "avx512bw")			TARGET_BUILTIN(__builtin_ia32_kunpcksi, "UiUiUi", "nc", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_loaddquhi512_mask, "V32sV32s*V32sUi", "n", "avx512bw")			TARGET_BUILTIN(__builtin_ia32_loaddquhi512_mask, "V32sV32s*V32sUi", "nV:512:", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_loaddquqi512_mask, "V64cV64c*V64cULLi", "n", "avx512bw")			TARGET_BUILTIN(__builtin_ia32_loaddquqi512_mask, "V64cV64c*V64cULLi", "nV:512:", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_fixupimmpd512_mask, "V8dV8dV8dV8LLiIiUcIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_fixupimmpd512_mask, "V8dV8dV8dV8LLiIiUcIi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_fixupimmpd512_maskz, "V8dV8dV8dV8LLiIiUcIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_fixupimmpd512_maskz, "V8dV8dV8dV8LLiIiUcIi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_fixupimmps512_mask, "V16fV16fV16fV16iIiUsIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_fixupimmps512_mask, "V16fV16fV16fV16iIiUsIi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_fixupimmps512_maskz, "V16fV16fV16fV16iIiUsIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_fixupimmps512_maskz, "V16fV16fV16fV16iIiUsIi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_fixupimmsd_mask, "V2dV2dV2dV2LLiIiUcIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_fixupimmsd_mask, "V2dV2dV2dV2LLiIiUcIi", "ncV:128:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_fixupimmsd_maskz, "V2dV2dV2dV2LLiIiUcIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_fixupimmsd_maskz, "V2dV2dV2dV2LLiIiUcIi", "ncV:128:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_fixupimmss_mask, "V4fV4fV4fV4iIiUcIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_fixupimmss_mask, "V4fV4fV4fV4iIiUcIi", "ncV:128:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_fixupimmss_maskz, "V4fV4fV4fV4iIiUcIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_fixupimmss_maskz, "V4fV4fV4fV4iIiUcIi", "ncV:128:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_getexpsd128_round_mask, "V2dV2dV2dV2dUcIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_getexpsd128_round_mask, "V2dV2dV2dV2dUcIi", "ncV:128:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_getexpss128_round_mask, "V4fV4fV4fV4fUcIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_getexpss128_round_mask, "V4fV4fV4fV4fUcIi", "ncV:128:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_getmantsd_round_mask, "V2dV2dV2dIiV2dUcIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_getmantsd_round_mask, "V2dV2dV2dIiV2dUcIi", "ncV:128:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_getmantss_round_mask, "V4fV4fV4fIiV4fUcIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_getmantss_round_mask, "V4fV4fV4fIiV4fUcIi", "ncV:128:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_loaddquhi128_mask, "V8sV8s*V8sUc", "n", "avx512bw,avx512vl")			TARGET_BUILTIN(__builtin_ia32_loaddquhi128_mask, "V8sV8s*V8sUc", "nV:128:", "avx512bw,avx512vl")
	TARGET_BUILTIN(__builtin_ia32_loaddquhi256_mask, "V16sV16s*V16sUs", "n", "avx512bw,avx512vl")			TARGET_BUILTIN(__builtin_ia32_loaddquhi256_mask, "V16sV16s*V16sUs", "nV:256:", "avx512bw,avx512vl")
	TARGET_BUILTIN(__builtin_ia32_loaddquqi128_mask, "V16cV16c*V16cUs", "n", "avx512bw,avx512vl")			TARGET_BUILTIN(__builtin_ia32_loaddquqi128_mask, "V16cV16c*V16cUs", "nV:128:", "avx512bw,avx512vl")
	TARGET_BUILTIN(__builtin_ia32_loaddquqi256_mask, "V32cV32c*V32cUi", "n", "avx512bw,avx512vl")			TARGET_BUILTIN(__builtin_ia32_loaddquqi256_mask, "V32cV32c*V32cUi", "nV:256:", "avx512bw,avx512vl")
	TARGET_BUILTIN(__builtin_ia32_fixupimmpd128_mask, "V2dV2dV2dV2LLiIiUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_fixupimmpd128_mask, "V2dV2dV2dV2LLiIiUc", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_fixupimmpd128_maskz, "V2dV2dV2dV2LLiIiUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_fixupimmpd128_maskz, "V2dV2dV2dV2LLiIiUc", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_fixupimmpd256_mask, "V4dV4dV4dV4LLiIiUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_fixupimmpd256_mask, "V4dV4dV4dV4LLiIiUc", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_fixupimmpd256_maskz, "V4dV4dV4dV4LLiIiUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_fixupimmpd256_maskz, "V4dV4dV4dV4LLiIiUc", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_fixupimmps128_mask, "V4fV4fV4fV4iIiUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_fixupimmps128_mask, "V4fV4fV4fV4iIiUc", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_fixupimmps128_maskz, "V4fV4fV4fV4iIiUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_fixupimmps128_maskz, "V4fV4fV4fV4iIiUc", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_fixupimmps256_mask, "V8fV8fV8fV8iIiUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_fixupimmps256_mask, "V8fV8fV8fV8iIiUc", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_fixupimmps256_maskz, "V8fV8fV8fV8iIiUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_fixupimmps256_maskz, "V8fV8fV8fV8iIiUc", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_loadapd128_mask, "V2dV2d*V2dUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_loadapd128_mask, "V2dV2d*V2dUc", "nV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_loadsd128_mask, "V2dV2d*V2dUc", "n", "avx512f")			TARGET_BUILTIN(__builtin_ia32_loadsd128_mask, "V2dV2d*V2dUc", "nV:128:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_loadapd256_mask, "V4dV4d*V4dUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_loadapd256_mask, "V4dV4d*V4dUc", "nV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_loadaps128_mask, "V4fV4f*V4fUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_loadaps128_mask, "V4fV4f*V4fUc", "nV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_loadss128_mask, "V4fV4f*V4fUc", "n", "avx512f")			TARGET_BUILTIN(__builtin_ia32_loadss128_mask, "V4fV4f*V4fUc", "nV:128:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_loadaps256_mask, "V8fV8f*V8fUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_loadaps256_mask, "V8fV8f*V8fUc", "nV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_loaddqudi128_mask, "V2LLiV2LLi*V2LLiUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_loaddqudi128_mask, "V2LLiV2LLi*V2LLiUc", "nV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_loaddqudi256_mask, "V4LLiV4LLi*V4LLiUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_loaddqudi256_mask, "V4LLiV4LLi*V4LLiUc", "nV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_loaddqusi128_mask, "V4iV4i*V4iUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_loaddqusi128_mask, "V4iV4i*V4iUc", "nV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_loaddqusi256_mask, "V8iV8i*V8iUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_loaddqusi256_mask, "V8iV8i*V8iUc", "nV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_loadupd128_mask, "V2dV2d*V2dUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_loadupd128_mask, "V2dV2d*V2dUc", "nV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_loadupd256_mask, "V4dV4d*V4dUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_loadupd256_mask, "V4dV4d*V4dUc", "nV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_loadups128_mask, "V4fV4f*V4fUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_loadups128_mask, "V4fV4f*V4fUc", "nV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_loadups256_mask, "V8fV8f*V8fUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_loadups256_mask, "V8fV8f*V8fUc", "nV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_storedquhi512_mask, "vV32s*V32sUi", "n", "avx512bw")			TARGET_BUILTIN(__builtin_ia32_storedquhi512_mask, "vV32s*V32sUi", "nV:512:", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_storedquqi512_mask, "vV64c*V64cULLi", "n", "avx512bw")			TARGET_BUILTIN(__builtin_ia32_storedquqi512_mask, "vV64c*V64cULLi", "nV:512:", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_storedquhi128_mask, "vV8s*V8sUc", "n", "avx512vl,avx512bw")			TARGET_BUILTIN(__builtin_ia32_storedquhi128_mask, "vV8s*V8sUc", "nV:128:", "avx512vl,avx512bw")
	TARGET_BUILTIN(__builtin_ia32_storedquhi256_mask, "vV16s*V16sUs", "n", "avx512vl,avx512bw")			TARGET_BUILTIN(__builtin_ia32_storedquhi256_mask, "vV16s*V16sUs", "nV:256:", "avx512vl,avx512bw")
	TARGET_BUILTIN(__builtin_ia32_storedquqi128_mask, "vV16c*V16cUs", "n", "avx512vl,avx512bw")			TARGET_BUILTIN(__builtin_ia32_storedquqi128_mask, "vV16c*V16cUs", "nV:128:", "avx512vl,avx512bw")
	TARGET_BUILTIN(__builtin_ia32_storedquqi256_mask, "vV32c*V32cUi", "n", "avx512vl,avx512bw")			TARGET_BUILTIN(__builtin_ia32_storedquqi256_mask, "vV32c*V32cUi", "nV:256:", "avx512vl,avx512bw")
	TARGET_BUILTIN(__builtin_ia32_storeapd128_mask, "vV2d*V2dUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_storeapd128_mask, "vV2d*V2dUc", "nV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_storesd128_mask, "vV2d*V2dUc", "n", "avx512f")			TARGET_BUILTIN(__builtin_ia32_storesd128_mask, "vV2d*V2dUc", "nV:128:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_storeapd256_mask, "vV4d*V4dUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_storeapd256_mask, "vV4d*V4dUc", "nV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_storeaps128_mask, "vV4f*V4fUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_storeaps128_mask, "vV4f*V4fUc", "nV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_storess128_mask, "vV4f*V4fUc", "n", "avx512f")			TARGET_BUILTIN(__builtin_ia32_storess128_mask, "vV4f*V4fUc", "nV:128:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_storeaps256_mask, "vV8f*V8fUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_storeaps256_mask, "vV8f*V8fUc", "nV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_storedqudi128_mask, "vV2LLi*V2LLiUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_storedqudi128_mask, "vV2LLi*V2LLiUc", "nV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_storedqudi256_mask, "vV4LLi*V4LLiUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_storedqudi256_mask, "vV4LLi*V4LLiUc", "nV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_storedqusi128_mask, "vV4i*V4iUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_storedqusi128_mask, "vV4i*V4iUc", "nV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_storedqusi256_mask, "vV8i*V8iUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_storedqusi256_mask, "vV8i*V8iUc", "nV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_storeupd128_mask, "vV2d*V2dUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_storeupd128_mask, "vV2d*V2dUc", "nV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_storeupd256_mask, "vV4d*V4dUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_storeupd256_mask, "vV4d*V4dUc", "nV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_storeups128_mask, "vV4f*V4fUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_storeups128_mask, "vV4f*V4fUc", "nV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_storeups256_mask, "vV8f*V8fUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_storeups256_mask, "vV8f*V8fUc", "nV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_rcp14pd128_mask, "V2dV2dV2dUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_rcp14pd128_mask, "V2dV2dV2dUc", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_rcp14pd256_mask, "V4dV4dV4dUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_rcp14pd256_mask, "V4dV4dV4dUc", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_rcp14ps128_mask, "V4fV4fV4fUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_rcp14ps128_mask, "V4fV4fV4fUc", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_rcp14ps256_mask, "V8fV8fV8fUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_rcp14ps256_mask, "V8fV8fV8fUc", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_vplzcntd_128, "V4iV4i", "nc", "avx512cd,avx512vl")			TARGET_BUILTIN(__builtin_ia32_vplzcntd_128, "V4iV4i", "ncV:128:", "avx512cd,avx512vl")
	TARGET_BUILTIN(__builtin_ia32_vplzcntd_256, "V8iV8i", "nc", "avx512cd,avx512vl")			TARGET_BUILTIN(__builtin_ia32_vplzcntd_256, "V8iV8i", "ncV:256:", "avx512cd,avx512vl")
	TARGET_BUILTIN(__builtin_ia32_vplzcntq_128, "V2LLiV2LLi", "nc", "avx512cd,avx512vl")			TARGET_BUILTIN(__builtin_ia32_vplzcntq_128, "V2LLiV2LLi", "ncV:128:", "avx512cd,avx512vl")
	TARGET_BUILTIN(__builtin_ia32_vplzcntq_256, "V4LLiV4LLi", "nc", "avx512cd,avx512vl")			TARGET_BUILTIN(__builtin_ia32_vplzcntq_256, "V4LLiV4LLi", "ncV:256:", "avx512cd,avx512vl")
	TARGET_BUILTIN(__builtin_ia32_vcvtsd2si32, "iV2dIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_vcvtsd2si32, "iV2dIi", "ncV:128:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_vcvtsd2usi32, "UiV2dIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_vcvtsd2usi32, "UiV2dIi", "ncV:128:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_vcvtss2si32, "iV4fIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_vcvtss2si32, "iV4fIi", "ncV:128:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_vcvtss2usi32, "UiV4fIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_vcvtss2usi32, "UiV4fIi", "ncV:128:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_vcvttsd2si32, "iV2dIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_vcvttsd2si32, "iV2dIi", "ncV:128:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_vcvttsd2usi32, "UiV2dIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_vcvttsd2usi32, "UiV2dIi", "ncV:128:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_vcvttss2si32, "iV4fIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_vcvttss2si32, "iV4fIi", "ncV:128:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_vcvttss2usi32, "UiV4fIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_vcvttss2usi32, "UiV4fIi", "ncV:128:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_vpermilpd512, "V8dV8dIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_vpermilpd512, "V8dV8dIi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_vpermilps512, "V16fV16fIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_vpermilps512, "V16fV16fIi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_vpermilvarpd512, "V8dV8dV8LLi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_vpermilvarpd512, "V8dV8dV8LLi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_vpermilvarps512, "V16fV16fV16i", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_vpermilvarps512, "V16fV16fV16i", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_rndscalesd_round_mask, "V2dV2dV2dV2dUcIiIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_rndscalesd_round_mask, "V2dV2dV2dV2dUcIiIi", "ncV:128:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_rndscaless_round_mask, "V4fV4fV4fV4fUcIiIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_rndscaless_round_mask, "V4fV4fV4fV4fUcIiIi", "ncV:128:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_scalefpd512_mask, "V8dV8dV8dV8dUcIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_scalefpd512_mask, "V8dV8dV8dV8dUcIi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_scalefps512_mask, "V16fV16fV16fV16fUsIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_scalefps512_mask, "V16fV16fV16fV16fUsIi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_scalefsd_round_mask, "V2dV2dV2dV2dUcIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_scalefsd_round_mask, "V2dV2dV2dV2dUcIi", "ncV:128:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_scalefss_round_mask, "V4fV4fV4fV4fUcIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_scalefss_round_mask, "V4fV4fV4fV4fUcIi", "ncV:128:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_psradi512, "V16iV16ii", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_psradi512, "V16iV16ii", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_psraqi512, "V8LLiV8LLii", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_psraqi512, "V8LLiV8LLii", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_psraq128, "V2LLiV2LLiV2LLi", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_psraq128, "V2LLiV2LLiV2LLi", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_psraq256, "V4LLiV4LLiV2LLi", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_psraq256, "V4LLiV4LLiV2LLi", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_psraqi128, "V2LLiV2LLii", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_psraqi128, "V2LLiV2LLii", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_psraqi256, "V4LLiV4LLii", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_psraqi256, "V4LLiV4LLii", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pslld512, "V16iV16iV4i", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_pslld512, "V16iV16iV4i", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_psllq512, "V8LLiV8LLiV2LLi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_psllq512, "V8LLiV8LLiV2LLi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_psllv16si, "V16iV16iV16i", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_psllv16si, "V16iV16iV16i", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_psllv8di, "V8LLiV8LLiV8LLi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_psllv8di, "V8LLiV8LLiV8LLi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_psrad512, "V16iV16iV4i", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_psrad512, "V16iV16iV4i", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_psraq512, "V8LLiV8LLiV2LLi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_psraq512, "V8LLiV8LLiV2LLi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_psrav16si, "V16iV16iV16i", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_psrav16si, "V16iV16iV16i", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_psrav8di, "V8LLiV8LLiV8LLi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_psrav8di, "V8LLiV8LLiV8LLi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_psrld512, "V16iV16iV4i", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_psrld512, "V16iV16iV4i", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_psrlq512, "V8LLiV8LLiV2LLi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_psrlq512, "V8LLiV8LLiV2LLi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_psrlv16si, "V16iV16iV16i", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_psrlv16si, "V16iV16iV16i", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_psrlv8di, "V8LLiV8LLiV8LLi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_psrlv8di, "V8LLiV8LLiV8LLi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_pternlogd512_mask, "V16iV16iV16iV16iIiUs", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_pternlogd512_mask, "V16iV16iV16iV16iIiUs", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_pternlogd512_maskz, "V16iV16iV16iV16iIiUs", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_pternlogd512_maskz, "V16iV16iV16iV16iIiUs", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_pternlogq512_mask, "V8LLiV8LLiV8LLiV8LLiIiUc", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_pternlogq512_mask, "V8LLiV8LLiV8LLiV8LLiIiUc", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_pternlogq512_maskz, "V8LLiV8LLiV8LLiV8LLiIiUc", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_pternlogq512_maskz, "V8LLiV8LLiV8LLiV8LLiIiUc", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_pternlogd128_mask, "V4iV4iV4iV4iIiUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pternlogd128_mask, "V4iV4iV4iV4iIiUc", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pternlogd128_maskz, "V4iV4iV4iV4iIiUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pternlogd128_maskz, "V4iV4iV4iV4iIiUc", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pternlogd256_mask, "V8iV8iV8iV8iIiUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pternlogd256_mask, "V8iV8iV8iV8iIiUc", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pternlogd256_maskz, "V8iV8iV8iV8iIiUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pternlogd256_maskz, "V8iV8iV8iV8iIiUc", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pternlogq128_mask, "V2LLiV2LLiV2LLiV2LLiIiUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pternlogq128_mask, "V2LLiV2LLiV2LLiV2LLiIiUc", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pternlogq128_maskz, "V2LLiV2LLiV2LLiV2LLiIiUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pternlogq128_maskz, "V2LLiV2LLiV2LLiV2LLiIiUc", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pternlogq256_mask, "V4LLiV4LLiV4LLiV4LLiIiUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pternlogq256_mask, "V4LLiV4LLiV4LLiV4LLiIiUc", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pternlogq256_maskz, "V4LLiV4LLiV4LLiV4LLiIiUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pternlogq256_maskz, "V4LLiV4LLiV4LLiV4LLiIiUc", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_shuf_f32x4, "V16fV16fV16fIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_shuf_f32x4, "V16fV16fV16fIi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_shuf_f64x2, "V8dV8dV8dIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_shuf_f64x2, "V8dV8dV8dIi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_shuf_i32x4, "V16iV16iV16iIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_shuf_i32x4, "V16iV16iV16iIi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_shuf_i64x2, "V8LLiV8LLiV8LLiIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_shuf_i64x2, "V8LLiV8LLiV8LLiIi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_shufpd512, "V8dV8dV8dIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_shufpd512, "V8dV8dV8dIi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_shufps512, "V16fV16fV16fIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_shufps512, "V16fV16fV16fIi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_shuf_f32x4_256, "V8fV8fV8fIi", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_shuf_f32x4_256, "V8fV8fV8fIi", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_shuf_f64x2_256, "V4dV4dV4dIi", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_shuf_f64x2_256, "V4dV4dV4dIi", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_shuf_i32x4_256, "V8iV8iV8iIi", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_shuf_i32x4_256, "V8iV8iV8iIi", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_shuf_i64x2_256, "V4LLiV4LLiV4LLiIi", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_shuf_i64x2_256, "V4LLiV4LLiV4LLiIi", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_sqrtsd_round_mask, "V2dV2dV2dV2dUcIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_sqrtsd_round_mask, "V2dV2dV2dV2dUcIi", "ncV:128:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_sqrtss_round_mask, "V4fV4fV4fV4fUcIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_sqrtss_round_mask, "V4fV4fV4fV4fUcIi", "ncV:128:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_rsqrt14pd128_mask, "V2dV2dV2dUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_rsqrt14pd128_mask, "V2dV2dV2dUc", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_rsqrt14pd256_mask, "V4dV4dV4dUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_rsqrt14pd256_mask, "V4dV4dV4dUc", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_rsqrt14ps128_mask, "V4fV4fV4fUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_rsqrt14ps128_mask, "V4fV4fV4fUc", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_rsqrt14ps256_mask, "V8fV8fV8fUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_rsqrt14ps256_mask, "V8fV8fV8fUc", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_cvtb2mask512, "ULLiV64c", "nc", "avx512bw")			TARGET_BUILTIN(__builtin_ia32_cvtb2mask512, "ULLiV64c", "ncV:512:", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_cvtmask2b512, "V64cULLi", "nc", "avx512bw")			TARGET_BUILTIN(__builtin_ia32_cvtmask2b512, "V64cULLi", "ncV:512:", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_cvtmask2w512, "V32sUi", "nc", "avx512bw")			TARGET_BUILTIN(__builtin_ia32_cvtmask2w512, "V32sUi", "ncV:512:", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_cvtd2mask512, "UsV16i", "nc", "avx512dq")			TARGET_BUILTIN(__builtin_ia32_cvtd2mask512, "UsV16i", "ncV:512:", "avx512dq")
	TARGET_BUILTIN(__builtin_ia32_cvtmask2d512, "V16iUs", "nc", "avx512dq")			TARGET_BUILTIN(__builtin_ia32_cvtmask2d512, "V16iUs", "ncV:512:", "avx512dq")
	TARGET_BUILTIN(__builtin_ia32_cvtmask2q512, "V8LLiUc", "nc", "avx512dq")			TARGET_BUILTIN(__builtin_ia32_cvtmask2q512, "V8LLiUc", "ncV:512:", "avx512dq")
	TARGET_BUILTIN(__builtin_ia32_cvtq2mask512, "UcV8LLi", "nc", "avx512dq")			TARGET_BUILTIN(__builtin_ia32_cvtq2mask512, "UcV8LLi", "ncV:512:", "avx512dq")
	TARGET_BUILTIN(__builtin_ia32_cvtb2mask128, "UsV16c", "nc", "avx512bw,avx512vl")			TARGET_BUILTIN(__builtin_ia32_cvtb2mask128, "UsV16c", "ncV:128:", "avx512bw,avx512vl")
	TARGET_BUILTIN(__builtin_ia32_cvtb2mask256, "UiV32c", "nc", "avx512bw,avx512vl")			TARGET_BUILTIN(__builtin_ia32_cvtb2mask256, "UiV32c", "ncV:256:", "avx512bw,avx512vl")
	TARGET_BUILTIN(__builtin_ia32_cvtmask2b128, "V16cUs", "nc", "avx512bw,avx512vl")			TARGET_BUILTIN(__builtin_ia32_cvtmask2b128, "V16cUs", "ncV:128:", "avx512bw,avx512vl")
	TARGET_BUILTIN(__builtin_ia32_cvtmask2b256, "V32cUi", "nc", "avx512bw,avx512vl")			TARGET_BUILTIN(__builtin_ia32_cvtmask2b256, "V32cUi", "ncV:256:", "avx512bw,avx512vl")
	TARGET_BUILTIN(__builtin_ia32_cvtmask2w128, "V8sUc", "nc", "avx512bw,avx512vl")			TARGET_BUILTIN(__builtin_ia32_cvtmask2w128, "V8sUc", "ncV:128:", "avx512bw,avx512vl")
	TARGET_BUILTIN(__builtin_ia32_cvtmask2w256, "V16sUs", "nc", "avx512bw,avx512vl")			TARGET_BUILTIN(__builtin_ia32_cvtmask2w256, "V16sUs", "ncV:256:", "avx512bw,avx512vl")
	TARGET_BUILTIN(__builtin_ia32_cvtd2mask128, "UcV4i", "nc", "avx512dq,avx512vl")			TARGET_BUILTIN(__builtin_ia32_cvtd2mask128, "UcV4i", "ncV:128:", "avx512dq,avx512vl")
	TARGET_BUILTIN(__builtin_ia32_cvtd2mask256, "UcV8i", "nc", "avx512dq,avx512vl")			TARGET_BUILTIN(__builtin_ia32_cvtd2mask256, "UcV8i", "ncV:256:", "avx512dq,avx512vl")
	TARGET_BUILTIN(__builtin_ia32_cvtmask2d128, "V4iUc", "nc", "avx512dq,avx512vl")			TARGET_BUILTIN(__builtin_ia32_cvtmask2d128, "V4iUc", "ncV:128:", "avx512dq,avx512vl")
	TARGET_BUILTIN(__builtin_ia32_cvtmask2d256, "V8iUc", "nc", "avx512dq,avx512vl")			TARGET_BUILTIN(__builtin_ia32_cvtmask2d256, "V8iUc", "ncV:256:", "avx512dq,avx512vl")
	TARGET_BUILTIN(__builtin_ia32_cvtmask2q128, "V2LLiUc", "nc", "avx512dq,avx512vl")			TARGET_BUILTIN(__builtin_ia32_cvtmask2q128, "V2LLiUc", "ncV:128:", "avx512dq,avx512vl")
	TARGET_BUILTIN(__builtin_ia32_cvtmask2q256, "V4LLiUc", "nc", "avx512dq,avx512vl")			TARGET_BUILTIN(__builtin_ia32_cvtmask2q256, "V4LLiUc", "ncV:256:", "avx512dq,avx512vl")
	TARGET_BUILTIN(__builtin_ia32_cvtq2mask128, "UcV2LLi", "nc", "avx512dq,avx512vl")			TARGET_BUILTIN(__builtin_ia32_cvtq2mask128, "UcV2LLi", "ncV:128:", "avx512dq,avx512vl")
	TARGET_BUILTIN(__builtin_ia32_cvtq2mask256, "UcV4LLi", "nc", "avx512dq,avx512vl")			TARGET_BUILTIN(__builtin_ia32_cvtq2mask256, "UcV4LLi", "ncV:256:", "avx512dq,avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovsdb512_mask, "V16cV16iV16cUs", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_pmovsdb512_mask, "V16cV16iV16cUs", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_pmovsdb512mem_mask, "vV16c*V16iUs", "n", "avx512f")			TARGET_BUILTIN(__builtin_ia32_pmovsdb512mem_mask, "vV16c*V16iUs", "nV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_pmovswb512mem_mask, "vV32c*V32sUi", "n", "avx512bw")			TARGET_BUILTIN(__builtin_ia32_pmovswb512mem_mask, "vV32c*V32sUi", "nV:512:", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_pmovsdw512_mask, "V16sV16iV16sUs", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_pmovsdw512_mask, "V16sV16iV16sUs", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_pmovsdw512mem_mask, "vV16s*V16iUs", "n", "avx512f")			TARGET_BUILTIN(__builtin_ia32_pmovsdw512mem_mask, "vV16s*V16iUs", "nV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_pmovsqb512_mask, "V16cV8LLiV16cUc", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_pmovsqb512_mask, "V16cV8LLiV16cUc", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_pmovsqb512mem_mask, "vV16c*V8LLiUc", "n", "avx512f")			TARGET_BUILTIN(__builtin_ia32_pmovsqb512mem_mask, "vV16c*V8LLiUc", "nV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_pmovsqd512_mask, "V8iV8LLiV8iUc", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_pmovsqd512_mask, "V8iV8LLiV8iUc", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_pmovsqd512mem_mask, "vV8i*V8LLiUc", "n", "avx512f")			TARGET_BUILTIN(__builtin_ia32_pmovsqd512mem_mask, "vV8i*V8LLiUc", "nV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_pmovsqw512_mask, "V8sV8LLiV8sUc", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_pmovsqw512_mask, "V8sV8LLiV8sUc", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_pmovsqw512mem_mask, "vV8s*V8LLiUc", "n", "avx512f")			TARGET_BUILTIN(__builtin_ia32_pmovsqw512mem_mask, "vV8s*V8LLiUc", "nV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_pmovsdb128_mask, "V16cV4iV16cUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmovsdb128_mask, "V16cV4iV16cUc", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovsdb128mem_mask, "vV16c*V4iUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmovsdb128mem_mask, "vV16c*V4iUc", "nV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovswb128mem_mask, "vV16c*V8sUc", "n", "avx512vl,avx512bw")			TARGET_BUILTIN(__builtin_ia32_pmovswb128mem_mask, "vV16c*V8sUc", "nV:128:", "avx512vl,avx512bw")
	TARGET_BUILTIN(__builtin_ia32_pmovsdb256_mask, "V16cV8iV16cUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmovsdb256_mask, "V16cV8iV16cUc", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovsdb256mem_mask, "vV16c*V8iUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmovsdb256mem_mask, "vV16c*V8iUc", "nV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovswb256mem_mask, "vV16c*V16sUs", "n", "avx512vl,avx512bw")			TARGET_BUILTIN(__builtin_ia32_pmovswb256mem_mask, "vV16c*V16sUs", "nV:256:", "avx512vl,avx512bw")
	TARGET_BUILTIN(__builtin_ia32_pmovsdw128_mask, "V8sV4iV8sUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmovsdw128_mask, "V8sV4iV8sUc", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovsdw128mem_mask, "vV8s*V4iUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmovsdw128mem_mask, "vV8s*V4iUc", "nV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovsdw256_mask, "V8sV8iV8sUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmovsdw256_mask, "V8sV8iV8sUc", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovsdw256mem_mask, "vV8s*V8iUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmovsdw256mem_mask, "vV8s*V8iUc", "nV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovsqb128_mask, "V16cV2LLiV16cUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmovsqb128_mask, "V16cV2LLiV16cUc", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovsqb128mem_mask, "vV16c*V2LLiUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmovsqb128mem_mask, "vV16c*V2LLiUc", "nV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovsqb256_mask, "V16cV4LLiV16cUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmovsqb256_mask, "V16cV4LLiV16cUc", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovsqb256mem_mask, "vV16c*V4LLiUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmovsqb256mem_mask, "vV16c*V4LLiUc", "nV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovsqd128_mask, "V4iV2LLiV4iUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmovsqd128_mask, "V4iV2LLiV4iUc", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovsqd128mem_mask, "vV4i*V2LLiUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmovsqd128mem_mask, "vV4i*V2LLiUc", "nV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovsqd256_mask, "V4iV4LLiV4iUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmovsqd256_mask, "V4iV4LLiV4iUc", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovsqd256mem_mask, "vV4i*V4LLiUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmovsqd256mem_mask, "vV4i*V4LLiUc", "nV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovsqw128_mask, "V8sV2LLiV8sUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmovsqw128_mask, "V8sV2LLiV8sUc", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovsqw128mem_mask, "vV8s*V2LLiUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmovsqw128mem_mask, "vV8s*V2LLiUc", "nV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovsqw256_mask, "V8sV4LLiV8sUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmovsqw256_mask, "V8sV4LLiV8sUc", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovsqw256mem_mask, "vV8s*V4LLiUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmovsqw256mem_mask, "vV8s*V4LLiUc", "nV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovusdb512_mask, "V16cV16iV16cUs", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_pmovusdb512_mask, "V16cV16iV16cUs", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_pmovusdb512mem_mask, "vV16c*V16iUs", "n", "avx512f")			TARGET_BUILTIN(__builtin_ia32_pmovusdb512mem_mask, "vV16c*V16iUs", "nV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_pmovuswb512mem_mask, "vV32c*V32sUi", "n", "avx512bw")			TARGET_BUILTIN(__builtin_ia32_pmovuswb512mem_mask, "vV32c*V32sUi", "nV:512:", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_pmovusdw512_mask, "V16sV16iV16sUs", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_pmovusdw512_mask, "V16sV16iV16sUs", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_pmovusdw512mem_mask, "vV16s*V16iUs", "n", "avx512f")			TARGET_BUILTIN(__builtin_ia32_pmovusdw512mem_mask, "vV16s*V16iUs", "nV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_pmovusqb512_mask, "V16cV8LLiV16cUc", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_pmovusqb512_mask, "V16cV8LLiV16cUc", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_pmovusqb512mem_mask, "vV16c*V8LLiUc", "n", "avx512f")			TARGET_BUILTIN(__builtin_ia32_pmovusqb512mem_mask, "vV16c*V8LLiUc", "nV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_pmovusqd512_mask, "V8iV8LLiV8iUc", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_pmovusqd512_mask, "V8iV8LLiV8iUc", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_pmovusqd512mem_mask, "vV8i*V8LLiUc", "n", "avx512f")			TARGET_BUILTIN(__builtin_ia32_pmovusqd512mem_mask, "vV8i*V8LLiUc", "nV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_pmovusqw512_mask, "V8sV8LLiV8sUc", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_pmovusqw512_mask, "V8sV8LLiV8sUc", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_pmovusqw512mem_mask, "vV8s*V8LLiUc", "n", "avx512f")			TARGET_BUILTIN(__builtin_ia32_pmovusqw512mem_mask, "vV8s*V8LLiUc", "nV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_pmovusdb128_mask, "V16cV4iV16cUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmovusdb128_mask, "V16cV4iV16cUc", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovusdb128mem_mask, "vV16c*V4iUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmovusdb128mem_mask, "vV16c*V4iUc", "nV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovuswb128mem_mask, "vV16c*V8sUc", "n", "avx512vl,avx512bw")			TARGET_BUILTIN(__builtin_ia32_pmovuswb128mem_mask, "vV16c*V8sUc", "nV:128:", "avx512vl,avx512bw")
	TARGET_BUILTIN(__builtin_ia32_pmovusdb256_mask, "V16cV8iV16cUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmovusdb256_mask, "V16cV8iV16cUc", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovusdb256mem_mask, "vV16c*V8iUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmovusdb256mem_mask, "vV16c*V8iUc", "nV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovuswb256mem_mask, "vV16c*V16sUs", "n", "avx512vl,avx512bw")			TARGET_BUILTIN(__builtin_ia32_pmovuswb256mem_mask, "vV16c*V16sUs", "nV:256:", "avx512vl,avx512bw")
	TARGET_BUILTIN(__builtin_ia32_pmovusdw128_mask, "V8sV4iV8sUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmovusdw128_mask, "V8sV4iV8sUc", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovusdw128mem_mask, "vV8s*V4iUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmovusdw128mem_mask, "vV8s*V4iUc", "nV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovusdw256_mask, "V8sV8iV8sUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmovusdw256_mask, "V8sV8iV8sUc", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovusdw256mem_mask, "vV8s*V8iUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmovusdw256mem_mask, "vV8s*V8iUc", "nV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovusqb128_mask, "V16cV2LLiV16cUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmovusqb128_mask, "V16cV2LLiV16cUc", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovusqb128mem_mask, "vV16c*V2LLiUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmovusqb128mem_mask, "vV16c*V2LLiUc", "nV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovusqb256_mask, "V16cV4LLiV16cUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmovusqb256_mask, "V16cV4LLiV16cUc", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovusqb256mem_mask, "vV16c*V4LLiUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmovusqb256mem_mask, "vV16c*V4LLiUc", "nV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovusqd128_mask, "V4iV2LLiV4iUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmovusqd128_mask, "V4iV2LLiV4iUc", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovusqd128mem_mask, "vV4i*V2LLiUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmovusqd128mem_mask, "vV4i*V2LLiUc", "nV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovusqd256_mask, "V4iV4LLiV4iUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmovusqd256_mask, "V4iV4LLiV4iUc", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovusqd256mem_mask, "vV4i*V4LLiUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmovusqd256mem_mask, "vV4i*V4LLiUc", "nV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovusqw128_mask, "V8sV2LLiV8sUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmovusqw128_mask, "V8sV2LLiV8sUc", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovusqw128mem_mask, "vV8s*V2LLiUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmovusqw128mem_mask, "vV8s*V2LLiUc", "nV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovusqw256_mask, "V8sV4LLiV8sUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmovusqw256_mask, "V8sV4LLiV8sUc", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovusqw256mem_mask, "vV8s*V4LLiUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmovusqw256mem_mask, "vV8s*V4LLiUc", "nV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovdb512_mask, "V16cV16iV16cUs", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_pmovdb512_mask, "V16cV16iV16cUs", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_pmovdb512mem_mask, "vV16c*V16iUs", "n", "avx512f")			TARGET_BUILTIN(__builtin_ia32_pmovdb512mem_mask, "vV16c*V16iUs", "nV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_pmovwb512mem_mask, "vV32c*V32sUi", "n", "avx512bw")			TARGET_BUILTIN(__builtin_ia32_pmovwb512mem_mask, "vV32c*V32sUi", "nV:512:", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_pmovdw512_mask, "V16sV16iV16sUs", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_pmovdw512_mask, "V16sV16iV16sUs", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_pmovdw512mem_mask, "vV16s*V16iUs", "n", "avx512f")			TARGET_BUILTIN(__builtin_ia32_pmovdw512mem_mask, "vV16s*V16iUs", "nV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_pmovqb512_mask, "V16cV8LLiV16cUc", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_pmovqb512_mask, "V16cV8LLiV16cUc", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_pmovqb512mem_mask, "vV16c*V8LLiUc", "n", "avx512f")			TARGET_BUILTIN(__builtin_ia32_pmovqb512mem_mask, "vV16c*V8LLiUc", "nV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_pmovqd512_mask, "V8iV8LLiV8iUc", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_pmovqd512_mask, "V8iV8LLiV8iUc", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_pmovqd512mem_mask, "vV8i*V8LLiUc", "n", "avx512f")			TARGET_BUILTIN(__builtin_ia32_pmovqd512mem_mask, "vV8i*V8LLiUc", "nV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_pmovqw512_mask, "V8sV8LLiV8sUc", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_pmovqw512_mask, "V8sV8LLiV8sUc", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_pmovqw512mem_mask, "vV8s*V8LLiUc", "n", "avx512f")			TARGET_BUILTIN(__builtin_ia32_pmovqw512mem_mask, "vV8s*V8LLiUc", "nV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_pmovdb128_mask, "V16cV4iV16cUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmovdb128_mask, "V16cV4iV16cUc", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovwb128mem_mask, "vV16c*V8sUc", "n", "avx512vl,avx512bw")			TARGET_BUILTIN(__builtin_ia32_pmovwb128mem_mask, "vV16c*V8sUc", "nV:128:", "avx512vl,avx512bw")
	TARGET_BUILTIN(__builtin_ia32_pmovdb128mem_mask, "vV16c*V4iUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmovdb128mem_mask, "vV16c*V4iUc", "nV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovdb256_mask, "V16cV8iV16cUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmovdb256_mask, "V16cV8iV16cUc", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovdb256mem_mask, "vV16c*V8iUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmovdb256mem_mask, "vV16c*V8iUc", "nV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovwb256mem_mask, "vV16c*V16sUs", "n", "avx512vl,avx512bw")			TARGET_BUILTIN(__builtin_ia32_pmovwb256mem_mask, "vV16c*V16sUs", "nV:256:", "avx512vl,avx512bw")
	TARGET_BUILTIN(__builtin_ia32_pmovdw128_mask, "V8sV4iV8sUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmovdw128_mask, "V8sV4iV8sUc", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovdw128mem_mask, "vV8s*V4iUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmovdw128mem_mask, "vV8s*V4iUc", "nV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovdw256_mask, "V8sV8iV8sUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmovdw256_mask, "V8sV8iV8sUc", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovdw256mem_mask, "vV8s*V8iUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmovdw256mem_mask, "vV8s*V8iUc", "nV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovqb128_mask, "V16cV2LLiV16cUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmovqb128_mask, "V16cV2LLiV16cUc", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovqb128mem_mask, "vV16c*V2LLiUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmovqb128mem_mask, "vV16c*V2LLiUc", "nV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovqb256_mask, "V16cV4LLiV16cUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmovqb256_mask, "V16cV4LLiV16cUc", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovqb256mem_mask, "vV16c*V4LLiUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmovqb256mem_mask, "vV16c*V4LLiUc", "nV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovqd128_mask, "V4iV2LLiV4iUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmovqd128_mask, "V4iV2LLiV4iUc", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovqd128mem_mask, "vV4i*V2LLiUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmovqd128mem_mask, "vV4i*V2LLiUc", "nV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovqd256mem_mask, "vV4i*V4LLiUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmovqd256mem_mask, "vV4i*V4LLiUc", "nV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovqw128_mask, "V8sV2LLiV8sUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmovqw128_mask, "V8sV2LLiV8sUc", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovqw128mem_mask, "vV8s*V2LLiUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmovqw128mem_mask, "vV8s*V2LLiUc", "nV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovqw256_mask, "V8sV4LLiV8sUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmovqw256_mask, "V8sV4LLiV8sUc", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_pmovqw256mem_mask, "vV8s*V4LLiUc", "n", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_pmovqw256mem_mask, "vV8s*V4LLiUc", "nV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_extractf32x8_mask, "V8fV16fIiV8fUc", "nc", "avx512dq")			TARGET_BUILTIN(__builtin_ia32_extractf32x8_mask, "V8fV16fIiV8fUc", "ncV:512:", "avx512dq")
	TARGET_BUILTIN(__builtin_ia32_extractf64x2_512_mask, "V2dV8dIiV2dUc", "nc", "avx512dq")			TARGET_BUILTIN(__builtin_ia32_extractf64x2_512_mask, "V2dV8dIiV2dUc", "ncV:512:", "avx512dq")
	TARGET_BUILTIN(__builtin_ia32_extracti32x8_mask, "V8iV16iIiV8iUc", "nc", "avx512dq")			TARGET_BUILTIN(__builtin_ia32_extracti32x8_mask, "V8iV16iIiV8iUc", "ncV:512:", "avx512dq")
	TARGET_BUILTIN(__builtin_ia32_extracti64x2_512_mask, "V2LLiV8LLiIiV2LLiUc", "nc", "avx512dq")			TARGET_BUILTIN(__builtin_ia32_extracti64x2_512_mask, "V2LLiV8LLiIiV2LLiUc", "ncV:512:", "avx512dq")
	TARGET_BUILTIN(__builtin_ia32_extracti32x4_mask, "V4iV16iIiV4iUc", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_extracti32x4_mask, "V4iV16iIiV4iUc", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_extracti64x4_mask, "V4LLiV8LLiIiV4LLiUc", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_extracti64x4_mask, "V4LLiV8LLiIiV4LLiUc", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_extractf64x2_256_mask, "V2dV4dIiV2dUc", "nc", "avx512dq,avx512vl")			TARGET_BUILTIN(__builtin_ia32_extractf64x2_256_mask, "V2dV4dIiV2dUc", "ncV:256:", "avx512dq,avx512vl")
	TARGET_BUILTIN(__builtin_ia32_extracti64x2_256_mask, "V2LLiV4LLiIiV2LLiUc", "nc", "avx512dq,avx512vl")			TARGET_BUILTIN(__builtin_ia32_extracti64x2_256_mask, "V2LLiV4LLiIiV2LLiUc", "ncV:256:", "avx512dq,avx512vl")
	TARGET_BUILTIN(__builtin_ia32_extractf32x4_256_mask, "V4fV8fIiV4fUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_extractf32x4_256_mask, "V4fV8fIiV4fUc", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_extracti32x4_256_mask, "V4iV8iIiV4iUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_extracti32x4_256_mask, "V4iV8iIiV4iUc", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_insertf32x8, "V16fV16fV8fIi", "nc", "avx512dq")			TARGET_BUILTIN(__builtin_ia32_insertf32x8, "V16fV16fV8fIi", "ncV:512:", "avx512dq")
	TARGET_BUILTIN(__builtin_ia32_insertf64x2_512, "V8dV8dV2dIi", "nc", "avx512dq")			TARGET_BUILTIN(__builtin_ia32_insertf64x2_512, "V8dV8dV2dIi", "ncV:512:", "avx512dq")
	TARGET_BUILTIN(__builtin_ia32_inserti32x8, "V16iV16iV8iIi", "nc", "avx512dq")			TARGET_BUILTIN(__builtin_ia32_inserti32x8, "V16iV16iV8iIi", "ncV:512:", "avx512dq")
	TARGET_BUILTIN(__builtin_ia32_inserti64x2_512, "V8LLiV8LLiV2LLiIi", "nc", "avx512dq")			TARGET_BUILTIN(__builtin_ia32_inserti64x2_512, "V8LLiV8LLiV2LLiIi", "ncV:512:", "avx512dq")
	TARGET_BUILTIN(__builtin_ia32_insertf64x4, "V8dV8dV4dIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_insertf64x4, "V8dV8dV4dIi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_inserti64x4, "V8LLiV8LLiV4LLiIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_inserti64x4, "V8LLiV8LLiV4LLiIi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_insertf64x2_256, "V4dV4dV2dIi", "nc", "avx512dq,avx512vl")			TARGET_BUILTIN(__builtin_ia32_insertf64x2_256, "V4dV4dV2dIi", "ncV:256:", "avx512dq,avx512vl")
	TARGET_BUILTIN(__builtin_ia32_inserti64x2_256, "V4LLiV4LLiV2LLiIi", "nc", "avx512dq,avx512vl")			TARGET_BUILTIN(__builtin_ia32_inserti64x2_256, "V4LLiV4LLiV2LLiIi", "ncV:256:", "avx512dq,avx512vl")
	TARGET_BUILTIN(__builtin_ia32_insertf32x4_256, "V8fV8fV4fIi", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_insertf32x4_256, "V8fV8fV4fIi", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_inserti32x4_256, "V8iV8iV4iIi", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_inserti32x4_256, "V8iV8iV4iIi", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_insertf32x4, "V16fV16fV4fIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_insertf32x4, "V16fV16fV4fIi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_inserti32x4, "V16iV16iV4iIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_inserti32x4, "V16iV16iV4iIi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_getmantpd128_mask, "V2dV2dIiV2dUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_getmantpd128_mask, "V2dV2diV2dUc", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_getmantpd256_mask, "V4dV4dIiV4dUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_getmantpd256_mask, "V4dV4diV4dUc", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_getmantps128_mask, "V4fV4fIiV4fUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_getmantps128_mask, "V4fV4fiV4fUc", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_getmantps256_mask, "V8fV8fIiV8fUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_getmantps256_mask, "V8fV8fiV8fUc", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_getmantpd512_mask, "V8dV8dIiV8dUcIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_getmantpd512_mask, "V8dV8diV8dUcIi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_getmantps512_mask, "V16fV16fIiV16fUsIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_getmantps512_mask, "V16fV16fiV16fUsIi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_getexppd512_mask, "V8dV8dV8dUcIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_getexppd512_mask, "V8dV8dV8dUcIi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_getexpps512_mask, "V16fV16fV16fUsIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_getexpps512_mask, "V16fV16fV16fUsIi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_vfmaddss3_mask, "V4fV4fV4fV4fUcIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_vfmaddss3_mask, "V4fV4fV4fV4fUcIi", "ncV:128:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_vfmaddss3_maskz, "V4fV4fV4fV4fUcIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_vfmaddss3_maskz, "V4fV4fV4fV4fUcIi", "ncV:128:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_vfmaddss3_mask3, "V4fV4fV4fV4fUcIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_vfmaddss3_mask3, "V4fV4fV4fV4fUcIi", "ncV:128:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_vfmaddsd3_mask, "V2dV2dV2dV2dUcIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_vfmaddsd3_mask, "V2dV2dV2dV2dUcIi", "ncV:128:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_vfmaddsd3_maskz, "V2dV2dV2dV2dUcIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_vfmaddsd3_maskz, "V2dV2dV2dV2dUcIi", "ncV:128:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_vfmaddsd3_mask3, "V2dV2dV2dV2dUcIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_vfmaddsd3_mask3, "V2dV2dV2dV2dUcIi", "ncV:128:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_vfmsubsd3_mask3, "V2dV2dV2dV2dUcIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_vfmsubsd3_mask3, "V2dV2dV2dV2dUcIi", "ncV:128:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_vfmsubss3_mask3, "V4fV4fV4fV4fUcIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_vfmsubss3_mask3, "V4fV4fV4fV4fUcIi", "ncV:128:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_vfnmsubsd3_mask3, "V2dV2dV2dV2dUcIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_vfnmsubsd3_mask3, "V2dV2dV2dV2dUcIi", "ncV:128:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_vfnmsubss3_mask3, "V4fV4fV4fV4fUcIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_vfnmsubss3_mask3, "V4fV4fV4fV4fUcIi", "ncV:128:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_permdf512, "V8dV8dIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_permdf512, "V8dV8dIi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_permdi512, "V8LLiV8LLiIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_permdi512, "V8LLiV8LLiIi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_permvarhi512, "V32sV32sV32s", "nc", "avx512bw")			TARGET_BUILTIN(__builtin_ia32_permvarhi512, "V32sV32sV32s", "ncV:512:", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_permvardf512, "V8dV8dV8LLi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_permvardf512, "V8dV8dV8LLi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_permvardi512, "V8LLiV8LLiV8LLi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_permvardi512, "V8LLiV8LLiV8LLi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_permvarsf512, "V16fV16fV16i", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_permvarsf512, "V16fV16fV16i", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_permvarsi512, "V16iV16iV16i", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_permvarsi512, "V16iV16iV16i", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_permvarqi512, "V64cV64cV64c", "nc", "avx512vbmi")			TARGET_BUILTIN(__builtin_ia32_permvarqi512, "V64cV64cV64c", "ncV:512:", "avx512vbmi")
	TARGET_BUILTIN(__builtin_ia32_permvarqi128, "V16cV16cV16c", "nc", "avx512vbmi,avx512vl")			TARGET_BUILTIN(__builtin_ia32_permvarqi128, "V16cV16cV16c", "ncV:128:", "avx512vbmi,avx512vl")
	TARGET_BUILTIN(__builtin_ia32_permvarqi256, "V32cV32cV32c", "nc", "avx512vbmi,avx512vl")			TARGET_BUILTIN(__builtin_ia32_permvarqi256, "V32cV32cV32c", "ncV:256:", "avx512vbmi,avx512vl")
	TARGET_BUILTIN(__builtin_ia32_permvarhi128, "V8sV8sV8s", "nc", "avx512bw,avx512vl")			TARGET_BUILTIN(__builtin_ia32_permvarhi128, "V8sV8sV8s", "ncV:128:", "avx512bw,avx512vl")
	TARGET_BUILTIN(__builtin_ia32_permvarhi256, "V16sV16sV16s", "nc", "avx512bw,avx512vl")			TARGET_BUILTIN(__builtin_ia32_permvarhi256, "V16sV16sV16s", "ncV:256:", "avx512bw,avx512vl")
	TARGET_BUILTIN(__builtin_ia32_permvardf256, "V4dV4dV4LLi", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_permvardf256, "V4dV4dV4LLi", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_permvardi256, "V4LLiV4LLiV4LLi", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_permvardi256, "V4LLiV4LLiV4LLi", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_fpclasspd128_mask, "UcV2dIiUc", "nc", "avx512dq,avx512vl")			TARGET_BUILTIN(__builtin_ia32_fpclasspd128_mask, "UcV2dIiUc", "ncV:128:", "avx512dq,avx512vl")
	TARGET_BUILTIN(__builtin_ia32_fpclasspd256_mask, "UcV4dIiUc", "nc", "avx512dq,avx512vl")			TARGET_BUILTIN(__builtin_ia32_fpclasspd256_mask, "UcV4dIiUc", "ncV:256:", "avx512dq,avx512vl")
	TARGET_BUILTIN(__builtin_ia32_fpclassps128_mask, "UcV4fIiUc", "nc", "avx512dq,avx512vl")			TARGET_BUILTIN(__builtin_ia32_fpclassps128_mask, "UcV4fIiUc", "ncV:128:", "avx512dq,avx512vl")
	TARGET_BUILTIN(__builtin_ia32_fpclassps256_mask, "UcV8fIiUc", "nc", "avx512dq,avx512vl")			TARGET_BUILTIN(__builtin_ia32_fpclassps256_mask, "UcV8fIiUc", "ncV:256:", "avx512dq,avx512vl")
	TARGET_BUILTIN(__builtin_ia32_fpclassps512_mask, "UsV16fIiUs", "nc", "avx512dq")			TARGET_BUILTIN(__builtin_ia32_fpclassps512_mask, "UsV16fIiUs", "ncV:512:", "avx512dq")
	TARGET_BUILTIN(__builtin_ia32_fpclasspd512_mask, "UcV8dIiUc", "nc", "avx512dq")			TARGET_BUILTIN(__builtin_ia32_fpclasspd512_mask, "UcV8dIiUc", "ncV:512:", "avx512dq")
	TARGET_BUILTIN(__builtin_ia32_fpclasssd_mask, "UcV2dIiUc", "nc", "avx512dq")			TARGET_BUILTIN(__builtin_ia32_fpclasssd_mask, "UcV2dIiUc", "ncV:128:", "avx512dq")
	TARGET_BUILTIN(__builtin_ia32_fpclassss_mask, "UcV4fIiUc", "nc", "avx512dq")			TARGET_BUILTIN(__builtin_ia32_fpclassss_mask, "UcV4fIiUc", "ncV:128:", "avx512dq")
	TARGET_BUILTIN(__builtin_ia32_kandhi, "UsUsUs", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_kandhi, "UsUsUs", "nc", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_kandnhi, "UsUsUs", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_kandnhi, "UsUsUs", "nc", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_korhi, "UsUsUs", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_korhi, "UsUsUs", "nc", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_kortestchi, "iUsUs", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_kortestchi, "iUsUs", "nc", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_kortestzhi, "iUsUs", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_kortestzhi, "iUsUs", "nc", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_kunpckhi, "UsUsUs", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_kunpckhi, "UsUsUs", "nc", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_kxnorhi, "UsUsUs", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_kxnorhi, "UsUsUs", "nc", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_kxorhi, "UsUsUs", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_kxorhi, "UsUsUs", "nc", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_palignr512, "V64cV64cV64cIi", "nc", "avx512bw")			TARGET_BUILTIN(__builtin_ia32_palignr512, "V64cV64cV64cIi", "ncV:512:", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_dbpsadbw128, "V8sV16cV16cIi", "nc", "avx512bw,avx512vl")			TARGET_BUILTIN(__builtin_ia32_dbpsadbw128, "V8sV16cV16cIi", "ncV:128:", "avx512bw,avx512vl")
	TARGET_BUILTIN(__builtin_ia32_dbpsadbw256, "V16sV32cV32cIi", "nc", "avx512bw,avx512vl")			TARGET_BUILTIN(__builtin_ia32_dbpsadbw256, "V16sV32cV32cIi", "ncV:256:", "avx512bw,avx512vl")
	TARGET_BUILTIN(__builtin_ia32_dbpsadbw512, "V32sV64cV64cIi", "nc", "avx512bw")			TARGET_BUILTIN(__builtin_ia32_dbpsadbw512, "V32sV64cV64cIi", "ncV:512:", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_psadbw512, "V8LLiV64cV64c", "nc", "avx512bw")			TARGET_BUILTIN(__builtin_ia32_psadbw512, "V8LLiV64cV64c", "ncV:512:", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_compressdf512_mask, "V8dV8dV8dUc", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_compressdf512_mask, "V8dV8dV8dUc", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_compressdi512_mask, "V8LLiV8LLiV8LLiUc", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_compressdi512_mask, "V8LLiV8LLiV8LLiUc", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_compresshi512_mask, "V32sV32sV32sUi", "nc", "avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_compresshi512_mask, "V32sV32sV32sUi", "ncV:512:", "avx512vbmi2")
	TARGET_BUILTIN(__builtin_ia32_compressqi512_mask, "V64cV64cV64cULLi", "nc", "avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_compressqi512_mask, "V64cV64cV64cULLi", "ncV:512:", "avx512vbmi2")
	TARGET_BUILTIN(__builtin_ia32_compresssf512_mask, "V16fV16fV16fUs", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_compresssf512_mask, "V16fV16fV16fUs", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_compresssi512_mask, "V16iV16iV16iUs", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_compresssi512_mask, "V16iV16iV16iUs", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_cmpsd_mask, "UcV2dV2dIiUcIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_cmpsd_mask, "UcV2dV2dIiUcIi", "ncV:128:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_cmpss_mask, "UcV4fV4fIiUcIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_cmpss_mask, "UcV4fV4fIiUcIi", "ncV:128:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_pshufd512, "V16iV16iIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_pshufd512, "V16iV16iIi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_expanddf512_mask, "V8dV8dV8dUc", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_expanddf512_mask, "V8dV8dV8dUc", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_expanddi512_mask, "V8LLiV8LLiV8LLiUc", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_expanddi512_mask, "V8LLiV8LLiV8LLiUc", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_expandhi512_mask, "V32sV32sV32sUi", "nc", "avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_expandhi512_mask, "V32sV32sV32sUi", "ncV:512:", "avx512vbmi2")
	TARGET_BUILTIN(__builtin_ia32_expandqi512_mask, "V64cV64cV64cULLi", "nc", "avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_expandqi512_mask, "V64cV64cV64cULLi", "ncV:512:", "avx512vbmi2")
	TARGET_BUILTIN(__builtin_ia32_expandloaddf512_mask, "V8dV8dC*V8dUc", "n", "avx512f")			TARGET_BUILTIN(__builtin_ia32_expandloaddf512_mask, "V8dV8dC*V8dUc", "nV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_expandloaddi512_mask, "V8LLiV8LLiC*V8LLiUc", "n", "avx512f")			TARGET_BUILTIN(__builtin_ia32_expandloaddi512_mask, "V8LLiV8LLiC*V8LLiUc", "nV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_expandloadhi512_mask, "V32sV32sC*V32sUi", "n", "avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_expandloadhi512_mask, "V32sV32sC*V32sUi", "nV:512:", "avx512vbmi2")
	TARGET_BUILTIN(__builtin_ia32_expandloadqi512_mask, "V64cV64cC*V64cULLi", "n", "avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_expandloadqi512_mask, "V64cV64cC*V64cULLi", "nV:512:", "avx512vbmi2")
	TARGET_BUILTIN(__builtin_ia32_expandloadsf512_mask, "V16fV16fC*V16fUs", "n", "avx512f")			TARGET_BUILTIN(__builtin_ia32_expandloadsf512_mask, "V16fV16fC*V16fUs", "nV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_expandloadsi512_mask, "V16iV16iC*V16iUs", "n", "avx512f")			TARGET_BUILTIN(__builtin_ia32_expandloadsi512_mask, "V16iV16iC*V16iUs", "nV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_expandsf512_mask, "V16fV16fV16fUs", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_expandsf512_mask, "V16fV16fV16fUs", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_expandsi512_mask, "V16iV16iV16iUs", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_expandsi512_mask, "V16iV16iV16iUs", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_cvtps2pd512_mask, "V8dV8fV8dUcIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_cvtps2pd512_mask, "V8dV8fV8dUcIi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_compressstoredf512_mask, "vV8d*V8dUc", "n", "avx512f")			TARGET_BUILTIN(__builtin_ia32_compressstoredf512_mask, "vV8d*V8dUc", "nV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_compressstoredi512_mask, "vV8LLi*V8LLiUc", "n", "avx512f")			TARGET_BUILTIN(__builtin_ia32_compressstoredi512_mask, "vV8LLi*V8LLiUc", "nV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_compressstorehi512_mask, "vV32s*V32sUi", "n", "avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_compressstorehi512_mask, "vV32s*V32sUi", "nV:512:", "avx512vbmi2")
	TARGET_BUILTIN(__builtin_ia32_compressstoreqi512_mask, "vV64c*V64cULLi", "n", "avx512vbmi2")			TARGET_BUILTIN(__builtin_ia32_compressstoreqi512_mask, "vV64c*V64cULLi", "nV:512:", "avx512vbmi2")
	TARGET_BUILTIN(__builtin_ia32_compressstoresf512_mask, "vV16f*V16fUs", "n", "avx512f")			TARGET_BUILTIN(__builtin_ia32_compressstoresf512_mask, "vV16f*V16fUs", "nV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_compressstoresi512_mask, "vV16i*V16iUs", "n", "avx512f")			TARGET_BUILTIN(__builtin_ia32_compressstoresi512_mask, "vV16i*V16iUs", "nV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_vcvtph2ps_mask, "V4fV8sV4fUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_vcvtph2ps_mask, "V4fV8sV4fUc", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_vcvtph2ps256_mask, "V8fV8sV8fUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_vcvtph2ps256_mask, "V8fV8sV8fUc", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_vcvtps2ph_mask, "V8sV4fIiV8sUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_vcvtps2ph_mask, "V8sV4fIiV8sUc", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_vcvtps2ph256_mask, "V8sV8fIiV8sUc", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_vcvtps2ph256_mask, "V8sV8fIiV8sUc", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_cvtw2mask512, "UiV32s", "nc", "avx512bw")			TARGET_BUILTIN(__builtin_ia32_cvtw2mask512, "UiV32s", "ncV:512:", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_cvtw2mask128, "UcV8s", "nc", "avx512bw,avx512vl")			TARGET_BUILTIN(__builtin_ia32_cvtw2mask128, "UcV8s", "ncV:128:", "avx512bw,avx512vl")
	TARGET_BUILTIN(__builtin_ia32_cvtw2mask256, "UsV16s", "nc", "avx512bw,avx512vl")			TARGET_BUILTIN(__builtin_ia32_cvtw2mask256, "UsV16s", "ncV:256:", "avx512bw,avx512vl")
	TARGET_BUILTIN(__builtin_ia32_cvtsd2ss_round_mask, "V4fV4fV2dV4fUcIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_cvtsd2ss_round_mask, "V4fV4fV2dV4fUcIi", "ncV:128:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_cvtsi2ss32, "V4fV4fiIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_cvtsi2ss32, "V4fV4fiIi", "ncV:128:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_cvtss2sd_round_mask, "V2dV2dV4fV2dUcIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_cvtss2sd_round_mask, "V2dV2dV4fV2dUcIi", "ncV:128:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_cvtusi2ss32, "V4fV4fUiIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_cvtusi2ss32, "V4fV4fUiIi", "ncV:128:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_vpmultishiftqb512_mask, "V64cV64cV64cV64cULLi", "nc", "avx512vbmi")			TARGET_BUILTIN(__builtin_ia32_vpmultishiftqb512_mask, "V64cV64cV64cV64cULLi", "ncV:512:", "avx512vbmi")
	TARGET_BUILTIN(__builtin_ia32_vpmultishiftqb128_mask, "V16cV16cV16cV16cUs", "nc", "avx512vbmi,avx512vl")			TARGET_BUILTIN(__builtin_ia32_vpmultishiftqb128_mask, "V16cV16cV16cV16cUs", "ncV:128:", "avx512vbmi,avx512vl")
	TARGET_BUILTIN(__builtin_ia32_vpmultishiftqb256_mask, "V32cV32cV32cV32cUi", "nc", "avx512vbmi,avx512vl")			TARGET_BUILTIN(__builtin_ia32_vpmultishiftqb256_mask, "V32cV32cV32cV32cUi", "ncV:256:", "avx512vbmi,avx512vl")

	// generic select intrinsics			// generic select intrinsics
	TARGET_BUILTIN(__builtin_ia32_selectb_128, "V16cUsV16cV16c", "nc", "avx512bw,avx512vl")			TARGET_BUILTIN(__builtin_ia32_selectb_128, "V16cUsV16cV16c", "ncV:128:", "avx512bw,avx512vl")
	TARGET_BUILTIN(__builtin_ia32_selectb_256, "V32cUiV32cV32c", "nc", "avx512bw,avx512vl")			TARGET_BUILTIN(__builtin_ia32_selectb_256, "V32cUiV32cV32c", "ncV:256:", "avx512bw,avx512vl")
	TARGET_BUILTIN(__builtin_ia32_selectb_512, "V64cULLiV64cV64c", "nc", "avx512bw")			TARGET_BUILTIN(__builtin_ia32_selectb_512, "V64cULLiV64cV64c", "ncV:512:", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_selectw_128, "V8sUcV8sV8s", "nc", "avx512bw,avx512vl")			TARGET_BUILTIN(__builtin_ia32_selectw_128, "V8sUcV8sV8s", "ncV:128:", "avx512bw,avx512vl")
	TARGET_BUILTIN(__builtin_ia32_selectw_256, "V16sUsV16sV16s", "nc", "avx512bw,avx512vl")			TARGET_BUILTIN(__builtin_ia32_selectw_256, "V16sUsV16sV16s", "ncV:256:", "avx512bw,avx512vl")
	TARGET_BUILTIN(__builtin_ia32_selectw_512, "V32sUiV32sV32s", "nc", "avx512bw")			TARGET_BUILTIN(__builtin_ia32_selectw_512, "V32sUiV32sV32s", "ncV:512:", "avx512bw")
	TARGET_BUILTIN(__builtin_ia32_selectd_128, "V4iUcV4iV4i", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_selectd_128, "V4iUcV4iV4i", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_selectd_256, "V8iUcV8iV8i", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_selectd_256, "V8iUcV8iV8i", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_selectd_512, "V16iUsV16iV16i", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_selectd_512, "V16iUsV16iV16i", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_selectq_128, "V2LLiUcV2LLiV2LLi", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_selectq_128, "V2LLiUcV2LLiV2LLi", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_selectq_256, "V4LLiUcV4LLiV4LLi", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_selectq_256, "V4LLiUcV4LLiV4LLi", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_selectq_512, "V8LLiUcV8LLiV8LLi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_selectq_512, "V8LLiUcV8LLiV8LLi", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_selectps_128, "V4fUcV4fV4f", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_selectps_128, "V4fUcV4fV4f", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_selectps_256, "V8fUcV8fV8f", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_selectps_256, "V8fUcV8fV8f", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_selectps_512, "V16fUsV16fV16f", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_selectps_512, "V16fUsV16fV16f", "ncV:512:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_selectpd_128, "V2dUcV2dV2d", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_selectpd_128, "V2dUcV2dV2d", "ncV:128:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_selectpd_256, "V4dUcV4dV4d", "nc", "avx512vl")			TARGET_BUILTIN(__builtin_ia32_selectpd_256, "V4dUcV4dV4d", "ncV:256:", "avx512vl")
	TARGET_BUILTIN(__builtin_ia32_selectpd_512, "V8dUcV8dV8d", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_selectpd_512, "V8dUcV8dV8d", "ncV:512:", "avx512f")

	// MONITORX/MWAITX			// MONITORX/MWAITX
	TARGET_BUILTIN(__builtin_ia32_monitorx, "vv*UiUi", "n", "mwaitx")			TARGET_BUILTIN(__builtin_ia32_monitorx, "vv*UiUi", "n", "mwaitx")
	TARGET_BUILTIN(__builtin_ia32_mwaitx, "vUiUiUi", "n", "mwaitx")			TARGET_BUILTIN(__builtin_ia32_mwaitx, "vUiUiUi", "n", "mwaitx")

	// WAITPKG			// WAITPKG
	TARGET_BUILTIN(__builtin_ia32_umonitor, "vv*", "n", "waitpkg")			TARGET_BUILTIN(__builtin_ia32_umonitor, "vv*", "n", "waitpkg")
	TARGET_BUILTIN(__builtin_ia32_umwait, "UcUiUiUi", "n", "waitpkg")			TARGET_BUILTIN(__builtin_ia32_umwait, "UcUiUiUi", "n", "waitpkg")
	▲ Show 20 Lines • Show All 48 Lines • Show Last 20 Lines

include/clang/Basic/BuiltinsX86_64.def

	Show All 38 Lines
	TARGET_HEADER_BUILTIN(_InterlockedExchangeSub64, "LLiLLiD*LLi", "nh", "intrin.h", ALL_MS_LANGUAGES, "")			TARGET_HEADER_BUILTIN(_InterlockedExchangeSub64, "LLiLLiD*LLi", "nh", "intrin.h", ALL_MS_LANGUAGES, "")
	TARGET_HEADER_BUILTIN(_InterlockedIncrement64, "LLiLLiD*", "nh", "intrin.h", ALL_MS_LANGUAGES, "")			TARGET_HEADER_BUILTIN(_InterlockedIncrement64, "LLiLLiD*", "nh", "intrin.h", ALL_MS_LANGUAGES, "")
	TARGET_HEADER_BUILTIN(_InterlockedOr64, "LLiLLiD*LLi", "nh", "intrin.h", ALL_MS_LANGUAGES, "")			TARGET_HEADER_BUILTIN(_InterlockedOr64, "LLiLLiD*LLi", "nh", "intrin.h", ALL_MS_LANGUAGES, "")
	TARGET_HEADER_BUILTIN(_InterlockedXor64, "LLiLLiD*LLi", "nh", "intrin.h", ALL_MS_LANGUAGES, "")			TARGET_HEADER_BUILTIN(_InterlockedXor64, "LLiLLiD*LLi", "nh", "intrin.h", ALL_MS_LANGUAGES, "")
	TARGET_HEADER_BUILTIN(_InterlockedCompareExchange128, "UcLLiDLLiLLiLLi", "nh", "intrin.h", ALL_MS_LANGUAGES, "cx16")			TARGET_HEADER_BUILTIN(_InterlockedCompareExchange128, "UcLLiDLLiLLiLLi", "nh", "intrin.h", ALL_MS_LANGUAGES, "cx16")

	TARGET_BUILTIN(__builtin_ia32_readeflags_u64, "ULLi", "n", "")			TARGET_BUILTIN(__builtin_ia32_readeflags_u64, "ULLi", "n", "")
	TARGET_BUILTIN(__builtin_ia32_writeeflags_u64, "vULLi", "n", "")			TARGET_BUILTIN(__builtin_ia32_writeeflags_u64, "vULLi", "n", "")
	TARGET_BUILTIN(__builtin_ia32_cvtss2si64, "LLiV4f", "nc", "sse")			TARGET_BUILTIN(__builtin_ia32_cvtss2si64, "LLiV4f", "ncV:128:", "sse")
	TARGET_BUILTIN(__builtin_ia32_cvttss2si64, "LLiV4f", "nc", "sse")			TARGET_BUILTIN(__builtin_ia32_cvttss2si64, "LLiV4f", "ncV:128:", "sse")
	TARGET_BUILTIN(__builtin_ia32_cvtsd2si64, "LLiV2d", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_cvtsd2si64, "LLiV2d", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_cvttsd2si64, "LLiV2d", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_cvttsd2si64, "LLiV2d", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_movnti64, "vLLi*LLi", "n", "sse2")			TARGET_BUILTIN(__builtin_ia32_movnti64, "vLLi*LLi", "n", "sse2")
	TARGET_BUILTIN(__builtin_ia32_vec_ext_v2di, "LLiV2LLiIi", "nc", "sse2")			TARGET_BUILTIN(__builtin_ia32_vec_ext_v2di, "LLiV2LLiIi", "ncV:128:", "sse2")
	TARGET_BUILTIN(__builtin_ia32_vec_set_v2di, "V2LLiV2LLiLLiIi", "nc", "sse4.1")			TARGET_BUILTIN(__builtin_ia32_vec_set_v2di, "V2LLiV2LLiLLiIi", "ncV:128:", "sse4.1")
	TARGET_BUILTIN(__builtin_ia32_crc32di, "ULLiULLiULLi", "nc", "sse4.2")			TARGET_BUILTIN(__builtin_ia32_crc32di, "ULLiULLiULLi", "nc", "sse4.2")
	TARGET_BUILTIN(__builtin_ia32_vec_ext_v4di, "LLiV4LLiIi", "nc", "avx")			TARGET_BUILTIN(__builtin_ia32_vec_ext_v4di, "LLiV4LLiIi", "ncV:256:", "avx")
	TARGET_BUILTIN(__builtin_ia32_vec_set_v4di, "V4LLiV4LLiLLiIi", "nc", "avx")			TARGET_BUILTIN(__builtin_ia32_vec_set_v4di, "V4LLiV4LLiLLiIi", "ncV:256:", "avx")
	TARGET_BUILTIN(__builtin_ia32_rdfsbase32, "Ui", "n", "fsgsbase")			TARGET_BUILTIN(__builtin_ia32_rdfsbase32, "Ui", "n", "fsgsbase")
	TARGET_BUILTIN(__builtin_ia32_rdfsbase64, "ULLi", "n", "fsgsbase")			TARGET_BUILTIN(__builtin_ia32_rdfsbase64, "ULLi", "n", "fsgsbase")
	TARGET_BUILTIN(__builtin_ia32_rdgsbase32, "Ui", "n", "fsgsbase")			TARGET_BUILTIN(__builtin_ia32_rdgsbase32, "Ui", "n", "fsgsbase")
	TARGET_BUILTIN(__builtin_ia32_rdgsbase64, "ULLi", "n", "fsgsbase")			TARGET_BUILTIN(__builtin_ia32_rdgsbase64, "ULLi", "n", "fsgsbase")
	TARGET_BUILTIN(__builtin_ia32_wrfsbase32, "vUi", "n", "fsgsbase")			TARGET_BUILTIN(__builtin_ia32_wrfsbase32, "vUi", "n", "fsgsbase")
	TARGET_BUILTIN(__builtin_ia32_wrfsbase64, "vULLi", "n", "fsgsbase")			TARGET_BUILTIN(__builtin_ia32_wrfsbase64, "vULLi", "n", "fsgsbase")
	TARGET_BUILTIN(__builtin_ia32_wrgsbase32, "vUi", "n", "fsgsbase")			TARGET_BUILTIN(__builtin_ia32_wrgsbase32, "vUi", "n", "fsgsbase")
	TARGET_BUILTIN(__builtin_ia32_wrgsbase64, "vULLi", "n", "fsgsbase")			TARGET_BUILTIN(__builtin_ia32_wrgsbase64, "vULLi", "n", "fsgsbase")
	Show All 16 Lines
	TARGET_BUILTIN(__builtin_ia32_rdseed64_step, "UiULLi*", "n", "rdseed")			TARGET_BUILTIN(__builtin_ia32_rdseed64_step, "UiULLi*", "n", "rdseed")
	TARGET_BUILTIN(__builtin_ia32_bextr_u64, "ULLiULLiULLi", "nc", "bmi")			TARGET_BUILTIN(__builtin_ia32_bextr_u64, "ULLiULLiULLi", "nc", "bmi")
	TARGET_BUILTIN(__builtin_ia32_bzhi_di, "ULLiULLiULLi", "nc", "bmi2")			TARGET_BUILTIN(__builtin_ia32_bzhi_di, "ULLiULLiULLi", "nc", "bmi2")
	TARGET_BUILTIN(__builtin_ia32_pdep_di, "ULLiULLiULLi", "nc", "bmi2")			TARGET_BUILTIN(__builtin_ia32_pdep_di, "ULLiULLiULLi", "nc", "bmi2")
	TARGET_BUILTIN(__builtin_ia32_pext_di, "ULLiULLiULLi", "nc", "bmi2")			TARGET_BUILTIN(__builtin_ia32_pext_di, "ULLiULLiULLi", "nc", "bmi2")
	TARGET_BUILTIN(__builtin_ia32_bextri_u64, "ULLiULLiIULLi", "nc", "tbm")			TARGET_BUILTIN(__builtin_ia32_bextri_u64, "ULLiULLiIULLi", "nc", "tbm")
	TARGET_BUILTIN(__builtin_ia32_lwpins64, "UcULLiUiUi", "n", "lwp")			TARGET_BUILTIN(__builtin_ia32_lwpins64, "UcULLiUiUi", "n", "lwp")
	TARGET_BUILTIN(__builtin_ia32_lwpval64, "vULLiUiUi", "n", "lwp")			TARGET_BUILTIN(__builtin_ia32_lwpval64, "vULLiUiUi", "n", "lwp")
	TARGET_BUILTIN(__builtin_ia32_vcvtsd2si64, "LLiV2dIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_vcvtsd2si64, "LLiV2dIi", "ncV:128:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_vcvtsd2usi64, "ULLiV2dIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_vcvtsd2usi64, "ULLiV2dIi", "ncV:128:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_vcvtss2si64, "LLiV4fIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_vcvtss2si64, "LLiV4fIi", "ncV:128:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_vcvtss2usi64, "ULLiV4fIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_vcvtss2usi64, "ULLiV4fIi", "ncV:128:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_vcvttsd2si64, "LLiV2dIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_vcvttsd2si64, "LLiV2dIi", "ncV:128:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_vcvttsd2usi64, "ULLiV2dIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_vcvttsd2usi64, "ULLiV2dIi", "ncV:128:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_vcvttss2si64, "LLiV4fIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_vcvttss2si64, "LLiV4fIi", "ncV:128:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_vcvttss2usi64, "ULLiV4fIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_vcvttss2usi64, "ULLiV4fIi", "ncV:128:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_cvtsi2sd64, "V2dV2dLLiIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_cvtsi2sd64, "V2dV2dLLiIi", "ncV:128:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_cvtsi2ss64, "V4fV4fLLiIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_cvtsi2ss64, "V4fV4fLLiIi", "ncV:128:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_cvtusi2sd64, "V2dV2dULLiIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_cvtusi2sd64, "V2dV2dULLiIi", "ncV:128:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_cvtusi2ss64, "V4fV4fULLiIi", "nc", "avx512f")			TARGET_BUILTIN(__builtin_ia32_cvtusi2ss64, "V4fV4fULLiIi", "ncV:128:", "avx512f")
	TARGET_BUILTIN(__builtin_ia32_directstore_u64, "vULi*ULi", "n", "movdiri")			TARGET_BUILTIN(__builtin_ia32_directstore_u64, "vULi*ULi", "n", "movdiri")
	TARGET_BUILTIN(__builtin_ia32_ptwrite64, "vULLi", "n", "ptwrite")			TARGET_BUILTIN(__builtin_ia32_ptwrite64, "vULLi", "n", "ptwrite")

	#undef BUILTIN			#undef BUILTIN
	#undef TARGET_BUILTIN			#undef TARGET_BUILTIN
	#undef TARGET_HEADER_BUILTIN			#undef TARGET_HEADER_BUILTIN

lib/Basic/Builtins.cpp

Show First 20 Lines • Show All 101 Lines • ▼ Show 20 Lines	for (unsigned i = 0, e = AuxTSRecords.size(); i != e; ++i)
Table.get(AuxTSRecords[i].Name)		Table.get(AuxTSRecords[i].Name)
.setBuiltinID(i + Builtin::FirstTSBuiltin + TSRecords.size());		.setBuiltinID(i + Builtin::FirstTSBuiltin + TSRecords.size());
}		}

void Builtin::Context::forgetBuiltin(unsigned ID, IdentifierTable &Table) {		void Builtin::Context::forgetBuiltin(unsigned ID, IdentifierTable &Table) {
Table.get(getRecord(ID).Name).setBuiltinID(0);		Table.get(getRecord(ID).Name).setBuiltinID(0);
}		}

		unsigned Builtin::Context::getRequiredVectorWidth(unsigned ID) const {
		const char *WidthPos = ::strchr(getRecord(ID).Attributes, 'V');
		chandlercUnsubmitted Not Done Reply Inline Actions To avoid confusion with the actual width returning, maybe WidthPos? or just Pos? chandlerc: To avoid confusion with the actual width returning, maybe WidthPos? or just Pos?
		if (!WidthPos)
		return 0;

		++WidthPos;
		assert(*WidthPos == ':' && "Vector width specifier must be followed by a ':'");
		++WidthPos;


		assert(::strchr(WidthPos, ':') &&
		"Vector width specifier must be end with a ':'");
		return ::strtol(WidthPos, nullptr, 10);
		}

bool Builtin::Context::isLike(unsigned ID, unsigned &FormatIdx,		bool Builtin::Context::isLike(unsigned ID, unsigned &FormatIdx,
bool &HasVAListArg, const char *Fmt) const {		bool &HasVAListArg, const char *Fmt) const {
assert(Fmt && "Not passed a format string");		assert(Fmt && "Not passed a format string");
assert(::strlen(Fmt) == 2 &&		assert(::strlen(Fmt) == 2 &&
"Format string needs to be two characters long");		"Format string needs to be two characters long");
assert(::toupper(Fmt[0]) == Fmt[1] &&		assert(::toupper(Fmt[0]) == Fmt[1] &&
"Format string is not in the form \"xX\"");		"Format string is not in the form \"xX\"");

Show All 31 Lines

lib/CodeGen/CGBuiltin.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

	Show First 20 Lines • Show All 3,648 Lines • ▼ Show 20 Lines

	// Check that a call to a target specific builtin has the correct target			// Check that a call to a target specific builtin has the correct target
	// features.			// features.
	// This is down here to avoid non-target specific builtins, however, if			// This is down here to avoid non-target specific builtins, however, if
	// generic builtins start to require generic target features then we			// generic builtins start to require generic target features then we
	// can move this up to the beginning of the function.			// can move this up to the beginning of the function.
	checkTargetFeatures(E, FD);			checkTargetFeatures(E, FD);

				if (unsigned VectorWidth = getContext().BuiltinInfo.getRequiredVectorWidth(BuiltinID))
				LargestVectorWidth = std::max(LargestVectorWidth, VectorWidth);

	// See if we have a target specific intrinsic.			// See if we have a target specific intrinsic.
	const char *Name = getContext().BuiltinInfo.getName(BuiltinID);			const char *Name = getContext().BuiltinInfo.getName(BuiltinID);
	Intrinsic::ID IntrinsicID = Intrinsic::not_intrinsic;			Intrinsic::ID IntrinsicID = Intrinsic::not_intrinsic;
	StringRef Prefix =			StringRef Prefix =
	llvm::Triple::getArchTypePrefix(getTarget().getTriple().getArch());			llvm::Triple::getArchTypePrefix(getTarget().getTriple().getArch());
	if (!Prefix.empty()) {			if (!Prefix.empty()) {
	IntrinsicID = Intrinsic::getIntrinsicForGCCBuiltin(Prefix.data(), Name);			IntrinsicID = Intrinsic::getIntrinsicForGCCBuiltin(Prefix.data(), Name);
	// NOTE we don't need to perform a compatibility flag check here since the			// NOTE we don't need to perform a compatibility flag check here since the
	▲ Show 20 Lines • Show All 8,575 Lines • Show Last 20 Lines

lib/CodeGen/CodeGenFunction.h

Show First 20 Lines • Show All 1,457 Lines • ▼ Show 20 Lines	private:

llvm::BasicBlock *TerminateLandingPad;		llvm::BasicBlock *TerminateLandingPad;
llvm::BasicBlock *TerminateHandler;		llvm::BasicBlock *TerminateHandler;
llvm::BasicBlock *TrapBB;		llvm::BasicBlock *TrapBB;

/// Terminate funclets keyed by parent funclet pad.		/// Terminate funclets keyed by parent funclet pad.
llvm::MapVector<llvm::Value , llvm::BasicBlock > TerminateFunclets;		llvm::MapVector<llvm::Value , llvm::BasicBlock > TerminateFunclets;

		/// Largest vector with used in ths function. Will be used to create a
		/// function attribute.
		unsigned LargestVectorWidth;

/// True if we need emit the life-time markers.		/// True if we need emit the life-time markers.
const bool ShouldEmitLifetimeMarkers;		const bool ShouldEmitLifetimeMarkers;

/// Add OpenCL kernel arg metadata and the kernel attribute metadata to		/// Add OpenCL kernel arg metadata and the kernel attribute metadata to
/// the function metadata.		/// the function metadata.
void EmitOpenCLKernelMetadata(const FunctionDecl *FD,		void EmitOpenCLKernelMetadata(const FunctionDecl *FD,
llvm::Function *Fn);		llvm::Function *Fn);

▲ Show 20 Lines • Show All 2,783 Lines • Show Last 20 Lines

lib/CodeGen/CodeGenFunction.cpp

Show First 20 Lines • Show All 75 Lines • ▼ Show 20 Lines	: CodeGenTypeCache(cgm), CGM(cgm), Target(cgm.getTarget()),
DisableDebugInfo(false), DidCallStackSave(false), IndirectBranch(nullptr),		DisableDebugInfo(false), DidCallStackSave(false), IndirectBranch(nullptr),
PGO(cgm), SwitchInsn(nullptr), SwitchWeights(nullptr),		PGO(cgm), SwitchInsn(nullptr), SwitchWeights(nullptr),
CaseRangeBlock(nullptr), UnreachableBlock(nullptr), NumReturnExprs(0),		CaseRangeBlock(nullptr), UnreachableBlock(nullptr), NumReturnExprs(0),
NumSimpleReturnExprs(0), CXXABIThisDecl(nullptr),		NumSimpleReturnExprs(0), CXXABIThisDecl(nullptr),
CXXABIThisValue(nullptr), CXXThisValue(nullptr),		CXXABIThisValue(nullptr), CXXThisValue(nullptr),
CXXStructorImplicitParamDecl(nullptr),		CXXStructorImplicitParamDecl(nullptr),
CXXStructorImplicitParamValue(nullptr), OutermostConditional(nullptr),		CXXStructorImplicitParamValue(nullptr), OutermostConditional(nullptr),
CurLexicalScope(nullptr), TerminateLandingPad(nullptr),		CurLexicalScope(nullptr), TerminateLandingPad(nullptr),
TerminateHandler(nullptr), TrapBB(nullptr),		TerminateHandler(nullptr), TrapBB(nullptr), LargestVectorWidth(0),
ShouldEmitLifetimeMarkers(		ShouldEmitLifetimeMarkers(
shouldEmitLifetimeMarkers(CGM.getCodeGenOpts(), CGM.getLangOpts())) {		shouldEmitLifetimeMarkers(CGM.getCodeGenOpts(), CGM.getLangOpts())) {
if (!suppressNewContext)		if (!suppressNewContext)
CGM.getCXXABI().getMangleContext().startNewFunction();		CGM.getCXXABI().getMangleContext().startNewFunction();

llvm::FastMathFlags FMF;		llvm::FastMathFlags FMF;
if (CGM.getLangOpts().FastMath)		if (CGM.getLangOpts().FastMath)
FMF.setFast();		FMF.setFast();
▲ Show 20 Lines • Show All 347 Lines • ▼ Show 20 Lines	void CodeGenFunction::FinishFunction(SourceLocation EndLoc) {
// of CleanupDestSlot alloca make correct coroutine frame building very		// of CleanupDestSlot alloca make correct coroutine frame building very
// difficult.		// difficult.
if (NormalCleanupDest.isValid() && isCoroutine()) {		if (NormalCleanupDest.isValid() && isCoroutine()) {
llvm::DominatorTree DT(*CurFn);		llvm::DominatorTree DT(*CurFn);
llvm::PromoteMemToReg(		llvm::PromoteMemToReg(
cast<llvm::AllocaInst>(NormalCleanupDest.getPointer()), DT);		cast<llvm::AllocaInst>(NormalCleanupDest.getPointer()), DT);
NormalCleanupDest = Address::invalid();		NormalCleanupDest = Address::invalid();
}		}

		// Add the required-vector-width attribute
		if (LargestVectorWidth != 0)
		CurFn->addFnAttr("min-legal-vector-width",
		llvm::utostr(LargestVectorWidth));
}		}

/// ShouldInstrumentFunction - Return true if the current function should be		/// ShouldInstrumentFunction - Return true if the current function should be
/// instrumented with __cyg_profile_func_* calls		/// instrumented with __cyg_profile_func_* calls
bool CodeGenFunction::ShouldInstrumentFunction() {		bool CodeGenFunction::ShouldInstrumentFunction() {
if (!CGM.getCodeGenOpts().InstrumentFunctions &&		if (!CGM.getCodeGenOpts().InstrumentFunctions &&
!CGM.getCodeGenOpts().InstrumentFunctionsAfterInlining &&		!CGM.getCodeGenOpts().InstrumentFunctionsAfterInlining &&
!CGM.getCodeGenOpts().InstrumentFunctionEntryBare)		!CGM.getCodeGenOpts().InstrumentFunctionEntryBare)
▲ Show 20 Lines • Show All 725 Lines • ▼ Show 20 Lines	else
Ty = VD->getType();		Ty = VD->getType();

if (Ty->isVariablyModifiedType())		if (Ty->isVariablyModifiedType())
EmitVariablyModifiedType(Ty);		EmitVariablyModifiedType(Ty);
}		}
// Emit a location at the end of the prologue.		// Emit a location at the end of the prologue.
if (CGDebugInfo *DI = getDebugInfo())		if (CGDebugInfo *DI = getDebugInfo())
DI->EmitLocation(Builder, StartLoc);		DI->EmitLocation(Builder, StartLoc);

		// TODO: Do we need to handle this in two places like we do with
		// target-features/target-cpu?
		chandlercUnsubmitted Not Done Reply Inline Actions FWIW, I have no idea. I'd ask Eric or Richard. chandlerc: FWIW, I have no idea. I'd ask Eric or Richard.
		if (CurFuncDecl)
		if (auto *VecWidth = CurFuncDecl->getAttr<MinVectorWidthAttr>())
		LargestVectorWidth = VecWidth->getVectorWidth();
}		}

void CodeGenFunction::EmitFunctionBody(FunctionArgList &Args,		void CodeGenFunction::EmitFunctionBody(FunctionArgList &Args,
const Stmt *Body) {		const Stmt *Body) {
incrementProfileCounter(Body);		incrementProfileCounter(Body);
if (const CompoundStmt *S = dyn_cast<CompoundStmt>(Body))		if (const CompoundStmt *S = dyn_cast<CompoundStmt>(Body))
EmitCompoundStmtWithoutScope(*S);		EmitCompoundStmtWithoutScope(*S);
else		else
▲ Show 20 Lines • Show All 1,229 Lines • Show Last 20 Lines

lib/Headers/__wmmintrin_aes.h

	Show All 23 Lines
	#ifndef __WMMINTRIN_H			#ifndef __WMMINTRIN_H
	#error "Never use <__wmmintrin_aes.h> directly; include <wmmintrin.h> instead."			#error "Never use <__wmmintrin_aes.h> directly; include <wmmintrin.h> instead."
	#endif			#endif

	#ifndef __WMMINTRIN_AES_H			#ifndef __WMMINTRIN_AES_H
	#define __WMMINTRIN_AES_H			#define __WMMINTRIN_AES_H

	/* Define the default attributes for the functions in this file. */			/* Define the default attributes for the functions in this file. */
	#define __DEFAULT_FN_ATTRS __attribute__((__always_inline__, __nodebug__, __target__("aes")))			#define __DEFAULT_FN_ATTRS __attribute__((__always_inline__, __nodebug__, __target__("aes"), __min_vector_width__(128)))

	/// Performs a single round of AES encryption using the Equivalent			/// Performs a single round of AES encryption using the Equivalent
	/// Inverse Cipher, transforming the state value from the first source			/// Inverse Cipher, transforming the state value from the first source
	/// operand using a 128-bit round key value contained in the second source			/// operand using a 128-bit round key value contained in the second source
	/// operand, and writes the result to the destination.			/// operand, and writes the result to the destination.
	///			///
	/// \headerfile <x86intrin.h>			/// \headerfile <x86intrin.h>
	///			///
	▲ Show 20 Lines • Show All 114 Lines • Show Last 20 Lines

lib/Headers/ammintrin.h

	Show All 21 Lines
	*/			*/

	#ifndef __AMMINTRIN_H			#ifndef __AMMINTRIN_H
	#define __AMMINTRIN_H			#define __AMMINTRIN_H

	#include <pmmintrin.h>			#include <pmmintrin.h>

	/* Define the default attributes for the functions in this file. */			/* Define the default attributes for the functions in this file. */
	#define __DEFAULT_FN_ATTRS __attribute__((__always_inline__, __nodebug__, __target__("sse4a")))			#define __DEFAULT_FN_ATTRS __attribute__((__always_inline__, __nodebug__, __target__("sse4a"), __min_vector_width__(128)))

	/// Extracts the specified bits from the lower 64 bits of the 128-bit			/// Extracts the specified bits from the lower 64 bits of the 128-bit
	/// integer vector operand at the index \a idx and of the length \a len.			/// integer vector operand at the index \a idx and of the length \a len.
	///			///
	/// \headerfile <x86intrin.h>			/// \headerfile <x86intrin.h>
	///			///
	/// \code			/// \code
	/// __m128i _mm_extracti_si64(__m128i x, const int len, const int idx);			/// __m128i _mm_extracti_si64(__m128i x, const int len, const int idx);
	▲ Show 20 Lines • Show All 155 Lines • Show Last 20 Lines

lib/Headers/avx2intrin.h

Show All 23 Lines
#ifndef __IMMINTRIN_H		#ifndef __IMMINTRIN_H
#error "Never use <avx2intrin.h> directly; include <immintrin.h> instead."		#error "Never use <avx2intrin.h> directly; include <immintrin.h> instead."
#endif		#endif

#ifndef __AVX2INTRIN_H		#ifndef __AVX2INTRIN_H
#define __AVX2INTRIN_H		#define __AVX2INTRIN_H

/* Define the default attributes for the functions in this file. */		/* Define the default attributes for the functions in this file. */
#define __DEFAULT_FN_ATTRS __attribute__((__always_inline__, __nodebug__, __target__("avx2")))		#define __DEFAULT_FN_ATTRS256 __attribute__((__always_inline__, __nodebug__, __target__("avx2"), __min_vector_width__(256)))
		#define __DEFAULT_FN_ATTRS128 __attribute__((__always_inline__, __nodebug__, __target__("avx2"), __min_vector_width__(128)))
		chandlercUnsubmitted Not Done Reply Inline Actions Does it make sense to call this 256? chandlerc: Does it make sense to call this 256?

/* SSE4 Multiple Packed Sums of Absolute Difference. */		/* SSE4 Multiple Packed Sums of Absolute Difference. */
#define _mm256_mpsadbw_epu8(X, Y, M) \		#define _mm256_mpsadbw_epu8(X, Y, M) \
(__m256i)__builtin_ia32_mpsadbw256((__v32qi)(__m256i)(X), \		(__m256i)__builtin_ia32_mpsadbw256((__v32qi)(__m256i)(X), \
(__v32qi)(__m256i)(Y), (int)(M))		(__v32qi)(__m256i)(Y), (int)(M))

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_abs_epi8(__m256i __a)		_mm256_abs_epi8(__m256i __a)
{		{
return (__m256i)__builtin_ia32_pabsb256((__v32qi)__a);		return (__m256i)__builtin_ia32_pabsb256((__v32qi)__a);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_abs_epi16(__m256i __a)		_mm256_abs_epi16(__m256i __a)
{		{
return (__m256i)__builtin_ia32_pabsw256((__v16hi)__a);		return (__m256i)__builtin_ia32_pabsw256((__v16hi)__a);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_abs_epi32(__m256i __a)		_mm256_abs_epi32(__m256i __a)
{		{
return (__m256i)__builtin_ia32_pabsd256((__v8si)__a);		return (__m256i)__builtin_ia32_pabsd256((__v8si)__a);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_packs_epi16(__m256i __a, __m256i __b)		_mm256_packs_epi16(__m256i __a, __m256i __b)
{		{
return (__m256i)__builtin_ia32_packsswb256((__v16hi)__a, (__v16hi)__b);		return (__m256i)__builtin_ia32_packsswb256((__v16hi)__a, (__v16hi)__b);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_packs_epi32(__m256i __a, __m256i __b)		_mm256_packs_epi32(__m256i __a, __m256i __b)
{		{
return (__m256i)__builtin_ia32_packssdw256((__v8si)__a, (__v8si)__b);		return (__m256i)__builtin_ia32_packssdw256((__v8si)__a, (__v8si)__b);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_packus_epi16(__m256i __a, __m256i __b)		_mm256_packus_epi16(__m256i __a, __m256i __b)
{		{
return (__m256i)__builtin_ia32_packuswb256((__v16hi)__a, (__v16hi)__b);		return (__m256i)__builtin_ia32_packuswb256((__v16hi)__a, (__v16hi)__b);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_packus_epi32(__m256i __V1, __m256i __V2)		_mm256_packus_epi32(__m256i __V1, __m256i __V2)
{		{
return (__m256i) __builtin_ia32_packusdw256((__v8si)__V1, (__v8si)__V2);		return (__m256i) __builtin_ia32_packusdw256((__v8si)__V1, (__v8si)__V2);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_add_epi8(__m256i __a, __m256i __b)		_mm256_add_epi8(__m256i __a, __m256i __b)
{		{
return (__m256i)((__v32qu)__a + (__v32qu)__b);		return (__m256i)((__v32qu)__a + (__v32qu)__b);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_add_epi16(__m256i __a, __m256i __b)		_mm256_add_epi16(__m256i __a, __m256i __b)
{		{
return (__m256i)((__v16hu)__a + (__v16hu)__b);		return (__m256i)((__v16hu)__a + (__v16hu)__b);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_add_epi32(__m256i __a, __m256i __b)		_mm256_add_epi32(__m256i __a, __m256i __b)
{		{
return (__m256i)((__v8su)__a + (__v8su)__b);		return (__m256i)((__v8su)__a + (__v8su)__b);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_add_epi64(__m256i __a, __m256i __b)		_mm256_add_epi64(__m256i __a, __m256i __b)
{		{
return (__m256i)((__v4du)__a + (__v4du)__b);		return (__m256i)((__v4du)__a + (__v4du)__b);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_adds_epi8(__m256i __a, __m256i __b)		_mm256_adds_epi8(__m256i __a, __m256i __b)
{		{
return (__m256i)__builtin_ia32_paddsb256((__v32qi)__a, (__v32qi)__b);		return (__m256i)__builtin_ia32_paddsb256((__v32qi)__a, (__v32qi)__b);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_adds_epi16(__m256i __a, __m256i __b)		_mm256_adds_epi16(__m256i __a, __m256i __b)
{		{
return (__m256i)__builtin_ia32_paddsw256((__v16hi)__a, (__v16hi)__b);		return (__m256i)__builtin_ia32_paddsw256((__v16hi)__a, (__v16hi)__b);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_adds_epu8(__m256i __a, __m256i __b)		_mm256_adds_epu8(__m256i __a, __m256i __b)
{		{
return (__m256i)__builtin_ia32_paddusb256((__v32qi)__a, (__v32qi)__b);		return (__m256i)__builtin_ia32_paddusb256((__v32qi)__a, (__v32qi)__b);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_adds_epu16(__m256i __a, __m256i __b)		_mm256_adds_epu16(__m256i __a, __m256i __b)
{		{
return (__m256i)__builtin_ia32_paddusw256((__v16hi)__a, (__v16hi)__b);		return (__m256i)__builtin_ia32_paddusw256((__v16hi)__a, (__v16hi)__b);
}		}

#define _mm256_alignr_epi8(a, b, n) \		#define _mm256_alignr_epi8(a, b, n) \
(__m256i)__builtin_ia32_palignr256((__v32qi)(__m256i)(a), \		(__m256i)__builtin_ia32_palignr256((__v32qi)(__m256i)(a), \
(__v32qi)(__m256i)(b), (n))		(__v32qi)(__m256i)(b), (n))

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_and_si256(__m256i __a, __m256i __b)		_mm256_and_si256(__m256i __a, __m256i __b)
{		{
return (__m256i)((__v4du)__a & (__v4du)__b);		return (__m256i)((__v4du)__a & (__v4du)__b);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_andnot_si256(__m256i __a, __m256i __b)		_mm256_andnot_si256(__m256i __a, __m256i __b)
{		{
return (__m256i)(~(__v4du)__a & (__v4du)__b);		return (__m256i)(~(__v4du)__a & (__v4du)__b);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_avg_epu8(__m256i __a, __m256i __b)		_mm256_avg_epu8(__m256i __a, __m256i __b)
{		{
typedef unsigned short __v32hu __attribute__((__vector_size__(64)));		typedef unsigned short __v32hu __attribute__((__vector_size__(64)));
return (__m256i)__builtin_convertvector(		return (__m256i)__builtin_convertvector(
((__builtin_convertvector((__v32qu)__a, __v32hu) +		((__builtin_convertvector((__v32qu)__a, __v32hu) +
__builtin_convertvector((__v32qu)__b, __v32hu)) + 1)		__builtin_convertvector((__v32qu)__b, __v32hu)) + 1)
>> 1, __v32qu);		>> 1, __v32qu);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_avg_epu16(__m256i __a, __m256i __b)		_mm256_avg_epu16(__m256i __a, __m256i __b)
{		{
typedef unsigned int __v16su __attribute__((__vector_size__(64)));		typedef unsigned int __v16su __attribute__((__vector_size__(64)));
return (__m256i)__builtin_convertvector(		return (__m256i)__builtin_convertvector(
((__builtin_convertvector((__v16hu)__a, __v16su) +		((__builtin_convertvector((__v16hu)__a, __v16su) +
__builtin_convertvector((__v16hu)__b, __v16su)) + 1)		__builtin_convertvector((__v16hu)__b, __v16su)) + 1)
>> 1, __v16hu);		>> 1, __v16hu);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_blendv_epi8(__m256i __V1, __m256i __V2, __m256i __M)		_mm256_blendv_epi8(__m256i __V1, __m256i __V2, __m256i __M)
{		{
return (__m256i)__builtin_ia32_pblendvb256((__v32qi)__V1, (__v32qi)__V2,		return (__m256i)__builtin_ia32_pblendvb256((__v32qi)__V1, (__v32qi)__V2,
(__v32qi)__M);		(__v32qi)__M);
}		}

#define _mm256_blend_epi16(V1, V2, M) \		#define _mm256_blend_epi16(V1, V2, M) \
(__m256i)__builtin_ia32_pblendw256((__v16hi)(__m256i)(V1), \		(__m256i)__builtin_ia32_pblendw256((__v16hi)(__m256i)(V1), \
(__v16hi)(__m256i)(V2), (int)(M))		(__v16hi)(__m256i)(V2), (int)(M))

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_cmpeq_epi8(__m256i __a, __m256i __b)		_mm256_cmpeq_epi8(__m256i __a, __m256i __b)
{		{
return (__m256i)((__v32qi)__a == (__v32qi)__b);		return (__m256i)((__v32qi)__a == (__v32qi)__b);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_cmpeq_epi16(__m256i __a, __m256i __b)		_mm256_cmpeq_epi16(__m256i __a, __m256i __b)
{		{
return (__m256i)((__v16hi)__a == (__v16hi)__b);		return (__m256i)((__v16hi)__a == (__v16hi)__b);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_cmpeq_epi32(__m256i __a, __m256i __b)		_mm256_cmpeq_epi32(__m256i __a, __m256i __b)
{		{
return (__m256i)((__v8si)__a == (__v8si)__b);		return (__m256i)((__v8si)__a == (__v8si)__b);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_cmpeq_epi64(__m256i __a, __m256i __b)		_mm256_cmpeq_epi64(__m256i __a, __m256i __b)
{		{
return (__m256i)((__v4di)__a == (__v4di)__b);		return (__m256i)((__v4di)__a == (__v4di)__b);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_cmpgt_epi8(__m256i __a, __m256i __b)		_mm256_cmpgt_epi8(__m256i __a, __m256i __b)
{		{
/* This function always performs a signed comparison, but __v32qi is a char		/* This function always performs a signed comparison, but __v32qi is a char
which may be signed or unsigned, so use __v32qs. */		which may be signed or unsigned, so use __v32qs. */
return (__m256i)((__v32qs)__a > (__v32qs)__b);		return (__m256i)((__v32qs)__a > (__v32qs)__b);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_cmpgt_epi16(__m256i __a, __m256i __b)		_mm256_cmpgt_epi16(__m256i __a, __m256i __b)
{		{
return (__m256i)((__v16hi)__a > (__v16hi)__b);		return (__m256i)((__v16hi)__a > (__v16hi)__b);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_cmpgt_epi32(__m256i __a, __m256i __b)		_mm256_cmpgt_epi32(__m256i __a, __m256i __b)
{		{
return (__m256i)((__v8si)__a > (__v8si)__b);		return (__m256i)((__v8si)__a > (__v8si)__b);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_cmpgt_epi64(__m256i __a, __m256i __b)		_mm256_cmpgt_epi64(__m256i __a, __m256i __b)
{		{
return (__m256i)((__v4di)__a > (__v4di)__b);		return (__m256i)((__v4di)__a > (__v4di)__b);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_hadd_epi16(__m256i __a, __m256i __b)		_mm256_hadd_epi16(__m256i __a, __m256i __b)
{		{
return (__m256i)__builtin_ia32_phaddw256((__v16hi)__a, (__v16hi)__b);		return (__m256i)__builtin_ia32_phaddw256((__v16hi)__a, (__v16hi)__b);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_hadd_epi32(__m256i __a, __m256i __b)		_mm256_hadd_epi32(__m256i __a, __m256i __b)
{		{
return (__m256i)__builtin_ia32_phaddd256((__v8si)__a, (__v8si)__b);		return (__m256i)__builtin_ia32_phaddd256((__v8si)__a, (__v8si)__b);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_hadds_epi16(__m256i __a, __m256i __b)		_mm256_hadds_epi16(__m256i __a, __m256i __b)
{		{
return (__m256i)__builtin_ia32_phaddsw256((__v16hi)__a, (__v16hi)__b);		return (__m256i)__builtin_ia32_phaddsw256((__v16hi)__a, (__v16hi)__b);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_hsub_epi16(__m256i __a, __m256i __b)		_mm256_hsub_epi16(__m256i __a, __m256i __b)
{		{
return (__m256i)__builtin_ia32_phsubw256((__v16hi)__a, (__v16hi)__b);		return (__m256i)__builtin_ia32_phsubw256((__v16hi)__a, (__v16hi)__b);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_hsub_epi32(__m256i __a, __m256i __b)		_mm256_hsub_epi32(__m256i __a, __m256i __b)
{		{
return (__m256i)__builtin_ia32_phsubd256((__v8si)__a, (__v8si)__b);		return (__m256i)__builtin_ia32_phsubd256((__v8si)__a, (__v8si)__b);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_hsubs_epi16(__m256i __a, __m256i __b)		_mm256_hsubs_epi16(__m256i __a, __m256i __b)
{		{
return (__m256i)__builtin_ia32_phsubsw256((__v16hi)__a, (__v16hi)__b);		return (__m256i)__builtin_ia32_phsubsw256((__v16hi)__a, (__v16hi)__b);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maddubs_epi16(__m256i __a, __m256i __b)		_mm256_maddubs_epi16(__m256i __a, __m256i __b)
{		{
return (__m256i)__builtin_ia32_pmaddubsw256((__v32qi)__a, (__v32qi)__b);		return (__m256i)__builtin_ia32_pmaddubsw256((__v32qi)__a, (__v32qi)__b);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_madd_epi16(__m256i __a, __m256i __b)		_mm256_madd_epi16(__m256i __a, __m256i __b)
{		{
return (__m256i)__builtin_ia32_pmaddwd256((__v16hi)__a, (__v16hi)__b);		return (__m256i)__builtin_ia32_pmaddwd256((__v16hi)__a, (__v16hi)__b);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_max_epi8(__m256i __a, __m256i __b)		_mm256_max_epi8(__m256i __a, __m256i __b)
{		{
return (__m256i)__builtin_ia32_pmaxsb256((__v32qi)__a, (__v32qi)__b);		return (__m256i)__builtin_ia32_pmaxsb256((__v32qi)__a, (__v32qi)__b);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_max_epi16(__m256i __a, __m256i __b)		_mm256_max_epi16(__m256i __a, __m256i __b)
{		{
return (__m256i)__builtin_ia32_pmaxsw256((__v16hi)__a, (__v16hi)__b);		return (__m256i)__builtin_ia32_pmaxsw256((__v16hi)__a, (__v16hi)__b);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_max_epi32(__m256i __a, __m256i __b)		_mm256_max_epi32(__m256i __a, __m256i __b)
{		{
return (__m256i)__builtin_ia32_pmaxsd256((__v8si)__a, (__v8si)__b);		return (__m256i)__builtin_ia32_pmaxsd256((__v8si)__a, (__v8si)__b);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_max_epu8(__m256i __a, __m256i __b)		_mm256_max_epu8(__m256i __a, __m256i __b)
{		{
return (__m256i)__builtin_ia32_pmaxub256((__v32qi)__a, (__v32qi)__b);		return (__m256i)__builtin_ia32_pmaxub256((__v32qi)__a, (__v32qi)__b);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_max_epu16(__m256i __a, __m256i __b)		_mm256_max_epu16(__m256i __a, __m256i __b)
{		{
return (__m256i)__builtin_ia32_pmaxuw256((__v16hi)__a, (__v16hi)__b);		return (__m256i)__builtin_ia32_pmaxuw256((__v16hi)__a, (__v16hi)__b);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_max_epu32(__m256i __a, __m256i __b)		_mm256_max_epu32(__m256i __a, __m256i __b)
{		{
return (__m256i)__builtin_ia32_pmaxud256((__v8si)__a, (__v8si)__b);		return (__m256i)__builtin_ia32_pmaxud256((__v8si)__a, (__v8si)__b);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_min_epi8(__m256i __a, __m256i __b)		_mm256_min_epi8(__m256i __a, __m256i __b)
{		{
return (__m256i)__builtin_ia32_pminsb256((__v32qi)__a, (__v32qi)__b);		return (__m256i)__builtin_ia32_pminsb256((__v32qi)__a, (__v32qi)__b);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_min_epi16(__m256i __a, __m256i __b)		_mm256_min_epi16(__m256i __a, __m256i __b)
{		{
return (__m256i)__builtin_ia32_pminsw256((__v16hi)__a, (__v16hi)__b);		return (__m256i)__builtin_ia32_pminsw256((__v16hi)__a, (__v16hi)__b);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_min_epi32(__m256i __a, __m256i __b)		_mm256_min_epi32(__m256i __a, __m256i __b)
{		{
return (__m256i)__builtin_ia32_pminsd256((__v8si)__a, (__v8si)__b);		return (__m256i)__builtin_ia32_pminsd256((__v8si)__a, (__v8si)__b);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_min_epu8(__m256i __a, __m256i __b)		_mm256_min_epu8(__m256i __a, __m256i __b)
{		{
return (__m256i)__builtin_ia32_pminub256((__v32qi)__a, (__v32qi)__b);		return (__m256i)__builtin_ia32_pminub256((__v32qi)__a, (__v32qi)__b);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_min_epu16(__m256i __a, __m256i __b)		_mm256_min_epu16(__m256i __a, __m256i __b)
{		{
return (__m256i)__builtin_ia32_pminuw256 ((__v16hi)__a, (__v16hi)__b);		return (__m256i)__builtin_ia32_pminuw256 ((__v16hi)__a, (__v16hi)__b);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_min_epu32(__m256i __a, __m256i __b)		_mm256_min_epu32(__m256i __a, __m256i __b)
{		{
return (__m256i)__builtin_ia32_pminud256((__v8si)__a, (__v8si)__b);		return (__m256i)__builtin_ia32_pminud256((__v8si)__a, (__v8si)__b);
}		}

static __inline__ int __DEFAULT_FN_ATTRS		static __inline__ int __DEFAULT_FN_ATTRS256
_mm256_movemask_epi8(__m256i __a)		_mm256_movemask_epi8(__m256i __a)
{		{
return __builtin_ia32_pmovmskb256((__v32qi)__a);		return __builtin_ia32_pmovmskb256((__v32qi)__a);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_cvtepi8_epi16(__m128i __V)		_mm256_cvtepi8_epi16(__m128i __V)
{		{
/* This function always performs a signed extension, but __v16qi is a char		/* This function always performs a signed extension, but __v16qi is a char
which may be signed or unsigned, so use __v16qs. */		which may be signed or unsigned, so use __v16qs. */
return (__m256i)__builtin_convertvector((__v16qs)__V, __v16hi);		return (__m256i)__builtin_convertvector((__v16qs)__V, __v16hi);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_cvtepi8_epi32(__m128i __V)		_mm256_cvtepi8_epi32(__m128i __V)
{		{
/* This function always performs a signed extension, but __v16qi is a char		/* This function always performs a signed extension, but __v16qi is a char
which may be signed or unsigned, so use __v16qs. */		which may be signed or unsigned, so use __v16qs. */
return (__m256i)__builtin_convertvector(__builtin_shufflevector((__v16qs)__V, (__v16qs)__V, 0, 1, 2, 3, 4, 5, 6, 7), __v8si);		return (__m256i)__builtin_convertvector(__builtin_shufflevector((__v16qs)__V, (__v16qs)__V, 0, 1, 2, 3, 4, 5, 6, 7), __v8si);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_cvtepi8_epi64(__m128i __V)		_mm256_cvtepi8_epi64(__m128i __V)
{		{
/* This function always performs a signed extension, but __v16qi is a char		/* This function always performs a signed extension, but __v16qi is a char
which may be signed or unsigned, so use __v16qs. */		which may be signed or unsigned, so use __v16qs. */
return (__m256i)__builtin_convertvector(__builtin_shufflevector((__v16qs)__V, (__v16qs)__V, 0, 1, 2, 3), __v4di);		return (__m256i)__builtin_convertvector(__builtin_shufflevector((__v16qs)__V, (__v16qs)__V, 0, 1, 2, 3), __v4di);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_cvtepi16_epi32(__m128i __V)		_mm256_cvtepi16_epi32(__m128i __V)
{		{
return (__m256i)__builtin_convertvector((__v8hi)__V, __v8si);		return (__m256i)__builtin_convertvector((__v8hi)__V, __v8si);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_cvtepi16_epi64(__m128i __V)		_mm256_cvtepi16_epi64(__m128i __V)
{		{
return (__m256i)__builtin_convertvector(__builtin_shufflevector((__v8hi)__V, (__v8hi)__V, 0, 1, 2, 3), __v4di);		return (__m256i)__builtin_convertvector(__builtin_shufflevector((__v8hi)__V, (__v8hi)__V, 0, 1, 2, 3), __v4di);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_cvtepi32_epi64(__m128i __V)		_mm256_cvtepi32_epi64(__m128i __V)
{		{
return (__m256i)__builtin_convertvector((__v4si)__V, __v4di);		return (__m256i)__builtin_convertvector((__v4si)__V, __v4di);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_cvtepu8_epi16(__m128i __V)		_mm256_cvtepu8_epi16(__m128i __V)
{		{
return (__m256i)__builtin_convertvector((__v16qu)__V, __v16hi);		return (__m256i)__builtin_convertvector((__v16qu)__V, __v16hi);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_cvtepu8_epi32(__m128i __V)		_mm256_cvtepu8_epi32(__m128i __V)
{		{
return (__m256i)__builtin_convertvector(__builtin_shufflevector((__v16qu)__V, (__v16qu)__V, 0, 1, 2, 3, 4, 5, 6, 7), __v8si);		return (__m256i)__builtin_convertvector(__builtin_shufflevector((__v16qu)__V, (__v16qu)__V, 0, 1, 2, 3, 4, 5, 6, 7), __v8si);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_cvtepu8_epi64(__m128i __V)		_mm256_cvtepu8_epi64(__m128i __V)
{		{
return (__m256i)__builtin_convertvector(__builtin_shufflevector((__v16qu)__V, (__v16qu)__V, 0, 1, 2, 3), __v4di);		return (__m256i)__builtin_convertvector(__builtin_shufflevector((__v16qu)__V, (__v16qu)__V, 0, 1, 2, 3), __v4di);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_cvtepu16_epi32(__m128i __V)		_mm256_cvtepu16_epi32(__m128i __V)
{		{
return (__m256i)__builtin_convertvector((__v8hu)__V, __v8si);		return (__m256i)__builtin_convertvector((__v8hu)__V, __v8si);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_cvtepu16_epi64(__m128i __V)		_mm256_cvtepu16_epi64(__m128i __V)
{		{
return (__m256i)__builtin_convertvector(__builtin_shufflevector((__v8hu)__V, (__v8hu)__V, 0, 1, 2, 3), __v4di);		return (__m256i)__builtin_convertvector(__builtin_shufflevector((__v8hu)__V, (__v8hu)__V, 0, 1, 2, 3), __v4di);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_cvtepu32_epi64(__m128i __V)		_mm256_cvtepu32_epi64(__m128i __V)
{		{
return (__m256i)__builtin_convertvector((__v4su)__V, __v4di);		return (__m256i)__builtin_convertvector((__v4su)__V, __v4di);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mul_epi32(__m256i __a, __m256i __b)		_mm256_mul_epi32(__m256i __a, __m256i __b)
{		{
return (__m256i)__builtin_ia32_pmuldq256((__v8si)__a, (__v8si)__b);		return (__m256i)__builtin_ia32_pmuldq256((__v8si)__a, (__v8si)__b);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mulhrs_epi16(__m256i __a, __m256i __b)		_mm256_mulhrs_epi16(__m256i __a, __m256i __b)
{		{
return (__m256i)__builtin_ia32_pmulhrsw256((__v16hi)__a, (__v16hi)__b);		return (__m256i)__builtin_ia32_pmulhrsw256((__v16hi)__a, (__v16hi)__b);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mulhi_epu16(__m256i __a, __m256i __b)		_mm256_mulhi_epu16(__m256i __a, __m256i __b)
{		{
return (__m256i)__builtin_ia32_pmulhuw256((__v16hi)__a, (__v16hi)__b);		return (__m256i)__builtin_ia32_pmulhuw256((__v16hi)__a, (__v16hi)__b);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mulhi_epi16(__m256i __a, __m256i __b)		_mm256_mulhi_epi16(__m256i __a, __m256i __b)
{		{
return (__m256i)__builtin_ia32_pmulhw256((__v16hi)__a, (__v16hi)__b);		return (__m256i)__builtin_ia32_pmulhw256((__v16hi)__a, (__v16hi)__b);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mullo_epi16(__m256i __a, __m256i __b)		_mm256_mullo_epi16(__m256i __a, __m256i __b)
{		{
return (__m256i)((__v16hu)__a * (__v16hu)__b);		return (__m256i)((__v16hu)__a * (__v16hu)__b);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mullo_epi32 (__m256i __a, __m256i __b)		_mm256_mullo_epi32 (__m256i __a, __m256i __b)
{		{
return (__m256i)((__v8su)__a * (__v8su)__b);		return (__m256i)((__v8su)__a * (__v8su)__b);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mul_epu32(__m256i __a, __m256i __b)		_mm256_mul_epu32(__m256i __a, __m256i __b)
{		{
return __builtin_ia32_pmuludq256((__v8si)__a, (__v8si)__b);		return __builtin_ia32_pmuludq256((__v8si)__a, (__v8si)__b);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_or_si256(__m256i __a, __m256i __b)		_mm256_or_si256(__m256i __a, __m256i __b)
{		{
return (__m256i)((__v4du)__a \| (__v4du)__b);		return (__m256i)((__v4du)__a \| (__v4du)__b);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_sad_epu8(__m256i __a, __m256i __b)		_mm256_sad_epu8(__m256i __a, __m256i __b)
{		{
return __builtin_ia32_psadbw256((__v32qi)__a, (__v32qi)__b);		return __builtin_ia32_psadbw256((__v32qi)__a, (__v32qi)__b);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_shuffle_epi8(__m256i __a, __m256i __b)		_mm256_shuffle_epi8(__m256i __a, __m256i __b)
{		{
return (__m256i)__builtin_ia32_pshufb256((__v32qi)__a, (__v32qi)__b);		return (__m256i)__builtin_ia32_pshufb256((__v32qi)__a, (__v32qi)__b);
}		}

#define _mm256_shuffle_epi32(a, imm) \		#define _mm256_shuffle_epi32(a, imm) \
(__m256i)__builtin_ia32_pshufd256((__v8si)(__m256i)(a), (int)(imm))		(__m256i)__builtin_ia32_pshufd256((__v8si)(__m256i)(a), (int)(imm))

#define _mm256_shufflehi_epi16(a, imm) \		#define _mm256_shufflehi_epi16(a, imm) \
(__m256i)__builtin_ia32_pshufhw256((__v16hi)(__m256i)(a), (int)(imm))		(__m256i)__builtin_ia32_pshufhw256((__v16hi)(__m256i)(a), (int)(imm))

#define _mm256_shufflelo_epi16(a, imm) \		#define _mm256_shufflelo_epi16(a, imm) \
(__m256i)__builtin_ia32_pshuflw256((__v16hi)(__m256i)(a), (int)(imm))		(__m256i)__builtin_ia32_pshuflw256((__v16hi)(__m256i)(a), (int)(imm))

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_sign_epi8(__m256i __a, __m256i __b)		_mm256_sign_epi8(__m256i __a, __m256i __b)
{		{
return (__m256i)__builtin_ia32_psignb256((__v32qi)__a, (__v32qi)__b);		return (__m256i)__builtin_ia32_psignb256((__v32qi)__a, (__v32qi)__b);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_sign_epi16(__m256i __a, __m256i __b)		_mm256_sign_epi16(__m256i __a, __m256i __b)
{		{
return (__m256i)__builtin_ia32_psignw256((__v16hi)__a, (__v16hi)__b);		return (__m256i)__builtin_ia32_psignw256((__v16hi)__a, (__v16hi)__b);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_sign_epi32(__m256i __a, __m256i __b)		_mm256_sign_epi32(__m256i __a, __m256i __b)
{		{
return (__m256i)__builtin_ia32_psignd256((__v8si)__a, (__v8si)__b);		return (__m256i)__builtin_ia32_psignd256((__v8si)__a, (__v8si)__b);
}		}

#define _mm256_slli_si256(a, imm) \		#define _mm256_slli_si256(a, imm) \
(__m256i)__builtin_ia32_pslldqi256_byteshift((__v4di)(__m256i)(a), (int)(imm))		(__m256i)__builtin_ia32_pslldqi256_byteshift((__v4di)(__m256i)(a), (int)(imm))

#define _mm256_bslli_epi128(a, imm) \		#define _mm256_bslli_epi128(a, imm) \
(__m256i)__builtin_ia32_pslldqi256_byteshift((__v4di)(__m256i)(a), (int)(imm))		(__m256i)__builtin_ia32_pslldqi256_byteshift((__v4di)(__m256i)(a), (int)(imm))

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_slli_epi16(__m256i __a, int __count)		_mm256_slli_epi16(__m256i __a, int __count)
{		{
return (__m256i)__builtin_ia32_psllwi256((__v16hi)__a, __count);		return (__m256i)__builtin_ia32_psllwi256((__v16hi)__a, __count);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_sll_epi16(__m256i __a, __m128i __count)		_mm256_sll_epi16(__m256i __a, __m128i __count)
{		{
return (__m256i)__builtin_ia32_psllw256((__v16hi)__a, (__v8hi)__count);		return (__m256i)__builtin_ia32_psllw256((__v16hi)__a, (__v8hi)__count);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_slli_epi32(__m256i __a, int __count)		_mm256_slli_epi32(__m256i __a, int __count)
{		{
return (__m256i)__builtin_ia32_pslldi256((__v8si)__a, __count);		return (__m256i)__builtin_ia32_pslldi256((__v8si)__a, __count);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_sll_epi32(__m256i __a, __m128i __count)		_mm256_sll_epi32(__m256i __a, __m128i __count)
{		{
return (__m256i)__builtin_ia32_pslld256((__v8si)__a, (__v4si)__count);		return (__m256i)__builtin_ia32_pslld256((__v8si)__a, (__v4si)__count);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_slli_epi64(__m256i __a, int __count)		_mm256_slli_epi64(__m256i __a, int __count)
{		{
return __builtin_ia32_psllqi256((__v4di)__a, __count);		return __builtin_ia32_psllqi256((__v4di)__a, __count);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_sll_epi64(__m256i __a, __m128i __count)		_mm256_sll_epi64(__m256i __a, __m128i __count)
{		{
return __builtin_ia32_psllq256((__v4di)__a, __count);		return __builtin_ia32_psllq256((__v4di)__a, __count);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_srai_epi16(__m256i __a, int __count)		_mm256_srai_epi16(__m256i __a, int __count)
{		{
return (__m256i)__builtin_ia32_psrawi256((__v16hi)__a, __count);		return (__m256i)__builtin_ia32_psrawi256((__v16hi)__a, __count);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_sra_epi16(__m256i __a, __m128i __count)		_mm256_sra_epi16(__m256i __a, __m128i __count)
{		{
return (__m256i)__builtin_ia32_psraw256((__v16hi)__a, (__v8hi)__count);		return (__m256i)__builtin_ia32_psraw256((__v16hi)__a, (__v8hi)__count);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_srai_epi32(__m256i __a, int __count)		_mm256_srai_epi32(__m256i __a, int __count)
{		{
return (__m256i)__builtin_ia32_psradi256((__v8si)__a, __count);		return (__m256i)__builtin_ia32_psradi256((__v8si)__a, __count);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_sra_epi32(__m256i __a, __m128i __count)		_mm256_sra_epi32(__m256i __a, __m128i __count)
{		{
return (__m256i)__builtin_ia32_psrad256((__v8si)__a, (__v4si)__count);		return (__m256i)__builtin_ia32_psrad256((__v8si)__a, (__v4si)__count);
}		}

#define _mm256_srli_si256(a, imm) \		#define _mm256_srli_si256(a, imm) \
(__m256i)__builtin_ia32_psrldqi256_byteshift((__m256i)(a), (int)(imm))		(__m256i)__builtin_ia32_psrldqi256_byteshift((__m256i)(a), (int)(imm))

#define _mm256_bsrli_epi128(a, imm) \		#define _mm256_bsrli_epi128(a, imm) \
(__m256i)__builtin_ia32_psrldqi256_byteshift((__m256i)(a), (int)(imm))		(__m256i)__builtin_ia32_psrldqi256_byteshift((__m256i)(a), (int)(imm))

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_srli_epi16(__m256i __a, int __count)		_mm256_srli_epi16(__m256i __a, int __count)
{		{
return (__m256i)__builtin_ia32_psrlwi256((__v16hi)__a, __count);		return (__m256i)__builtin_ia32_psrlwi256((__v16hi)__a, __count);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_srl_epi16(__m256i __a, __m128i __count)		_mm256_srl_epi16(__m256i __a, __m128i __count)
{		{
return (__m256i)__builtin_ia32_psrlw256((__v16hi)__a, (__v8hi)__count);		return (__m256i)__builtin_ia32_psrlw256((__v16hi)__a, (__v8hi)__count);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_srli_epi32(__m256i __a, int __count)		_mm256_srli_epi32(__m256i __a, int __count)
{		{
return (__m256i)__builtin_ia32_psrldi256((__v8si)__a, __count);		return (__m256i)__builtin_ia32_psrldi256((__v8si)__a, __count);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_srl_epi32(__m256i __a, __m128i __count)		_mm256_srl_epi32(__m256i __a, __m128i __count)
{		{
return (__m256i)__builtin_ia32_psrld256((__v8si)__a, (__v4si)__count);		return (__m256i)__builtin_ia32_psrld256((__v8si)__a, (__v4si)__count);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_srli_epi64(__m256i __a, int __count)		_mm256_srli_epi64(__m256i __a, int __count)
{		{
return __builtin_ia32_psrlqi256((__v4di)__a, __count);		return __builtin_ia32_psrlqi256((__v4di)__a, __count);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_srl_epi64(__m256i __a, __m128i __count)		_mm256_srl_epi64(__m256i __a, __m128i __count)
{		{
return __builtin_ia32_psrlq256((__v4di)__a, __count);		return __builtin_ia32_psrlq256((__v4di)__a, __count);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_sub_epi8(__m256i __a, __m256i __b)		_mm256_sub_epi8(__m256i __a, __m256i __b)
{		{
return (__m256i)((__v32qu)__a - (__v32qu)__b);		return (__m256i)((__v32qu)__a - (__v32qu)__b);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_sub_epi16(__m256i __a, __m256i __b)		_mm256_sub_epi16(__m256i __a, __m256i __b)
{		{
return (__m256i)((__v16hu)__a - (__v16hu)__b);		return (__m256i)((__v16hu)__a - (__v16hu)__b);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_sub_epi32(__m256i __a, __m256i __b)		_mm256_sub_epi32(__m256i __a, __m256i __b)
{		{
return (__m256i)((__v8su)__a - (__v8su)__b);		return (__m256i)((__v8su)__a - (__v8su)__b);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_sub_epi64(__m256i __a, __m256i __b)		_mm256_sub_epi64(__m256i __a, __m256i __b)
{		{
return (__m256i)((__v4du)__a - (__v4du)__b);		return (__m256i)((__v4du)__a - (__v4du)__b);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_subs_epi8(__m256i __a, __m256i __b)		_mm256_subs_epi8(__m256i __a, __m256i __b)
{		{
return (__m256i)__builtin_ia32_psubsb256((__v32qi)__a, (__v32qi)__b);		return (__m256i)__builtin_ia32_psubsb256((__v32qi)__a, (__v32qi)__b);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_subs_epi16(__m256i __a, __m256i __b)		_mm256_subs_epi16(__m256i __a, __m256i __b)
{		{
return (__m256i)__builtin_ia32_psubsw256((__v16hi)__a, (__v16hi)__b);		return (__m256i)__builtin_ia32_psubsw256((__v16hi)__a, (__v16hi)__b);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_subs_epu8(__m256i __a, __m256i __b)		_mm256_subs_epu8(__m256i __a, __m256i __b)
{		{
return (__m256i)__builtin_ia32_psubusb256((__v32qi)__a, (__v32qi)__b);		return (__m256i)__builtin_ia32_psubusb256((__v32qi)__a, (__v32qi)__b);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_subs_epu16(__m256i __a, __m256i __b)		_mm256_subs_epu16(__m256i __a, __m256i __b)
{		{
return (__m256i)__builtin_ia32_psubusw256((__v16hi)__a, (__v16hi)__b);		return (__m256i)__builtin_ia32_psubusw256((__v16hi)__a, (__v16hi)__b);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_unpackhi_epi8(__m256i __a, __m256i __b)		_mm256_unpackhi_epi8(__m256i __a, __m256i __b)
{		{
return (__m256i)__builtin_shufflevector((__v32qi)__a, (__v32qi)__b, 8, 32+8, 9, 32+9, 10, 32+10, 11, 32+11, 12, 32+12, 13, 32+13, 14, 32+14, 15, 32+15, 24, 32+24, 25, 32+25, 26, 32+26, 27, 32+27, 28, 32+28, 29, 32+29, 30, 32+30, 31, 32+31);		return (__m256i)__builtin_shufflevector((__v32qi)__a, (__v32qi)__b, 8, 32+8, 9, 32+9, 10, 32+10, 11, 32+11, 12, 32+12, 13, 32+13, 14, 32+14, 15, 32+15, 24, 32+24, 25, 32+25, 26, 32+26, 27, 32+27, 28, 32+28, 29, 32+29, 30, 32+30, 31, 32+31);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_unpackhi_epi16(__m256i __a, __m256i __b)		_mm256_unpackhi_epi16(__m256i __a, __m256i __b)
{		{
return (__m256i)__builtin_shufflevector((__v16hi)__a, (__v16hi)__b, 4, 16+4, 5, 16+5, 6, 16+6, 7, 16+7, 12, 16+12, 13, 16+13, 14, 16+14, 15, 16+15);		return (__m256i)__builtin_shufflevector((__v16hi)__a, (__v16hi)__b, 4, 16+4, 5, 16+5, 6, 16+6, 7, 16+7, 12, 16+12, 13, 16+13, 14, 16+14, 15, 16+15);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_unpackhi_epi32(__m256i __a, __m256i __b)		_mm256_unpackhi_epi32(__m256i __a, __m256i __b)
{		{
return (__m256i)__builtin_shufflevector((__v8si)__a, (__v8si)__b, 2, 8+2, 3, 8+3, 6, 8+6, 7, 8+7);		return (__m256i)__builtin_shufflevector((__v8si)__a, (__v8si)__b, 2, 8+2, 3, 8+3, 6, 8+6, 7, 8+7);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_unpackhi_epi64(__m256i __a, __m256i __b)		_mm256_unpackhi_epi64(__m256i __a, __m256i __b)
{		{
return (__m256i)__builtin_shufflevector((__v4di)__a, (__v4di)__b, 1, 4+1, 3, 4+3);		return (__m256i)__builtin_shufflevector((__v4di)__a, (__v4di)__b, 1, 4+1, 3, 4+3);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_unpacklo_epi8(__m256i __a, __m256i __b)		_mm256_unpacklo_epi8(__m256i __a, __m256i __b)
{		{
return (__m256i)__builtin_shufflevector((__v32qi)__a, (__v32qi)__b, 0, 32+0, 1, 32+1, 2, 32+2, 3, 32+3, 4, 32+4, 5, 32+5, 6, 32+6, 7, 32+7, 16, 32+16, 17, 32+17, 18, 32+18, 19, 32+19, 20, 32+20, 21, 32+21, 22, 32+22, 23, 32+23);		return (__m256i)__builtin_shufflevector((__v32qi)__a, (__v32qi)__b, 0, 32+0, 1, 32+1, 2, 32+2, 3, 32+3, 4, 32+4, 5, 32+5, 6, 32+6, 7, 32+7, 16, 32+16, 17, 32+17, 18, 32+18, 19, 32+19, 20, 32+20, 21, 32+21, 22, 32+22, 23, 32+23);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_unpacklo_epi16(__m256i __a, __m256i __b)		_mm256_unpacklo_epi16(__m256i __a, __m256i __b)
{		{
return (__m256i)__builtin_shufflevector((__v16hi)__a, (__v16hi)__b, 0, 16+0, 1, 16+1, 2, 16+2, 3, 16+3, 8, 16+8, 9, 16+9, 10, 16+10, 11, 16+11);		return (__m256i)__builtin_shufflevector((__v16hi)__a, (__v16hi)__b, 0, 16+0, 1, 16+1, 2, 16+2, 3, 16+3, 8, 16+8, 9, 16+9, 10, 16+10, 11, 16+11);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_unpacklo_epi32(__m256i __a, __m256i __b)		_mm256_unpacklo_epi32(__m256i __a, __m256i __b)
{		{
return (__m256i)__builtin_shufflevector((__v8si)__a, (__v8si)__b, 0, 8+0, 1, 8+1, 4, 8+4, 5, 8+5);		return (__m256i)__builtin_shufflevector((__v8si)__a, (__v8si)__b, 0, 8+0, 1, 8+1, 4, 8+4, 5, 8+5);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_unpacklo_epi64(__m256i __a, __m256i __b)		_mm256_unpacklo_epi64(__m256i __a, __m256i __b)
{		{
return (__m256i)__builtin_shufflevector((__v4di)__a, (__v4di)__b, 0, 4+0, 2, 4+2);		return (__m256i)__builtin_shufflevector((__v4di)__a, (__v4di)__b, 0, 4+0, 2, 4+2);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_xor_si256(__m256i __a, __m256i __b)		_mm256_xor_si256(__m256i __a, __m256i __b)
{		{
return (__m256i)((__v4du)__a ^ (__v4du)__b);		return (__m256i)((__v4du)__a ^ (__v4du)__b);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_stream_load_si256(__m256i const *__V)		_mm256_stream_load_si256(__m256i const *__V)
{		{
typedef __v4di __v4di_aligned __attribute__((aligned(32)));		typedef __v4di __v4di_aligned __attribute__((aligned(32)));
return (__m256i)__builtin_nontemporal_load((const __v4di_aligned *)__V);		return (__m256i)__builtin_nontemporal_load((const __v4di_aligned *)__V);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_broadcastss_ps(__m128 __X)		_mm_broadcastss_ps(__m128 __X)
{		{
return (__m128)__builtin_shufflevector((__v4sf)__X, (__v4sf)__X, 0, 0, 0, 0);		return (__m128)__builtin_shufflevector((__v4sf)__X, (__v4sf)__X, 0, 0, 0, 0);
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_broadcastsd_pd(__m128d __a)		_mm_broadcastsd_pd(__m128d __a)
{		{
return __builtin_shufflevector((__v2df)__a, (__v2df)__a, 0, 0);		return __builtin_shufflevector((__v2df)__a, (__v2df)__a, 0, 0);
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_broadcastss_ps(__m128 __X)		_mm256_broadcastss_ps(__m128 __X)
{		{
return (__m256)__builtin_shufflevector((__v4sf)__X, (__v4sf)__X, 0, 0, 0, 0, 0, 0, 0, 0);		return (__m256)__builtin_shufflevector((__v4sf)__X, (__v4sf)__X, 0, 0, 0, 0, 0, 0, 0, 0);
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_broadcastsd_pd(__m128d __X)		_mm256_broadcastsd_pd(__m128d __X)
{		{
return (__m256d)__builtin_shufflevector((__v2df)__X, (__v2df)__X, 0, 0, 0, 0);		return (__m256d)__builtin_shufflevector((__v2df)__X, (__v2df)__X, 0, 0, 0, 0);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_broadcastsi128_si256(__m128i __X)		_mm256_broadcastsi128_si256(__m128i __X)
{		{
return (__m256i)__builtin_shufflevector((__v2di)__X, (__v2di)__X, 0, 1, 0, 1);		return (__m256i)__builtin_shufflevector((__v2di)__X, (__v2di)__X, 0, 1, 0, 1);
}		}

#define _mm_blend_epi32(V1, V2, M) \		#define _mm_blend_epi32(V1, V2, M) \
(__m128i)__builtin_ia32_pblendd128((__v4si)(__m128i)(V1), \		(__m128i)__builtin_ia32_pblendd128((__v4si)(__m128i)(V1), \
(__v4si)(__m128i)(V2), (int)(M))		(__v4si)(__m128i)(V2), (int)(M))

#define _mm256_blend_epi32(V1, V2, M) \		#define _mm256_blend_epi32(V1, V2, M) \
(__m256i)__builtin_ia32_pblendd256((__v8si)(__m256i)(V1), \		(__m256i)__builtin_ia32_pblendd256((__v8si)(__m256i)(V1), \
(__v8si)(__m256i)(V2), (int)(M))		(__v8si)(__m256i)(V2), (int)(M))

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_broadcastb_epi8(__m128i __X)		_mm256_broadcastb_epi8(__m128i __X)
{		{
return (__m256i)__builtin_shufflevector((__v16qi)__X, (__v16qi)__X, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0);		return (__m256i)__builtin_shufflevector((__v16qi)__X, (__v16qi)__X, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_broadcastw_epi16(__m128i __X)		_mm256_broadcastw_epi16(__m128i __X)
{		{
return (__m256i)__builtin_shufflevector((__v8hi)__X, (__v8hi)__X, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0);		return (__m256i)__builtin_shufflevector((__v8hi)__X, (__v8hi)__X, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_broadcastd_epi32(__m128i __X)		_mm256_broadcastd_epi32(__m128i __X)
{		{
return (__m256i)__builtin_shufflevector((__v4si)__X, (__v4si)__X, 0, 0, 0, 0, 0, 0, 0, 0);		return (__m256i)__builtin_shufflevector((__v4si)__X, (__v4si)__X, 0, 0, 0, 0, 0, 0, 0, 0);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_broadcastq_epi64(__m128i __X)		_mm256_broadcastq_epi64(__m128i __X)
{		{
return (__m256i)__builtin_shufflevector((__v2di)__X, (__v2di)__X, 0, 0, 0, 0);		return (__m256i)__builtin_shufflevector((__v2di)__X, (__v2di)__X, 0, 0, 0, 0);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_broadcastb_epi8(__m128i __X)		_mm_broadcastb_epi8(__m128i __X)
{		{
return (__m128i)__builtin_shufflevector((__v16qi)__X, (__v16qi)__X, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0);		return (__m128i)__builtin_shufflevector((__v16qi)__X, (__v16qi)__X, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_broadcastw_epi16(__m128i __X)		_mm_broadcastw_epi16(__m128i __X)
{		{
return (__m128i)__builtin_shufflevector((__v8hi)__X, (__v8hi)__X, 0, 0, 0, 0, 0, 0, 0, 0);		return (__m128i)__builtin_shufflevector((__v8hi)__X, (__v8hi)__X, 0, 0, 0, 0, 0, 0, 0, 0);
}		}


static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_broadcastd_epi32(__m128i __X)		_mm_broadcastd_epi32(__m128i __X)
{		{
return (__m128i)__builtin_shufflevector((__v4si)__X, (__v4si)__X, 0, 0, 0, 0);		return (__m128i)__builtin_shufflevector((__v4si)__X, (__v4si)__X, 0, 0, 0, 0);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_broadcastq_epi64(__m128i __X)		_mm_broadcastq_epi64(__m128i __X)
{		{
return (__m128i)__builtin_shufflevector((__v2di)__X, (__v2di)__X, 0, 0);		return (__m128i)__builtin_shufflevector((__v2di)__X, (__v2di)__X, 0, 0);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_permutevar8x32_epi32(__m256i __a, __m256i __b)		_mm256_permutevar8x32_epi32(__m256i __a, __m256i __b)
{		{
return (__m256i)__builtin_ia32_permvarsi256((__v8si)__a, (__v8si)__b);		return (__m256i)__builtin_ia32_permvarsi256((__v8si)__a, (__v8si)__b);
}		}

#define _mm256_permute4x64_pd(V, M) \		#define _mm256_permute4x64_pd(V, M) \
(__m256d)__builtin_ia32_permdf256((__v4df)(__m256d)(V), (int)(M))		(__m256d)__builtin_ia32_permdf256((__v4df)(__m256d)(V), (int)(M))

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_permutevar8x32_ps(__m256 __a, __m256i __b)		_mm256_permutevar8x32_ps(__m256 __a, __m256i __b)
{		{
return (__m256)__builtin_ia32_permvarsf256((__v8sf)__a, (__v8si)__b);		return (__m256)__builtin_ia32_permvarsf256((__v8sf)__a, (__v8si)__b);
}		}

#define _mm256_permute4x64_epi64(V, M) \		#define _mm256_permute4x64_epi64(V, M) \
(__m256i)__builtin_ia32_permdi256((__v4di)(__m256i)(V), (int)(M))		(__m256i)__builtin_ia32_permdi256((__v4di)(__m256i)(V), (int)(M))

#define _mm256_permute2x128_si256(V1, V2, M) \		#define _mm256_permute2x128_si256(V1, V2, M) \
(__m256i)__builtin_ia32_permti256((__m256i)(V1), (__m256i)(V2), (int)(M))		(__m256i)__builtin_ia32_permti256((__m256i)(V1), (__m256i)(V2), (int)(M))

#define _mm256_extracti128_si256(V, M) \		#define _mm256_extracti128_si256(V, M) \
(__m128i)__builtin_ia32_extract128i256((__v4di)(__m256i)(V), (int)(M))		(__m128i)__builtin_ia32_extract128i256((__v4di)(__m256i)(V), (int)(M))

#define _mm256_inserti128_si256(V1, V2, M) \		#define _mm256_inserti128_si256(V1, V2, M) \
(__m256i)__builtin_ia32_insert128i256((__v4di)(__m256i)(V1), \		(__m256i)__builtin_ia32_insert128i256((__v4di)(__m256i)(V1), \
(__v2di)(__m128i)(V2), (int)(M))		(__v2di)(__m128i)(V2), (int)(M))

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskload_epi32(int const *__X, __m256i __M)		_mm256_maskload_epi32(int const *__X, __m256i __M)
{		{
return (__m256i)__builtin_ia32_maskloadd256((const __v8si *)__X, (__v8si)__M);		return (__m256i)__builtin_ia32_maskloadd256((const __v8si *)__X, (__v8si)__M);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskload_epi64(long long const *__X, __m256i __M)		_mm256_maskload_epi64(long long const *__X, __m256i __M)
{		{
return (__m256i)__builtin_ia32_maskloadq256((const __v4di *)__X, (__v4di)__M);		return (__m256i)__builtin_ia32_maskloadq256((const __v4di *)__X, (__v4di)__M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskload_epi32(int const *__X, __m128i __M)		_mm_maskload_epi32(int const *__X, __m128i __M)
{		{
return (__m128i)__builtin_ia32_maskloadd((const __v4si *)__X, (__v4si)__M);		return (__m128i)__builtin_ia32_maskloadd((const __v4si *)__X, (__v4si)__M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskload_epi64(long long const *__X, __m128i __M)		_mm_maskload_epi64(long long const *__X, __m128i __M)
{		{
return (__m128i)__builtin_ia32_maskloadq((const __v2di *)__X, (__v2di)__M);		return (__m128i)__builtin_ia32_maskloadq((const __v2di *)__X, (__v2di)__M);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS256
_mm256_maskstore_epi32(int *__X, __m256i __M, __m256i __Y)		_mm256_maskstore_epi32(int *__X, __m256i __M, __m256i __Y)
{		{
__builtin_ia32_maskstored256((__v8si *)__X, (__v8si)__M, (__v8si)__Y);		__builtin_ia32_maskstored256((__v8si *)__X, (__v8si)__M, (__v8si)__Y);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS256
_mm256_maskstore_epi64(long long *__X, __m256i __M, __m256i __Y)		_mm256_maskstore_epi64(long long *__X, __m256i __M, __m256i __Y)
{		{
__builtin_ia32_maskstoreq256((__v4di *)__X, (__v4di)__M, (__v4di)__Y);		__builtin_ia32_maskstoreq256((__v4di *)__X, (__v4di)__M, (__v4di)__Y);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS128
_mm_maskstore_epi32(int *__X, __m128i __M, __m128i __Y)		_mm_maskstore_epi32(int *__X, __m128i __M, __m128i __Y)
{		{
__builtin_ia32_maskstored((__v4si *)__X, (__v4si)__M, (__v4si)__Y);		__builtin_ia32_maskstored((__v4si *)__X, (__v4si)__M, (__v4si)__Y);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS128
_mm_maskstore_epi64(long long *__X, __m128i __M, __m128i __Y)		_mm_maskstore_epi64(long long *__X, __m128i __M, __m128i __Y)
{		{
__builtin_ia32_maskstoreq(( __v2di *)__X, (__v2di)__M, (__v2di)__Y);		__builtin_ia32_maskstoreq(( __v2di *)__X, (__v2di)__M, (__v2di)__Y);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_sllv_epi32(__m256i __X, __m256i __Y)		_mm256_sllv_epi32(__m256i __X, __m256i __Y)
{		{
return (__m256i)__builtin_ia32_psllv8si((__v8si)__X, (__v8si)__Y);		return (__m256i)__builtin_ia32_psllv8si((__v8si)__X, (__v8si)__Y);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_sllv_epi32(__m128i __X, __m128i __Y)		_mm_sllv_epi32(__m128i __X, __m128i __Y)
{		{
return (__m128i)__builtin_ia32_psllv4si((__v4si)__X, (__v4si)__Y);		return (__m128i)__builtin_ia32_psllv4si((__v4si)__X, (__v4si)__Y);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_sllv_epi64(__m256i __X, __m256i __Y)		_mm256_sllv_epi64(__m256i __X, __m256i __Y)
{		{
return (__m256i)__builtin_ia32_psllv4di((__v4di)__X, (__v4di)__Y);		return (__m256i)__builtin_ia32_psllv4di((__v4di)__X, (__v4di)__Y);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_sllv_epi64(__m128i __X, __m128i __Y)		_mm_sllv_epi64(__m128i __X, __m128i __Y)
{		{
return (__m128i)__builtin_ia32_psllv2di((__v2di)__X, (__v2di)__Y);		return (__m128i)__builtin_ia32_psllv2di((__v2di)__X, (__v2di)__Y);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_srav_epi32(__m256i __X, __m256i __Y)		_mm256_srav_epi32(__m256i __X, __m256i __Y)
{		{
return (__m256i)__builtin_ia32_psrav8si((__v8si)__X, (__v8si)__Y);		return (__m256i)__builtin_ia32_psrav8si((__v8si)__X, (__v8si)__Y);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_srav_epi32(__m128i __X, __m128i __Y)		_mm_srav_epi32(__m128i __X, __m128i __Y)
{		{
return (__m128i)__builtin_ia32_psrav4si((__v4si)__X, (__v4si)__Y);		return (__m128i)__builtin_ia32_psrav4si((__v4si)__X, (__v4si)__Y);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_srlv_epi32(__m256i __X, __m256i __Y)		_mm256_srlv_epi32(__m256i __X, __m256i __Y)
{		{
return (__m256i)__builtin_ia32_psrlv8si((__v8si)__X, (__v8si)__Y);		return (__m256i)__builtin_ia32_psrlv8si((__v8si)__X, (__v8si)__Y);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_srlv_epi32(__m128i __X, __m128i __Y)		_mm_srlv_epi32(__m128i __X, __m128i __Y)
{		{
return (__m128i)__builtin_ia32_psrlv4si((__v4si)__X, (__v4si)__Y);		return (__m128i)__builtin_ia32_psrlv4si((__v4si)__X, (__v4si)__Y);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_srlv_epi64(__m256i __X, __m256i __Y)		_mm256_srlv_epi64(__m256i __X, __m256i __Y)
{		{
return (__m256i)__builtin_ia32_psrlv4di((__v4di)__X, (__v4di)__Y);		return (__m256i)__builtin_ia32_psrlv4di((__v4di)__X, (__v4di)__Y);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_srlv_epi64(__m128i __X, __m128i __Y)		_mm_srlv_epi64(__m128i __X, __m128i __Y)
{		{
return (__m128i)__builtin_ia32_psrlv2di((__v2di)__X, (__v2di)__Y);		return (__m128i)__builtin_ia32_psrlv2di((__v2di)__X, (__v2di)__Y);
}		}

#define _mm_mask_i32gather_pd(a, m, i, mask, s) \		#define _mm_mask_i32gather_pd(a, m, i, mask, s) \
(__m128d)__builtin_ia32_gatherd_pd((__v2df)(__m128i)(a), \		(__m128d)__builtin_ia32_gatherd_pd((__v2df)(__m128i)(a), \
(double const *)(m), \		(double const *)(m), \
▲ Show 20 Lines • Show All 196 Lines • ▼ Show 20 Lines	(__m128i)__builtin_ia32_gatherq_q((__v2di)_mm_undefined_si128(), \
(__v2di)_mm_set1_epi64x(-1), (s))		(__v2di)_mm_set1_epi64x(-1), (s))

#define _mm256_i64gather_epi64(m, i, s) \		#define _mm256_i64gather_epi64(m, i, s) \
(__m256i)__builtin_ia32_gatherq_q256((__v4di)_mm256_undefined_si256(), \		(__m256i)__builtin_ia32_gatherq_q256((__v4di)_mm256_undefined_si256(), \
(long long const *)(m), \		(long long const *)(m), \
(__v4di)(__m256i)(i), \		(__v4di)(__m256i)(i), \
(__v4di)_mm256_set1_epi64x(-1), (s))		(__v4di)_mm256_set1_epi64x(-1), (s))

#undef __DEFAULT_FN_ATTRS		#undef __DEFAULT_FN_ATTRS256
		#undef __DEFAULT_FN_ATTRS128

#endif /* __AVX2INTRIN_H */		#endif /* __AVX2INTRIN_H */

lib/Headers/avx512bitalgintrin.h

	Show All 23 Lines
	#ifndef __IMMINTRIN_H			#ifndef __IMMINTRIN_H
	#error "Never use <avx512bitalgintrin.h> directly; include <immintrin.h> instead."			#error "Never use <avx512bitalgintrin.h> directly; include <immintrin.h> instead."
	#endif			#endif

	#ifndef __AVX512BITALGINTRIN_H			#ifndef __AVX512BITALGINTRIN_H
	#define __AVX512BITALGINTRIN_H			#define __AVX512BITALGINTRIN_H

	/* Define the default attributes for the functions in this file. */			/* Define the default attributes for the functions in this file. */
	#define __DEFAULT_FN_ATTRS __attribute__((__always_inline__, __nodebug__, __target__("avx512bitalg")))			#define __DEFAULT_FN_ATTRS __attribute__((__always_inline__, __nodebug__, __target__("avx512bitalg"), __min_vector_width__(512)))

	static __inline__ __m512i __DEFAULT_FN_ATTRS			static __inline__ __m512i __DEFAULT_FN_ATTRS
	_mm512_popcnt_epi16(__m512i __A)			_mm512_popcnt_epi16(__m512i __A)
	{			{
	return (__m512i) __builtin_ia32_vpopcntw_512((__v32hi) __A);			return (__m512i) __builtin_ia32_vpopcntw_512((__v32hi) __A);
	}			}

	static __inline__ __m512i __DEFAULT_FN_ATTRS			static __inline__ __m512i __DEFAULT_FN_ATTRS
	▲ Show 20 Lines • Show All 57 Lines • Show Last 20 Lines

lib/Headers/avx512bwintrin.h

	Show All 26 Lines

	#ifndef __AVX512BWINTRIN_H			#ifndef __AVX512BWINTRIN_H
	#define __AVX512BWINTRIN_H			#define __AVX512BWINTRIN_H

	typedef unsigned int __mmask32;			typedef unsigned int __mmask32;
	typedef unsigned long long __mmask64;			typedef unsigned long long __mmask64;

	/* Define the default attributes for the functions in this file. */			/* Define the default attributes for the functions in this file. */
	#define __DEFAULT_FN_ATTRS __attribute__((__always_inline__, __nodebug__, __target__("avx512bw")))			#define __DEFAULT_FN_ATTRS __attribute__((__always_inline__, __nodebug__, __target__("avx512bw"), __min_vector_width__(512)))

	/* Integer compare */			/* Integer compare */

	#define _mm512_cmp_epi8_mask(a, b, p) \			#define _mm512_cmp_epi8_mask(a, b, p) \
	(__mmask64)__builtin_ia32_cmpb512_mask((__v64qi)(__m512i)(a), \			(__mmask64)__builtin_ia32_cmpb512_mask((__v64qi)(__m512i)(a), \
	(__v64qi)(__m512i)(b), (int)(p), \			(__v64qi)(__m512i)(b), (int)(p), \
	(__mmask64)-1)			(__mmask64)-1)

	▲ Show 20 Lines • Show All 1,803 Lines • Show Last 20 Lines

lib/Headers/avx512cdintrin.h

	Show All 23 Lines
	#ifndef __IMMINTRIN_H			#ifndef __IMMINTRIN_H
	#error "Never use <avx512cdintrin.h> directly; include <immintrin.h> instead."			#error "Never use <avx512cdintrin.h> directly; include <immintrin.h> instead."
	#endif			#endif

	#ifndef __AVX512CDINTRIN_H			#ifndef __AVX512CDINTRIN_H
	#define __AVX512CDINTRIN_H			#define __AVX512CDINTRIN_H

	/* Define the default attributes for the functions in this file. */			/* Define the default attributes for the functions in this file. */
	#define __DEFAULT_FN_ATTRS __attribute__((__always_inline__, __nodebug__, __target__("avx512cd")))			#define __DEFAULT_FN_ATTRS __attribute__((__always_inline__, __nodebug__, __target__("avx512cd"), __min_vector_width__(512)))

	static __inline__ __m512i __DEFAULT_FN_ATTRS			static __inline__ __m512i __DEFAULT_FN_ATTRS
	_mm512_conflict_epi64 (__m512i __A)			_mm512_conflict_epi64 (__m512i __A)
	{			{
	return (__m512i) __builtin_ia32_vpconflictdi_512_mask ((__v8di) __A,			return (__m512i) __builtin_ia32_vpconflictdi_512_mask ((__v8di) __A,
	(__v8di) _mm512_setzero_si512 (),			(__v8di) _mm512_setzero_si512 (),
	(__mmask8) -1);			(__mmask8) -1);
	}			}
	▲ Show 20 Lines • Show All 101 Lines • Show Last 20 Lines

lib/Headers/avx512dqintrin.h

	Show All 23 Lines
	#ifndef __IMMINTRIN_H			#ifndef __IMMINTRIN_H
	#error "Never use <avx512dqintrin.h> directly; include <immintrin.h> instead."			#error "Never use <avx512dqintrin.h> directly; include <immintrin.h> instead."
	#endif			#endif

	#ifndef __AVX512DQINTRIN_H			#ifndef __AVX512DQINTRIN_H
	#define __AVX512DQINTRIN_H			#define __AVX512DQINTRIN_H

	/* Define the default attributes for the functions in this file. */			/* Define the default attributes for the functions in this file. */
	#define __DEFAULT_FN_ATTRS __attribute__((__always_inline__, __nodebug__, __target__("avx512dq")))			#define __DEFAULT_FN_ATTRS __attribute__((__always_inline__, __nodebug__, __target__("avx512dq"), __min_vector_width__(512)))

	static __inline__ __m512i __DEFAULT_FN_ATTRS			static __inline__ __m512i __DEFAULT_FN_ATTRS
	_mm512_mullo_epi64 (__m512i __A, __m512i __B) {			_mm512_mullo_epi64 (__m512i __A, __m512i __B) {
	return (__m512i) ((__v8du) __A * (__v8du) __B);			return (__m512i) ((__v8du) __A * (__v8du) __B);
	}			}

	static __inline__ __m512i __DEFAULT_FN_ATTRS			static __inline__ __m512i __DEFAULT_FN_ATTRS
	_mm512_mask_mullo_epi64(__m512i __W, __mmask8 __U, __m512i __A, __m512i __B) {			_mm512_mask_mullo_epi64(__m512i __W, __mmask8 __U, __m512i __A, __m512i __B) {
	▲ Show 20 Lines • Show All 1,221 Lines • Show Last 20 Lines

lib/Headers/avx512fintrin.h

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 167 Lines • ▼ Show 20 Lines
typedef enum		typedef enum
{		{
_MM_MANT_SIGN_src, /* sign = sign(SRC) */		_MM_MANT_SIGN_src, /* sign = sign(SRC) */
_MM_MANT_SIGN_zero, /* sign = 0 */		_MM_MANT_SIGN_zero, /* sign = 0 */
_MM_MANT_SIGN_nan /* DEST = NaN if sign(SRC) = 1 */		_MM_MANT_SIGN_nan /* DEST = NaN if sign(SRC) = 1 */
} _MM_MANTISSA_SIGN_ENUM;		} _MM_MANTISSA_SIGN_ENUM;

/* Define the default attributes for the functions in this file. */		/* Define the default attributes for the functions in this file. */
#define __DEFAULT_FN_ATTRS __attribute__((__always_inline__, __nodebug__, __target__("avx512f")))		#define __DEFAULT_FN_ATTRS512 __attribute__((__always_inline__, __nodebug__, __target__("avx512f"), __min_vector_width__(512)))
		#define __DEFAULT_FN_ATTRS128 __attribute__((__always_inline__, __nodebug__, __target__("avx512f"), __min_vector_width__(128)))
		chandlercUnsubmitted Not Done Reply Inline Actions Want this to be suffixed with 512? No strong opinion here. chandlerc: Want this to be suffixed with 512? No strong opinion here.

/* Create vectors with repeated elements */		/* Create vectors with repeated elements */

static __inline __m512i __DEFAULT_FN_ATTRS		static __inline __m512i __DEFAULT_FN_ATTRS512
_mm512_setzero_si512(void)		_mm512_setzero_si512(void)
{		{
return __extension__ (__m512i)(__v8di){ 0, 0, 0, 0, 0, 0, 0, 0 };		return __extension__ (__m512i)(__v8di){ 0, 0, 0, 0, 0, 0, 0, 0 };
}		}

#define _mm512_setzero_epi32 _mm512_setzero_si512		#define _mm512_setzero_epi32 _mm512_setzero_si512

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_undefined_pd(void)		_mm512_undefined_pd(void)
{		{
return (__m512d)__builtin_ia32_undef512();		return (__m512d)__builtin_ia32_undef512();
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_undefined(void)		_mm512_undefined(void)
{		{
return (__m512)__builtin_ia32_undef512();		return (__m512)__builtin_ia32_undef512();
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_undefined_ps(void)		_mm512_undefined_ps(void)
{		{
return (__m512)__builtin_ia32_undef512();		return (__m512)__builtin_ia32_undef512();
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_undefined_epi32(void)		_mm512_undefined_epi32(void)
{		{
return (__m512i)__builtin_ia32_undef512();		return (__m512i)__builtin_ia32_undef512();
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_broadcastd_epi32 (__m128i __A)		_mm512_broadcastd_epi32 (__m128i __A)
{		{
return (__m512i)__builtin_shufflevector((__v4si) __A, (__v4si) __A,		return (__m512i)__builtin_shufflevector((__v4si) __A, (__v4si) __A,
0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0);		0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_broadcastd_epi32 (__m512i __O, __mmask16 __M, __m128i __A)		_mm512_mask_broadcastd_epi32 (__m512i __O, __mmask16 __M, __m128i __A)
{		{
return (__m512i)__builtin_ia32_selectd_512(__M,		return (__m512i)__builtin_ia32_selectd_512(__M,
(__v16si) _mm512_broadcastd_epi32(__A),		(__v16si) _mm512_broadcastd_epi32(__A),
(__v16si) __O);		(__v16si) __O);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_broadcastd_epi32 (__mmask16 __M, __m128i __A)		_mm512_maskz_broadcastd_epi32 (__mmask16 __M, __m128i __A)
{		{
return (__m512i)__builtin_ia32_selectd_512(__M,		return (__m512i)__builtin_ia32_selectd_512(__M,
(__v16si) _mm512_broadcastd_epi32(__A),		(__v16si) _mm512_broadcastd_epi32(__A),
(__v16si) _mm512_setzero_si512());		(__v16si) _mm512_setzero_si512());
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_broadcastq_epi64 (__m128i __A)		_mm512_broadcastq_epi64 (__m128i __A)
{		{
return (__m512i)__builtin_shufflevector((__v2di) __A, (__v2di) __A,		return (__m512i)__builtin_shufflevector((__v2di) __A, (__v2di) __A,
0, 0, 0, 0, 0, 0, 0, 0);		0, 0, 0, 0, 0, 0, 0, 0);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_broadcastq_epi64 (__m512i __O, __mmask8 __M, __m128i __A)		_mm512_mask_broadcastq_epi64 (__m512i __O, __mmask8 __M, __m128i __A)
{		{
return (__m512i)__builtin_ia32_selectq_512(__M,		return (__m512i)__builtin_ia32_selectq_512(__M,
(__v8di) _mm512_broadcastq_epi64(__A),		(__v8di) _mm512_broadcastq_epi64(__A),
(__v8di) __O);		(__v8di) __O);

}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_broadcastq_epi64 (__mmask8 __M, __m128i __A)		_mm512_maskz_broadcastq_epi64 (__mmask8 __M, __m128i __A)
{		{
return (__m512i)__builtin_ia32_selectq_512(__M,		return (__m512i)__builtin_ia32_selectq_512(__M,
(__v8di) _mm512_broadcastq_epi64(__A),		(__v8di) _mm512_broadcastq_epi64(__A),
(__v8di) _mm512_setzero_si512());		(__v8di) _mm512_setzero_si512());
}		}


static __inline __m512 __DEFAULT_FN_ATTRS		static __inline __m512 __DEFAULT_FN_ATTRS512
_mm512_setzero_ps(void)		_mm512_setzero_ps(void)
{		{
return __extension__ (__m512){ 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0,		return __extension__ (__m512){ 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0,
0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0 };		0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0 };
}		}

#define _mm512_setzero _mm512_setzero_ps		#define _mm512_setzero _mm512_setzero_ps

static __inline __m512d __DEFAULT_FN_ATTRS		static __inline __m512d __DEFAULT_FN_ATTRS512
_mm512_setzero_pd(void)		_mm512_setzero_pd(void)
{		{
return __extension__ (__m512d){ 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0 };		return __extension__ (__m512d){ 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0 };
}		}

static __inline __m512 __DEFAULT_FN_ATTRS		static __inline __m512 __DEFAULT_FN_ATTRS512
_mm512_set1_ps(float __w)		_mm512_set1_ps(float __w)
{		{
return __extension__ (__m512){ __w, __w, __w, __w, __w, __w, __w, __w,		return __extension__ (__m512){ __w, __w, __w, __w, __w, __w, __w, __w,
__w, __w, __w, __w, __w, __w, __w, __w };		__w, __w, __w, __w, __w, __w, __w, __w };
}		}

static __inline __m512d __DEFAULT_FN_ATTRS		static __inline __m512d __DEFAULT_FN_ATTRS512
_mm512_set1_pd(double __w)		_mm512_set1_pd(double __w)
{		{
return __extension__ (__m512d){ __w, __w, __w, __w, __w, __w, __w, __w };		return __extension__ (__m512d){ __w, __w, __w, __w, __w, __w, __w, __w };
}		}

static __inline __m512i __DEFAULT_FN_ATTRS		static __inline __m512i __DEFAULT_FN_ATTRS512
_mm512_set1_epi8(char __w)		_mm512_set1_epi8(char __w)
{		{
return __extension__ (__m512i)(__v64qi){		return __extension__ (__m512i)(__v64qi){
__w, __w, __w, __w, __w, __w, __w, __w,		__w, __w, __w, __w, __w, __w, __w, __w,
__w, __w, __w, __w, __w, __w, __w, __w,		__w, __w, __w, __w, __w, __w, __w, __w,
__w, __w, __w, __w, __w, __w, __w, __w,		__w, __w, __w, __w, __w, __w, __w, __w,
__w, __w, __w, __w, __w, __w, __w, __w,		__w, __w, __w, __w, __w, __w, __w, __w,
__w, __w, __w, __w, __w, __w, __w, __w,		__w, __w, __w, __w, __w, __w, __w, __w,
__w, __w, __w, __w, __w, __w, __w, __w,		__w, __w, __w, __w, __w, __w, __w, __w,
__w, __w, __w, __w, __w, __w, __w, __w,		__w, __w, __w, __w, __w, __w, __w, __w,
__w, __w, __w, __w, __w, __w, __w, __w };		__w, __w, __w, __w, __w, __w, __w, __w };
}		}

static __inline __m512i __DEFAULT_FN_ATTRS		static __inline __m512i __DEFAULT_FN_ATTRS512
_mm512_set1_epi16(short __w)		_mm512_set1_epi16(short __w)
{		{
return __extension__ (__m512i)(__v32hi){		return __extension__ (__m512i)(__v32hi){
__w, __w, __w, __w, __w, __w, __w, __w,		__w, __w, __w, __w, __w, __w, __w, __w,
__w, __w, __w, __w, __w, __w, __w, __w,		__w, __w, __w, __w, __w, __w, __w, __w,
__w, __w, __w, __w, __w, __w, __w, __w,		__w, __w, __w, __w, __w, __w, __w, __w,
__w, __w, __w, __w, __w, __w, __w, __w };		__w, __w, __w, __w, __w, __w, __w, __w };
}		}

static __inline __m512i __DEFAULT_FN_ATTRS		static __inline __m512i __DEFAULT_FN_ATTRS512
_mm512_set1_epi32(int __s)		_mm512_set1_epi32(int __s)
{		{
return __extension__ (__m512i)(__v16si){		return __extension__ (__m512i)(__v16si){
__s, __s, __s, __s, __s, __s, __s, __s,		__s, __s, __s, __s, __s, __s, __s, __s,
__s, __s, __s, __s, __s, __s, __s, __s };		__s, __s, __s, __s, __s, __s, __s, __s };
}		}

static __inline __m512i __DEFAULT_FN_ATTRS		static __inline __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_set1_epi32(__mmask16 __M, int __A)		_mm512_maskz_set1_epi32(__mmask16 __M, int __A)
{		{
return (__m512i)__builtin_ia32_selectd_512(__M,		return (__m512i)__builtin_ia32_selectd_512(__M,
(__v16si)_mm512_set1_epi32(__A),		(__v16si)_mm512_set1_epi32(__A),
(__v16si)_mm512_setzero_si512());		(__v16si)_mm512_setzero_si512());
}		}

static __inline __m512i __DEFAULT_FN_ATTRS		static __inline __m512i __DEFAULT_FN_ATTRS512
_mm512_set1_epi64(long long __d)		_mm512_set1_epi64(long long __d)
{		{
return __extension__(__m512i)(__v8di){ __d, __d, __d, __d, __d, __d, __d, __d };		return __extension__(__m512i)(__v8di){ __d, __d, __d, __d, __d, __d, __d, __d };
}		}

static __inline __m512i __DEFAULT_FN_ATTRS		static __inline __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_set1_epi64(__mmask8 __M, long long __A)		_mm512_maskz_set1_epi64(__mmask8 __M, long long __A)
{		{
return (__m512i)__builtin_ia32_selectq_512(__M,		return (__m512i)__builtin_ia32_selectq_512(__M,
(__v8di)_mm512_set1_epi64(__A),		(__v8di)_mm512_set1_epi64(__A),
(__v8di)_mm512_setzero_si512());		(__v8di)_mm512_setzero_si512());
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_broadcastss_ps(__m128 __A)		_mm512_broadcastss_ps(__m128 __A)
{		{
return (__m512)__builtin_shufflevector((__v4sf) __A, (__v4sf) __A,		return (__m512)__builtin_shufflevector((__v4sf) __A, (__v4sf) __A,
0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0);		0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0);
}		}

static __inline __m512i __DEFAULT_FN_ATTRS		static __inline __m512i __DEFAULT_FN_ATTRS512
_mm512_set4_epi32 (int __A, int __B, int __C, int __D)		_mm512_set4_epi32 (int __A, int __B, int __C, int __D)
{		{
return __extension__ (__m512i)(__v16si)		return __extension__ (__m512i)(__v16si)
{ __D, __C, __B, __A, __D, __C, __B, __A,		{ __D, __C, __B, __A, __D, __C, __B, __A,
__D, __C, __B, __A, __D, __C, __B, __A };		__D, __C, __B, __A, __D, __C, __B, __A };
}		}

static __inline __m512i __DEFAULT_FN_ATTRS		static __inline __m512i __DEFAULT_FN_ATTRS512
_mm512_set4_epi64 (long long __A, long long __B, long long __C,		_mm512_set4_epi64 (long long __A, long long __B, long long __C,
long long __D)		long long __D)
{		{
return __extension__ (__m512i) (__v8di)		return __extension__ (__m512i) (__v8di)
{ __D, __C, __B, __A, __D, __C, __B, __A };		{ __D, __C, __B, __A, __D, __C, __B, __A };
}		}

static __inline __m512d __DEFAULT_FN_ATTRS		static __inline __m512d __DEFAULT_FN_ATTRS512
_mm512_set4_pd (double __A, double __B, double __C, double __D)		_mm512_set4_pd (double __A, double __B, double __C, double __D)
{		{
return __extension__ (__m512d)		return __extension__ (__m512d)
{ __D, __C, __B, __A, __D, __C, __B, __A };		{ __D, __C, __B, __A, __D, __C, __B, __A };
}		}

static __inline __m512 __DEFAULT_FN_ATTRS		static __inline __m512 __DEFAULT_FN_ATTRS512
_mm512_set4_ps (float __A, float __B, float __C, float __D)		_mm512_set4_ps (float __A, float __B, float __C, float __D)
{		{
return __extension__ (__m512)		return __extension__ (__m512)
{ __D, __C, __B, __A, __D, __C, __B, __A,		{ __D, __C, __B, __A, __D, __C, __B, __A,
__D, __C, __B, __A, __D, __C, __B, __A };		__D, __C, __B, __A, __D, __C, __B, __A };
}		}

#define _mm512_setr4_epi32(e0,e1,e2,e3) \		#define _mm512_setr4_epi32(e0,e1,e2,e3) \
_mm512_set4_epi32((e3),(e2),(e1),(e0))		_mm512_set4_epi32((e3),(e2),(e1),(e0))

#define _mm512_setr4_epi64(e0,e1,e2,e3) \		#define _mm512_setr4_epi64(e0,e1,e2,e3) \
_mm512_set4_epi64((e3),(e2),(e1),(e0))		_mm512_set4_epi64((e3),(e2),(e1),(e0))

#define _mm512_setr4_pd(e0,e1,e2,e3) \		#define _mm512_setr4_pd(e0,e1,e2,e3) \
_mm512_set4_pd((e3),(e2),(e1),(e0))		_mm512_set4_pd((e3),(e2),(e1),(e0))

#define _mm512_setr4_ps(e0,e1,e2,e3) \		#define _mm512_setr4_ps(e0,e1,e2,e3) \
_mm512_set4_ps((e3),(e2),(e1),(e0))		_mm512_set4_ps((e3),(e2),(e1),(e0))

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_broadcastsd_pd(__m128d __A)		_mm512_broadcastsd_pd(__m128d __A)
{		{
return (__m512d)__builtin_shufflevector((__v2df) __A, (__v2df) __A,		return (__m512d)__builtin_shufflevector((__v2df) __A, (__v2df) __A,
0, 0, 0, 0, 0, 0, 0, 0);		0, 0, 0, 0, 0, 0, 0, 0);
}		}

/* Cast between vector types */		/* Cast between vector types */

static __inline __m512d __DEFAULT_FN_ATTRS		static __inline __m512d __DEFAULT_FN_ATTRS512
_mm512_castpd256_pd512(__m256d __a)		_mm512_castpd256_pd512(__m256d __a)
{		{
return __builtin_shufflevector(__a, __a, 0, 1, 2, 3, -1, -1, -1, -1);		return __builtin_shufflevector(__a, __a, 0, 1, 2, 3, -1, -1, -1, -1);
}		}

static __inline __m512 __DEFAULT_FN_ATTRS		static __inline __m512 __DEFAULT_FN_ATTRS512
_mm512_castps256_ps512(__m256 __a)		_mm512_castps256_ps512(__m256 __a)
{		{
return __builtin_shufflevector(__a, __a, 0, 1, 2, 3, 4, 5, 6, 7,		return __builtin_shufflevector(__a, __a, 0, 1, 2, 3, 4, 5, 6, 7,
-1, -1, -1, -1, -1, -1, -1, -1);		-1, -1, -1, -1, -1, -1, -1, -1);
}		}

static __inline __m128d __DEFAULT_FN_ATTRS		static __inline __m128d __DEFAULT_FN_ATTRS512
_mm512_castpd512_pd128(__m512d __a)		_mm512_castpd512_pd128(__m512d __a)
{		{
return __builtin_shufflevector(__a, __a, 0, 1);		return __builtin_shufflevector(__a, __a, 0, 1);
}		}

static __inline __m256d __DEFAULT_FN_ATTRS		static __inline __m256d __DEFAULT_FN_ATTRS512
_mm512_castpd512_pd256 (__m512d __A)		_mm512_castpd512_pd256 (__m512d __A)
{		{
return __builtin_shufflevector(__A, __A, 0, 1, 2, 3);		return __builtin_shufflevector(__A, __A, 0, 1, 2, 3);
}		}

static __inline __m128 __DEFAULT_FN_ATTRS		static __inline __m128 __DEFAULT_FN_ATTRS512
_mm512_castps512_ps128(__m512 __a)		_mm512_castps512_ps128(__m512 __a)
{		{
return __builtin_shufflevector(__a, __a, 0, 1, 2, 3);		return __builtin_shufflevector(__a, __a, 0, 1, 2, 3);
}		}

static __inline __m256 __DEFAULT_FN_ATTRS		static __inline __m256 __DEFAULT_FN_ATTRS512
_mm512_castps512_ps256 (__m512 __A)		_mm512_castps512_ps256 (__m512 __A)
{		{
return __builtin_shufflevector(__A, __A, 0, 1, 2, 3, 4, 5, 6, 7);		return __builtin_shufflevector(__A, __A, 0, 1, 2, 3, 4, 5, 6, 7);
}		}

static __inline __m512 __DEFAULT_FN_ATTRS		static __inline __m512 __DEFAULT_FN_ATTRS512
_mm512_castpd_ps (__m512d __A)		_mm512_castpd_ps (__m512d __A)
{		{
return (__m512) (__A);		return (__m512) (__A);
}		}

static __inline __m512i __DEFAULT_FN_ATTRS		static __inline __m512i __DEFAULT_FN_ATTRS512
_mm512_castpd_si512 (__m512d __A)		_mm512_castpd_si512 (__m512d __A)
{		{
return (__m512i) (__A);		return (__m512i) (__A);
}		}

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_castpd128_pd512 (__m128d __A)		_mm512_castpd128_pd512 (__m128d __A)
{		{
return __builtin_shufflevector( __A, __A, 0, 1, -1, -1, -1, -1, -1, -1);		return __builtin_shufflevector( __A, __A, 0, 1, -1, -1, -1, -1, -1, -1);
}		}

static __inline __m512d __DEFAULT_FN_ATTRS		static __inline __m512d __DEFAULT_FN_ATTRS512
_mm512_castps_pd (__m512 __A)		_mm512_castps_pd (__m512 __A)
{		{
return (__m512d) (__A);		return (__m512d) (__A);
}		}

static __inline __m512i __DEFAULT_FN_ATTRS		static __inline __m512i __DEFAULT_FN_ATTRS512
_mm512_castps_si512 (__m512 __A)		_mm512_castps_si512 (__m512 __A)
{		{
return (__m512i) (__A);		return (__m512i) (__A);
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_castps128_ps512 (__m128 __A)		_mm512_castps128_ps512 (__m128 __A)
{		{
return __builtin_shufflevector( __A, __A, 0, 1, 2, 3, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1);		return __builtin_shufflevector( __A, __A, 0, 1, 2, 3, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_castsi128_si512 (__m128i __A)		_mm512_castsi128_si512 (__m128i __A)
{		{
return __builtin_shufflevector( __A, __A, 0, 1, -1, -1, -1, -1, -1, -1);		return __builtin_shufflevector( __A, __A, 0, 1, -1, -1, -1, -1, -1, -1);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_castsi256_si512 (__m256i __A)		_mm512_castsi256_si512 (__m256i __A)
{		{
return __builtin_shufflevector( __A, __A, 0, 1, 2, 3, -1, -1, -1, -1);		return __builtin_shufflevector( __A, __A, 0, 1, 2, 3, -1, -1, -1, -1);
}		}

static __inline __m512 __DEFAULT_FN_ATTRS		static __inline __m512 __DEFAULT_FN_ATTRS512
_mm512_castsi512_ps (__m512i __A)		_mm512_castsi512_ps (__m512i __A)
{		{
return (__m512) (__A);		return (__m512) (__A);
}		}

static __inline __m512d __DEFAULT_FN_ATTRS		static __inline __m512d __DEFAULT_FN_ATTRS512
_mm512_castsi512_pd (__m512i __A)		_mm512_castsi512_pd (__m512i __A)
{		{
return (__m512d) (__A);		return (__m512d) (__A);
}		}

static __inline __m128i __DEFAULT_FN_ATTRS		static __inline __m128i __DEFAULT_FN_ATTRS512
_mm512_castsi512_si128 (__m512i __A)		_mm512_castsi512_si128 (__m512i __A)
{		{
return (__m128i)__builtin_shufflevector(__A, __A , 0, 1);		return (__m128i)__builtin_shufflevector(__A, __A , 0, 1);
}		}

static __inline __m256i __DEFAULT_FN_ATTRS		static __inline __m256i __DEFAULT_FN_ATTRS512
_mm512_castsi512_si256 (__m512i __A)		_mm512_castsi512_si256 (__m512i __A)
{		{
return (__m256i)__builtin_shufflevector(__A, __A , 0, 1, 2, 3);		return (__m256i)__builtin_shufflevector(__A, __A , 0, 1, 2, 3);
}		}

static __inline__ __mmask16 __DEFAULT_FN_ATTRS		static __inline__ __mmask16 __DEFAULT_FN_ATTRS512
_mm512_int2mask(int __a)		_mm512_int2mask(int __a)
{		{
return (__mmask16)__a;		return (__mmask16)__a;
}		}

static __inline__ int __DEFAULT_FN_ATTRS		static __inline__ int __DEFAULT_FN_ATTRS512
_mm512_mask2int(__mmask16 __a)		_mm512_mask2int(__mmask16 __a)
{		{
return (int)__a;		return (int)__a;
}		}

/// Constructs a 512-bit floating-point vector of [8 x double] from a		/// Constructs a 512-bit floating-point vector of [8 x double] from a
/// 128-bit floating-point vector of [2 x double]. The lower 128 bits		/// 128-bit floating-point vector of [2 x double]. The lower 128 bits
/// contain the value of the source vector. The upper 384 bits are set		/// contain the value of the source vector. The upper 384 bits are set
/// to zero.		/// to zero.
///		///
/// \headerfile <x86intrin.h>		/// \headerfile <x86intrin.h>
///		///
/// This intrinsic has no corresponding instruction.		/// This intrinsic has no corresponding instruction.
///		///
/// \param __a		/// \param __a
/// A 128-bit vector of [2 x double].		/// A 128-bit vector of [2 x double].
/// \returns A 512-bit floating-point vector of [8 x double]. The lower 128 bits		/// \returns A 512-bit floating-point vector of [8 x double]. The lower 128 bits
/// contain the value of the parameter. The upper 384 bits are set to zero.		/// contain the value of the parameter. The upper 384 bits are set to zero.
static __inline __m512d __DEFAULT_FN_ATTRS		static __inline __m512d __DEFAULT_FN_ATTRS512
_mm512_zextpd128_pd512(__m128d __a)		_mm512_zextpd128_pd512(__m128d __a)
{		{
return __builtin_shufflevector((__v2df)__a, (__v2df)_mm_setzero_pd(), 0, 1, 2, 3, 2, 3, 2, 3);		return __builtin_shufflevector((__v2df)__a, (__v2df)_mm_setzero_pd(), 0, 1, 2, 3, 2, 3, 2, 3);
}		}

/// Constructs a 512-bit floating-point vector of [8 x double] from a		/// Constructs a 512-bit floating-point vector of [8 x double] from a
/// 256-bit floating-point vector of [4 x double]. The lower 256 bits		/// 256-bit floating-point vector of [4 x double]. The lower 256 bits
/// contain the value of the source vector. The upper 256 bits are set		/// contain the value of the source vector. The upper 256 bits are set
/// to zero.		/// to zero.
///		///
/// \headerfile <x86intrin.h>		/// \headerfile <x86intrin.h>
///		///
/// This intrinsic has no corresponding instruction.		/// This intrinsic has no corresponding instruction.
///		///
/// \param __a		/// \param __a
/// A 256-bit vector of [4 x double].		/// A 256-bit vector of [4 x double].
/// \returns A 512-bit floating-point vector of [8 x double]. The lower 256 bits		/// \returns A 512-bit floating-point vector of [8 x double]. The lower 256 bits
/// contain the value of the parameter. The upper 256 bits are set to zero.		/// contain the value of the parameter. The upper 256 bits are set to zero.
static __inline __m512d __DEFAULT_FN_ATTRS		static __inline __m512d __DEFAULT_FN_ATTRS512
_mm512_zextpd256_pd512(__m256d __a)		_mm512_zextpd256_pd512(__m256d __a)
{		{
return __builtin_shufflevector((__v4df)__a, (__v4df)_mm256_setzero_pd(), 0, 1, 2, 3, 4, 5, 6, 7);		return __builtin_shufflevector((__v4df)__a, (__v4df)_mm256_setzero_pd(), 0, 1, 2, 3, 4, 5, 6, 7);
}		}

/// Constructs a 512-bit floating-point vector of [16 x float] from a		/// Constructs a 512-bit floating-point vector of [16 x float] from a
/// 128-bit floating-point vector of [4 x float]. The lower 128 bits contain		/// 128-bit floating-point vector of [4 x float]. The lower 128 bits contain
/// the value of the source vector. The upper 384 bits are set to zero.		/// the value of the source vector. The upper 384 bits are set to zero.
///		///
/// \headerfile <x86intrin.h>		/// \headerfile <x86intrin.h>
///		///
/// This intrinsic has no corresponding instruction.		/// This intrinsic has no corresponding instruction.
///		///
/// \param __a		/// \param __a
/// A 128-bit vector of [4 x float].		/// A 128-bit vector of [4 x float].
/// \returns A 512-bit floating-point vector of [16 x float]. The lower 128 bits		/// \returns A 512-bit floating-point vector of [16 x float]. The lower 128 bits
/// contain the value of the parameter. The upper 384 bits are set to zero.		/// contain the value of the parameter. The upper 384 bits are set to zero.
static __inline __m512 __DEFAULT_FN_ATTRS		static __inline __m512 __DEFAULT_FN_ATTRS512
_mm512_zextps128_ps512(__m128 __a)		_mm512_zextps128_ps512(__m128 __a)
{		{
return __builtin_shufflevector((__v4sf)__a, (__v4sf)_mm_setzero_ps(), 0, 1, 2, 3, 4, 5, 6, 7, 4, 5, 6, 7, 4, 5, 6, 7);		return __builtin_shufflevector((__v4sf)__a, (__v4sf)_mm_setzero_ps(), 0, 1, 2, 3, 4, 5, 6, 7, 4, 5, 6, 7, 4, 5, 6, 7);
}		}

/// Constructs a 512-bit floating-point vector of [16 x float] from a		/// Constructs a 512-bit floating-point vector of [16 x float] from a
/// 256-bit floating-point vector of [8 x float]. The lower 256 bits contain		/// 256-bit floating-point vector of [8 x float]. The lower 256 bits contain
/// the value of the source vector. The upper 256 bits are set to zero.		/// the value of the source vector. The upper 256 bits are set to zero.
///		///
/// \headerfile <x86intrin.h>		/// \headerfile <x86intrin.h>
///		///
/// This intrinsic has no corresponding instruction.		/// This intrinsic has no corresponding instruction.
///		///
/// \param __a		/// \param __a
/// A 256-bit vector of [8 x float].		/// A 256-bit vector of [8 x float].
/// \returns A 512-bit floating-point vector of [16 x float]. The lower 256 bits		/// \returns A 512-bit floating-point vector of [16 x float]. The lower 256 bits
/// contain the value of the parameter. The upper 256 bits are set to zero.		/// contain the value of the parameter. The upper 256 bits are set to zero.
static __inline __m512 __DEFAULT_FN_ATTRS		static __inline __m512 __DEFAULT_FN_ATTRS512
_mm512_zextps256_ps512(__m256 __a)		_mm512_zextps256_ps512(__m256 __a)
{		{
return __builtin_shufflevector((__v8sf)__a, (__v8sf)_mm256_setzero_ps(), 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15);		return __builtin_shufflevector((__v8sf)__a, (__v8sf)_mm256_setzero_ps(), 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15);
}		}

/// Constructs a 512-bit integer vector from a 128-bit integer vector.		/// Constructs a 512-bit integer vector from a 128-bit integer vector.
/// The lower 128 bits contain the value of the source vector. The upper		/// The lower 128 bits contain the value of the source vector. The upper
/// 384 bits are set to zero.		/// 384 bits are set to zero.
///		///
/// \headerfile <x86intrin.h>		/// \headerfile <x86intrin.h>
///		///
/// This intrinsic has no corresponding instruction.		/// This intrinsic has no corresponding instruction.
///		///
/// \param __a		/// \param __a
/// A 128-bit integer vector.		/// A 128-bit integer vector.
/// \returns A 512-bit integer vector. The lower 128 bits contain the value of		/// \returns A 512-bit integer vector. The lower 128 bits contain the value of
/// the parameter. The upper 384 bits are set to zero.		/// the parameter. The upper 384 bits are set to zero.
static __inline __m512i __DEFAULT_FN_ATTRS		static __inline __m512i __DEFAULT_FN_ATTRS512
_mm512_zextsi128_si512(__m128i __a)		_mm512_zextsi128_si512(__m128i __a)
{		{
return __builtin_shufflevector((__v2di)__a, (__v2di)_mm_setzero_si128(), 0, 1, 2, 3, 2, 3, 2, 3);		return __builtin_shufflevector((__v2di)__a, (__v2di)_mm_setzero_si128(), 0, 1, 2, 3, 2, 3, 2, 3);
}		}

/// Constructs a 512-bit integer vector from a 256-bit integer vector.		/// Constructs a 512-bit integer vector from a 256-bit integer vector.
/// The lower 256 bits contain the value of the source vector. The upper		/// The lower 256 bits contain the value of the source vector. The upper
/// 256 bits are set to zero.		/// 256 bits are set to zero.
///		///
/// \headerfile <x86intrin.h>		/// \headerfile <x86intrin.h>
///		///
/// This intrinsic has no corresponding instruction.		/// This intrinsic has no corresponding instruction.
///		///
/// \param __a		/// \param __a
/// A 256-bit integer vector.		/// A 256-bit integer vector.
/// \returns A 512-bit integer vector. The lower 256 bits contain the value of		/// \returns A 512-bit integer vector. The lower 256 bits contain the value of
/// the parameter. The upper 256 bits are set to zero.		/// the parameter. The upper 256 bits are set to zero.
static __inline __m512i __DEFAULT_FN_ATTRS		static __inline __m512i __DEFAULT_FN_ATTRS512
_mm512_zextsi256_si512(__m256i __a)		_mm512_zextsi256_si512(__m256i __a)
{		{
return __builtin_shufflevector((__v4di)__a, (__v4di)_mm256_setzero_si256(), 0, 1, 2, 3, 4, 5, 6, 7);		return __builtin_shufflevector((__v4di)__a, (__v4di)_mm256_setzero_si256(), 0, 1, 2, 3, 4, 5, 6, 7);
}		}

/* Bitwise operators */		/* Bitwise operators */
static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_and_epi32(__m512i __a, __m512i __b)		_mm512_and_epi32(__m512i __a, __m512i __b)
{		{
return (__m512i)((__v16su)__a & (__v16su)__b);		return (__m512i)((__v16su)__a & (__v16su)__b);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_and_epi32(__m512i __src, __mmask16 __k, __m512i __a, __m512i __b)		_mm512_mask_and_epi32(__m512i __src, __mmask16 __k, __m512i __a, __m512i __b)
{		{
return (__m512i)__builtin_ia32_selectd_512((__mmask16)__k,		return (__m512i)__builtin_ia32_selectd_512((__mmask16)__k,
(__v16si) _mm512_and_epi32(__a, __b),		(__v16si) _mm512_and_epi32(__a, __b),
(__v16si) __src);		(__v16si) __src);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_and_epi32(__mmask16 __k, __m512i __a, __m512i __b)		_mm512_maskz_and_epi32(__mmask16 __k, __m512i __a, __m512i __b)
{		{
return (__m512i) _mm512_mask_and_epi32(_mm512_setzero_si512 (),		return (__m512i) _mm512_mask_and_epi32(_mm512_setzero_si512 (),
__k, __a, __b);		__k, __a, __b);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_and_epi64(__m512i __a, __m512i __b)		_mm512_and_epi64(__m512i __a, __m512i __b)
{		{
return (__m512i)((__v8du)__a & (__v8du)__b);		return (__m512i)((__v8du)__a & (__v8du)__b);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_and_epi64(__m512i __src, __mmask8 __k, __m512i __a, __m512i __b)		_mm512_mask_and_epi64(__m512i __src, __mmask8 __k, __m512i __a, __m512i __b)
{		{
return (__m512i) __builtin_ia32_selectq_512 ((__mmask8) __k,		return (__m512i) __builtin_ia32_selectq_512 ((__mmask8) __k,
(__v8di) _mm512_and_epi64(__a, __b),		(__v8di) _mm512_and_epi64(__a, __b),
(__v8di) __src);		(__v8di) __src);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_and_epi64(__mmask8 __k, __m512i __a, __m512i __b)		_mm512_maskz_and_epi64(__mmask8 __k, __m512i __a, __m512i __b)
{		{
return (__m512i) _mm512_mask_and_epi64(_mm512_setzero_si512 (),		return (__m512i) _mm512_mask_and_epi64(_mm512_setzero_si512 (),
__k, __a, __b);		__k, __a, __b);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_andnot_si512 (__m512i __A, __m512i __B)		_mm512_andnot_si512 (__m512i __A, __m512i __B)
{		{
return (__m512i)(~(__v8du)__A & (__v8du)__B);		return (__m512i)(~(__v8du)__A & (__v8du)__B);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_andnot_epi32 (__m512i __A, __m512i __B)		_mm512_andnot_epi32 (__m512i __A, __m512i __B)
{		{
return (__m512i)(~(__v16su)__A & (__v16su)__B);		return (__m512i)(~(__v16su)__A & (__v16su)__B);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_andnot_epi32(__m512i __W, __mmask16 __U, __m512i __A, __m512i __B)		_mm512_mask_andnot_epi32(__m512i __W, __mmask16 __U, __m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_selectd_512((__mmask16)__U,		return (__m512i)__builtin_ia32_selectd_512((__mmask16)__U,
(__v16si)_mm512_andnot_epi32(__A, __B),		(__v16si)_mm512_andnot_epi32(__A, __B),
(__v16si)__W);		(__v16si)__W);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_andnot_epi32(__mmask16 __U, __m512i __A, __m512i __B)		_mm512_maskz_andnot_epi32(__mmask16 __U, __m512i __A, __m512i __B)
{		{
return (__m512i)_mm512_mask_andnot_epi32(_mm512_setzero_si512(),		return (__m512i)_mm512_mask_andnot_epi32(_mm512_setzero_si512(),
__U, __A, __B);		__U, __A, __B);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_andnot_epi64(__m512i __A, __m512i __B)		_mm512_andnot_epi64(__m512i __A, __m512i __B)
{		{
return (__m512i)(~(__v8du)__A & (__v8du)__B);		return (__m512i)(~(__v8du)__A & (__v8du)__B);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_andnot_epi64(__m512i __W, __mmask8 __U, __m512i __A, __m512i __B)		_mm512_mask_andnot_epi64(__m512i __W, __mmask8 __U, __m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_selectq_512((__mmask8)__U,		return (__m512i)__builtin_ia32_selectq_512((__mmask8)__U,
(__v8di)_mm512_andnot_epi64(__A, __B),		(__v8di)_mm512_andnot_epi64(__A, __B),
(__v8di)__W);		(__v8di)__W);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_andnot_epi64(__mmask8 __U, __m512i __A, __m512i __B)		_mm512_maskz_andnot_epi64(__mmask8 __U, __m512i __A, __m512i __B)
{		{
return (__m512i)_mm512_mask_andnot_epi64(_mm512_setzero_si512(),		return (__m512i)_mm512_mask_andnot_epi64(_mm512_setzero_si512(),
__U, __A, __B);		__U, __A, __B);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_or_epi32(__m512i __a, __m512i __b)		_mm512_or_epi32(__m512i __a, __m512i __b)
{		{
return (__m512i)((__v16su)__a \| (__v16su)__b);		return (__m512i)((__v16su)__a \| (__v16su)__b);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_or_epi32(__m512i __src, __mmask16 __k, __m512i __a, __m512i __b)		_mm512_mask_or_epi32(__m512i __src, __mmask16 __k, __m512i __a, __m512i __b)
{		{
return (__m512i)__builtin_ia32_selectd_512((__mmask16)__k,		return (__m512i)__builtin_ia32_selectd_512((__mmask16)__k,
(__v16si)_mm512_or_epi32(__a, __b),		(__v16si)_mm512_or_epi32(__a, __b),
(__v16si)__src);		(__v16si)__src);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_or_epi32(__mmask16 __k, __m512i __a, __m512i __b)		_mm512_maskz_or_epi32(__mmask16 __k, __m512i __a, __m512i __b)
{		{
return (__m512i)_mm512_mask_or_epi32(_mm512_setzero_si512(), __k, __a, __b);		return (__m512i)_mm512_mask_or_epi32(_mm512_setzero_si512(), __k, __a, __b);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_or_epi64(__m512i __a, __m512i __b)		_mm512_or_epi64(__m512i __a, __m512i __b)
{		{
return (__m512i)((__v8du)__a \| (__v8du)__b);		return (__m512i)((__v8du)__a \| (__v8du)__b);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_or_epi64(__m512i __src, __mmask8 __k, __m512i __a, __m512i __b)		_mm512_mask_or_epi64(__m512i __src, __mmask8 __k, __m512i __a, __m512i __b)
{		{
return (__m512i)__builtin_ia32_selectq_512((__mmask8)__k,		return (__m512i)__builtin_ia32_selectq_512((__mmask8)__k,
(__v8di)_mm512_or_epi64(__a, __b),		(__v8di)_mm512_or_epi64(__a, __b),
(__v8di)__src);		(__v8di)__src);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_or_epi64(__mmask8 __k, __m512i __a, __m512i __b)		_mm512_maskz_or_epi64(__mmask8 __k, __m512i __a, __m512i __b)
{		{
return (__m512i)_mm512_mask_or_epi64(_mm512_setzero_si512(), __k, __a, __b);		return (__m512i)_mm512_mask_or_epi64(_mm512_setzero_si512(), __k, __a, __b);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_xor_epi32(__m512i __a, __m512i __b)		_mm512_xor_epi32(__m512i __a, __m512i __b)
{		{
return (__m512i)((__v16su)__a ^ (__v16su)__b);		return (__m512i)((__v16su)__a ^ (__v16su)__b);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_xor_epi32(__m512i __src, __mmask16 __k, __m512i __a, __m512i __b)		_mm512_mask_xor_epi32(__m512i __src, __mmask16 __k, __m512i __a, __m512i __b)
{		{
return (__m512i)__builtin_ia32_selectd_512((__mmask16)__k,		return (__m512i)__builtin_ia32_selectd_512((__mmask16)__k,
(__v16si)_mm512_xor_epi32(__a, __b),		(__v16si)_mm512_xor_epi32(__a, __b),
(__v16si)__src);		(__v16si)__src);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_xor_epi32(__mmask16 __k, __m512i __a, __m512i __b)		_mm512_maskz_xor_epi32(__mmask16 __k, __m512i __a, __m512i __b)
{		{
return (__m512i)_mm512_mask_xor_epi32(_mm512_setzero_si512(), __k, __a, __b);		return (__m512i)_mm512_mask_xor_epi32(_mm512_setzero_si512(), __k, __a, __b);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_xor_epi64(__m512i __a, __m512i __b)		_mm512_xor_epi64(__m512i __a, __m512i __b)
{		{
return (__m512i)((__v8du)__a ^ (__v8du)__b);		return (__m512i)((__v8du)__a ^ (__v8du)__b);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_xor_epi64(__m512i __src, __mmask8 __k, __m512i __a, __m512i __b)		_mm512_mask_xor_epi64(__m512i __src, __mmask8 __k, __m512i __a, __m512i __b)
{		{
return (__m512i)__builtin_ia32_selectq_512((__mmask8)__k,		return (__m512i)__builtin_ia32_selectq_512((__mmask8)__k,
(__v8di)_mm512_xor_epi64(__a, __b),		(__v8di)_mm512_xor_epi64(__a, __b),
(__v8di)__src);		(__v8di)__src);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_xor_epi64(__mmask8 __k, __m512i __a, __m512i __b)		_mm512_maskz_xor_epi64(__mmask8 __k, __m512i __a, __m512i __b)
{		{
return (__m512i)_mm512_mask_xor_epi64(_mm512_setzero_si512(), __k, __a, __b);		return (__m512i)_mm512_mask_xor_epi64(_mm512_setzero_si512(), __k, __a, __b);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_and_si512(__m512i __a, __m512i __b)		_mm512_and_si512(__m512i __a, __m512i __b)
{		{
return (__m512i)((__v8du)__a & (__v8du)__b);		return (__m512i)((__v8du)__a & (__v8du)__b);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_or_si512(__m512i __a, __m512i __b)		_mm512_or_si512(__m512i __a, __m512i __b)
{		{
return (__m512i)((__v8du)__a \| (__v8du)__b);		return (__m512i)((__v8du)__a \| (__v8du)__b);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_xor_si512(__m512i __a, __m512i __b)		_mm512_xor_si512(__m512i __a, __m512i __b)
{		{
return (__m512i)((__v8du)__a ^ (__v8du)__b);		return (__m512i)((__v8du)__a ^ (__v8du)__b);
}		}

/* Arithmetic */		/* Arithmetic */

static __inline __m512d __DEFAULT_FN_ATTRS		static __inline __m512d __DEFAULT_FN_ATTRS512
_mm512_add_pd(__m512d __a, __m512d __b)		_mm512_add_pd(__m512d __a, __m512d __b)
{		{
return (__m512d)((__v8df)__a + (__v8df)__b);		return (__m512d)((__v8df)__a + (__v8df)__b);
}		}

static __inline __m512 __DEFAULT_FN_ATTRS		static __inline __m512 __DEFAULT_FN_ATTRS512
_mm512_add_ps(__m512 __a, __m512 __b)		_mm512_add_ps(__m512 __a, __m512 __b)
{		{
return (__m512)((__v16sf)__a + (__v16sf)__b);		return (__m512)((__v16sf)__a + (__v16sf)__b);
}		}

static __inline __m512d __DEFAULT_FN_ATTRS		static __inline __m512d __DEFAULT_FN_ATTRS512
_mm512_mul_pd(__m512d __a, __m512d __b)		_mm512_mul_pd(__m512d __a, __m512d __b)
{		{
return (__m512d)((__v8df)__a * (__v8df)__b);		return (__m512d)((__v8df)__a * (__v8df)__b);
}		}

static __inline __m512 __DEFAULT_FN_ATTRS		static __inline __m512 __DEFAULT_FN_ATTRS512
_mm512_mul_ps(__m512 __a, __m512 __b)		_mm512_mul_ps(__m512 __a, __m512 __b)
{		{
return (__m512)((__v16sf)__a * (__v16sf)__b);		return (__m512)((__v16sf)__a * (__v16sf)__b);
}		}

static __inline __m512d __DEFAULT_FN_ATTRS		static __inline __m512d __DEFAULT_FN_ATTRS512
_mm512_sub_pd(__m512d __a, __m512d __b)		_mm512_sub_pd(__m512d __a, __m512d __b)
{		{
return (__m512d)((__v8df)__a - (__v8df)__b);		return (__m512d)((__v8df)__a - (__v8df)__b);
}		}

static __inline __m512 __DEFAULT_FN_ATTRS		static __inline __m512 __DEFAULT_FN_ATTRS512
_mm512_sub_ps(__m512 __a, __m512 __b)		_mm512_sub_ps(__m512 __a, __m512 __b)
{		{
return (__m512)((__v16sf)__a - (__v16sf)__b);		return (__m512)((__v16sf)__a - (__v16sf)__b);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_add_epi64 (__m512i __A, __m512i __B)		_mm512_add_epi64 (__m512i __A, __m512i __B)
{		{
return (__m512i) ((__v8du) __A + (__v8du) __B);		return (__m512i) ((__v8du) __A + (__v8du) __B);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_add_epi64(__m512i __W, __mmask8 __U, __m512i __A, __m512i __B)		_mm512_mask_add_epi64(__m512i __W, __mmask8 __U, __m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_selectq_512((__mmask8)__U,		return (__m512i)__builtin_ia32_selectq_512((__mmask8)__U,
(__v8di)_mm512_add_epi64(__A, __B),		(__v8di)_mm512_add_epi64(__A, __B),
(__v8di)__W);		(__v8di)__W);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_add_epi64(__mmask8 __U, __m512i __A, __m512i __B)		_mm512_maskz_add_epi64(__mmask8 __U, __m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_selectq_512((__mmask8)__U,		return (__m512i)__builtin_ia32_selectq_512((__mmask8)__U,
(__v8di)_mm512_add_epi64(__A, __B),		(__v8di)_mm512_add_epi64(__A, __B),
(__v8di)_mm512_setzero_si512());		(__v8di)_mm512_setzero_si512());
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_sub_epi64 (__m512i __A, __m512i __B)		_mm512_sub_epi64 (__m512i __A, __m512i __B)
{		{
return (__m512i) ((__v8du) __A - (__v8du) __B);		return (__m512i) ((__v8du) __A - (__v8du) __B);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_sub_epi64(__m512i __W, __mmask8 __U, __m512i __A, __m512i __B)		_mm512_mask_sub_epi64(__m512i __W, __mmask8 __U, __m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_selectq_512((__mmask8)__U,		return (__m512i)__builtin_ia32_selectq_512((__mmask8)__U,
(__v8di)_mm512_sub_epi64(__A, __B),		(__v8di)_mm512_sub_epi64(__A, __B),
(__v8di)__W);		(__v8di)__W);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_sub_epi64(__mmask8 __U, __m512i __A, __m512i __B)		_mm512_maskz_sub_epi64(__mmask8 __U, __m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_selectq_512((__mmask8)__U,		return (__m512i)__builtin_ia32_selectq_512((__mmask8)__U,
(__v8di)_mm512_sub_epi64(__A, __B),		(__v8di)_mm512_sub_epi64(__A, __B),
(__v8di)_mm512_setzero_si512());		(__v8di)_mm512_setzero_si512());
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_add_epi32 (__m512i __A, __m512i __B)		_mm512_add_epi32 (__m512i __A, __m512i __B)
{		{
return (__m512i) ((__v16su) __A + (__v16su) __B);		return (__m512i) ((__v16su) __A + (__v16su) __B);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_add_epi32(__m512i __W, __mmask16 __U, __m512i __A, __m512i __B)		_mm512_mask_add_epi32(__m512i __W, __mmask16 __U, __m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_selectd_512((__mmask16)__U,		return (__m512i)__builtin_ia32_selectd_512((__mmask16)__U,
(__v16si)_mm512_add_epi32(__A, __B),		(__v16si)_mm512_add_epi32(__A, __B),
(__v16si)__W);		(__v16si)__W);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_add_epi32 (__mmask16 __U, __m512i __A, __m512i __B)		_mm512_maskz_add_epi32 (__mmask16 __U, __m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_selectd_512((__mmask16)__U,		return (__m512i)__builtin_ia32_selectd_512((__mmask16)__U,
(__v16si)_mm512_add_epi32(__A, __B),		(__v16si)_mm512_add_epi32(__A, __B),
(__v16si)_mm512_setzero_si512());		(__v16si)_mm512_setzero_si512());
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_sub_epi32 (__m512i __A, __m512i __B)		_mm512_sub_epi32 (__m512i __A, __m512i __B)
{		{
return (__m512i) ((__v16su) __A - (__v16su) __B);		return (__m512i) ((__v16su) __A - (__v16su) __B);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_sub_epi32(__m512i __W, __mmask16 __U, __m512i __A, __m512i __B)		_mm512_mask_sub_epi32(__m512i __W, __mmask16 __U, __m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_selectd_512((__mmask16)__U,		return (__m512i)__builtin_ia32_selectd_512((__mmask16)__U,
(__v16si)_mm512_sub_epi32(__A, __B),		(__v16si)_mm512_sub_epi32(__A, __B),
(__v16si)__W);		(__v16si)__W);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_sub_epi32(__mmask16 __U, __m512i __A, __m512i __B)		_mm512_maskz_sub_epi32(__mmask16 __U, __m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_selectd_512((__mmask16)__U,		return (__m512i)__builtin_ia32_selectd_512((__mmask16)__U,
(__v16si)_mm512_sub_epi32(__A, __B),		(__v16si)_mm512_sub_epi32(__A, __B),
(__v16si)_mm512_setzero_si512());		(__v16si)_mm512_setzero_si512());
}		}

#define _mm512_max_round_pd(A, B, R) \		#define _mm512_max_round_pd(A, B, R) \
(__m512d)__builtin_ia32_maxpd512((__v8df)(__m512d)(A), \		(__m512d)__builtin_ia32_maxpd512((__v8df)(__m512d)(A), \
(__v8df)(__m512d)(B), (int)(R))		(__v8df)(__m512d)(B), (int)(R))

#define _mm512_mask_max_round_pd(W, U, A, B, R) \		#define _mm512_mask_max_round_pd(W, U, A, B, R) \
(__m512d)__builtin_ia32_selectpd_512((__mmask8)(U), \		(__m512d)__builtin_ia32_selectpd_512((__mmask8)(U), \
(__v8df)_mm512_max_round_pd((A), (B), (R)), \		(__v8df)_mm512_max_round_pd((A), (B), (R)), \
(__v8df)(W))		(__v8df)(W))

#define _mm512_maskz_max_round_pd(U, A, B, R) \		#define _mm512_maskz_max_round_pd(U, A, B, R) \
(__m512d)__builtin_ia32_selectpd_512((__mmask8)(U), \		(__m512d)__builtin_ia32_selectpd_512((__mmask8)(U), \
(__v8df)_mm512_max_round_pd((A), (B), (R)), \		(__v8df)_mm512_max_round_pd((A), (B), (R)), \
(__v8df)_mm512_setzero_pd())		(__v8df)_mm512_setzero_pd())

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_max_pd(__m512d __A, __m512d __B)		_mm512_max_pd(__m512d __A, __m512d __B)
{		{
return (__m512d) __builtin_ia32_maxpd512((__v8df) __A, (__v8df) __B,		return (__m512d) __builtin_ia32_maxpd512((__v8df) __A, (__v8df) __B,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_mask_max_pd (__m512d __W, __mmask8 __U, __m512d __A, __m512d __B)		_mm512_mask_max_pd (__m512d __W, __mmask8 __U, __m512d __A, __m512d __B)
{		{
return (__m512d)__builtin_ia32_selectpd_512(__U,		return (__m512d)__builtin_ia32_selectpd_512(__U,
(__v8df)_mm512_max_pd(__A, __B),		(__v8df)_mm512_max_pd(__A, __B),
(__v8df)__W);		(__v8df)__W);
}		}

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_maskz_max_pd (__mmask8 __U, __m512d __A, __m512d __B)		_mm512_maskz_max_pd (__mmask8 __U, __m512d __A, __m512d __B)
{		{
return (__m512d)__builtin_ia32_selectpd_512(__U,		return (__m512d)__builtin_ia32_selectpd_512(__U,
(__v8df)_mm512_max_pd(__A, __B),		(__v8df)_mm512_max_pd(__A, __B),
(__v8df)_mm512_setzero_pd());		(__v8df)_mm512_setzero_pd());
}		}

#define _mm512_max_round_ps(A, B, R) \		#define _mm512_max_round_ps(A, B, R) \
(__m512)__builtin_ia32_maxps512((__v16sf)(__m512)(A), \		(__m512)__builtin_ia32_maxps512((__v16sf)(__m512)(A), \
(__v16sf)(__m512)(B), (int)(R))		(__v16sf)(__m512)(B), (int)(R))

#define _mm512_mask_max_round_ps(W, U, A, B, R) \		#define _mm512_mask_max_round_ps(W, U, A, B, R) \
(__m512)__builtin_ia32_selectps_512((__mmask16)(U), \		(__m512)__builtin_ia32_selectps_512((__mmask16)(U), \
(__v16sf)_mm512_max_round_ps((A), (B), (R)), \		(__v16sf)_mm512_max_round_ps((A), (B), (R)), \
(__v16sf)(W))		(__v16sf)(W))

#define _mm512_maskz_max_round_ps(U, A, B, R) \		#define _mm512_maskz_max_round_ps(U, A, B, R) \
(__m512)__builtin_ia32_selectps_512((__mmask16)(U), \		(__m512)__builtin_ia32_selectps_512((__mmask16)(U), \
(__v16sf)_mm512_max_round_ps((A), (B), (R)), \		(__v16sf)_mm512_max_round_ps((A), (B), (R)), \
(__v16sf)_mm512_setzero_ps())		(__v16sf)_mm512_setzero_ps())

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_max_ps(__m512 __A, __m512 __B)		_mm512_max_ps(__m512 __A, __m512 __B)
{		{
return (__m512) __builtin_ia32_maxps512((__v16sf) __A, (__v16sf) __B,		return (__m512) __builtin_ia32_maxps512((__v16sf) __A, (__v16sf) __B,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_mask_max_ps (__m512 __W, __mmask16 __U, __m512 __A, __m512 __B)		_mm512_mask_max_ps (__m512 __W, __mmask16 __U, __m512 __A, __m512 __B)
{		{
return (__m512)__builtin_ia32_selectps_512(__U,		return (__m512)__builtin_ia32_selectps_512(__U,
(__v16sf)_mm512_max_ps(__A, __B),		(__v16sf)_mm512_max_ps(__A, __B),
(__v16sf)__W);		(__v16sf)__W);
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_maskz_max_ps (__mmask16 __U, __m512 __A, __m512 __B)		_mm512_maskz_max_ps (__mmask16 __U, __m512 __A, __m512 __B)
{		{
return (__m512)__builtin_ia32_selectps_512(__U,		return (__m512)__builtin_ia32_selectps_512(__U,
(__v16sf)_mm512_max_ps(__A, __B),		(__v16sf)_mm512_max_ps(__A, __B),
(__v16sf)_mm512_setzero_ps());		(__v16sf)_mm512_setzero_ps());
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_mask_max_ss(__m128 __W, __mmask8 __U,__m128 __A, __m128 __B) {		_mm_mask_max_ss(__m128 __W, __mmask8 __U,__m128 __A, __m128 __B) {
return (__m128) __builtin_ia32_maxss_round_mask ((__v4sf) __A,		return (__m128) __builtin_ia32_maxss_round_mask ((__v4sf) __A,
(__v4sf) __B,		(__v4sf) __B,
(__v4sf) __W,		(__v4sf) __W,
(__mmask8) __U,		(__mmask8) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_maskz_max_ss(__mmask8 __U,__m128 __A, __m128 __B) {		_mm_maskz_max_ss(__mmask8 __U,__m128 __A, __m128 __B) {
return (__m128) __builtin_ia32_maxss_round_mask ((__v4sf) __A,		return (__m128) __builtin_ia32_maxss_round_mask ((__v4sf) __A,
(__v4sf) __B,		(__v4sf) __B,
(__v4sf) _mm_setzero_ps (),		(__v4sf) _mm_setzero_ps (),
(__mmask8) __U,		(__mmask8) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

Show All 10 Lines	(__m128)__builtin_ia32_maxss_round_mask((__v4sf)(__m128)(A), \
(int)(R))		(int)(R))

#define _mm_maskz_max_round_ss(U, A, B, R) \		#define _mm_maskz_max_round_ss(U, A, B, R) \
(__m128)__builtin_ia32_maxss_round_mask((__v4sf)(__m128)(A), \		(__m128)__builtin_ia32_maxss_round_mask((__v4sf)(__m128)(A), \
(__v4sf)(__m128)(B), \		(__v4sf)(__m128)(B), \
(__v4sf)_mm_setzero_ps(), \		(__v4sf)_mm_setzero_ps(), \
(__mmask8)(U), (int)(R))		(__mmask8)(U), (int)(R))

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_mask_max_sd(__m128d __W, __mmask8 __U,__m128d __A, __m128d __B) {		_mm_mask_max_sd(__m128d __W, __mmask8 __U,__m128d __A, __m128d __B) {
return (__m128d) __builtin_ia32_maxsd_round_mask ((__v2df) __A,		return (__m128d) __builtin_ia32_maxsd_round_mask ((__v2df) __A,
(__v2df) __B,		(__v2df) __B,
(__v2df) __W,		(__v2df) __W,
(__mmask8) __U,		(__mmask8) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_maskz_max_sd(__mmask8 __U,__m128d __A, __m128d __B) {		_mm_maskz_max_sd(__mmask8 __U,__m128d __A, __m128d __B) {
return (__m128d) __builtin_ia32_maxsd_round_mask ((__v2df) __A,		return (__m128d) __builtin_ia32_maxsd_round_mask ((__v2df) __A,
(__v2df) __B,		(__v2df) __B,
(__v2df) _mm_setzero_pd (),		(__v2df) _mm_setzero_pd (),
(__mmask8) __U,		(__mmask8) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

Show All 11 Lines

#define _mm_maskz_max_round_sd(U, A, B, R) \		#define _mm_maskz_max_round_sd(U, A, B, R) \
(__m128d)__builtin_ia32_maxsd_round_mask((__v2df)(__m128d)(A), \		(__m128d)__builtin_ia32_maxsd_round_mask((__v2df)(__m128d)(A), \
(__v2df)(__m128d)(B), \		(__v2df)(__m128d)(B), \
(__v2df)_mm_setzero_pd(), \		(__v2df)_mm_setzero_pd(), \
(__mmask8)(U), (int)(R))		(__mmask8)(U), (int)(R))

static __inline __m512i		static __inline __m512i
__DEFAULT_FN_ATTRS		__DEFAULT_FN_ATTRS512
_mm512_max_epi32(__m512i __A, __m512i __B)		_mm512_max_epi32(__m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_pmaxsd512((__v16si)__A, (__v16si)__B);		return (__m512i)__builtin_ia32_pmaxsd512((__v16si)__A, (__v16si)__B);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_max_epi32 (__m512i __W, __mmask16 __M, __m512i __A, __m512i __B)		_mm512_mask_max_epi32 (__m512i __W, __mmask16 __M, __m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_selectd_512((__mmask16)__M,		return (__m512i)__builtin_ia32_selectd_512((__mmask16)__M,
(__v16si)_mm512_max_epi32(__A, __B),		(__v16si)_mm512_max_epi32(__A, __B),
(__v16si)__W);		(__v16si)__W);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_max_epi32 (__mmask16 __M, __m512i __A, __m512i __B)		_mm512_maskz_max_epi32 (__mmask16 __M, __m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_selectd_512((__mmask16)__M,		return (__m512i)__builtin_ia32_selectd_512((__mmask16)__M,
(__v16si)_mm512_max_epi32(__A, __B),		(__v16si)_mm512_max_epi32(__A, __B),
(__v16si)_mm512_setzero_si512());		(__v16si)_mm512_setzero_si512());
}		}

static __inline __m512i __DEFAULT_FN_ATTRS		static __inline __m512i __DEFAULT_FN_ATTRS512
_mm512_max_epu32(__m512i __A, __m512i __B)		_mm512_max_epu32(__m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_pmaxud512((__v16si)__A, (__v16si)__B);		return (__m512i)__builtin_ia32_pmaxud512((__v16si)__A, (__v16si)__B);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_max_epu32 (__m512i __W, __mmask16 __M, __m512i __A, __m512i __B)		_mm512_mask_max_epu32 (__m512i __W, __mmask16 __M, __m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_selectd_512((__mmask16)__M,		return (__m512i)__builtin_ia32_selectd_512((__mmask16)__M,
(__v16si)_mm512_max_epu32(__A, __B),		(__v16si)_mm512_max_epu32(__A, __B),
(__v16si)__W);		(__v16si)__W);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_max_epu32 (__mmask16 __M, __m512i __A, __m512i __B)		_mm512_maskz_max_epu32 (__mmask16 __M, __m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_selectd_512((__mmask16)__M,		return (__m512i)__builtin_ia32_selectd_512((__mmask16)__M,
(__v16si)_mm512_max_epu32(__A, __B),		(__v16si)_mm512_max_epu32(__A, __B),
(__v16si)_mm512_setzero_si512());		(__v16si)_mm512_setzero_si512());
}		}

static __inline __m512i __DEFAULT_FN_ATTRS		static __inline __m512i __DEFAULT_FN_ATTRS512
_mm512_max_epi64(__m512i __A, __m512i __B)		_mm512_max_epi64(__m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_pmaxsq512((__v8di)__A, (__v8di)__B);		return (__m512i)__builtin_ia32_pmaxsq512((__v8di)__A, (__v8di)__B);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_max_epi64 (__m512i __W, __mmask8 __M, __m512i __A, __m512i __B)		_mm512_mask_max_epi64 (__m512i __W, __mmask8 __M, __m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_selectq_512((__mmask8)__M,		return (__m512i)__builtin_ia32_selectq_512((__mmask8)__M,
(__v8di)_mm512_max_epi64(__A, __B),		(__v8di)_mm512_max_epi64(__A, __B),
(__v8di)__W);		(__v8di)__W);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_max_epi64 (__mmask8 __M, __m512i __A, __m512i __B)		_mm512_maskz_max_epi64 (__mmask8 __M, __m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_selectq_512((__mmask8)__M,		return (__m512i)__builtin_ia32_selectq_512((__mmask8)__M,
(__v8di)_mm512_max_epi64(__A, __B),		(__v8di)_mm512_max_epi64(__A, __B),
(__v8di)_mm512_setzero_si512());		(__v8di)_mm512_setzero_si512());
}		}

static __inline __m512i __DEFAULT_FN_ATTRS		static __inline __m512i __DEFAULT_FN_ATTRS512
_mm512_max_epu64(__m512i __A, __m512i __B)		_mm512_max_epu64(__m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_pmaxuq512((__v8di)__A, (__v8di)__B);		return (__m512i)__builtin_ia32_pmaxuq512((__v8di)__A, (__v8di)__B);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_max_epu64 (__m512i __W, __mmask8 __M, __m512i __A, __m512i __B)		_mm512_mask_max_epu64 (__m512i __W, __mmask8 __M, __m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_selectq_512((__mmask8)__M,		return (__m512i)__builtin_ia32_selectq_512((__mmask8)__M,
(__v8di)_mm512_max_epu64(__A, __B),		(__v8di)_mm512_max_epu64(__A, __B),
(__v8di)__W);		(__v8di)__W);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_max_epu64 (__mmask8 __M, __m512i __A, __m512i __B)		_mm512_maskz_max_epu64 (__mmask8 __M, __m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_selectq_512((__mmask8)__M,		return (__m512i)__builtin_ia32_selectq_512((__mmask8)__M,
(__v8di)_mm512_max_epu64(__A, __B),		(__v8di)_mm512_max_epu64(__A, __B),
(__v8di)_mm512_setzero_si512());		(__v8di)_mm512_setzero_si512());
}		}

#define _mm512_min_round_pd(A, B, R) \		#define _mm512_min_round_pd(A, B, R) \
(__m512d)__builtin_ia32_minpd512((__v8df)(__m512d)(A), \		(__m512d)__builtin_ia32_minpd512((__v8df)(__m512d)(A), \
(__v8df)(__m512d)(B), (int)(R))		(__v8df)(__m512d)(B), (int)(R))

#define _mm512_mask_min_round_pd(W, U, A, B, R) \		#define _mm512_mask_min_round_pd(W, U, A, B, R) \
(__m512d)__builtin_ia32_selectpd_512((__mmask8)(U), \		(__m512d)__builtin_ia32_selectpd_512((__mmask8)(U), \
(__v8df)_mm512_min_round_pd((A), (B), (R)), \		(__v8df)_mm512_min_round_pd((A), (B), (R)), \
(__v8df)(W))		(__v8df)(W))

#define _mm512_maskz_min_round_pd(U, A, B, R) \		#define _mm512_maskz_min_round_pd(U, A, B, R) \
(__m512d)__builtin_ia32_selectpd_512((__mmask8)(U), \		(__m512d)__builtin_ia32_selectpd_512((__mmask8)(U), \
(__v8df)_mm512_min_round_pd((A), (B), (R)), \		(__v8df)_mm512_min_round_pd((A), (B), (R)), \
(__v8df)_mm512_setzero_pd())		(__v8df)_mm512_setzero_pd())

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_min_pd(__m512d __A, __m512d __B)		_mm512_min_pd(__m512d __A, __m512d __B)
{		{
return (__m512d) __builtin_ia32_minpd512((__v8df) __A, (__v8df) __B,		return (__m512d) __builtin_ia32_minpd512((__v8df) __A, (__v8df) __B,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_mask_min_pd (__m512d __W, __mmask8 __U, __m512d __A, __m512d __B)		_mm512_mask_min_pd (__m512d __W, __mmask8 __U, __m512d __A, __m512d __B)
{		{
return (__m512d)__builtin_ia32_selectpd_512(__U,		return (__m512d)__builtin_ia32_selectpd_512(__U,
(__v8df)_mm512_min_pd(__A, __B),		(__v8df)_mm512_min_pd(__A, __B),
(__v8df)__W);		(__v8df)__W);
}		}

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_maskz_min_pd (__mmask8 __U, __m512d __A, __m512d __B)		_mm512_maskz_min_pd (__mmask8 __U, __m512d __A, __m512d __B)
{		{
return (__m512d)__builtin_ia32_selectpd_512(__U,		return (__m512d)__builtin_ia32_selectpd_512(__U,
(__v8df)_mm512_min_pd(__A, __B),		(__v8df)_mm512_min_pd(__A, __B),
(__v8df)_mm512_setzero_pd());		(__v8df)_mm512_setzero_pd());
}		}

#define _mm512_min_round_ps(A, B, R) \		#define _mm512_min_round_ps(A, B, R) \
(__m512)__builtin_ia32_minps512((__v16sf)(__m512)(A), \		(__m512)__builtin_ia32_minps512((__v16sf)(__m512)(A), \
(__v16sf)(__m512)(B), (int)(R))		(__v16sf)(__m512)(B), (int)(R))

#define _mm512_mask_min_round_ps(W, U, A, B, R) \		#define _mm512_mask_min_round_ps(W, U, A, B, R) \
(__m512)__builtin_ia32_selectps_512((__mmask16)(U), \		(__m512)__builtin_ia32_selectps_512((__mmask16)(U), \
(__v16sf)_mm512_min_round_ps((A), (B), (R)), \		(__v16sf)_mm512_min_round_ps((A), (B), (R)), \
(__v16sf)(W))		(__v16sf)(W))

#define _mm512_maskz_min_round_ps(U, A, B, R) \		#define _mm512_maskz_min_round_ps(U, A, B, R) \
(__m512)__builtin_ia32_selectps_512((__mmask16)(U), \		(__m512)__builtin_ia32_selectps_512((__mmask16)(U), \
(__v16sf)_mm512_min_round_ps((A), (B), (R)), \		(__v16sf)_mm512_min_round_ps((A), (B), (R)), \
(__v16sf)_mm512_setzero_ps())		(__v16sf)_mm512_setzero_ps())

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_min_ps(__m512 __A, __m512 __B)		_mm512_min_ps(__m512 __A, __m512 __B)
{		{
return (__m512) __builtin_ia32_minps512((__v16sf) __A, (__v16sf) __B,		return (__m512) __builtin_ia32_minps512((__v16sf) __A, (__v16sf) __B,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_mask_min_ps (__m512 __W, __mmask16 __U, __m512 __A, __m512 __B)		_mm512_mask_min_ps (__m512 __W, __mmask16 __U, __m512 __A, __m512 __B)
{		{
return (__m512)__builtin_ia32_selectps_512(__U,		return (__m512)__builtin_ia32_selectps_512(__U,
(__v16sf)_mm512_min_ps(__A, __B),		(__v16sf)_mm512_min_ps(__A, __B),
(__v16sf)__W);		(__v16sf)__W);
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_maskz_min_ps (__mmask16 __U, __m512 __A, __m512 __B)		_mm512_maskz_min_ps (__mmask16 __U, __m512 __A, __m512 __B)
{		{
return (__m512)__builtin_ia32_selectps_512(__U,		return (__m512)__builtin_ia32_selectps_512(__U,
(__v16sf)_mm512_min_ps(__A, __B),		(__v16sf)_mm512_min_ps(__A, __B),
(__v16sf)_mm512_setzero_ps());		(__v16sf)_mm512_setzero_ps());
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_mask_min_ss(__m128 __W, __mmask8 __U,__m128 __A, __m128 __B) {		_mm_mask_min_ss(__m128 __W, __mmask8 __U,__m128 __A, __m128 __B) {
return (__m128) __builtin_ia32_minss_round_mask ((__v4sf) __A,		return (__m128) __builtin_ia32_minss_round_mask ((__v4sf) __A,
(__v4sf) __B,		(__v4sf) __B,
(__v4sf) __W,		(__v4sf) __W,
(__mmask8) __U,		(__mmask8) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_maskz_min_ss(__mmask8 __U,__m128 __A, __m128 __B) {		_mm_maskz_min_ss(__mmask8 __U,__m128 __A, __m128 __B) {
return (__m128) __builtin_ia32_minss_round_mask ((__v4sf) __A,		return (__m128) __builtin_ia32_minss_round_mask ((__v4sf) __A,
(__v4sf) __B,		(__v4sf) __B,
(__v4sf) _mm_setzero_ps (),		(__v4sf) _mm_setzero_ps (),
(__mmask8) __U,		(__mmask8) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

Show All 10 Lines	(__m128)__builtin_ia32_minss_round_mask((__v4sf)(__m128)(A), \
(int)(R))		(int)(R))

#define _mm_maskz_min_round_ss(U, A, B, R) \		#define _mm_maskz_min_round_ss(U, A, B, R) \
(__m128)__builtin_ia32_minss_round_mask((__v4sf)(__m128)(A), \		(__m128)__builtin_ia32_minss_round_mask((__v4sf)(__m128)(A), \
(__v4sf)(__m128)(B), \		(__v4sf)(__m128)(B), \
(__v4sf)_mm_setzero_ps(), \		(__v4sf)_mm_setzero_ps(), \
(__mmask8)(U), (int)(R))		(__mmask8)(U), (int)(R))

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_mask_min_sd(__m128d __W, __mmask8 __U,__m128d __A, __m128d __B) {		_mm_mask_min_sd(__m128d __W, __mmask8 __U,__m128d __A, __m128d __B) {
return (__m128d) __builtin_ia32_minsd_round_mask ((__v2df) __A,		return (__m128d) __builtin_ia32_minsd_round_mask ((__v2df) __A,
(__v2df) __B,		(__v2df) __B,
(__v2df) __W,		(__v2df) __W,
(__mmask8) __U,		(__mmask8) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_maskz_min_sd(__mmask8 __U,__m128d __A, __m128d __B) {		_mm_maskz_min_sd(__mmask8 __U,__m128d __A, __m128d __B) {
return (__m128d) __builtin_ia32_minsd_round_mask ((__v2df) __A,		return (__m128d) __builtin_ia32_minsd_round_mask ((__v2df) __A,
(__v2df) __B,		(__v2df) __B,
(__v2df) _mm_setzero_pd (),		(__v2df) _mm_setzero_pd (),
(__mmask8) __U,		(__mmask8) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

Show All 11 Lines

#define _mm_maskz_min_round_sd(U, A, B, R) \		#define _mm_maskz_min_round_sd(U, A, B, R) \
(__m128d)__builtin_ia32_minsd_round_mask((__v2df)(__m128d)(A), \		(__m128d)__builtin_ia32_minsd_round_mask((__v2df)(__m128d)(A), \
(__v2df)(__m128d)(B), \		(__v2df)(__m128d)(B), \
(__v2df)_mm_setzero_pd(), \		(__v2df)_mm_setzero_pd(), \
(__mmask8)(U), (int)(R))		(__mmask8)(U), (int)(R))

static __inline __m512i		static __inline __m512i
__DEFAULT_FN_ATTRS		__DEFAULT_FN_ATTRS512
_mm512_min_epi32(__m512i __A, __m512i __B)		_mm512_min_epi32(__m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_pminsd512((__v16si)__A, (__v16si)__B);		return (__m512i)__builtin_ia32_pminsd512((__v16si)__A, (__v16si)__B);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_min_epi32 (__m512i __W, __mmask16 __M, __m512i __A, __m512i __B)		_mm512_mask_min_epi32 (__m512i __W, __mmask16 __M, __m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_selectd_512((__mmask16)__M,		return (__m512i)__builtin_ia32_selectd_512((__mmask16)__M,
(__v16si)_mm512_min_epi32(__A, __B),		(__v16si)_mm512_min_epi32(__A, __B),
(__v16si)__W);		(__v16si)__W);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_min_epi32 (__mmask16 __M, __m512i __A, __m512i __B)		_mm512_maskz_min_epi32 (__mmask16 __M, __m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_selectd_512((__mmask16)__M,		return (__m512i)__builtin_ia32_selectd_512((__mmask16)__M,
(__v16si)_mm512_min_epi32(__A, __B),		(__v16si)_mm512_min_epi32(__A, __B),
(__v16si)_mm512_setzero_si512());		(__v16si)_mm512_setzero_si512());
}		}

static __inline __m512i __DEFAULT_FN_ATTRS		static __inline __m512i __DEFAULT_FN_ATTRS512
_mm512_min_epu32(__m512i __A, __m512i __B)		_mm512_min_epu32(__m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_pminud512((__v16si)__A, (__v16si)__B);		return (__m512i)__builtin_ia32_pminud512((__v16si)__A, (__v16si)__B);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_min_epu32 (__m512i __W, __mmask16 __M, __m512i __A, __m512i __B)		_mm512_mask_min_epu32 (__m512i __W, __mmask16 __M, __m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_selectd_512((__mmask16)__M,		return (__m512i)__builtin_ia32_selectd_512((__mmask16)__M,
(__v16si)_mm512_min_epu32(__A, __B),		(__v16si)_mm512_min_epu32(__A, __B),
(__v16si)__W);		(__v16si)__W);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_min_epu32 (__mmask16 __M, __m512i __A, __m512i __B)		_mm512_maskz_min_epu32 (__mmask16 __M, __m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_selectd_512((__mmask16)__M,		return (__m512i)__builtin_ia32_selectd_512((__mmask16)__M,
(__v16si)_mm512_min_epu32(__A, __B),		(__v16si)_mm512_min_epu32(__A, __B),
(__v16si)_mm512_setzero_si512());		(__v16si)_mm512_setzero_si512());
}		}

static __inline __m512i __DEFAULT_FN_ATTRS		static __inline __m512i __DEFAULT_FN_ATTRS512
_mm512_min_epi64(__m512i __A, __m512i __B)		_mm512_min_epi64(__m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_pminsq512((__v8di)__A, (__v8di)__B);		return (__m512i)__builtin_ia32_pminsq512((__v8di)__A, (__v8di)__B);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_min_epi64 (__m512i __W, __mmask8 __M, __m512i __A, __m512i __B)		_mm512_mask_min_epi64 (__m512i __W, __mmask8 __M, __m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_selectq_512((__mmask8)__M,		return (__m512i)__builtin_ia32_selectq_512((__mmask8)__M,
(__v8di)_mm512_min_epi64(__A, __B),		(__v8di)_mm512_min_epi64(__A, __B),
(__v8di)__W);		(__v8di)__W);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_min_epi64 (__mmask8 __M, __m512i __A, __m512i __B)		_mm512_maskz_min_epi64 (__mmask8 __M, __m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_selectq_512((__mmask8)__M,		return (__m512i)__builtin_ia32_selectq_512((__mmask8)__M,
(__v8di)_mm512_min_epi64(__A, __B),		(__v8di)_mm512_min_epi64(__A, __B),
(__v8di)_mm512_setzero_si512());		(__v8di)_mm512_setzero_si512());
}		}

static __inline __m512i __DEFAULT_FN_ATTRS		static __inline __m512i __DEFAULT_FN_ATTRS512
_mm512_min_epu64(__m512i __A, __m512i __B)		_mm512_min_epu64(__m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_pminuq512((__v8di)__A, (__v8di)__B);		return (__m512i)__builtin_ia32_pminuq512((__v8di)__A, (__v8di)__B);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_min_epu64 (__m512i __W, __mmask8 __M, __m512i __A, __m512i __B)		_mm512_mask_min_epu64 (__m512i __W, __mmask8 __M, __m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_selectq_512((__mmask8)__M,		return (__m512i)__builtin_ia32_selectq_512((__mmask8)__M,
(__v8di)_mm512_min_epu64(__A, __B),		(__v8di)_mm512_min_epu64(__A, __B),
(__v8di)__W);		(__v8di)__W);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_min_epu64 (__mmask8 __M, __m512i __A, __m512i __B)		_mm512_maskz_min_epu64 (__mmask8 __M, __m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_selectq_512((__mmask8)__M,		return (__m512i)__builtin_ia32_selectq_512((__mmask8)__M,
(__v8di)_mm512_min_epu64(__A, __B),		(__v8di)_mm512_min_epu64(__A, __B),
(__v8di)_mm512_setzero_si512());		(__v8di)_mm512_setzero_si512());
}		}

static __inline __m512i __DEFAULT_FN_ATTRS		static __inline __m512i __DEFAULT_FN_ATTRS512
_mm512_mul_epi32(__m512i __X, __m512i __Y)		_mm512_mul_epi32(__m512i __X, __m512i __Y)
{		{
return (__m512i)__builtin_ia32_pmuldq512((__v16si)__X, (__v16si) __Y);		return (__m512i)__builtin_ia32_pmuldq512((__v16si)__X, (__v16si) __Y);
}		}

static __inline __m512i __DEFAULT_FN_ATTRS		static __inline __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_mul_epi32(__m512i __W, __mmask8 __M, __m512i __X, __m512i __Y)		_mm512_mask_mul_epi32(__m512i __W, __mmask8 __M, __m512i __X, __m512i __Y)
{		{
return (__m512i)__builtin_ia32_selectq_512((__mmask8)__M,		return (__m512i)__builtin_ia32_selectq_512((__mmask8)__M,
(__v8di)_mm512_mul_epi32(__X, __Y),		(__v8di)_mm512_mul_epi32(__X, __Y),
(__v8di)__W);		(__v8di)__W);
}		}

static __inline __m512i __DEFAULT_FN_ATTRS		static __inline __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_mul_epi32(__mmask8 __M, __m512i __X, __m512i __Y)		_mm512_maskz_mul_epi32(__mmask8 __M, __m512i __X, __m512i __Y)
{		{
return (__m512i)__builtin_ia32_selectq_512((__mmask8)__M,		return (__m512i)__builtin_ia32_selectq_512((__mmask8)__M,
(__v8di)_mm512_mul_epi32(__X, __Y),		(__v8di)_mm512_mul_epi32(__X, __Y),
(__v8di)_mm512_setzero_si512 ());		(__v8di)_mm512_setzero_si512 ());
}		}

static __inline __m512i __DEFAULT_FN_ATTRS		static __inline __m512i __DEFAULT_FN_ATTRS512
_mm512_mul_epu32(__m512i __X, __m512i __Y)		_mm512_mul_epu32(__m512i __X, __m512i __Y)
{		{
return (__m512i)__builtin_ia32_pmuludq512((__v16si)__X, (__v16si)__Y);		return (__m512i)__builtin_ia32_pmuludq512((__v16si)__X, (__v16si)__Y);
}		}

static __inline __m512i __DEFAULT_FN_ATTRS		static __inline __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_mul_epu32(__m512i __W, __mmask8 __M, __m512i __X, __m512i __Y)		_mm512_mask_mul_epu32(__m512i __W, __mmask8 __M, __m512i __X, __m512i __Y)
{		{
return (__m512i)__builtin_ia32_selectq_512((__mmask8)__M,		return (__m512i)__builtin_ia32_selectq_512((__mmask8)__M,
(__v8di)_mm512_mul_epu32(__X, __Y),		(__v8di)_mm512_mul_epu32(__X, __Y),
(__v8di)__W);		(__v8di)__W);
}		}

static __inline __m512i __DEFAULT_FN_ATTRS		static __inline __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_mul_epu32(__mmask8 __M, __m512i __X, __m512i __Y)		_mm512_maskz_mul_epu32(__mmask8 __M, __m512i __X, __m512i __Y)
{		{
return (__m512i)__builtin_ia32_selectq_512((__mmask8)__M,		return (__m512i)__builtin_ia32_selectq_512((__mmask8)__M,
(__v8di)_mm512_mul_epu32(__X, __Y),		(__v8di)_mm512_mul_epu32(__X, __Y),
(__v8di)_mm512_setzero_si512 ());		(__v8di)_mm512_setzero_si512 ());
}		}

static __inline __m512i __DEFAULT_FN_ATTRS		static __inline __m512i __DEFAULT_FN_ATTRS512
_mm512_mullo_epi32 (__m512i __A, __m512i __B)		_mm512_mullo_epi32 (__m512i __A, __m512i __B)
{		{
return (__m512i) ((__v16su) __A * (__v16su) __B);		return (__m512i) ((__v16su) __A * (__v16su) __B);
}		}

static __inline __m512i __DEFAULT_FN_ATTRS		static __inline __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_mullo_epi32(__mmask16 __M, __m512i __A, __m512i __B)		_mm512_maskz_mullo_epi32(__mmask16 __M, __m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_selectd_512((__mmask16)__M,		return (__m512i)__builtin_ia32_selectd_512((__mmask16)__M,
(__v16si)_mm512_mullo_epi32(__A, __B),		(__v16si)_mm512_mullo_epi32(__A, __B),
(__v16si)_mm512_setzero_si512());		(__v16si)_mm512_setzero_si512());
}		}

static __inline __m512i __DEFAULT_FN_ATTRS		static __inline __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_mullo_epi32(__m512i __W, __mmask16 __M, __m512i __A, __m512i __B)		_mm512_mask_mullo_epi32(__m512i __W, __mmask16 __M, __m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_selectd_512((__mmask16)__M,		return (__m512i)__builtin_ia32_selectd_512((__mmask16)__M,
(__v16si)_mm512_mullo_epi32(__A, __B),		(__v16si)_mm512_mullo_epi32(__A, __B),
(__v16si)__W);		(__v16si)__W);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mullox_epi64 (__m512i __A, __m512i __B) {		_mm512_mullox_epi64 (__m512i __A, __m512i __B) {
return (__m512i) ((__v8du) __A * (__v8du) __B);		return (__m512i) ((__v8du) __A * (__v8du) __B);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_mullox_epi64(__m512i __W, __mmask8 __U, __m512i __A, __m512i __B) {		_mm512_mask_mullox_epi64(__m512i __W, __mmask8 __U, __m512i __A, __m512i __B) {
return (__m512i)__builtin_ia32_selectq_512((__mmask8)__U,		return (__m512i)__builtin_ia32_selectq_512((__mmask8)__U,
(__v8di)_mm512_mullox_epi64(__A, __B),		(__v8di)_mm512_mullox_epi64(__A, __B),
(__v8di)__W);		(__v8di)__W);
}		}

#define _mm512_mask_sqrt_round_pd(W, U, A, R) \		#define _mm512_mask_sqrt_round_pd(W, U, A, R) \
(__m512d)__builtin_ia32_sqrtpd512_mask((__v8df)(__m512d)(A), \		(__m512d)__builtin_ia32_sqrtpd512_mask((__v8df)(__m512d)(A), \
(__v8df)(__m512d)(W), (__mmask8)(U), \		(__v8df)(__m512d)(W), (__mmask8)(U), \
(int)(R))		(int)(R))

#define _mm512_maskz_sqrt_round_pd(U, A, R) \		#define _mm512_maskz_sqrt_round_pd(U, A, R) \
(__m512d)__builtin_ia32_sqrtpd512_mask((__v8df)(__m512d)(A), \		(__m512d)__builtin_ia32_sqrtpd512_mask((__v8df)(__m512d)(A), \
(__v8df)_mm512_setzero_pd(), \		(__v8df)_mm512_setzero_pd(), \
(__mmask8)(U), (int)(R))		(__mmask8)(U), (int)(R))

#define _mm512_sqrt_round_pd(A, R) \		#define _mm512_sqrt_round_pd(A, R) \
(__m512d)__builtin_ia32_sqrtpd512_mask((__v8df)(__m512d)(A), \		(__m512d)__builtin_ia32_sqrtpd512_mask((__v8df)(__m512d)(A), \
(__v8df)_mm512_undefined_pd(), \		(__v8df)_mm512_undefined_pd(), \
(__mmask8)-1, (int)(R))		(__mmask8)-1, (int)(R))

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_sqrt_pd(__m512d __a)		_mm512_sqrt_pd(__m512d __a)
{		{
return (__m512d)__builtin_ia32_sqrtpd512_mask((__v8df)__a,		return (__m512d)__builtin_ia32_sqrtpd512_mask((__v8df)__a,
(__v8df) _mm512_setzero_pd (),		(__v8df) _mm512_setzero_pd (),
(__mmask8) -1,		(__mmask8) -1,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_mask_sqrt_pd (__m512d __W, __mmask8 __U, __m512d __A)		_mm512_mask_sqrt_pd (__m512d __W, __mmask8 __U, __m512d __A)
{		{
return (__m512d) __builtin_ia32_sqrtpd512_mask ((__v8df) __A,		return (__m512d) __builtin_ia32_sqrtpd512_mask ((__v8df) __A,
(__v8df) __W,		(__v8df) __W,
(__mmask8) __U,		(__mmask8) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_maskz_sqrt_pd (__mmask8 __U, __m512d __A)		_mm512_maskz_sqrt_pd (__mmask8 __U, __m512d __A)
{		{
return (__m512d) __builtin_ia32_sqrtpd512_mask ((__v8df) __A,		return (__m512d) __builtin_ia32_sqrtpd512_mask ((__v8df) __A,
(__v8df)		(__v8df)
_mm512_setzero_pd (),		_mm512_setzero_pd (),
(__mmask8) __U,		(__mmask8) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

#define _mm512_mask_sqrt_round_ps(W, U, A, R) \		#define _mm512_mask_sqrt_round_ps(W, U, A, R) \
(__m512)__builtin_ia32_sqrtps512_mask((__v16sf)(__m512)(A), \		(__m512)__builtin_ia32_sqrtps512_mask((__v16sf)(__m512)(A), \
(__v16sf)(__m512)(W), (__mmask16)(U), \		(__v16sf)(__m512)(W), (__mmask16)(U), \
(int)(R))		(int)(R))

#define _mm512_maskz_sqrt_round_ps(U, A, R) \		#define _mm512_maskz_sqrt_round_ps(U, A, R) \
(__m512)__builtin_ia32_sqrtps512_mask((__v16sf)(__m512)(A), \		(__m512)__builtin_ia32_sqrtps512_mask((__v16sf)(__m512)(A), \
(__v16sf)_mm512_setzero_ps(), \		(__v16sf)_mm512_setzero_ps(), \
(__mmask16)(U), (int)(R))		(__mmask16)(U), (int)(R))

#define _mm512_sqrt_round_ps(A, R) \		#define _mm512_sqrt_round_ps(A, R) \
(__m512)__builtin_ia32_sqrtps512_mask((__v16sf)(__m512)(A), \		(__m512)__builtin_ia32_sqrtps512_mask((__v16sf)(__m512)(A), \
(__v16sf)_mm512_undefined_ps(), \		(__v16sf)_mm512_undefined_ps(), \
(__mmask16)-1, (int)(R))		(__mmask16)-1, (int)(R))

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_sqrt_ps(__m512 __a)		_mm512_sqrt_ps(__m512 __a)
{		{
return (__m512)__builtin_ia32_sqrtps512_mask((__v16sf)__a,		return (__m512)__builtin_ia32_sqrtps512_mask((__v16sf)__a,
(__v16sf) _mm512_setzero_ps (),		(__v16sf) _mm512_setzero_ps (),
(__mmask16) -1,		(__mmask16) -1,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_mask_sqrt_ps(__m512 __W, __mmask16 __U, __m512 __A)		_mm512_mask_sqrt_ps(__m512 __W, __mmask16 __U, __m512 __A)
{		{
return (__m512)__builtin_ia32_sqrtps512_mask((__v16sf)__A,		return (__m512)__builtin_ia32_sqrtps512_mask((__v16sf)__A,
(__v16sf) __W,		(__v16sf) __W,
(__mmask16) __U,		(__mmask16) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_maskz_sqrt_ps( __mmask16 __U, __m512 __A)		_mm512_maskz_sqrt_ps( __mmask16 __U, __m512 __A)
{		{
return (__m512)__builtin_ia32_sqrtps512_mask((__v16sf)__A,		return (__m512)__builtin_ia32_sqrtps512_mask((__v16sf)__A,
(__v16sf) _mm512_setzero_ps (),		(__v16sf) _mm512_setzero_ps (),
(__mmask16) __U,		(__mmask16) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_rsqrt14_pd(__m512d __A)		_mm512_rsqrt14_pd(__m512d __A)
{		{
return (__m512d) __builtin_ia32_rsqrt14pd512_mask ((__v8df) __A,		return (__m512d) __builtin_ia32_rsqrt14pd512_mask ((__v8df) __A,
(__v8df)		(__v8df)
_mm512_setzero_pd (),		_mm512_setzero_pd (),
(__mmask8) -1);}		(__mmask8) -1);}

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_mask_rsqrt14_pd (__m512d __W, __mmask8 __U, __m512d __A)		_mm512_mask_rsqrt14_pd (__m512d __W, __mmask8 __U, __m512d __A)
{		{
return (__m512d) __builtin_ia32_rsqrt14pd512_mask ((__v8df) __A,		return (__m512d) __builtin_ia32_rsqrt14pd512_mask ((__v8df) __A,
(__v8df) __W,		(__v8df) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_maskz_rsqrt14_pd (__mmask8 __U, __m512d __A)		_mm512_maskz_rsqrt14_pd (__mmask8 __U, __m512d __A)
{		{
return (__m512d) __builtin_ia32_rsqrt14pd512_mask ((__v8df) __A,		return (__m512d) __builtin_ia32_rsqrt14pd512_mask ((__v8df) __A,
(__v8df)		(__v8df)
_mm512_setzero_pd (),		_mm512_setzero_pd (),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_rsqrt14_ps(__m512 __A)		_mm512_rsqrt14_ps(__m512 __A)
{		{
return (__m512) __builtin_ia32_rsqrt14ps512_mask ((__v16sf) __A,		return (__m512) __builtin_ia32_rsqrt14ps512_mask ((__v16sf) __A,
(__v16sf)		(__v16sf)
_mm512_setzero_ps (),		_mm512_setzero_ps (),
(__mmask16) -1);		(__mmask16) -1);
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_mask_rsqrt14_ps (__m512 __W, __mmask16 __U, __m512 __A)		_mm512_mask_rsqrt14_ps (__m512 __W, __mmask16 __U, __m512 __A)
{		{
return (__m512) __builtin_ia32_rsqrt14ps512_mask ((__v16sf) __A,		return (__m512) __builtin_ia32_rsqrt14ps512_mask ((__v16sf) __A,
(__v16sf) __W,		(__v16sf) __W,
(__mmask16) __U);		(__mmask16) __U);
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_maskz_rsqrt14_ps (__mmask16 __U, __m512 __A)		_mm512_maskz_rsqrt14_ps (__mmask16 __U, __m512 __A)
{		{
return (__m512) __builtin_ia32_rsqrt14ps512_mask ((__v16sf) __A,		return (__m512) __builtin_ia32_rsqrt14ps512_mask ((__v16sf) __A,
(__v16sf)		(__v16sf)
_mm512_setzero_ps (),		_mm512_setzero_ps (),
(__mmask16) __U);		(__mmask16) __U);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_rsqrt14_ss(__m128 __A, __m128 __B)		_mm_rsqrt14_ss(__m128 __A, __m128 __B)
{		{
return (__m128) __builtin_ia32_rsqrt14ss_mask ((__v4sf) __A,		return (__m128) __builtin_ia32_rsqrt14ss_mask ((__v4sf) __A,
(__v4sf) __B,		(__v4sf) __B,
(__v4sf)		(__v4sf)
_mm_setzero_ps (),		_mm_setzero_ps (),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_mask_rsqrt14_ss (__m128 __W, __mmask8 __U, __m128 __A, __m128 __B)		_mm_mask_rsqrt14_ss (__m128 __W, __mmask8 __U, __m128 __A, __m128 __B)
{		{
return (__m128) __builtin_ia32_rsqrt14ss_mask ((__v4sf) __A,		return (__m128) __builtin_ia32_rsqrt14ss_mask ((__v4sf) __A,
(__v4sf) __B,		(__v4sf) __B,
(__v4sf) __W,		(__v4sf) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_maskz_rsqrt14_ss (__mmask8 __U, __m128 __A, __m128 __B)		_mm_maskz_rsqrt14_ss (__mmask8 __U, __m128 __A, __m128 __B)
{		{
return (__m128) __builtin_ia32_rsqrt14ss_mask ((__v4sf) __A,		return (__m128) __builtin_ia32_rsqrt14ss_mask ((__v4sf) __A,
(__v4sf) __B,		(__v4sf) __B,
(__v4sf) _mm_setzero_ps (),		(__v4sf) _mm_setzero_ps (),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_rsqrt14_sd(__m128d __A, __m128d __B)		_mm_rsqrt14_sd(__m128d __A, __m128d __B)
{		{
return (__m128d) __builtin_ia32_rsqrt14sd_mask ((__v2df) __A,		return (__m128d) __builtin_ia32_rsqrt14sd_mask ((__v2df) __A,
(__v2df) __B,		(__v2df) __B,
(__v2df)		(__v2df)
_mm_setzero_pd (),		_mm_setzero_pd (),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_mask_rsqrt14_sd (__m128d __W, __mmask8 __U, __m128d __A, __m128d __B)		_mm_mask_rsqrt14_sd (__m128d __W, __mmask8 __U, __m128d __A, __m128d __B)
{		{
return (__m128d) __builtin_ia32_rsqrt14sd_mask ( (__v2df) __A,		return (__m128d) __builtin_ia32_rsqrt14sd_mask ( (__v2df) __A,
(__v2df) __B,		(__v2df) __B,
(__v2df) __W,		(__v2df) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_maskz_rsqrt14_sd (__mmask8 __U, __m128d __A, __m128d __B)		_mm_maskz_rsqrt14_sd (__mmask8 __U, __m128d __A, __m128d __B)
{		{
return (__m128d) __builtin_ia32_rsqrt14sd_mask ( (__v2df) __A,		return (__m128d) __builtin_ia32_rsqrt14sd_mask ( (__v2df) __A,
(__v2df) __B,		(__v2df) __B,
(__v2df) _mm_setzero_pd (),		(__v2df) _mm_setzero_pd (),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_rcp14_pd(__m512d __A)		_mm512_rcp14_pd(__m512d __A)
{		{
return (__m512d) __builtin_ia32_rcp14pd512_mask ((__v8df) __A,		return (__m512d) __builtin_ia32_rcp14pd512_mask ((__v8df) __A,
(__v8df)		(__v8df)
_mm512_setzero_pd (),		_mm512_setzero_pd (),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_mask_rcp14_pd (__m512d __W, __mmask8 __U, __m512d __A)		_mm512_mask_rcp14_pd (__m512d __W, __mmask8 __U, __m512d __A)
{		{
return (__m512d) __builtin_ia32_rcp14pd512_mask ((__v8df) __A,		return (__m512d) __builtin_ia32_rcp14pd512_mask ((__v8df) __A,
(__v8df) __W,		(__v8df) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_maskz_rcp14_pd (__mmask8 __U, __m512d __A)		_mm512_maskz_rcp14_pd (__mmask8 __U, __m512d __A)
{		{
return (__m512d) __builtin_ia32_rcp14pd512_mask ((__v8df) __A,		return (__m512d) __builtin_ia32_rcp14pd512_mask ((__v8df) __A,
(__v8df)		(__v8df)
_mm512_setzero_pd (),		_mm512_setzero_pd (),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_rcp14_ps(__m512 __A)		_mm512_rcp14_ps(__m512 __A)
{		{
return (__m512) __builtin_ia32_rcp14ps512_mask ((__v16sf) __A,		return (__m512) __builtin_ia32_rcp14ps512_mask ((__v16sf) __A,
(__v16sf)		(__v16sf)
_mm512_setzero_ps (),		_mm512_setzero_ps (),
(__mmask16) -1);		(__mmask16) -1);
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_mask_rcp14_ps (__m512 __W, __mmask16 __U, __m512 __A)		_mm512_mask_rcp14_ps (__m512 __W, __mmask16 __U, __m512 __A)
{		{
return (__m512) __builtin_ia32_rcp14ps512_mask ((__v16sf) __A,		return (__m512) __builtin_ia32_rcp14ps512_mask ((__v16sf) __A,
(__v16sf) __W,		(__v16sf) __W,
(__mmask16) __U);		(__mmask16) __U);
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_maskz_rcp14_ps (__mmask16 __U, __m512 __A)		_mm512_maskz_rcp14_ps (__mmask16 __U, __m512 __A)
{		{
return (__m512) __builtin_ia32_rcp14ps512_mask ((__v16sf) __A,		return (__m512) __builtin_ia32_rcp14ps512_mask ((__v16sf) __A,
(__v16sf)		(__v16sf)
_mm512_setzero_ps (),		_mm512_setzero_ps (),
(__mmask16) __U);		(__mmask16) __U);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_rcp14_ss(__m128 __A, __m128 __B)		_mm_rcp14_ss(__m128 __A, __m128 __B)
{		{
return (__m128) __builtin_ia32_rcp14ss_mask ((__v4sf) __A,		return (__m128) __builtin_ia32_rcp14ss_mask ((__v4sf) __A,
(__v4sf) __B,		(__v4sf) __B,
(__v4sf)		(__v4sf)
_mm_setzero_ps (),		_mm_setzero_ps (),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_mask_rcp14_ss (__m128 __W, __mmask8 __U, __m128 __A, __m128 __B)		_mm_mask_rcp14_ss (__m128 __W, __mmask8 __U, __m128 __A, __m128 __B)
{		{
return (__m128) __builtin_ia32_rcp14ss_mask ((__v4sf) __A,		return (__m128) __builtin_ia32_rcp14ss_mask ((__v4sf) __A,
(__v4sf) __B,		(__v4sf) __B,
(__v4sf) __W,		(__v4sf) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_maskz_rcp14_ss (__mmask8 __U, __m128 __A, __m128 __B)		_mm_maskz_rcp14_ss (__mmask8 __U, __m128 __A, __m128 __B)
{		{
return (__m128) __builtin_ia32_rcp14ss_mask ((__v4sf) __A,		return (__m128) __builtin_ia32_rcp14ss_mask ((__v4sf) __A,
(__v4sf) __B,		(__v4sf) __B,
(__v4sf) _mm_setzero_ps (),		(__v4sf) _mm_setzero_ps (),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_rcp14_sd(__m128d __A, __m128d __B)		_mm_rcp14_sd(__m128d __A, __m128d __B)
{		{
return (__m128d) __builtin_ia32_rcp14sd_mask ((__v2df) __A,		return (__m128d) __builtin_ia32_rcp14sd_mask ((__v2df) __A,
(__v2df) __B,		(__v2df) __B,
(__v2df)		(__v2df)
_mm_setzero_pd (),		_mm_setzero_pd (),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_mask_rcp14_sd (__m128d __W, __mmask8 __U, __m128d __A, __m128d __B)		_mm_mask_rcp14_sd (__m128d __W, __mmask8 __U, __m128d __A, __m128d __B)
{		{
return (__m128d) __builtin_ia32_rcp14sd_mask ( (__v2df) __A,		return (__m128d) __builtin_ia32_rcp14sd_mask ( (__v2df) __A,
(__v2df) __B,		(__v2df) __B,
(__v2df) __W,		(__v2df) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_maskz_rcp14_sd (__mmask8 __U, __m128d __A, __m128d __B)		_mm_maskz_rcp14_sd (__mmask8 __U, __m128d __A, __m128d __B)
{		{
return (__m128d) __builtin_ia32_rcp14sd_mask ( (__v2df) __A,		return (__m128d) __builtin_ia32_rcp14sd_mask ( (__v2df) __A,
(__v2df) __B,		(__v2df) __B,
(__v2df) _mm_setzero_pd (),		(__v2df) _mm_setzero_pd (),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline __m512 __DEFAULT_FN_ATTRS		static __inline __m512 __DEFAULT_FN_ATTRS512
_mm512_floor_ps(__m512 __A)		_mm512_floor_ps(__m512 __A)
{		{
return (__m512) __builtin_ia32_rndscaleps_mask ((__v16sf) __A,		return (__m512) __builtin_ia32_rndscaleps_mask ((__v16sf) __A,
_MM_FROUND_FLOOR,		_MM_FROUND_FLOOR,
(__v16sf) __A, -1,		(__v16sf) __A, -1,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_mask_floor_ps (__m512 __W, __mmask16 __U, __m512 __A)		_mm512_mask_floor_ps (__m512 __W, __mmask16 __U, __m512 __A)
{		{
return (__m512) __builtin_ia32_rndscaleps_mask ((__v16sf) __A,		return (__m512) __builtin_ia32_rndscaleps_mask ((__v16sf) __A,
_MM_FROUND_FLOOR,		_MM_FROUND_FLOOR,
(__v16sf) __W, __U,		(__v16sf) __W, __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline __m512d __DEFAULT_FN_ATTRS		static __inline __m512d __DEFAULT_FN_ATTRS512
_mm512_floor_pd(__m512d __A)		_mm512_floor_pd(__m512d __A)
{		{
return (__m512d) __builtin_ia32_rndscalepd_mask ((__v8df) __A,		return (__m512d) __builtin_ia32_rndscalepd_mask ((__v8df) __A,
_MM_FROUND_FLOOR,		_MM_FROUND_FLOOR,
(__v8df) __A, -1,		(__v8df) __A, -1,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_mask_floor_pd (__m512d __W, __mmask8 __U, __m512d __A)		_mm512_mask_floor_pd (__m512d __W, __mmask8 __U, __m512d __A)
{		{
return (__m512d) __builtin_ia32_rndscalepd_mask ((__v8df) __A,		return (__m512d) __builtin_ia32_rndscalepd_mask ((__v8df) __A,
_MM_FROUND_FLOOR,		_MM_FROUND_FLOOR,
(__v8df) __W, __U,		(__v8df) __W, __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_mask_ceil_ps (__m512 __W, __mmask16 __U, __m512 __A)		_mm512_mask_ceil_ps (__m512 __W, __mmask16 __U, __m512 __A)
{		{
return (__m512) __builtin_ia32_rndscaleps_mask ((__v16sf) __A,		return (__m512) __builtin_ia32_rndscaleps_mask ((__v16sf) __A,
_MM_FROUND_CEIL,		_MM_FROUND_CEIL,
(__v16sf) __W, __U,		(__v16sf) __W, __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline __m512 __DEFAULT_FN_ATTRS		static __inline __m512 __DEFAULT_FN_ATTRS512
_mm512_ceil_ps(__m512 __A)		_mm512_ceil_ps(__m512 __A)
{		{
return (__m512) __builtin_ia32_rndscaleps_mask ((__v16sf) __A,		return (__m512) __builtin_ia32_rndscaleps_mask ((__v16sf) __A,
_MM_FROUND_CEIL,		_MM_FROUND_CEIL,
(__v16sf) __A, -1,		(__v16sf) __A, -1,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline __m512d __DEFAULT_FN_ATTRS		static __inline __m512d __DEFAULT_FN_ATTRS512
_mm512_ceil_pd(__m512d __A)		_mm512_ceil_pd(__m512d __A)
{		{
return (__m512d) __builtin_ia32_rndscalepd_mask ((__v8df) __A,		return (__m512d) __builtin_ia32_rndscalepd_mask ((__v8df) __A,
_MM_FROUND_CEIL,		_MM_FROUND_CEIL,
(__v8df) __A, -1,		(__v8df) __A, -1,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_mask_ceil_pd (__m512d __W, __mmask8 __U, __m512d __A)		_mm512_mask_ceil_pd (__m512d __W, __mmask8 __U, __m512d __A)
{		{
return (__m512d) __builtin_ia32_rndscalepd_mask ((__v8df) __A,		return (__m512d) __builtin_ia32_rndscalepd_mask ((__v8df) __A,
_MM_FROUND_CEIL,		_MM_FROUND_CEIL,
(__v8df) __W, __U,		(__v8df) __W, __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline __m512i __DEFAULT_FN_ATTRS		static __inline __m512i __DEFAULT_FN_ATTRS512
_mm512_abs_epi64(__m512i __A)		_mm512_abs_epi64(__m512i __A)
{		{
return (__m512i)__builtin_ia32_pabsq512((__v8di)__A);		return (__m512i)__builtin_ia32_pabsq512((__v8di)__A);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_abs_epi64 (__m512i __W, __mmask8 __U, __m512i __A)		_mm512_mask_abs_epi64 (__m512i __W, __mmask8 __U, __m512i __A)
{		{
return (__m512i)__builtin_ia32_selectq_512((__mmask8)__U,		return (__m512i)__builtin_ia32_selectq_512((__mmask8)__U,
(__v8di)_mm512_abs_epi64(__A),		(__v8di)_mm512_abs_epi64(__A),
(__v8di)__W);		(__v8di)__W);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_abs_epi64 (__mmask8 __U, __m512i __A)		_mm512_maskz_abs_epi64 (__mmask8 __U, __m512i __A)
{		{
return (__m512i)__builtin_ia32_selectq_512((__mmask8)__U,		return (__m512i)__builtin_ia32_selectq_512((__mmask8)__U,
(__v8di)_mm512_abs_epi64(__A),		(__v8di)_mm512_abs_epi64(__A),
(__v8di)_mm512_setzero_si512());		(__v8di)_mm512_setzero_si512());
}		}

static __inline __m512i __DEFAULT_FN_ATTRS		static __inline __m512i __DEFAULT_FN_ATTRS512
_mm512_abs_epi32(__m512i __A)		_mm512_abs_epi32(__m512i __A)
{		{
return (__m512i)__builtin_ia32_pabsd512((__v16si) __A);		return (__m512i)__builtin_ia32_pabsd512((__v16si) __A);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_abs_epi32 (__m512i __W, __mmask16 __U, __m512i __A)		_mm512_mask_abs_epi32 (__m512i __W, __mmask16 __U, __m512i __A)
{		{
return (__m512i)__builtin_ia32_selectd_512(__U,		return (__m512i)__builtin_ia32_selectd_512(__U,
(__v16si)_mm512_abs_epi32(__A),		(__v16si)_mm512_abs_epi32(__A),
(__v16si)__W);		(__v16si)__W);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_abs_epi32 (__mmask16 __U, __m512i __A)		_mm512_maskz_abs_epi32 (__mmask16 __U, __m512i __A)
{		{
return (__m512i)__builtin_ia32_selectd_512(__U,		return (__m512i)__builtin_ia32_selectd_512(__U,
(__v16si)_mm512_abs_epi32(__A),		(__v16si)_mm512_abs_epi32(__A),
(__v16si)_mm512_setzero_si512());		(__v16si)_mm512_setzero_si512());
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_mask_add_ss(__m128 __W, __mmask8 __U,__m128 __A, __m128 __B) {		_mm_mask_add_ss(__m128 __W, __mmask8 __U,__m128 __A, __m128 __B) {
__A = _mm_add_ss(__A, __B);		__A = _mm_add_ss(__A, __B);
__A[0] = (__U & 1) ? __A[0] : __W[0];		__A[0] = (__U & 1) ? __A[0] : __W[0];
return __A;		return __A;
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_maskz_add_ss(__mmask8 __U,__m128 __A, __m128 __B) {		_mm_maskz_add_ss(__mmask8 __U,__m128 __A, __m128 __B) {
__A = _mm_add_ss(__A, __B);		__A = _mm_add_ss(__A, __B);
__A[0] = (__U & 1) ? __A[0] : 0;		__A[0] = (__U & 1) ? __A[0] : 0;
return __A;		return __A;
}		}

#define _mm_add_round_ss(A, B, R) \		#define _mm_add_round_ss(A, B, R) \
(__m128)__builtin_ia32_addss_round_mask((__v4sf)(__m128)(A), \		(__m128)__builtin_ia32_addss_round_mask((__v4sf)(__m128)(A), \
(__v4sf)(__m128)(B), \		(__v4sf)(__m128)(B), \
(__v4sf)_mm_setzero_ps(), \		(__v4sf)_mm_setzero_ps(), \
(__mmask8)-1, (int)(R))		(__mmask8)-1, (int)(R))

#define _mm_mask_add_round_ss(W, U, A, B, R) \		#define _mm_mask_add_round_ss(W, U, A, B, R) \
(__m128)__builtin_ia32_addss_round_mask((__v4sf)(__m128)(A), \		(__m128)__builtin_ia32_addss_round_mask((__v4sf)(__m128)(A), \
(__v4sf)(__m128)(B), \		(__v4sf)(__m128)(B), \
(__v4sf)(__m128)(W), (__mmask8)(U), \		(__v4sf)(__m128)(W), (__mmask8)(U), \
(int)(R))		(int)(R))

#define _mm_maskz_add_round_ss(U, A, B, R) \		#define _mm_maskz_add_round_ss(U, A, B, R) \
(__m128)__builtin_ia32_addss_round_mask((__v4sf)(__m128)(A), \		(__m128)__builtin_ia32_addss_round_mask((__v4sf)(__m128)(A), \
(__v4sf)(__m128)(B), \		(__v4sf)(__m128)(B), \
(__v4sf)_mm_setzero_ps(), \		(__v4sf)_mm_setzero_ps(), \
(__mmask8)(U), (int)(R))		(__mmask8)(U), (int)(R))

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_mask_add_sd(__m128d __W, __mmask8 __U,__m128d __A, __m128d __B) {		_mm_mask_add_sd(__m128d __W, __mmask8 __U,__m128d __A, __m128d __B) {
__A = _mm_add_sd(__A, __B);		__A = _mm_add_sd(__A, __B);
__A[0] = (__U & 1) ? __A[0] : __W[0];		__A[0] = (__U & 1) ? __A[0] : __W[0];
return __A;		return __A;
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_maskz_add_sd(__mmask8 __U,__m128d __A, __m128d __B) {		_mm_maskz_add_sd(__mmask8 __U,__m128d __A, __m128d __B) {
__A = _mm_add_sd(__A, __B);		__A = _mm_add_sd(__A, __B);
__A[0] = (__U & 1) ? __A[0] : 0;		__A[0] = (__U & 1) ? __A[0] : 0;
return __A;		return __A;
}		}
#define _mm_add_round_sd(A, B, R) \		#define _mm_add_round_sd(A, B, R) \
(__m128d)__builtin_ia32_addsd_round_mask((__v2df)(__m128d)(A), \		(__m128d)__builtin_ia32_addsd_round_mask((__v2df)(__m128d)(A), \
(__v2df)(__m128d)(B), \		(__v2df)(__m128d)(B), \
(__v2df)_mm_setzero_pd(), \		(__v2df)_mm_setzero_pd(), \
(__mmask8)-1, (int)(R))		(__mmask8)-1, (int)(R))

#define _mm_mask_add_round_sd(W, U, A, B, R) \		#define _mm_mask_add_round_sd(W, U, A, B, R) \
(__m128d)__builtin_ia32_addsd_round_mask((__v2df)(__m128d)(A), \		(__m128d)__builtin_ia32_addsd_round_mask((__v2df)(__m128d)(A), \
(__v2df)(__m128d)(B), \		(__v2df)(__m128d)(B), \
(__v2df)(__m128d)(W), \		(__v2df)(__m128d)(W), \
(__mmask8)(U), (int)(R))		(__mmask8)(U), (int)(R))

#define _mm_maskz_add_round_sd(U, A, B, R) \		#define _mm_maskz_add_round_sd(U, A, B, R) \
(__m128d)__builtin_ia32_addsd_round_mask((__v2df)(__m128d)(A), \		(__m128d)__builtin_ia32_addsd_round_mask((__v2df)(__m128d)(A), \
(__v2df)(__m128d)(B), \		(__v2df)(__m128d)(B), \
(__v2df)_mm_setzero_pd(), \		(__v2df)_mm_setzero_pd(), \
(__mmask8)(U), (int)(R))		(__mmask8)(U), (int)(R))

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_mask_add_pd(__m512d __W, __mmask8 __U, __m512d __A, __m512d __B) {		_mm512_mask_add_pd(__m512d __W, __mmask8 __U, __m512d __A, __m512d __B) {
return (__m512d)__builtin_ia32_selectpd_512((__mmask8)__U,		return (__m512d)__builtin_ia32_selectpd_512((__mmask8)__U,
(__v8df)_mm512_add_pd(__A, __B),		(__v8df)_mm512_add_pd(__A, __B),
(__v8df)__W);		(__v8df)__W);
}		}

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_maskz_add_pd(__mmask8 __U, __m512d __A, __m512d __B) {		_mm512_maskz_add_pd(__mmask8 __U, __m512d __A, __m512d __B) {
return (__m512d)__builtin_ia32_selectpd_512((__mmask8)__U,		return (__m512d)__builtin_ia32_selectpd_512((__mmask8)__U,
(__v8df)_mm512_add_pd(__A, __B),		(__v8df)_mm512_add_pd(__A, __B),
(__v8df)_mm512_setzero_pd());		(__v8df)_mm512_setzero_pd());
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_mask_add_ps(__m512 __W, __mmask16 __U, __m512 __A, __m512 __B) {		_mm512_mask_add_ps(__m512 __W, __mmask16 __U, __m512 __A, __m512 __B) {
return (__m512)__builtin_ia32_selectps_512((__mmask16)__U,		return (__m512)__builtin_ia32_selectps_512((__mmask16)__U,
(__v16sf)_mm512_add_ps(__A, __B),		(__v16sf)_mm512_add_ps(__A, __B),
(__v16sf)__W);		(__v16sf)__W);
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_maskz_add_ps(__mmask16 __U, __m512 __A, __m512 __B) {		_mm512_maskz_add_ps(__mmask16 __U, __m512 __A, __m512 __B) {
return (__m512)__builtin_ia32_selectps_512((__mmask16)__U,		return (__m512)__builtin_ia32_selectps_512((__mmask16)__U,
(__v16sf)_mm512_add_ps(__A, __B),		(__v16sf)_mm512_add_ps(__A, __B),
(__v16sf)_mm512_setzero_ps());		(__v16sf)_mm512_setzero_ps());
}		}

#define _mm512_add_round_pd(A, B, R) \		#define _mm512_add_round_pd(A, B, R) \
(__m512d)__builtin_ia32_addpd512((__v8df)(__m512d)(A), \		(__m512d)__builtin_ia32_addpd512((__v8df)(__m512d)(A), \
Show All 18 Lines	(__m512)__builtin_ia32_selectps_512((__mmask16)(U), \
(__v16sf)_mm512_add_round_ps((A), (B), (R)), \		(__v16sf)_mm512_add_round_ps((A), (B), (R)), \
(__v16sf)(__m512)(W));		(__v16sf)(__m512)(W));

#define _mm512_maskz_add_round_ps(U, A, B, R) \		#define _mm512_maskz_add_round_ps(U, A, B, R) \
(__m512)__builtin_ia32_selectps_512((__mmask16)(U), \		(__m512)__builtin_ia32_selectps_512((__mmask16)(U), \
(__v16sf)_mm512_add_round_ps((A), (B), (R)), \		(__v16sf)_mm512_add_round_ps((A), (B), (R)), \
(__v16sf)_mm512_setzero_ps());		(__v16sf)_mm512_setzero_ps());

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_mask_sub_ss(__m128 __W, __mmask8 __U,__m128 __A, __m128 __B) {		_mm_mask_sub_ss(__m128 __W, __mmask8 __U,__m128 __A, __m128 __B) {
__A = _mm_sub_ss(__A, __B);		__A = _mm_sub_ss(__A, __B);
__A[0] = (__U & 1) ? __A[0] : __W[0];		__A[0] = (__U & 1) ? __A[0] : __W[0];
return __A;		return __A;
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_maskz_sub_ss(__mmask8 __U,__m128 __A, __m128 __B) {		_mm_maskz_sub_ss(__mmask8 __U,__m128 __A, __m128 __B) {
__A = _mm_sub_ss(__A, __B);		__A = _mm_sub_ss(__A, __B);
__A[0] = (__U & 1) ? __A[0] : 0;		__A[0] = (__U & 1) ? __A[0] : 0;
return __A;		return __A;
}		}
#define _mm_sub_round_ss(A, B, R) \		#define _mm_sub_round_ss(A, B, R) \
(__m128)__builtin_ia32_subss_round_mask((__v4sf)(__m128)(A), \		(__m128)__builtin_ia32_subss_round_mask((__v4sf)(__m128)(A), \
(__v4sf)(__m128)(B), \		(__v4sf)(__m128)(B), \
(__v4sf)_mm_setzero_ps(), \		(__v4sf)_mm_setzero_ps(), \
(__mmask8)-1, (int)(R))		(__mmask8)-1, (int)(R))

#define _mm_mask_sub_round_ss(W, U, A, B, R) \		#define _mm_mask_sub_round_ss(W, U, A, B, R) \
(__m128)__builtin_ia32_subss_round_mask((__v4sf)(__m128)(A), \		(__m128)__builtin_ia32_subss_round_mask((__v4sf)(__m128)(A), \
(__v4sf)(__m128)(B), \		(__v4sf)(__m128)(B), \
(__v4sf)(__m128)(W), (__mmask8)(U), \		(__v4sf)(__m128)(W), (__mmask8)(U), \
(int)(R))		(int)(R))

#define _mm_maskz_sub_round_ss(U, A, B, R) \		#define _mm_maskz_sub_round_ss(U, A, B, R) \
(__m128)__builtin_ia32_subss_round_mask((__v4sf)(__m128)(A), \		(__m128)__builtin_ia32_subss_round_mask((__v4sf)(__m128)(A), \
(__v4sf)(__m128)(B), \		(__v4sf)(__m128)(B), \
(__v4sf)_mm_setzero_ps(), \		(__v4sf)_mm_setzero_ps(), \
(__mmask8)(U), (int)(R))		(__mmask8)(U), (int)(R))

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_mask_sub_sd(__m128d __W, __mmask8 __U,__m128d __A, __m128d __B) {		_mm_mask_sub_sd(__m128d __W, __mmask8 __U,__m128d __A, __m128d __B) {
__A = _mm_sub_sd(__A, __B);		__A = _mm_sub_sd(__A, __B);
__A[0] = (__U & 1) ? __A[0] : __W[0];		__A[0] = (__U & 1) ? __A[0] : __W[0];
return __A;		return __A;
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_maskz_sub_sd(__mmask8 __U,__m128d __A, __m128d __B) {		_mm_maskz_sub_sd(__mmask8 __U,__m128d __A, __m128d __B) {
__A = _mm_sub_sd(__A, __B);		__A = _mm_sub_sd(__A, __B);
__A[0] = (__U & 1) ? __A[0] : 0;		__A[0] = (__U & 1) ? __A[0] : 0;
return __A;		return __A;
}		}

#define _mm_sub_round_sd(A, B, R) \		#define _mm_sub_round_sd(A, B, R) \
(__m128d)__builtin_ia32_subsd_round_mask((__v2df)(__m128d)(A), \		(__m128d)__builtin_ia32_subsd_round_mask((__v2df)(__m128d)(A), \
(__v2df)(__m128d)(B), \		(__v2df)(__m128d)(B), \
(__v2df)_mm_setzero_pd(), \		(__v2df)_mm_setzero_pd(), \
(__mmask8)-1, (int)(R))		(__mmask8)-1, (int)(R))

#define _mm_mask_sub_round_sd(W, U, A, B, R) \		#define _mm_mask_sub_round_sd(W, U, A, B, R) \
(__m128d)__builtin_ia32_subsd_round_mask((__v2df)(__m128d)(A), \		(__m128d)__builtin_ia32_subsd_round_mask((__v2df)(__m128d)(A), \
(__v2df)(__m128d)(B), \		(__v2df)(__m128d)(B), \
(__v2df)(__m128d)(W), \		(__v2df)(__m128d)(W), \
(__mmask8)(U), (int)(R))		(__mmask8)(U), (int)(R))

#define _mm_maskz_sub_round_sd(U, A, B, R) \		#define _mm_maskz_sub_round_sd(U, A, B, R) \
(__m128d)__builtin_ia32_subsd_round_mask((__v2df)(__m128d)(A), \		(__m128d)__builtin_ia32_subsd_round_mask((__v2df)(__m128d)(A), \
(__v2df)(__m128d)(B), \		(__v2df)(__m128d)(B), \
(__v2df)_mm_setzero_pd(), \		(__v2df)_mm_setzero_pd(), \
(__mmask8)(U), (int)(R))		(__mmask8)(U), (int)(R))

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_mask_sub_pd(__m512d __W, __mmask8 __U, __m512d __A, __m512d __B) {		_mm512_mask_sub_pd(__m512d __W, __mmask8 __U, __m512d __A, __m512d __B) {
return (__m512d)__builtin_ia32_selectpd_512((__mmask8)__U,		return (__m512d)__builtin_ia32_selectpd_512((__mmask8)__U,
(__v8df)_mm512_sub_pd(__A, __B),		(__v8df)_mm512_sub_pd(__A, __B),
(__v8df)__W);		(__v8df)__W);
}		}

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_maskz_sub_pd(__mmask8 __U, __m512d __A, __m512d __B) {		_mm512_maskz_sub_pd(__mmask8 __U, __m512d __A, __m512d __B) {
return (__m512d)__builtin_ia32_selectpd_512((__mmask8)__U,		return (__m512d)__builtin_ia32_selectpd_512((__mmask8)__U,
(__v8df)_mm512_sub_pd(__A, __B),		(__v8df)_mm512_sub_pd(__A, __B),
(__v8df)_mm512_setzero_pd());		(__v8df)_mm512_setzero_pd());
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_mask_sub_ps(__m512 __W, __mmask16 __U, __m512 __A, __m512 __B) {		_mm512_mask_sub_ps(__m512 __W, __mmask16 __U, __m512 __A, __m512 __B) {
return (__m512)__builtin_ia32_selectps_512((__mmask16)__U,		return (__m512)__builtin_ia32_selectps_512((__mmask16)__U,
(__v16sf)_mm512_sub_ps(__A, __B),		(__v16sf)_mm512_sub_ps(__A, __B),
(__v16sf)__W);		(__v16sf)__W);
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_maskz_sub_ps(__mmask16 __U, __m512 __A, __m512 __B) {		_mm512_maskz_sub_ps(__mmask16 __U, __m512 __A, __m512 __B) {
return (__m512)__builtin_ia32_selectps_512((__mmask16)__U,		return (__m512)__builtin_ia32_selectps_512((__mmask16)__U,
(__v16sf)_mm512_sub_ps(__A, __B),		(__v16sf)_mm512_sub_ps(__A, __B),
(__v16sf)_mm512_setzero_ps());		(__v16sf)_mm512_setzero_ps());
}		}

#define _mm512_sub_round_pd(A, B, R) \		#define _mm512_sub_round_pd(A, B, R) \
(__m512d)__builtin_ia32_subpd512((__v8df)(__m512d)(A), \		(__m512d)__builtin_ia32_subpd512((__v8df)(__m512d)(A), \
Show All 18 Lines	(__m512)__builtin_ia32_selectps_512((__mmask16)(U), \
(__v16sf)_mm512_sub_round_ps((A), (B), (R)), \		(__v16sf)_mm512_sub_round_ps((A), (B), (R)), \
(__v16sf)(__m512)(W));		(__v16sf)(__m512)(W));

#define _mm512_maskz_sub_round_ps(U, A, B, R) \		#define _mm512_maskz_sub_round_ps(U, A, B, R) \
(__m512)__builtin_ia32_selectps_512((__mmask16)(U), \		(__m512)__builtin_ia32_selectps_512((__mmask16)(U), \
(__v16sf)_mm512_sub_round_ps((A), (B), (R)), \		(__v16sf)_mm512_sub_round_ps((A), (B), (R)), \
(__v16sf)_mm512_setzero_ps());		(__v16sf)_mm512_setzero_ps());

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_mask_mul_ss(__m128 __W, __mmask8 __U,__m128 __A, __m128 __B) {		_mm_mask_mul_ss(__m128 __W, __mmask8 __U,__m128 __A, __m128 __B) {
__A = _mm_mul_ss(__A, __B);		__A = _mm_mul_ss(__A, __B);
__A[0] = (__U & 1) ? __A[0] : __W[0];		__A[0] = (__U & 1) ? __A[0] : __W[0];
return __A;		return __A;
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_maskz_mul_ss(__mmask8 __U,__m128 __A, __m128 __B) {		_mm_maskz_mul_ss(__mmask8 __U,__m128 __A, __m128 __B) {
__A = _mm_mul_ss(__A, __B);		__A = _mm_mul_ss(__A, __B);
__A[0] = (__U & 1) ? __A[0] : 0;		__A[0] = (__U & 1) ? __A[0] : 0;
return __A;		return __A;
}		}
#define _mm_mul_round_ss(A, B, R) \		#define _mm_mul_round_ss(A, B, R) \
(__m128)__builtin_ia32_mulss_round_mask((__v4sf)(__m128)(A), \		(__m128)__builtin_ia32_mulss_round_mask((__v4sf)(__m128)(A), \
(__v4sf)(__m128)(B), \		(__v4sf)(__m128)(B), \
(__v4sf)_mm_setzero_ps(), \		(__v4sf)_mm_setzero_ps(), \
(__mmask8)-1, (int)(R))		(__mmask8)-1, (int)(R))

#define _mm_mask_mul_round_ss(W, U, A, B, R) \		#define _mm_mask_mul_round_ss(W, U, A, B, R) \
(__m128)__builtin_ia32_mulss_round_mask((__v4sf)(__m128)(A), \		(__m128)__builtin_ia32_mulss_round_mask((__v4sf)(__m128)(A), \
(__v4sf)(__m128)(B), \		(__v4sf)(__m128)(B), \
(__v4sf)(__m128)(W), (__mmask8)(U), \		(__v4sf)(__m128)(W), (__mmask8)(U), \
(int)(R))		(int)(R))

#define _mm_maskz_mul_round_ss(U, A, B, R) \		#define _mm_maskz_mul_round_ss(U, A, B, R) \
(__m128)__builtin_ia32_mulss_round_mask((__v4sf)(__m128)(A), \		(__m128)__builtin_ia32_mulss_round_mask((__v4sf)(__m128)(A), \
(__v4sf)(__m128)(B), \		(__v4sf)(__m128)(B), \
(__v4sf)_mm_setzero_ps(), \		(__v4sf)_mm_setzero_ps(), \
(__mmask8)(U), (int)(R))		(__mmask8)(U), (int)(R))

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_mask_mul_sd(__m128d __W, __mmask8 __U,__m128d __A, __m128d __B) {		_mm_mask_mul_sd(__m128d __W, __mmask8 __U,__m128d __A, __m128d __B) {
__A = _mm_mul_sd(__A, __B);		__A = _mm_mul_sd(__A, __B);
__A[0] = (__U & 1) ? __A[0] : __W[0];		__A[0] = (__U & 1) ? __A[0] : __W[0];
return __A;		return __A;
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_maskz_mul_sd(__mmask8 __U,__m128d __A, __m128d __B) {		_mm_maskz_mul_sd(__mmask8 __U,__m128d __A, __m128d __B) {
__A = _mm_mul_sd(__A, __B);		__A = _mm_mul_sd(__A, __B);
__A[0] = (__U & 1) ? __A[0] : 0;		__A[0] = (__U & 1) ? __A[0] : 0;
return __A;		return __A;
}		}

#define _mm_mul_round_sd(A, B, R) \		#define _mm_mul_round_sd(A, B, R) \
(__m128d)__builtin_ia32_mulsd_round_mask((__v2df)(__m128d)(A), \		(__m128d)__builtin_ia32_mulsd_round_mask((__v2df)(__m128d)(A), \
(__v2df)(__m128d)(B), \		(__v2df)(__m128d)(B), \
(__v2df)_mm_setzero_pd(), \		(__v2df)_mm_setzero_pd(), \
(__mmask8)-1, (int)(R))		(__mmask8)-1, (int)(R))

#define _mm_mask_mul_round_sd(W, U, A, B, R) \		#define _mm_mask_mul_round_sd(W, U, A, B, R) \
(__m128d)__builtin_ia32_mulsd_round_mask((__v2df)(__m128d)(A), \		(__m128d)__builtin_ia32_mulsd_round_mask((__v2df)(__m128d)(A), \
(__v2df)(__m128d)(B), \		(__v2df)(__m128d)(B), \
(__v2df)(__m128d)(W), \		(__v2df)(__m128d)(W), \
(__mmask8)(U), (int)(R))		(__mmask8)(U), (int)(R))

#define _mm_maskz_mul_round_sd(U, A, B, R) \		#define _mm_maskz_mul_round_sd(U, A, B, R) \
(__m128d)__builtin_ia32_mulsd_round_mask((__v2df)(__m128d)(A), \		(__m128d)__builtin_ia32_mulsd_round_mask((__v2df)(__m128d)(A), \
(__v2df)(__m128d)(B), \		(__v2df)(__m128d)(B), \
(__v2df)_mm_setzero_pd(), \		(__v2df)_mm_setzero_pd(), \
(__mmask8)(U), (int)(R))		(__mmask8)(U), (int)(R))

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_mask_mul_pd(__m512d __W, __mmask8 __U, __m512d __A, __m512d __B) {		_mm512_mask_mul_pd(__m512d __W, __mmask8 __U, __m512d __A, __m512d __B) {
return (__m512d)__builtin_ia32_selectpd_512((__mmask8)__U,		return (__m512d)__builtin_ia32_selectpd_512((__mmask8)__U,
(__v8df)_mm512_mul_pd(__A, __B),		(__v8df)_mm512_mul_pd(__A, __B),
(__v8df)__W);		(__v8df)__W);
}		}

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_maskz_mul_pd(__mmask8 __U, __m512d __A, __m512d __B) {		_mm512_maskz_mul_pd(__mmask8 __U, __m512d __A, __m512d __B) {
return (__m512d)__builtin_ia32_selectpd_512((__mmask8)__U,		return (__m512d)__builtin_ia32_selectpd_512((__mmask8)__U,
(__v8df)_mm512_mul_pd(__A, __B),		(__v8df)_mm512_mul_pd(__A, __B),
(__v8df)_mm512_setzero_pd());		(__v8df)_mm512_setzero_pd());
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_mask_mul_ps(__m512 __W, __mmask16 __U, __m512 __A, __m512 __B) {		_mm512_mask_mul_ps(__m512 __W, __mmask16 __U, __m512 __A, __m512 __B) {
return (__m512)__builtin_ia32_selectps_512((__mmask16)__U,		return (__m512)__builtin_ia32_selectps_512((__mmask16)__U,
(__v16sf)_mm512_mul_ps(__A, __B),		(__v16sf)_mm512_mul_ps(__A, __B),
(__v16sf)__W);		(__v16sf)__W);
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_maskz_mul_ps(__mmask16 __U, __m512 __A, __m512 __B) {		_mm512_maskz_mul_ps(__mmask16 __U, __m512 __A, __m512 __B) {
return (__m512)__builtin_ia32_selectps_512((__mmask16)__U,		return (__m512)__builtin_ia32_selectps_512((__mmask16)__U,
(__v16sf)_mm512_mul_ps(__A, __B),		(__v16sf)_mm512_mul_ps(__A, __B),
(__v16sf)_mm512_setzero_ps());		(__v16sf)_mm512_setzero_ps());
}		}

#define _mm512_mul_round_pd(A, B, R) \		#define _mm512_mul_round_pd(A, B, R) \
(__m512d)__builtin_ia32_mulpd512((__v8df)(__m512d)(A), \		(__m512d)__builtin_ia32_mulpd512((__v8df)(__m512d)(A), \
Show All 18 Lines	(__m512)__builtin_ia32_selectps_512((__mmask16)(U), \
(__v16sf)_mm512_mul_round_ps((A), (B), (R)), \		(__v16sf)_mm512_mul_round_ps((A), (B), (R)), \
(__v16sf)(__m512)(W));		(__v16sf)(__m512)(W));

#define _mm512_maskz_mul_round_ps(U, A, B, R) \		#define _mm512_maskz_mul_round_ps(U, A, B, R) \
(__m512)__builtin_ia32_selectps_512((__mmask16)(U), \		(__m512)__builtin_ia32_selectps_512((__mmask16)(U), \
(__v16sf)_mm512_mul_round_ps((A), (B), (R)), \		(__v16sf)_mm512_mul_round_ps((A), (B), (R)), \
(__v16sf)_mm512_setzero_ps());		(__v16sf)_mm512_setzero_ps());

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_mask_div_ss(__m128 __W, __mmask8 __U,__m128 __A, __m128 __B) {		_mm_mask_div_ss(__m128 __W, __mmask8 __U,__m128 __A, __m128 __B) {
return (__m128) __builtin_ia32_divss_round_mask ((__v4sf) __A,		return (__m128) __builtin_ia32_divss_round_mask ((__v4sf) __A,
(__v4sf) __B,		(__v4sf) __B,
(__v4sf) __W,		(__v4sf) __W,
(__mmask8) __U,		(__mmask8) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_maskz_div_ss(__mmask8 __U,__m128 __A, __m128 __B) {		_mm_maskz_div_ss(__mmask8 __U,__m128 __A, __m128 __B) {
return (__m128) __builtin_ia32_divss_round_mask ((__v4sf) __A,		return (__m128) __builtin_ia32_divss_round_mask ((__v4sf) __A,
(__v4sf) __B,		(__v4sf) __B,
(__v4sf) _mm_setzero_ps (),		(__v4sf) _mm_setzero_ps (),
(__mmask8) __U,		(__mmask8) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

Show All 10 Lines	(__m128)__builtin_ia32_divss_round_mask((__v4sf)(__m128)(A), \
(int)(R))		(int)(R))

#define _mm_maskz_div_round_ss(U, A, B, R) \		#define _mm_maskz_div_round_ss(U, A, B, R) \
(__m128)__builtin_ia32_divss_round_mask((__v4sf)(__m128)(A), \		(__m128)__builtin_ia32_divss_round_mask((__v4sf)(__m128)(A), \
(__v4sf)(__m128)(B), \		(__v4sf)(__m128)(B), \
(__v4sf)_mm_setzero_ps(), \		(__v4sf)_mm_setzero_ps(), \
(__mmask8)(U), (int)(R))		(__mmask8)(U), (int)(R))

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_mask_div_sd(__m128d __W, __mmask8 __U,__m128d __A, __m128d __B) {		_mm_mask_div_sd(__m128d __W, __mmask8 __U,__m128d __A, __m128d __B) {
return (__m128d) __builtin_ia32_divsd_round_mask ((__v2df) __A,		return (__m128d) __builtin_ia32_divsd_round_mask ((__v2df) __A,
(__v2df) __B,		(__v2df) __B,
(__v2df) __W,		(__v2df) __W,
(__mmask8) __U,		(__mmask8) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_maskz_div_sd(__mmask8 __U,__m128d __A, __m128d __B) {		_mm_maskz_div_sd(__mmask8 __U,__m128d __A, __m128d __B) {
return (__m128d) __builtin_ia32_divsd_round_mask ((__v2df) __A,		return (__m128d) __builtin_ia32_divsd_round_mask ((__v2df) __A,
(__v2df) __B,		(__v2df) __B,
(__v2df) _mm_setzero_pd (),		(__v2df) _mm_setzero_pd (),
(__mmask8) __U,		(__mmask8) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

Show All 10 Lines	(__m128d)__builtin_ia32_divsd_round_mask((__v2df)(__m128d)(A), \
(__mmask8)(U), (int)(R))		(__mmask8)(U), (int)(R))

#define _mm_maskz_div_round_sd(U, A, B, R) \		#define _mm_maskz_div_round_sd(U, A, B, R) \
(__m128d)__builtin_ia32_divsd_round_mask((__v2df)(__m128d)(A), \		(__m128d)__builtin_ia32_divsd_round_mask((__v2df)(__m128d)(A), \
(__v2df)(__m128d)(B), \		(__v2df)(__m128d)(B), \
(__v2df)_mm_setzero_pd(), \		(__v2df)_mm_setzero_pd(), \
(__mmask8)(U), (int)(R))		(__mmask8)(U), (int)(R))

static __inline __m512d __DEFAULT_FN_ATTRS		static __inline __m512d __DEFAULT_FN_ATTRS512
_mm512_div_pd(__m512d __a, __m512d __b)		_mm512_div_pd(__m512d __a, __m512d __b)
{		{
return (__m512d)((__v8df)__a/(__v8df)__b);		return (__m512d)((__v8df)__a/(__v8df)__b);
}		}

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_mask_div_pd(__m512d __W, __mmask8 __U, __m512d __A, __m512d __B) {		_mm512_mask_div_pd(__m512d __W, __mmask8 __U, __m512d __A, __m512d __B) {
return (__m512d)__builtin_ia32_selectpd_512((__mmask8)__U,		return (__m512d)__builtin_ia32_selectpd_512((__mmask8)__U,
(__v8df)_mm512_div_pd(__A, __B),		(__v8df)_mm512_div_pd(__A, __B),
(__v8df)__W);		(__v8df)__W);
}		}

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_maskz_div_pd(__mmask8 __U, __m512d __A, __m512d __B) {		_mm512_maskz_div_pd(__mmask8 __U, __m512d __A, __m512d __B) {
return (__m512d)__builtin_ia32_selectpd_512((__mmask8)__U,		return (__m512d)__builtin_ia32_selectpd_512((__mmask8)__U,
(__v8df)_mm512_div_pd(__A, __B),		(__v8df)_mm512_div_pd(__A, __B),
(__v8df)_mm512_setzero_pd());		(__v8df)_mm512_setzero_pd());
}		}

static __inline __m512 __DEFAULT_FN_ATTRS		static __inline __m512 __DEFAULT_FN_ATTRS512
_mm512_div_ps(__m512 __a, __m512 __b)		_mm512_div_ps(__m512 __a, __m512 __b)
{		{
return (__m512)((__v16sf)__a/(__v16sf)__b);		return (__m512)((__v16sf)__a/(__v16sf)__b);
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_mask_div_ps(__m512 __W, __mmask16 __U, __m512 __A, __m512 __B) {		_mm512_mask_div_ps(__m512 __W, __mmask16 __U, __m512 __A, __m512 __B) {
return (__m512)__builtin_ia32_selectps_512((__mmask16)__U,		return (__m512)__builtin_ia32_selectps_512((__mmask16)__U,
(__v16sf)_mm512_div_ps(__A, __B),		(__v16sf)_mm512_div_ps(__A, __B),
(__v16sf)__W);		(__v16sf)__W);
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_maskz_div_ps(__mmask16 __U, __m512 __A, __m512 __B) {		_mm512_maskz_div_ps(__mmask16 __U, __m512 __A, __m512 __B) {
return (__m512)__builtin_ia32_selectps_512((__mmask16)__U,		return (__m512)__builtin_ia32_selectps_512((__mmask16)__U,
(__v16sf)_mm512_div_ps(__A, __B),		(__v16sf)_mm512_div_ps(__A, __B),
(__v16sf)_mm512_setzero_ps());		(__v16sf)_mm512_setzero_ps());
}		}

#define _mm512_div_round_pd(A, B, R) \		#define _mm512_div_round_pd(A, B, R) \
(__m512d)__builtin_ia32_divpd512((__v8df)(__m512d)(A), \		(__m512d)__builtin_ia32_divpd512((__v8df)(__m512d)(A), \
▲ Show 20 Lines • Show All 166 Lines • ▼ Show 20 Lines

#define _mm512_maskz_fnmsub_round_pd(U, A, B, C, R) \		#define _mm512_maskz_fnmsub_round_pd(U, A, B, C, R) \
(__m512d)__builtin_ia32_vfmaddpd512_maskz(-(__v8df)(__m512d)(A), \		(__m512d)__builtin_ia32_vfmaddpd512_maskz(-(__v8df)(__m512d)(A), \
(__v8df)(__m512d)(B), \		(__v8df)(__m512d)(B), \
-(__v8df)(__m512d)(C), \		-(__v8df)(__m512d)(C), \
(__mmask8)(U), (int)(R))		(__mmask8)(U), (int)(R))


static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_fmadd_pd(__m512d __A, __m512d __B, __m512d __C)		_mm512_fmadd_pd(__m512d __A, __m512d __B, __m512d __C)
{		{
return (__m512d) __builtin_ia32_vfmaddpd512_mask ((__v8df) __A,		return (__m512d) __builtin_ia32_vfmaddpd512_mask ((__v8df) __A,
(__v8df) __B,		(__v8df) __B,
(__v8df) __C,		(__v8df) __C,
(__mmask8) -1,		(__mmask8) -1,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_mask_fmadd_pd(__m512d __A, __mmask8 __U, __m512d __B, __m512d __C)		_mm512_mask_fmadd_pd(__m512d __A, __mmask8 __U, __m512d __B, __m512d __C)
{		{
return (__m512d) __builtin_ia32_vfmaddpd512_mask ((__v8df) __A,		return (__m512d) __builtin_ia32_vfmaddpd512_mask ((__v8df) __A,
(__v8df) __B,		(__v8df) __B,
(__v8df) __C,		(__v8df) __C,
(__mmask8) __U,		(__mmask8) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_mask3_fmadd_pd(__m512d __A, __m512d __B, __m512d __C, __mmask8 __U)		_mm512_mask3_fmadd_pd(__m512d __A, __m512d __B, __m512d __C, __mmask8 __U)
{		{
return (__m512d) __builtin_ia32_vfmaddpd512_mask3 ((__v8df) __A,		return (__m512d) __builtin_ia32_vfmaddpd512_mask3 ((__v8df) __A,
(__v8df) __B,		(__v8df) __B,
(__v8df) __C,		(__v8df) __C,
(__mmask8) __U,		(__mmask8) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_maskz_fmadd_pd(__mmask8 __U, __m512d __A, __m512d __B, __m512d __C)		_mm512_maskz_fmadd_pd(__mmask8 __U, __m512d __A, __m512d __B, __m512d __C)
{		{
return (__m512d) __builtin_ia32_vfmaddpd512_maskz ((__v8df) __A,		return (__m512d) __builtin_ia32_vfmaddpd512_maskz ((__v8df) __A,
(__v8df) __B,		(__v8df) __B,
(__v8df) __C,		(__v8df) __C,
(__mmask8) __U,		(__mmask8) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_fmsub_pd(__m512d __A, __m512d __B, __m512d __C)		_mm512_fmsub_pd(__m512d __A, __m512d __B, __m512d __C)
{		{
return (__m512d) __builtin_ia32_vfmaddpd512_mask ((__v8df) __A,		return (__m512d) __builtin_ia32_vfmaddpd512_mask ((__v8df) __A,
(__v8df) __B,		(__v8df) __B,
-(__v8df) __C,		-(__v8df) __C,
(__mmask8) -1,		(__mmask8) -1,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_mask_fmsub_pd(__m512d __A, __mmask8 __U, __m512d __B, __m512d __C)		_mm512_mask_fmsub_pd(__m512d __A, __mmask8 __U, __m512d __B, __m512d __C)
{		{
return (__m512d) __builtin_ia32_vfmaddpd512_mask ((__v8df) __A,		return (__m512d) __builtin_ia32_vfmaddpd512_mask ((__v8df) __A,
(__v8df) __B,		(__v8df) __B,
-(__v8df) __C,		-(__v8df) __C,
(__mmask8) __U,		(__mmask8) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_maskz_fmsub_pd(__mmask8 __U, __m512d __A, __m512d __B, __m512d __C)		_mm512_maskz_fmsub_pd(__mmask8 __U, __m512d __A, __m512d __B, __m512d __C)
{		{
return (__m512d) __builtin_ia32_vfmaddpd512_maskz ((__v8df) __A,		return (__m512d) __builtin_ia32_vfmaddpd512_maskz ((__v8df) __A,
(__v8df) __B,		(__v8df) __B,
-(__v8df) __C,		-(__v8df) __C,
(__mmask8) __U,		(__mmask8) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_fnmadd_pd(__m512d __A, __m512d __B, __m512d __C)		_mm512_fnmadd_pd(__m512d __A, __m512d __B, __m512d __C)
{		{
return (__m512d) __builtin_ia32_vfmaddpd512_mask ((__v8df) __A,		return (__m512d) __builtin_ia32_vfmaddpd512_mask ((__v8df) __A,
-(__v8df) __B,		-(__v8df) __B,
(__v8df) __C,		(__v8df) __C,
(__mmask8) -1,		(__mmask8) -1,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_mask3_fnmadd_pd(__m512d __A, __m512d __B, __m512d __C, __mmask8 __U)		_mm512_mask3_fnmadd_pd(__m512d __A, __m512d __B, __m512d __C, __mmask8 __U)
{		{
return (__m512d) __builtin_ia32_vfmaddpd512_mask3 (-(__v8df) __A,		return (__m512d) __builtin_ia32_vfmaddpd512_mask3 (-(__v8df) __A,
(__v8df) __B,		(__v8df) __B,
(__v8df) __C,		(__v8df) __C,
(__mmask8) __U,		(__mmask8) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_maskz_fnmadd_pd(__mmask8 __U, __m512d __A, __m512d __B, __m512d __C)		_mm512_maskz_fnmadd_pd(__mmask8 __U, __m512d __A, __m512d __B, __m512d __C)
{		{
return (__m512d) __builtin_ia32_vfmaddpd512_maskz (-(__v8df) __A,		return (__m512d) __builtin_ia32_vfmaddpd512_maskz (-(__v8df) __A,
(__v8df) __B,		(__v8df) __B,
(__v8df) __C,		(__v8df) __C,
(__mmask8) __U,		(__mmask8) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_fnmsub_pd(__m512d __A, __m512d __B, __m512d __C)		_mm512_fnmsub_pd(__m512d __A, __m512d __B, __m512d __C)
{		{
return (__m512d) __builtin_ia32_vfmaddpd512_mask ((__v8df) __A,		return (__m512d) __builtin_ia32_vfmaddpd512_mask ((__v8df) __A,
-(__v8df) __B,		-(__v8df) __B,
-(__v8df) __C,		-(__v8df) __C,
(__mmask8) -1,		(__mmask8) -1,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_maskz_fnmsub_pd(__mmask8 __U, __m512d __A, __m512d __B, __m512d __C)		_mm512_maskz_fnmsub_pd(__mmask8 __U, __m512d __A, __m512d __B, __m512d __C)
{		{
return (__m512d) __builtin_ia32_vfmaddpd512_maskz (-(__v8df) __A,		return (__m512d) __builtin_ia32_vfmaddpd512_maskz (-(__v8df) __A,
(__v8df) __B,		(__v8df) __B,
-(__v8df) __C,		-(__v8df) __C,
(__mmask8) __U,		(__mmask8) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}
▲ Show 20 Lines • Show All 77 Lines • ▼ Show 20 Lines

#define _mm512_maskz_fnmsub_round_ps(U, A, B, C, R) \		#define _mm512_maskz_fnmsub_round_ps(U, A, B, C, R) \
(__m512)__builtin_ia32_vfmaddps512_maskz(-(__v16sf)(__m512)(A), \		(__m512)__builtin_ia32_vfmaddps512_maskz(-(__v16sf)(__m512)(A), \
(__v16sf)(__m512)(B), \		(__v16sf)(__m512)(B), \
-(__v16sf)(__m512)(C), \		-(__v16sf)(__m512)(C), \
(__mmask16)(U), (int)(R))		(__mmask16)(U), (int)(R))


static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_fmadd_ps(__m512 __A, __m512 __B, __m512 __C)		_mm512_fmadd_ps(__m512 __A, __m512 __B, __m512 __C)
{		{
return (__m512) __builtin_ia32_vfmaddps512_mask ((__v16sf) __A,		return (__m512) __builtin_ia32_vfmaddps512_mask ((__v16sf) __A,
(__v16sf) __B,		(__v16sf) __B,
(__v16sf) __C,		(__v16sf) __C,
(__mmask16) -1,		(__mmask16) -1,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_mask_fmadd_ps(__m512 __A, __mmask16 __U, __m512 __B, __m512 __C)		_mm512_mask_fmadd_ps(__m512 __A, __mmask16 __U, __m512 __B, __m512 __C)
{		{
return (__m512) __builtin_ia32_vfmaddps512_mask ((__v16sf) __A,		return (__m512) __builtin_ia32_vfmaddps512_mask ((__v16sf) __A,
(__v16sf) __B,		(__v16sf) __B,
(__v16sf) __C,		(__v16sf) __C,
(__mmask16) __U,		(__mmask16) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_mask3_fmadd_ps(__m512 __A, __m512 __B, __m512 __C, __mmask16 __U)		_mm512_mask3_fmadd_ps(__m512 __A, __m512 __B, __m512 __C, __mmask16 __U)
{		{
return (__m512) __builtin_ia32_vfmaddps512_mask3 ((__v16sf) __A,		return (__m512) __builtin_ia32_vfmaddps512_mask3 ((__v16sf) __A,
(__v16sf) __B,		(__v16sf) __B,
(__v16sf) __C,		(__v16sf) __C,
(__mmask16) __U,		(__mmask16) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_maskz_fmadd_ps(__mmask16 __U, __m512 __A, __m512 __B, __m512 __C)		_mm512_maskz_fmadd_ps(__mmask16 __U, __m512 __A, __m512 __B, __m512 __C)
{		{
return (__m512) __builtin_ia32_vfmaddps512_maskz ((__v16sf) __A,		return (__m512) __builtin_ia32_vfmaddps512_maskz ((__v16sf) __A,
(__v16sf) __B,		(__v16sf) __B,
(__v16sf) __C,		(__v16sf) __C,
(__mmask16) __U,		(__mmask16) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_fmsub_ps(__m512 __A, __m512 __B, __m512 __C)		_mm512_fmsub_ps(__m512 __A, __m512 __B, __m512 __C)
{		{
return (__m512) __builtin_ia32_vfmaddps512_mask ((__v16sf) __A,		return (__m512) __builtin_ia32_vfmaddps512_mask ((__v16sf) __A,
(__v16sf) __B,		(__v16sf) __B,
-(__v16sf) __C,		-(__v16sf) __C,
(__mmask16) -1,		(__mmask16) -1,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_mask_fmsub_ps(__m512 __A, __mmask16 __U, __m512 __B, __m512 __C)		_mm512_mask_fmsub_ps(__m512 __A, __mmask16 __U, __m512 __B, __m512 __C)
{		{
return (__m512) __builtin_ia32_vfmaddps512_mask ((__v16sf) __A,		return (__m512) __builtin_ia32_vfmaddps512_mask ((__v16sf) __A,
(__v16sf) __B,		(__v16sf) __B,
-(__v16sf) __C,		-(__v16sf) __C,
(__mmask16) __U,		(__mmask16) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_maskz_fmsub_ps(__mmask16 __U, __m512 __A, __m512 __B, __m512 __C)		_mm512_maskz_fmsub_ps(__mmask16 __U, __m512 __A, __m512 __B, __m512 __C)
{		{
return (__m512) __builtin_ia32_vfmaddps512_maskz ((__v16sf) __A,		return (__m512) __builtin_ia32_vfmaddps512_maskz ((__v16sf) __A,
(__v16sf) __B,		(__v16sf) __B,
-(__v16sf) __C,		-(__v16sf) __C,
(__mmask16) __U,		(__mmask16) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_fnmadd_ps(__m512 __A, __m512 __B, __m512 __C)		_mm512_fnmadd_ps(__m512 __A, __m512 __B, __m512 __C)
{		{
return (__m512) __builtin_ia32_vfmaddps512_mask ((__v16sf) __A,		return (__m512) __builtin_ia32_vfmaddps512_mask ((__v16sf) __A,
-(__v16sf) __B,		-(__v16sf) __B,
(__v16sf) __C,		(__v16sf) __C,
(__mmask16) -1,		(__mmask16) -1,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_mask3_fnmadd_ps(__m512 __A, __m512 __B, __m512 __C, __mmask16 __U)		_mm512_mask3_fnmadd_ps(__m512 __A, __m512 __B, __m512 __C, __mmask16 __U)
{		{
return (__m512) __builtin_ia32_vfmaddps512_mask3 (-(__v16sf) __A,		return (__m512) __builtin_ia32_vfmaddps512_mask3 (-(__v16sf) __A,
(__v16sf) __B,		(__v16sf) __B,
(__v16sf) __C,		(__v16sf) __C,
(__mmask16) __U,		(__mmask16) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_maskz_fnmadd_ps(__mmask16 __U, __m512 __A, __m512 __B, __m512 __C)		_mm512_maskz_fnmadd_ps(__mmask16 __U, __m512 __A, __m512 __B, __m512 __C)
{		{
return (__m512) __builtin_ia32_vfmaddps512_maskz (-(__v16sf) __A,		return (__m512) __builtin_ia32_vfmaddps512_maskz (-(__v16sf) __A,
(__v16sf) __B,		(__v16sf) __B,
(__v16sf) __C,		(__v16sf) __C,
(__mmask16) __U,		(__mmask16) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_fnmsub_ps(__m512 __A, __m512 __B, __m512 __C)		_mm512_fnmsub_ps(__m512 __A, __m512 __B, __m512 __C)
{		{
return (__m512) __builtin_ia32_vfmaddps512_mask ((__v16sf) __A,		return (__m512) __builtin_ia32_vfmaddps512_mask ((__v16sf) __A,
-(__v16sf) __B,		-(__v16sf) __B,
-(__v16sf) __C,		-(__v16sf) __C,
(__mmask16) -1,		(__mmask16) -1,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_maskz_fnmsub_ps(__mmask16 __U, __m512 __A, __m512 __B, __m512 __C)		_mm512_maskz_fnmsub_ps(__mmask16 __U, __m512 __A, __m512 __B, __m512 __C)
{		{
return (__m512) __builtin_ia32_vfmaddps512_maskz (-(__v16sf) __A,		return (__m512) __builtin_ia32_vfmaddps512_maskz (-(__v16sf) __A,
(__v16sf) __B,		(__v16sf) __B,
-(__v16sf) __C,		-(__v16sf) __C,
(__mmask16) __U,		(__mmask16) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}
▲ Show 20 Lines • Show All 42 Lines • ▼ Show 20 Lines

#define _mm512_maskz_fmsubadd_round_pd(U, A, B, C, R) \		#define _mm512_maskz_fmsubadd_round_pd(U, A, B, C, R) \
(__m512d)__builtin_ia32_vfmaddsubpd512_maskz((__v8df)(__m512d)(A), \		(__m512d)__builtin_ia32_vfmaddsubpd512_maskz((__v8df)(__m512d)(A), \
(__v8df)(__m512d)(B), \		(__v8df)(__m512d)(B), \
-(__v8df)(__m512d)(C), \		-(__v8df)(__m512d)(C), \
(__mmask8)(U), (int)(R))		(__mmask8)(U), (int)(R))


static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_fmaddsub_pd(__m512d __A, __m512d __B, __m512d __C)		_mm512_fmaddsub_pd(__m512d __A, __m512d __B, __m512d __C)
{		{
return (__m512d) __builtin_ia32_vfmaddsubpd512_mask ((__v8df) __A,		return (__m512d) __builtin_ia32_vfmaddsubpd512_mask ((__v8df) __A,
(__v8df) __B,		(__v8df) __B,
(__v8df) __C,		(__v8df) __C,
(__mmask8) -1,		(__mmask8) -1,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_mask_fmaddsub_pd(__m512d __A, __mmask8 __U, __m512d __B, __m512d __C)		_mm512_mask_fmaddsub_pd(__m512d __A, __mmask8 __U, __m512d __B, __m512d __C)
{		{
return (__m512d) __builtin_ia32_vfmaddsubpd512_mask ((__v8df) __A,		return (__m512d) __builtin_ia32_vfmaddsubpd512_mask ((__v8df) __A,
(__v8df) __B,		(__v8df) __B,
(__v8df) __C,		(__v8df) __C,
(__mmask8) __U,		(__mmask8) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_mask3_fmaddsub_pd(__m512d __A, __m512d __B, __m512d __C, __mmask8 __U)		_mm512_mask3_fmaddsub_pd(__m512d __A, __m512d __B, __m512d __C, __mmask8 __U)
{		{
return (__m512d) __builtin_ia32_vfmaddsubpd512_mask3 ((__v8df) __A,		return (__m512d) __builtin_ia32_vfmaddsubpd512_mask3 ((__v8df) __A,
(__v8df) __B,		(__v8df) __B,
(__v8df) __C,		(__v8df) __C,
(__mmask8) __U,		(__mmask8) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_maskz_fmaddsub_pd(__mmask8 __U, __m512d __A, __m512d __B, __m512d __C)		_mm512_maskz_fmaddsub_pd(__mmask8 __U, __m512d __A, __m512d __B, __m512d __C)
{		{
return (__m512d) __builtin_ia32_vfmaddsubpd512_maskz ((__v8df) __A,		return (__m512d) __builtin_ia32_vfmaddsubpd512_maskz ((__v8df) __A,
(__v8df) __B,		(__v8df) __B,
(__v8df) __C,		(__v8df) __C,
(__mmask8) __U,		(__mmask8) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_fmsubadd_pd(__m512d __A, __m512d __B, __m512d __C)		_mm512_fmsubadd_pd(__m512d __A, __m512d __B, __m512d __C)
{		{
return (__m512d) __builtin_ia32_vfmaddsubpd512_mask ((__v8df) __A,		return (__m512d) __builtin_ia32_vfmaddsubpd512_mask ((__v8df) __A,
(__v8df) __B,		(__v8df) __B,
-(__v8df) __C,		-(__v8df) __C,
(__mmask8) -1,		(__mmask8) -1,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_mask_fmsubadd_pd(__m512d __A, __mmask8 __U, __m512d __B, __m512d __C)		_mm512_mask_fmsubadd_pd(__m512d __A, __mmask8 __U, __m512d __B, __m512d __C)
{		{
return (__m512d) __builtin_ia32_vfmaddsubpd512_mask ((__v8df) __A,		return (__m512d) __builtin_ia32_vfmaddsubpd512_mask ((__v8df) __A,
(__v8df) __B,		(__v8df) __B,
-(__v8df) __C,		-(__v8df) __C,
(__mmask8) __U,		(__mmask8) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_maskz_fmsubadd_pd(__mmask8 __U, __m512d __A, __m512d __B, __m512d __C)		_mm512_maskz_fmsubadd_pd(__mmask8 __U, __m512d __A, __m512d __B, __m512d __C)
{		{
return (__m512d) __builtin_ia32_vfmaddsubpd512_maskz ((__v8df) __A,		return (__m512d) __builtin_ia32_vfmaddsubpd512_maskz ((__v8df) __A,
(__v8df) __B,		(__v8df) __B,
-(__v8df) __C,		-(__v8df) __C,
(__mmask8) __U,		(__mmask8) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}
▲ Show 20 Lines • Show All 42 Lines • ▼ Show 20 Lines

#define _mm512_maskz_fmsubadd_round_ps(U, A, B, C, R) \		#define _mm512_maskz_fmsubadd_round_ps(U, A, B, C, R) \
(__m512)__builtin_ia32_vfmaddsubps512_maskz((__v16sf)(__m512)(A), \		(__m512)__builtin_ia32_vfmaddsubps512_maskz((__v16sf)(__m512)(A), \
(__v16sf)(__m512)(B), \		(__v16sf)(__m512)(B), \
-(__v16sf)(__m512)(C), \		-(__v16sf)(__m512)(C), \
(__mmask16)(U), (int)(R))		(__mmask16)(U), (int)(R))


static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_fmaddsub_ps(__m512 __A, __m512 __B, __m512 __C)		_mm512_fmaddsub_ps(__m512 __A, __m512 __B, __m512 __C)
{		{
return (__m512) __builtin_ia32_vfmaddsubps512_mask ((__v16sf) __A,		return (__m512) __builtin_ia32_vfmaddsubps512_mask ((__v16sf) __A,
(__v16sf) __B,		(__v16sf) __B,
(__v16sf) __C,		(__v16sf) __C,
(__mmask16) -1,		(__mmask16) -1,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_mask_fmaddsub_ps(__m512 __A, __mmask16 __U, __m512 __B, __m512 __C)		_mm512_mask_fmaddsub_ps(__m512 __A, __mmask16 __U, __m512 __B, __m512 __C)
{		{
return (__m512) __builtin_ia32_vfmaddsubps512_mask ((__v16sf) __A,		return (__m512) __builtin_ia32_vfmaddsubps512_mask ((__v16sf) __A,
(__v16sf) __B,		(__v16sf) __B,
(__v16sf) __C,		(__v16sf) __C,
(__mmask16) __U,		(__mmask16) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_mask3_fmaddsub_ps(__m512 __A, __m512 __B, __m512 __C, __mmask16 __U)		_mm512_mask3_fmaddsub_ps(__m512 __A, __m512 __B, __m512 __C, __mmask16 __U)
{		{
return (__m512) __builtin_ia32_vfmaddsubps512_mask3 ((__v16sf) __A,		return (__m512) __builtin_ia32_vfmaddsubps512_mask3 ((__v16sf) __A,
(__v16sf) __B,		(__v16sf) __B,
(__v16sf) __C,		(__v16sf) __C,
(__mmask16) __U,		(__mmask16) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_maskz_fmaddsub_ps(__mmask16 __U, __m512 __A, __m512 __B, __m512 __C)		_mm512_maskz_fmaddsub_ps(__mmask16 __U, __m512 __A, __m512 __B, __m512 __C)
{		{
return (__m512) __builtin_ia32_vfmaddsubps512_maskz ((__v16sf) __A,		return (__m512) __builtin_ia32_vfmaddsubps512_maskz ((__v16sf) __A,
(__v16sf) __B,		(__v16sf) __B,
(__v16sf) __C,		(__v16sf) __C,
(__mmask16) __U,		(__mmask16) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_fmsubadd_ps(__m512 __A, __m512 __B, __m512 __C)		_mm512_fmsubadd_ps(__m512 __A, __m512 __B, __m512 __C)
{		{
return (__m512) __builtin_ia32_vfmaddsubps512_mask ((__v16sf) __A,		return (__m512) __builtin_ia32_vfmaddsubps512_mask ((__v16sf) __A,
(__v16sf) __B,		(__v16sf) __B,
-(__v16sf) __C,		-(__v16sf) __C,
(__mmask16) -1,		(__mmask16) -1,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_mask_fmsubadd_ps(__m512 __A, __mmask16 __U, __m512 __B, __m512 __C)		_mm512_mask_fmsubadd_ps(__m512 __A, __mmask16 __U, __m512 __B, __m512 __C)
{		{
return (__m512) __builtin_ia32_vfmaddsubps512_mask ((__v16sf) __A,		return (__m512) __builtin_ia32_vfmaddsubps512_mask ((__v16sf) __A,
(__v16sf) __B,		(__v16sf) __B,
-(__v16sf) __C,		-(__v16sf) __C,
(__mmask16) __U,		(__mmask16) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_maskz_fmsubadd_ps(__mmask16 __U, __m512 __A, __m512 __B, __m512 __C)		_mm512_maskz_fmsubadd_ps(__mmask16 __U, __m512 __A, __m512 __B, __m512 __C)
{		{
return (__m512) __builtin_ia32_vfmaddsubps512_maskz ((__v16sf) __A,		return (__m512) __builtin_ia32_vfmaddsubps512_maskz ((__v16sf) __A,
(__v16sf) __B,		(__v16sf) __B,
-(__v16sf) __C,		-(__v16sf) __C,
(__mmask16) __U,		(__mmask16) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

#define _mm512_mask3_fmsub_round_pd(A, B, C, U, R) \		#define _mm512_mask3_fmsub_round_pd(A, B, C, U, R) \
(__m512d)__builtin_ia32_vfmsubpd512_mask3((__v8df)(__m512d)(A), \		(__m512d)__builtin_ia32_vfmsubpd512_mask3((__v8df)(__m512d)(A), \
(__v8df)(__m512d)(B), \		(__v8df)(__m512d)(B), \
(__v8df)(__m512d)(C), \		(__v8df)(__m512d)(C), \
(__mmask8)(U), (int)(R))		(__mmask8)(U), (int)(R))


static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_mask3_fmsub_pd(__m512d __A, __m512d __B, __m512d __C, __mmask8 __U)		_mm512_mask3_fmsub_pd(__m512d __A, __m512d __B, __m512d __C, __mmask8 __U)
{		{
return (__m512d)__builtin_ia32_vfmsubpd512_mask3 ((__v8df) __A,		return (__m512d)__builtin_ia32_vfmsubpd512_mask3 ((__v8df) __A,
(__v8df) __B,		(__v8df) __B,
(__v8df) __C,		(__v8df) __C,
(__mmask8) __U,		(__mmask8) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

#define _mm512_mask3_fmsub_round_ps(A, B, C, U, R) \		#define _mm512_mask3_fmsub_round_ps(A, B, C, U, R) \
(__m512)__builtin_ia32_vfmsubps512_mask3((__v16sf)(__m512)(A), \		(__m512)__builtin_ia32_vfmsubps512_mask3((__v16sf)(__m512)(A), \
(__v16sf)(__m512)(B), \		(__v16sf)(__m512)(B), \
(__v16sf)(__m512)(C), \		(__v16sf)(__m512)(C), \
(__mmask16)(U), (int)(R))		(__mmask16)(U), (int)(R))

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_mask3_fmsub_ps(__m512 __A, __m512 __B, __m512 __C, __mmask16 __U)		_mm512_mask3_fmsub_ps(__m512 __A, __m512 __B, __m512 __C, __mmask16 __U)
{		{
return (__m512)__builtin_ia32_vfmsubps512_mask3 ((__v16sf) __A,		return (__m512)__builtin_ia32_vfmsubps512_mask3 ((__v16sf) __A,
(__v16sf) __B,		(__v16sf) __B,
(__v16sf) __C,		(__v16sf) __C,
(__mmask16) __U,		(__mmask16) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

#define _mm512_mask3_fmsubadd_round_pd(A, B, C, U, R) \		#define _mm512_mask3_fmsubadd_round_pd(A, B, C, U, R) \
(__m512d)__builtin_ia32_vfmsubaddpd512_mask3((__v8df)(__m512d)(A), \		(__m512d)__builtin_ia32_vfmsubaddpd512_mask3((__v8df)(__m512d)(A), \
(__v8df)(__m512d)(B), \		(__v8df)(__m512d)(B), \
(__v8df)(__m512d)(C), \		(__v8df)(__m512d)(C), \
(__mmask8)(U), (int)(R))		(__mmask8)(U), (int)(R))


static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_mask3_fmsubadd_pd(__m512d __A, __m512d __B, __m512d __C, __mmask8 __U)		_mm512_mask3_fmsubadd_pd(__m512d __A, __m512d __B, __m512d __C, __mmask8 __U)
{		{
return (__m512d)__builtin_ia32_vfmsubaddpd512_mask3 ((__v8df) __A,		return (__m512d)__builtin_ia32_vfmsubaddpd512_mask3 ((__v8df) __A,
(__v8df) __B,		(__v8df) __B,
(__v8df) __C,		(__v8df) __C,
(__mmask8) __U,		(__mmask8) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

#define _mm512_mask3_fmsubadd_round_ps(A, B, C, U, R) \		#define _mm512_mask3_fmsubadd_round_ps(A, B, C, U, R) \
(__m512)__builtin_ia32_vfmsubaddps512_mask3((__v16sf)(__m512)(A), \		(__m512)__builtin_ia32_vfmsubaddps512_mask3((__v16sf)(__m512)(A), \
(__v16sf)(__m512)(B), \		(__v16sf)(__m512)(B), \
(__v16sf)(__m512)(C), \		(__v16sf)(__m512)(C), \
(__mmask16)(U), (int)(R))		(__mmask16)(U), (int)(R))


static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_mask3_fmsubadd_ps(__m512 __A, __m512 __B, __m512 __C, __mmask16 __U)		_mm512_mask3_fmsubadd_ps(__m512 __A, __m512 __B, __m512 __C, __mmask16 __U)
{		{
return (__m512)__builtin_ia32_vfmsubaddps512_mask3 ((__v16sf) __A,		return (__m512)__builtin_ia32_vfmsubaddps512_mask3 ((__v16sf) __A,
(__v16sf) __B,		(__v16sf) __B,
(__v16sf) __C,		(__v16sf) __C,
(__mmask16) __U,		(__mmask16) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

#define _mm512_mask_fnmadd_round_pd(A, U, B, C, R) \		#define _mm512_mask_fnmadd_round_pd(A, U, B, C, R) \
(__m512d)__builtin_ia32_vfmaddpd512_mask((__v8df)(__m512d)(A), \		(__m512d)__builtin_ia32_vfmaddpd512_mask((__v8df)(__m512d)(A), \
-(__v8df)(__m512d)(B), \		-(__v8df)(__m512d)(B), \
(__v8df)(__m512d)(C), \		(__v8df)(__m512d)(C), \
(__mmask8)(U), (int)(R))		(__mmask8)(U), (int)(R))


static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_mask_fnmadd_pd(__m512d __A, __mmask8 __U, __m512d __B, __m512d __C)		_mm512_mask_fnmadd_pd(__m512d __A, __mmask8 __U, __m512d __B, __m512d __C)
{		{
return (__m512d) __builtin_ia32_vfmaddpd512_mask ((__v8df) __A,		return (__m512d) __builtin_ia32_vfmaddpd512_mask ((__v8df) __A,
-(__v8df) __B,		-(__v8df) __B,
(__v8df) __C,		(__v8df) __C,
(__mmask8) __U,		(__mmask8) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

#define _mm512_mask_fnmadd_round_ps(A, U, B, C, R) \		#define _mm512_mask_fnmadd_round_ps(A, U, B, C, R) \
(__m512)__builtin_ia32_vfmaddps512_mask((__v16sf)(__m512)(A), \		(__m512)__builtin_ia32_vfmaddps512_mask((__v16sf)(__m512)(A), \
-(__v16sf)(__m512)(B), \		-(__v16sf)(__m512)(B), \
(__v16sf)(__m512)(C), \		(__v16sf)(__m512)(C), \
(__mmask16)(U), (int)(R))		(__mmask16)(U), (int)(R))


static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_mask_fnmadd_ps(__m512 __A, __mmask16 __U, __m512 __B, __m512 __C)		_mm512_mask_fnmadd_ps(__m512 __A, __mmask16 __U, __m512 __B, __m512 __C)
{		{
return (__m512) __builtin_ia32_vfmaddps512_mask ((__v16sf) __A,		return (__m512) __builtin_ia32_vfmaddps512_mask ((__v16sf) __A,
-(__v16sf) __B,		-(__v16sf) __B,
(__v16sf) __C,		(__v16sf) __C,
(__mmask16) __U,		(__mmask16) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

#define _mm512_mask_fnmsub_round_pd(A, U, B, C, R) \		#define _mm512_mask_fnmsub_round_pd(A, U, B, C, R) \
(__m512d)__builtin_ia32_vfmaddpd512_mask((__v8df)(__m512d)(A), \		(__m512d)__builtin_ia32_vfmaddpd512_mask((__v8df)(__m512d)(A), \
-(__v8df)(__m512d)(B), \		-(__v8df)(__m512d)(B), \
-(__v8df)(__m512d)(C), \		-(__v8df)(__m512d)(C), \
(__mmask8)(U), (int)(R))		(__mmask8)(U), (int)(R))


#define _mm512_mask3_fnmsub_round_pd(A, B, C, U, R) \		#define _mm512_mask3_fnmsub_round_pd(A, B, C, U, R) \
(__m512d)__builtin_ia32_vfmsubpd512_mask3(-(__v8df)(__m512d)(A), \		(__m512d)__builtin_ia32_vfmsubpd512_mask3(-(__v8df)(__m512d)(A), \
(__v8df)(__m512d)(B), \		(__v8df)(__m512d)(B), \
(__v8df)(__m512d)(C), \		(__v8df)(__m512d)(C), \
(__mmask8)(U), (int)(R))		(__mmask8)(U), (int)(R))


static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_mask_fnmsub_pd(__m512d __A, __mmask8 __U, __m512d __B, __m512d __C)		_mm512_mask_fnmsub_pd(__m512d __A, __mmask8 __U, __m512d __B, __m512d __C)
{		{
return (__m512d) __builtin_ia32_vfmaddpd512_mask ((__v8df) __A,		return (__m512d) __builtin_ia32_vfmaddpd512_mask ((__v8df) __A,
-(__v8df) __B,		-(__v8df) __B,
-(__v8df) __C,		-(__v8df) __C,
(__mmask8) __U,		(__mmask8) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_mask3_fnmsub_pd(__m512d __A, __m512d __B, __m512d __C, __mmask8 __U)		_mm512_mask3_fnmsub_pd(__m512d __A, __m512d __B, __m512d __C, __mmask8 __U)
{		{
return (__m512d) __builtin_ia32_vfmsubpd512_mask3 (-(__v8df) __A,		return (__m512d) __builtin_ia32_vfmsubpd512_mask3 (-(__v8df) __A,
(__v8df) __B,		(__v8df) __B,
(__v8df) __C,		(__v8df) __C,
(__mmask8) __U,		(__mmask8) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

#define _mm512_mask_fnmsub_round_ps(A, U, B, C, R) \		#define _mm512_mask_fnmsub_round_ps(A, U, B, C, R) \
(__m512)__builtin_ia32_vfmaddps512_mask((__v16sf)(__m512)(A), \		(__m512)__builtin_ia32_vfmaddps512_mask((__v16sf)(__m512)(A), \
-(__v16sf)(__m512)(B), \		-(__v16sf)(__m512)(B), \
-(__v16sf)(__m512)(C), \		-(__v16sf)(__m512)(C), \
(__mmask16)(U), (int)(R))		(__mmask16)(U), (int)(R))


#define _mm512_mask3_fnmsub_round_ps(A, B, C, U, R) \		#define _mm512_mask3_fnmsub_round_ps(A, B, C, U, R) \
(__m512)__builtin_ia32_vfmsubps512_mask3(-(__v16sf)(__m512)(A), \		(__m512)__builtin_ia32_vfmsubps512_mask3(-(__v16sf)(__m512)(A), \
(__v16sf)(__m512)(B), \		(__v16sf)(__m512)(B), \
(__v16sf)(__m512)(C), \		(__v16sf)(__m512)(C), \
(__mmask16)(U), (int)(R))		(__mmask16)(U), (int)(R))


static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_mask_fnmsub_ps(__m512 __A, __mmask16 __U, __m512 __B, __m512 __C)		_mm512_mask_fnmsub_ps(__m512 __A, __mmask16 __U, __m512 __B, __m512 __C)
{		{
return (__m512) __builtin_ia32_vfmaddps512_mask ((__v16sf) __A,		return (__m512) __builtin_ia32_vfmaddps512_mask ((__v16sf) __A,
-(__v16sf) __B,		-(__v16sf) __B,
-(__v16sf) __C,		-(__v16sf) __C,
(__mmask16) __U,		(__mmask16) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_mask3_fnmsub_ps(__m512 __A, __m512 __B, __m512 __C, __mmask16 __U)		_mm512_mask3_fnmsub_ps(__m512 __A, __m512 __B, __m512 __C, __mmask16 __U)
{		{
return (__m512) __builtin_ia32_vfmsubps512_mask3 (-(__v16sf) __A,		return (__m512) __builtin_ia32_vfmsubps512_mask3 (-(__v16sf) __A,
(__v16sf) __B,		(__v16sf) __B,
(__v16sf) __C,		(__v16sf) __C,
(__mmask16) __U,		(__mmask16) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}



/* Vector permutations */		/* Vector permutations */

static __inline __m512i __DEFAULT_FN_ATTRS		static __inline __m512i __DEFAULT_FN_ATTRS512
_mm512_permutex2var_epi32(__m512i __A, __m512i __I, __m512i __B)		_mm512_permutex2var_epi32(__m512i __A, __m512i __I, __m512i __B)
{		{
return (__m512i)__builtin_ia32_vpermi2vard512((__v16si)__A, (__v16si) __I,		return (__m512i)__builtin_ia32_vpermi2vard512((__v16si)__A, (__v16si) __I,
(__v16si) __B);		(__v16si) __B);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_permutex2var_epi32(__m512i __A, __mmask16 __U, __m512i __I,		_mm512_mask_permutex2var_epi32(__m512i __A, __mmask16 __U, __m512i __I,
__m512i __B)		__m512i __B)
{		{
return (__m512i)__builtin_ia32_selectd_512(__U,		return (__m512i)__builtin_ia32_selectd_512(__U,
(__v16si)_mm512_permutex2var_epi32(__A, __I, __B),		(__v16si)_mm512_permutex2var_epi32(__A, __I, __B),
(__v16si)__A);		(__v16si)__A);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask2_permutex2var_epi32(__m512i __A, __m512i __I, __mmask16 __U,		_mm512_mask2_permutex2var_epi32(__m512i __A, __m512i __I, __mmask16 __U,
__m512i __B)		__m512i __B)
{		{
return (__m512i)__builtin_ia32_selectd_512(__U,		return (__m512i)__builtin_ia32_selectd_512(__U,
(__v16si)_mm512_permutex2var_epi32(__A, __I, __B),		(__v16si)_mm512_permutex2var_epi32(__A, __I, __B),
(__v16si)__I);		(__v16si)__I);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_permutex2var_epi32(__mmask16 __U, __m512i __A, __m512i __I,		_mm512_maskz_permutex2var_epi32(__mmask16 __U, __m512i __A, __m512i __I,
__m512i __B)		__m512i __B)
{		{
return (__m512i)__builtin_ia32_selectd_512(__U,		return (__m512i)__builtin_ia32_selectd_512(__U,
(__v16si)_mm512_permutex2var_epi32(__A, __I, __B),		(__v16si)_mm512_permutex2var_epi32(__A, __I, __B),
(__v16si)_mm512_setzero_si512());		(__v16si)_mm512_setzero_si512());
}		}

static __inline __m512i __DEFAULT_FN_ATTRS		static __inline __m512i __DEFAULT_FN_ATTRS512
_mm512_permutex2var_epi64(__m512i __A, __m512i __I, __m512i __B)		_mm512_permutex2var_epi64(__m512i __A, __m512i __I, __m512i __B)
{		{
return (__m512i)__builtin_ia32_vpermi2varq512((__v8di)__A, (__v8di) __I,		return (__m512i)__builtin_ia32_vpermi2varq512((__v8di)__A, (__v8di) __I,
(__v8di) __B);		(__v8di) __B);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_permutex2var_epi64(__m512i __A, __mmask8 __U, __m512i __I,		_mm512_mask_permutex2var_epi64(__m512i __A, __mmask8 __U, __m512i __I,
__m512i __B)		__m512i __B)
{		{
return (__m512i)__builtin_ia32_selectq_512(__U,		return (__m512i)__builtin_ia32_selectq_512(__U,
(__v8di)_mm512_permutex2var_epi64(__A, __I, __B),		(__v8di)_mm512_permutex2var_epi64(__A, __I, __B),
(__v8di)__A);		(__v8di)__A);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask2_permutex2var_epi64(__m512i __A, __m512i __I, __mmask8 __U,		_mm512_mask2_permutex2var_epi64(__m512i __A, __m512i __I, __mmask8 __U,
__m512i __B)		__m512i __B)
{		{
return (__m512i)__builtin_ia32_selectq_512(__U,		return (__m512i)__builtin_ia32_selectq_512(__U,
(__v8di)_mm512_permutex2var_epi64(__A, __I, __B),		(__v8di)_mm512_permutex2var_epi64(__A, __I, __B),
(__v8di)__I);		(__v8di)__I);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_permutex2var_epi64(__mmask8 __U, __m512i __A, __m512i __I,		_mm512_maskz_permutex2var_epi64(__mmask8 __U, __m512i __A, __m512i __I,
__m512i __B)		__m512i __B)
{		{
return (__m512i)__builtin_ia32_selectq_512(__U,		return (__m512i)__builtin_ia32_selectq_512(__U,
(__v8di)_mm512_permutex2var_epi64(__A, __I, __B),		(__v8di)_mm512_permutex2var_epi64(__A, __I, __B),
(__v8di)_mm512_setzero_si512());		(__v8di)_mm512_setzero_si512());
}		}

▲ Show 20 Lines • Show All 53 Lines • ▼ Show 20 Lines

#define _mm512_maskz_extractf32x4_ps(U, A, imm) \		#define _mm512_maskz_extractf32x4_ps(U, A, imm) \
(__m128)__builtin_ia32_extractf32x4_mask((__v16sf)(__m512)(A), (int)(imm), \		(__m128)__builtin_ia32_extractf32x4_mask((__v16sf)(__m512)(A), (int)(imm), \
(__v4sf)_mm_setzero_ps(), \		(__v4sf)_mm_setzero_ps(), \
(__mmask8)(U))		(__mmask8)(U))

/* Vector Blend */		/* Vector Blend */

static __inline __m512d __DEFAULT_FN_ATTRS		static __inline __m512d __DEFAULT_FN_ATTRS512
_mm512_mask_blend_pd(__mmask8 __U, __m512d __A, __m512d __W)		_mm512_mask_blend_pd(__mmask8 __U, __m512d __A, __m512d __W)
{		{
return (__m512d) __builtin_ia32_selectpd_512 ((__mmask8) __U,		return (__m512d) __builtin_ia32_selectpd_512 ((__mmask8) __U,
(__v8df) __W,		(__v8df) __W,
(__v8df) __A);		(__v8df) __A);
}		}

static __inline __m512 __DEFAULT_FN_ATTRS		static __inline __m512 __DEFAULT_FN_ATTRS512
_mm512_mask_blend_ps(__mmask16 __U, __m512 __A, __m512 __W)		_mm512_mask_blend_ps(__mmask16 __U, __m512 __A, __m512 __W)
{		{
return (__m512) __builtin_ia32_selectps_512 ((__mmask16) __U,		return (__m512) __builtin_ia32_selectps_512 ((__mmask16) __U,
(__v16sf) __W,		(__v16sf) __W,
(__v16sf) __A);		(__v16sf) __A);
}		}

static __inline __m512i __DEFAULT_FN_ATTRS		static __inline __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_blend_epi64(__mmask8 __U, __m512i __A, __m512i __W)		_mm512_mask_blend_epi64(__mmask8 __U, __m512i __A, __m512i __W)
{		{
return (__m512i) __builtin_ia32_selectq_512 ((__mmask8) __U,		return (__m512i) __builtin_ia32_selectq_512 ((__mmask8) __U,
(__v8di) __W,		(__v8di) __W,
(__v8di) __A);		(__v8di) __A);
}		}

static __inline __m512i __DEFAULT_FN_ATTRS		static __inline __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_blend_epi32(__mmask16 __U, __m512i __A, __m512i __W)		_mm512_mask_blend_epi32(__mmask16 __U, __m512i __A, __m512i __W)
{		{
return (__m512i) __builtin_ia32_selectd_512 ((__mmask16) __U,		return (__m512i) __builtin_ia32_selectd_512 ((__mmask16) __U,
(__v16si) __W,		(__v16si) __W,
(__v16si) __A);		(__v16si) __A);
}		}

/* Compare */		/* Compare */
▲ Show 20 Lines • Show All 121 Lines • ▼ Show 20 Lines	(__m512i)__builtin_ia32_cvttps2udq512_mask((__v16sf)(__m512)(A), \
(__mmask16)(U), (int)(R))		(__mmask16)(U), (int)(R))

#define _mm512_maskz_cvtt_roundps_epu32(U, A, R) \		#define _mm512_maskz_cvtt_roundps_epu32(U, A, R) \
(__m512i)__builtin_ia32_cvttps2udq512_mask((__v16sf)(__m512)(A), \		(__m512i)__builtin_ia32_cvttps2udq512_mask((__v16sf)(__m512)(A), \
(__v16si)_mm512_setzero_si512(), \		(__v16si)_mm512_setzero_si512(), \
(__mmask16)(U), (int)(R))		(__mmask16)(U), (int)(R))


static __inline __m512i __DEFAULT_FN_ATTRS		static __inline __m512i __DEFAULT_FN_ATTRS512
_mm512_cvttps_epu32(__m512 __A)		_mm512_cvttps_epu32(__m512 __A)
{		{
return (__m512i) __builtin_ia32_cvttps2udq512_mask ((__v16sf) __A,		return (__m512i) __builtin_ia32_cvttps2udq512_mask ((__v16sf) __A,
(__v16si)		(__v16si)
_mm512_setzero_si512 (),		_mm512_setzero_si512 (),
(__mmask16) -1,		(__mmask16) -1,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_cvttps_epu32 (__m512i __W, __mmask16 __U, __m512 __A)		_mm512_mask_cvttps_epu32 (__m512i __W, __mmask16 __U, __m512 __A)
{		{
return (__m512i) __builtin_ia32_cvttps2udq512_mask ((__v16sf) __A,		return (__m512i) __builtin_ia32_cvttps2udq512_mask ((__v16sf) __A,
(__v16si) __W,		(__v16si) __W,
(__mmask16) __U,		(__mmask16) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_cvttps_epu32 (__mmask16 __U, __m512 __A)		_mm512_maskz_cvttps_epu32 (__mmask16 __U, __m512 __A)
{		{
return (__m512i) __builtin_ia32_cvttps2udq512_mask ((__v16sf) __A,		return (__m512i) __builtin_ia32_cvttps2udq512_mask ((__v16sf) __A,
(__v16si) _mm512_setzero_si512 (),		(__v16si) _mm512_setzero_si512 (),
(__mmask16) __U,		(__mmask16) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

Show All 22 Lines	(__m512)__builtin_ia32_cvtudq2ps512_mask((__v16si)(__m512i)(A), \
(__v16sf)(__m512)(W), \		(__v16sf)(__m512)(W), \
(__mmask16)(U), (int)(R))		(__mmask16)(U), (int)(R))

#define _mm512_maskz_cvt_roundepu32_ps(U, A, R) \		#define _mm512_maskz_cvt_roundepu32_ps(U, A, R) \
(__m512)__builtin_ia32_cvtudq2ps512_mask((__v16si)(__m512i)(A), \		(__m512)__builtin_ia32_cvtudq2ps512_mask((__v16si)(__m512i)(A), \
(__v16sf)_mm512_setzero_ps(), \		(__v16sf)_mm512_setzero_ps(), \
(__mmask16)(U), (int)(R))		(__mmask16)(U), (int)(R))

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_cvtepu32_ps (__m512i __A)		_mm512_cvtepu32_ps (__m512i __A)
{		{
return (__m512)__builtin_convertvector((__v16su)__A, __v16sf);		return (__m512)__builtin_convertvector((__v16su)__A, __v16sf);
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_mask_cvtepu32_ps (__m512 __W, __mmask16 __U, __m512i __A)		_mm512_mask_cvtepu32_ps (__m512 __W, __mmask16 __U, __m512i __A)
{		{
return (__m512)__builtin_ia32_selectps_512((__mmask16)__U,		return (__m512)__builtin_ia32_selectps_512((__mmask16)__U,
(__v16sf)_mm512_cvtepu32_ps(__A),		(__v16sf)_mm512_cvtepu32_ps(__A),
(__v16sf)__W);		(__v16sf)__W);
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_maskz_cvtepu32_ps (__mmask16 __U, __m512i __A)		_mm512_maskz_cvtepu32_ps (__mmask16 __U, __m512i __A)
{		{
return (__m512)__builtin_ia32_selectps_512((__mmask16)__U,		return (__m512)__builtin_ia32_selectps_512((__mmask16)__U,
(__v16sf)_mm512_cvtepu32_ps(__A),		(__v16sf)_mm512_cvtepu32_ps(__A),
(__v16sf)_mm512_setzero_ps());		(__v16sf)_mm512_setzero_ps());
}		}

static __inline __m512d __DEFAULT_FN_ATTRS		static __inline __m512d __DEFAULT_FN_ATTRS512
_mm512_cvtepi32_pd(__m256i __A)		_mm512_cvtepi32_pd(__m256i __A)
{		{
return (__m512d)__builtin_convertvector((__v8si)__A, __v8df);		return (__m512d)__builtin_convertvector((__v8si)__A, __v8df);
}		}

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_mask_cvtepi32_pd (__m512d __W, __mmask8 __U, __m256i __A)		_mm512_mask_cvtepi32_pd (__m512d __W, __mmask8 __U, __m256i __A)
{		{
return (__m512d)__builtin_ia32_selectpd_512((__mmask8) __U,		return (__m512d)__builtin_ia32_selectpd_512((__mmask8) __U,
(__v8df)_mm512_cvtepi32_pd(__A),		(__v8df)_mm512_cvtepi32_pd(__A),
(__v8df)__W);		(__v8df)__W);
}		}

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_maskz_cvtepi32_pd (__mmask8 __U, __m256i __A)		_mm512_maskz_cvtepi32_pd (__mmask8 __U, __m256i __A)
{		{
return (__m512d)__builtin_ia32_selectpd_512((__mmask8) __U,		return (__m512d)__builtin_ia32_selectpd_512((__mmask8) __U,
(__v8df)_mm512_cvtepi32_pd(__A),		(__v8df)_mm512_cvtepi32_pd(__A),
(__v8df)_mm512_setzero_pd());		(__v8df)_mm512_setzero_pd());
}		}

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_cvtepi32lo_pd(__m512i __A)		_mm512_cvtepi32lo_pd(__m512i __A)
{		{
return (__m512d) _mm512_cvtepi32_pd(_mm512_castsi512_si256(__A));		return (__m512d) _mm512_cvtepi32_pd(_mm512_castsi512_si256(__A));
}		}

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_mask_cvtepi32lo_pd(__m512d __W, __mmask8 __U,__m512i __A)		_mm512_mask_cvtepi32lo_pd(__m512d __W, __mmask8 __U,__m512i __A)
{		{
return (__m512d) _mm512_mask_cvtepi32_pd(__W, __U, _mm512_castsi512_si256(__A));		return (__m512d) _mm512_mask_cvtepi32_pd(__W, __U, _mm512_castsi512_si256(__A));
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_cvtepi32_ps (__m512i __A)		_mm512_cvtepi32_ps (__m512i __A)
{		{
return (__m512)__builtin_convertvector((__v16si)__A, __v16sf);		return (__m512)__builtin_convertvector((__v16si)__A, __v16sf);
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_mask_cvtepi32_ps (__m512 __W, __mmask16 __U, __m512i __A)		_mm512_mask_cvtepi32_ps (__m512 __W, __mmask16 __U, __m512i __A)
{		{
return (__m512)__builtin_ia32_selectps_512((__mmask16)__U,		return (__m512)__builtin_ia32_selectps_512((__mmask16)__U,
(__v16sf)_mm512_cvtepi32_ps(__A),		(__v16sf)_mm512_cvtepi32_ps(__A),
(__v16sf)__W);		(__v16sf)__W);
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_maskz_cvtepi32_ps (__mmask16 __U, __m512i __A)		_mm512_maskz_cvtepi32_ps (__mmask16 __U, __m512i __A)
{		{
return (__m512)__builtin_ia32_selectps_512((__mmask16)__U,		return (__m512)__builtin_ia32_selectps_512((__mmask16)__U,
(__v16sf)_mm512_cvtepi32_ps(__A),		(__v16sf)_mm512_cvtepi32_ps(__A),
(__v16sf)_mm512_setzero_ps());		(__v16sf)_mm512_setzero_ps());
}		}

static __inline __m512d __DEFAULT_FN_ATTRS		static __inline __m512d __DEFAULT_FN_ATTRS512
_mm512_cvtepu32_pd(__m256i __A)		_mm512_cvtepu32_pd(__m256i __A)
{		{
return (__m512d)__builtin_convertvector((__v8su)__A, __v8df);		return (__m512d)__builtin_convertvector((__v8su)__A, __v8df);
}		}

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_mask_cvtepu32_pd (__m512d __W, __mmask8 __U, __m256i __A)		_mm512_mask_cvtepu32_pd (__m512d __W, __mmask8 __U, __m256i __A)
{		{
return (__m512d)__builtin_ia32_selectpd_512((__mmask8) __U,		return (__m512d)__builtin_ia32_selectpd_512((__mmask8) __U,
(__v8df)_mm512_cvtepu32_pd(__A),		(__v8df)_mm512_cvtepu32_pd(__A),
(__v8df)__W);		(__v8df)__W);
}		}

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_maskz_cvtepu32_pd (__mmask8 __U, __m256i __A)		_mm512_maskz_cvtepu32_pd (__mmask8 __U, __m256i __A)
{		{
return (__m512d)__builtin_ia32_selectpd_512((__mmask8) __U,		return (__m512d)__builtin_ia32_selectpd_512((__mmask8) __U,
(__v8df)_mm512_cvtepu32_pd(__A),		(__v8df)_mm512_cvtepu32_pd(__A),
(__v8df)_mm512_setzero_pd());		(__v8df)_mm512_setzero_pd());
}		}

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_cvtepu32lo_pd(__m512i __A)		_mm512_cvtepu32lo_pd(__m512i __A)
{		{
return (__m512d) _mm512_cvtepu32_pd(_mm512_castsi512_si256(__A));		return (__m512d) _mm512_cvtepu32_pd(_mm512_castsi512_si256(__A));
}		}

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_mask_cvtepu32lo_pd(__m512d __W, __mmask8 __U,__m512i __A)		_mm512_mask_cvtepu32lo_pd(__m512d __W, __mmask8 __U,__m512i __A)
{		{
return (__m512d) _mm512_mask_cvtepu32_pd(__W, __U, _mm512_castsi512_si256(__A));		return (__m512d) _mm512_mask_cvtepu32_pd(__W, __U, _mm512_castsi512_si256(__A));
}		}

#define _mm512_cvt_roundpd_ps(A, R) \		#define _mm512_cvt_roundpd_ps(A, R) \
(__m256)__builtin_ia32_cvtpd2ps512_mask((__v8df)(__m512d)(A), \		(__m256)__builtin_ia32_cvtpd2ps512_mask((__v8df)(__m512d)(A), \
(__v8sf)_mm256_setzero_ps(), \		(__v8sf)_mm256_setzero_ps(), \
(__mmask8)-1, (int)(R))		(__mmask8)-1, (int)(R))

#define _mm512_mask_cvt_roundpd_ps(W, U, A, R) \		#define _mm512_mask_cvt_roundpd_ps(W, U, A, R) \
(__m256)__builtin_ia32_cvtpd2ps512_mask((__v8df)(__m512d)(A), \		(__m256)__builtin_ia32_cvtpd2ps512_mask((__v8df)(__m512d)(A), \
(__v8sf)(__m256)(W), (__mmask8)(U), \		(__v8sf)(__m256)(W), (__mmask8)(U), \
(int)(R))		(int)(R))

#define _mm512_maskz_cvt_roundpd_ps(U, A, R) \		#define _mm512_maskz_cvt_roundpd_ps(U, A, R) \
(__m256)__builtin_ia32_cvtpd2ps512_mask((__v8df)(__m512d)(A), \		(__m256)__builtin_ia32_cvtpd2ps512_mask((__v8df)(__m512d)(A), \
(__v8sf)_mm256_setzero_ps(), \		(__v8sf)_mm256_setzero_ps(), \
(__mmask8)(U), (int)(R))		(__mmask8)(U), (int)(R))

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS512
_mm512_cvtpd_ps (__m512d __A)		_mm512_cvtpd_ps (__m512d __A)
{		{
return (__m256) __builtin_ia32_cvtpd2ps512_mask ((__v8df) __A,		return (__m256) __builtin_ia32_cvtpd2ps512_mask ((__v8df) __A,
(__v8sf) _mm256_undefined_ps (),		(__v8sf) _mm256_undefined_ps (),
(__mmask8) -1,		(__mmask8) -1,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS512
_mm512_mask_cvtpd_ps (__m256 __W, __mmask8 __U, __m512d __A)		_mm512_mask_cvtpd_ps (__m256 __W, __mmask8 __U, __m512d __A)
{		{
return (__m256) __builtin_ia32_cvtpd2ps512_mask ((__v8df) __A,		return (__m256) __builtin_ia32_cvtpd2ps512_mask ((__v8df) __A,
(__v8sf) __W,		(__v8sf) __W,
(__mmask8) __U,		(__mmask8) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS512
_mm512_maskz_cvtpd_ps (__mmask8 __U, __m512d __A)		_mm512_maskz_cvtpd_ps (__mmask8 __U, __m512d __A)
{		{
return (__m256) __builtin_ia32_cvtpd2ps512_mask ((__v8df) __A,		return (__m256) __builtin_ia32_cvtpd2ps512_mask ((__v8df) __A,
(__v8sf) _mm256_setzero_ps (),		(__v8sf) _mm256_setzero_ps (),
(__mmask8) __U,		(__mmask8) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_cvtpd_pslo (__m512d __A)		_mm512_cvtpd_pslo (__m512d __A)
{		{
return (__m512) __builtin_shufflevector((__v8sf) _mm512_cvtpd_ps(__A),		return (__m512) __builtin_shufflevector((__v8sf) _mm512_cvtpd_ps(__A),
(__v8sf) _mm256_setzero_ps (),		(__v8sf) _mm256_setzero_ps (),
0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15);		0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15);
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_mask_cvtpd_pslo (__m512 __W, __mmask8 __U,__m512d __A)		_mm512_mask_cvtpd_pslo (__m512 __W, __mmask8 __U,__m512d __A)
{		{
return (__m512) __builtin_shufflevector (		return (__m512) __builtin_shufflevector (
(__v8sf) _mm512_mask_cvtpd_ps (_mm512_castps512_ps256(__W),		(__v8sf) _mm512_mask_cvtpd_ps (_mm512_castps512_ps256(__W),
__U, __A),		__U, __A),
(__v8sf) _mm256_setzero_ps (),		(__v8sf) _mm256_setzero_ps (),
0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15);		0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15);
}		}
Show All 39 Lines	(__m512)__builtin_ia32_vcvtph2ps512_mask((__v16hi)(__m256i)(A), \
(__mmask16)(U), (int)(R))		(__mmask16)(U), (int)(R))

#define _mm512_maskz_cvt_roundph_ps(U, A, R) \		#define _mm512_maskz_cvt_roundph_ps(U, A, R) \
(__m512)__builtin_ia32_vcvtph2ps512_mask((__v16hi)(__m256i)(A), \		(__m512)__builtin_ia32_vcvtph2ps512_mask((__v16hi)(__m256i)(A), \
(__v16sf)_mm512_setzero_ps(), \		(__v16sf)_mm512_setzero_ps(), \
(__mmask16)(U), (int)(R))		(__mmask16)(U), (int)(R))


static __inline __m512 __DEFAULT_FN_ATTRS		static __inline __m512 __DEFAULT_FN_ATTRS512
_mm512_cvtph_ps(__m256i __A)		_mm512_cvtph_ps(__m256i __A)
{		{
return (__m512) __builtin_ia32_vcvtph2ps512_mask ((__v16hi) __A,		return (__m512) __builtin_ia32_vcvtph2ps512_mask ((__v16hi) __A,
(__v16sf)		(__v16sf)
_mm512_setzero_ps (),		_mm512_setzero_ps (),
(__mmask16) -1,		(__mmask16) -1,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_mask_cvtph_ps (__m512 __W, __mmask16 __U, __m256i __A)		_mm512_mask_cvtph_ps (__m512 __W, __mmask16 __U, __m256i __A)
{		{
return (__m512) __builtin_ia32_vcvtph2ps512_mask ((__v16hi) __A,		return (__m512) __builtin_ia32_vcvtph2ps512_mask ((__v16hi) __A,
(__v16sf) __W,		(__v16sf) __W,
(__mmask16) __U,		(__mmask16) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_maskz_cvtph_ps (__mmask16 __U, __m256i __A)		_mm512_maskz_cvtph_ps (__mmask16 __U, __m256i __A)
{		{
return (__m512) __builtin_ia32_vcvtph2ps512_mask ((__v16hi) __A,		return (__m512) __builtin_ia32_vcvtph2ps512_mask ((__v16hi) __A,
(__v16sf) _mm512_setzero_ps (),		(__v16sf) _mm512_setzero_ps (),
(__mmask16) __U,		(__mmask16) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

#define _mm512_cvtt_roundpd_epi32(A, R) \		#define _mm512_cvtt_roundpd_epi32(A, R) \
(__m256i)__builtin_ia32_cvttpd2dq512_mask((__v8df)(__m512d)(A), \		(__m256i)__builtin_ia32_cvttpd2dq512_mask((__v8df)(__m512d)(A), \
(__v8si)_mm256_setzero_si256(), \		(__v8si)_mm256_setzero_si256(), \
(__mmask8)-1, (int)(R))		(__mmask8)-1, (int)(R))

#define _mm512_mask_cvtt_roundpd_epi32(W, U, A, R) \		#define _mm512_mask_cvtt_roundpd_epi32(W, U, A, R) \
(__m256i)__builtin_ia32_cvttpd2dq512_mask((__v8df)(__m512d)(A), \		(__m256i)__builtin_ia32_cvttpd2dq512_mask((__v8df)(__m512d)(A), \
(__v8si)(__m256i)(W), \		(__v8si)(__m256i)(W), \
(__mmask8)(U), (int)(R))		(__mmask8)(U), (int)(R))

#define _mm512_maskz_cvtt_roundpd_epi32(U, A, R) \		#define _mm512_maskz_cvtt_roundpd_epi32(U, A, R) \
(__m256i)__builtin_ia32_cvttpd2dq512_mask((__v8df)(__m512d)(A), \		(__m256i)__builtin_ia32_cvttpd2dq512_mask((__v8df)(__m512d)(A), \
(__v8si)_mm256_setzero_si256(), \		(__v8si)_mm256_setzero_si256(), \
(__mmask8)(U), (int)(R))		(__mmask8)(U), (int)(R))

static __inline __m256i __DEFAULT_FN_ATTRS		static __inline __m256i __DEFAULT_FN_ATTRS512
_mm512_cvttpd_epi32(__m512d __a)		_mm512_cvttpd_epi32(__m512d __a)
{		{
return (__m256i)__builtin_ia32_cvttpd2dq512_mask((__v8df) __a,		return (__m256i)__builtin_ia32_cvttpd2dq512_mask((__v8df) __a,
(__v8si)_mm256_setzero_si256(),		(__v8si)_mm256_setzero_si256(),
(__mmask8) -1,		(__mmask8) -1,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS512
_mm512_mask_cvttpd_epi32 (__m256i __W, __mmask8 __U, __m512d __A)		_mm512_mask_cvttpd_epi32 (__m256i __W, __mmask8 __U, __m512d __A)
{		{
return (__m256i) __builtin_ia32_cvttpd2dq512_mask ((__v8df) __A,		return (__m256i) __builtin_ia32_cvttpd2dq512_mask ((__v8df) __A,
(__v8si) __W,		(__v8si) __W,
(__mmask8) __U,		(__mmask8) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS512
_mm512_maskz_cvttpd_epi32 (__mmask8 __U, __m512d __A)		_mm512_maskz_cvttpd_epi32 (__mmask8 __U, __m512d __A)
{		{
return (__m256i) __builtin_ia32_cvttpd2dq512_mask ((__v8df) __A,		return (__m256i) __builtin_ia32_cvttpd2dq512_mask ((__v8df) __A,
(__v8si) _mm256_setzero_si256 (),		(__v8si) _mm256_setzero_si256 (),
(__mmask8) __U,		(__mmask8) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

#define _mm512_cvtt_roundps_epi32(A, R) \		#define _mm512_cvtt_roundps_epi32(A, R) \
(__m512i)__builtin_ia32_cvttps2dq512_mask((__v16sf)(__m512)(A), \		(__m512i)__builtin_ia32_cvttps2dq512_mask((__v16sf)(__m512)(A), \
(__v16si)_mm512_setzero_si512(), \		(__v16si)_mm512_setzero_si512(), \
(__mmask16)-1, (int)(R))		(__mmask16)-1, (int)(R))

#define _mm512_mask_cvtt_roundps_epi32(W, U, A, R) \		#define _mm512_mask_cvtt_roundps_epi32(W, U, A, R) \
(__m512i)__builtin_ia32_cvttps2dq512_mask((__v16sf)(__m512)(A), \		(__m512i)__builtin_ia32_cvttps2dq512_mask((__v16sf)(__m512)(A), \
(__v16si)(__m512i)(W), \		(__v16si)(__m512i)(W), \
(__mmask16)(U), (int)(R))		(__mmask16)(U), (int)(R))

#define _mm512_maskz_cvtt_roundps_epi32(U, A, R) \		#define _mm512_maskz_cvtt_roundps_epi32(U, A, R) \
(__m512i)__builtin_ia32_cvttps2dq512_mask((__v16sf)(__m512)(A), \		(__m512i)__builtin_ia32_cvttps2dq512_mask((__v16sf)(__m512)(A), \
(__v16si)_mm512_setzero_si512(), \		(__v16si)_mm512_setzero_si512(), \
(__mmask16)(U), (int)(R))		(__mmask16)(U), (int)(R))

static __inline __m512i __DEFAULT_FN_ATTRS		static __inline __m512i __DEFAULT_FN_ATTRS512
_mm512_cvttps_epi32(__m512 __a)		_mm512_cvttps_epi32(__m512 __a)
{		{
return (__m512i)		return (__m512i)
__builtin_ia32_cvttps2dq512_mask((__v16sf) __a,		__builtin_ia32_cvttps2dq512_mask((__v16sf) __a,
(__v16si) _mm512_setzero_si512 (),		(__v16si) _mm512_setzero_si512 (),
(__mmask16) -1, _MM_FROUND_CUR_DIRECTION);		(__mmask16) -1, _MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_cvttps_epi32 (__m512i __W, __mmask16 __U, __m512 __A)		_mm512_mask_cvttps_epi32 (__m512i __W, __mmask16 __U, __m512 __A)
{		{
return (__m512i) __builtin_ia32_cvttps2dq512_mask ((__v16sf) __A,		return (__m512i) __builtin_ia32_cvttps2dq512_mask ((__v16sf) __A,
(__v16si) __W,		(__v16si) __W,
(__mmask16) __U,		(__mmask16) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_cvttps_epi32 (__mmask16 __U, __m512 __A)		_mm512_maskz_cvttps_epi32 (__mmask16 __U, __m512 __A)
{		{
return (__m512i) __builtin_ia32_cvttps2dq512_mask ((__v16sf) __A,		return (__m512i) __builtin_ia32_cvttps2dq512_mask ((__v16sf) __A,
(__v16si) _mm512_setzero_si512 (),		(__v16si) _mm512_setzero_si512 (),
(__mmask16) __U,		(__mmask16) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

#define _mm512_cvt_roundps_epi32(A, R) \		#define _mm512_cvt_roundps_epi32(A, R) \
(__m512i)__builtin_ia32_cvtps2dq512_mask((__v16sf)(__m512)(A), \		(__m512i)__builtin_ia32_cvtps2dq512_mask((__v16sf)(__m512)(A), \
(__v16si)_mm512_setzero_si512(), \		(__v16si)_mm512_setzero_si512(), \
(__mmask16)-1, (int)(R))		(__mmask16)-1, (int)(R))

#define _mm512_mask_cvt_roundps_epi32(W, U, A, R) \		#define _mm512_mask_cvt_roundps_epi32(W, U, A, R) \
(__m512i)__builtin_ia32_cvtps2dq512_mask((__v16sf)(__m512)(A), \		(__m512i)__builtin_ia32_cvtps2dq512_mask((__v16sf)(__m512)(A), \
(__v16si)(__m512i)(W), \		(__v16si)(__m512i)(W), \
(__mmask16)(U), (int)(R))		(__mmask16)(U), (int)(R))

#define _mm512_maskz_cvt_roundps_epi32(U, A, R) \		#define _mm512_maskz_cvt_roundps_epi32(U, A, R) \
(__m512i)__builtin_ia32_cvtps2dq512_mask((__v16sf)(__m512)(A), \		(__m512i)__builtin_ia32_cvtps2dq512_mask((__v16sf)(__m512)(A), \
(__v16si)_mm512_setzero_si512(), \		(__v16si)_mm512_setzero_si512(), \
(__mmask16)(U), (int)(R))		(__mmask16)(U), (int)(R))

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_cvtps_epi32 (__m512 __A)		_mm512_cvtps_epi32 (__m512 __A)
{		{
return (__m512i) __builtin_ia32_cvtps2dq512_mask ((__v16sf) __A,		return (__m512i) __builtin_ia32_cvtps2dq512_mask ((__v16sf) __A,
(__v16si) _mm512_undefined_epi32 (),		(__v16si) _mm512_undefined_epi32 (),
(__mmask16) -1,		(__mmask16) -1,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_cvtps_epi32 (__m512i __W, __mmask16 __U, __m512 __A)		_mm512_mask_cvtps_epi32 (__m512i __W, __mmask16 __U, __m512 __A)
{		{
return (__m512i) __builtin_ia32_cvtps2dq512_mask ((__v16sf) __A,		return (__m512i) __builtin_ia32_cvtps2dq512_mask ((__v16sf) __A,
(__v16si) __W,		(__v16si) __W,
(__mmask16) __U,		(__mmask16) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_cvtps_epi32 (__mmask16 __U, __m512 __A)		_mm512_maskz_cvtps_epi32 (__mmask16 __U, __m512 __A)
{		{
return (__m512i) __builtin_ia32_cvtps2dq512_mask ((__v16sf) __A,		return (__m512i) __builtin_ia32_cvtps2dq512_mask ((__v16sf) __A,
(__v16si)		(__v16si)
_mm512_setzero_si512 (),		_mm512_setzero_si512 (),
(__mmask16) __U,		(__mmask16) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

#define _mm512_cvt_roundpd_epi32(A, R) \		#define _mm512_cvt_roundpd_epi32(A, R) \
(__m256i)__builtin_ia32_cvtpd2dq512_mask((__v8df)(__m512d)(A), \		(__m256i)__builtin_ia32_cvtpd2dq512_mask((__v8df)(__m512d)(A), \
(__v8si)_mm256_setzero_si256(), \		(__v8si)_mm256_setzero_si256(), \
(__mmask8)-1, (int)(R))		(__mmask8)-1, (int)(R))

#define _mm512_mask_cvt_roundpd_epi32(W, U, A, R) \		#define _mm512_mask_cvt_roundpd_epi32(W, U, A, R) \
(__m256i)__builtin_ia32_cvtpd2dq512_mask((__v8df)(__m512d)(A), \		(__m256i)__builtin_ia32_cvtpd2dq512_mask((__v8df)(__m512d)(A), \
(__v8si)(__m256i)(W), \		(__v8si)(__m256i)(W), \
(__mmask8)(U), (int)(R))		(__mmask8)(U), (int)(R))

#define _mm512_maskz_cvt_roundpd_epi32(U, A, R) \		#define _mm512_maskz_cvt_roundpd_epi32(U, A, R) \
(__m256i)__builtin_ia32_cvtpd2dq512_mask((__v8df)(__m512d)(A), \		(__m256i)__builtin_ia32_cvtpd2dq512_mask((__v8df)(__m512d)(A), \
(__v8si)_mm256_setzero_si256(), \		(__v8si)_mm256_setzero_si256(), \
(__mmask8)(U), (int)(R))		(__mmask8)(U), (int)(R))

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS512
_mm512_cvtpd_epi32 (__m512d __A)		_mm512_cvtpd_epi32 (__m512d __A)
{		{
return (__m256i) __builtin_ia32_cvtpd2dq512_mask ((__v8df) __A,		return (__m256i) __builtin_ia32_cvtpd2dq512_mask ((__v8df) __A,
(__v8si)		(__v8si)
_mm256_undefined_si256 (),		_mm256_undefined_si256 (),
(__mmask8) -1,		(__mmask8) -1,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS512
_mm512_mask_cvtpd_epi32 (__m256i __W, __mmask8 __U, __m512d __A)		_mm512_mask_cvtpd_epi32 (__m256i __W, __mmask8 __U, __m512d __A)
{		{
return (__m256i) __builtin_ia32_cvtpd2dq512_mask ((__v8df) __A,		return (__m256i) __builtin_ia32_cvtpd2dq512_mask ((__v8df) __A,
(__v8si) __W,		(__v8si) __W,
(__mmask8) __U,		(__mmask8) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS512
_mm512_maskz_cvtpd_epi32 (__mmask8 __U, __m512d __A)		_mm512_maskz_cvtpd_epi32 (__mmask8 __U, __m512d __A)
{		{
return (__m256i) __builtin_ia32_cvtpd2dq512_mask ((__v8df) __A,		return (__m256i) __builtin_ia32_cvtpd2dq512_mask ((__v8df) __A,
(__v8si)		(__v8si)
_mm256_setzero_si256 (),		_mm256_setzero_si256 (),
(__mmask8) __U,		(__mmask8) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

#define _mm512_cvt_roundps_epu32(A, R) \		#define _mm512_cvt_roundps_epu32(A, R) \
(__m512i)__builtin_ia32_cvtps2udq512_mask((__v16sf)(__m512)(A), \		(__m512i)__builtin_ia32_cvtps2udq512_mask((__v16sf)(__m512)(A), \
(__v16si)_mm512_setzero_si512(), \		(__v16si)_mm512_setzero_si512(), \
(__mmask16)-1, (int)(R))		(__mmask16)-1, (int)(R))

#define _mm512_mask_cvt_roundps_epu32(W, U, A, R) \		#define _mm512_mask_cvt_roundps_epu32(W, U, A, R) \
(__m512i)__builtin_ia32_cvtps2udq512_mask((__v16sf)(__m512)(A), \		(__m512i)__builtin_ia32_cvtps2udq512_mask((__v16sf)(__m512)(A), \
(__v16si)(__m512i)(W), \		(__v16si)(__m512i)(W), \
(__mmask16)(U), (int)(R))		(__mmask16)(U), (int)(R))

#define _mm512_maskz_cvt_roundps_epu32(U, A, R) \		#define _mm512_maskz_cvt_roundps_epu32(U, A, R) \
(__m512i)__builtin_ia32_cvtps2udq512_mask((__v16sf)(__m512)(A), \		(__m512i)__builtin_ia32_cvtps2udq512_mask((__v16sf)(__m512)(A), \
(__v16si)_mm512_setzero_si512(), \		(__v16si)_mm512_setzero_si512(), \
(__mmask16)(U), (int)(R))		(__mmask16)(U), (int)(R))

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_cvtps_epu32 ( __m512 __A)		_mm512_cvtps_epu32 ( __m512 __A)
{		{
return (__m512i) __builtin_ia32_cvtps2udq512_mask ((__v16sf) __A,\		return (__m512i) __builtin_ia32_cvtps2udq512_mask ((__v16sf) __A,\
(__v16si)\		(__v16si)\
_mm512_undefined_epi32 (),\		_mm512_undefined_epi32 (),\
(__mmask16) -1,\		(__mmask16) -1,\
_MM_FROUND_CUR_DIRECTION);\		_MM_FROUND_CUR_DIRECTION);\
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_cvtps_epu32 (__m512i __W, __mmask16 __U, __m512 __A)		_mm512_mask_cvtps_epu32 (__m512i __W, __mmask16 __U, __m512 __A)
{		{
return (__m512i) __builtin_ia32_cvtps2udq512_mask ((__v16sf) __A,		return (__m512i) __builtin_ia32_cvtps2udq512_mask ((__v16sf) __A,
(__v16si) __W,		(__v16si) __W,
(__mmask16) __U,		(__mmask16) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_cvtps_epu32 ( __mmask16 __U, __m512 __A)		_mm512_maskz_cvtps_epu32 ( __mmask16 __U, __m512 __A)
{		{
return (__m512i) __builtin_ia32_cvtps2udq512_mask ((__v16sf) __A,		return (__m512i) __builtin_ia32_cvtps2udq512_mask ((__v16sf) __A,
(__v16si)		(__v16si)
_mm512_setzero_si512 (),		_mm512_setzero_si512 (),
(__mmask16) __U ,		(__mmask16) __U ,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

#define _mm512_cvt_roundpd_epu32(A, R) \		#define _mm512_cvt_roundpd_epu32(A, R) \
(__m256i)__builtin_ia32_cvtpd2udq512_mask((__v8df)(__m512d)(A), \		(__m256i)__builtin_ia32_cvtpd2udq512_mask((__v8df)(__m512d)(A), \
(__v8si)_mm256_setzero_si256(), \		(__v8si)_mm256_setzero_si256(), \
(__mmask8)-1, (int)(R))		(__mmask8)-1, (int)(R))

#define _mm512_mask_cvt_roundpd_epu32(W, U, A, R) \		#define _mm512_mask_cvt_roundpd_epu32(W, U, A, R) \
(__m256i)__builtin_ia32_cvtpd2udq512_mask((__v8df)(__m512d)(A), \		(__m256i)__builtin_ia32_cvtpd2udq512_mask((__v8df)(__m512d)(A), \
(__v8si)(__m256i)(W), \		(__v8si)(__m256i)(W), \
(__mmask8)(U), (int)(R))		(__mmask8)(U), (int)(R))

#define _mm512_maskz_cvt_roundpd_epu32(U, A, R) \		#define _mm512_maskz_cvt_roundpd_epu32(U, A, R) \
(__m256i)__builtin_ia32_cvtpd2udq512_mask((__v8df)(__m512d)(A), \		(__m256i)__builtin_ia32_cvtpd2udq512_mask((__v8df)(__m512d)(A), \
(__v8si)_mm256_setzero_si256(), \		(__v8si)_mm256_setzero_si256(), \
(__mmask8)(U), (int)(R))		(__mmask8)(U), (int)(R))

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS512
_mm512_cvtpd_epu32 (__m512d __A)		_mm512_cvtpd_epu32 (__m512d __A)
{		{
return (__m256i) __builtin_ia32_cvtpd2udq512_mask ((__v8df) __A,		return (__m256i) __builtin_ia32_cvtpd2udq512_mask ((__v8df) __A,
(__v8si)		(__v8si)
_mm256_undefined_si256 (),		_mm256_undefined_si256 (),
(__mmask8) -1,		(__mmask8) -1,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS512
_mm512_mask_cvtpd_epu32 (__m256i __W, __mmask8 __U, __m512d __A)		_mm512_mask_cvtpd_epu32 (__m256i __W, __mmask8 __U, __m512d __A)
{		{
return (__m256i) __builtin_ia32_cvtpd2udq512_mask ((__v8df) __A,		return (__m256i) __builtin_ia32_cvtpd2udq512_mask ((__v8df) __A,
(__v8si) __W,		(__v8si) __W,
(__mmask8) __U,		(__mmask8) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS512
_mm512_maskz_cvtpd_epu32 (__mmask8 __U, __m512d __A)		_mm512_maskz_cvtpd_epu32 (__mmask8 __U, __m512d __A)
{		{
return (__m256i) __builtin_ia32_cvtpd2udq512_mask ((__v8df) __A,		return (__m256i) __builtin_ia32_cvtpd2udq512_mask ((__v8df) __A,
(__v8si)		(__v8si)
_mm256_setzero_si256 (),		_mm256_setzero_si256 (),
(__mmask8) __U,		(__mmask8) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ double __DEFAULT_FN_ATTRS		static __inline__ double __DEFAULT_FN_ATTRS512
_mm512_cvtsd_f64(__m512d __a)		_mm512_cvtsd_f64(__m512d __a)
{		{
return __a[0];		return __a[0];
}		}

static __inline__ float __DEFAULT_FN_ATTRS		static __inline__ float __DEFAULT_FN_ATTRS512
_mm512_cvtss_f32(__m512 __a)		_mm512_cvtss_f32(__m512 __a)
{		{
return __a[0];		return __a[0];
}		}

/* Unpack and Interleave */		/* Unpack and Interleave */

static __inline __m512d __DEFAULT_FN_ATTRS		static __inline __m512d __DEFAULT_FN_ATTRS512
_mm512_unpackhi_pd(__m512d __a, __m512d __b)		_mm512_unpackhi_pd(__m512d __a, __m512d __b)
{		{
return (__m512d)__builtin_shufflevector((__v8df)__a, (__v8df)__b,		return (__m512d)__builtin_shufflevector((__v8df)__a, (__v8df)__b,
1, 9, 1+2, 9+2, 1+4, 9+4, 1+6, 9+6);		1, 9, 1+2, 9+2, 1+4, 9+4, 1+6, 9+6);
}		}

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_mask_unpackhi_pd(__m512d __W, __mmask8 __U, __m512d __A, __m512d __B)		_mm512_mask_unpackhi_pd(__m512d __W, __mmask8 __U, __m512d __A, __m512d __B)
{		{
return (__m512d)__builtin_ia32_selectpd_512((__mmask8) __U,		return (__m512d)__builtin_ia32_selectpd_512((__mmask8) __U,
(__v8df)_mm512_unpackhi_pd(__A, __B),		(__v8df)_mm512_unpackhi_pd(__A, __B),
(__v8df)__W);		(__v8df)__W);
}		}

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_maskz_unpackhi_pd(__mmask8 __U, __m512d __A, __m512d __B)		_mm512_maskz_unpackhi_pd(__mmask8 __U, __m512d __A, __m512d __B)
{		{
return (__m512d)__builtin_ia32_selectpd_512((__mmask8) __U,		return (__m512d)__builtin_ia32_selectpd_512((__mmask8) __U,
(__v8df)_mm512_unpackhi_pd(__A, __B),		(__v8df)_mm512_unpackhi_pd(__A, __B),
(__v8df)_mm512_setzero_pd());		(__v8df)_mm512_setzero_pd());
}		}

static __inline __m512d __DEFAULT_FN_ATTRS		static __inline __m512d __DEFAULT_FN_ATTRS512
_mm512_unpacklo_pd(__m512d __a, __m512d __b)		_mm512_unpacklo_pd(__m512d __a, __m512d __b)
{		{
return (__m512d)__builtin_shufflevector((__v8df)__a, (__v8df)__b,		return (__m512d)__builtin_shufflevector((__v8df)__a, (__v8df)__b,
0, 8, 0+2, 8+2, 0+4, 8+4, 0+6, 8+6);		0, 8, 0+2, 8+2, 0+4, 8+4, 0+6, 8+6);
}		}

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_mask_unpacklo_pd(__m512d __W, __mmask8 __U, __m512d __A, __m512d __B)		_mm512_mask_unpacklo_pd(__m512d __W, __mmask8 __U, __m512d __A, __m512d __B)
{		{
return (__m512d)__builtin_ia32_selectpd_512((__mmask8) __U,		return (__m512d)__builtin_ia32_selectpd_512((__mmask8) __U,
(__v8df)_mm512_unpacklo_pd(__A, __B),		(__v8df)_mm512_unpacklo_pd(__A, __B),
(__v8df)__W);		(__v8df)__W);
}		}

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_maskz_unpacklo_pd (__mmask8 __U, __m512d __A, __m512d __B)		_mm512_maskz_unpacklo_pd (__mmask8 __U, __m512d __A, __m512d __B)
{		{
return (__m512d)__builtin_ia32_selectpd_512((__mmask8) __U,		return (__m512d)__builtin_ia32_selectpd_512((__mmask8) __U,
(__v8df)_mm512_unpacklo_pd(__A, __B),		(__v8df)_mm512_unpacklo_pd(__A, __B),
(__v8df)_mm512_setzero_pd());		(__v8df)_mm512_setzero_pd());
}		}

static __inline __m512 __DEFAULT_FN_ATTRS		static __inline __m512 __DEFAULT_FN_ATTRS512
_mm512_unpackhi_ps(__m512 __a, __m512 __b)		_mm512_unpackhi_ps(__m512 __a, __m512 __b)
{		{
return (__m512)__builtin_shufflevector((__v16sf)__a, (__v16sf)__b,		return (__m512)__builtin_shufflevector((__v16sf)__a, (__v16sf)__b,
2, 18, 3, 19,		2, 18, 3, 19,
2+4, 18+4, 3+4, 19+4,		2+4, 18+4, 3+4, 19+4,
2+8, 18+8, 3+8, 19+8,		2+8, 18+8, 3+8, 19+8,
2+12, 18+12, 3+12, 19+12);		2+12, 18+12, 3+12, 19+12);
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_mask_unpackhi_ps(__m512 __W, __mmask16 __U, __m512 __A, __m512 __B)		_mm512_mask_unpackhi_ps(__m512 __W, __mmask16 __U, __m512 __A, __m512 __B)
{		{
return (__m512)__builtin_ia32_selectps_512((__mmask16) __U,		return (__m512)__builtin_ia32_selectps_512((__mmask16) __U,
(__v16sf)_mm512_unpackhi_ps(__A, __B),		(__v16sf)_mm512_unpackhi_ps(__A, __B),
(__v16sf)__W);		(__v16sf)__W);
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_maskz_unpackhi_ps (__mmask16 __U, __m512 __A, __m512 __B)		_mm512_maskz_unpackhi_ps (__mmask16 __U, __m512 __A, __m512 __B)
{		{
return (__m512)__builtin_ia32_selectps_512((__mmask16) __U,		return (__m512)__builtin_ia32_selectps_512((__mmask16) __U,
(__v16sf)_mm512_unpackhi_ps(__A, __B),		(__v16sf)_mm512_unpackhi_ps(__A, __B),
(__v16sf)_mm512_setzero_ps());		(__v16sf)_mm512_setzero_ps());
}		}

static __inline __m512 __DEFAULT_FN_ATTRS		static __inline __m512 __DEFAULT_FN_ATTRS512
_mm512_unpacklo_ps(__m512 __a, __m512 __b)		_mm512_unpacklo_ps(__m512 __a, __m512 __b)
{		{
return (__m512)__builtin_shufflevector((__v16sf)__a, (__v16sf)__b,		return (__m512)__builtin_shufflevector((__v16sf)__a, (__v16sf)__b,
0, 16, 1, 17,		0, 16, 1, 17,
0+4, 16+4, 1+4, 17+4,		0+4, 16+4, 1+4, 17+4,
0+8, 16+8, 1+8, 17+8,		0+8, 16+8, 1+8, 17+8,
0+12, 16+12, 1+12, 17+12);		0+12, 16+12, 1+12, 17+12);
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_mask_unpacklo_ps(__m512 __W, __mmask16 __U, __m512 __A, __m512 __B)		_mm512_mask_unpacklo_ps(__m512 __W, __mmask16 __U, __m512 __A, __m512 __B)
{		{
return (__m512)__builtin_ia32_selectps_512((__mmask16) __U,		return (__m512)__builtin_ia32_selectps_512((__mmask16) __U,
(__v16sf)_mm512_unpacklo_ps(__A, __B),		(__v16sf)_mm512_unpacklo_ps(__A, __B),
(__v16sf)__W);		(__v16sf)__W);
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_maskz_unpacklo_ps (__mmask16 __U, __m512 __A, __m512 __B)		_mm512_maskz_unpacklo_ps (__mmask16 __U, __m512 __A, __m512 __B)
{		{
return (__m512)__builtin_ia32_selectps_512((__mmask16) __U,		return (__m512)__builtin_ia32_selectps_512((__mmask16) __U,
(__v16sf)_mm512_unpacklo_ps(__A, __B),		(__v16sf)_mm512_unpacklo_ps(__A, __B),
(__v16sf)_mm512_setzero_ps());		(__v16sf)_mm512_setzero_ps());
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_unpackhi_epi32(__m512i __A, __m512i __B)		_mm512_unpackhi_epi32(__m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_shufflevector((__v16si)__A, (__v16si)__B,		return (__m512i)__builtin_shufflevector((__v16si)__A, (__v16si)__B,
2, 18, 3, 19,		2, 18, 3, 19,
2+4, 18+4, 3+4, 19+4,		2+4, 18+4, 3+4, 19+4,
2+8, 18+8, 3+8, 19+8,		2+8, 18+8, 3+8, 19+8,
2+12, 18+12, 3+12, 19+12);		2+12, 18+12, 3+12, 19+12);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_unpackhi_epi32(__m512i __W, __mmask16 __U, __m512i __A, __m512i __B)		_mm512_mask_unpackhi_epi32(__m512i __W, __mmask16 __U, __m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_selectd_512((__mmask16) __U,		return (__m512i)__builtin_ia32_selectd_512((__mmask16) __U,
(__v16si)_mm512_unpackhi_epi32(__A, __B),		(__v16si)_mm512_unpackhi_epi32(__A, __B),
(__v16si)__W);		(__v16si)__W);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_unpackhi_epi32(__mmask16 __U, __m512i __A, __m512i __B)		_mm512_maskz_unpackhi_epi32(__mmask16 __U, __m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_selectd_512((__mmask16) __U,		return (__m512i)__builtin_ia32_selectd_512((__mmask16) __U,
(__v16si)_mm512_unpackhi_epi32(__A, __B),		(__v16si)_mm512_unpackhi_epi32(__A, __B),
(__v16si)_mm512_setzero_si512());		(__v16si)_mm512_setzero_si512());
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_unpacklo_epi32(__m512i __A, __m512i __B)		_mm512_unpacklo_epi32(__m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_shufflevector((__v16si)__A, (__v16si)__B,		return (__m512i)__builtin_shufflevector((__v16si)__A, (__v16si)__B,
0, 16, 1, 17,		0, 16, 1, 17,
0+4, 16+4, 1+4, 17+4,		0+4, 16+4, 1+4, 17+4,
0+8, 16+8, 1+8, 17+8,		0+8, 16+8, 1+8, 17+8,
0+12, 16+12, 1+12, 17+12);		0+12, 16+12, 1+12, 17+12);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_unpacklo_epi32(__m512i __W, __mmask16 __U, __m512i __A, __m512i __B)		_mm512_mask_unpacklo_epi32(__m512i __W, __mmask16 __U, __m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_selectd_512((__mmask16) __U,		return (__m512i)__builtin_ia32_selectd_512((__mmask16) __U,
(__v16si)_mm512_unpacklo_epi32(__A, __B),		(__v16si)_mm512_unpacklo_epi32(__A, __B),
(__v16si)__W);		(__v16si)__W);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_unpacklo_epi32(__mmask16 __U, __m512i __A, __m512i __B)		_mm512_maskz_unpacklo_epi32(__mmask16 __U, __m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_selectd_512((__mmask16) __U,		return (__m512i)__builtin_ia32_selectd_512((__mmask16) __U,
(__v16si)_mm512_unpacklo_epi32(__A, __B),		(__v16si)_mm512_unpacklo_epi32(__A, __B),
(__v16si)_mm512_setzero_si512());		(__v16si)_mm512_setzero_si512());
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_unpackhi_epi64(__m512i __A, __m512i __B)		_mm512_unpackhi_epi64(__m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_shufflevector((__v8di)__A, (__v8di)__B,		return (__m512i)__builtin_shufflevector((__v8di)__A, (__v8di)__B,
1, 9, 1+2, 9+2, 1+4, 9+4, 1+6, 9+6);		1, 9, 1+2, 9+2, 1+4, 9+4, 1+6, 9+6);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_unpackhi_epi64(__m512i __W, __mmask8 __U, __m512i __A, __m512i __B)		_mm512_mask_unpackhi_epi64(__m512i __W, __mmask8 __U, __m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_selectq_512((__mmask8) __U,		return (__m512i)__builtin_ia32_selectq_512((__mmask8) __U,
(__v8di)_mm512_unpackhi_epi64(__A, __B),		(__v8di)_mm512_unpackhi_epi64(__A, __B),
(__v8di)__W);		(__v8di)__W);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_unpackhi_epi64(__mmask8 __U, __m512i __A, __m512i __B)		_mm512_maskz_unpackhi_epi64(__mmask8 __U, __m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_selectq_512((__mmask8) __U,		return (__m512i)__builtin_ia32_selectq_512((__mmask8) __U,
(__v8di)_mm512_unpackhi_epi64(__A, __B),		(__v8di)_mm512_unpackhi_epi64(__A, __B),
(__v8di)_mm512_setzero_si512());		(__v8di)_mm512_setzero_si512());
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_unpacklo_epi64 (__m512i __A, __m512i __B)		_mm512_unpacklo_epi64 (__m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_shufflevector((__v8di)__A, (__v8di)__B,		return (__m512i)__builtin_shufflevector((__v8di)__A, (__v8di)__B,
0, 8, 0+2, 8+2, 0+4, 8+4, 0+6, 8+6);		0, 8, 0+2, 8+2, 0+4, 8+4, 0+6, 8+6);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_unpacklo_epi64 (__m512i __W, __mmask8 __U, __m512i __A, __m512i __B)		_mm512_mask_unpacklo_epi64 (__m512i __W, __mmask8 __U, __m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_selectq_512((__mmask8) __U,		return (__m512i)__builtin_ia32_selectq_512((__mmask8) __U,
(__v8di)_mm512_unpacklo_epi64(__A, __B),		(__v8di)_mm512_unpacklo_epi64(__A, __B),
(__v8di)__W);		(__v8di)__W);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_unpacklo_epi64 (__mmask8 __U, __m512i __A, __m512i __B)		_mm512_maskz_unpacklo_epi64 (__mmask8 __U, __m512i __A, __m512i __B)
{		{
return (__m512i)__builtin_ia32_selectq_512((__mmask8) __U,		return (__m512i)__builtin_ia32_selectq_512((__mmask8) __U,
(__v8di)_mm512_unpacklo_epi64(__A, __B),		(__v8di)_mm512_unpacklo_epi64(__A, __B),
(__v8di)_mm512_setzero_si512());		(__v8di)_mm512_setzero_si512());
}		}


/* SIMD load ops */		/* SIMD load ops */

static __inline __m512i __DEFAULT_FN_ATTRS		static __inline __m512i __DEFAULT_FN_ATTRS512
_mm512_loadu_si512 (void const *__P)		_mm512_loadu_si512 (void const *__P)
{		{
struct __loadu_si512 {		struct __loadu_si512 {
__m512i __v;		__m512i __v;
} __attribute__((__packed__, __may_alias__));		} __attribute__((__packed__, __may_alias__));
return ((struct __loadu_si512*)__P)->__v;		return ((struct __loadu_si512*)__P)->__v;
}		}

static __inline __m512i __DEFAULT_FN_ATTRS		static __inline __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_loadu_epi32 (__m512i __W, __mmask16 __U, void const *__P)		_mm512_mask_loadu_epi32 (__m512i __W, __mmask16 __U, void const *__P)
{		{
return (__m512i) __builtin_ia32_loaddqusi512_mask ((const int *) __P,		return (__m512i) __builtin_ia32_loaddqusi512_mask ((const int *) __P,
(__v16si) __W,		(__v16si) __W,
(__mmask16) __U);		(__mmask16) __U);
}		}


static __inline __m512i __DEFAULT_FN_ATTRS		static __inline __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_loadu_epi32(__mmask16 __U, void const *__P)		_mm512_maskz_loadu_epi32(__mmask16 __U, void const *__P)
{		{
return (__m512i) __builtin_ia32_loaddqusi512_mask ((const int *)__P,		return (__m512i) __builtin_ia32_loaddqusi512_mask ((const int *)__P,
(__v16si)		(__v16si)
_mm512_setzero_si512 (),		_mm512_setzero_si512 (),
(__mmask16) __U);		(__mmask16) __U);
}		}

static __inline __m512i __DEFAULT_FN_ATTRS		static __inline __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_loadu_epi64 (__m512i __W, __mmask8 __U, void const *__P)		_mm512_mask_loadu_epi64 (__m512i __W, __mmask8 __U, void const *__P)
{		{
return (__m512i) __builtin_ia32_loaddqudi512_mask ((const long long *) __P,		return (__m512i) __builtin_ia32_loaddqudi512_mask ((const long long *) __P,
(__v8di) __W,		(__v8di) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline __m512i __DEFAULT_FN_ATTRS		static __inline __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_loadu_epi64(__mmask8 __U, void const *__P)		_mm512_maskz_loadu_epi64(__mmask8 __U, void const *__P)
{		{
return (__m512i) __builtin_ia32_loaddqudi512_mask ((const long long *)__P,		return (__m512i) __builtin_ia32_loaddqudi512_mask ((const long long *)__P,
(__v8di)		(__v8di)
_mm512_setzero_si512 (),		_mm512_setzero_si512 (),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline __m512 __DEFAULT_FN_ATTRS		static __inline __m512 __DEFAULT_FN_ATTRS512
_mm512_mask_loadu_ps (__m512 __W, __mmask16 __U, void const *__P)		_mm512_mask_loadu_ps (__m512 __W, __mmask16 __U, void const *__P)
{		{
return (__m512) __builtin_ia32_loadups512_mask ((const float *) __P,		return (__m512) __builtin_ia32_loadups512_mask ((const float *) __P,
(__v16sf) __W,		(__v16sf) __W,
(__mmask16) __U);		(__mmask16) __U);
}		}

static __inline __m512 __DEFAULT_FN_ATTRS		static __inline __m512 __DEFAULT_FN_ATTRS512
_mm512_maskz_loadu_ps(__mmask16 __U, void const *__P)		_mm512_maskz_loadu_ps(__mmask16 __U, void const *__P)
{		{
return (__m512) __builtin_ia32_loadups512_mask ((const float *)__P,		return (__m512) __builtin_ia32_loadups512_mask ((const float *)__P,
(__v16sf)		(__v16sf)
_mm512_setzero_ps (),		_mm512_setzero_ps (),
(__mmask16) __U);		(__mmask16) __U);
}		}

static __inline __m512d __DEFAULT_FN_ATTRS		static __inline __m512d __DEFAULT_FN_ATTRS512
_mm512_mask_loadu_pd (__m512d __W, __mmask8 __U, void const *__P)		_mm512_mask_loadu_pd (__m512d __W, __mmask8 __U, void const *__P)
{		{
return (__m512d) __builtin_ia32_loadupd512_mask ((const double *) __P,		return (__m512d) __builtin_ia32_loadupd512_mask ((const double *) __P,
(__v8df) __W,		(__v8df) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline __m512d __DEFAULT_FN_ATTRS		static __inline __m512d __DEFAULT_FN_ATTRS512
_mm512_maskz_loadu_pd(__mmask8 __U, void const *__P)		_mm512_maskz_loadu_pd(__mmask8 __U, void const *__P)
{		{
return (__m512d) __builtin_ia32_loadupd512_mask ((const double *)__P,		return (__m512d) __builtin_ia32_loadupd512_mask ((const double *)__P,
(__v8df)		(__v8df)
_mm512_setzero_pd (),		_mm512_setzero_pd (),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline __m512d __DEFAULT_FN_ATTRS		static __inline __m512d __DEFAULT_FN_ATTRS512
_mm512_loadu_pd(void const *__p)		_mm512_loadu_pd(void const *__p)
{		{
struct __loadu_pd {		struct __loadu_pd {
__m512d __v;		__m512d __v;
} __attribute__((__packed__, __may_alias__));		} __attribute__((__packed__, __may_alias__));
return ((struct __loadu_pd*)__p)->__v;		return ((struct __loadu_pd*)__p)->__v;
}		}

static __inline __m512 __DEFAULT_FN_ATTRS		static __inline __m512 __DEFAULT_FN_ATTRS512
_mm512_loadu_ps(void const *__p)		_mm512_loadu_ps(void const *__p)
{		{
struct __loadu_ps {		struct __loadu_ps {
__m512 __v;		__m512 __v;
} __attribute__((__packed__, __may_alias__));		} __attribute__((__packed__, __may_alias__));
return ((struct __loadu_ps*)__p)->__v;		return ((struct __loadu_ps*)__p)->__v;
}		}

static __inline __m512 __DEFAULT_FN_ATTRS		static __inline __m512 __DEFAULT_FN_ATTRS512
_mm512_load_ps(void const *__p)		_mm512_load_ps(void const *__p)
{		{
return (__m512)__p;		return (__m512)__p;
}		}

static __inline __m512 __DEFAULT_FN_ATTRS		static __inline __m512 __DEFAULT_FN_ATTRS512
_mm512_mask_load_ps (__m512 __W, __mmask16 __U, void const *__P)		_mm512_mask_load_ps (__m512 __W, __mmask16 __U, void const *__P)
{		{
return (__m512) __builtin_ia32_loadaps512_mask ((const __v16sf *) __P,		return (__m512) __builtin_ia32_loadaps512_mask ((const __v16sf *) __P,
(__v16sf) __W,		(__v16sf) __W,
(__mmask16) __U);		(__mmask16) __U);
}		}

static __inline __m512 __DEFAULT_FN_ATTRS		static __inline __m512 __DEFAULT_FN_ATTRS512
_mm512_maskz_load_ps(__mmask16 __U, void const *__P)		_mm512_maskz_load_ps(__mmask16 __U, void const *__P)
{		{
return (__m512) __builtin_ia32_loadaps512_mask ((const __v16sf *)__P,		return (__m512) __builtin_ia32_loadaps512_mask ((const __v16sf *)__P,
(__v16sf)		(__v16sf)
_mm512_setzero_ps (),		_mm512_setzero_ps (),
(__mmask16) __U);		(__mmask16) __U);
}		}

static __inline __m512d __DEFAULT_FN_ATTRS		static __inline __m512d __DEFAULT_FN_ATTRS512
_mm512_load_pd(void const *__p)		_mm512_load_pd(void const *__p)
{		{
return (__m512d)__p;		return (__m512d)__p;
}		}

static __inline __m512d __DEFAULT_FN_ATTRS		static __inline __m512d __DEFAULT_FN_ATTRS512
_mm512_mask_load_pd (__m512d __W, __mmask8 __U, void const *__P)		_mm512_mask_load_pd (__m512d __W, __mmask8 __U, void const *__P)
{		{
return (__m512d) __builtin_ia32_loadapd512_mask ((const __v8df *) __P,		return (__m512d) __builtin_ia32_loadapd512_mask ((const __v8df *) __P,
(__v8df) __W,		(__v8df) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline __m512d __DEFAULT_FN_ATTRS		static __inline __m512d __DEFAULT_FN_ATTRS512
_mm512_maskz_load_pd(__mmask8 __U, void const *__P)		_mm512_maskz_load_pd(__mmask8 __U, void const *__P)
{		{
return (__m512d) __builtin_ia32_loadapd512_mask ((const __v8df *)__P,		return (__m512d) __builtin_ia32_loadapd512_mask ((const __v8df *)__P,
(__v8df)		(__v8df)
_mm512_setzero_pd (),		_mm512_setzero_pd (),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline __m512i __DEFAULT_FN_ATTRS		static __inline __m512i __DEFAULT_FN_ATTRS512
_mm512_load_si512 (void const *__P)		_mm512_load_si512 (void const *__P)
{		{
return (__m512i ) __P;		return (__m512i ) __P;
}		}

static __inline __m512i __DEFAULT_FN_ATTRS		static __inline __m512i __DEFAULT_FN_ATTRS512
_mm512_load_epi32 (void const *__P)		_mm512_load_epi32 (void const *__P)
{		{
return (__m512i ) __P;		return (__m512i ) __P;
}		}

static __inline __m512i __DEFAULT_FN_ATTRS		static __inline __m512i __DEFAULT_FN_ATTRS512
_mm512_load_epi64 (void const *__P)		_mm512_load_epi64 (void const *__P)
{		{
return (__m512i ) __P;		return (__m512i ) __P;
}		}

/* SIMD store ops */		/* SIMD store ops */

static __inline void __DEFAULT_FN_ATTRS		static __inline void __DEFAULT_FN_ATTRS512
_mm512_mask_storeu_epi64(void *__P, __mmask8 __U, __m512i __A)		_mm512_mask_storeu_epi64(void *__P, __mmask8 __U, __m512i __A)
{		{
__builtin_ia32_storedqudi512_mask ((long long *)__P, (__v8di) __A,		__builtin_ia32_storedqudi512_mask ((long long *)__P, (__v8di) __A,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline void __DEFAULT_FN_ATTRS		static __inline void __DEFAULT_FN_ATTRS512
_mm512_storeu_si512 (void *__P, __m512i __A)		_mm512_storeu_si512 (void *__P, __m512i __A)
{		{
struct __storeu_si512 {		struct __storeu_si512 {
__m512i __v;		__m512i __v;
} __attribute__((__packed__, __may_alias__));		} __attribute__((__packed__, __may_alias__));
((struct __storeu_si512*)__P)->__v = __A;		((struct __storeu_si512*)__P)->__v = __A;
}		}

static __inline void __DEFAULT_FN_ATTRS		static __inline void __DEFAULT_FN_ATTRS512
_mm512_mask_storeu_epi32(void *__P, __mmask16 __U, __m512i __A)		_mm512_mask_storeu_epi32(void *__P, __mmask16 __U, __m512i __A)
{		{
__builtin_ia32_storedqusi512_mask ((int *)__P, (__v16si) __A,		__builtin_ia32_storedqusi512_mask ((int *)__P, (__v16si) __A,
(__mmask16) __U);		(__mmask16) __U);
}		}

static __inline void __DEFAULT_FN_ATTRS		static __inline void __DEFAULT_FN_ATTRS512
_mm512_mask_storeu_pd(void *__P, __mmask8 __U, __m512d __A)		_mm512_mask_storeu_pd(void *__P, __mmask8 __U, __m512d __A)
{		{
__builtin_ia32_storeupd512_mask ((double *)__P, (__v8df) __A, (__mmask8) __U);		__builtin_ia32_storeupd512_mask ((double *)__P, (__v8df) __A, (__mmask8) __U);
}		}

static __inline void __DEFAULT_FN_ATTRS		static __inline void __DEFAULT_FN_ATTRS512
_mm512_storeu_pd(void *__P, __m512d __A)		_mm512_storeu_pd(void *__P, __m512d __A)
{		{
struct __storeu_pd {		struct __storeu_pd {
__m512d __v;		__m512d __v;
} __attribute__((__packed__, __may_alias__));		} __attribute__((__packed__, __may_alias__));
((struct __storeu_pd*)__P)->__v = __A;		((struct __storeu_pd*)__P)->__v = __A;
}		}

static __inline void __DEFAULT_FN_ATTRS		static __inline void __DEFAULT_FN_ATTRS512
_mm512_mask_storeu_ps(void *__P, __mmask16 __U, __m512 __A)		_mm512_mask_storeu_ps(void *__P, __mmask16 __U, __m512 __A)
{		{
__builtin_ia32_storeups512_mask ((float *)__P, (__v16sf) __A,		__builtin_ia32_storeups512_mask ((float *)__P, (__v16sf) __A,
(__mmask16) __U);		(__mmask16) __U);
}		}

static __inline void __DEFAULT_FN_ATTRS		static __inline void __DEFAULT_FN_ATTRS512
_mm512_storeu_ps(void *__P, __m512 __A)		_mm512_storeu_ps(void *__P, __m512 __A)
{		{
struct __storeu_ps {		struct __storeu_ps {
__m512 __v;		__m512 __v;
} __attribute__((__packed__, __may_alias__));		} __attribute__((__packed__, __may_alias__));
((struct __storeu_ps*)__P)->__v = __A;		((struct __storeu_ps*)__P)->__v = __A;
}		}

static __inline void __DEFAULT_FN_ATTRS		static __inline void __DEFAULT_FN_ATTRS512
_mm512_mask_store_pd(void *__P, __mmask8 __U, __m512d __A)		_mm512_mask_store_pd(void *__P, __mmask8 __U, __m512d __A)
{		{
__builtin_ia32_storeapd512_mask ((__v8df *)__P, (__v8df) __A, (__mmask8) __U);		__builtin_ia32_storeapd512_mask ((__v8df *)__P, (__v8df) __A, (__mmask8) __U);
}		}

static __inline void __DEFAULT_FN_ATTRS		static __inline void __DEFAULT_FN_ATTRS512
_mm512_store_pd(void *__P, __m512d __A)		_mm512_store_pd(void *__P, __m512d __A)
{		{
(__m512d)__P = __A;		(__m512d)__P = __A;
}		}

static __inline void __DEFAULT_FN_ATTRS		static __inline void __DEFAULT_FN_ATTRS512
_mm512_mask_store_ps(void *__P, __mmask16 __U, __m512 __A)		_mm512_mask_store_ps(void *__P, __mmask16 __U, __m512 __A)
{		{
__builtin_ia32_storeaps512_mask ((__v16sf *)__P, (__v16sf) __A,		__builtin_ia32_storeaps512_mask ((__v16sf *)__P, (__v16sf) __A,
(__mmask16) __U);		(__mmask16) __U);
}		}

static __inline void __DEFAULT_FN_ATTRS		static __inline void __DEFAULT_FN_ATTRS512
_mm512_store_ps(void *__P, __m512 __A)		_mm512_store_ps(void *__P, __m512 __A)
{		{
(__m512)__P = __A;		(__m512)__P = __A;
}		}

static __inline void __DEFAULT_FN_ATTRS		static __inline void __DEFAULT_FN_ATTRS512
_mm512_store_si512 (void *__P, __m512i __A)		_mm512_store_si512 (void *__P, __m512i __A)
{		{
(__m512i ) __P = __A;		(__m512i ) __P = __A;
}		}

static __inline void __DEFAULT_FN_ATTRS		static __inline void __DEFAULT_FN_ATTRS512
_mm512_store_epi32 (void *__P, __m512i __A)		_mm512_store_epi32 (void *__P, __m512i __A)
{		{
(__m512i ) __P = __A;		(__m512i ) __P = __A;
}		}

static __inline void __DEFAULT_FN_ATTRS		static __inline void __DEFAULT_FN_ATTRS512
_mm512_store_epi64 (void *__P, __m512i __A)		_mm512_store_epi64 (void *__P, __m512i __A)
{		{
(__m512i ) __P = __A;		(__m512i ) __P = __A;
}		}

/* Mask ops */		/* Mask ops */

static __inline __mmask16 __DEFAULT_FN_ATTRS		static __inline __mmask16 __DEFAULT_FN_ATTRS512
_mm512_knot(__mmask16 __M)		_mm512_knot(__mmask16 __M)
{		{
return __builtin_ia32_knothi(__M);		return __builtin_ia32_knothi(__M);
}		}

/* Integer compare */		/* Integer compare */

#define _mm512_cmpeq_epi32_mask(A, B) \		#define _mm512_cmpeq_epi32_mask(A, B) \
▲ Show 20 Lines • Show All 91 Lines • ▼ Show 20 Lines	#define _mm512_cmplt_epu64_mask(A, B) \
_mm512_cmp_epu64_mask((A), (B), _MM_CMPINT_LT)		_mm512_cmp_epu64_mask((A), (B), _MM_CMPINT_LT)
#define _mm512_mask_cmplt_epu64_mask(k, A, B) \		#define _mm512_mask_cmplt_epu64_mask(k, A, B) \
_mm512_mask_cmp_epu64_mask((k), (A), (B), _MM_CMPINT_LT)		_mm512_mask_cmp_epu64_mask((k), (A), (B), _MM_CMPINT_LT)
#define _mm512_cmpneq_epu64_mask(A, B) \		#define _mm512_cmpneq_epu64_mask(A, B) \
_mm512_cmp_epu64_mask((A), (B), _MM_CMPINT_NE)		_mm512_cmp_epu64_mask((A), (B), _MM_CMPINT_NE)
#define _mm512_mask_cmpneq_epu64_mask(k, A, B) \		#define _mm512_mask_cmpneq_epu64_mask(k, A, B) \
_mm512_mask_cmp_epu64_mask((k), (A), (B), _MM_CMPINT_NE)		_mm512_mask_cmp_epu64_mask((k), (A), (B), _MM_CMPINT_NE)

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_cvtepi8_epi32(__m128i __A)		_mm512_cvtepi8_epi32(__m128i __A)
{		{
/* This function always performs a signed extension, but __v16qi is a char		/* This function always performs a signed extension, but __v16qi is a char
which may be signed or unsigned, so use __v16qs. */		which may be signed or unsigned, so use __v16qs. */
return (__m512i)__builtin_convertvector((__v16qs)__A, __v16si);		return (__m512i)__builtin_convertvector((__v16qs)__A, __v16si);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_cvtepi8_epi32(__m512i __W, __mmask16 __U, __m128i __A)		_mm512_mask_cvtepi8_epi32(__m512i __W, __mmask16 __U, __m128i __A)
{		{
return (__m512i)__builtin_ia32_selectd_512((__mmask16)__U,		return (__m512i)__builtin_ia32_selectd_512((__mmask16)__U,
(__v16si)_mm512_cvtepi8_epi32(__A),		(__v16si)_mm512_cvtepi8_epi32(__A),
(__v16si)__W);		(__v16si)__W);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_cvtepi8_epi32(__mmask16 __U, __m128i __A)		_mm512_maskz_cvtepi8_epi32(__mmask16 __U, __m128i __A)
{		{
return (__m512i)__builtin_ia32_selectd_512((__mmask16)__U,		return (__m512i)__builtin_ia32_selectd_512((__mmask16)__U,
(__v16si)_mm512_cvtepi8_epi32(__A),		(__v16si)_mm512_cvtepi8_epi32(__A),
(__v16si)_mm512_setzero_si512());		(__v16si)_mm512_setzero_si512());
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_cvtepi8_epi64(__m128i __A)		_mm512_cvtepi8_epi64(__m128i __A)
{		{
/* This function always performs a signed extension, but __v16qi is a char		/* This function always performs a signed extension, but __v16qi is a char
which may be signed or unsigned, so use __v16qs. */		which may be signed or unsigned, so use __v16qs. */
return (__m512i)__builtin_convertvector(__builtin_shufflevector((__v16qs)__A, (__v16qs)__A, 0, 1, 2, 3, 4, 5, 6, 7), __v8di);		return (__m512i)__builtin_convertvector(__builtin_shufflevector((__v16qs)__A, (__v16qs)__A, 0, 1, 2, 3, 4, 5, 6, 7), __v8di);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_cvtepi8_epi64(__m512i __W, __mmask8 __U, __m128i __A)		_mm512_mask_cvtepi8_epi64(__m512i __W, __mmask8 __U, __m128i __A)
{		{
return (__m512i)__builtin_ia32_selectq_512((__mmask8)__U,		return (__m512i)__builtin_ia32_selectq_512((__mmask8)__U,
(__v8di)_mm512_cvtepi8_epi64(__A),		(__v8di)_mm512_cvtepi8_epi64(__A),
(__v8di)__W);		(__v8di)__W);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_cvtepi8_epi64(__mmask8 __U, __m128i __A)		_mm512_maskz_cvtepi8_epi64(__mmask8 __U, __m128i __A)
{		{
return (__m512i)__builtin_ia32_selectq_512((__mmask8)__U,		return (__m512i)__builtin_ia32_selectq_512((__mmask8)__U,
(__v8di)_mm512_cvtepi8_epi64(__A),		(__v8di)_mm512_cvtepi8_epi64(__A),
(__v8di)_mm512_setzero_si512 ());		(__v8di)_mm512_setzero_si512 ());
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_cvtepi32_epi64(__m256i __X)		_mm512_cvtepi32_epi64(__m256i __X)
{		{
return (__m512i)__builtin_convertvector((__v8si)__X, __v8di);		return (__m512i)__builtin_convertvector((__v8si)__X, __v8di);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_cvtepi32_epi64(__m512i __W, __mmask8 __U, __m256i __X)		_mm512_mask_cvtepi32_epi64(__m512i __W, __mmask8 __U, __m256i __X)
{		{
return (__m512i)__builtin_ia32_selectq_512((__mmask8)__U,		return (__m512i)__builtin_ia32_selectq_512((__mmask8)__U,
(__v8di)_mm512_cvtepi32_epi64(__X),		(__v8di)_mm512_cvtepi32_epi64(__X),
(__v8di)__W);		(__v8di)__W);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_cvtepi32_epi64(__mmask8 __U, __m256i __X)		_mm512_maskz_cvtepi32_epi64(__mmask8 __U, __m256i __X)
{		{
return (__m512i)__builtin_ia32_selectq_512((__mmask8)__U,		return (__m512i)__builtin_ia32_selectq_512((__mmask8)__U,
(__v8di)_mm512_cvtepi32_epi64(__X),		(__v8di)_mm512_cvtepi32_epi64(__X),
(__v8di)_mm512_setzero_si512());		(__v8di)_mm512_setzero_si512());
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_cvtepi16_epi32(__m256i __A)		_mm512_cvtepi16_epi32(__m256i __A)
{		{
return (__m512i)__builtin_convertvector((__v16hi)__A, __v16si);		return (__m512i)__builtin_convertvector((__v16hi)__A, __v16si);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_cvtepi16_epi32(__m512i __W, __mmask16 __U, __m256i __A)		_mm512_mask_cvtepi16_epi32(__m512i __W, __mmask16 __U, __m256i __A)
{		{
return (__m512i)__builtin_ia32_selectd_512((__mmask16)__U,		return (__m512i)__builtin_ia32_selectd_512((__mmask16)__U,
(__v16si)_mm512_cvtepi16_epi32(__A),		(__v16si)_mm512_cvtepi16_epi32(__A),
(__v16si)__W);		(__v16si)__W);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_cvtepi16_epi32(__mmask16 __U, __m256i __A)		_mm512_maskz_cvtepi16_epi32(__mmask16 __U, __m256i __A)
{		{
return (__m512i)__builtin_ia32_selectd_512((__mmask16)__U,		return (__m512i)__builtin_ia32_selectd_512((__mmask16)__U,
(__v16si)_mm512_cvtepi16_epi32(__A),		(__v16si)_mm512_cvtepi16_epi32(__A),
(__v16si)_mm512_setzero_si512 ());		(__v16si)_mm512_setzero_si512 ());
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_cvtepi16_epi64(__m128i __A)		_mm512_cvtepi16_epi64(__m128i __A)
{		{
return (__m512i)__builtin_convertvector((__v8hi)__A, __v8di);		return (__m512i)__builtin_convertvector((__v8hi)__A, __v8di);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_cvtepi16_epi64(__m512i __W, __mmask8 __U, __m128i __A)		_mm512_mask_cvtepi16_epi64(__m512i __W, __mmask8 __U, __m128i __A)
{		{
return (__m512i)__builtin_ia32_selectq_512((__mmask8)__U,		return (__m512i)__builtin_ia32_selectq_512((__mmask8)__U,
(__v8di)_mm512_cvtepi16_epi64(__A),		(__v8di)_mm512_cvtepi16_epi64(__A),
(__v8di)__W);		(__v8di)__W);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_cvtepi16_epi64(__mmask8 __U, __m128i __A)		_mm512_maskz_cvtepi16_epi64(__mmask8 __U, __m128i __A)
{		{
return (__m512i)__builtin_ia32_selectq_512((__mmask8)__U,		return (__m512i)__builtin_ia32_selectq_512((__mmask8)__U,
(__v8di)_mm512_cvtepi16_epi64(__A),		(__v8di)_mm512_cvtepi16_epi64(__A),
(__v8di)_mm512_setzero_si512());		(__v8di)_mm512_setzero_si512());
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_cvtepu8_epi32(__m128i __A)		_mm512_cvtepu8_epi32(__m128i __A)
{		{
return (__m512i)__builtin_convertvector((__v16qu)__A, __v16si);		return (__m512i)__builtin_convertvector((__v16qu)__A, __v16si);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_cvtepu8_epi32(__m512i __W, __mmask16 __U, __m128i __A)		_mm512_mask_cvtepu8_epi32(__m512i __W, __mmask16 __U, __m128i __A)
{		{
return (__m512i)__builtin_ia32_selectd_512((__mmask16)__U,		return (__m512i)__builtin_ia32_selectd_512((__mmask16)__U,
(__v16si)_mm512_cvtepu8_epi32(__A),		(__v16si)_mm512_cvtepu8_epi32(__A),
(__v16si)__W);		(__v16si)__W);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_cvtepu8_epi32(__mmask16 __U, __m128i __A)		_mm512_maskz_cvtepu8_epi32(__mmask16 __U, __m128i __A)
{		{
return (__m512i)__builtin_ia32_selectd_512((__mmask16)__U,		return (__m512i)__builtin_ia32_selectd_512((__mmask16)__U,
(__v16si)_mm512_cvtepu8_epi32(__A),		(__v16si)_mm512_cvtepu8_epi32(__A),
(__v16si)_mm512_setzero_si512());		(__v16si)_mm512_setzero_si512());
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_cvtepu8_epi64(__m128i __A)		_mm512_cvtepu8_epi64(__m128i __A)
{		{
return (__m512i)__builtin_convertvector(__builtin_shufflevector((__v16qu)__A, (__v16qu)__A, 0, 1, 2, 3, 4, 5, 6, 7), __v8di);		return (__m512i)__builtin_convertvector(__builtin_shufflevector((__v16qu)__A, (__v16qu)__A, 0, 1, 2, 3, 4, 5, 6, 7), __v8di);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_cvtepu8_epi64(__m512i __W, __mmask8 __U, __m128i __A)		_mm512_mask_cvtepu8_epi64(__m512i __W, __mmask8 __U, __m128i __A)
{		{
return (__m512i)__builtin_ia32_selectq_512((__mmask8)__U,		return (__m512i)__builtin_ia32_selectq_512((__mmask8)__U,
(__v8di)_mm512_cvtepu8_epi64(__A),		(__v8di)_mm512_cvtepu8_epi64(__A),
(__v8di)__W);		(__v8di)__W);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_cvtepu8_epi64(__mmask8 __U, __m128i __A)		_mm512_maskz_cvtepu8_epi64(__mmask8 __U, __m128i __A)
{		{
return (__m512i)__builtin_ia32_selectq_512((__mmask8)__U,		return (__m512i)__builtin_ia32_selectq_512((__mmask8)__U,
(__v8di)_mm512_cvtepu8_epi64(__A),		(__v8di)_mm512_cvtepu8_epi64(__A),
(__v8di)_mm512_setzero_si512());		(__v8di)_mm512_setzero_si512());
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_cvtepu32_epi64(__m256i __X)		_mm512_cvtepu32_epi64(__m256i __X)
{		{
return (__m512i)__builtin_convertvector((__v8su)__X, __v8di);		return (__m512i)__builtin_convertvector((__v8su)__X, __v8di);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_cvtepu32_epi64(__m512i __W, __mmask8 __U, __m256i __X)		_mm512_mask_cvtepu32_epi64(__m512i __W, __mmask8 __U, __m256i __X)
{		{
return (__m512i)__builtin_ia32_selectq_512((__mmask8)__U,		return (__m512i)__builtin_ia32_selectq_512((__mmask8)__U,
(__v8di)_mm512_cvtepu32_epi64(__X),		(__v8di)_mm512_cvtepu32_epi64(__X),
(__v8di)__W);		(__v8di)__W);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_cvtepu32_epi64(__mmask8 __U, __m256i __X)		_mm512_maskz_cvtepu32_epi64(__mmask8 __U, __m256i __X)
{		{
return (__m512i)__builtin_ia32_selectq_512((__mmask8)__U,		return (__m512i)__builtin_ia32_selectq_512((__mmask8)__U,
(__v8di)_mm512_cvtepu32_epi64(__X),		(__v8di)_mm512_cvtepu32_epi64(__X),
(__v8di)_mm512_setzero_si512());		(__v8di)_mm512_setzero_si512());
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_cvtepu16_epi32(__m256i __A)		_mm512_cvtepu16_epi32(__m256i __A)
{		{
return (__m512i)__builtin_convertvector((__v16hu)__A, __v16si);		return (__m512i)__builtin_convertvector((__v16hu)__A, __v16si);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_cvtepu16_epi32(__m512i __W, __mmask16 __U, __m256i __A)		_mm512_mask_cvtepu16_epi32(__m512i __W, __mmask16 __U, __m256i __A)
{		{
return (__m512i)__builtin_ia32_selectd_512((__mmask16)__U,		return (__m512i)__builtin_ia32_selectd_512((__mmask16)__U,
(__v16si)_mm512_cvtepu16_epi32(__A),		(__v16si)_mm512_cvtepu16_epi32(__A),
(__v16si)__W);		(__v16si)__W);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_cvtepu16_epi32(__mmask16 __U, __m256i __A)		_mm512_maskz_cvtepu16_epi32(__mmask16 __U, __m256i __A)
{		{
return (__m512i)__builtin_ia32_selectd_512((__mmask16)__U,		return (__m512i)__builtin_ia32_selectd_512((__mmask16)__U,
(__v16si)_mm512_cvtepu16_epi32(__A),		(__v16si)_mm512_cvtepu16_epi32(__A),
(__v16si)_mm512_setzero_si512());		(__v16si)_mm512_setzero_si512());
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_cvtepu16_epi64(__m128i __A)		_mm512_cvtepu16_epi64(__m128i __A)
{		{
return (__m512i)__builtin_convertvector((__v8hu)__A, __v8di);		return (__m512i)__builtin_convertvector((__v8hu)__A, __v8di);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_cvtepu16_epi64(__m512i __W, __mmask8 __U, __m128i __A)		_mm512_mask_cvtepu16_epi64(__m512i __W, __mmask8 __U, __m128i __A)
{		{
return (__m512i)__builtin_ia32_selectq_512((__mmask8)__U,		return (__m512i)__builtin_ia32_selectq_512((__mmask8)__U,
(__v8di)_mm512_cvtepu16_epi64(__A),		(__v8di)_mm512_cvtepu16_epi64(__A),
(__v8di)__W);		(__v8di)__W);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_cvtepu16_epi64(__mmask8 __U, __m128i __A)		_mm512_maskz_cvtepu16_epi64(__mmask8 __U, __m128i __A)
{		{
return (__m512i)__builtin_ia32_selectq_512((__mmask8)__U,		return (__m512i)__builtin_ia32_selectq_512((__mmask8)__U,
(__v8di)_mm512_cvtepu16_epi64(__A),		(__v8di)_mm512_cvtepu16_epi64(__A),
(__v8di)_mm512_setzero_si512());		(__v8di)_mm512_setzero_si512());
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_rorv_epi32 (__m512i __A, __m512i __B)		_mm512_rorv_epi32 (__m512i __A, __m512i __B)
{		{
return (__m512i) __builtin_ia32_prorvd512_mask ((__v16si) __A,		return (__m512i) __builtin_ia32_prorvd512_mask ((__v16si) __A,
(__v16si) __B,		(__v16si) __B,
(__v16si)		(__v16si)
_mm512_setzero_si512 (),		_mm512_setzero_si512 (),
(__mmask16) -1);		(__mmask16) -1);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_rorv_epi32 (__m512i __W, __mmask16 __U, __m512i __A, __m512i __B)		_mm512_mask_rorv_epi32 (__m512i __W, __mmask16 __U, __m512i __A, __m512i __B)
{		{
return (__m512i) __builtin_ia32_prorvd512_mask ((__v16si) __A,		return (__m512i) __builtin_ia32_prorvd512_mask ((__v16si) __A,
(__v16si) __B,		(__v16si) __B,
(__v16si) __W,		(__v16si) __W,
(__mmask16) __U);		(__mmask16) __U);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_rorv_epi32 (__mmask16 __U, __m512i __A, __m512i __B)		_mm512_maskz_rorv_epi32 (__mmask16 __U, __m512i __A, __m512i __B)
{		{
return (__m512i) __builtin_ia32_prorvd512_mask ((__v16si) __A,		return (__m512i) __builtin_ia32_prorvd512_mask ((__v16si) __A,
(__v16si) __B,		(__v16si) __B,
(__v16si)		(__v16si)
_mm512_setzero_si512 (),		_mm512_setzero_si512 (),
(__mmask16) __U);		(__mmask16) __U);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_rorv_epi64 (__m512i __A, __m512i __B)		_mm512_rorv_epi64 (__m512i __A, __m512i __B)
{		{
return (__m512i) __builtin_ia32_prorvq512_mask ((__v8di) __A,		return (__m512i) __builtin_ia32_prorvq512_mask ((__v8di) __A,
(__v8di) __B,		(__v8di) __B,
(__v8di)		(__v8di)
_mm512_setzero_si512 (),		_mm512_setzero_si512 (),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_rorv_epi64 (__m512i __W, __mmask8 __U, __m512i __A, __m512i __B)		_mm512_mask_rorv_epi64 (__m512i __W, __mmask8 __U, __m512i __A, __m512i __B)
{		{
return (__m512i) __builtin_ia32_prorvq512_mask ((__v8di) __A,		return (__m512i) __builtin_ia32_prorvq512_mask ((__v8di) __A,
(__v8di) __B,		(__v8di) __B,
(__v8di) __W,		(__v8di) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_rorv_epi64 (__mmask8 __U, __m512i __A, __m512i __B)		_mm512_maskz_rorv_epi64 (__mmask8 __U, __m512i __A, __m512i __B)
{		{
return (__m512i) __builtin_ia32_prorvq512_mask ((__v8di) __A,		return (__m512i) __builtin_ia32_prorvq512_mask ((__v8di) __A,
(__v8di) __B,		(__v8di) __B,
(__v8di)		(__v8di)
_mm512_setzero_si512 (),		_mm512_setzero_si512 (),
(__mmask8) __U);		(__mmask8) __U);
}		}
▲ Show 20 Lines • Show All 63 Lines • ▼ Show 20 Lines
#define _mm512_mask_rol_epi64(W, U, a, b) \		#define _mm512_mask_rol_epi64(W, U, a, b) \
(__m512i)__builtin_ia32_prolq512_mask((__v8di)(__m512i)(a), (int)(b), \		(__m512i)__builtin_ia32_prolq512_mask((__v8di)(__m512i)(a), (int)(b), \
(__v8di)(__m512i)(W), (__mmask8)(U))		(__v8di)(__m512i)(W), (__mmask8)(U))

#define _mm512_maskz_rol_epi64(U, a, b) \		#define _mm512_maskz_rol_epi64(U, a, b) \
(__m512i)__builtin_ia32_prolq512_mask((__v8di)(__m512i)(a), (int)(b), \		(__m512i)__builtin_ia32_prolq512_mask((__v8di)(__m512i)(a), (int)(b), \
(__v8di)_mm512_setzero_si512(), \		(__v8di)_mm512_setzero_si512(), \
(__mmask8)(U))		(__mmask8)(U))
static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_rolv_epi32 (__m512i __A, __m512i __B)		_mm512_rolv_epi32 (__m512i __A, __m512i __B)
{		{
return (__m512i) __builtin_ia32_prolvd512_mask ((__v16si) __A,		return (__m512i) __builtin_ia32_prolvd512_mask ((__v16si) __A,
(__v16si) __B,		(__v16si) __B,
(__v16si)		(__v16si)
_mm512_setzero_si512 (),		_mm512_setzero_si512 (),
(__mmask16) -1);		(__mmask16) -1);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_rolv_epi32 (__m512i __W, __mmask16 __U, __m512i __A, __m512i __B)		_mm512_mask_rolv_epi32 (__m512i __W, __mmask16 __U, __m512i __A, __m512i __B)
{		{
return (__m512i) __builtin_ia32_prolvd512_mask ((__v16si) __A,		return (__m512i) __builtin_ia32_prolvd512_mask ((__v16si) __A,
(__v16si) __B,		(__v16si) __B,
(__v16si) __W,		(__v16si) __W,
(__mmask16) __U);		(__mmask16) __U);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_rolv_epi32 (__mmask16 __U, __m512i __A, __m512i __B)		_mm512_maskz_rolv_epi32 (__mmask16 __U, __m512i __A, __m512i __B)
{		{
return (__m512i) __builtin_ia32_prolvd512_mask ((__v16si) __A,		return (__m512i) __builtin_ia32_prolvd512_mask ((__v16si) __A,
(__v16si) __B,		(__v16si) __B,
(__v16si)		(__v16si)
_mm512_setzero_si512 (),		_mm512_setzero_si512 (),
(__mmask16) __U);		(__mmask16) __U);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_rolv_epi64 (__m512i __A, __m512i __B)		_mm512_rolv_epi64 (__m512i __A, __m512i __B)
{		{
return (__m512i) __builtin_ia32_prolvq512_mask ((__v8di) __A,		return (__m512i) __builtin_ia32_prolvq512_mask ((__v8di) __A,
(__v8di) __B,		(__v8di) __B,
(__v8di)		(__v8di)
_mm512_setzero_si512 (),		_mm512_setzero_si512 (),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_rolv_epi64 (__m512i __W, __mmask8 __U, __m512i __A, __m512i __B)		_mm512_mask_rolv_epi64 (__m512i __W, __mmask8 __U, __m512i __A, __m512i __B)
{		{
return (__m512i) __builtin_ia32_prolvq512_mask ((__v8di) __A,		return (__m512i) __builtin_ia32_prolvq512_mask ((__v8di) __A,
(__v8di) __B,		(__v8di) __B,
(__v8di) __W,		(__v8di) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_rolv_epi64 (__mmask8 __U, __m512i __A, __m512i __B)		_mm512_maskz_rolv_epi64 (__mmask8 __U, __m512i __A, __m512i __B)
{		{
return (__m512i) __builtin_ia32_prolvq512_mask ((__v8di) __A,		return (__m512i) __builtin_ia32_prolvq512_mask ((__v8di) __A,
(__v8di) __B,		(__v8di) __B,
(__v8di)		(__v8di)
_mm512_setzero_si512 (),		_mm512_setzero_si512 (),
(__mmask8) __U);		(__mmask8) __U);
}		}
Show All 22 Lines	#define _mm512_mask_ror_epi64(W, U, A, B) \
(__m512i)__builtin_ia32_prorq512_mask((__v8di)(__m512i)(A), (int)(B), \		(__m512i)__builtin_ia32_prorq512_mask((__v8di)(__m512i)(A), (int)(B), \
(__v8di)(__m512i)(W), (__mmask8)(U))		(__v8di)(__m512i)(W), (__mmask8)(U))

#define _mm512_maskz_ror_epi64(U, A, B) \		#define _mm512_maskz_ror_epi64(U, A, B) \
(__m512i)__builtin_ia32_prorq512_mask((__v8di)(__m512i)(A), (int)(B), \		(__m512i)__builtin_ia32_prorq512_mask((__v8di)(__m512i)(A), (int)(B), \
(__v8di)_mm512_setzero_si512(), \		(__v8di)_mm512_setzero_si512(), \
(__mmask8)(U))		(__mmask8)(U))

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_slli_epi32(__m512i __A, int __B)		_mm512_slli_epi32(__m512i __A, int __B)
{		{
return (__m512i)__builtin_ia32_pslldi512((__v16si)__A, __B);		return (__m512i)__builtin_ia32_pslldi512((__v16si)__A, __B);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_slli_epi32(__m512i __W, __mmask16 __U, __m512i __A, int __B)		_mm512_mask_slli_epi32(__m512i __W, __mmask16 __U, __m512i __A, int __B)
{		{
return (__m512i)__builtin_ia32_selectd_512((__mmask16)__U,		return (__m512i)__builtin_ia32_selectd_512((__mmask16)__U,
(__v16si)_mm512_slli_epi32(__A, __B),		(__v16si)_mm512_slli_epi32(__A, __B),
(__v16si)__W);		(__v16si)__W);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_slli_epi32(__mmask16 __U, __m512i __A, int __B) {		_mm512_maskz_slli_epi32(__mmask16 __U, __m512i __A, int __B) {
return (__m512i)__builtin_ia32_selectd_512((__mmask16)__U,		return (__m512i)__builtin_ia32_selectd_512((__mmask16)__U,
(__v16si)_mm512_slli_epi32(__A, __B),		(__v16si)_mm512_slli_epi32(__A, __B),
(__v16si)_mm512_setzero_si512());		(__v16si)_mm512_setzero_si512());
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_slli_epi64(__m512i __A, int __B)		_mm512_slli_epi64(__m512i __A, int __B)
{		{
return (__m512i)__builtin_ia32_psllqi512((__v8di)__A, __B);		return (__m512i)__builtin_ia32_psllqi512((__v8di)__A, __B);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_slli_epi64(__m512i __W, __mmask8 __U, __m512i __A, int __B)		_mm512_mask_slli_epi64(__m512i __W, __mmask8 __U, __m512i __A, int __B)
{		{
return (__m512i)__builtin_ia32_selectq_512((__mmask8)__U,		return (__m512i)__builtin_ia32_selectq_512((__mmask8)__U,
(__v8di)_mm512_slli_epi64(__A, __B),		(__v8di)_mm512_slli_epi64(__A, __B),
(__v8di)__W);		(__v8di)__W);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_slli_epi64(__mmask8 __U, __m512i __A, int __B)		_mm512_maskz_slli_epi64(__mmask8 __U, __m512i __A, int __B)
{		{
return (__m512i)__builtin_ia32_selectq_512((__mmask8)__U,		return (__m512i)__builtin_ia32_selectq_512((__mmask8)__U,
(__v8di)_mm512_slli_epi64(__A, __B),		(__v8di)_mm512_slli_epi64(__A, __B),
(__v8di)_mm512_setzero_si512());		(__v8di)_mm512_setzero_si512());
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_srli_epi32(__m512i __A, int __B)		_mm512_srli_epi32(__m512i __A, int __B)
{		{
return (__m512i)__builtin_ia32_psrldi512((__v16si)__A, __B);		return (__m512i)__builtin_ia32_psrldi512((__v16si)__A, __B);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_srli_epi32(__m512i __W, __mmask16 __U, __m512i __A, int __B)		_mm512_mask_srli_epi32(__m512i __W, __mmask16 __U, __m512i __A, int __B)
{		{
return (__m512i)__builtin_ia32_selectd_512((__mmask16)__U,		return (__m512i)__builtin_ia32_selectd_512((__mmask16)__U,
(__v16si)_mm512_srli_epi32(__A, __B),		(__v16si)_mm512_srli_epi32(__A, __B),
(__v16si)__W);		(__v16si)__W);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_srli_epi32(__mmask16 __U, __m512i __A, int __B) {		_mm512_maskz_srli_epi32(__mmask16 __U, __m512i __A, int __B) {
return (__m512i)__builtin_ia32_selectd_512((__mmask16)__U,		return (__m512i)__builtin_ia32_selectd_512((__mmask16)__U,
(__v16si)_mm512_srli_epi32(__A, __B),		(__v16si)_mm512_srli_epi32(__A, __B),
(__v16si)_mm512_setzero_si512());		(__v16si)_mm512_setzero_si512());
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_srli_epi64(__m512i __A, int __B)		_mm512_srli_epi64(__m512i __A, int __B)
{		{
return (__m512i)__builtin_ia32_psrlqi512((__v8di)__A, __B);		return (__m512i)__builtin_ia32_psrlqi512((__v8di)__A, __B);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_srli_epi64(__m512i __W, __mmask8 __U, __m512i __A, int __B)		_mm512_mask_srli_epi64(__m512i __W, __mmask8 __U, __m512i __A, int __B)
{		{
return (__m512i)__builtin_ia32_selectq_512((__mmask8)__U,		return (__m512i)__builtin_ia32_selectq_512((__mmask8)__U,
(__v8di)_mm512_srli_epi64(__A, __B),		(__v8di)_mm512_srli_epi64(__A, __B),
(__v8di)__W);		(__v8di)__W);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_srli_epi64(__mmask8 __U, __m512i __A, int __B)		_mm512_maskz_srli_epi64(__mmask8 __U, __m512i __A, int __B)
{		{
return (__m512i)__builtin_ia32_selectq_512((__mmask8)__U,		return (__m512i)__builtin_ia32_selectq_512((__mmask8)__U,
(__v8di)_mm512_srli_epi64(__A, __B),		(__v8di)_mm512_srli_epi64(__A, __B),
(__v8di)_mm512_setzero_si512());		(__v8di)_mm512_setzero_si512());
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_load_epi32 (__m512i __W, __mmask16 __U, void const *__P)		_mm512_mask_load_epi32 (__m512i __W, __mmask16 __U, void const *__P)
{		{
return (__m512i) __builtin_ia32_movdqa32load512_mask ((const __v16si *) __P,		return (__m512i) __builtin_ia32_movdqa32load512_mask ((const __v16si *) __P,
(__v16si) __W,		(__v16si) __W,
(__mmask16) __U);		(__mmask16) __U);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_load_epi32 (__mmask16 __U, void const *__P)		_mm512_maskz_load_epi32 (__mmask16 __U, void const *__P)
{		{
return (__m512i) __builtin_ia32_movdqa32load512_mask ((const __v16si *) __P,		return (__m512i) __builtin_ia32_movdqa32load512_mask ((const __v16si *) __P,
(__v16si)		(__v16si)
_mm512_setzero_si512 (),		_mm512_setzero_si512 (),
(__mmask16) __U);		(__mmask16) __U);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS512
_mm512_mask_store_epi32 (void *__P, __mmask16 __U, __m512i __A)		_mm512_mask_store_epi32 (void *__P, __mmask16 __U, __m512i __A)
{		{
__builtin_ia32_movdqa32store512_mask ((__v16si *) __P, (__v16si) __A,		__builtin_ia32_movdqa32store512_mask ((__v16si *) __P, (__v16si) __A,
(__mmask16) __U);		(__mmask16) __U);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_mov_epi32 (__m512i __W, __mmask16 __U, __m512i __A)		_mm512_mask_mov_epi32 (__m512i __W, __mmask16 __U, __m512i __A)
{		{
return (__m512i) __builtin_ia32_selectd_512 ((__mmask16) __U,		return (__m512i) __builtin_ia32_selectd_512 ((__mmask16) __U,
(__v16si) __A,		(__v16si) __A,
(__v16si) __W);		(__v16si) __W);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_mov_epi32 (__mmask16 __U, __m512i __A)		_mm512_maskz_mov_epi32 (__mmask16 __U, __m512i __A)
{		{
return (__m512i) __builtin_ia32_selectd_512 ((__mmask16) __U,		return (__m512i) __builtin_ia32_selectd_512 ((__mmask16) __U,
(__v16si) __A,		(__v16si) __A,
(__v16si) _mm512_setzero_si512 ());		(__v16si) _mm512_setzero_si512 ());
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_mov_epi64 (__m512i __W, __mmask8 __U, __m512i __A)		_mm512_mask_mov_epi64 (__m512i __W, __mmask8 __U, __m512i __A)
{		{
return (__m512i) __builtin_ia32_selectq_512 ((__mmask8) __U,		return (__m512i) __builtin_ia32_selectq_512 ((__mmask8) __U,
(__v8di) __A,		(__v8di) __A,
(__v8di) __W);		(__v8di) __W);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_mov_epi64 (__mmask8 __U, __m512i __A)		_mm512_maskz_mov_epi64 (__mmask8 __U, __m512i __A)
{		{
return (__m512i) __builtin_ia32_selectq_512 ((__mmask8) __U,		return (__m512i) __builtin_ia32_selectq_512 ((__mmask8) __U,
(__v8di) __A,		(__v8di) __A,
(__v8di) _mm512_setzero_si512 ());		(__v8di) _mm512_setzero_si512 ());
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_load_epi64 (__m512i __W, __mmask8 __U, void const *__P)		_mm512_mask_load_epi64 (__m512i __W, __mmask8 __U, void const *__P)
{		{
return (__m512i) __builtin_ia32_movdqa64load512_mask ((const __v8di *) __P,		return (__m512i) __builtin_ia32_movdqa64load512_mask ((const __v8di *) __P,
(__v8di) __W,		(__v8di) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_load_epi64 (__mmask8 __U, void const *__P)		_mm512_maskz_load_epi64 (__mmask8 __U, void const *__P)
{		{
return (__m512i) __builtin_ia32_movdqa64load512_mask ((const __v8di *) __P,		return (__m512i) __builtin_ia32_movdqa64load512_mask ((const __v8di *) __P,
(__v8di)		(__v8di)
_mm512_setzero_si512 (),		_mm512_setzero_si512 (),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS512
_mm512_mask_store_epi64 (void *__P, __mmask8 __U, __m512i __A)		_mm512_mask_store_epi64 (void *__P, __mmask8 __U, __m512i __A)
{		{
__builtin_ia32_movdqa64store512_mask ((__v8di *) __P, (__v8di) __A,		__builtin_ia32_movdqa64store512_mask ((__v8di *) __P, (__v8di) __A,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_movedup_pd (__m512d __A)		_mm512_movedup_pd (__m512d __A)
{		{
return (__m512d)__builtin_shufflevector((__v8df)__A, (__v8df)__A,		return (__m512d)__builtin_shufflevector((__v8df)__A, (__v8df)__A,
0, 0, 2, 2, 4, 4, 6, 6);		0, 0, 2, 2, 4, 4, 6, 6);
}		}

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_mask_movedup_pd (__m512d __W, __mmask8 __U, __m512d __A)		_mm512_mask_movedup_pd (__m512d __W, __mmask8 __U, __m512d __A)
{		{
return (__m512d)__builtin_ia32_selectpd_512((__mmask8)__U,		return (__m512d)__builtin_ia32_selectpd_512((__mmask8)__U,
(__v8df)_mm512_movedup_pd(__A),		(__v8df)_mm512_movedup_pd(__A),
(__v8df)__W);		(__v8df)__W);
}		}

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_maskz_movedup_pd (__mmask8 __U, __m512d __A)		_mm512_maskz_movedup_pd (__mmask8 __U, __m512d __A)
{		{
return (__m512d)__builtin_ia32_selectpd_512((__mmask8)__U,		return (__m512d)__builtin_ia32_selectpd_512((__mmask8)__U,
(__v8df)_mm512_movedup_pd(__A),		(__v8df)_mm512_movedup_pd(__A),
(__v8df)_mm512_setzero_pd());		(__v8df)_mm512_setzero_pd());
}		}

#define _mm512_fixupimm_round_pd(A, B, C, imm, R) \		#define _mm512_fixupimm_round_pd(A, B, C, imm, R) \
▲ Show 20 Lines • Show All 156 Lines • ▼ Show 20 Lines

#define _mm_getexp_round_sd(A, B, R) \		#define _mm_getexp_round_sd(A, B, R) \
(__m128d)__builtin_ia32_getexpsd128_round_mask((__v2df)(__m128d)(A), \		(__m128d)__builtin_ia32_getexpsd128_round_mask((__v2df)(__m128d)(A), \
(__v2df)(__m128d)(B), \		(__v2df)(__m128d)(B), \
(__v2df)_mm_setzero_pd(), \		(__v2df)_mm_setzero_pd(), \
(__mmask8)-1, (int)(R))		(__mmask8)-1, (int)(R))


static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_getexp_sd (__m128d __A, __m128d __B)		_mm_getexp_sd (__m128d __A, __m128d __B)
{		{
return (__m128d) __builtin_ia32_getexpsd128_round_mask ((__v2df) __A,		return (__m128d) __builtin_ia32_getexpsd128_round_mask ((__v2df) __A,
(__v2df) __B, (__v2df) _mm_setzero_pd(), (__mmask8) -1, _MM_FROUND_CUR_DIRECTION);		(__v2df) __B, (__v2df) _mm_setzero_pd(), (__mmask8) -1, _MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_mask_getexp_sd (__m128d __W, __mmask8 __U, __m128d __A, __m128d __B)		_mm_mask_getexp_sd (__m128d __W, __mmask8 __U, __m128d __A, __m128d __B)
{		{
return (__m128d) __builtin_ia32_getexpsd128_round_mask ( (__v2df) __A,		return (__m128d) __builtin_ia32_getexpsd128_round_mask ( (__v2df) __A,
(__v2df) __B,		(__v2df) __B,
(__v2df) __W,		(__v2df) __W,
(__mmask8) __U,		(__mmask8) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

#define _mm_mask_getexp_round_sd(W, U, A, B, R) \		#define _mm_mask_getexp_round_sd(W, U, A, B, R) \
(__m128d)__builtin_ia32_getexpsd128_round_mask((__v2df)(__m128d)(A), \		(__m128d)__builtin_ia32_getexpsd128_round_mask((__v2df)(__m128d)(A), \
(__v2df)(__m128d)(B), \		(__v2df)(__m128d)(B), \
(__v2df)(__m128d)(W), \		(__v2df)(__m128d)(W), \
(__mmask8)(U), (int)(R))		(__mmask8)(U), (int)(R))

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_maskz_getexp_sd (__mmask8 __U, __m128d __A, __m128d __B)		_mm_maskz_getexp_sd (__mmask8 __U, __m128d __A, __m128d __B)
{		{
return (__m128d) __builtin_ia32_getexpsd128_round_mask ( (__v2df) __A,		return (__m128d) __builtin_ia32_getexpsd128_round_mask ( (__v2df) __A,
(__v2df) __B,		(__v2df) __B,
(__v2df) _mm_setzero_pd (),		(__v2df) _mm_setzero_pd (),
(__mmask8) __U,		(__mmask8) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

#define _mm_maskz_getexp_round_sd(U, A, B, R) \		#define _mm_maskz_getexp_round_sd(U, A, B, R) \
(__m128d)__builtin_ia32_getexpsd128_round_mask((__v2df)(__m128d)(A), \		(__m128d)__builtin_ia32_getexpsd128_round_mask((__v2df)(__m128d)(A), \
(__v2df)(__m128d)(B), \		(__v2df)(__m128d)(B), \
(__v2df)_mm_setzero_pd(), \		(__v2df)_mm_setzero_pd(), \
(__mmask8)(U), (int)(R))		(__mmask8)(U), (int)(R))

#define _mm_getexp_round_ss(A, B, R) \		#define _mm_getexp_round_ss(A, B, R) \
(__m128)__builtin_ia32_getexpss128_round_mask((__v4sf)(__m128)(A), \		(__m128)__builtin_ia32_getexpss128_round_mask((__v4sf)(__m128)(A), \
(__v4sf)(__m128)(B), \		(__v4sf)(__m128)(B), \
(__v4sf)_mm_setzero_ps(), \		(__v4sf)_mm_setzero_ps(), \
(__mmask8)-1, (int)(R))		(__mmask8)-1, (int)(R))

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_getexp_ss (__m128 __A, __m128 __B)		_mm_getexp_ss (__m128 __A, __m128 __B)
{		{
return (__m128) __builtin_ia32_getexpss128_round_mask ((__v4sf) __A,		return (__m128) __builtin_ia32_getexpss128_round_mask ((__v4sf) __A,
(__v4sf) __B, (__v4sf) _mm_setzero_ps(), (__mmask8) -1, _MM_FROUND_CUR_DIRECTION);		(__v4sf) __B, (__v4sf) _mm_setzero_ps(), (__mmask8) -1, _MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_mask_getexp_ss (__m128 __W, __mmask8 __U, __m128 __A, __m128 __B)		_mm_mask_getexp_ss (__m128 __W, __mmask8 __U, __m128 __A, __m128 __B)
{		{
return (__m128) __builtin_ia32_getexpss128_round_mask ((__v4sf) __A,		return (__m128) __builtin_ia32_getexpss128_round_mask ((__v4sf) __A,
(__v4sf) __B,		(__v4sf) __B,
(__v4sf) __W,		(__v4sf) __W,
(__mmask8) __U,		(__mmask8) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

#define _mm_mask_getexp_round_ss(W, U, A, B, R) \		#define _mm_mask_getexp_round_ss(W, U, A, B, R) \
(__m128)__builtin_ia32_getexpss128_round_mask((__v4sf)(__m128)(A), \		(__m128)__builtin_ia32_getexpss128_round_mask((__v4sf)(__m128)(A), \
(__v4sf)(__m128)(B), \		(__v4sf)(__m128)(B), \
(__v4sf)(__m128)(W), \		(__v4sf)(__m128)(W), \
(__mmask8)(U), (int)(R))		(__mmask8)(U), (int)(R))

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_maskz_getexp_ss (__mmask8 __U, __m128 __A, __m128 __B)		_mm_maskz_getexp_ss (__mmask8 __U, __m128 __A, __m128 __B)
{		{
return (__m128) __builtin_ia32_getexpss128_round_mask ((__v4sf) __A,		return (__m128) __builtin_ia32_getexpss128_round_mask ((__v4sf) __A,
(__v4sf) __B,		(__v4sf) __B,
(__v4sf) _mm_setzero_pd (),		(__v4sf) _mm_setzero_pd (),
(__mmask8) __U,		(__mmask8) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}
▲ Show 20 Lines • Show All 89 Lines • ▼ Show 20 Lines

#define _mm_maskz_getmant_round_ss(U, A, B, C, D, R) \		#define _mm_maskz_getmant_round_ss(U, A, B, C, D, R) \
(__m128)__builtin_ia32_getmantss_round_mask((__v4sf)(__m128)(A), \		(__m128)__builtin_ia32_getmantss_round_mask((__v4sf)(__m128)(A), \
(__v4sf)(__m128)(B), \		(__v4sf)(__m128)(B), \
(int)(((D)<<2) \| (C)), \		(int)(((D)<<2) \| (C)), \
(__v4sf)_mm_setzero_ps(), \		(__v4sf)_mm_setzero_ps(), \
(__mmask8)(U), (int)(R))		(__mmask8)(U), (int)(R))

static __inline__ __mmask16 __DEFAULT_FN_ATTRS		static __inline__ __mmask16 __DEFAULT_FN_ATTRS512
_mm512_kmov (__mmask16 __A)		_mm512_kmov (__mmask16 __A)
{		{
return __A;		return __A;
}		}

#define _mm_comi_round_sd(A, B, P, R) \		#define _mm_comi_round_sd(A, B, P, R) \
(int)__builtin_ia32_vcomisd((__v2df)(__m128d)(A), (__v2df)(__m128d)(B), \		(int)__builtin_ia32_vcomisd((__v2df)(__m128d)(A), (__v2df)(__m128d)(B), \
(int)(P), (int)(R))		(int)(P), (int)(R))

#define _mm_comi_round_ss(A, B, P, R) \		#define _mm_comi_round_ss(A, B, P, R) \
(int)__builtin_ia32_vcomiss((__v4sf)(__m128)(A), (__v4sf)(__m128)(B), \		(int)__builtin_ia32_vcomiss((__v4sf)(__m128)(A), (__v4sf)(__m128)(B), \
(int)(P), (int)(R))		(int)(P), (int)(R))

#ifdef __x86_64__		#ifdef __x86_64__
#define _mm_cvt_roundsd_si64(A, R) \		#define _mm_cvt_roundsd_si64(A, R) \
(long long)__builtin_ia32_vcvtsd2si64((__v2df)(__m128d)(A), (int)(R))		(long long)__builtin_ia32_vcvtsd2si64((__v2df)(__m128d)(A), (int)(R))
#endif		#endif

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_sll_epi32(__m512i __A, __m128i __B)		_mm512_sll_epi32(__m512i __A, __m128i __B)
{		{
return (__m512i)__builtin_ia32_pslld512((__v16si) __A, (__v4si)__B);		return (__m512i)__builtin_ia32_pslld512((__v16si) __A, (__v4si)__B);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_sll_epi32(__m512i __W, __mmask16 __U, __m512i __A, __m128i __B)		_mm512_mask_sll_epi32(__m512i __W, __mmask16 __U, __m512i __A, __m128i __B)
{		{
return (__m512i)__builtin_ia32_selectd_512((__mmask16)__U,		return (__m512i)__builtin_ia32_selectd_512((__mmask16)__U,
(__v16si)_mm512_sll_epi32(__A, __B),		(__v16si)_mm512_sll_epi32(__A, __B),
(__v16si)__W);		(__v16si)__W);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_sll_epi32(__mmask16 __U, __m512i __A, __m128i __B)		_mm512_maskz_sll_epi32(__mmask16 __U, __m512i __A, __m128i __B)
{		{
return (__m512i)__builtin_ia32_selectd_512((__mmask16)__U,		return (__m512i)__builtin_ia32_selectd_512((__mmask16)__U,
(__v16si)_mm512_sll_epi32(__A, __B),		(__v16si)_mm512_sll_epi32(__A, __B),
(__v16si)_mm512_setzero_si512());		(__v16si)_mm512_setzero_si512());
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_sll_epi64(__m512i __A, __m128i __B)		_mm512_sll_epi64(__m512i __A, __m128i __B)
{		{
return (__m512i)__builtin_ia32_psllq512((__v8di)__A, (__v2di)__B);		return (__m512i)__builtin_ia32_psllq512((__v8di)__A, (__v2di)__B);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_sll_epi64(__m512i __W, __mmask8 __U, __m512i __A, __m128i __B)		_mm512_mask_sll_epi64(__m512i __W, __mmask8 __U, __m512i __A, __m128i __B)
{		{
return (__m512i)__builtin_ia32_selectq_512((__mmask8)__U,		return (__m512i)__builtin_ia32_selectq_512((__mmask8)__U,
(__v8di)_mm512_sll_epi64(__A, __B),		(__v8di)_mm512_sll_epi64(__A, __B),
(__v8di)__W);		(__v8di)__W);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_sll_epi64(__mmask8 __U, __m512i __A, __m128i __B)		_mm512_maskz_sll_epi64(__mmask8 __U, __m512i __A, __m128i __B)
{		{
return (__m512i)__builtin_ia32_selectq_512((__mmask8)__U,		return (__m512i)__builtin_ia32_selectq_512((__mmask8)__U,
(__v8di)_mm512_sll_epi64(__A, __B),		(__v8di)_mm512_sll_epi64(__A, __B),
(__v8di)_mm512_setzero_si512());		(__v8di)_mm512_setzero_si512());
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_sllv_epi32(__m512i __X, __m512i __Y)		_mm512_sllv_epi32(__m512i __X, __m512i __Y)
{		{
return (__m512i)__builtin_ia32_psllv16si((__v16si)__X, (__v16si)__Y);		return (__m512i)__builtin_ia32_psllv16si((__v16si)__X, (__v16si)__Y);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_sllv_epi32(__m512i __W, __mmask16 __U, __m512i __X, __m512i __Y)		_mm512_mask_sllv_epi32(__m512i __W, __mmask16 __U, __m512i __X, __m512i __Y)
{		{
return (__m512i)__builtin_ia32_selectd_512((__mmask16)__U,		return (__m512i)__builtin_ia32_selectd_512((__mmask16)__U,
(__v16si)_mm512_sllv_epi32(__X, __Y),		(__v16si)_mm512_sllv_epi32(__X, __Y),
(__v16si)__W);		(__v16si)__W);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_sllv_epi32(__mmask16 __U, __m512i __X, __m512i __Y)		_mm512_maskz_sllv_epi32(__mmask16 __U, __m512i __X, __m512i __Y)
{		{
return (__m512i)__builtin_ia32_selectd_512((__mmask16)__U,		return (__m512i)__builtin_ia32_selectd_512((__mmask16)__U,
(__v16si)_mm512_sllv_epi32(__X, __Y),		(__v16si)_mm512_sllv_epi32(__X, __Y),
(__v16si)_mm512_setzero_si512());		(__v16si)_mm512_setzero_si512());
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_sllv_epi64(__m512i __X, __m512i __Y)		_mm512_sllv_epi64(__m512i __X, __m512i __Y)
{		{
return (__m512i)__builtin_ia32_psllv8di((__v8di)__X, (__v8di)__Y);		return (__m512i)__builtin_ia32_psllv8di((__v8di)__X, (__v8di)__Y);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_sllv_epi64(__m512i __W, __mmask8 __U, __m512i __X, __m512i __Y)		_mm512_mask_sllv_epi64(__m512i __W, __mmask8 __U, __m512i __X, __m512i __Y)
{		{
return (__m512i)__builtin_ia32_selectq_512((__mmask8)__U,		return (__m512i)__builtin_ia32_selectq_512((__mmask8)__U,
(__v8di)_mm512_sllv_epi64(__X, __Y),		(__v8di)_mm512_sllv_epi64(__X, __Y),
(__v8di)__W);		(__v8di)__W);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_sllv_epi64(__mmask8 __U, __m512i __X, __m512i __Y)		_mm512_maskz_sllv_epi64(__mmask8 __U, __m512i __X, __m512i __Y)
{		{
return (__m512i)__builtin_ia32_selectq_512((__mmask8)__U,		return (__m512i)__builtin_ia32_selectq_512((__mmask8)__U,
(__v8di)_mm512_sllv_epi64(__X, __Y),		(__v8di)_mm512_sllv_epi64(__X, __Y),
(__v8di)_mm512_setzero_si512());		(__v8di)_mm512_setzero_si512());
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_sra_epi32(__m512i __A, __m128i __B)		_mm512_sra_epi32(__m512i __A, __m128i __B)
{		{
return (__m512i)__builtin_ia32_psrad512((__v16si) __A, (__v4si)__B);		return (__m512i)__builtin_ia32_psrad512((__v16si) __A, (__v4si)__B);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_sra_epi32(__m512i __W, __mmask16 __U, __m512i __A, __m128i __B)		_mm512_mask_sra_epi32(__m512i __W, __mmask16 __U, __m512i __A, __m128i __B)
{		{
return (__m512i)__builtin_ia32_selectd_512((__mmask16)__U,		return (__m512i)__builtin_ia32_selectd_512((__mmask16)__U,
(__v16si)_mm512_sra_epi32(__A, __B),		(__v16si)_mm512_sra_epi32(__A, __B),
(__v16si)__W);		(__v16si)__W);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_sra_epi32(__mmask16 __U, __m512i __A, __m128i __B)		_mm512_maskz_sra_epi32(__mmask16 __U, __m512i __A, __m128i __B)
{		{
return (__m512i)__builtin_ia32_selectd_512((__mmask16)__U,		return (__m512i)__builtin_ia32_selectd_512((__mmask16)__U,
(__v16si)_mm512_sra_epi32(__A, __B),		(__v16si)_mm512_sra_epi32(__A, __B),
(__v16si)_mm512_setzero_si512());		(__v16si)_mm512_setzero_si512());
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_sra_epi64(__m512i __A, __m128i __B)		_mm512_sra_epi64(__m512i __A, __m128i __B)
{		{
return (__m512i)__builtin_ia32_psraq512((__v8di)__A, (__v2di)__B);		return (__m512i)__builtin_ia32_psraq512((__v8di)__A, (__v2di)__B);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_sra_epi64(__m512i __W, __mmask8 __U, __m512i __A, __m128i __B)		_mm512_mask_sra_epi64(__m512i __W, __mmask8 __U, __m512i __A, __m128i __B)
{		{
return (__m512i)__builtin_ia32_selectq_512((__mmask8)__U,		return (__m512i)__builtin_ia32_selectq_512((__mmask8)__U,
(__v8di)_mm512_sra_epi64(__A, __B),		(__v8di)_mm512_sra_epi64(__A, __B),
(__v8di)__W);		(__v8di)__W);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_sra_epi64(__mmask8 __U, __m512i __A, __m128i __B)		_mm512_maskz_sra_epi64(__mmask8 __U, __m512i __A, __m128i __B)
{		{
return (__m512i)__builtin_ia32_selectq_512((__mmask8)__U,		return (__m512i)__builtin_ia32_selectq_512((__mmask8)__U,
(__v8di)_mm512_sra_epi64(__A, __B),		(__v8di)_mm512_sra_epi64(__A, __B),
(__v8di)_mm512_setzero_si512());		(__v8di)_mm512_setzero_si512());
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_srav_epi32(__m512i __X, __m512i __Y)		_mm512_srav_epi32(__m512i __X, __m512i __Y)
{		{
return (__m512i)__builtin_ia32_psrav16si((__v16si)__X, (__v16si)__Y);		return (__m512i)__builtin_ia32_psrav16si((__v16si)__X, (__v16si)__Y);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_srav_epi32(__m512i __W, __mmask16 __U, __m512i __X, __m512i __Y)		_mm512_mask_srav_epi32(__m512i __W, __mmask16 __U, __m512i __X, __m512i __Y)
{		{
return (__m512i)__builtin_ia32_selectd_512((__mmask16)__U,		return (__m512i)__builtin_ia32_selectd_512((__mmask16)__U,
(__v16si)_mm512_srav_epi32(__X, __Y),		(__v16si)_mm512_srav_epi32(__X, __Y),
(__v16si)__W);		(__v16si)__W);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_srav_epi32(__mmask16 __U, __m512i __X, __m512i __Y)		_mm512_maskz_srav_epi32(__mmask16 __U, __m512i __X, __m512i __Y)
{		{
return (__m512i)__builtin_ia32_selectd_512((__mmask16)__U,		return (__m512i)__builtin_ia32_selectd_512((__mmask16)__U,
(__v16si)_mm512_srav_epi32(__X, __Y),		(__v16si)_mm512_srav_epi32(__X, __Y),
(__v16si)_mm512_setzero_si512());		(__v16si)_mm512_setzero_si512());
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_srav_epi64(__m512i __X, __m512i __Y)		_mm512_srav_epi64(__m512i __X, __m512i __Y)
{		{
return (__m512i)__builtin_ia32_psrav8di((__v8di)__X, (__v8di)__Y);		return (__m512i)__builtin_ia32_psrav8di((__v8di)__X, (__v8di)__Y);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_srav_epi64(__m512i __W, __mmask8 __U, __m512i __X, __m512i __Y)		_mm512_mask_srav_epi64(__m512i __W, __mmask8 __U, __m512i __X, __m512i __Y)
{		{
return (__m512i)__builtin_ia32_selectq_512((__mmask8)__U,		return (__m512i)__builtin_ia32_selectq_512((__mmask8)__U,
(__v8di)_mm512_srav_epi64(__X, __Y),		(__v8di)_mm512_srav_epi64(__X, __Y),
(__v8di)__W);		(__v8di)__W);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_srav_epi64(__mmask8 __U, __m512i __X, __m512i __Y)		_mm512_maskz_srav_epi64(__mmask8 __U, __m512i __X, __m512i __Y)
{		{
return (__m512i)__builtin_ia32_selectq_512((__mmask8)__U,		return (__m512i)__builtin_ia32_selectq_512((__mmask8)__U,
(__v8di)_mm512_srav_epi64(__X, __Y),		(__v8di)_mm512_srav_epi64(__X, __Y),
(__v8di)_mm512_setzero_si512());		(__v8di)_mm512_setzero_si512());
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_srl_epi32(__m512i __A, __m128i __B)		_mm512_srl_epi32(__m512i __A, __m128i __B)
{		{
return (__m512i)__builtin_ia32_psrld512((__v16si) __A, (__v4si)__B);		return (__m512i)__builtin_ia32_psrld512((__v16si) __A, (__v4si)__B);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_srl_epi32(__m512i __W, __mmask16 __U, __m512i __A, __m128i __B)		_mm512_mask_srl_epi32(__m512i __W, __mmask16 __U, __m512i __A, __m128i __B)
{		{
return (__m512i)__builtin_ia32_selectd_512((__mmask16)__U,		return (__m512i)__builtin_ia32_selectd_512((__mmask16)__U,
(__v16si)_mm512_srl_epi32(__A, __B),		(__v16si)_mm512_srl_epi32(__A, __B),
(__v16si)__W);		(__v16si)__W);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_srl_epi32(__mmask16 __U, __m512i __A, __m128i __B)		_mm512_maskz_srl_epi32(__mmask16 __U, __m512i __A, __m128i __B)
{		{
return (__m512i)__builtin_ia32_selectd_512((__mmask16)__U,		return (__m512i)__builtin_ia32_selectd_512((__mmask16)__U,
(__v16si)_mm512_srl_epi32(__A, __B),		(__v16si)_mm512_srl_epi32(__A, __B),
(__v16si)_mm512_setzero_si512());		(__v16si)_mm512_setzero_si512());
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_srl_epi64(__m512i __A, __m128i __B)		_mm512_srl_epi64(__m512i __A, __m128i __B)
{		{
return (__m512i)__builtin_ia32_psrlq512((__v8di)__A, (__v2di)__B);		return (__m512i)__builtin_ia32_psrlq512((__v8di)__A, (__v2di)__B);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_srl_epi64(__m512i __W, __mmask8 __U, __m512i __A, __m128i __B)		_mm512_mask_srl_epi64(__m512i __W, __mmask8 __U, __m512i __A, __m128i __B)
{		{
return (__m512i)__builtin_ia32_selectq_512((__mmask8)__U,		return (__m512i)__builtin_ia32_selectq_512((__mmask8)__U,
(__v8di)_mm512_srl_epi64(__A, __B),		(__v8di)_mm512_srl_epi64(__A, __B),
(__v8di)__W);		(__v8di)__W);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_srl_epi64(__mmask8 __U, __m512i __A, __m128i __B)		_mm512_maskz_srl_epi64(__mmask8 __U, __m512i __A, __m128i __B)
{		{
return (__m512i)__builtin_ia32_selectq_512((__mmask8)__U,		return (__m512i)__builtin_ia32_selectq_512((__mmask8)__U,
(__v8di)_mm512_srl_epi64(__A, __B),		(__v8di)_mm512_srl_epi64(__A, __B),
(__v8di)_mm512_setzero_si512());		(__v8di)_mm512_setzero_si512());
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_srlv_epi32(__m512i __X, __m512i __Y)		_mm512_srlv_epi32(__m512i __X, __m512i __Y)
{		{
return (__m512i)__builtin_ia32_psrlv16si((__v16si)__X, (__v16si)__Y);		return (__m512i)__builtin_ia32_psrlv16si((__v16si)__X, (__v16si)__Y);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_srlv_epi32(__m512i __W, __mmask16 __U, __m512i __X, __m512i __Y)		_mm512_mask_srlv_epi32(__m512i __W, __mmask16 __U, __m512i __X, __m512i __Y)
{		{
return (__m512i)__builtin_ia32_selectd_512((__mmask16)__U,		return (__m512i)__builtin_ia32_selectd_512((__mmask16)__U,
(__v16si)_mm512_srlv_epi32(__X, __Y),		(__v16si)_mm512_srlv_epi32(__X, __Y),
(__v16si)__W);		(__v16si)__W);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_srlv_epi32(__mmask16 __U, __m512i __X, __m512i __Y)		_mm512_maskz_srlv_epi32(__mmask16 __U, __m512i __X, __m512i __Y)
{		{
return (__m512i)__builtin_ia32_selectd_512((__mmask16)__U,		return (__m512i)__builtin_ia32_selectd_512((__mmask16)__U,
(__v16si)_mm512_srlv_epi32(__X, __Y),		(__v16si)_mm512_srlv_epi32(__X, __Y),
(__v16si)_mm512_setzero_si512());		(__v16si)_mm512_setzero_si512());
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_srlv_epi64 (__m512i __X, __m512i __Y)		_mm512_srlv_epi64 (__m512i __X, __m512i __Y)
{		{
return (__m512i)__builtin_ia32_psrlv8di((__v8di)__X, (__v8di)__Y);		return (__m512i)__builtin_ia32_psrlv8di((__v8di)__X, (__v8di)__Y);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_srlv_epi64(__m512i __W, __mmask8 __U, __m512i __X, __m512i __Y)		_mm512_mask_srlv_epi64(__m512i __W, __mmask8 __U, __m512i __X, __m512i __Y)
{		{
return (__m512i)__builtin_ia32_selectq_512((__mmask8)__U,		return (__m512i)__builtin_ia32_selectq_512((__mmask8)__U,
(__v8di)_mm512_srlv_epi64(__X, __Y),		(__v8di)_mm512_srlv_epi64(__X, __Y),
(__v8di)__W);		(__v8di)__W);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_srlv_epi64(__mmask8 __U, __m512i __X, __m512i __Y)		_mm512_maskz_srlv_epi64(__mmask8 __U, __m512i __X, __m512i __Y)
{		{
return (__m512i)__builtin_ia32_selectq_512((__mmask8)__U,		return (__m512i)__builtin_ia32_selectq_512((__mmask8)__U,
(__v8di)_mm512_srlv_epi64(__X, __Y),		(__v8di)_mm512_srlv_epi64(__X, __Y),
(__v8di)_mm512_setzero_si512());		(__v8di)_mm512_setzero_si512());
}		}

#define _mm512_ternarylogic_epi32(A, B, C, imm) \		#define _mm512_ternarylogic_epi32(A, B, C, imm) \
▲ Show 20 Lines • Show All 41 Lines • ▼ Show 20 Lines	#define _mm_cvt_roundsd_si32(A, R) \
(int)__builtin_ia32_vcvtsd2si32((__v2df)(__m128d)(A), (int)(R))		(int)__builtin_ia32_vcvtsd2si32((__v2df)(__m128d)(A), (int)(R))

#define _mm_cvt_roundsd_i32(A, R) \		#define _mm_cvt_roundsd_i32(A, R) \
(int)__builtin_ia32_vcvtsd2si32((__v2df)(__m128d)(A), (int)(R))		(int)__builtin_ia32_vcvtsd2si32((__v2df)(__m128d)(A), (int)(R))

#define _mm_cvt_roundsd_u32(A, R) \		#define _mm_cvt_roundsd_u32(A, R) \
(unsigned int)__builtin_ia32_vcvtsd2usi32((__v2df)(__m128d)(A), (int)(R))		(unsigned int)__builtin_ia32_vcvtsd2usi32((__v2df)(__m128d)(A), (int)(R))

static __inline__ unsigned __DEFAULT_FN_ATTRS		static __inline__ unsigned __DEFAULT_FN_ATTRS128
_mm_cvtsd_u32 (__m128d __A)		_mm_cvtsd_u32 (__m128d __A)
{		{
return (unsigned) __builtin_ia32_vcvtsd2usi32 ((__v2df) __A,		return (unsigned) __builtin_ia32_vcvtsd2usi32 ((__v2df) __A,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

#ifdef __x86_64__		#ifdef __x86_64__
#define _mm_cvt_roundsd_u64(A, R) \		#define _mm_cvt_roundsd_u64(A, R) \
(unsigned long long)__builtin_ia32_vcvtsd2usi64((__v2df)(__m128d)(A), \		(unsigned long long)__builtin_ia32_vcvtsd2usi64((__v2df)(__m128d)(A), \
(int)(R))		(int)(R))

static __inline__ unsigned long long __DEFAULT_FN_ATTRS		static __inline__ unsigned long long __DEFAULT_FN_ATTRS128
_mm_cvtsd_u64 (__m128d __A)		_mm_cvtsd_u64 (__m128d __A)
{		{
return (unsigned long long) __builtin_ia32_vcvtsd2usi64 ((__v2df)		return (unsigned long long) __builtin_ia32_vcvtsd2usi64 ((__v2df)
__A,		__A,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}
#endif		#endif

Show All 9 Lines

#define _mm_cvt_roundss_i64(A, R) \		#define _mm_cvt_roundss_i64(A, R) \
(long long)__builtin_ia32_vcvtss2si64((__v4sf)(__m128)(A), (int)(R))		(long long)__builtin_ia32_vcvtss2si64((__v4sf)(__m128)(A), (int)(R))
#endif		#endif

#define _mm_cvt_roundss_u32(A, R) \		#define _mm_cvt_roundss_u32(A, R) \
(unsigned int)__builtin_ia32_vcvtss2usi32((__v4sf)(__m128)(A), (int)(R))		(unsigned int)__builtin_ia32_vcvtss2usi32((__v4sf)(__m128)(A), (int)(R))

static __inline__ unsigned __DEFAULT_FN_ATTRS		static __inline__ unsigned __DEFAULT_FN_ATTRS128
_mm_cvtss_u32 (__m128 __A)		_mm_cvtss_u32 (__m128 __A)
{		{
return (unsigned) __builtin_ia32_vcvtss2usi32 ((__v4sf) __A,		return (unsigned) __builtin_ia32_vcvtss2usi32 ((__v4sf) __A,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

#ifdef __x86_64__		#ifdef __x86_64__
#define _mm_cvt_roundss_u64(A, R) \		#define _mm_cvt_roundss_u64(A, R) \
(unsigned long long)__builtin_ia32_vcvtss2usi64((__v4sf)(__m128)(A), \		(unsigned long long)__builtin_ia32_vcvtss2usi64((__v4sf)(__m128)(A), \
(int)(R))		(int)(R))

static __inline__ unsigned long long __DEFAULT_FN_ATTRS		static __inline__ unsigned long long __DEFAULT_FN_ATTRS128
_mm_cvtss_u64 (__m128 __A)		_mm_cvtss_u64 (__m128 __A)
{		{
return (unsigned long long) __builtin_ia32_vcvtss2usi64 ((__v4sf)		return (unsigned long long) __builtin_ia32_vcvtss2usi64 ((__v4sf)
__A,		__A,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}
#endif		#endif

#define _mm_cvtt_roundsd_i32(A, R) \		#define _mm_cvtt_roundsd_i32(A, R) \
(int)__builtin_ia32_vcvttsd2si32((__v2df)(__m128d)(A), (int)(R))		(int)__builtin_ia32_vcvttsd2si32((__v2df)(__m128d)(A), (int)(R))

#define _mm_cvtt_roundsd_si32(A, R) \		#define _mm_cvtt_roundsd_si32(A, R) \
(int)__builtin_ia32_vcvttsd2si32((__v2df)(__m128d)(A), (int)(R))		(int)__builtin_ia32_vcvttsd2si32((__v2df)(__m128d)(A), (int)(R))

static __inline__ int __DEFAULT_FN_ATTRS		static __inline__ int __DEFAULT_FN_ATTRS128
_mm_cvttsd_i32 (__m128d __A)		_mm_cvttsd_i32 (__m128d __A)
{		{
return (int) __builtin_ia32_vcvttsd2si32 ((__v2df) __A,		return (int) __builtin_ia32_vcvttsd2si32 ((__v2df) __A,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

#ifdef __x86_64__		#ifdef __x86_64__
#define _mm_cvtt_roundsd_si64(A, R) \		#define _mm_cvtt_roundsd_si64(A, R) \
(long long)__builtin_ia32_vcvttsd2si64((__v2df)(__m128d)(A), (int)(R))		(long long)__builtin_ia32_vcvttsd2si64((__v2df)(__m128d)(A), (int)(R))

#define _mm_cvtt_roundsd_i64(A, R) \		#define _mm_cvtt_roundsd_i64(A, R) \
(long long)__builtin_ia32_vcvttsd2si64((__v2df)(__m128d)(A), (int)(R))		(long long)__builtin_ia32_vcvttsd2si64((__v2df)(__m128d)(A), (int)(R))

static __inline__ long long __DEFAULT_FN_ATTRS		static __inline__ long long __DEFAULT_FN_ATTRS128
_mm_cvttsd_i64 (__m128d __A)		_mm_cvttsd_i64 (__m128d __A)
{		{
return (long long) __builtin_ia32_vcvttsd2si64 ((__v2df) __A,		return (long long) __builtin_ia32_vcvttsd2si64 ((__v2df) __A,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}
#endif		#endif

#define _mm_cvtt_roundsd_u32(A, R) \		#define _mm_cvtt_roundsd_u32(A, R) \
(unsigned int)__builtin_ia32_vcvttsd2usi32((__v2df)(__m128d)(A), (int)(R))		(unsigned int)__builtin_ia32_vcvttsd2usi32((__v2df)(__m128d)(A), (int)(R))

static __inline__ unsigned __DEFAULT_FN_ATTRS		static __inline__ unsigned __DEFAULT_FN_ATTRS128
_mm_cvttsd_u32 (__m128d __A)		_mm_cvttsd_u32 (__m128d __A)
{		{
return (unsigned) __builtin_ia32_vcvttsd2usi32 ((__v2df) __A,		return (unsigned) __builtin_ia32_vcvttsd2usi32 ((__v2df) __A,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

#ifdef __x86_64__		#ifdef __x86_64__
#define _mm_cvtt_roundsd_u64(A, R) \		#define _mm_cvtt_roundsd_u64(A, R) \
(unsigned long long)__builtin_ia32_vcvttsd2usi64((__v2df)(__m128d)(A), \		(unsigned long long)__builtin_ia32_vcvttsd2usi64((__v2df)(__m128d)(A), \
(int)(R))		(int)(R))

static __inline__ unsigned long long __DEFAULT_FN_ATTRS		static __inline__ unsigned long long __DEFAULT_FN_ATTRS128
_mm_cvttsd_u64 (__m128d __A)		_mm_cvttsd_u64 (__m128d __A)
{		{
return (unsigned long long) __builtin_ia32_vcvttsd2usi64 ((__v2df)		return (unsigned long long) __builtin_ia32_vcvttsd2usi64 ((__v2df)
__A,		__A,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}
#endif		#endif

#define _mm_cvtt_roundss_i32(A, R) \		#define _mm_cvtt_roundss_i32(A, R) \
(int)__builtin_ia32_vcvttss2si32((__v4sf)(__m128)(A), (int)(R))		(int)__builtin_ia32_vcvttss2si32((__v4sf)(__m128)(A), (int)(R))

#define _mm_cvtt_roundss_si32(A, R) \		#define _mm_cvtt_roundss_si32(A, R) \
(int)__builtin_ia32_vcvttss2si32((__v4sf)(__m128)(A), (int)(R))		(int)__builtin_ia32_vcvttss2si32((__v4sf)(__m128)(A), (int)(R))

static __inline__ int __DEFAULT_FN_ATTRS		static __inline__ int __DEFAULT_FN_ATTRS128
_mm_cvttss_i32 (__m128 __A)		_mm_cvttss_i32 (__m128 __A)
{		{
return (int) __builtin_ia32_vcvttss2si32 ((__v4sf) __A,		return (int) __builtin_ia32_vcvttss2si32 ((__v4sf) __A,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

#ifdef __x86_64__		#ifdef __x86_64__
#define _mm_cvtt_roundss_i64(A, R) \		#define _mm_cvtt_roundss_i64(A, R) \
(long long)__builtin_ia32_vcvttss2si64((__v4sf)(__m128)(A), (int)(R))		(long long)__builtin_ia32_vcvttss2si64((__v4sf)(__m128)(A), (int)(R))

#define _mm_cvtt_roundss_si64(A, R) \		#define _mm_cvtt_roundss_si64(A, R) \
(long long)__builtin_ia32_vcvttss2si64((__v4sf)(__m128)(A), (int)(R))		(long long)__builtin_ia32_vcvttss2si64((__v4sf)(__m128)(A), (int)(R))

static __inline__ long long __DEFAULT_FN_ATTRS		static __inline__ long long __DEFAULT_FN_ATTRS128
_mm_cvttss_i64 (__m128 __A)		_mm_cvttss_i64 (__m128 __A)
{		{
return (long long) __builtin_ia32_vcvttss2si64 ((__v4sf) __A,		return (long long) __builtin_ia32_vcvttss2si64 ((__v4sf) __A,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}
#endif		#endif

#define _mm_cvtt_roundss_u32(A, R) \		#define _mm_cvtt_roundss_u32(A, R) \
(unsigned int)__builtin_ia32_vcvttss2usi32((__v4sf)(__m128)(A), (int)(R))		(unsigned int)__builtin_ia32_vcvttss2usi32((__v4sf)(__m128)(A), (int)(R))

static __inline__ unsigned __DEFAULT_FN_ATTRS		static __inline__ unsigned __DEFAULT_FN_ATTRS128
_mm_cvttss_u32 (__m128 __A)		_mm_cvttss_u32 (__m128 __A)
{		{
return (unsigned) __builtin_ia32_vcvttss2usi32 ((__v4sf) __A,		return (unsigned) __builtin_ia32_vcvttss2usi32 ((__v4sf) __A,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

#ifdef __x86_64__		#ifdef __x86_64__
#define _mm_cvtt_roundss_u64(A, R) \		#define _mm_cvtt_roundss_u64(A, R) \
(unsigned long long)__builtin_ia32_vcvttss2usi64((__v4sf)(__m128)(A), \		(unsigned long long)__builtin_ia32_vcvttss2usi64((__v4sf)(__m128)(A), \
(int)(R))		(int)(R))

static __inline__ unsigned long long __DEFAULT_FN_ATTRS		static __inline__ unsigned long long __DEFAULT_FN_ATTRS128
_mm_cvttss_u64 (__m128 __A)		_mm_cvttss_u64 (__m128 __A)
{		{
return (unsigned long long) __builtin_ia32_vcvttss2usi64 ((__v4sf)		return (unsigned long long) __builtin_ia32_vcvttss2usi64 ((__v4sf)
__A,		__A,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}
#endif		#endif

Show All 18 Lines	(__m512)__builtin_ia32_selectps_512((__mmask16)(U), \
(__v16sf)_mm512_permute_ps((X), (C)), \		(__v16sf)_mm512_permute_ps((X), (C)), \
(__v16sf)(__m512)(W))		(__v16sf)(__m512)(W))

#define _mm512_maskz_permute_ps(U, X, C) \		#define _mm512_maskz_permute_ps(U, X, C) \
(__m512)__builtin_ia32_selectps_512((__mmask16)(U), \		(__m512)__builtin_ia32_selectps_512((__mmask16)(U), \
(__v16sf)_mm512_permute_ps((X), (C)), \		(__v16sf)_mm512_permute_ps((X), (C)), \
(__v16sf)_mm512_setzero_ps())		(__v16sf)_mm512_setzero_ps())

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_permutevar_pd(__m512d __A, __m512i __C)		_mm512_permutevar_pd(__m512d __A, __m512i __C)
{		{
return (__m512d)__builtin_ia32_vpermilvarpd512((__v8df)__A, (__v8di)__C);		return (__m512d)__builtin_ia32_vpermilvarpd512((__v8df)__A, (__v8di)__C);
}		}

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_mask_permutevar_pd(__m512d __W, __mmask8 __U, __m512d __A, __m512i __C)		_mm512_mask_permutevar_pd(__m512d __W, __mmask8 __U, __m512d __A, __m512i __C)
{		{
return (__m512d)__builtin_ia32_selectpd_512((__mmask8)__U,		return (__m512d)__builtin_ia32_selectpd_512((__mmask8)__U,
(__v8df)_mm512_permutevar_pd(__A, __C),		(__v8df)_mm512_permutevar_pd(__A, __C),
(__v8df)__W);		(__v8df)__W);
}		}

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_maskz_permutevar_pd(__mmask8 __U, __m512d __A, __m512i __C)		_mm512_maskz_permutevar_pd(__mmask8 __U, __m512d __A, __m512i __C)
{		{
return (__m512d)__builtin_ia32_selectpd_512((__mmask8)__U,		return (__m512d)__builtin_ia32_selectpd_512((__mmask8)__U,
(__v8df)_mm512_permutevar_pd(__A, __C),		(__v8df)_mm512_permutevar_pd(__A, __C),
(__v8df)_mm512_setzero_pd());		(__v8df)_mm512_setzero_pd());
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_permutevar_ps(__m512 __A, __m512i __C)		_mm512_permutevar_ps(__m512 __A, __m512i __C)
{		{
return (__m512)__builtin_ia32_vpermilvarps512((__v16sf)__A, (__v16si)__C);		return (__m512)__builtin_ia32_vpermilvarps512((__v16sf)__A, (__v16si)__C);
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_mask_permutevar_ps(__m512 __W, __mmask16 __U, __m512 __A, __m512i __C)		_mm512_mask_permutevar_ps(__m512 __W, __mmask16 __U, __m512 __A, __m512i __C)
{		{
return (__m512)__builtin_ia32_selectps_512((__mmask16)__U,		return (__m512)__builtin_ia32_selectps_512((__mmask16)__U,
(__v16sf)_mm512_permutevar_ps(__A, __C),		(__v16sf)_mm512_permutevar_ps(__A, __C),
(__v16sf)__W);		(__v16sf)__W);
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_maskz_permutevar_ps(__mmask16 __U, __m512 __A, __m512i __C)		_mm512_maskz_permutevar_ps(__mmask16 __U, __m512 __A, __m512i __C)
{		{
return (__m512)__builtin_ia32_selectps_512((__mmask16)__U,		return (__m512)__builtin_ia32_selectps_512((__mmask16)__U,
(__v16sf)_mm512_permutevar_ps(__A, __C),		(__v16sf)_mm512_permutevar_ps(__A, __C),
(__v16sf)_mm512_setzero_ps());		(__v16sf)_mm512_setzero_ps());
}		}

static __inline __m512d __DEFAULT_FN_ATTRS		static __inline __m512d __DEFAULT_FN_ATTRS512
_mm512_permutex2var_pd(__m512d __A, __m512i __I, __m512d __B)		_mm512_permutex2var_pd(__m512d __A, __m512i __I, __m512d __B)
{		{
return (__m512d)__builtin_ia32_vpermi2varpd512((__v8df)__A, (__v8di)__I,		return (__m512d)__builtin_ia32_vpermi2varpd512((__v8df)__A, (__v8di)__I,
(__v8df)__B);		(__v8df)__B);
}		}

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_mask_permutex2var_pd(__m512d __A, __mmask8 __U, __m512i __I, __m512d __B)		_mm512_mask_permutex2var_pd(__m512d __A, __mmask8 __U, __m512i __I, __m512d __B)
{		{
return (__m512d)__builtin_ia32_selectpd_512(__U,		return (__m512d)__builtin_ia32_selectpd_512(__U,
(__v8df)_mm512_permutex2var_pd(__A, __I, __B),		(__v8df)_mm512_permutex2var_pd(__A, __I, __B),
(__v8df)__A);		(__v8df)__A);
}		}

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_mask2_permutex2var_pd(__m512d __A, __m512i __I, __mmask8 __U,		_mm512_mask2_permutex2var_pd(__m512d __A, __m512i __I, __mmask8 __U,
__m512d __B)		__m512d __B)
{		{
return (__m512d)__builtin_ia32_selectpd_512(__U,		return (__m512d)__builtin_ia32_selectpd_512(__U,
(__v8df)_mm512_permutex2var_pd(__A, __I, __B),		(__v8df)_mm512_permutex2var_pd(__A, __I, __B),
(__v8df)(__m512d)__I);		(__v8df)(__m512d)__I);
}		}

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_maskz_permutex2var_pd(__mmask8 __U, __m512d __A, __m512i __I,		_mm512_maskz_permutex2var_pd(__mmask8 __U, __m512d __A, __m512i __I,
__m512d __B)		__m512d __B)
{		{
return (__m512d)__builtin_ia32_selectpd_512(__U,		return (__m512d)__builtin_ia32_selectpd_512(__U,
(__v8df)_mm512_permutex2var_pd(__A, __I, __B),		(__v8df)_mm512_permutex2var_pd(__A, __I, __B),
(__v8df)_mm512_setzero_pd());		(__v8df)_mm512_setzero_pd());
}		}

static __inline __m512 __DEFAULT_FN_ATTRS		static __inline __m512 __DEFAULT_FN_ATTRS512
_mm512_permutex2var_ps(__m512 __A, __m512i __I, __m512 __B)		_mm512_permutex2var_ps(__m512 __A, __m512i __I, __m512 __B)
{		{
return (__m512)__builtin_ia32_vpermi2varps512((__v16sf)__A, (__v16si)__I,		return (__m512)__builtin_ia32_vpermi2varps512((__v16sf)__A, (__v16si)__I,
(__v16sf) __B);		(__v16sf) __B);
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_mask_permutex2var_ps(__m512 __A, __mmask16 __U, __m512i __I, __m512 __B)		_mm512_mask_permutex2var_ps(__m512 __A, __mmask16 __U, __m512i __I, __m512 __B)
{		{
return (__m512)__builtin_ia32_selectps_512(__U,		return (__m512)__builtin_ia32_selectps_512(__U,
(__v16sf)_mm512_permutex2var_ps(__A, __I, __B),		(__v16sf)_mm512_permutex2var_ps(__A, __I, __B),
(__v16sf)__A);		(__v16sf)__A);
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_mask2_permutex2var_ps(__m512 __A, __m512i __I, __mmask16 __U, __m512 __B)		_mm512_mask2_permutex2var_ps(__m512 __A, __m512i __I, __mmask16 __U, __m512 __B)
{		{
return (__m512)__builtin_ia32_selectps_512(__U,		return (__m512)__builtin_ia32_selectps_512(__U,
(__v16sf)_mm512_permutex2var_ps(__A, __I, __B),		(__v16sf)_mm512_permutex2var_ps(__A, __I, __B),
(__v16sf)(__m512)__I);		(__v16sf)(__m512)__I);
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_maskz_permutex2var_ps(__mmask16 __U, __m512 __A, __m512i __I, __m512 __B)		_mm512_maskz_permutex2var_ps(__mmask16 __U, __m512 __A, __m512i __I, __m512 __B)
{		{
return (__m512)__builtin_ia32_selectps_512(__U,		return (__m512)__builtin_ia32_selectps_512(__U,
(__v16sf)_mm512_permutex2var_ps(__A, __I, __B),		(__v16sf)_mm512_permutex2var_ps(__A, __I, __B),
(__v16sf)_mm512_setzero_ps());		(__v16sf)_mm512_setzero_ps());
}		}


#define _mm512_cvtt_roundpd_epu32(A, R) \		#define _mm512_cvtt_roundpd_epu32(A, R) \
(__m256i)__builtin_ia32_cvttpd2udq512_mask((__v8df)(__m512d)(A), \		(__m256i)__builtin_ia32_cvttpd2udq512_mask((__v8df)(__m512d)(A), \
(__v8si)_mm256_undefined_si256(), \		(__v8si)_mm256_undefined_si256(), \
(__mmask8)-1, (int)(R))		(__mmask8)-1, (int)(R))

#define _mm512_mask_cvtt_roundpd_epu32(W, U, A, R) \		#define _mm512_mask_cvtt_roundpd_epu32(W, U, A, R) \
(__m256i)__builtin_ia32_cvttpd2udq512_mask((__v8df)(__m512d)(A), \		(__m256i)__builtin_ia32_cvttpd2udq512_mask((__v8df)(__m512d)(A), \
(__v8si)(__m256i)(W), \		(__v8si)(__m256i)(W), \
(__mmask8)(U), (int)(R))		(__mmask8)(U), (int)(R))

#define _mm512_maskz_cvtt_roundpd_epu32(U, A, R) \		#define _mm512_maskz_cvtt_roundpd_epu32(U, A, R) \
(__m256i)__builtin_ia32_cvttpd2udq512_mask((__v8df)(__m512d)(A), \		(__m256i)__builtin_ia32_cvttpd2udq512_mask((__v8df)(__m512d)(A), \
(__v8si)_mm256_setzero_si256(), \		(__v8si)_mm256_setzero_si256(), \
(__mmask8)(U), (int)(R))		(__mmask8)(U), (int)(R))

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS512
_mm512_cvttpd_epu32 (__m512d __A)		_mm512_cvttpd_epu32 (__m512d __A)
{		{
return (__m256i) __builtin_ia32_cvttpd2udq512_mask ((__v8df) __A,		return (__m256i) __builtin_ia32_cvttpd2udq512_mask ((__v8df) __A,
(__v8si)		(__v8si)
_mm256_undefined_si256 (),		_mm256_undefined_si256 (),
(__mmask8) -1,		(__mmask8) -1,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS512
_mm512_mask_cvttpd_epu32 (__m256i __W, __mmask8 __U, __m512d __A)		_mm512_mask_cvttpd_epu32 (__m256i __W, __mmask8 __U, __m512d __A)
{		{
return (__m256i) __builtin_ia32_cvttpd2udq512_mask ((__v8df) __A,		return (__m256i) __builtin_ia32_cvttpd2udq512_mask ((__v8df) __A,
(__v8si) __W,		(__v8si) __W,
(__mmask8) __U,		(__mmask8) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS512
_mm512_maskz_cvttpd_epu32 (__mmask8 __U, __m512d __A)		_mm512_maskz_cvttpd_epu32 (__mmask8 __U, __m512d __A)
{		{
return (__m256i) __builtin_ia32_cvttpd2udq512_mask ((__v8df) __A,		return (__m256i) __builtin_ia32_cvttpd2udq512_mask ((__v8df) __A,
(__v8si)		(__v8si)
_mm256_setzero_si256 (),		_mm256_setzero_si256 (),
(__mmask8) __U,		(__mmask8) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}
▲ Show 20 Lines • Show All 95 Lines • ▼ Show 20 Lines	(__m512d)__builtin_ia32_scalefpd512_mask((__v8df)(__m512d)(A), \
(__mmask8)(U), (int)(R))		(__mmask8)(U), (int)(R))

#define _mm512_maskz_scalef_round_pd(U, A, B, R) \		#define _mm512_maskz_scalef_round_pd(U, A, B, R) \
(__m512d)__builtin_ia32_scalefpd512_mask((__v8df)(__m512d)(A), \		(__m512d)__builtin_ia32_scalefpd512_mask((__v8df)(__m512d)(A), \
(__v8df)(__m512d)(B), \		(__v8df)(__m512d)(B), \
(__v8df)_mm512_setzero_pd(), \		(__v8df)_mm512_setzero_pd(), \
(__mmask8)(U), (int)(R))		(__mmask8)(U), (int)(R))

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_scalef_pd (__m512d __A, __m512d __B)		_mm512_scalef_pd (__m512d __A, __m512d __B)
{		{
return (__m512d) __builtin_ia32_scalefpd512_mask ((__v8df) __A,		return (__m512d) __builtin_ia32_scalefpd512_mask ((__v8df) __A,
(__v8df) __B,		(__v8df) __B,
(__v8df)		(__v8df)
_mm512_undefined_pd (),		_mm512_undefined_pd (),
(__mmask8) -1,		(__mmask8) -1,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_mask_scalef_pd (__m512d __W, __mmask8 __U, __m512d __A, __m512d __B)		_mm512_mask_scalef_pd (__m512d __W, __mmask8 __U, __m512d __A, __m512d __B)
{		{
return (__m512d) __builtin_ia32_scalefpd512_mask ((__v8df) __A,		return (__m512d) __builtin_ia32_scalefpd512_mask ((__v8df) __A,
(__v8df) __B,		(__v8df) __B,
(__v8df) __W,		(__v8df) __W,
(__mmask8) __U,		(__mmask8) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_maskz_scalef_pd (__mmask8 __U, __m512d __A, __m512d __B)		_mm512_maskz_scalef_pd (__mmask8 __U, __m512d __A, __m512d __B)
{		{
return (__m512d) __builtin_ia32_scalefpd512_mask ((__v8df) __A,		return (__m512d) __builtin_ia32_scalefpd512_mask ((__v8df) __A,
(__v8df) __B,		(__v8df) __B,
(__v8df)		(__v8df)
_mm512_setzero_pd (),		_mm512_setzero_pd (),
(__mmask8) __U,		(__mmask8) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
Show All 12 Lines	(__m512)__builtin_ia32_scalefps512_mask((__v16sf)(__m512)(A), \
(__mmask16)(U), (int)(R))		(__mmask16)(U), (int)(R))

#define _mm512_maskz_scalef_round_ps(U, A, B, R) \		#define _mm512_maskz_scalef_round_ps(U, A, B, R) \
(__m512)__builtin_ia32_scalefps512_mask((__v16sf)(__m512)(A), \		(__m512)__builtin_ia32_scalefps512_mask((__v16sf)(__m512)(A), \
(__v16sf)(__m512)(B), \		(__v16sf)(__m512)(B), \
(__v16sf)_mm512_setzero_ps(), \		(__v16sf)_mm512_setzero_ps(), \
(__mmask16)(U), (int)(R))		(__mmask16)(U), (int)(R))

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_scalef_ps (__m512 __A, __m512 __B)		_mm512_scalef_ps (__m512 __A, __m512 __B)
{		{
return (__m512) __builtin_ia32_scalefps512_mask ((__v16sf) __A,		return (__m512) __builtin_ia32_scalefps512_mask ((__v16sf) __A,
(__v16sf) __B,		(__v16sf) __B,
(__v16sf)		(__v16sf)
_mm512_undefined_ps (),		_mm512_undefined_ps (),
(__mmask16) -1,		(__mmask16) -1,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_mask_scalef_ps (__m512 __W, __mmask16 __U, __m512 __A, __m512 __B)		_mm512_mask_scalef_ps (__m512 __W, __mmask16 __U, __m512 __A, __m512 __B)
{		{
return (__m512) __builtin_ia32_scalefps512_mask ((__v16sf) __A,		return (__m512) __builtin_ia32_scalefps512_mask ((__v16sf) __A,
(__v16sf) __B,		(__v16sf) __B,
(__v16sf) __W,		(__v16sf) __W,
(__mmask16) __U,		(__mmask16) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_maskz_scalef_ps (__mmask16 __U, __m512 __A, __m512 __B)		_mm512_maskz_scalef_ps (__mmask16 __U, __m512 __A, __m512 __B)
{		{
return (__m512) __builtin_ia32_scalefps512_mask ((__v16sf) __A,		return (__m512) __builtin_ia32_scalefps512_mask ((__v16sf) __A,
(__v16sf) __B,		(__v16sf) __B,
(__v16sf)		(__v16sf)
_mm512_setzero_ps (),		_mm512_setzero_ps (),
(__mmask16) __U,		(__mmask16) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

#define _mm_scalef_round_sd(A, B, R) \		#define _mm_scalef_round_sd(A, B, R) \
(__m128d)__builtin_ia32_scalefsd_round_mask((__v2df)(__m128d)(A), \		(__m128d)__builtin_ia32_scalefsd_round_mask((__v2df)(__m128d)(A), \
(__v2df)(__m128d)(B), \		(__v2df)(__m128d)(B), \
(__v2df)_mm_setzero_pd(), \		(__v2df)_mm_setzero_pd(), \
(__mmask8)-1, (int)(R))		(__mmask8)-1, (int)(R))

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_scalef_sd (__m128d __A, __m128d __B)		_mm_scalef_sd (__m128d __A, __m128d __B)
{		{
return (__m128d) __builtin_ia32_scalefsd_round_mask ((__v2df) __A,		return (__m128d) __builtin_ia32_scalefsd_round_mask ((__v2df) __A,
(__v2df)( __B), (__v2df) _mm_setzero_pd(),		(__v2df)( __B), (__v2df) _mm_setzero_pd(),
(__mmask8) -1,		(__mmask8) -1,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_mask_scalef_sd (__m128d __W, __mmask8 __U, __m128d __A, __m128d __B)		_mm_mask_scalef_sd (__m128d __W, __mmask8 __U, __m128d __A, __m128d __B)
{		{
return (__m128d) __builtin_ia32_scalefsd_round_mask ( (__v2df) __A,		return (__m128d) __builtin_ia32_scalefsd_round_mask ( (__v2df) __A,
(__v2df) __B,		(__v2df) __B,
(__v2df) __W,		(__v2df) __W,
(__mmask8) __U,		(__mmask8) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

#define _mm_mask_scalef_round_sd(W, U, A, B, R) \		#define _mm_mask_scalef_round_sd(W, U, A, B, R) \
(__m128d)__builtin_ia32_scalefsd_round_mask((__v2df)(__m128d)(A), \		(__m128d)__builtin_ia32_scalefsd_round_mask((__v2df)(__m128d)(A), \
(__v2df)(__m128d)(B), \		(__v2df)(__m128d)(B), \
(__v2df)(__m128d)(W), \		(__v2df)(__m128d)(W), \
(__mmask8)(U), (int)(R))		(__mmask8)(U), (int)(R))

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_maskz_scalef_sd (__mmask8 __U, __m128d __A, __m128d __B)		_mm_maskz_scalef_sd (__mmask8 __U, __m128d __A, __m128d __B)
{		{
return (__m128d) __builtin_ia32_scalefsd_round_mask ( (__v2df) __A,		return (__m128d) __builtin_ia32_scalefsd_round_mask ( (__v2df) __A,
(__v2df) __B,		(__v2df) __B,
(__v2df) _mm_setzero_pd (),		(__v2df) _mm_setzero_pd (),
(__mmask8) __U,		(__mmask8) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

#define _mm_maskz_scalef_round_sd(U, A, B, R) \		#define _mm_maskz_scalef_round_sd(U, A, B, R) \
(__m128d)__builtin_ia32_scalefsd_round_mask((__v2df)(__m128d)(A), \		(__m128d)__builtin_ia32_scalefsd_round_mask((__v2df)(__m128d)(A), \
(__v2df)(__m128d)(B), \		(__v2df)(__m128d)(B), \
(__v2df)_mm_setzero_pd(), \		(__v2df)_mm_setzero_pd(), \
(__mmask8)(U), (int)(R))		(__mmask8)(U), (int)(R))

#define _mm_scalef_round_ss(A, B, R) \		#define _mm_scalef_round_ss(A, B, R) \
(__m128)__builtin_ia32_scalefss_round_mask((__v4sf)(__m128)(A), \		(__m128)__builtin_ia32_scalefss_round_mask((__v4sf)(__m128)(A), \
(__v4sf)(__m128)(B), \		(__v4sf)(__m128)(B), \
(__v4sf)_mm_setzero_ps(), \		(__v4sf)_mm_setzero_ps(), \
(__mmask8)-1, (int)(R))		(__mmask8)-1, (int)(R))

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_scalef_ss (__m128 __A, __m128 __B)		_mm_scalef_ss (__m128 __A, __m128 __B)
{		{
return (__m128) __builtin_ia32_scalefss_round_mask ((__v4sf) __A,		return (__m128) __builtin_ia32_scalefss_round_mask ((__v4sf) __A,
(__v4sf)( __B), (__v4sf) _mm_setzero_ps(),		(__v4sf)( __B), (__v4sf) _mm_setzero_ps(),
(__mmask8) -1,		(__mmask8) -1,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_mask_scalef_ss (__m128 __W, __mmask8 __U, __m128 __A, __m128 __B)		_mm_mask_scalef_ss (__m128 __W, __mmask8 __U, __m128 __A, __m128 __B)
{		{
return (__m128) __builtin_ia32_scalefss_round_mask ( (__v4sf) __A,		return (__m128) __builtin_ia32_scalefss_round_mask ( (__v4sf) __A,
(__v4sf) __B,		(__v4sf) __B,
(__v4sf) __W,		(__v4sf) __W,
(__mmask8) __U,		(__mmask8) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

#define _mm_mask_scalef_round_ss(W, U, A, B, R) \		#define _mm_mask_scalef_round_ss(W, U, A, B, R) \
(__m128)__builtin_ia32_scalefss_round_mask((__v4sf)(__m128)(A), \		(__m128)__builtin_ia32_scalefss_round_mask((__v4sf)(__m128)(A), \
(__v4sf)(__m128)(B), \		(__v4sf)(__m128)(B), \
(__v4sf)(__m128)(W), \		(__v4sf)(__m128)(W), \
(__mmask8)(U), (int)(R))		(__mmask8)(U), (int)(R))

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_maskz_scalef_ss (__mmask8 __U, __m128 __A, __m128 __B)		_mm_maskz_scalef_ss (__mmask8 __U, __m128 __A, __m128 __B)
{		{
return (__m128) __builtin_ia32_scalefss_round_mask ( (__v4sf) __A,		return (__m128) __builtin_ia32_scalefss_round_mask ( (__v4sf) __A,
(__v4sf) __B,		(__v4sf) __B,
(__v4sf) _mm_setzero_ps (),		(__v4sf) _mm_setzero_ps (),
(__mmask8) __U,		(__mmask8) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

#define _mm_maskz_scalef_round_ss(U, A, B, R) \		#define _mm_maskz_scalef_round_ss(U, A, B, R) \
(__m128)__builtin_ia32_scalefss_round_mask((__v4sf)(__m128)(A), \		(__m128)__builtin_ia32_scalefss_round_mask((__v4sf)(__m128)(A), \
(__v4sf)(__m128)(B), \		(__v4sf)(__m128)(B), \
(__v4sf)_mm_setzero_ps(), \		(__v4sf)_mm_setzero_ps(), \
(__mmask8)(U), \		(__mmask8)(U), \
_MM_FROUND_CUR_DIRECTION)		_MM_FROUND_CUR_DIRECTION)

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_srai_epi32(__m512i __A, int __B)		_mm512_srai_epi32(__m512i __A, int __B)
{		{
return (__m512i)__builtin_ia32_psradi512((__v16si)__A, __B);		return (__m512i)__builtin_ia32_psradi512((__v16si)__A, __B);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_srai_epi32(__m512i __W, __mmask16 __U, __m512i __A, int __B)		_mm512_mask_srai_epi32(__m512i __W, __mmask16 __U, __m512i __A, int __B)
{		{
return (__m512i)__builtin_ia32_selectd_512((__mmask16)__U, \		return (__m512i)__builtin_ia32_selectd_512((__mmask16)__U, \
(__v16si)_mm512_srai_epi32(__A, __B), \		(__v16si)_mm512_srai_epi32(__A, __B), \
(__v16si)__W);		(__v16si)__W);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_srai_epi32(__mmask16 __U, __m512i __A, int __B) {		_mm512_maskz_srai_epi32(__mmask16 __U, __m512i __A, int __B) {
return (__m512i)__builtin_ia32_selectd_512((__mmask16)__U, \		return (__m512i)__builtin_ia32_selectd_512((__mmask16)__U, \
(__v16si)_mm512_srai_epi32(__A, __B), \		(__v16si)_mm512_srai_epi32(__A, __B), \
(__v16si)_mm512_setzero_si512());		(__v16si)_mm512_setzero_si512());
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_srai_epi64(__m512i __A, int __B)		_mm512_srai_epi64(__m512i __A, int __B)
{		{
return (__m512i)__builtin_ia32_psraqi512((__v8di)__A, __B);		return (__m512i)__builtin_ia32_psraqi512((__v8di)__A, __B);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_srai_epi64(__m512i __W, __mmask8 __U, __m512i __A, int __B)		_mm512_mask_srai_epi64(__m512i __W, __mmask8 __U, __m512i __A, int __B)
{		{
return (__m512i)__builtin_ia32_selectq_512((__mmask8)__U, \		return (__m512i)__builtin_ia32_selectq_512((__mmask8)__U, \
(__v8di)_mm512_srai_epi64(__A, __B), \		(__v8di)_mm512_srai_epi64(__A, __B), \
(__v8di)__W);		(__v8di)__W);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_srai_epi64(__mmask8 __U, __m512i __A, int __B)		_mm512_maskz_srai_epi64(__mmask8 __U, __m512i __A, int __B)
{		{
return (__m512i)__builtin_ia32_selectq_512((__mmask8)__U, \		return (__m512i)__builtin_ia32_selectq_512((__mmask8)__U, \
(__v8di)_mm512_srai_epi64(__A, __B), \		(__v8di)_mm512_srai_epi64(__A, __B), \
(__v8di)_mm512_setzero_si512());		(__v8di)_mm512_setzero_si512());
}		}

#define _mm512_shuffle_f32x4(A, B, imm) \		#define _mm512_shuffle_f32x4(A, B, imm) \
▲ Show 20 Lines • Show All 105 Lines • ▼ Show 20 Lines	(__m512)__builtin_ia32_selectps_512((__mmask16)(U), \
(__v16sf)_mm512_setzero_ps())		(__v16sf)_mm512_setzero_ps())

#define _mm_sqrt_round_sd(A, B, R) \		#define _mm_sqrt_round_sd(A, B, R) \
(__m128d)__builtin_ia32_sqrtsd_round_mask((__v2df)(__m128d)(A), \		(__m128d)__builtin_ia32_sqrtsd_round_mask((__v2df)(__m128d)(A), \
(__v2df)(__m128d)(B), \		(__v2df)(__m128d)(B), \
(__v2df)_mm_setzero_pd(), \		(__v2df)_mm_setzero_pd(), \
(__mmask8)-1, (int)(R))		(__mmask8)-1, (int)(R))

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_mask_sqrt_sd (__m128d __W, __mmask8 __U, __m128d __A, __m128d __B)		_mm_mask_sqrt_sd (__m128d __W, __mmask8 __U, __m128d __A, __m128d __B)
{		{
return (__m128d) __builtin_ia32_sqrtsd_round_mask ( (__v2df) __A,		return (__m128d) __builtin_ia32_sqrtsd_round_mask ( (__v2df) __A,
(__v2df) __B,		(__v2df) __B,
(__v2df) __W,		(__v2df) __W,
(__mmask8) __U,		(__mmask8) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

#define _mm_mask_sqrt_round_sd(W, U, A, B, R) \		#define _mm_mask_sqrt_round_sd(W, U, A, B, R) \
(__m128d)__builtin_ia32_sqrtsd_round_mask((__v2df)(__m128d)(A), \		(__m128d)__builtin_ia32_sqrtsd_round_mask((__v2df)(__m128d)(A), \
(__v2df)(__m128d)(B), \		(__v2df)(__m128d)(B), \
(__v2df)(__m128d)(W), \		(__v2df)(__m128d)(W), \
(__mmask8)(U), (int)(R))		(__mmask8)(U), (int)(R))

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_maskz_sqrt_sd (__mmask8 __U, __m128d __A, __m128d __B)		_mm_maskz_sqrt_sd (__mmask8 __U, __m128d __A, __m128d __B)
{		{
return (__m128d) __builtin_ia32_sqrtsd_round_mask ( (__v2df) __A,		return (__m128d) __builtin_ia32_sqrtsd_round_mask ( (__v2df) __A,
(__v2df) __B,		(__v2df) __B,
(__v2df) _mm_setzero_pd (),		(__v2df) _mm_setzero_pd (),
(__mmask8) __U,		(__mmask8) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

#define _mm_maskz_sqrt_round_sd(U, A, B, R) \		#define _mm_maskz_sqrt_round_sd(U, A, B, R) \
(__m128d)__builtin_ia32_sqrtsd_round_mask((__v2df)(__m128d)(A), \		(__m128d)__builtin_ia32_sqrtsd_round_mask((__v2df)(__m128d)(A), \
(__v2df)(__m128d)(B), \		(__v2df)(__m128d)(B), \
(__v2df)_mm_setzero_pd(), \		(__v2df)_mm_setzero_pd(), \
(__mmask8)(U), (int)(R))		(__mmask8)(U), (int)(R))

#define _mm_sqrt_round_ss(A, B, R) \		#define _mm_sqrt_round_ss(A, B, R) \
(__m128)__builtin_ia32_sqrtss_round_mask((__v4sf)(__m128)(A), \		(__m128)__builtin_ia32_sqrtss_round_mask((__v4sf)(__m128)(A), \
(__v4sf)(__m128)(B), \		(__v4sf)(__m128)(B), \
(__v4sf)_mm_setzero_ps(), \		(__v4sf)_mm_setzero_ps(), \
(__mmask8)-1, (int)(R))		(__mmask8)-1, (int)(R))

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_mask_sqrt_ss (__m128 __W, __mmask8 __U, __m128 __A, __m128 __B)		_mm_mask_sqrt_ss (__m128 __W, __mmask8 __U, __m128 __A, __m128 __B)
{		{
return (__m128) __builtin_ia32_sqrtss_round_mask ( (__v4sf) __A,		return (__m128) __builtin_ia32_sqrtss_round_mask ( (__v4sf) __A,
(__v4sf) __B,		(__v4sf) __B,
(__v4sf) __W,		(__v4sf) __W,
(__mmask8) __U,		(__mmask8) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

#define _mm_mask_sqrt_round_ss(W, U, A, B, R) \		#define _mm_mask_sqrt_round_ss(W, U, A, B, R) \
(__m128)__builtin_ia32_sqrtss_round_mask((__v4sf)(__m128)(A), \		(__m128)__builtin_ia32_sqrtss_round_mask((__v4sf)(__m128)(A), \
(__v4sf)(__m128)(B), \		(__v4sf)(__m128)(B), \
(__v4sf)(__m128)(W), (__mmask8)(U), \		(__v4sf)(__m128)(W), (__mmask8)(U), \
(int)(R))		(int)(R))

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_maskz_sqrt_ss (__mmask8 __U, __m128 __A, __m128 __B)		_mm_maskz_sqrt_ss (__mmask8 __U, __m128 __A, __m128 __B)
{		{
return (__m128) __builtin_ia32_sqrtss_round_mask ( (__v4sf) __A,		return (__m128) __builtin_ia32_sqrtss_round_mask ( (__v4sf) __A,
(__v4sf) __B,		(__v4sf) __B,
(__v4sf) _mm_setzero_ps (),		(__v4sf) _mm_setzero_ps (),
(__mmask8) __U,		(__mmask8) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

#define _mm_maskz_sqrt_round_ss(U, A, B, R) \		#define _mm_maskz_sqrt_round_ss(U, A, B, R) \
(__m128)__builtin_ia32_sqrtss_round_mask((__v4sf)(__m128)(A), \		(__m128)__builtin_ia32_sqrtss_round_mask((__v4sf)(__m128)(A), \
(__v4sf)(__m128)(B), \		(__v4sf)(__m128)(B), \
(__v4sf)_mm_setzero_ps(), \		(__v4sf)_mm_setzero_ps(), \
(__mmask8)(U), (int)(R))		(__mmask8)(U), (int)(R))

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_broadcast_f32x4(__m128 __A)		_mm512_broadcast_f32x4(__m128 __A)
{		{
return (__m512)__builtin_shufflevector((__v4sf)__A, (__v4sf)__A,		return (__m512)__builtin_shufflevector((__v4sf)__A, (__v4sf)__A,
0, 1, 2, 3, 0, 1, 2, 3,		0, 1, 2, 3, 0, 1, 2, 3,
0, 1, 2, 3, 0, 1, 2, 3);		0, 1, 2, 3, 0, 1, 2, 3);
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_mask_broadcast_f32x4(__m512 __O, __mmask16 __M, __m128 __A)		_mm512_mask_broadcast_f32x4(__m512 __O, __mmask16 __M, __m128 __A)
{		{
return (__m512)__builtin_ia32_selectps_512((__mmask16)__M,		return (__m512)__builtin_ia32_selectps_512((__mmask16)__M,
(__v16sf)_mm512_broadcast_f32x4(__A),		(__v16sf)_mm512_broadcast_f32x4(__A),
(__v16sf)__O);		(__v16sf)__O);
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_maskz_broadcast_f32x4(__mmask16 __M, __m128 __A)		_mm512_maskz_broadcast_f32x4(__mmask16 __M, __m128 __A)
{		{
return (__m512)__builtin_ia32_selectps_512((__mmask16)__M,		return (__m512)__builtin_ia32_selectps_512((__mmask16)__M,
(__v16sf)_mm512_broadcast_f32x4(__A),		(__v16sf)_mm512_broadcast_f32x4(__A),
(__v16sf)_mm512_setzero_ps());		(__v16sf)_mm512_setzero_ps());
}		}

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_broadcast_f64x4(__m256d __A)		_mm512_broadcast_f64x4(__m256d __A)
{		{
return (__m512d)__builtin_shufflevector((__v4df)__A, (__v4df)__A,		return (__m512d)__builtin_shufflevector((__v4df)__A, (__v4df)__A,
0, 1, 2, 3, 0, 1, 2, 3);		0, 1, 2, 3, 0, 1, 2, 3);
}		}

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_mask_broadcast_f64x4(__m512d __O, __mmask8 __M, __m256d __A)		_mm512_mask_broadcast_f64x4(__m512d __O, __mmask8 __M, __m256d __A)
{		{
return (__m512d)__builtin_ia32_selectpd_512((__mmask8)__M,		return (__m512d)__builtin_ia32_selectpd_512((__mmask8)__M,
(__v8df)_mm512_broadcast_f64x4(__A),		(__v8df)_mm512_broadcast_f64x4(__A),
(__v8df)__O);		(__v8df)__O);
}		}

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_maskz_broadcast_f64x4(__mmask8 __M, __m256d __A)		_mm512_maskz_broadcast_f64x4(__mmask8 __M, __m256d __A)
{		{
return (__m512d)__builtin_ia32_selectpd_512((__mmask8)__M,		return (__m512d)__builtin_ia32_selectpd_512((__mmask8)__M,
(__v8df)_mm512_broadcast_f64x4(__A),		(__v8df)_mm512_broadcast_f64x4(__A),
(__v8df)_mm512_setzero_pd());		(__v8df)_mm512_setzero_pd());
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_broadcast_i32x4(__m128i __A)		_mm512_broadcast_i32x4(__m128i __A)
{		{
return (__m512i)__builtin_shufflevector((__v4si)__A, (__v4si)__A,		return (__m512i)__builtin_shufflevector((__v4si)__A, (__v4si)__A,
0, 1, 2, 3, 0, 1, 2, 3,		0, 1, 2, 3, 0, 1, 2, 3,
0, 1, 2, 3, 0, 1, 2, 3);		0, 1, 2, 3, 0, 1, 2, 3);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_broadcast_i32x4(__m512i __O, __mmask16 __M, __m128i __A)		_mm512_mask_broadcast_i32x4(__m512i __O, __mmask16 __M, __m128i __A)
{		{
return (__m512i)__builtin_ia32_selectd_512((__mmask16)__M,		return (__m512i)__builtin_ia32_selectd_512((__mmask16)__M,
(__v16si)_mm512_broadcast_i32x4(__A),		(__v16si)_mm512_broadcast_i32x4(__A),
(__v16si)__O);		(__v16si)__O);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_broadcast_i32x4(__mmask16 __M, __m128i __A)		_mm512_maskz_broadcast_i32x4(__mmask16 __M, __m128i __A)
{		{
return (__m512i)__builtin_ia32_selectd_512((__mmask16)__M,		return (__m512i)__builtin_ia32_selectd_512((__mmask16)__M,
(__v16si)_mm512_broadcast_i32x4(__A),		(__v16si)_mm512_broadcast_i32x4(__A),
(__v16si)_mm512_setzero_si512());		(__v16si)_mm512_setzero_si512());
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_broadcast_i64x4(__m256i __A)		_mm512_broadcast_i64x4(__m256i __A)
{		{
return (__m512i)__builtin_shufflevector((__v4di)__A, (__v4di)__A,		return (__m512i)__builtin_shufflevector((__v4di)__A, (__v4di)__A,
0, 1, 2, 3, 0, 1, 2, 3);		0, 1, 2, 3, 0, 1, 2, 3);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_broadcast_i64x4(__m512i __O, __mmask8 __M, __m256i __A)		_mm512_mask_broadcast_i64x4(__m512i __O, __mmask8 __M, __m256i __A)
{		{
return (__m512i)__builtin_ia32_selectq_512((__mmask8)__M,		return (__m512i)__builtin_ia32_selectq_512((__mmask8)__M,
(__v8di)_mm512_broadcast_i64x4(__A),		(__v8di)_mm512_broadcast_i64x4(__A),
(__v8di)__O);		(__v8di)__O);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_broadcast_i64x4(__mmask8 __M, __m256i __A)		_mm512_maskz_broadcast_i64x4(__mmask8 __M, __m256i __A)
{		{
return (__m512i)__builtin_ia32_selectq_512((__mmask8)__M,		return (__m512i)__builtin_ia32_selectq_512((__mmask8)__M,
(__v8di)_mm512_broadcast_i64x4(__A),		(__v8di)_mm512_broadcast_i64x4(__A),
(__v8di)_mm512_setzero_si512());		(__v8di)_mm512_setzero_si512());
}		}

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_mask_broadcastsd_pd (__m512d __O, __mmask8 __M, __m128d __A)		_mm512_mask_broadcastsd_pd (__m512d __O, __mmask8 __M, __m128d __A)
{		{
return (__m512d)__builtin_ia32_selectpd_512(__M,		return (__m512d)__builtin_ia32_selectpd_512(__M,
(__v8df) _mm512_broadcastsd_pd(__A),		(__v8df) _mm512_broadcastsd_pd(__A),
(__v8df) __O);		(__v8df) __O);
}		}

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_maskz_broadcastsd_pd (__mmask8 __M, __m128d __A)		_mm512_maskz_broadcastsd_pd (__mmask8 __M, __m128d __A)
{		{
return (__m512d)__builtin_ia32_selectpd_512(__M,		return (__m512d)__builtin_ia32_selectpd_512(__M,
(__v8df) _mm512_broadcastsd_pd(__A),		(__v8df) _mm512_broadcastsd_pd(__A),
(__v8df) _mm512_setzero_pd());		(__v8df) _mm512_setzero_pd());
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_mask_broadcastss_ps (__m512 __O, __mmask16 __M, __m128 __A)		_mm512_mask_broadcastss_ps (__m512 __O, __mmask16 __M, __m128 __A)
{		{
return (__m512)__builtin_ia32_selectps_512(__M,		return (__m512)__builtin_ia32_selectps_512(__M,
(__v16sf) _mm512_broadcastss_ps(__A),		(__v16sf) _mm512_broadcastss_ps(__A),
(__v16sf) __O);		(__v16sf) __O);
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_maskz_broadcastss_ps (__mmask16 __M, __m128 __A)		_mm512_maskz_broadcastss_ps (__mmask16 __M, __m128 __A)
{		{
return (__m512)__builtin_ia32_selectps_512(__M,		return (__m512)__builtin_ia32_selectps_512(__M,
(__v16sf) _mm512_broadcastss_ps(__A),		(__v16sf) _mm512_broadcastss_ps(__A),
(__v16sf) _mm512_setzero_ps());		(__v16sf) _mm512_setzero_ps());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS512
_mm512_cvtsepi32_epi8 (__m512i __A)		_mm512_cvtsepi32_epi8 (__m512i __A)
{		{
return (__m128i) __builtin_ia32_pmovsdb512_mask ((__v16si) __A,		return (__m128i) __builtin_ia32_pmovsdb512_mask ((__v16si) __A,
(__v16qi) _mm_undefined_si128 (),		(__v16qi) _mm_undefined_si128 (),
(__mmask16) -1);		(__mmask16) -1);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS512
_mm512_mask_cvtsepi32_epi8 (__m128i __O, __mmask16 __M, __m512i __A)		_mm512_mask_cvtsepi32_epi8 (__m128i __O, __mmask16 __M, __m512i __A)
{		{
return (__m128i) __builtin_ia32_pmovsdb512_mask ((__v16si) __A,		return (__m128i) __builtin_ia32_pmovsdb512_mask ((__v16si) __A,
(__v16qi) __O, __M);		(__v16qi) __O, __M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS512
_mm512_maskz_cvtsepi32_epi8 (__mmask16 __M, __m512i __A)		_mm512_maskz_cvtsepi32_epi8 (__mmask16 __M, __m512i __A)
{		{
return (__m128i) __builtin_ia32_pmovsdb512_mask ((__v16si) __A,		return (__m128i) __builtin_ia32_pmovsdb512_mask ((__v16si) __A,
(__v16qi) _mm_setzero_si128 (),		(__v16qi) _mm_setzero_si128 (),
__M);		__M);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS512
_mm512_mask_cvtsepi32_storeu_epi8 (void * __P, __mmask16 __M, __m512i __A)		_mm512_mask_cvtsepi32_storeu_epi8 (void * __P, __mmask16 __M, __m512i __A)
{		{
__builtin_ia32_pmovsdb512mem_mask ((__v16qi *) __P, (__v16si) __A, __M);		__builtin_ia32_pmovsdb512mem_mask ((__v16qi *) __P, (__v16si) __A, __M);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS512
_mm512_cvtsepi32_epi16 (__m512i __A)		_mm512_cvtsepi32_epi16 (__m512i __A)
{		{
return (__m256i) __builtin_ia32_pmovsdw512_mask ((__v16si) __A,		return (__m256i) __builtin_ia32_pmovsdw512_mask ((__v16si) __A,
(__v16hi) _mm256_undefined_si256 (),		(__v16hi) _mm256_undefined_si256 (),
(__mmask16) -1);		(__mmask16) -1);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS512
_mm512_mask_cvtsepi32_epi16 (__m256i __O, __mmask16 __M, __m512i __A)		_mm512_mask_cvtsepi32_epi16 (__m256i __O, __mmask16 __M, __m512i __A)
{		{
return (__m256i) __builtin_ia32_pmovsdw512_mask ((__v16si) __A,		return (__m256i) __builtin_ia32_pmovsdw512_mask ((__v16si) __A,
(__v16hi) __O, __M);		(__v16hi) __O, __M);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS512
_mm512_maskz_cvtsepi32_epi16 (__mmask16 __M, __m512i __A)		_mm512_maskz_cvtsepi32_epi16 (__mmask16 __M, __m512i __A)
{		{
return (__m256i) __builtin_ia32_pmovsdw512_mask ((__v16si) __A,		return (__m256i) __builtin_ia32_pmovsdw512_mask ((__v16si) __A,
(__v16hi) _mm256_setzero_si256 (),		(__v16hi) _mm256_setzero_si256 (),
__M);		__M);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS512
_mm512_mask_cvtsepi32_storeu_epi16 (void *__P, __mmask16 __M, __m512i __A)		_mm512_mask_cvtsepi32_storeu_epi16 (void *__P, __mmask16 __M, __m512i __A)
{		{
__builtin_ia32_pmovsdw512mem_mask ((__v16hi*) __P, (__v16si) __A, __M);		__builtin_ia32_pmovsdw512mem_mask ((__v16hi*) __P, (__v16si) __A, __M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS512
_mm512_cvtsepi64_epi8 (__m512i __A)		_mm512_cvtsepi64_epi8 (__m512i __A)
{		{
return (__m128i) __builtin_ia32_pmovsqb512_mask ((__v8di) __A,		return (__m128i) __builtin_ia32_pmovsqb512_mask ((__v8di) __A,
(__v16qi) _mm_undefined_si128 (),		(__v16qi) _mm_undefined_si128 (),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS512
_mm512_mask_cvtsepi64_epi8 (__m128i __O, __mmask8 __M, __m512i __A)		_mm512_mask_cvtsepi64_epi8 (__m128i __O, __mmask8 __M, __m512i __A)
{		{
return (__m128i) __builtin_ia32_pmovsqb512_mask ((__v8di) __A,		return (__m128i) __builtin_ia32_pmovsqb512_mask ((__v8di) __A,
(__v16qi) __O, __M);		(__v16qi) __O, __M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS512
_mm512_maskz_cvtsepi64_epi8 (__mmask8 __M, __m512i __A)		_mm512_maskz_cvtsepi64_epi8 (__mmask8 __M, __m512i __A)
{		{
return (__m128i) __builtin_ia32_pmovsqb512_mask ((__v8di) __A,		return (__m128i) __builtin_ia32_pmovsqb512_mask ((__v8di) __A,
(__v16qi) _mm_setzero_si128 (),		(__v16qi) _mm_setzero_si128 (),
__M);		__M);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS512
_mm512_mask_cvtsepi64_storeu_epi8 (void * __P, __mmask8 __M, __m512i __A)		_mm512_mask_cvtsepi64_storeu_epi8 (void * __P, __mmask8 __M, __m512i __A)
{		{
__builtin_ia32_pmovsqb512mem_mask ((__v16qi *) __P, (__v8di) __A, __M);		__builtin_ia32_pmovsqb512mem_mask ((__v16qi *) __P, (__v8di) __A, __M);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS512
_mm512_cvtsepi64_epi32 (__m512i __A)		_mm512_cvtsepi64_epi32 (__m512i __A)
{		{
return (__m256i) __builtin_ia32_pmovsqd512_mask ((__v8di) __A,		return (__m256i) __builtin_ia32_pmovsqd512_mask ((__v8di) __A,
(__v8si) _mm256_undefined_si256 (),		(__v8si) _mm256_undefined_si256 (),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS512
_mm512_mask_cvtsepi64_epi32 (__m256i __O, __mmask8 __M, __m512i __A)		_mm512_mask_cvtsepi64_epi32 (__m256i __O, __mmask8 __M, __m512i __A)
{		{
return (__m256i) __builtin_ia32_pmovsqd512_mask ((__v8di) __A,		return (__m256i) __builtin_ia32_pmovsqd512_mask ((__v8di) __A,
(__v8si) __O, __M);		(__v8si) __O, __M);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS512
_mm512_maskz_cvtsepi64_epi32 (__mmask8 __M, __m512i __A)		_mm512_maskz_cvtsepi64_epi32 (__mmask8 __M, __m512i __A)
{		{
return (__m256i) __builtin_ia32_pmovsqd512_mask ((__v8di) __A,		return (__m256i) __builtin_ia32_pmovsqd512_mask ((__v8di) __A,
(__v8si) _mm256_setzero_si256 (),		(__v8si) _mm256_setzero_si256 (),
__M);		__M);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS512
_mm512_mask_cvtsepi64_storeu_epi32 (void *__P, __mmask8 __M, __m512i __A)		_mm512_mask_cvtsepi64_storeu_epi32 (void *__P, __mmask8 __M, __m512i __A)
{		{
__builtin_ia32_pmovsqd512mem_mask ((__v8si *) __P, (__v8di) __A, __M);		__builtin_ia32_pmovsqd512mem_mask ((__v8si *) __P, (__v8di) __A, __M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS512
_mm512_cvtsepi64_epi16 (__m512i __A)		_mm512_cvtsepi64_epi16 (__m512i __A)
{		{
return (__m128i) __builtin_ia32_pmovsqw512_mask ((__v8di) __A,		return (__m128i) __builtin_ia32_pmovsqw512_mask ((__v8di) __A,
(__v8hi) _mm_undefined_si128 (),		(__v8hi) _mm_undefined_si128 (),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS512
_mm512_mask_cvtsepi64_epi16 (__m128i __O, __mmask8 __M, __m512i __A)		_mm512_mask_cvtsepi64_epi16 (__m128i __O, __mmask8 __M, __m512i __A)
{		{
return (__m128i) __builtin_ia32_pmovsqw512_mask ((__v8di) __A,		return (__m128i) __builtin_ia32_pmovsqw512_mask ((__v8di) __A,
(__v8hi) __O, __M);		(__v8hi) __O, __M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS512
_mm512_maskz_cvtsepi64_epi16 (__mmask8 __M, __m512i __A)		_mm512_maskz_cvtsepi64_epi16 (__mmask8 __M, __m512i __A)
{		{
return (__m128i) __builtin_ia32_pmovsqw512_mask ((__v8di) __A,		return (__m128i) __builtin_ia32_pmovsqw512_mask ((__v8di) __A,
(__v8hi) _mm_setzero_si128 (),		(__v8hi) _mm_setzero_si128 (),
__M);		__M);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS512
_mm512_mask_cvtsepi64_storeu_epi16 (void * __P, __mmask8 __M, __m512i __A)		_mm512_mask_cvtsepi64_storeu_epi16 (void * __P, __mmask8 __M, __m512i __A)
{		{
__builtin_ia32_pmovsqw512mem_mask ((__v8hi *) __P, (__v8di) __A, __M);		__builtin_ia32_pmovsqw512mem_mask ((__v8hi *) __P, (__v8di) __A, __M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS512
_mm512_cvtusepi32_epi8 (__m512i __A)		_mm512_cvtusepi32_epi8 (__m512i __A)
{		{
return (__m128i) __builtin_ia32_pmovusdb512_mask ((__v16si) __A,		return (__m128i) __builtin_ia32_pmovusdb512_mask ((__v16si) __A,
(__v16qi) _mm_undefined_si128 (),		(__v16qi) _mm_undefined_si128 (),
(__mmask16) -1);		(__mmask16) -1);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS512
_mm512_mask_cvtusepi32_epi8 (__m128i __O, __mmask16 __M, __m512i __A)		_mm512_mask_cvtusepi32_epi8 (__m128i __O, __mmask16 __M, __m512i __A)
{		{
return (__m128i) __builtin_ia32_pmovusdb512_mask ((__v16si) __A,		return (__m128i) __builtin_ia32_pmovusdb512_mask ((__v16si) __A,
(__v16qi) __O,		(__v16qi) __O,
__M);		__M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS512
_mm512_maskz_cvtusepi32_epi8 (__mmask16 __M, __m512i __A)		_mm512_maskz_cvtusepi32_epi8 (__mmask16 __M, __m512i __A)
{		{
return (__m128i) __builtin_ia32_pmovusdb512_mask ((__v16si) __A,		return (__m128i) __builtin_ia32_pmovusdb512_mask ((__v16si) __A,
(__v16qi) _mm_setzero_si128 (),		(__v16qi) _mm_setzero_si128 (),
__M);		__M);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS512
_mm512_mask_cvtusepi32_storeu_epi8 (void * __P, __mmask16 __M, __m512i __A)		_mm512_mask_cvtusepi32_storeu_epi8 (void * __P, __mmask16 __M, __m512i __A)
{		{
__builtin_ia32_pmovusdb512mem_mask ((__v16qi *) __P, (__v16si) __A, __M);		__builtin_ia32_pmovusdb512mem_mask ((__v16qi *) __P, (__v16si) __A, __M);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS512
_mm512_cvtusepi32_epi16 (__m512i __A)		_mm512_cvtusepi32_epi16 (__m512i __A)
{		{
return (__m256i) __builtin_ia32_pmovusdw512_mask ((__v16si) __A,		return (__m256i) __builtin_ia32_pmovusdw512_mask ((__v16si) __A,
(__v16hi) _mm256_undefined_si256 (),		(__v16hi) _mm256_undefined_si256 (),
(__mmask16) -1);		(__mmask16) -1);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS512
_mm512_mask_cvtusepi32_epi16 (__m256i __O, __mmask16 __M, __m512i __A)		_mm512_mask_cvtusepi32_epi16 (__m256i __O, __mmask16 __M, __m512i __A)
{		{
return (__m256i) __builtin_ia32_pmovusdw512_mask ((__v16si) __A,		return (__m256i) __builtin_ia32_pmovusdw512_mask ((__v16si) __A,
(__v16hi) __O,		(__v16hi) __O,
__M);		__M);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS512
_mm512_maskz_cvtusepi32_epi16 (__mmask16 __M, __m512i __A)		_mm512_maskz_cvtusepi32_epi16 (__mmask16 __M, __m512i __A)
{		{
return (__m256i) __builtin_ia32_pmovusdw512_mask ((__v16si) __A,		return (__m256i) __builtin_ia32_pmovusdw512_mask ((__v16si) __A,
(__v16hi) _mm256_setzero_si256 (),		(__v16hi) _mm256_setzero_si256 (),
__M);		__M);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS512
_mm512_mask_cvtusepi32_storeu_epi16 (void *__P, __mmask16 __M, __m512i __A)		_mm512_mask_cvtusepi32_storeu_epi16 (void *__P, __mmask16 __M, __m512i __A)
{		{
__builtin_ia32_pmovusdw512mem_mask ((__v16hi*) __P, (__v16si) __A, __M);		__builtin_ia32_pmovusdw512mem_mask ((__v16hi*) __P, (__v16si) __A, __M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS512
_mm512_cvtusepi64_epi8 (__m512i __A)		_mm512_cvtusepi64_epi8 (__m512i __A)
{		{
return (__m128i) __builtin_ia32_pmovusqb512_mask ((__v8di) __A,		return (__m128i) __builtin_ia32_pmovusqb512_mask ((__v8di) __A,
(__v16qi) _mm_undefined_si128 (),		(__v16qi) _mm_undefined_si128 (),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS512
_mm512_mask_cvtusepi64_epi8 (__m128i __O, __mmask8 __M, __m512i __A)		_mm512_mask_cvtusepi64_epi8 (__m128i __O, __mmask8 __M, __m512i __A)
{		{
return (__m128i) __builtin_ia32_pmovusqb512_mask ((__v8di) __A,		return (__m128i) __builtin_ia32_pmovusqb512_mask ((__v8di) __A,
(__v16qi) __O,		(__v16qi) __O,
__M);		__M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS512
_mm512_maskz_cvtusepi64_epi8 (__mmask8 __M, __m512i __A)		_mm512_maskz_cvtusepi64_epi8 (__mmask8 __M, __m512i __A)
{		{
return (__m128i) __builtin_ia32_pmovusqb512_mask ((__v8di) __A,		return (__m128i) __builtin_ia32_pmovusqb512_mask ((__v8di) __A,
(__v16qi) _mm_setzero_si128 (),		(__v16qi) _mm_setzero_si128 (),
__M);		__M);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS512
_mm512_mask_cvtusepi64_storeu_epi8 (void * __P, __mmask8 __M, __m512i __A)		_mm512_mask_cvtusepi64_storeu_epi8 (void * __P, __mmask8 __M, __m512i __A)
{		{
__builtin_ia32_pmovusqb512mem_mask ((__v16qi *) __P, (__v8di) __A, __M);		__builtin_ia32_pmovusqb512mem_mask ((__v16qi *) __P, (__v8di) __A, __M);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS512
_mm512_cvtusepi64_epi32 (__m512i __A)		_mm512_cvtusepi64_epi32 (__m512i __A)
{		{
return (__m256i) __builtin_ia32_pmovusqd512_mask ((__v8di) __A,		return (__m256i) __builtin_ia32_pmovusqd512_mask ((__v8di) __A,
(__v8si) _mm256_undefined_si256 (),		(__v8si) _mm256_undefined_si256 (),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS512
_mm512_mask_cvtusepi64_epi32 (__m256i __O, __mmask8 __M, __m512i __A)		_mm512_mask_cvtusepi64_epi32 (__m256i __O, __mmask8 __M, __m512i __A)
{		{
return (__m256i) __builtin_ia32_pmovusqd512_mask ((__v8di) __A,		return (__m256i) __builtin_ia32_pmovusqd512_mask ((__v8di) __A,
(__v8si) __O, __M);		(__v8si) __O, __M);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS512
_mm512_maskz_cvtusepi64_epi32 (__mmask8 __M, __m512i __A)		_mm512_maskz_cvtusepi64_epi32 (__mmask8 __M, __m512i __A)
{		{
return (__m256i) __builtin_ia32_pmovusqd512_mask ((__v8di) __A,		return (__m256i) __builtin_ia32_pmovusqd512_mask ((__v8di) __A,
(__v8si) _mm256_setzero_si256 (),		(__v8si) _mm256_setzero_si256 (),
__M);		__M);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS512
_mm512_mask_cvtusepi64_storeu_epi32 (void* __P, __mmask8 __M, __m512i __A)		_mm512_mask_cvtusepi64_storeu_epi32 (void* __P, __mmask8 __M, __m512i __A)
{		{
__builtin_ia32_pmovusqd512mem_mask ((__v8si*) __P, (__v8di) __A, __M);		__builtin_ia32_pmovusqd512mem_mask ((__v8si*) __P, (__v8di) __A, __M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS512
_mm512_cvtusepi64_epi16 (__m512i __A)		_mm512_cvtusepi64_epi16 (__m512i __A)
{		{
return (__m128i) __builtin_ia32_pmovusqw512_mask ((__v8di) __A,		return (__m128i) __builtin_ia32_pmovusqw512_mask ((__v8di) __A,
(__v8hi) _mm_undefined_si128 (),		(__v8hi) _mm_undefined_si128 (),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS512
_mm512_mask_cvtusepi64_epi16 (__m128i __O, __mmask8 __M, __m512i __A)		_mm512_mask_cvtusepi64_epi16 (__m128i __O, __mmask8 __M, __m512i __A)
{		{
return (__m128i) __builtin_ia32_pmovusqw512_mask ((__v8di) __A,		return (__m128i) __builtin_ia32_pmovusqw512_mask ((__v8di) __A,
(__v8hi) __O, __M);		(__v8hi) __O, __M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS512
_mm512_maskz_cvtusepi64_epi16 (__mmask8 __M, __m512i __A)		_mm512_maskz_cvtusepi64_epi16 (__mmask8 __M, __m512i __A)
{		{
return (__m128i) __builtin_ia32_pmovusqw512_mask ((__v8di) __A,		return (__m128i) __builtin_ia32_pmovusqw512_mask ((__v8di) __A,
(__v8hi) _mm_setzero_si128 (),		(__v8hi) _mm_setzero_si128 (),
__M);		__M);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS512
_mm512_mask_cvtusepi64_storeu_epi16 (void *__P, __mmask8 __M, __m512i __A)		_mm512_mask_cvtusepi64_storeu_epi16 (void *__P, __mmask8 __M, __m512i __A)
{		{
__builtin_ia32_pmovusqw512mem_mask ((__v8hi*) __P, (__v8di) __A, __M);		__builtin_ia32_pmovusqw512mem_mask ((__v8hi*) __P, (__v8di) __A, __M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS512
_mm512_cvtepi32_epi8 (__m512i __A)		_mm512_cvtepi32_epi8 (__m512i __A)
{		{
return (__m128i) __builtin_ia32_pmovdb512_mask ((__v16si) __A,		return (__m128i) __builtin_ia32_pmovdb512_mask ((__v16si) __A,
(__v16qi) _mm_undefined_si128 (),		(__v16qi) _mm_undefined_si128 (),
(__mmask16) -1);		(__mmask16) -1);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS512
_mm512_mask_cvtepi32_epi8 (__m128i __O, __mmask16 __M, __m512i __A)		_mm512_mask_cvtepi32_epi8 (__m128i __O, __mmask16 __M, __m512i __A)
{		{
return (__m128i) __builtin_ia32_pmovdb512_mask ((__v16si) __A,		return (__m128i) __builtin_ia32_pmovdb512_mask ((__v16si) __A,
(__v16qi) __O, __M);		(__v16qi) __O, __M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS512
_mm512_maskz_cvtepi32_epi8 (__mmask16 __M, __m512i __A)		_mm512_maskz_cvtepi32_epi8 (__mmask16 __M, __m512i __A)
{		{
return (__m128i) __builtin_ia32_pmovdb512_mask ((__v16si) __A,		return (__m128i) __builtin_ia32_pmovdb512_mask ((__v16si) __A,
(__v16qi) _mm_setzero_si128 (),		(__v16qi) _mm_setzero_si128 (),
__M);		__M);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS512
_mm512_mask_cvtepi32_storeu_epi8 (void * __P, __mmask16 __M, __m512i __A)		_mm512_mask_cvtepi32_storeu_epi8 (void * __P, __mmask16 __M, __m512i __A)
{		{
__builtin_ia32_pmovdb512mem_mask ((__v16qi *) __P, (__v16si) __A, __M);		__builtin_ia32_pmovdb512mem_mask ((__v16qi *) __P, (__v16si) __A, __M);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS512
_mm512_cvtepi32_epi16 (__m512i __A)		_mm512_cvtepi32_epi16 (__m512i __A)
{		{
return (__m256i) __builtin_ia32_pmovdw512_mask ((__v16si) __A,		return (__m256i) __builtin_ia32_pmovdw512_mask ((__v16si) __A,
(__v16hi) _mm256_undefined_si256 (),		(__v16hi) _mm256_undefined_si256 (),
(__mmask16) -1);		(__mmask16) -1);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS512
_mm512_mask_cvtepi32_epi16 (__m256i __O, __mmask16 __M, __m512i __A)		_mm512_mask_cvtepi32_epi16 (__m256i __O, __mmask16 __M, __m512i __A)
{		{
return (__m256i) __builtin_ia32_pmovdw512_mask ((__v16si) __A,		return (__m256i) __builtin_ia32_pmovdw512_mask ((__v16si) __A,
(__v16hi) __O, __M);		(__v16hi) __O, __M);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS512
_mm512_maskz_cvtepi32_epi16 (__mmask16 __M, __m512i __A)		_mm512_maskz_cvtepi32_epi16 (__mmask16 __M, __m512i __A)
{		{
return (__m256i) __builtin_ia32_pmovdw512_mask ((__v16si) __A,		return (__m256i) __builtin_ia32_pmovdw512_mask ((__v16si) __A,
(__v16hi) _mm256_setzero_si256 (),		(__v16hi) _mm256_setzero_si256 (),
__M);		__M);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS512
_mm512_mask_cvtepi32_storeu_epi16 (void * __P, __mmask16 __M, __m512i __A)		_mm512_mask_cvtepi32_storeu_epi16 (void * __P, __mmask16 __M, __m512i __A)
{		{
__builtin_ia32_pmovdw512mem_mask ((__v16hi *) __P, (__v16si) __A, __M);		__builtin_ia32_pmovdw512mem_mask ((__v16hi *) __P, (__v16si) __A, __M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS512
_mm512_cvtepi64_epi8 (__m512i __A)		_mm512_cvtepi64_epi8 (__m512i __A)
{		{
return (__m128i) __builtin_ia32_pmovqb512_mask ((__v8di) __A,		return (__m128i) __builtin_ia32_pmovqb512_mask ((__v8di) __A,
(__v16qi) _mm_undefined_si128 (),		(__v16qi) _mm_undefined_si128 (),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS512
_mm512_mask_cvtepi64_epi8 (__m128i __O, __mmask8 __M, __m512i __A)		_mm512_mask_cvtepi64_epi8 (__m128i __O, __mmask8 __M, __m512i __A)
{		{
return (__m128i) __builtin_ia32_pmovqb512_mask ((__v8di) __A,		return (__m128i) __builtin_ia32_pmovqb512_mask ((__v8di) __A,
(__v16qi) __O, __M);		(__v16qi) __O, __M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS512
_mm512_maskz_cvtepi64_epi8 (__mmask8 __M, __m512i __A)		_mm512_maskz_cvtepi64_epi8 (__mmask8 __M, __m512i __A)
{		{
return (__m128i) __builtin_ia32_pmovqb512_mask ((__v8di) __A,		return (__m128i) __builtin_ia32_pmovqb512_mask ((__v8di) __A,
(__v16qi) _mm_setzero_si128 (),		(__v16qi) _mm_setzero_si128 (),
__M);		__M);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS512
_mm512_mask_cvtepi64_storeu_epi8 (void * __P, __mmask8 __M, __m512i __A)		_mm512_mask_cvtepi64_storeu_epi8 (void * __P, __mmask8 __M, __m512i __A)
{		{
__builtin_ia32_pmovqb512mem_mask ((__v16qi *) __P, (__v8di) __A, __M);		__builtin_ia32_pmovqb512mem_mask ((__v16qi *) __P, (__v8di) __A, __M);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS512
_mm512_cvtepi64_epi32 (__m512i __A)		_mm512_cvtepi64_epi32 (__m512i __A)
{		{
return (__m256i) __builtin_ia32_pmovqd512_mask ((__v8di) __A,		return (__m256i) __builtin_ia32_pmovqd512_mask ((__v8di) __A,
(__v8si) _mm256_undefined_si256 (),		(__v8si) _mm256_undefined_si256 (),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS512
_mm512_mask_cvtepi64_epi32 (__m256i __O, __mmask8 __M, __m512i __A)		_mm512_mask_cvtepi64_epi32 (__m256i __O, __mmask8 __M, __m512i __A)
{		{
return (__m256i) __builtin_ia32_pmovqd512_mask ((__v8di) __A,		return (__m256i) __builtin_ia32_pmovqd512_mask ((__v8di) __A,
(__v8si) __O, __M);		(__v8si) __O, __M);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS512
_mm512_maskz_cvtepi64_epi32 (__mmask8 __M, __m512i __A)		_mm512_maskz_cvtepi64_epi32 (__mmask8 __M, __m512i __A)
{		{
return (__m256i) __builtin_ia32_pmovqd512_mask ((__v8di) __A,		return (__m256i) __builtin_ia32_pmovqd512_mask ((__v8di) __A,
(__v8si) _mm256_setzero_si256 (),		(__v8si) _mm256_setzero_si256 (),
__M);		__M);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS512
_mm512_mask_cvtepi64_storeu_epi32 (void* __P, __mmask8 __M, __m512i __A)		_mm512_mask_cvtepi64_storeu_epi32 (void* __P, __mmask8 __M, __m512i __A)
{		{
__builtin_ia32_pmovqd512mem_mask ((__v8si *) __P, (__v8di) __A, __M);		__builtin_ia32_pmovqd512mem_mask ((__v8si *) __P, (__v8di) __A, __M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS512
_mm512_cvtepi64_epi16 (__m512i __A)		_mm512_cvtepi64_epi16 (__m512i __A)
{		{
return (__m128i) __builtin_ia32_pmovqw512_mask ((__v8di) __A,		return (__m128i) __builtin_ia32_pmovqw512_mask ((__v8di) __A,
(__v8hi) _mm_undefined_si128 (),		(__v8hi) _mm_undefined_si128 (),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS512
_mm512_mask_cvtepi64_epi16 (__m128i __O, __mmask8 __M, __m512i __A)		_mm512_mask_cvtepi64_epi16 (__m128i __O, __mmask8 __M, __m512i __A)
{		{
return (__m128i) __builtin_ia32_pmovqw512_mask ((__v8di) __A,		return (__m128i) __builtin_ia32_pmovqw512_mask ((__v8di) __A,
(__v8hi) __O, __M);		(__v8hi) __O, __M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS512
_mm512_maskz_cvtepi64_epi16 (__mmask8 __M, __m512i __A)		_mm512_maskz_cvtepi64_epi16 (__mmask8 __M, __m512i __A)
{		{
return (__m128i) __builtin_ia32_pmovqw512_mask ((__v8di) __A,		return (__m128i) __builtin_ia32_pmovqw512_mask ((__v8di) __A,
(__v8hi) _mm_setzero_si128 (),		(__v8hi) _mm_setzero_si128 (),
__M);		__M);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS512
_mm512_mask_cvtepi64_storeu_epi16 (void *__P, __mmask8 __M, __m512i __A)		_mm512_mask_cvtepi64_storeu_epi16 (void *__P, __mmask8 __M, __m512i __A)
{		{
__builtin_ia32_pmovqw512mem_mask ((__v8hi *) __P, (__v8di) __A, __M);		__builtin_ia32_pmovqw512mem_mask ((__v8hi *) __P, (__v8di) __A, __M);
}		}

#define _mm512_extracti32x4_epi32(A, imm) \		#define _mm512_extracti32x4_epi32(A, imm) \
(__m128i)__builtin_ia32_extracti32x4_mask((__v16si)(__m512i)(A), (int)(imm), \		(__m128i)__builtin_ia32_extracti32x4_mask((__v16si)(__m512i)(A), (int)(imm), \
(__v4si)_mm_undefined_si128(), \		(__v4si)_mm_undefined_si128(), \
▲ Show 20 Lines • Show All 168 Lines • ▼ Show 20 Lines	(__m512d)__builtin_ia32_getexppd512_mask((__v8df)(__m512d)(A), \
(__v8df)(__m512d)(W), \		(__v8df)(__m512d)(W), \
(__mmask8)(U), (int)(R))		(__mmask8)(U), (int)(R))

#define _mm512_maskz_getexp_round_pd(U, A, R) \		#define _mm512_maskz_getexp_round_pd(U, A, R) \
(__m512d)__builtin_ia32_getexppd512_mask((__v8df)(__m512d)(A), \		(__m512d)__builtin_ia32_getexppd512_mask((__v8df)(__m512d)(A), \
(__v8df)_mm512_setzero_pd(), \		(__v8df)_mm512_setzero_pd(), \
(__mmask8)(U), (int)(R))		(__mmask8)(U), (int)(R))

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_getexp_pd (__m512d __A)		_mm512_getexp_pd (__m512d __A)
{		{
return (__m512d) __builtin_ia32_getexppd512_mask ((__v8df) __A,		return (__m512d) __builtin_ia32_getexppd512_mask ((__v8df) __A,
(__v8df) _mm512_undefined_pd (),		(__v8df) _mm512_undefined_pd (),
(__mmask8) -1,		(__mmask8) -1,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_mask_getexp_pd (__m512d __W, __mmask8 __U, __m512d __A)		_mm512_mask_getexp_pd (__m512d __W, __mmask8 __U, __m512d __A)
{		{
return (__m512d) __builtin_ia32_getexppd512_mask ((__v8df) __A,		return (__m512d) __builtin_ia32_getexppd512_mask ((__v8df) __A,
(__v8df) __W,		(__v8df) __W,
(__mmask8) __U,		(__mmask8) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_maskz_getexp_pd (__mmask8 __U, __m512d __A)		_mm512_maskz_getexp_pd (__mmask8 __U, __m512d __A)
{		{
return (__m512d) __builtin_ia32_getexppd512_mask ((__v8df) __A,		return (__m512d) __builtin_ia32_getexppd512_mask ((__v8df) __A,
(__v8df) _mm512_setzero_pd (),		(__v8df) _mm512_setzero_pd (),
(__mmask8) __U,		(__mmask8) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

#define _mm512_getexp_round_ps(A, R) \		#define _mm512_getexp_round_ps(A, R) \
(__m512)__builtin_ia32_getexpps512_mask((__v16sf)(__m512)(A), \		(__m512)__builtin_ia32_getexpps512_mask((__v16sf)(__m512)(A), \
(__v16sf)_mm512_undefined_ps(), \		(__v16sf)_mm512_undefined_ps(), \
(__mmask16)-1, (int)(R))		(__mmask16)-1, (int)(R))

#define _mm512_mask_getexp_round_ps(W, U, A, R) \		#define _mm512_mask_getexp_round_ps(W, U, A, R) \
(__m512)__builtin_ia32_getexpps512_mask((__v16sf)(__m512)(A), \		(__m512)__builtin_ia32_getexpps512_mask((__v16sf)(__m512)(A), \
(__v16sf)(__m512)(W), \		(__v16sf)(__m512)(W), \
(__mmask16)(U), (int)(R))		(__mmask16)(U), (int)(R))

#define _mm512_maskz_getexp_round_ps(U, A, R) \		#define _mm512_maskz_getexp_round_ps(U, A, R) \
(__m512)__builtin_ia32_getexpps512_mask((__v16sf)(__m512)(A), \		(__m512)__builtin_ia32_getexpps512_mask((__v16sf)(__m512)(A), \
(__v16sf)_mm512_setzero_ps(), \		(__v16sf)_mm512_setzero_ps(), \
(__mmask16)(U), (int)(R))		(__mmask16)(U), (int)(R))

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_getexp_ps (__m512 __A)		_mm512_getexp_ps (__m512 __A)
{		{
return (__m512) __builtin_ia32_getexpps512_mask ((__v16sf) __A,		return (__m512) __builtin_ia32_getexpps512_mask ((__v16sf) __A,
(__v16sf) _mm512_undefined_ps (),		(__v16sf) _mm512_undefined_ps (),
(__mmask16) -1,		(__mmask16) -1,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_mask_getexp_ps (__m512 __W, __mmask16 __U, __m512 __A)		_mm512_mask_getexp_ps (__m512 __W, __mmask16 __U, __m512 __A)
{		{
return (__m512) __builtin_ia32_getexpps512_mask ((__v16sf) __A,		return (__m512) __builtin_ia32_getexpps512_mask ((__v16sf) __A,
(__v16sf) __W,		(__v16sf) __W,
(__mmask16) __U,		(__mmask16) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_maskz_getexp_ps (__mmask16 __U, __m512 __A)		_mm512_maskz_getexp_ps (__mmask16 __U, __m512 __A)
{		{
return (__m512) __builtin_ia32_getexpps512_mask ((__v16sf) __A,		return (__m512) __builtin_ia32_getexpps512_mask ((__v16sf) __A,
(__v16sf) _mm512_setzero_ps (),		(__v16sf) _mm512_setzero_ps (),
(__mmask16) __U,		(__mmask16) __U,
_MM_FROUND_CUR_DIRECTION);		_MM_FROUND_CUR_DIRECTION);
}		}

▲ Show 20 Lines • Show All 168 Lines • ▼ Show 20 Lines	__builtin_ia32_scattersiv8di((long long *)(addr), (__mmask8)-1, \
(__v8si)(__m256i)(index), \		(__v8si)(__m256i)(index), \
(__v8di)(__m512i)(v1), (int)(scale))		(__v8di)(__m512i)(v1), (int)(scale))

#define _mm512_mask_i32scatter_epi64(addr, mask, index, v1, scale) \		#define _mm512_mask_i32scatter_epi64(addr, mask, index, v1, scale) \
__builtin_ia32_scattersiv8di((long long *)(addr), (__mmask8)(mask), \		__builtin_ia32_scattersiv8di((long long *)(addr), (__mmask8)(mask), \
(__v8si)(__m256i)(index), \		(__v8si)(__m256i)(index), \
(__v8di)(__m512i)(v1), (int)(scale))		(__v8di)(__m512i)(v1), (int)(scale))

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_mask_fmadd_ss (__m128 __W, __mmask8 __U, __m128 __A, __m128 __B)		_mm_mask_fmadd_ss (__m128 __W, __mmask8 __U, __m128 __A, __m128 __B)
{		{
__m128 __Z = __builtin_ia32_vfmaddss3((__v4sf) __W,		__m128 __Z = __builtin_ia32_vfmaddss3((__v4sf) __W,
(__v4sf) __A,		(__v4sf) __A,
(__v4sf) __B);		(__v4sf) __B);
__W[0] = (__U & 1) ? __Z[0] : __W[0];		__W[0] = (__U & 1) ? __Z[0] : __W[0];
return __W;		return __W;
}		}

#define _mm_mask_fmadd_round_ss(W, U, A, B, R) \		#define _mm_mask_fmadd_round_ss(W, U, A, B, R) \
(__m128d)__builtin_ia32_vfmaddss3_mask((__v2df)(__m128d)(W), \		(__m128d)__builtin_ia32_vfmaddss3_mask((__v2df)(__m128d)(W), \
(__v2df)(__m128d)(A), \		(__v2df)(__m128d)(A), \
(__v2df)(__m128d)(B), (__mmask8)(U), \		(__v2df)(__m128d)(B), (__mmask8)(U), \
(int)(R))		(int)(R))

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_maskz_fmadd_ss (__mmask8 __U, __m128 __A, __m128 __B, __m128 __C)		_mm_maskz_fmadd_ss (__mmask8 __U, __m128 __A, __m128 __B, __m128 __C)
{		{
__m128 __Z = __builtin_ia32_vfmaddss3((__v4sf) __A,		__m128 __Z = __builtin_ia32_vfmaddss3((__v4sf) __A,
(__v4sf) __B,		(__v4sf) __B,
(__v4sf) __C);		(__v4sf) __C);
__A[0] = (__U & 1) ? __Z[0] : 0;		__A[0] = (__U & 1) ? __Z[0] : 0;
return __A;		return __A;
}		}

#define _mm_maskz_fmadd_round_ss(U, A, B, C, R) \		#define _mm_maskz_fmadd_round_ss(U, A, B, C, R) \
(__m128)__builtin_ia32_vfmaddss3_maskz((__v4sf)(__m128)(A), \		(__m128)__builtin_ia32_vfmaddss3_maskz((__v4sf)(__m128)(A), \
(__v4sf)(__m128)(B), \		(__v4sf)(__m128)(B), \
(__v4sf)(__m128)(C), (__mmask8)(U), \		(__v4sf)(__m128)(C), (__mmask8)(U), \
_MM_FROUND_CUR_DIRECTION)		_MM_FROUND_CUR_DIRECTION)

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_mask3_fmadd_ss (__m128 __W, __m128 __X, __m128 __Y, __mmask8 __U)		_mm_mask3_fmadd_ss (__m128 __W, __m128 __X, __m128 __Y, __mmask8 __U)
{		{
__m128 __Z = __builtin_ia32_vfmaddss3((__v4sf) __W,		__m128 __Z = __builtin_ia32_vfmaddss3((__v4sf) __W,
(__v4sf) __X,		(__v4sf) __X,
(__v4sf) __Y);		(__v4sf) __Y);
__Y[0] = (__U & 1) ? __Z[0] : __Y[0];		__Y[0] = (__U & 1) ? __Z[0] : __Y[0];
return __Y;		return __Y;
}		}

#define _mm_mask3_fmadd_round_ss(W, X, Y, U, R) \		#define _mm_mask3_fmadd_round_ss(W, X, Y, U, R) \
(__m128)__builtin_ia32_vfmaddss3_mask3((__v4sf)(__m128)(W), \		(__m128)__builtin_ia32_vfmaddss3_mask3((__v4sf)(__m128)(W), \
(__v4sf)(__m128)(X), \		(__v4sf)(__m128)(X), \
(__v4sf)(__m128)(Y), (__mmask8)(U), \		(__v4sf)(__m128)(Y), (__mmask8)(U), \
(int)(R))		(int)(R))

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_mask_fmsub_ss (__m128 __W, __mmask8 __U, __m128 __A, __m128 __B)		_mm_mask_fmsub_ss (__m128 __W, __mmask8 __U, __m128 __A, __m128 __B)
{		{
__m128 __Z = __builtin_ia32_vfmaddss3((__v4sf) __W,		__m128 __Z = __builtin_ia32_vfmaddss3((__v4sf) __W,
(__v4sf) __A,		(__v4sf) __A,
-(__v4sf) __B);		-(__v4sf) __B);
__W[0] = (__U & 1) ? __Z[0] : __W[0];		__W[0] = (__U & 1) ? __Z[0] : __W[0];
return __W;		return __W;
}		}

#define _mm_mask_fmsub_round_ss(W, U, A, B, R) \		#define _mm_mask_fmsub_round_ss(W, U, A, B, R) \
(__m128)__builtin_ia32_vfmaddss3_mask((__v4sf)(__m128)(W), \		(__m128)__builtin_ia32_vfmaddss3_mask((__v4sf)(__m128)(W), \
(__v4sf)(__m128)(A), \		(__v4sf)(__m128)(A), \
-(__v4sf)(__m128)(B), (__mmask8)(U), \		-(__v4sf)(__m128)(B), (__mmask8)(U), \
(int)(R))		(int)(R))

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_maskz_fmsub_ss (__mmask8 __U, __m128 __A, __m128 __B, __m128 __C)		_mm_maskz_fmsub_ss (__mmask8 __U, __m128 __A, __m128 __B, __m128 __C)
{		{
__m128 __Z = __builtin_ia32_vfmaddss3((__v4sf) __A,		__m128 __Z = __builtin_ia32_vfmaddss3((__v4sf) __A,
(__v4sf) __B,		(__v4sf) __B,
-(__v4sf) __C);		-(__v4sf) __C);
__A[0] = (__U & 1) ? __Z[0] : 0;		__A[0] = (__U & 1) ? __Z[0] : 0;
return __A;		return __A;
}		}

#define _mm_maskz_fmsub_round_ss(U, A, B, C, R) \		#define _mm_maskz_fmsub_round_ss(U, A, B, C, R) \
(__m128)__builtin_ia32_vfmaddss3_maskz((__v4sf)(__m128)(A), \		(__m128)__builtin_ia32_vfmaddss3_maskz((__v4sf)(__m128)(A), \
(__v4sf)(__m128)(B), \		(__v4sf)(__m128)(B), \
-(__v4sf)(__m128)(C), (__mmask8)(U), \		-(__v4sf)(__m128)(C), (__mmask8)(U), \
(int)(R))		(int)(R))

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_mask3_fmsub_ss (__m128 __W, __m128 __X, __m128 __Y, __mmask8 __U)		_mm_mask3_fmsub_ss (__m128 __W, __m128 __X, __m128 __Y, __mmask8 __U)
{		{
__m128 __Z = __builtin_ia32_vfmaddss3((__v4sf) __W,		__m128 __Z = __builtin_ia32_vfmaddss3((__v4sf) __W,
(__v4sf) __X,		(__v4sf) __X,
-(__v4sf) __Y);		-(__v4sf) __Y);
__Y[0] = (__U & 1) ? __Z[0] : __Y[0];		__Y[0] = (__U & 1) ? __Z[0] : __Y[0];
return __Y;		return __Y;
}		}

#define _mm_mask3_fmsub_round_ss(W, X, Y, U, R) \		#define _mm_mask3_fmsub_round_ss(W, X, Y, U, R) \
(__m128)__builtin_ia32_vfmsubss3_mask3((__v4sf)(__m128)(W), \		(__m128)__builtin_ia32_vfmsubss3_mask3((__v4sf)(__m128)(W), \
(__v4sf)(__m128)(X), \		(__v4sf)(__m128)(X), \
(__v4sf)(__m128)(Y), (__mmask8)(U), \		(__v4sf)(__m128)(Y), (__mmask8)(U), \
(int)(R))		(int)(R))

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_mask_fnmadd_ss (__m128 __W, __mmask8 __U, __m128 __A, __m128 __B)		_mm_mask_fnmadd_ss (__m128 __W, __mmask8 __U, __m128 __A, __m128 __B)
{		{
__m128 __Z = __builtin_ia32_vfmaddss3((__v4sf) __W,		__m128 __Z = __builtin_ia32_vfmaddss3((__v4sf) __W,
-(__v4sf) __A,		-(__v4sf) __A,
(__v4sf) __B);		(__v4sf) __B);
__W[0] = (__U & 1) ? __Z[0] : __W[0];		__W[0] = (__U & 1) ? __Z[0] : __W[0];
return __W;		return __W;
}		}

#define _mm_mask_fnmadd_round_ss(W, U, A, B, R) \		#define _mm_mask_fnmadd_round_ss(W, U, A, B, R) \
(__m128)__builtin_ia32_vfmaddss3_mask((__v4sf)(__m128)(W), \		(__m128)__builtin_ia32_vfmaddss3_mask((__v4sf)(__m128)(W), \
-(__v4sf)(__m128)(A), \		-(__v4sf)(__m128)(A), \
(__v4sf)(__m128)(B), (__mmask8)(U), \		(__v4sf)(__m128)(B), (__mmask8)(U), \
(int)(R))		(int)(R))

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_maskz_fnmadd_ss (__mmask8 __U, __m128 __A, __m128 __B, __m128 __C)		_mm_maskz_fnmadd_ss (__mmask8 __U, __m128 __A, __m128 __B, __m128 __C)
{		{
__m128 __Z = __builtin_ia32_vfmaddss3((__v4sf) __A,		__m128 __Z = __builtin_ia32_vfmaddss3((__v4sf) __A,
-(__v4sf) __B,		-(__v4sf) __B,
(__v4sf) __C);		(__v4sf) __C);
__A[0] = (__U & 1) ? __Z[0] : 0;		__A[0] = (__U & 1) ? __Z[0] : 0;
return __A;		return __A;
}		}

#define _mm_maskz_fnmadd_round_ss(U, A, B, C, R) \		#define _mm_maskz_fnmadd_round_ss(U, A, B, C, R) \
(__m128)__builtin_ia32_vfmaddss3_maskz((__v4sf)(__m128)(A), \		(__m128)__builtin_ia32_vfmaddss3_maskz((__v4sf)(__m128)(A), \
-(__v4sf)(__m128)(B), \		-(__v4sf)(__m128)(B), \
(__v4sf)(__m128)(C), (__mmask8)(U), \		(__v4sf)(__m128)(C), (__mmask8)(U), \
(int)(R))		(int)(R))

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_mask3_fnmadd_ss (__m128 __W, __m128 __X, __m128 __Y, __mmask8 __U)		_mm_mask3_fnmadd_ss (__m128 __W, __m128 __X, __m128 __Y, __mmask8 __U)
{		{
__m128 __Z = __builtin_ia32_vfmaddss3((__v4sf) __W,		__m128 __Z = __builtin_ia32_vfmaddss3((__v4sf) __W,
-(__v4sf) __X,		-(__v4sf) __X,
(__v4sf) __Y);		(__v4sf) __Y);
__Y[0] = (__U & 1) ? __Z[0] : __Y[0];		__Y[0] = (__U & 1) ? __Z[0] : __Y[0];
return __Y;		return __Y;
}		}

#define _mm_mask3_fnmadd_round_ss(W, X, Y, U, R) \		#define _mm_mask3_fnmadd_round_ss(W, X, Y, U, R) \
(__m128)__builtin_ia32_vfmaddss3_mask3((__v4sf)(__m128)(W), \		(__m128)__builtin_ia32_vfmaddss3_mask3((__v4sf)(__m128)(W), \
-(__v4sf)(__m128)(X), \		-(__v4sf)(__m128)(X), \
(__v4sf)(__m128)(Y), (__mmask8)(U), \		(__v4sf)(__m128)(Y), (__mmask8)(U), \
(int)(R))		(int)(R))

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_mask_fnmsub_ss (__m128 __W, __mmask8 __U, __m128 __A, __m128 __B)		_mm_mask_fnmsub_ss (__m128 __W, __mmask8 __U, __m128 __A, __m128 __B)
{		{
__m128 __Z = __builtin_ia32_vfmaddss3((__v4sf) __W,		__m128 __Z = __builtin_ia32_vfmaddss3((__v4sf) __W,
-(__v4sf) __A,		-(__v4sf) __A,
-(__v4sf) __B);		-(__v4sf) __B);
__W[0] = (__U & 1) ? __Z[0] : __W[0];		__W[0] = (__U & 1) ? __Z[0] : __W[0];
return __W;		return __W;
}		}

#define _mm_mask_fnmsub_round_ss(W, U, A, B, R) \		#define _mm_mask_fnmsub_round_ss(W, U, A, B, R) \
(__m128)__builtin_ia32_vfmaddss3_mask((__v4sf)(__m128)(W), \		(__m128)__builtin_ia32_vfmaddss3_mask((__v4sf)(__m128)(W), \
-(__v4sf)(__m128)(A), \		-(__v4sf)(__m128)(A), \
-(__v4sf)(__m128)(B), (__mmask8)(U), \		-(__v4sf)(__m128)(B), (__mmask8)(U), \
(int)(R))		(int)(R))

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_maskz_fnmsub_ss (__mmask8 __U, __m128 __A, __m128 __B, __m128 __C)		_mm_maskz_fnmsub_ss (__mmask8 __U, __m128 __A, __m128 __B, __m128 __C)
{		{
__m128 __Z = __builtin_ia32_vfmaddss3((__v4sf) __A,		__m128 __Z = __builtin_ia32_vfmaddss3((__v4sf) __A,
-(__v4sf) __B,		-(__v4sf) __B,
-(__v4sf) __C);		-(__v4sf) __C);
__A[0] = (__U & 1) ? __Z[0] : 0;		__A[0] = (__U & 1) ? __Z[0] : 0;
return __A;		return __A;
}		}

#define _mm_maskz_fnmsub_round_ss(U, A, B, C, R) \		#define _mm_maskz_fnmsub_round_ss(U, A, B, C, R) \
(__m128)__builtin_ia32_vfmaddss3_maskz((__v4sf)(__m128)(A), \		(__m128)__builtin_ia32_vfmaddss3_maskz((__v4sf)(__m128)(A), \
-(__v4sf)(__m128)(B), \		-(__v4sf)(__m128)(B), \
-(__v4sf)(__m128)(C), (__mmask8)(U), \		-(__v4sf)(__m128)(C), (__mmask8)(U), \
_MM_FROUND_CUR_DIRECTION)		_MM_FROUND_CUR_DIRECTION)

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_mask3_fnmsub_ss (__m128 __W, __m128 __X, __m128 __Y, __mmask8 __U)		_mm_mask3_fnmsub_ss (__m128 __W, __m128 __X, __m128 __Y, __mmask8 __U)
{		{
__m128 __Z = __builtin_ia32_vfmaddss3((__v4sf) __W,		__m128 __Z = __builtin_ia32_vfmaddss3((__v4sf) __W,
-(__v4sf) __X,		-(__v4sf) __X,
-(__v4sf) __Y);		-(__v4sf) __Y);
__Y[0] = (__U & 1) ? __Z[0] : __Y[0];		__Y[0] = (__U & 1) ? __Z[0] : __Y[0];
return __Y;		return __Y;
}		}

#define _mm_mask3_fnmsub_round_ss(W, X, Y, U, R) \		#define _mm_mask3_fnmsub_round_ss(W, X, Y, U, R) \
(__m128)__builtin_ia32_vfmsubss3_mask3((__v4sf)(__m128)(W), \		(__m128)__builtin_ia32_vfmsubss3_mask3((__v4sf)(__m128)(W), \
-(__v4sf)(__m128)(X), \		-(__v4sf)(__m128)(X), \
(__v4sf)(__m128)(Y), (__mmask8)(U), \		(__v4sf)(__m128)(Y), (__mmask8)(U), \
(int)(R))		(int)(R))

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_mask_fmadd_sd (__m128d __W, __mmask8 __U, __m128d __A, __m128d __B)		_mm_mask_fmadd_sd (__m128d __W, __mmask8 __U, __m128d __A, __m128d __B)
{		{
__m128d __Z = __builtin_ia32_vfmaddsd3((__v2df) __W,		__m128d __Z = __builtin_ia32_vfmaddsd3((__v2df) __W,
(__v2df) __A,		(__v2df) __A,
(__v2df) __B);		(__v2df) __B);
__W[0] = (__U & 1) ? __Z[0] : __W[0];		__W[0] = (__U & 1) ? __Z[0] : __W[0];
return __W;		return __W;
}		}

#define _mm_mask_fmadd_round_sd(W, U, A, B, R) \		#define _mm_mask_fmadd_round_sd(W, U, A, B, R) \
(__m128d)__builtin_ia32_vfmaddsd3_mask((__v2df)(__m128d)(W), \		(__m128d)__builtin_ia32_vfmaddsd3_mask((__v2df)(__m128d)(W), \
(__v2df)(__m128d)(A), \		(__v2df)(__m128d)(A), \
(__v2df)(__m128d)(B), (__mmask8)(U), \		(__v2df)(__m128d)(B), (__mmask8)(U), \
(int)(R))		(int)(R))

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_maskz_fmadd_sd (__mmask8 __U, __m128d __A, __m128d __B, __m128d __C)		_mm_maskz_fmadd_sd (__mmask8 __U, __m128d __A, __m128d __B, __m128d __C)
{		{
__m128d __Z = __builtin_ia32_vfmaddsd3((__v2df) __A,		__m128d __Z = __builtin_ia32_vfmaddsd3((__v2df) __A,
(__v2df) __B,		(__v2df) __B,
(__v2df) __C);		(__v2df) __C);
__A[0] = (__U & 1) ? __Z[0] : 0;		__A[0] = (__U & 1) ? __Z[0] : 0;
return __A;		return __A;
}		}

#define _mm_maskz_fmadd_round_sd(U, A, B, C, R) \		#define _mm_maskz_fmadd_round_sd(U, A, B, C, R) \
(__m128d)__builtin_ia32_vfmaddsd3_maskz((__v2df)(__m128d)(A), \		(__m128d)__builtin_ia32_vfmaddsd3_maskz((__v2df)(__m128d)(A), \
(__v2df)(__m128d)(B), \		(__v2df)(__m128d)(B), \
(__v2df)(__m128d)(C), (__mmask8)(U), \		(__v2df)(__m128d)(C), (__mmask8)(U), \
_MM_FROUND_CUR_DIRECTION)		_MM_FROUND_CUR_DIRECTION)

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_mask3_fmadd_sd (__m128d __W, __m128d __X, __m128d __Y, __mmask8 __U)		_mm_mask3_fmadd_sd (__m128d __W, __m128d __X, __m128d __Y, __mmask8 __U)
{		{
__m128d __Z = __builtin_ia32_vfmaddsd3((__v2df) __W,		__m128d __Z = __builtin_ia32_vfmaddsd3((__v2df) __W,
(__v2df) __X,		(__v2df) __X,
(__v2df) __Y);		(__v2df) __Y);
__Y[0] = (__U & 1) ? __Z[0] : __Y[0];		__Y[0] = (__U & 1) ? __Z[0] : __Y[0];
return __Y;		return __Y;
}		}

#define _mm_mask3_fmadd_round_sd(W, X, Y, U, R) \		#define _mm_mask3_fmadd_round_sd(W, X, Y, U, R) \
(__m128d)__builtin_ia32_vfmaddsd3_mask3((__v2df)(__m128d)(W), \		(__m128d)__builtin_ia32_vfmaddsd3_mask3((__v2df)(__m128d)(W), \
(__v2df)(__m128d)(X), \		(__v2df)(__m128d)(X), \
(__v2df)(__m128d)(Y), (__mmask8)(U), \		(__v2df)(__m128d)(Y), (__mmask8)(U), \
(int)(R))		(int)(R))

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_mask_fmsub_sd (__m128d __W, __mmask8 __U, __m128d __A, __m128d __B)		_mm_mask_fmsub_sd (__m128d __W, __mmask8 __U, __m128d __A, __m128d __B)
{		{
__m128d __Z = __builtin_ia32_vfmaddsd3((__v2df) __W,		__m128d __Z = __builtin_ia32_vfmaddsd3((__v2df) __W,
(__v2df) __A,		(__v2df) __A,
-(__v2df) __B);		-(__v2df) __B);
__W[0] = (__U & 1) ? __Z[0] : __W[0];		__W[0] = (__U & 1) ? __Z[0] : __W[0];
return __W;		return __W;
}		}

#define _mm_mask_fmsub_round_sd(W, U, A, B, R) \		#define _mm_mask_fmsub_round_sd(W, U, A, B, R) \
(__m128d)__builtin_ia32_vfmaddsd3_mask((__v2df)(__m128d)(W), \		(__m128d)__builtin_ia32_vfmaddsd3_mask((__v2df)(__m128d)(W), \
(__v2df)(__m128d)(A), \		(__v2df)(__m128d)(A), \
-(__v2df)(__m128d)(B), (__mmask8)(U), \		-(__v2df)(__m128d)(B), (__mmask8)(U), \
(int)(R))		(int)(R))

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_maskz_fmsub_sd (__mmask8 __U, __m128d __A, __m128d __B, __m128d __C)		_mm_maskz_fmsub_sd (__mmask8 __U, __m128d __A, __m128d __B, __m128d __C)
{		{
__m128d __Z = __builtin_ia32_vfmaddsd3((__v2df) __A,		__m128d __Z = __builtin_ia32_vfmaddsd3((__v2df) __A,
(__v2df) __B,		(__v2df) __B,
-(__v2df) __C);		-(__v2df) __C);
__A[0] = (__U & 1) ? __Z[0] : 0;		__A[0] = (__U & 1) ? __Z[0] : 0;
return __A;		return __A;
}		}

#define _mm_maskz_fmsub_round_sd(U, A, B, C, R) \		#define _mm_maskz_fmsub_round_sd(U, A, B, C, R) \
(__m128d)__builtin_ia32_vfmaddsd3_maskz((__v2df)(__m128d)(A), \		(__m128d)__builtin_ia32_vfmaddsd3_maskz((__v2df)(__m128d)(A), \
(__v2df)(__m128d)(B), \		(__v2df)(__m128d)(B), \
-(__v2df)(__m128d)(C), \		-(__v2df)(__m128d)(C), \
(__mmask8)(U), (int)(R))		(__mmask8)(U), (int)(R))

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_mask3_fmsub_sd (__m128d __W, __m128d __X, __m128d __Y, __mmask8 __U)		_mm_mask3_fmsub_sd (__m128d __W, __m128d __X, __m128d __Y, __mmask8 __U)
{		{
__m128d __Z = __builtin_ia32_vfmaddsd3((__v2df) __W,		__m128d __Z = __builtin_ia32_vfmaddsd3((__v2df) __W,
(__v2df) __X,		(__v2df) __X,
-(__v2df) __Y);		-(__v2df) __Y);
__Y[0] = (__U & 1) ? __Z[0] : __Y[0];		__Y[0] = (__U & 1) ? __Z[0] : __Y[0];
return __Y;		return __Y;
}		}

#define _mm_mask3_fmsub_round_sd(W, X, Y, U, R) \		#define _mm_mask3_fmsub_round_sd(W, X, Y, U, R) \
(__m128d)__builtin_ia32_vfmsubsd3_mask3((__v2df)(__m128d)(W), \		(__m128d)__builtin_ia32_vfmsubsd3_mask3((__v2df)(__m128d)(W), \
(__v2df)(__m128d)(X), \		(__v2df)(__m128d)(X), \
(__v2df)(__m128d)(Y), \		(__v2df)(__m128d)(Y), \
(__mmask8)(U), (int)(R))		(__mmask8)(U), (int)(R))

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_mask_fnmadd_sd (__m128d __W, __mmask8 __U, __m128d __A, __m128d __B)		_mm_mask_fnmadd_sd (__m128d __W, __mmask8 __U, __m128d __A, __m128d __B)
{		{
__m128d __Z = __builtin_ia32_vfmaddsd3((__v2df) __W,		__m128d __Z = __builtin_ia32_vfmaddsd3((__v2df) __W,
-(__v2df) __A,		-(__v2df) __A,
(__v2df) __B);		(__v2df) __B);
__W[0] = (__U & 1) ? __Z[0] : __W[0];		__W[0] = (__U & 1) ? __Z[0] : __W[0];
return __W;		return __W;
}		}

#define _mm_mask_fnmadd_round_sd(W, U, A, B, R) \		#define _mm_mask_fnmadd_round_sd(W, U, A, B, R) \
(__m128d)__builtin_ia32_vfmaddsd3_mask((__v2df)(__m128d)(W), \		(__m128d)__builtin_ia32_vfmaddsd3_mask((__v2df)(__m128d)(W), \
-(__v2df)(__m128d)(A), \		-(__v2df)(__m128d)(A), \
(__v2df)(__m128d)(B), (__mmask8)(U), \		(__v2df)(__m128d)(B), (__mmask8)(U), \
(int)(R))		(int)(R))

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_maskz_fnmadd_sd (__mmask8 __U, __m128d __A, __m128d __B, __m128d __C)		_mm_maskz_fnmadd_sd (__mmask8 __U, __m128d __A, __m128d __B, __m128d __C)
{		{
__m128d __Z = __builtin_ia32_vfmaddsd3((__v2df) __A,		__m128d __Z = __builtin_ia32_vfmaddsd3((__v2df) __A,
-(__v2df) __B,		-(__v2df) __B,
(__v2df) __C);		(__v2df) __C);
__A[0] = (__U & 1) ? __Z[0] : 0;		__A[0] = (__U & 1) ? __Z[0] : 0;
return __A;		return __A;
}		}

#define _mm_maskz_fnmadd_round_sd(U, A, B, C, R) \		#define _mm_maskz_fnmadd_round_sd(U, A, B, C, R) \
(__m128d)__builtin_ia32_vfmaddsd3_maskz((__v2df)(__m128d)(A), \		(__m128d)__builtin_ia32_vfmaddsd3_maskz((__v2df)(__m128d)(A), \
-(__v2df)(__m128d)(B), \		-(__v2df)(__m128d)(B), \
(__v2df)(__m128d)(C), (__mmask8)(U), \		(__v2df)(__m128d)(C), (__mmask8)(U), \
(int)(R))		(int)(R))

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_mask3_fnmadd_sd (__m128d __W, __m128d __X, __m128d __Y, __mmask8 __U)		_mm_mask3_fnmadd_sd (__m128d __W, __m128d __X, __m128d __Y, __mmask8 __U)
{		{
__m128d __Z = __builtin_ia32_vfmaddsd3((__v2df) __W,		__m128d __Z = __builtin_ia32_vfmaddsd3((__v2df) __W,
-(__v2df) __X,		-(__v2df) __X,
(__v2df) __Y);		(__v2df) __Y);
__Y[0] = (__U & 1) ? __Z[0] : __Y[0];		__Y[0] = (__U & 1) ? __Z[0] : __Y[0];
return __Y;		return __Y;
}		}

#define _mm_mask3_fnmadd_round_sd(W, X, Y, U, R) \		#define _mm_mask3_fnmadd_round_sd(W, X, Y, U, R) \
(__m128d)__builtin_ia32_vfmaddsd3_mask3((__v2df)(__m128d)(W), \		(__m128d)__builtin_ia32_vfmaddsd3_mask3((__v2df)(__m128d)(W), \
-(__v2df)(__m128d)(X), \		-(__v2df)(__m128d)(X), \
(__v2df)(__m128d)(Y), (__mmask8)(U), \		(__v2df)(__m128d)(Y), (__mmask8)(U), \
(int)(R))		(int)(R))

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_mask_fnmsub_sd (__m128d __W, __mmask8 __U, __m128d __A, __m128d __B)		_mm_mask_fnmsub_sd (__m128d __W, __mmask8 __U, __m128d __A, __m128d __B)
{		{
__m128d __Z = __builtin_ia32_vfmaddsd3((__v2df) __W,		__m128d __Z = __builtin_ia32_vfmaddsd3((__v2df) __W,
-(__v2df) __A,		-(__v2df) __A,
-(__v2df) __B);		-(__v2df) __B);
__W[0] = (__U & 1) ? __Z[0] : __W[0];		__W[0] = (__U & 1) ? __Z[0] : __W[0];
return __W;		return __W;
}		}

#define _mm_mask_fnmsub_round_sd(W, U, A, B, R) \		#define _mm_mask_fnmsub_round_sd(W, U, A, B, R) \
(__m128d)__builtin_ia32_vfmaddsd3_mask((__v2df)(__m128d)(W), \		(__m128d)__builtin_ia32_vfmaddsd3_mask((__v2df)(__m128d)(W), \
-(__v2df)(__m128d)(A), \		-(__v2df)(__m128d)(A), \
-(__v2df)(__m128d)(B), (__mmask8)(U), \		-(__v2df)(__m128d)(B), (__mmask8)(U), \
(int)(R))		(int)(R))

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_maskz_fnmsub_sd (__mmask8 __U, __m128d __A, __m128d __B, __m128d __C)		_mm_maskz_fnmsub_sd (__mmask8 __U, __m128d __A, __m128d __B, __m128d __C)
{		{
__m128d __Z = __builtin_ia32_vfmaddsd3((__v2df) __A,		__m128d __Z = __builtin_ia32_vfmaddsd3((__v2df) __A,
-(__v2df) __B,		-(__v2df) __B,
-(__v2df) __C);		-(__v2df) __C);
__A[0] = (__U & 1) ? __Z[0] : 0;		__A[0] = (__U & 1) ? __Z[0] : 0;
return __A;		return __A;
}		}

#define _mm_maskz_fnmsub_round_sd(U, A, B, C, R) \		#define _mm_maskz_fnmsub_round_sd(U, A, B, C, R) \
(__m128d)__builtin_ia32_vfmaddsd3_maskz((__v2df)(__m128d)(A), \		(__m128d)__builtin_ia32_vfmaddsd3_maskz((__v2df)(__m128d)(A), \
-(__v2df)(__m128d)(B), \		-(__v2df)(__m128d)(B), \
-(__v2df)(__m128d)(C), \		-(__v2df)(__m128d)(C), \
(__mmask8)(U), \		(__mmask8)(U), \
_MM_FROUND_CUR_DIRECTION)		_MM_FROUND_CUR_DIRECTION)

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_mask3_fnmsub_sd (__m128d __W, __m128d __X, __m128d __Y, __mmask8 __U)		_mm_mask3_fnmsub_sd (__m128d __W, __m128d __X, __m128d __Y, __mmask8 __U)
{		{
__m128d __Z = __builtin_ia32_vfmaddsd3((__v2df) __W,		__m128d __Z = __builtin_ia32_vfmaddsd3((__v2df) __W,
-(__v2df) __X,		-(__v2df) __X,
-(__v2df) __Y);		-(__v2df) __Y);
__Y[0] = (__U & 1) ? __Z[0] : __Y[0];		__Y[0] = (__U & 1) ? __Z[0] : __Y[0];
return __Y;		return __Y;
}		}
Show All 25 Lines	(__m512i)__builtin_ia32_selectq_512((__mmask8)(U), \
(__v8di)_mm512_permutex_epi64((X), (C)), \		(__v8di)_mm512_permutex_epi64((X), (C)), \
(__v8di)(__m512i)(W))		(__v8di)(__m512i)(W))

#define _mm512_maskz_permutex_epi64(U, X, C) \		#define _mm512_maskz_permutex_epi64(U, X, C) \
(__m512i)__builtin_ia32_selectq_512((__mmask8)(U), \		(__m512i)__builtin_ia32_selectq_512((__mmask8)(U), \
(__v8di)_mm512_permutex_epi64((X), (C)), \		(__v8di)_mm512_permutex_epi64((X), (C)), \
(__v8di)_mm512_setzero_si512())		(__v8di)_mm512_setzero_si512())

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_permutexvar_pd (__m512i __X, __m512d __Y)		_mm512_permutexvar_pd (__m512i __X, __m512d __Y)
{		{
return (__m512d)__builtin_ia32_permvardf512((__v8df) __Y, (__v8di) __X);		return (__m512d)__builtin_ia32_permvardf512((__v8df) __Y, (__v8di) __X);
}		}

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_mask_permutexvar_pd (__m512d __W, __mmask8 __U, __m512i __X, __m512d __Y)		_mm512_mask_permutexvar_pd (__m512d __W, __mmask8 __U, __m512i __X, __m512d __Y)
{		{
return (__m512d)__builtin_ia32_selectpd_512((__mmask8)__U,		return (__m512d)__builtin_ia32_selectpd_512((__mmask8)__U,
(__v8df)_mm512_permutexvar_pd(__X, __Y),		(__v8df)_mm512_permutexvar_pd(__X, __Y),
(__v8df)__W);		(__v8df)__W);
}		}

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_maskz_permutexvar_pd (__mmask8 __U, __m512i __X, __m512d __Y)		_mm512_maskz_permutexvar_pd (__mmask8 __U, __m512i __X, __m512d __Y)
{		{
return (__m512d)__builtin_ia32_selectpd_512((__mmask8)__U,		return (__m512d)__builtin_ia32_selectpd_512((__mmask8)__U,
(__v8df)_mm512_permutexvar_pd(__X, __Y),		(__v8df)_mm512_permutexvar_pd(__X, __Y),
(__v8df)_mm512_setzero_pd());		(__v8df)_mm512_setzero_pd());
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_permutexvar_epi64 (__m512i __X, __m512i __Y)		_mm512_permutexvar_epi64 (__m512i __X, __m512i __Y)
{		{
return (__m512i)__builtin_ia32_permvardi512((__v8di)__Y, (__v8di)__X);		return (__m512i)__builtin_ia32_permvardi512((__v8di)__Y, (__v8di)__X);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_permutexvar_epi64 (__mmask8 __M, __m512i __X, __m512i __Y)		_mm512_maskz_permutexvar_epi64 (__mmask8 __M, __m512i __X, __m512i __Y)
{		{
return (__m512i)__builtin_ia32_selectq_512((__mmask8)__M,		return (__m512i)__builtin_ia32_selectq_512((__mmask8)__M,
(__v8di)_mm512_permutexvar_epi64(__X, __Y),		(__v8di)_mm512_permutexvar_epi64(__X, __Y),
(__v8di)_mm512_setzero_si512());		(__v8di)_mm512_setzero_si512());
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_permutexvar_epi64 (__m512i __W, __mmask8 __M, __m512i __X,		_mm512_mask_permutexvar_epi64 (__m512i __W, __mmask8 __M, __m512i __X,
__m512i __Y)		__m512i __Y)
{		{
return (__m512i)__builtin_ia32_selectq_512((__mmask8)__M,		return (__m512i)__builtin_ia32_selectq_512((__mmask8)__M,
(__v8di)_mm512_permutexvar_epi64(__X, __Y),		(__v8di)_mm512_permutexvar_epi64(__X, __Y),
(__v8di)__W);		(__v8di)__W);
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_permutexvar_ps (__m512i __X, __m512 __Y)		_mm512_permutexvar_ps (__m512i __X, __m512 __Y)
{		{
return (__m512)__builtin_ia32_permvarsf512((__v16sf)__Y, (__v16si)__X);		return (__m512)__builtin_ia32_permvarsf512((__v16sf)__Y, (__v16si)__X);
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_mask_permutexvar_ps (__m512 __W, __mmask16 __U, __m512i __X, __m512 __Y)		_mm512_mask_permutexvar_ps (__m512 __W, __mmask16 __U, __m512i __X, __m512 __Y)
{		{
return (__m512)__builtin_ia32_selectps_512((__mmask16)__U,		return (__m512)__builtin_ia32_selectps_512((__mmask16)__U,
(__v16sf)_mm512_permutexvar_ps(__X, __Y),		(__v16sf)_mm512_permutexvar_ps(__X, __Y),
(__v16sf)__W);		(__v16sf)__W);
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_maskz_permutexvar_ps (__mmask16 __U, __m512i __X, __m512 __Y)		_mm512_maskz_permutexvar_ps (__mmask16 __U, __m512i __X, __m512 __Y)
{		{
return (__m512)__builtin_ia32_selectps_512((__mmask16)__U,		return (__m512)__builtin_ia32_selectps_512((__mmask16)__U,
(__v16sf)_mm512_permutexvar_ps(__X, __Y),		(__v16sf)_mm512_permutexvar_ps(__X, __Y),
(__v16sf)_mm512_setzero_ps());		(__v16sf)_mm512_setzero_ps());
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_permutexvar_epi32 (__m512i __X, __m512i __Y)		_mm512_permutexvar_epi32 (__m512i __X, __m512i __Y)
{		{
return (__m512i)__builtin_ia32_permvarsi512((__v16si)__Y, (__v16si)__X);		return (__m512i)__builtin_ia32_permvarsi512((__v16si)__Y, (__v16si)__X);
}		}

#define _mm512_permutevar_epi32 _mm512_permutexvar_epi32		#define _mm512_permutevar_epi32 _mm512_permutexvar_epi32

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_permutexvar_epi32 (__mmask16 __M, __m512i __X, __m512i __Y)		_mm512_maskz_permutexvar_epi32 (__mmask16 __M, __m512i __X, __m512i __Y)
{		{
return (__m512i)__builtin_ia32_selectd_512((__mmask16)__M,		return (__m512i)__builtin_ia32_selectd_512((__mmask16)__M,
(__v16si)_mm512_permutexvar_epi32(__X, __Y),		(__v16si)_mm512_permutexvar_epi32(__X, __Y),
(__v16si)_mm512_setzero_si512());		(__v16si)_mm512_setzero_si512());
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_permutexvar_epi32 (__m512i __W, __mmask16 __M, __m512i __X,		_mm512_mask_permutexvar_epi32 (__m512i __W, __mmask16 __M, __m512i __X,
__m512i __Y)		__m512i __Y)
{		{
return (__m512i)__builtin_ia32_selectd_512((__mmask16)__M,		return (__m512i)__builtin_ia32_selectd_512((__mmask16)__M,
(__v16si)_mm512_permutexvar_epi32(__X, __Y),		(__v16si)_mm512_permutexvar_epi32(__X, __Y),
(__v16si)__W);		(__v16si)__W);
}		}

#define _mm512_mask_permutevar_epi32 _mm512_mask_permutexvar_epi32		#define _mm512_mask_permutevar_epi32 _mm512_mask_permutexvar_epi32

static __inline__ __mmask16 __DEFAULT_FN_ATTRS		static __inline__ __mmask16 __DEFAULT_FN_ATTRS512
_mm512_kand (__mmask16 __A, __mmask16 __B)		_mm512_kand (__mmask16 __A, __mmask16 __B)
{		{
return (__mmask16) __builtin_ia32_kandhi ((__mmask16) __A, (__mmask16) __B);		return (__mmask16) __builtin_ia32_kandhi ((__mmask16) __A, (__mmask16) __B);
}		}

static __inline__ __mmask16 __DEFAULT_FN_ATTRS		static __inline__ __mmask16 __DEFAULT_FN_ATTRS512
_mm512_kandn (__mmask16 __A, __mmask16 __B)		_mm512_kandn (__mmask16 __A, __mmask16 __B)
{		{
return (__mmask16) __builtin_ia32_kandnhi ((__mmask16) __A, (__mmask16) __B);		return (__mmask16) __builtin_ia32_kandnhi ((__mmask16) __A, (__mmask16) __B);
}		}

static __inline__ __mmask16 __DEFAULT_FN_ATTRS		static __inline__ __mmask16 __DEFAULT_FN_ATTRS512
_mm512_kor (__mmask16 __A, __mmask16 __B)		_mm512_kor (__mmask16 __A, __mmask16 __B)
{		{
return (__mmask16) __builtin_ia32_korhi ((__mmask16) __A, (__mmask16) __B);		return (__mmask16) __builtin_ia32_korhi ((__mmask16) __A, (__mmask16) __B);
}		}

static __inline__ int __DEFAULT_FN_ATTRS		static __inline__ int __DEFAULT_FN_ATTRS512
_mm512_kortestc (__mmask16 __A, __mmask16 __B)		_mm512_kortestc (__mmask16 __A, __mmask16 __B)
{		{
return __builtin_ia32_kortestchi ((__mmask16) __A, (__mmask16) __B);		return __builtin_ia32_kortestchi ((__mmask16) __A, (__mmask16) __B);
}		}

static __inline__ int __DEFAULT_FN_ATTRS		static __inline__ int __DEFAULT_FN_ATTRS512
_mm512_kortestz (__mmask16 __A, __mmask16 __B)		_mm512_kortestz (__mmask16 __A, __mmask16 __B)
{		{
return __builtin_ia32_kortestzhi ((__mmask16) __A, (__mmask16) __B);		return __builtin_ia32_kortestzhi ((__mmask16) __A, (__mmask16) __B);
}		}

static __inline__ __mmask16 __DEFAULT_FN_ATTRS		static __inline__ __mmask16 __DEFAULT_FN_ATTRS512
_mm512_kunpackb (__mmask16 __A, __mmask16 __B)		_mm512_kunpackb (__mmask16 __A, __mmask16 __B)
{		{
return (__mmask16) __builtin_ia32_kunpckhi ((__mmask16) __A, (__mmask16) __B);		return (__mmask16) __builtin_ia32_kunpckhi ((__mmask16) __A, (__mmask16) __B);
}		}

static __inline__ __mmask16 __DEFAULT_FN_ATTRS		static __inline__ __mmask16 __DEFAULT_FN_ATTRS512
_mm512_kxnor (__mmask16 __A, __mmask16 __B)		_mm512_kxnor (__mmask16 __A, __mmask16 __B)
{		{
return (__mmask16) __builtin_ia32_kxnorhi ((__mmask16) __A, (__mmask16) __B);		return (__mmask16) __builtin_ia32_kxnorhi ((__mmask16) __A, (__mmask16) __B);
}		}

static __inline__ __mmask16 __DEFAULT_FN_ATTRS		static __inline__ __mmask16 __DEFAULT_FN_ATTRS512
_mm512_kxor (__mmask16 __A, __mmask16 __B)		_mm512_kxor (__mmask16 __A, __mmask16 __B)
{		{
return (__mmask16) __builtin_ia32_kxorhi ((__mmask16) __A, (__mmask16) __B);		return (__mmask16) __builtin_ia32_kxorhi ((__mmask16) __A, (__mmask16) __B);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS512
_mm512_stream_si512 (__m512i * __P, __m512i __A)		_mm512_stream_si512 (__m512i * __P, __m512i __A)
{		{
typedef __v8di __v8di_aligned __attribute__((aligned(64)));		typedef __v8di __v8di_aligned __attribute__((aligned(64)));
__builtin_nontemporal_store((__v8di_aligned)__A, (__v8di_aligned*)__P);		__builtin_nontemporal_store((__v8di_aligned)__A, (__v8di_aligned*)__P);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_stream_load_si512 (void const *__P)		_mm512_stream_load_si512 (void const *__P)
{		{
typedef __v8di __v8di_aligned __attribute__((aligned(64)));		typedef __v8di __v8di_aligned __attribute__((aligned(64)));
return (__m512i) __builtin_nontemporal_load((const __v8di_aligned *)__P);		return (__m512i) __builtin_nontemporal_load((const __v8di_aligned *)__P);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS512
_mm512_stream_pd (double *__P, __m512d __A)		_mm512_stream_pd (double *__P, __m512d __A)
{		{
typedef __v8df __v8df_aligned __attribute__((aligned(64)));		typedef __v8df __v8df_aligned __attribute__((aligned(64)));
__builtin_nontemporal_store((__v8df_aligned)__A, (__v8df_aligned*)__P);		__builtin_nontemporal_store((__v8df_aligned)__A, (__v8df_aligned*)__P);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS512
_mm512_stream_ps (float *__P, __m512 __A)		_mm512_stream_ps (float *__P, __m512 __A)
{		{
typedef __v16sf __v16sf_aligned __attribute__((aligned(64)));		typedef __v16sf __v16sf_aligned __attribute__((aligned(64)));
__builtin_nontemporal_store((__v16sf_aligned)__A, (__v16sf_aligned*)__P);		__builtin_nontemporal_store((__v16sf_aligned)__A, (__v16sf_aligned*)__P);
}		}

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_mask_compress_pd (__m512d __W, __mmask8 __U, __m512d __A)		_mm512_mask_compress_pd (__m512d __W, __mmask8 __U, __m512d __A)
{		{
return (__m512d) __builtin_ia32_compressdf512_mask ((__v8df) __A,		return (__m512d) __builtin_ia32_compressdf512_mask ((__v8df) __A,
(__v8df) __W,		(__v8df) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_maskz_compress_pd (__mmask8 __U, __m512d __A)		_mm512_maskz_compress_pd (__mmask8 __U, __m512d __A)
{		{
return (__m512d) __builtin_ia32_compressdf512_mask ((__v8df) __A,		return (__m512d) __builtin_ia32_compressdf512_mask ((__v8df) __A,
(__v8df)		(__v8df)
_mm512_setzero_pd (),		_mm512_setzero_pd (),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_compress_epi64 (__m512i __W, __mmask8 __U, __m512i __A)		_mm512_mask_compress_epi64 (__m512i __W, __mmask8 __U, __m512i __A)
{		{
return (__m512i) __builtin_ia32_compressdi512_mask ((__v8di) __A,		return (__m512i) __builtin_ia32_compressdi512_mask ((__v8di) __A,
(__v8di) __W,		(__v8di) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_compress_epi64 (__mmask8 __U, __m512i __A)		_mm512_maskz_compress_epi64 (__mmask8 __U, __m512i __A)
{		{
return (__m512i) __builtin_ia32_compressdi512_mask ((__v8di) __A,		return (__m512i) __builtin_ia32_compressdi512_mask ((__v8di) __A,
(__v8di)		(__v8di)
_mm512_setzero_si512 (),		_mm512_setzero_si512 (),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_mask_compress_ps (__m512 __W, __mmask16 __U, __m512 __A)		_mm512_mask_compress_ps (__m512 __W, __mmask16 __U, __m512 __A)
{		{
return (__m512) __builtin_ia32_compresssf512_mask ((__v16sf) __A,		return (__m512) __builtin_ia32_compresssf512_mask ((__v16sf) __A,
(__v16sf) __W,		(__v16sf) __W,
(__mmask16) __U);		(__mmask16) __U);
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_maskz_compress_ps (__mmask16 __U, __m512 __A)		_mm512_maskz_compress_ps (__mmask16 __U, __m512 __A)
{		{
return (__m512) __builtin_ia32_compresssf512_mask ((__v16sf) __A,		return (__m512) __builtin_ia32_compresssf512_mask ((__v16sf) __A,
(__v16sf)		(__v16sf)
_mm512_setzero_ps (),		_mm512_setzero_ps (),
(__mmask16) __U);		(__mmask16) __U);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_compress_epi32 (__m512i __W, __mmask16 __U, __m512i __A)		_mm512_mask_compress_epi32 (__m512i __W, __mmask16 __U, __m512i __A)
{		{
return (__m512i) __builtin_ia32_compresssi512_mask ((__v16si) __A,		return (__m512i) __builtin_ia32_compresssi512_mask ((__v16si) __A,
(__v16si) __W,		(__v16si) __W,
(__mmask16) __U);		(__mmask16) __U);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_compress_epi32 (__mmask16 __U, __m512i __A)		_mm512_maskz_compress_epi32 (__mmask16 __U, __m512i __A)
{		{
return (__m512i) __builtin_ia32_compresssi512_mask ((__v16si) __A,		return (__m512i) __builtin_ia32_compresssi512_mask ((__v16si) __A,
(__v16si)		(__v16si)
_mm512_setzero_si512 (),		_mm512_setzero_si512 (),
(__mmask16) __U);		(__mmask16) __U);
}		}

Show All 38 Lines
#define _mm_mask_cmp_sd_mask(M, X, Y, P) \		#define _mm_mask_cmp_sd_mask(M, X, Y, P) \
(__mmask8)__builtin_ia32_cmpsd_mask((__v2df)(__m128d)(X), \		(__mmask8)__builtin_ia32_cmpsd_mask((__v2df)(__m128d)(X), \
(__v2df)(__m128d)(Y), (int)(P), \		(__v2df)(__m128d)(Y), (int)(P), \
(__mmask8)(M), \		(__mmask8)(M), \
_MM_FROUND_CUR_DIRECTION)		_MM_FROUND_CUR_DIRECTION)

/* Bit Test */		/* Bit Test */

static __inline __mmask16 __DEFAULT_FN_ATTRS		static __inline __mmask16 __DEFAULT_FN_ATTRS512
_mm512_test_epi32_mask (__m512i __A, __m512i __B)		_mm512_test_epi32_mask (__m512i __A, __m512i __B)
{		{
return _mm512_cmpneq_epi32_mask (_mm512_and_epi32(__A, __B),		return _mm512_cmpneq_epi32_mask (_mm512_and_epi32(__A, __B),
_mm512_setzero_si512());		_mm512_setzero_si512());
}		}

static __inline__ __mmask16 __DEFAULT_FN_ATTRS		static __inline__ __mmask16 __DEFAULT_FN_ATTRS512
_mm512_mask_test_epi32_mask (__mmask16 __U, __m512i __A, __m512i __B)		_mm512_mask_test_epi32_mask (__mmask16 __U, __m512i __A, __m512i __B)
{		{
return _mm512_mask_cmpneq_epi32_mask (__U, _mm512_and_epi32 (__A, __B),		return _mm512_mask_cmpneq_epi32_mask (__U, _mm512_and_epi32 (__A, __B),
_mm512_setzero_si512());		_mm512_setzero_si512());
}		}

static __inline __mmask8 __DEFAULT_FN_ATTRS		static __inline __mmask8 __DEFAULT_FN_ATTRS512
_mm512_test_epi64_mask (__m512i __A, __m512i __B)		_mm512_test_epi64_mask (__m512i __A, __m512i __B)
{		{
return _mm512_cmpneq_epi64_mask (_mm512_and_epi32 (__A, __B),		return _mm512_cmpneq_epi64_mask (_mm512_and_epi32 (__A, __B),
_mm512_setzero_si512());		_mm512_setzero_si512());
}		}

static __inline__ __mmask8 __DEFAULT_FN_ATTRS		static __inline__ __mmask8 __DEFAULT_FN_ATTRS512
_mm512_mask_test_epi64_mask (__mmask8 __U, __m512i __A, __m512i __B)		_mm512_mask_test_epi64_mask (__mmask8 __U, __m512i __A, __m512i __B)
{		{
return _mm512_mask_cmpneq_epi64_mask (__U, _mm512_and_epi32 (__A, __B),		return _mm512_mask_cmpneq_epi64_mask (__U, _mm512_and_epi32 (__A, __B),
_mm512_setzero_si512());		_mm512_setzero_si512());
}		}

static __inline__ __mmask16 __DEFAULT_FN_ATTRS		static __inline__ __mmask16 __DEFAULT_FN_ATTRS512
_mm512_testn_epi32_mask (__m512i __A, __m512i __B)		_mm512_testn_epi32_mask (__m512i __A, __m512i __B)
{		{
return _mm512_cmpeq_epi32_mask (_mm512_and_epi32 (__A, __B),		return _mm512_cmpeq_epi32_mask (_mm512_and_epi32 (__A, __B),
_mm512_setzero_si512());		_mm512_setzero_si512());
}		}

static __inline__ __mmask16 __DEFAULT_FN_ATTRS		static __inline__ __mmask16 __DEFAULT_FN_ATTRS512
_mm512_mask_testn_epi32_mask (__mmask16 __U, __m512i __A, __m512i __B)		_mm512_mask_testn_epi32_mask (__mmask16 __U, __m512i __A, __m512i __B)
{		{
return _mm512_mask_cmpeq_epi32_mask (__U, _mm512_and_epi32 (__A, __B),		return _mm512_mask_cmpeq_epi32_mask (__U, _mm512_and_epi32 (__A, __B),
_mm512_setzero_si512());		_mm512_setzero_si512());
}		}

static __inline__ __mmask8 __DEFAULT_FN_ATTRS		static __inline__ __mmask8 __DEFAULT_FN_ATTRS512
_mm512_testn_epi64_mask (__m512i __A, __m512i __B)		_mm512_testn_epi64_mask (__m512i __A, __m512i __B)
{		{
return _mm512_cmpeq_epi64_mask (_mm512_and_epi32 (__A, __B),		return _mm512_cmpeq_epi64_mask (_mm512_and_epi32 (__A, __B),
_mm512_setzero_si512());		_mm512_setzero_si512());
}		}

static __inline__ __mmask8 __DEFAULT_FN_ATTRS		static __inline__ __mmask8 __DEFAULT_FN_ATTRS512
_mm512_mask_testn_epi64_mask (__mmask8 __U, __m512i __A, __m512i __B)		_mm512_mask_testn_epi64_mask (__mmask8 __U, __m512i __A, __m512i __B)
{		{
return _mm512_mask_cmpeq_epi64_mask (__U, _mm512_and_epi32 (__A, __B),		return _mm512_mask_cmpeq_epi64_mask (__U, _mm512_and_epi32 (__A, __B),
_mm512_setzero_si512());		_mm512_setzero_si512());
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_movehdup_ps (__m512 __A)		_mm512_movehdup_ps (__m512 __A)
{		{
return (__m512)__builtin_shufflevector((__v16sf)__A, (__v16sf)__A,		return (__m512)__builtin_shufflevector((__v16sf)__A, (__v16sf)__A,
1, 1, 3, 3, 5, 5, 7, 7, 9, 9, 11, 11, 13, 13, 15, 15);		1, 1, 3, 3, 5, 5, 7, 7, 9, 9, 11, 11, 13, 13, 15, 15);
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_mask_movehdup_ps (__m512 __W, __mmask16 __U, __m512 __A)		_mm512_mask_movehdup_ps (__m512 __W, __mmask16 __U, __m512 __A)
{		{
return (__m512)__builtin_ia32_selectps_512((__mmask16)__U,		return (__m512)__builtin_ia32_selectps_512((__mmask16)__U,
(__v16sf)_mm512_movehdup_ps(__A),		(__v16sf)_mm512_movehdup_ps(__A),
(__v16sf)__W);		(__v16sf)__W);
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_maskz_movehdup_ps (__mmask16 __U, __m512 __A)		_mm512_maskz_movehdup_ps (__mmask16 __U, __m512 __A)
{		{
return (__m512)__builtin_ia32_selectps_512((__mmask16)__U,		return (__m512)__builtin_ia32_selectps_512((__mmask16)__U,
(__v16sf)_mm512_movehdup_ps(__A),		(__v16sf)_mm512_movehdup_ps(__A),
(__v16sf)_mm512_setzero_ps());		(__v16sf)_mm512_setzero_ps());
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_moveldup_ps (__m512 __A)		_mm512_moveldup_ps (__m512 __A)
{		{
return (__m512)__builtin_shufflevector((__v16sf)__A, (__v16sf)__A,		return (__m512)__builtin_shufflevector((__v16sf)__A, (__v16sf)__A,
0, 0, 2, 2, 4, 4, 6, 6, 8, 8, 10, 10, 12, 12, 14, 14);		0, 0, 2, 2, 4, 4, 6, 6, 8, 8, 10, 10, 12, 12, 14, 14);
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_mask_moveldup_ps (__m512 __W, __mmask16 __U, __m512 __A)		_mm512_mask_moveldup_ps (__m512 __W, __mmask16 __U, __m512 __A)
{		{
return (__m512)__builtin_ia32_selectps_512((__mmask16)__U,		return (__m512)__builtin_ia32_selectps_512((__mmask16)__U,
(__v16sf)_mm512_moveldup_ps(__A),		(__v16sf)_mm512_moveldup_ps(__A),
(__v16sf)__W);		(__v16sf)__W);
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_maskz_moveldup_ps (__mmask16 __U, __m512 __A)		_mm512_maskz_moveldup_ps (__mmask16 __U, __m512 __A)
{		{
return (__m512)__builtin_ia32_selectps_512((__mmask16)__U,		return (__m512)__builtin_ia32_selectps_512((__mmask16)__U,
(__v16sf)_mm512_moveldup_ps(__A),		(__v16sf)_mm512_moveldup_ps(__A),
(__v16sf)_mm512_setzero_ps());		(__v16sf)_mm512_setzero_ps());
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_mask_move_ss (__m128 __W, __mmask8 __U, __m128 __A, __m128 __B)		_mm_mask_move_ss (__m128 __W, __mmask8 __U, __m128 __A, __m128 __B)
{		{
__m128 res = __A;		__m128 res = __A;
res[0] = (__U & 1) ? __B[0] : __W[0];		res[0] = (__U & 1) ? __B[0] : __W[0];
return res;		return res;
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_maskz_move_ss (__mmask8 __U, __m128 __A, __m128 __B)		_mm_maskz_move_ss (__mmask8 __U, __m128 __A, __m128 __B)
{		{
__m128 res = __A;		__m128 res = __A;
res[0] = (__U & 1) ? __B[0] : 0;		res[0] = (__U & 1) ? __B[0] : 0;
return res;		return res;
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_mask_move_sd (__m128d __W, __mmask8 __U, __m128d __A, __m128d __B)		_mm_mask_move_sd (__m128d __W, __mmask8 __U, __m128d __A, __m128d __B)
{		{
__m128d res = __A;		__m128d res = __A;
res[0] = (__U & 1) ? __B[0] : __W[0];		res[0] = (__U & 1) ? __B[0] : __W[0];
return res;		return res;
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_maskz_move_sd (__mmask8 __U, __m128d __A, __m128d __B)		_mm_maskz_move_sd (__mmask8 __U, __m128d __A, __m128d __B)
{		{
__m128d res = __A;		__m128d res = __A;
res[0] = (__U & 1) ? __B[0] : 0;		res[0] = (__U & 1) ? __B[0] : 0;
return res;		return res;
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS128
_mm_mask_store_ss (float * __W, __mmask8 __U, __m128 __A)		_mm_mask_store_ss (float * __W, __mmask8 __U, __m128 __A)
{		{
__builtin_ia32_storess128_mask ((__v4sf *)__W, __A, __U & 1);		__builtin_ia32_storess128_mask ((__v4sf *)__W, __A, __U & 1);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS128
_mm_mask_store_sd (double * __W, __mmask8 __U, __m128d __A)		_mm_mask_store_sd (double * __W, __mmask8 __U, __m128d __A)
{		{
__builtin_ia32_storesd128_mask ((__v2df *)__W, __A, __U & 1);		__builtin_ia32_storesd128_mask ((__v2df *)__W, __A, __U & 1);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_mask_load_ss (__m128 __W, __mmask8 __U, const float* __A)		_mm_mask_load_ss (__m128 __W, __mmask8 __U, const float* __A)
{		{
__m128 src = (__v4sf) __builtin_shufflevector((__v4sf) __W,		__m128 src = (__v4sf) __builtin_shufflevector((__v4sf) __W,
(__v4sf)_mm_setzero_ps(),		(__v4sf)_mm_setzero_ps(),
0, 4, 4, 4);		0, 4, 4, 4);

return (__m128) __builtin_ia32_loadss128_mask ((__v4sf *) __A, src, __U & 1);		return (__m128) __builtin_ia32_loadss128_mask ((__v4sf *) __A, src, __U & 1);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_maskz_load_ss (__mmask8 __U, const float* __A)		_mm_maskz_load_ss (__mmask8 __U, const float* __A)
{		{
return (__m128)__builtin_ia32_loadss128_mask ((__v4sf *) __A,		return (__m128)__builtin_ia32_loadss128_mask ((__v4sf *) __A,
(__v4sf) _mm_setzero_ps(),		(__v4sf) _mm_setzero_ps(),
__U & 1);		__U & 1);
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_mask_load_sd (__m128d __W, __mmask8 __U, const double* __A)		_mm_mask_load_sd (__m128d __W, __mmask8 __U, const double* __A)
{		{
__m128d src = (__v2df) __builtin_shufflevector((__v2df) __W,		__m128d src = (__v2df) __builtin_shufflevector((__v2df) __W,
(__v2df)_mm_setzero_pd(),		(__v2df)_mm_setzero_pd(),
0, 2);		0, 2);

return (__m128d) __builtin_ia32_loadsd128_mask ((__v2df *) __A, src, __U & 1);		return (__m128d) __builtin_ia32_loadsd128_mask ((__v2df *) __A, src, __U & 1);
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_maskz_load_sd (__mmask8 __U, const double* __A)		_mm_maskz_load_sd (__mmask8 __U, const double* __A)
{		{
return (__m128d) __builtin_ia32_loadsd128_mask ((__v2df *) __A,		return (__m128d) __builtin_ia32_loadsd128_mask ((__v2df *) __A,
(__v2df) _mm_setzero_pd(),		(__v2df) _mm_setzero_pd(),
__U & 1);		__U & 1);
}		}

#define _mm512_shuffle_epi32(A, I) \		#define _mm512_shuffle_epi32(A, I) \
(__m512i)__builtin_ia32_pshufd512((__v16si)(__m512i)(A), (int)(I))		(__m512i)__builtin_ia32_pshufd512((__v16si)(__m512i)(A), (int)(I))

#define _mm512_mask_shuffle_epi32(W, U, A, I) \		#define _mm512_mask_shuffle_epi32(W, U, A, I) \
(__m512i)__builtin_ia32_selectd_512((__mmask16)(U), \		(__m512i)__builtin_ia32_selectd_512((__mmask16)(U), \
(__v16si)_mm512_shuffle_epi32((A), (I)), \		(__v16si)_mm512_shuffle_epi32((A), (I)), \
(__v16si)(__m512i)(W))		(__v16si)(__m512i)(W))

#define _mm512_maskz_shuffle_epi32(U, A, I) \		#define _mm512_maskz_shuffle_epi32(U, A, I) \
(__m512i)__builtin_ia32_selectd_512((__mmask16)(U), \		(__m512i)__builtin_ia32_selectd_512((__mmask16)(U), \
(__v16si)_mm512_shuffle_epi32((A), (I)), \		(__v16si)_mm512_shuffle_epi32((A), (I)), \
(__v16si)_mm512_setzero_si512())		(__v16si)_mm512_setzero_si512())

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_mask_expand_pd (__m512d __W, __mmask8 __U, __m512d __A)		_mm512_mask_expand_pd (__m512d __W, __mmask8 __U, __m512d __A)
{		{
return (__m512d) __builtin_ia32_expanddf512_mask ((__v8df) __A,		return (__m512d) __builtin_ia32_expanddf512_mask ((__v8df) __A,
(__v8df) __W,		(__v8df) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_maskz_expand_pd (__mmask8 __U, __m512d __A)		_mm512_maskz_expand_pd (__mmask8 __U, __m512d __A)
{		{
return (__m512d) __builtin_ia32_expanddf512_mask ((__v8df) __A,		return (__m512d) __builtin_ia32_expanddf512_mask ((__v8df) __A,
(__v8df) _mm512_setzero_pd (),		(__v8df) _mm512_setzero_pd (),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_expand_epi64 (__m512i __W, __mmask8 __U, __m512i __A)		_mm512_mask_expand_epi64 (__m512i __W, __mmask8 __U, __m512i __A)
{		{
return (__m512i) __builtin_ia32_expanddi512_mask ((__v8di) __A,		return (__m512i) __builtin_ia32_expanddi512_mask ((__v8di) __A,
(__v8di) __W,		(__v8di) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_expand_epi64 ( __mmask8 __U, __m512i __A)		_mm512_maskz_expand_epi64 ( __mmask8 __U, __m512i __A)
{		{
return (__m512i) __builtin_ia32_expanddi512_mask ((__v8di) __A,		return (__m512i) __builtin_ia32_expanddi512_mask ((__v8di) __A,
(__v8di) _mm512_setzero_pd (),		(__v8di) _mm512_setzero_pd (),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_mask_expandloadu_pd(__m512d __W, __mmask8 __U, void const *__P)		_mm512_mask_expandloadu_pd(__m512d __W, __mmask8 __U, void const *__P)
{		{
return (__m512d) __builtin_ia32_expandloaddf512_mask ((const __v8df *)__P,		return (__m512d) __builtin_ia32_expandloaddf512_mask ((const __v8df *)__P,
(__v8df) __W,		(__v8df) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_maskz_expandloadu_pd(__mmask8 __U, void const *__P)		_mm512_maskz_expandloadu_pd(__mmask8 __U, void const *__P)
{		{
return (__m512d) __builtin_ia32_expandloaddf512_mask ((const __v8df *)__P,		return (__m512d) __builtin_ia32_expandloaddf512_mask ((const __v8df *)__P,
(__v8df) _mm512_setzero_pd(),		(__v8df) _mm512_setzero_pd(),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_expandloadu_epi64(__m512i __W, __mmask8 __U, void const *__P)		_mm512_mask_expandloadu_epi64(__m512i __W, __mmask8 __U, void const *__P)
{		{
return (__m512i) __builtin_ia32_expandloaddi512_mask ((const __v8di *)__P,		return (__m512i) __builtin_ia32_expandloaddi512_mask ((const __v8di *)__P,
(__v8di) __W,		(__v8di) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_expandloadu_epi64(__mmask8 __U, void const *__P)		_mm512_maskz_expandloadu_epi64(__mmask8 __U, void const *__P)
{		{
return (__m512i) __builtin_ia32_expandloaddi512_mask ((const __v8di *)__P,		return (__m512i) __builtin_ia32_expandloaddi512_mask ((const __v8di *)__P,
(__v8di) _mm512_setzero_pd(),		(__v8di) _mm512_setzero_pd(),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_mask_expandloadu_ps(__m512 __W, __mmask16 __U, void const *__P)		_mm512_mask_expandloadu_ps(__m512 __W, __mmask16 __U, void const *__P)
{		{
return (__m512) __builtin_ia32_expandloadsf512_mask ((const __v16sf *)__P,		return (__m512) __builtin_ia32_expandloadsf512_mask ((const __v16sf *)__P,
(__v16sf) __W,		(__v16sf) __W,
(__mmask16) __U);		(__mmask16) __U);
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_maskz_expandloadu_ps(__mmask16 __U, void const *__P)		_mm512_maskz_expandloadu_ps(__mmask16 __U, void const *__P)
{		{
return (__m512) __builtin_ia32_expandloadsf512_mask ((const __v16sf *)__P,		return (__m512) __builtin_ia32_expandloadsf512_mask ((const __v16sf *)__P,
(__v16sf) _mm512_setzero_ps(),		(__v16sf) _mm512_setzero_ps(),
(__mmask16) __U);		(__mmask16) __U);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_expandloadu_epi32(__m512i __W, __mmask16 __U, void const *__P)		_mm512_mask_expandloadu_epi32(__m512i __W, __mmask16 __U, void const *__P)
{		{
return (__m512i) __builtin_ia32_expandloadsi512_mask ((const __v16si *)__P,		return (__m512i) __builtin_ia32_expandloadsi512_mask ((const __v16si *)__P,
(__v16si) __W,		(__v16si) __W,
(__mmask16) __U);		(__mmask16) __U);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_expandloadu_epi32(__mmask16 __U, void const *__P)		_mm512_maskz_expandloadu_epi32(__mmask16 __U, void const *__P)
{		{
return (__m512i) __builtin_ia32_expandloadsi512_mask ((const __v16si *)__P,		return (__m512i) __builtin_ia32_expandloadsi512_mask ((const __v16si *)__P,
(__v16si) _mm512_setzero_ps(),		(__v16si) _mm512_setzero_ps(),
(__mmask16) __U);		(__mmask16) __U);
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_mask_expand_ps (__m512 __W, __mmask16 __U, __m512 __A)		_mm512_mask_expand_ps (__m512 __W, __mmask16 __U, __m512 __A)
{		{
return (__m512) __builtin_ia32_expandsf512_mask ((__v16sf) __A,		return (__m512) __builtin_ia32_expandsf512_mask ((__v16sf) __A,
(__v16sf) __W,		(__v16sf) __W,
(__mmask16) __U);		(__mmask16) __U);
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_maskz_expand_ps (__mmask16 __U, __m512 __A)		_mm512_maskz_expand_ps (__mmask16 __U, __m512 __A)
{		{
return (__m512) __builtin_ia32_expandsf512_mask ((__v16sf) __A,		return (__m512) __builtin_ia32_expandsf512_mask ((__v16sf) __A,
(__v16sf) _mm512_setzero_ps(),		(__v16sf) _mm512_setzero_ps(),
(__mmask16) __U);		(__mmask16) __U);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_expand_epi32 (__m512i __W, __mmask16 __U, __m512i __A)		_mm512_mask_expand_epi32 (__m512i __W, __mmask16 __U, __m512i __A)
{		{
return (__m512i) __builtin_ia32_expandsi512_mask ((__v16si) __A,		return (__m512i) __builtin_ia32_expandsi512_mask ((__v16si) __A,
(__v16si) __W,		(__v16si) __W,
(__mmask16) __U);		(__mmask16) __U);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_maskz_expand_epi32 (__mmask16 __U, __m512i __A)		_mm512_maskz_expand_epi32 (__mmask16 __U, __m512i __A)
{		{
return (__m512i) __builtin_ia32_expandsi512_mask ((__v16si) __A,		return (__m512i) __builtin_ia32_expandsi512_mask ((__v16si) __A,
(__v16si) _mm512_setzero_ps(),		(__v16si) _mm512_setzero_ps(),
(__mmask16) __U);		(__mmask16) __U);
}		}

#define _mm512_cvt_roundps_pd(A, R) \		#define _mm512_cvt_roundps_pd(A, R) \
(__m512d)__builtin_ia32_cvtps2pd512_mask((__v8sf)(__m256)(A), \		(__m512d)__builtin_ia32_cvtps2pd512_mask((__v8sf)(__m256)(A), \
(__v8df)_mm512_undefined_pd(), \		(__v8df)_mm512_undefined_pd(), \
(__mmask8)-1, (int)(R))		(__mmask8)-1, (int)(R))

#define _mm512_mask_cvt_roundps_pd(W, U, A, R) \		#define _mm512_mask_cvt_roundps_pd(W, U, A, R) \
(__m512d)__builtin_ia32_cvtps2pd512_mask((__v8sf)(__m256)(A), \		(__m512d)__builtin_ia32_cvtps2pd512_mask((__v8sf)(__m256)(A), \
(__v8df)(__m512d)(W), \		(__v8df)(__m512d)(W), \
(__mmask8)(U), (int)(R))		(__mmask8)(U), (int)(R))

#define _mm512_maskz_cvt_roundps_pd(U, A, R) \		#define _mm512_maskz_cvt_roundps_pd(U, A, R) \
(__m512d)__builtin_ia32_cvtps2pd512_mask((__v8sf)(__m256)(A), \		(__m512d)__builtin_ia32_cvtps2pd512_mask((__v8sf)(__m256)(A), \
(__v8df)_mm512_setzero_pd(), \		(__v8df)_mm512_setzero_pd(), \
(__mmask8)(U), (int)(R))		(__mmask8)(U), (int)(R))

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_cvtps_pd (__m256 __A)		_mm512_cvtps_pd (__m256 __A)
{		{
return (__m512d) __builtin_convertvector((__v8sf)__A, __v8df);		return (__m512d) __builtin_convertvector((__v8sf)__A, __v8df);
}		}

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_mask_cvtps_pd (__m512d __W, __mmask8 __U, __m256 __A)		_mm512_mask_cvtps_pd (__m512d __W, __mmask8 __U, __m256 __A)
{		{
return (__m512d)__builtin_ia32_selectpd_512((__mmask8)__U,		return (__m512d)__builtin_ia32_selectpd_512((__mmask8)__U,
(__v8df)_mm512_cvtps_pd(__A),		(__v8df)_mm512_cvtps_pd(__A),
(__v8df)__W);		(__v8df)__W);
}		}

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_maskz_cvtps_pd (__mmask8 __U, __m256 __A)		_mm512_maskz_cvtps_pd (__mmask8 __U, __m256 __A)
{		{
return (__m512d)__builtin_ia32_selectpd_512((__mmask8)__U,		return (__m512d)__builtin_ia32_selectpd_512((__mmask8)__U,
(__v8df)_mm512_cvtps_pd(__A),		(__v8df)_mm512_cvtps_pd(__A),
(__v8df)_mm512_setzero_pd());		(__v8df)_mm512_setzero_pd());
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_cvtpslo_pd (__m512 __A)		_mm512_cvtpslo_pd (__m512 __A)
{		{
return (__m512) _mm512_cvtps_pd(_mm512_castps512_ps256(__A));		return (__m512) _mm512_cvtps_pd(_mm512_castps512_ps256(__A));
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_mask_cvtpslo_pd (__m512d __W, __mmask8 __U, __m512 __A)		_mm512_mask_cvtpslo_pd (__m512d __W, __mmask8 __U, __m512 __A)
{		{
return (__m512) _mm512_mask_cvtps_pd(__W, __U, _mm512_castps512_ps256(__A));		return (__m512) _mm512_mask_cvtps_pd(__W, __U, _mm512_castps512_ps256(__A));
}		}

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_mask_mov_pd (__m512d __W, __mmask8 __U, __m512d __A)		_mm512_mask_mov_pd (__m512d __W, __mmask8 __U, __m512d __A)
{		{
return (__m512d) __builtin_ia32_selectpd_512 ((__mmask8) __U,		return (__m512d) __builtin_ia32_selectpd_512 ((__mmask8) __U,
(__v8df) __A,		(__v8df) __A,
(__v8df) __W);		(__v8df) __W);
}		}

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_maskz_mov_pd (__mmask8 __U, __m512d __A)		_mm512_maskz_mov_pd (__mmask8 __U, __m512d __A)
{		{
return (__m512d) __builtin_ia32_selectpd_512 ((__mmask8) __U,		return (__m512d) __builtin_ia32_selectpd_512 ((__mmask8) __U,
(__v8df) __A,		(__v8df) __A,
(__v8df) _mm512_setzero_pd ());		(__v8df) _mm512_setzero_pd ());
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_mask_mov_ps (__m512 __W, __mmask16 __U, __m512 __A)		_mm512_mask_mov_ps (__m512 __W, __mmask16 __U, __m512 __A)
{		{
return (__m512) __builtin_ia32_selectps_512 ((__mmask16) __U,		return (__m512) __builtin_ia32_selectps_512 ((__mmask16) __U,
(__v16sf) __A,		(__v16sf) __A,
(__v16sf) __W);		(__v16sf) __W);
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_maskz_mov_ps (__mmask16 __U, __m512 __A)		_mm512_maskz_mov_ps (__mmask16 __U, __m512 __A)
{		{
return (__m512) __builtin_ia32_selectps_512 ((__mmask16) __U,		return (__m512) __builtin_ia32_selectps_512 ((__mmask16) __U,
(__v16sf) __A,		(__v16sf) __A,
(__v16sf) _mm512_setzero_ps ());		(__v16sf) _mm512_setzero_ps ());
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS512
_mm512_mask_compressstoreu_pd (void *__P, __mmask8 __U, __m512d __A)		_mm512_mask_compressstoreu_pd (void *__P, __mmask8 __U, __m512d __A)
{		{
__builtin_ia32_compressstoredf512_mask ((__v8df *) __P, (__v8df) __A,		__builtin_ia32_compressstoredf512_mask ((__v8df *) __P, (__v8df) __A,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS512
_mm512_mask_compressstoreu_epi64 (void *__P, __mmask8 __U, __m512i __A)		_mm512_mask_compressstoreu_epi64 (void *__P, __mmask8 __U, __m512i __A)
{		{
__builtin_ia32_compressstoredi512_mask ((__v8di *) __P, (__v8di) __A,		__builtin_ia32_compressstoredi512_mask ((__v8di *) __P, (__v8di) __A,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS512
_mm512_mask_compressstoreu_ps (void *__P, __mmask16 __U, __m512 __A)		_mm512_mask_compressstoreu_ps (void *__P, __mmask16 __U, __m512 __A)
{		{
__builtin_ia32_compressstoresf512_mask ((__v16sf *) __P, (__v16sf) __A,		__builtin_ia32_compressstoresf512_mask ((__v16sf *) __P, (__v16sf) __A,
(__mmask16) __U);		(__mmask16) __U);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS512
_mm512_mask_compressstoreu_epi32 (void *__P, __mmask16 __U, __m512i __A)		_mm512_mask_compressstoreu_epi32 (void *__P, __mmask16 __U, __m512i __A)
{		{
__builtin_ia32_compressstoresi512_mask ((__v16si *) __P, (__v16si) __A,		__builtin_ia32_compressstoresi512_mask ((__v16si *) __P, (__v16si) __A,
(__mmask16) __U);		(__mmask16) __U);
}		}

#define _mm_cvt_roundsd_ss(A, B, R) \		#define _mm_cvt_roundsd_ss(A, B, R) \
(__m128)__builtin_ia32_cvtsd2ss_round_mask((__v4sf)(__m128)(A), \		(__m128)__builtin_ia32_cvtsd2ss_round_mask((__v4sf)(__m128)(A), \
(__v2df)(__m128d)(B), \		(__v2df)(__m128d)(B), \
(__v4sf)_mm_undefined_ps(), \		(__v4sf)_mm_undefined_ps(), \
(__mmask8)-1, (int)(R))		(__mmask8)-1, (int)(R))

#define _mm_mask_cvt_roundsd_ss(W, U, A, B, R) \		#define _mm_mask_cvt_roundsd_ss(W, U, A, B, R) \
(__m128)__builtin_ia32_cvtsd2ss_round_mask((__v4sf)(__m128)(A), \		(__m128)__builtin_ia32_cvtsd2ss_round_mask((__v4sf)(__m128)(A), \
(__v2df)(__m128d)(B), \		(__v2df)(__m128d)(B), \
(__v4sf)(__m128)(W), \		(__v4sf)(__m128)(W), \
(__mmask8)(U), (int)(R))		(__mmask8)(U), (int)(R))

#define _mm_maskz_cvt_roundsd_ss(U, A, B, R) \		#define _mm_maskz_cvt_roundsd_ss(U, A, B, R) \
(__m128)__builtin_ia32_cvtsd2ss_round_mask((__v4sf)(__m128)(A), \		(__m128)__builtin_ia32_cvtsd2ss_round_mask((__v4sf)(__m128)(A), \
(__v2df)(__m128d)(B), \		(__v2df)(__m128d)(B), \
(__v4sf)_mm_setzero_ps(), \		(__v4sf)_mm_setzero_ps(), \
(__mmask8)(U), (int)(R))		(__mmask8)(U), (int)(R))

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_mask_cvtsd_ss (__m128 __W, __mmask8 __U, __m128 __A, __m128d __B)		_mm_mask_cvtsd_ss (__m128 __W, __mmask8 __U, __m128 __A, __m128d __B)
{		{
return __builtin_ia32_cvtsd2ss_round_mask ((__v4sf)__A,		return __builtin_ia32_cvtsd2ss_round_mask ((__v4sf)__A,
(__v2df)__B,		(__v2df)__B,
(__v4sf)__W,		(__v4sf)__W,
(__mmask8)__U, _MM_FROUND_CUR_DIRECTION);		(__mmask8)__U, _MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_maskz_cvtsd_ss (__mmask8 __U, __m128 __A, __m128d __B)		_mm_maskz_cvtsd_ss (__mmask8 __U, __m128 __A, __m128d __B)
{		{
return __builtin_ia32_cvtsd2ss_round_mask ((__v4sf)__A,		return __builtin_ia32_cvtsd2ss_round_mask ((__v4sf)__A,
(__v2df)__B,		(__v2df)__B,
(__v4sf)_mm_setzero_ps(),		(__v4sf)_mm_setzero_ps(),
(__mmask8)__U, _MM_FROUND_CUR_DIRECTION);		(__mmask8)__U, _MM_FROUND_CUR_DIRECTION);
}		}

▲ Show 20 Lines • Show All 47 Lines • ▼ Show 20 Lines	(__m128d)__builtin_ia32_cvtss2sd_round_mask((__v2df)(__m128d)(A), \
(__mmask8)(U), (int)(R))		(__mmask8)(U), (int)(R))

#define _mm_maskz_cvt_roundss_sd(U, A, B, R) \		#define _mm_maskz_cvt_roundss_sd(U, A, B, R) \
(__m128d)__builtin_ia32_cvtss2sd_round_mask((__v2df)(__m128d)(A), \		(__m128d)__builtin_ia32_cvtss2sd_round_mask((__v2df)(__m128d)(A), \
(__v4sf)(__m128)(B), \		(__v4sf)(__m128)(B), \
(__v2df)_mm_setzero_pd(), \		(__v2df)_mm_setzero_pd(), \
(__mmask8)(U), (int)(R))		(__mmask8)(U), (int)(R))

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_mask_cvtss_sd (__m128d __W, __mmask8 __U, __m128d __A, __m128 __B)		_mm_mask_cvtss_sd (__m128d __W, __mmask8 __U, __m128d __A, __m128 __B)
{		{
return __builtin_ia32_cvtss2sd_round_mask((__v2df)__A,		return __builtin_ia32_cvtss2sd_round_mask((__v2df)__A,
(__v4sf)__B,		(__v4sf)__B,
(__v2df)__W,		(__v2df)__W,
(__mmask8)__U, _MM_FROUND_CUR_DIRECTION);		(__mmask8)__U, _MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_maskz_cvtss_sd (__mmask8 __U, __m128d __A, __m128 __B)		_mm_maskz_cvtss_sd (__mmask8 __U, __m128d __A, __m128 __B)
{		{
return __builtin_ia32_cvtss2sd_round_mask((__v2df)__A,		return __builtin_ia32_cvtss2sd_round_mask((__v2df)__A,
(__v4sf)__B,		(__v4sf)__B,
(__v2df)_mm_setzero_pd(),		(__v2df)_mm_setzero_pd(),
(__mmask8)__U, _MM_FROUND_CUR_DIRECTION);		(__mmask8)__U, _MM_FROUND_CUR_DIRECTION);
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_cvtu32_sd (__m128d __A, unsigned __B)		_mm_cvtu32_sd (__m128d __A, unsigned __B)
{		{
__A[0] = __B;		__A[0] = __B;
return __A;		return __A;
}		}

#ifdef __x86_64__		#ifdef __x86_64__
#define _mm_cvt_roundu64_sd(A, B, R) \		#define _mm_cvt_roundu64_sd(A, B, R) \
(__m128d)__builtin_ia32_cvtusi2sd64((__v2df)(__m128d)(A), \		(__m128d)__builtin_ia32_cvtusi2sd64((__v2df)(__m128d)(A), \
(unsigned long long)(B), (int)(R))		(unsigned long long)(B), (int)(R))

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_cvtu64_sd (__m128d __A, unsigned long long __B)		_mm_cvtu64_sd (__m128d __A, unsigned long long __B)
{		{
__A[0] = __B;		__A[0] = __B;
return __A;		return __A;
}		}
#endif		#endif

#define _mm_cvt_roundu32_ss(A, B, R) \		#define _mm_cvt_roundu32_ss(A, B, R) \
(__m128)__builtin_ia32_cvtusi2ss32((__v4sf)(__m128)(A), (unsigned int)(B), \		(__m128)__builtin_ia32_cvtusi2ss32((__v4sf)(__m128)(A), (unsigned int)(B), \
(int)(R))		(int)(R))

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_cvtu32_ss (__m128 __A, unsigned __B)		_mm_cvtu32_ss (__m128 __A, unsigned __B)
{		{
__A[0] = __B;		__A[0] = __B;
return __A;		return __A;
}		}

#ifdef __x86_64__		#ifdef __x86_64__
#define _mm_cvt_roundu64_ss(A, B, R) \		#define _mm_cvt_roundu64_ss(A, B, R) \
(__m128)__builtin_ia32_cvtusi2ss64((__v4sf)(__m128)(A), \		(__m128)__builtin_ia32_cvtusi2ss64((__v4sf)(__m128)(A), \
(unsigned long long)(B), (int)(R))		(unsigned long long)(B), (int)(R))

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_cvtu64_ss (__m128 __A, unsigned long long __B)		_mm_cvtu64_ss (__m128 __A, unsigned long long __B)
{		{
__A[0] = __B;		__A[0] = __B;
return __A;		return __A;
}		}
#endif		#endif

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_set1_epi32 (__m512i __O, __mmask16 __M, int __A)		_mm512_mask_set1_epi32 (__m512i __O, __mmask16 __M, int __A)
{		{
return (__m512i) __builtin_ia32_selectd_512(__M,		return (__m512i) __builtin_ia32_selectd_512(__M,
(__v16si) _mm512_set1_epi32(__A),		(__v16si) _mm512_set1_epi32(__A),
(__v16si) __O);		(__v16si) __O);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_mask_set1_epi64 (__m512i __O, __mmask8 __M, long long __A)		_mm512_mask_set1_epi64 (__m512i __O, __mmask8 __M, long long __A)
{		{
return (__m512i) __builtin_ia32_selectq_512(__M,		return (__m512i) __builtin_ia32_selectq_512(__M,
(__v8di) _mm512_set1_epi64(__A),		(__v8di) _mm512_set1_epi64(__A),
(__v8di) __O);		(__v8di) __O);
}		}

static __inline __m512i __DEFAULT_FN_ATTRS		static __inline __m512i __DEFAULT_FN_ATTRS512
_mm512_set_epi8 (char __e63, char __e62, char __e61, char __e60, char __e59,		_mm512_set_epi8 (char __e63, char __e62, char __e61, char __e60, char __e59,
char __e58, char __e57, char __e56, char __e55, char __e54, char __e53,		char __e58, char __e57, char __e56, char __e55, char __e54, char __e53,
char __e52, char __e51, char __e50, char __e49, char __e48, char __e47,		char __e52, char __e51, char __e50, char __e49, char __e48, char __e47,
char __e46, char __e45, char __e44, char __e43, char __e42, char __e41,		char __e46, char __e45, char __e44, char __e43, char __e42, char __e41,
char __e40, char __e39, char __e38, char __e37, char __e36, char __e35,		char __e40, char __e39, char __e38, char __e37, char __e36, char __e35,
char __e34, char __e33, char __e32, char __e31, char __e30, char __e29,		char __e34, char __e33, char __e32, char __e31, char __e30, char __e29,
char __e28, char __e27, char __e26, char __e25, char __e24, char __e23,		char __e28, char __e27, char __e26, char __e25, char __e24, char __e23,
char __e22, char __e21, char __e20, char __e19, char __e18, char __e17,		char __e22, char __e21, char __e20, char __e19, char __e18, char __e17,
char __e16, char __e15, char __e14, char __e13, char __e12, char __e11,		char __e16, char __e15, char __e14, char __e13, char __e12, char __e11,
char __e10, char __e9, char __e8, char __e7, char __e6, char __e5,		char __e10, char __e9, char __e8, char __e7, char __e6, char __e5,
char __e4, char __e3, char __e2, char __e1, char __e0) {		char __e4, char __e3, char __e2, char __e1, char __e0) {

return __extension__ (__m512i)(__v64qi)		return __extension__ (__m512i)(__v64qi)
{__e0, __e1, __e2, __e3, __e4, __e5, __e6, __e7,		{__e0, __e1, __e2, __e3, __e4, __e5, __e6, __e7,
__e8, __e9, __e10, __e11, __e12, __e13, __e14, __e15,		__e8, __e9, __e10, __e11, __e12, __e13, __e14, __e15,
__e16, __e17, __e18, __e19, __e20, __e21, __e22, __e23,		__e16, __e17, __e18, __e19, __e20, __e21, __e22, __e23,
__e24, __e25, __e26, __e27, __e28, __e29, __e30, __e31,		__e24, __e25, __e26, __e27, __e28, __e29, __e30, __e31,
__e32, __e33, __e34, __e35, __e36, __e37, __e38, __e39,		__e32, __e33, __e34, __e35, __e36, __e37, __e38, __e39,
__e40, __e41, __e42, __e43, __e44, __e45, __e46, __e47,		__e40, __e41, __e42, __e43, __e44, __e45, __e46, __e47,
__e48, __e49, __e50, __e51, __e52, __e53, __e54, __e55,		__e48, __e49, __e50, __e51, __e52, __e53, __e54, __e55,
__e56, __e57, __e58, __e59, __e60, __e61, __e62, __e63};		__e56, __e57, __e58, __e59, __e60, __e61, __e62, __e63};
}		}

static __inline __m512i __DEFAULT_FN_ATTRS		static __inline __m512i __DEFAULT_FN_ATTRS512
_mm512_set_epi16(short __e31, short __e30, short __e29, short __e28,		_mm512_set_epi16(short __e31, short __e30, short __e29, short __e28,
short __e27, short __e26, short __e25, short __e24, short __e23,		short __e27, short __e26, short __e25, short __e24, short __e23,
short __e22, short __e21, short __e20, short __e19, short __e18,		short __e22, short __e21, short __e20, short __e19, short __e18,
short __e17, short __e16, short __e15, short __e14, short __e13,		short __e17, short __e16, short __e15, short __e14, short __e13,
short __e12, short __e11, short __e10, short __e9, short __e8,		short __e12, short __e11, short __e10, short __e9, short __e8,
short __e7, short __e6, short __e5, short __e4, short __e3,		short __e7, short __e6, short __e5, short __e4, short __e3,
short __e2, short __e1, short __e0) {		short __e2, short __e1, short __e0) {
return __extension__ (__m512i)(__v32hi)		return __extension__ (__m512i)(__v32hi)
{__e0, __e1, __e2, __e3, __e4, __e5, __e6, __e7,		{__e0, __e1, __e2, __e3, __e4, __e5, __e6, __e7,
__e8, __e9, __e10, __e11, __e12, __e13, __e14, __e15,		__e8, __e9, __e10, __e11, __e12, __e13, __e14, __e15,
__e16, __e17, __e18, __e19, __e20, __e21, __e22, __e23,		__e16, __e17, __e18, __e19, __e20, __e21, __e22, __e23,
__e24, __e25, __e26, __e27, __e28, __e29, __e30, __e31 };		__e24, __e25, __e26, __e27, __e28, __e29, __e30, __e31 };
}		}

static __inline __m512i __DEFAULT_FN_ATTRS		static __inline __m512i __DEFAULT_FN_ATTRS512
_mm512_set_epi32 (int __A, int __B, int __C, int __D,		_mm512_set_epi32 (int __A, int __B, int __C, int __D,
int __E, int __F, int __G, int __H,		int __E, int __F, int __G, int __H,
int __I, int __J, int __K, int __L,		int __I, int __J, int __K, int __L,
int __M, int __N, int __O, int __P)		int __M, int __N, int __O, int __P)
{		{
return __extension__ (__m512i)(__v16si)		return __extension__ (__m512i)(__v16si)
{ __P, __O, __N, __M, __L, __K, __J, __I,		{ __P, __O, __N, __M, __L, __K, __J, __I,
__H, __G, __F, __E, __D, __C, __B, __A };		__H, __G, __F, __E, __D, __C, __B, __A };
}		}

#define _mm512_setr_epi32(e0,e1,e2,e3,e4,e5,e6,e7, \		#define _mm512_setr_epi32(e0,e1,e2,e3,e4,e5,e6,e7, \
e8,e9,e10,e11,e12,e13,e14,e15) \		e8,e9,e10,e11,e12,e13,e14,e15) \
_mm512_set_epi32((e15),(e14),(e13),(e12),(e11),(e10),(e9),(e8),(e7),(e6), \		_mm512_set_epi32((e15),(e14),(e13),(e12),(e11),(e10),(e9),(e8),(e7),(e6), \
(e5),(e4),(e3),(e2),(e1),(e0))		(e5),(e4),(e3),(e2),(e1),(e0))

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS512
_mm512_set_epi64 (long long __A, long long __B, long long __C,		_mm512_set_epi64 (long long __A, long long __B, long long __C,
long long __D, long long __E, long long __F,		long long __D, long long __E, long long __F,
long long __G, long long __H)		long long __G, long long __H)
{		{
return __extension__ (__m512i) (__v8di)		return __extension__ (__m512i) (__v8di)
{ __H, __G, __F, __E, __D, __C, __B, __A };		{ __H, __G, __F, __E, __D, __C, __B, __A };
}		}

#define _mm512_setr_epi64(e0,e1,e2,e3,e4,e5,e6,e7) \		#define _mm512_setr_epi64(e0,e1,e2,e3,e4,e5,e6,e7) \
_mm512_set_epi64((e7),(e6),(e5),(e4),(e3),(e2),(e1),(e0))		_mm512_set_epi64((e7),(e6),(e5),(e4),(e3),(e2),(e1),(e0))

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_set_pd (double __A, double __B, double __C, double __D,		_mm512_set_pd (double __A, double __B, double __C, double __D,
double __E, double __F, double __G, double __H)		double __E, double __F, double __G, double __H)
{		{
return __extension__ (__m512d)		return __extension__ (__m512d)
{ __H, __G, __F, __E, __D, __C, __B, __A };		{ __H, __G, __F, __E, __D, __C, __B, __A };
}		}

#define _mm512_setr_pd(e0,e1,e2,e3,e4,e5,e6,e7) \		#define _mm512_setr_pd(e0,e1,e2,e3,e4,e5,e6,e7) \
_mm512_set_pd((e7),(e6),(e5),(e4),(e3),(e2),(e1),(e0))		_mm512_set_pd((e7),(e6),(e5),(e4),(e3),(e2),(e1),(e0))

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_set_ps (float __A, float __B, float __C, float __D,		_mm512_set_ps (float __A, float __B, float __C, float __D,
float __E, float __F, float __G, float __H,		float __E, float __F, float __G, float __H,
float __I, float __J, float __K, float __L,		float __I, float __J, float __K, float __L,
float __M, float __N, float __O, float __P)		float __M, float __N, float __O, float __P)
{		{
return __extension__ (__m512)		return __extension__ (__m512)
{ __P, __O, __N, __M, __L, __K, __J, __I,		{ __P, __O, __N, __M, __L, __K, __J, __I,
__H, __G, __F, __E, __D, __C, __B, __A };		__H, __G, __F, __E, __D, __C, __B, __A };
}		}

#define _mm512_setr_ps(e0,e1,e2,e3,e4,e5,e6,e7,e8,e9,e10,e11,e12,e13,e14,e15) \		#define _mm512_setr_ps(e0,e1,e2,e3,e4,e5,e6,e7,e8,e9,e10,e11,e12,e13,e14,e15) \
_mm512_set_ps((e15),(e14),(e13),(e12),(e11),(e10),(e9),(e8),(e7),(e6),(e5), \		_mm512_set_ps((e15),(e14),(e13),(e12),(e11),(e10),(e9),(e8),(e7),(e6),(e5), \
(e4),(e3),(e2),(e1),(e0))		(e4),(e3),(e2),(e1),(e0))

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_abs_ps(__m512 __A)		_mm512_abs_ps(__m512 __A)
{		{
return (__m512)_mm512_and_epi32(_mm512_set1_epi32(0x7FFFFFFF),(__m512i)__A) ;		return (__m512)_mm512_and_epi32(_mm512_set1_epi32(0x7FFFFFFF),(__m512i)__A) ;
}		}

static __inline__ __m512 __DEFAULT_FN_ATTRS		static __inline__ __m512 __DEFAULT_FN_ATTRS512
_mm512_mask_abs_ps(__m512 __W, __mmask16 __K, __m512 __A)		_mm512_mask_abs_ps(__m512 __W, __mmask16 __K, __m512 __A)
{		{
return (__m512)_mm512_mask_and_epi32((__m512i)__W, __K, _mm512_set1_epi32(0x7FFFFFFF),(__m512i)__A) ;		return (__m512)_mm512_mask_and_epi32((__m512i)__W, __K, _mm512_set1_epi32(0x7FFFFFFF),(__m512i)__A) ;
}		}

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_abs_pd(__m512d __A)		_mm512_abs_pd(__m512d __A)
{		{
return (__m512d)_mm512_and_epi64(_mm512_set1_epi64(0x7FFFFFFFFFFFFFFF),(__v8di)__A) ;		return (__m512d)_mm512_and_epi64(_mm512_set1_epi64(0x7FFFFFFFFFFFFFFF),(__v8di)__A) ;
}		}

static __inline__ __m512d __DEFAULT_FN_ATTRS		static __inline__ __m512d __DEFAULT_FN_ATTRS512
_mm512_mask_abs_pd(__m512d __W, __mmask8 __K, __m512d __A)		_mm512_mask_abs_pd(__m512d __W, __mmask8 __K, __m512d __A)
{		{
return (__m512d)_mm512_mask_and_epi64((__v8di)__W, __K, _mm512_set1_epi64(0x7FFFFFFFFFFFFFFF),(__v8di)__A);		return (__m512d)_mm512_mask_and_epi64((__v8di)__W, __K, _mm512_set1_epi64(0x7FFFFFFFFFFFFFFF),(__v8di)__A);
}		}

/* Vector-reduction arithmetic accepts vectors as inputs and produces scalars as		/* Vector-reduction arithmetic accepts vectors as inputs and produces scalars as
* outputs. This class of vector operation forms the basis of many scientific		* outputs. This class of vector operation forms the basis of many scientific
* computations. In vector-reduction arithmetic, the evaluation off is		* computations. In vector-reduction arithmetic, the evaluation off is
▲ Show 20 Lines • Show All 76 Lines • ▼ Show 20 Lines	#define _mm512_mask_reduce_operator_64bit(Vec512, Vec512Neutral, Operator, \
__extension__({ \		__extension__({ \
Vec512 = __builtin_ia32_select##T3##_512( \		Vec512 = __builtin_ia32_select##T3##_512( \
(__mmask8)Mask, \		(__mmask8)Mask, \
(__v8d##T2)Vec512, \		(__v8d##T2)Vec512, \
(__v8d##T2)Vec512Neutral); \		(__v8d##T2)Vec512Neutral); \
_mm512_reduce_operator_64bit(Vec512, Operator, T2, T1); \		_mm512_reduce_operator_64bit(Vec512, Operator, T2, T1); \
})		})

static __inline__ long long __DEFAULT_FN_ATTRS		static __inline__ long long __DEFAULT_FN_ATTRS512
_mm512_mask_reduce_add_epi64(__mmask8 __M, __m512i __W) {		_mm512_mask_reduce_add_epi64(__mmask8 __M, __m512i __W) {
_mm512_mask_reduce_operator_64bit(__W, _mm512_set1_epi64(0), +, __M, i, i, q);		_mm512_mask_reduce_operator_64bit(__W, _mm512_set1_epi64(0), +, __M, i, i, q);
}		}

static __inline__ long long __DEFAULT_FN_ATTRS		static __inline__ long long __DEFAULT_FN_ATTRS512
_mm512_mask_reduce_mul_epi64(__mmask8 __M, __m512i __W) {		_mm512_mask_reduce_mul_epi64(__mmask8 __M, __m512i __W) {
_mm512_mask_reduce_operator_64bit(__W, _mm512_set1_epi64(1), *, __M, i, i, q);		_mm512_mask_reduce_operator_64bit(__W, _mm512_set1_epi64(1), *, __M, i, i, q);
}		}

static __inline__ long long __DEFAULT_FN_ATTRS		static __inline__ long long __DEFAULT_FN_ATTRS512
_mm512_mask_reduce_and_epi64(__mmask8 __M, __m512i __W) {		_mm512_mask_reduce_and_epi64(__mmask8 __M, __m512i __W) {
_mm512_mask_reduce_operator_64bit(__W, _mm512_set1_epi64(0xFFFFFFFFFFFFFFFF),		_mm512_mask_reduce_operator_64bit(__W, _mm512_set1_epi64(0xFFFFFFFFFFFFFFFF),
&, __M, i, i, q);		&, __M, i, i, q);
}		}

static __inline__ long long __DEFAULT_FN_ATTRS		static __inline__ long long __DEFAULT_FN_ATTRS512
_mm512_mask_reduce_or_epi64(__mmask8 __M, __m512i __W) {		_mm512_mask_reduce_or_epi64(__mmask8 __M, __m512i __W) {
_mm512_mask_reduce_operator_64bit(__W, _mm512_set1_epi64(0), \|, __M,		_mm512_mask_reduce_operator_64bit(__W, _mm512_set1_epi64(0), \|, __M,
i, i, q);		i, i, q);
}		}

static __inline__ double __DEFAULT_FN_ATTRS		static __inline__ double __DEFAULT_FN_ATTRS512
_mm512_mask_reduce_add_pd(__mmask8 __M, __m512d __W) {		_mm512_mask_reduce_add_pd(__mmask8 __M, __m512d __W) {
_mm512_mask_reduce_operator_64bit(__W, _mm512_set1_pd(0), +, __M,		_mm512_mask_reduce_operator_64bit(__W, _mm512_set1_pd(0), +, __M,
f, d, pd);		f, d, pd);
}		}

static __inline__ double __DEFAULT_FN_ATTRS		static __inline__ double __DEFAULT_FN_ATTRS512
_mm512_mask_reduce_mul_pd(__mmask8 __M, __m512d __W) {		_mm512_mask_reduce_mul_pd(__mmask8 __M, __m512d __W) {
_mm512_mask_reduce_operator_64bit(__W, _mm512_set1_pd(1), *, __M,		_mm512_mask_reduce_operator_64bit(__W, _mm512_set1_pd(1), *, __M,
f, d, pd);		f, d, pd);
}		}
#undef _mm512_reduce_operator_64bit		#undef _mm512_reduce_operator_64bit
#undef _mm512_mask_reduce_operator_64bit		#undef _mm512_mask_reduce_operator_64bit

/* Vec512 - Vector with size 512.		/* Vec512 - Vector with size 512.
Show All 39 Lines	Vec128 = (__m128##T1)(__builtin_shufflevector( \
Operator \		Operator \
__builtin_shufflevector( \		__builtin_shufflevector( \
(__v4s##T2)Vec128, \		(__v4s##T2)Vec128, \
(__v4s##T2)Vec128, \		(__v4s##T2)Vec128, \
1, -1, -1, -1)); \		1, -1, -1, -1)); \
return Vec128[0]; \		return Vec128[0]; \
})		})

static __inline__ int __DEFAULT_FN_ATTRS		static __inline__ int __DEFAULT_FN_ATTRS512
_mm512_reduce_add_epi32(__m512i __W) {		_mm512_reduce_add_epi32(__m512i __W) {
_mm512_reduce_operator_32bit(__W, +, i, i);		_mm512_reduce_operator_32bit(__W, +, i, i);
}		}

static __inline__ int __DEFAULT_FN_ATTRS		static __inline__ int __DEFAULT_FN_ATTRS512
_mm512_reduce_mul_epi32(__m512i __W) {		_mm512_reduce_mul_epi32(__m512i __W) {
_mm512_reduce_operator_32bit(__W, *, i, i);		_mm512_reduce_operator_32bit(__W, *, i, i);
}		}

static __inline__ int __DEFAULT_FN_ATTRS		static __inline__ int __DEFAULT_FN_ATTRS512
_mm512_reduce_and_epi32(__m512i __W) {		_mm512_reduce_and_epi32(__m512i __W) {
_mm512_reduce_operator_32bit(__W, &, i, i);		_mm512_reduce_operator_32bit(__W, &, i, i);
}		}

static __inline__ int __DEFAULT_FN_ATTRS		static __inline__ int __DEFAULT_FN_ATTRS512
_mm512_reduce_or_epi32(__m512i __W) {		_mm512_reduce_or_epi32(__m512i __W) {
_mm512_reduce_operator_32bit(__W, \|, i, i);		_mm512_reduce_operator_32bit(__W, \|, i, i);
}		}

static __inline__ float __DEFAULT_FN_ATTRS		static __inline__ float __DEFAULT_FN_ATTRS512
_mm512_reduce_add_ps(__m512 __W) {		_mm512_reduce_add_ps(__m512 __W) {
_mm512_reduce_operator_32bit(__W, +, f, );		_mm512_reduce_operator_32bit(__W, +, f, );
}		}

static __inline__ float __DEFAULT_FN_ATTRS		static __inline__ float __DEFAULT_FN_ATTRS512
_mm512_reduce_mul_ps(__m512 __W) {		_mm512_reduce_mul_ps(__m512 __W) {
_mm512_reduce_operator_32bit(__W, *, f, );		_mm512_reduce_operator_32bit(__W, *, f, );
}		}

/* Vec512 - Vector with size 512.		/* Vec512 - Vector with size 512.
* Vec512Neutral - All vector elements set to the identity element.		* Vec512Neutral - All vector elements set to the identity element.
* Identity element: {+,0},{*,1},{&,0xFFFFFFFF},{\|,0}		* Identity element: {+,0},{*,1},{&,0xFFFFFFFF},{\|,0}
* Operator - Can be one of following: +,*,&,\|		* Operator - Can be one of following: +,*,&,\|
* Mask - Intrinsic Mask		* Mask - Intrinsic Mask
* T2 - Can get 'i' for int and 'f' for float.		* T2 - Can get 'i' for int and 'f' for float.
* T1 - Can get 'i' for int and 'd' for double.		* T1 - Can get 'i' for int and 'd' for double.
* T3 - Can be Ps for packed single or d for d-word.		* T3 - Can be Ps for packed single or d for d-word.
*/		*/

#define _mm512_mask_reduce_operator_32bit(Vec512, Vec512Neutral, Operator, \		#define _mm512_mask_reduce_operator_32bit(Vec512, Vec512Neutral, Operator, \
Mask, T2, T1, T3) \		Mask, T2, T1, T3) \
__extension__({ \		__extension__({ \
Vec512 = (__m512##T1)__builtin_ia32_select##T3##_512( \		Vec512 = (__m512##T1)__builtin_ia32_select##T3##_512( \
(__mmask16)Mask, \		(__mmask16)Mask, \
(__v16s##T2)Vec512, \		(__v16s##T2)Vec512, \
(__v16s##T2)Vec512Neutral); \		(__v16s##T2)Vec512Neutral); \
_mm512_reduce_operator_32bit(Vec512, Operator, T2, T1); \		_mm512_reduce_operator_32bit(Vec512, Operator, T2, T1); \
})		})

static __inline__ int __DEFAULT_FN_ATTRS		static __inline__ int __DEFAULT_FN_ATTRS512
_mm512_mask_reduce_add_epi32( __mmask16 __M, __m512i __W) {		_mm512_mask_reduce_add_epi32( __mmask16 __M, __m512i __W) {
_mm512_mask_reduce_operator_32bit(__W, _mm512_set1_epi32(0), +, __M, i, i, d);		_mm512_mask_reduce_operator_32bit(__W, _mm512_set1_epi32(0), +, __M, i, i, d);
}		}

static __inline__ int __DEFAULT_FN_ATTRS		static __inline__ int __DEFAULT_FN_ATTRS512
_mm512_mask_reduce_mul_epi32( __mmask16 __M, __m512i __W) {		_mm512_mask_reduce_mul_epi32( __mmask16 __M, __m512i __W) {
_mm512_mask_reduce_operator_32bit(__W, _mm512_set1_epi32(1), *, __M, i, i, d);		_mm512_mask_reduce_operator_32bit(__W, _mm512_set1_epi32(1), *, __M, i, i, d);
}		}

static __inline__ int __DEFAULT_FN_ATTRS		static __inline__ int __DEFAULT_FN_ATTRS512
_mm512_mask_reduce_and_epi32( __mmask16 __M, __m512i __W) {		_mm512_mask_reduce_and_epi32( __mmask16 __M, __m512i __W) {
_mm512_mask_reduce_operator_32bit(__W, _mm512_set1_epi32(0xFFFFFFFF), &, __M,		_mm512_mask_reduce_operator_32bit(__W, _mm512_set1_epi32(0xFFFFFFFF), &, __M,
i, i, d);		i, i, d);
}		}

static __inline__ int __DEFAULT_FN_ATTRS		static __inline__ int __DEFAULT_FN_ATTRS512
_mm512_mask_reduce_or_epi32(__mmask16 __M, __m512i __W) {		_mm512_mask_reduce_or_epi32(__mmask16 __M, __m512i __W) {
_mm512_mask_reduce_operator_32bit(__W, _mm512_set1_epi32(0), \|, __M, i, i, d);		_mm512_mask_reduce_operator_32bit(__W, _mm512_set1_epi32(0), \|, __M, i, i, d);
}		}

static __inline__ float __DEFAULT_FN_ATTRS		static __inline__ float __DEFAULT_FN_ATTRS512
_mm512_mask_reduce_add_ps(__mmask16 __M, __m512 __W) {		_mm512_mask_reduce_add_ps(__mmask16 __M, __m512 __W) {
_mm512_mask_reduce_operator_32bit(__W, _mm512_set1_ps(0), +, __M, f, , ps);		_mm512_mask_reduce_operator_32bit(__W, _mm512_set1_ps(0), +, __M, f, , ps);
}		}

static __inline__ float __DEFAULT_FN_ATTRS		static __inline__ float __DEFAULT_FN_ATTRS512
_mm512_mask_reduce_mul_ps(__mmask16 __M, __m512 __W) {		_mm512_mask_reduce_mul_ps(__mmask16 __M, __m512 __W) {
_mm512_mask_reduce_operator_32bit(__W, _mm512_set1_ps(1), *, __M, f, , ps);		_mm512_mask_reduce_operator_32bit(__W, _mm512_set1_ps(1), *, __M, f, , ps);
}		}
#undef _mm512_reduce_operator_32bit		#undef _mm512_reduce_operator_32bit
#undef _mm512_mask_reduce_operator_32bit		#undef _mm512_mask_reduce_operator_32bit

#define _mm512_mask_reduce_operator(op) \		#define _mm512_mask_reduce_operator(op) \
__m512i __t1 = (__m512i)__builtin_shufflevector((__v8di)__V, (__v8di)__V, 4, 5, 6, 7, 0, 1, 2, 3); \		__m512i __t1 = (__m512i)__builtin_shufflevector((__v8di)__V, (__v8di)__V, 4, 5, 6, 7, 0, 1, 2, 3); \
__m512i __t2 = _mm512_##op(__V, __t1); \		__m512i __t2 = _mm512_##op(__V, __t1); \
__m512i __t3 = (__m512i)__builtin_shufflevector((__v8di)__t2, (__v8di)__t2, 2, 3, 0, 1, 6, 7, 4, 5); \		__m512i __t3 = (__m512i)__builtin_shufflevector((__v8di)__t2, (__v8di)__t2, 2, 3, 0, 1, 6, 7, 4, 5); \
__m512i __t4 = _mm512_##op(__t2, __t3); \		__m512i __t4 = _mm512_##op(__t2, __t3); \
__m512i __t5 = (__m512i)__builtin_shufflevector((__v8di)__t4, (__v8di)__t4, 1, 0, 3, 2, 5, 4, 7, 6); \		__m512i __t5 = (__m512i)__builtin_shufflevector((__v8di)__t4, (__v8di)__t4, 1, 0, 3, 2, 5, 4, 7, 6); \
__v8di __t6 = (__v8di)_mm512_##op(__t4, __t5); \		__v8di __t6 = (__v8di)_mm512_##op(__t4, __t5); \
return __t6[0];		return __t6[0];

static __inline__ long long __DEFAULT_FN_ATTRS		static __inline__ long long __DEFAULT_FN_ATTRS512
_mm512_reduce_max_epi64(__m512i __V) {		_mm512_reduce_max_epi64(__m512i __V) {
_mm512_mask_reduce_operator(max_epi64);		_mm512_mask_reduce_operator(max_epi64);
}		}

static __inline__ unsigned long long __DEFAULT_FN_ATTRS		static __inline__ unsigned long long __DEFAULT_FN_ATTRS512
_mm512_reduce_max_epu64(__m512i __V) {		_mm512_reduce_max_epu64(__m512i __V) {
_mm512_mask_reduce_operator(max_epu64);		_mm512_mask_reduce_operator(max_epu64);
}		}

static __inline__ long long __DEFAULT_FN_ATTRS		static __inline__ long long __DEFAULT_FN_ATTRS512
_mm512_reduce_min_epi64(__m512i __V) {		_mm512_reduce_min_epi64(__m512i __V) {
_mm512_mask_reduce_operator(min_epi64);		_mm512_mask_reduce_operator(min_epi64);
}		}

static __inline__ unsigned long long __DEFAULT_FN_ATTRS		static __inline__ unsigned long long __DEFAULT_FN_ATTRS512
_mm512_reduce_min_epu64(__m512i __V) {		_mm512_reduce_min_epu64(__m512i __V) {
_mm512_mask_reduce_operator(min_epu64);		_mm512_mask_reduce_operator(min_epu64);
}		}

static __inline__ long long __DEFAULT_FN_ATTRS		static __inline__ long long __DEFAULT_FN_ATTRS512
_mm512_mask_reduce_max_epi64(__mmask8 __M, __m512i __V) {		_mm512_mask_reduce_max_epi64(__mmask8 __M, __m512i __V) {
__V = _mm512_mask_mov_epi64(_mm512_set1_epi64(-__LONG_LONG_MAX__ - 1LL), __M, __V);		__V = _mm512_mask_mov_epi64(_mm512_set1_epi64(-__LONG_LONG_MAX__ - 1LL), __M, __V);
_mm512_mask_reduce_operator(max_epi64);		_mm512_mask_reduce_operator(max_epi64);
}		}

static __inline__ unsigned long long __DEFAULT_FN_ATTRS		static __inline__ unsigned long long __DEFAULT_FN_ATTRS512
_mm512_mask_reduce_max_epu64(__mmask8 __M, __m512i __V) {		_mm512_mask_reduce_max_epu64(__mmask8 __M, __m512i __V) {
__V = _mm512_maskz_mov_epi64(__M, __V);		__V = _mm512_maskz_mov_epi64(__M, __V);
_mm512_mask_reduce_operator(max_epu64);		_mm512_mask_reduce_operator(max_epu64);
}		}

static __inline__ long long __DEFAULT_FN_ATTRS		static __inline__ long long __DEFAULT_FN_ATTRS512
_mm512_mask_reduce_min_epi64(__mmask8 __M, __m512i __V) {		_mm512_mask_reduce_min_epi64(__mmask8 __M, __m512i __V) {
__V = _mm512_mask_mov_epi64(_mm512_set1_epi64(__LONG_LONG_MAX__), __M, __V);		__V = _mm512_mask_mov_epi64(_mm512_set1_epi64(__LONG_LONG_MAX__), __M, __V);
_mm512_mask_reduce_operator(min_epi64);		_mm512_mask_reduce_operator(min_epi64);
}		}

static __inline__ unsigned long long __DEFAULT_FN_ATTRS		static __inline__ unsigned long long __DEFAULT_FN_ATTRS512
_mm512_mask_reduce_min_epu64(__mmask8 __M, __m512i __V) {		_mm512_mask_reduce_min_epu64(__mmask8 __M, __m512i __V) {
__V = _mm512_mask_mov_epi64(_mm512_set1_epi64(~0ULL), __M, __V);		__V = _mm512_mask_mov_epi64(_mm512_set1_epi64(~0ULL), __M, __V);
_mm512_mask_reduce_operator(min_epu64);		_mm512_mask_reduce_operator(min_epu64);
}		}
#undef _mm512_mask_reduce_operator		#undef _mm512_mask_reduce_operator

#define _mm512_mask_reduce_operator(op) \		#define _mm512_mask_reduce_operator(op) \
__m256i __t1 = _mm512_extracti64x4_epi64(__V, 0); \		__m256i __t1 = _mm512_extracti64x4_epi64(__V, 0); \
__m256i __t2 = _mm512_extracti64x4_epi64(__V, 1); \		__m256i __t2 = _mm512_extracti64x4_epi64(__V, 1); \
__m256i __t3 = _mm256_##op(__t1, __t2); \		__m256i __t3 = _mm256_##op(__t1, __t2); \
__m128i __t4 = _mm256_extracti128_si256(__t3, 0); \		__m128i __t4 = _mm256_extracti128_si256(__t3, 0); \
__m128i __t5 = _mm256_extracti128_si256(__t3, 1); \		__m128i __t5 = _mm256_extracti128_si256(__t3, 1); \
__m128i __t6 = _mm_##op(__t4, __t5); \		__m128i __t6 = _mm_##op(__t4, __t5); \
__m128i __t7 = (__m128i)__builtin_shufflevector((__v4si)__t6, (__v4si)__t6, 2, 3, 0, 1); \		__m128i __t7 = (__m128i)__builtin_shufflevector((__v4si)__t6, (__v4si)__t6, 2, 3, 0, 1); \
__m128i __t8 = _mm_##op(__t6, __t7); \		__m128i __t8 = _mm_##op(__t6, __t7); \
__m128i __t9 = (__m128i)__builtin_shufflevector((__v4si)__t8, (__v4si)__t8, 1, 0, 3, 2); \		__m128i __t9 = (__m128i)__builtin_shufflevector((__v4si)__t8, (__v4si)__t8, 1, 0, 3, 2); \
__v4si __t10 = (__v4si)_mm_##op(__t8, __t9); \		__v4si __t10 = (__v4si)_mm_##op(__t8, __t9); \
return __t10[0];		return __t10[0];

static __inline__ int __DEFAULT_FN_ATTRS		static __inline__ int __DEFAULT_FN_ATTRS512
_mm512_reduce_max_epi32(__m512i __V) {		_mm512_reduce_max_epi32(__m512i __V) {
_mm512_mask_reduce_operator(max_epi32);		_mm512_mask_reduce_operator(max_epi32);
}		}

static __inline__ unsigned int __DEFAULT_FN_ATTRS		static __inline__ unsigned int __DEFAULT_FN_ATTRS512
_mm512_reduce_max_epu32(__m512i __V) {		_mm512_reduce_max_epu32(__m512i __V) {
_mm512_mask_reduce_operator(max_epu32);		_mm512_mask_reduce_operator(max_epu32);
}		}

static __inline__ int __DEFAULT_FN_ATTRS		static __inline__ int __DEFAULT_FN_ATTRS512
_mm512_reduce_min_epi32(__m512i __V) {		_mm512_reduce_min_epi32(__m512i __V) {
_mm512_mask_reduce_operator(min_epi32);		_mm512_mask_reduce_operator(min_epi32);
}		}

static __inline__ unsigned int __DEFAULT_FN_ATTRS		static __inline__ unsigned int __DEFAULT_FN_ATTRS512
_mm512_reduce_min_epu32(__m512i __V) {		_mm512_reduce_min_epu32(__m512i __V) {
_mm512_mask_reduce_operator(min_epu32);		_mm512_mask_reduce_operator(min_epu32);
}		}

static __inline__ int __DEFAULT_FN_ATTRS		static __inline__ int __DEFAULT_FN_ATTRS512
_mm512_mask_reduce_max_epi32(__mmask16 __M, __m512i __V) {		_mm512_mask_reduce_max_epi32(__mmask16 __M, __m512i __V) {
__V = _mm512_mask_mov_epi32(_mm512_set1_epi32(-__INT_MAX__ - 1), __M, __V);		__V = _mm512_mask_mov_epi32(_mm512_set1_epi32(-__INT_MAX__ - 1), __M, __V);
_mm512_mask_reduce_operator(max_epi32);		_mm512_mask_reduce_operator(max_epi32);
}		}

static __inline__ unsigned int __DEFAULT_FN_ATTRS		static __inline__ unsigned int __DEFAULT_FN_ATTRS512
_mm512_mask_reduce_max_epu32(__mmask16 __M, __m512i __V) {		_mm512_mask_reduce_max_epu32(__mmask16 __M, __m512i __V) {
__V = _mm512_maskz_mov_epi32(__M, __V);		__V = _mm512_maskz_mov_epi32(__M, __V);
_mm512_mask_reduce_operator(max_epu32);		_mm512_mask_reduce_operator(max_epu32);
}		}

static __inline__ int __DEFAULT_FN_ATTRS		static __inline__ int __DEFAULT_FN_ATTRS512
_mm512_mask_reduce_min_epi32(__mmask16 __M, __m512i __V) {		_mm512_mask_reduce_min_epi32(__mmask16 __M, __m512i __V) {
__V = _mm512_mask_mov_epi32(_mm512_set1_epi32(__INT_MAX__), __M, __V);		__V = _mm512_mask_mov_epi32(_mm512_set1_epi32(__INT_MAX__), __M, __V);
_mm512_mask_reduce_operator(min_epi32);		_mm512_mask_reduce_operator(min_epi32);
}		}

static __inline__ unsigned int __DEFAULT_FN_ATTRS		static __inline__ unsigned int __DEFAULT_FN_ATTRS512
_mm512_mask_reduce_min_epu32(__mmask16 __M, __m512i __V) {		_mm512_mask_reduce_min_epu32(__mmask16 __M, __m512i __V) {
__V = _mm512_mask_mov_epi32(_mm512_set1_epi32(~0U), __M, __V);		__V = _mm512_mask_mov_epi32(_mm512_set1_epi32(~0U), __M, __V);
_mm512_mask_reduce_operator(min_epu32);		_mm512_mask_reduce_operator(min_epu32);
}		}
#undef _mm512_mask_reduce_operator		#undef _mm512_mask_reduce_operator

#define _mm512_mask_reduce_operator(op) \		#define _mm512_mask_reduce_operator(op) \
__m256d __t1 = _mm512_extractf64x4_pd(__V, 0); \		__m256d __t1 = _mm512_extractf64x4_pd(__V, 0); \
__m256d __t2 = _mm512_extractf64x4_pd(__V, 1); \		__m256d __t2 = _mm512_extractf64x4_pd(__V, 1); \
__m256d __t3 = _mm256_##op(__t1, __t2); \		__m256d __t3 = _mm256_##op(__t1, __t2); \
__m128d __t4 = _mm256_extractf128_pd(__t3, 0); \		__m128d __t4 = _mm256_extractf128_pd(__t3, 0); \
__m128d __t5 = _mm256_extractf128_pd(__t3, 1); \		__m128d __t5 = _mm256_extractf128_pd(__t3, 1); \
__m128d __t6 = _mm_##op(__t4, __t5); \		__m128d __t6 = _mm_##op(__t4, __t5); \
__m128d __t7 = __builtin_shufflevector(__t6, __t6, 1, 0); \		__m128d __t7 = __builtin_shufflevector(__t6, __t6, 1, 0); \
__m128d __t8 = _mm_##op(__t6, __t7); \		__m128d __t8 = _mm_##op(__t6, __t7); \
return __t8[0];		return __t8[0];

static __inline__ double __DEFAULT_FN_ATTRS		static __inline__ double __DEFAULT_FN_ATTRS512
_mm512_reduce_max_pd(__m512d __V) {		_mm512_reduce_max_pd(__m512d __V) {
_mm512_mask_reduce_operator(max_pd);		_mm512_mask_reduce_operator(max_pd);
}		}

static __inline__ double __DEFAULT_FN_ATTRS		static __inline__ double __DEFAULT_FN_ATTRS512
_mm512_reduce_min_pd(__m512d __V) {		_mm512_reduce_min_pd(__m512d __V) {
_mm512_mask_reduce_operator(min_pd);		_mm512_mask_reduce_operator(min_pd);
}		}

static __inline__ double __DEFAULT_FN_ATTRS		static __inline__ double __DEFAULT_FN_ATTRS512
_mm512_mask_reduce_max_pd(__mmask8 __M, __m512d __V) {		_mm512_mask_reduce_max_pd(__mmask8 __M, __m512d __V) {
__V = _mm512_mask_mov_pd(_mm512_set1_pd(-__builtin_inf()), __M, __V);		__V = _mm512_mask_mov_pd(_mm512_set1_pd(-__builtin_inf()), __M, __V);
_mm512_mask_reduce_operator(max_pd);		_mm512_mask_reduce_operator(max_pd);
}		}

static __inline__ double __DEFAULT_FN_ATTRS		static __inline__ double __DEFAULT_FN_ATTRS512
_mm512_mask_reduce_min_pd(__mmask8 __M, __m512d __V) {		_mm512_mask_reduce_min_pd(__mmask8 __M, __m512d __V) {
__V = _mm512_mask_mov_pd(_mm512_set1_pd(__builtin_inf()), __M, __V);		__V = _mm512_mask_mov_pd(_mm512_set1_pd(__builtin_inf()), __M, __V);
_mm512_mask_reduce_operator(min_pd);		_mm512_mask_reduce_operator(min_pd);
}		}
#undef _mm512_mask_reduce_operator		#undef _mm512_mask_reduce_operator

#define _mm512_mask_reduce_operator(op) \		#define _mm512_mask_reduce_operator(op) \
__m256 __t1 = (__m256)_mm512_extractf64x4_pd((__m512d)__V, 0); \		__m256 __t1 = (__m256)_mm512_extractf64x4_pd((__m512d)__V, 0); \
__m256 __t2 = (__m256)_mm512_extractf64x4_pd((__m512d)__V, 1); \		__m256 __t2 = (__m256)_mm512_extractf64x4_pd((__m512d)__V, 1); \
__m256 __t3 = _mm256_##op(__t1, __t2); \		__m256 __t3 = _mm256_##op(__t1, __t2); \
__m128 __t4 = _mm256_extractf128_ps(__t3, 0); \		__m128 __t4 = _mm256_extractf128_ps(__t3, 0); \
__m128 __t5 = _mm256_extractf128_ps(__t3, 1); \		__m128 __t5 = _mm256_extractf128_ps(__t3, 1); \
__m128 __t6 = _mm_##op(__t4, __t5); \		__m128 __t6 = _mm_##op(__t4, __t5); \
__m128 __t7 = __builtin_shufflevector(__t6, __t6, 2, 3, 0, 1); \		__m128 __t7 = __builtin_shufflevector(__t6, __t6, 2, 3, 0, 1); \
__m128 __t8 = _mm_##op(__t6, __t7); \		__m128 __t8 = _mm_##op(__t6, __t7); \
__m128 __t9 = __builtin_shufflevector(__t8, __t8, 1, 0, 3, 2); \		__m128 __t9 = __builtin_shufflevector(__t8, __t8, 1, 0, 3, 2); \
__m128 __t10 = _mm_##op(__t8, __t9); \		__m128 __t10 = _mm_##op(__t8, __t9); \
return __t10[0];		return __t10[0];

static __inline__ float __DEFAULT_FN_ATTRS		static __inline__ float __DEFAULT_FN_ATTRS512
_mm512_reduce_max_ps(__m512 __V) {		_mm512_reduce_max_ps(__m512 __V) {
_mm512_mask_reduce_operator(max_ps);		_mm512_mask_reduce_operator(max_ps);
}		}

static __inline__ float __DEFAULT_FN_ATTRS		static __inline__ float __DEFAULT_FN_ATTRS512
_mm512_reduce_min_ps(__m512 __V) {		_mm512_reduce_min_ps(__m512 __V) {
_mm512_mask_reduce_operator(min_ps);		_mm512_mask_reduce_operator(min_ps);
}		}

static __inline__ float __DEFAULT_FN_ATTRS		static __inline__ float __DEFAULT_FN_ATTRS512
_mm512_mask_reduce_max_ps(__mmask16 __M, __m512 __V) {		_mm512_mask_reduce_max_ps(__mmask16 __M, __m512 __V) {
__V = _mm512_mask_mov_ps(_mm512_set1_ps(-__builtin_inff()), __M, __V);		__V = _mm512_mask_mov_ps(_mm512_set1_ps(-__builtin_inff()), __M, __V);
_mm512_mask_reduce_operator(max_ps);		_mm512_mask_reduce_operator(max_ps);
}		}

static __inline__ float __DEFAULT_FN_ATTRS		static __inline__ float __DEFAULT_FN_ATTRS512
_mm512_mask_reduce_min_ps(__mmask16 __M, __m512 __V) {		_mm512_mask_reduce_min_ps(__mmask16 __M, __m512 __V) {
__V = _mm512_mask_mov_ps(_mm512_set1_ps(__builtin_inff()), __M, __V);		__V = _mm512_mask_mov_ps(_mm512_set1_ps(__builtin_inff()), __M, __V);
_mm512_mask_reduce_operator(min_ps);		_mm512_mask_reduce_operator(min_ps);
}		}
#undef _mm512_mask_reduce_operator		#undef _mm512_mask_reduce_operator

#undef __DEFAULT_FN_ATTRS		#undef __DEFAULT_FN_ATTRS512
		#undef __DEFAULT_FN_ATTRS128

#endif /* __AVX512FINTRIN_H */		#endif /* __AVX512FINTRIN_H */

lib/Headers/avx512ifmaintrin.h

	Show All 23 Lines
	#ifndef __IMMINTRIN_H			#ifndef __IMMINTRIN_H
	#error "Never use <avx512ifmaintrin.h> directly; include <immintrin.h> instead."			#error "Never use <avx512ifmaintrin.h> directly; include <immintrin.h> instead."
	#endif			#endif

	#ifndef __IFMAINTRIN_H			#ifndef __IFMAINTRIN_H
	#define __IFMAINTRIN_H			#define __IFMAINTRIN_H

	/* Define the default attributes for the functions in this file. */			/* Define the default attributes for the functions in this file. */
	#define __DEFAULT_FN_ATTRS __attribute__((__always_inline__, __nodebug__, __target__("avx512ifma")))			#define __DEFAULT_FN_ATTRS __attribute__((__always_inline__, __nodebug__, __target__("avx512ifma"), __min_vector_width__(512)))

	static __inline__ __m512i __DEFAULT_FN_ATTRS			static __inline__ __m512i __DEFAULT_FN_ATTRS
	_mm512_madd52hi_epu64 (__m512i __X, __m512i __Y, __m512i __Z)			_mm512_madd52hi_epu64 (__m512i __X, __m512i __Y, __m512i __Z)
	{			{
	return (__m512i)__builtin_ia32_vpmadd52huq512((__v8di) __X, (__v8di) __Y,			return (__m512i)__builtin_ia32_vpmadd52huq512((__v8di) __X, (__v8di) __Y,
	(__v8di) __Z);			(__v8di) __Z);
	}			}

	▲ Show 20 Lines • Show All 42 Lines • Show Last 20 Lines

lib/Headers/avx512ifmavlintrin.h

	Show All 23 Lines
	#ifndef __IMMINTRIN_H			#ifndef __IMMINTRIN_H
	#error "Never use <avx512ifmavlintrin.h> directly; include <immintrin.h> instead."			#error "Never use <avx512ifmavlintrin.h> directly; include <immintrin.h> instead."
	#endif			#endif

	#ifndef __IFMAVLINTRIN_H			#ifndef __IFMAVLINTRIN_H
	#define __IFMAVLINTRIN_H			#define __IFMAVLINTRIN_H

	/* Define the default attributes for the functions in this file. */			/* Define the default attributes for the functions in this file. */
	#define __DEFAULT_FN_ATTRS __attribute__((__always_inline__, __nodebug__, __target__("avx512ifma,avx512vl")))			#define __DEFAULT_FN_ATTRS128 __attribute__((__always_inline__, __nodebug__, __target__("avx512ifma,avx512vl"), __min_vector_width__(128)))
				#define __DEFAULT_FN_ATTRS256 __attribute__((__always_inline__, __nodebug__, __target__("avx512ifma,avx512vl"), __min_vector_width__(256)))



	static __inline__ __m128i __DEFAULT_FN_ATTRS			static __inline__ __m128i __DEFAULT_FN_ATTRS128
	_mm_madd52hi_epu64 (__m128i __X, __m128i __Y, __m128i __Z)			_mm_madd52hi_epu64 (__m128i __X, __m128i __Y, __m128i __Z)
	{			{
	return (__m128i)__builtin_ia32_vpmadd52huq128((__v2di) __X, (__v2di) __Y,			return (__m128i)__builtin_ia32_vpmadd52huq128((__v2di) __X, (__v2di) __Y,
	(__v2di) __Z);			(__v2di) __Z);
	}			}

	static __inline__ __m128i __DEFAULT_FN_ATTRS			static __inline__ __m128i __DEFAULT_FN_ATTRS128
	_mm_mask_madd52hi_epu64 (__m128i __W, __mmask8 __M, __m128i __X, __m128i __Y)			_mm_mask_madd52hi_epu64 (__m128i __W, __mmask8 __M, __m128i __X, __m128i __Y)
	{			{
	return (__m128i)__builtin_ia32_selectq_128(__M,			return (__m128i)__builtin_ia32_selectq_128(__M,
	(__v2di)_mm_madd52hi_epu64(__W, __X, __Y),			(__v2di)_mm_madd52hi_epu64(__W, __X, __Y),
	(__v2di)__W);			(__v2di)__W);
	}			}

	static __inline__ __m128i __DEFAULT_FN_ATTRS			static __inline__ __m128i __DEFAULT_FN_ATTRS128
	_mm_maskz_madd52hi_epu64 (__mmask8 __M, __m128i __X, __m128i __Y, __m128i __Z)			_mm_maskz_madd52hi_epu64 (__mmask8 __M, __m128i __X, __m128i __Y, __m128i __Z)
	{			{
	return (__m128i)__builtin_ia32_selectq_128(__M,			return (__m128i)__builtin_ia32_selectq_128(__M,
	(__v2di)_mm_madd52hi_epu64(__X, __Y, __Z),			(__v2di)_mm_madd52hi_epu64(__X, __Y, __Z),
	(__v2di)_mm_setzero_si128());			(__v2di)_mm_setzero_si128());
	}			}

	static __inline__ __m256i __DEFAULT_FN_ATTRS			static __inline__ __m256i __DEFAULT_FN_ATTRS256
	_mm256_madd52hi_epu64 (__m256i __X, __m256i __Y, __m256i __Z)			_mm256_madd52hi_epu64 (__m256i __X, __m256i __Y, __m256i __Z)
	{			{
	return (__m256i)__builtin_ia32_vpmadd52huq256((__v4di)__X, (__v4di)__Y,			return (__m256i)__builtin_ia32_vpmadd52huq256((__v4di)__X, (__v4di)__Y,
	(__v4di)__Z);			(__v4di)__Z);
	}			}

	static __inline__ __m256i __DEFAULT_FN_ATTRS			static __inline__ __m256i __DEFAULT_FN_ATTRS256
	_mm256_mask_madd52hi_epu64 (__m256i __W, __mmask8 __M, __m256i __X, __m256i __Y)			_mm256_mask_madd52hi_epu64 (__m256i __W, __mmask8 __M, __m256i __X, __m256i __Y)
	{			{
	return (__m256i)__builtin_ia32_selectq_256(__M,			return (__m256i)__builtin_ia32_selectq_256(__M,
	(__v4di)_mm256_madd52hi_epu64(__W, __X, __Y),			(__v4di)_mm256_madd52hi_epu64(__W, __X, __Y),
	(__v4di)__W);			(__v4di)__W);
	}			}

	static __inline__ __m256i __DEFAULT_FN_ATTRS			static __inline__ __m256i __DEFAULT_FN_ATTRS256
	_mm256_maskz_madd52hi_epu64 (__mmask8 __M, __m256i __X, __m256i __Y, __m256i __Z)			_mm256_maskz_madd52hi_epu64 (__mmask8 __M, __m256i __X, __m256i __Y, __m256i __Z)
	{			{
	return (__m256i)__builtin_ia32_selectq_256(__M,			return (__m256i)__builtin_ia32_selectq_256(__M,
	(__v4di)_mm256_madd52hi_epu64(__X, __Y, __Z),			(__v4di)_mm256_madd52hi_epu64(__X, __Y, __Z),
	(__v4di)_mm256_setzero_si256());			(__v4di)_mm256_setzero_si256());
	}			}

	static __inline__ __m128i __DEFAULT_FN_ATTRS			static __inline__ __m128i __DEFAULT_FN_ATTRS128
	_mm_madd52lo_epu64 (__m128i __X, __m128i __Y, __m128i __Z)			_mm_madd52lo_epu64 (__m128i __X, __m128i __Y, __m128i __Z)
	{			{
	return (__m128i)__builtin_ia32_vpmadd52luq128((__v2di)__X, (__v2di)__Y,			return (__m128i)__builtin_ia32_vpmadd52luq128((__v2di)__X, (__v2di)__Y,
	(__v2di)__Z);			(__v2di)__Z);
	}			}

	static __inline__ __m128i __DEFAULT_FN_ATTRS			static __inline__ __m128i __DEFAULT_FN_ATTRS128
	_mm_mask_madd52lo_epu64 (__m128i __W, __mmask8 __M, __m128i __X, __m128i __Y)			_mm_mask_madd52lo_epu64 (__m128i __W, __mmask8 __M, __m128i __X, __m128i __Y)
	{			{
	return (__m128i)__builtin_ia32_selectq_128(__M,			return (__m128i)__builtin_ia32_selectq_128(__M,
	(__v2di)_mm_madd52lo_epu64(__W, __X, __Y),			(__v2di)_mm_madd52lo_epu64(__W, __X, __Y),
	(__v2di)__W);			(__v2di)__W);
	}			}

	static __inline__ __m128i __DEFAULT_FN_ATTRS			static __inline__ __m128i __DEFAULT_FN_ATTRS128
	_mm_maskz_madd52lo_epu64 (__mmask8 __M, __m128i __X, __m128i __Y, __m128i __Z)			_mm_maskz_madd52lo_epu64 (__mmask8 __M, __m128i __X, __m128i __Y, __m128i __Z)
	{			{
	return (__m128i)__builtin_ia32_selectq_128(__M,			return (__m128i)__builtin_ia32_selectq_128(__M,
	(__v2di)_mm_madd52lo_epu64(__X, __Y, __Z),			(__v2di)_mm_madd52lo_epu64(__X, __Y, __Z),
	(__v2di)_mm_setzero_si128());			(__v2di)_mm_setzero_si128());
	}			}

	static __inline__ __m256i __DEFAULT_FN_ATTRS			static __inline__ __m256i __DEFAULT_FN_ATTRS256
	_mm256_madd52lo_epu64 (__m256i __X, __m256i __Y, __m256i __Z)			_mm256_madd52lo_epu64 (__m256i __X, __m256i __Y, __m256i __Z)
	{			{
	return (__m256i)__builtin_ia32_vpmadd52luq256((__v4di)__X, (__v4di)__Y,			return (__m256i)__builtin_ia32_vpmadd52luq256((__v4di)__X, (__v4di)__Y,
	(__v4di)__Z);			(__v4di)__Z);
	}			}

	static __inline__ __m256i __DEFAULT_FN_ATTRS			static __inline__ __m256i __DEFAULT_FN_ATTRS256
	_mm256_mask_madd52lo_epu64 (__m256i __W, __mmask8 __M, __m256i __X, __m256i __Y)			_mm256_mask_madd52lo_epu64 (__m256i __W, __mmask8 __M, __m256i __X, __m256i __Y)
	{			{
	return (__m256i)__builtin_ia32_selectq_256(__M,			return (__m256i)__builtin_ia32_selectq_256(__M,
	(__v4di)_mm256_madd52lo_epu64(__W, __X, __Y),			(__v4di)_mm256_madd52lo_epu64(__W, __X, __Y),
	(__v4di)__W);			(__v4di)__W);
	}			}

	static __inline__ __m256i __DEFAULT_FN_ATTRS			static __inline__ __m256i __DEFAULT_FN_ATTRS256
	_mm256_maskz_madd52lo_epu64 (__mmask8 __M, __m256i __X, __m256i __Y, __m256i __Z)			_mm256_maskz_madd52lo_epu64 (__mmask8 __M, __m256i __X, __m256i __Y, __m256i __Z)
	{			{
	return (__m256i)__builtin_ia32_selectq_256(__M,			return (__m256i)__builtin_ia32_selectq_256(__M,
	(__v4di)_mm256_madd52lo_epu64(__X, __Y, __Z),			(__v4di)_mm256_madd52lo_epu64(__X, __Y, __Z),
	(__v4di)_mm256_setzero_si256());			(__v4di)_mm256_setzero_si256());
	}			}


	#undef __DEFAULT_FN_ATTRS			#undef __DEFAULT_FN_ATTRS128
				#undef __DEFAULT_FN_ATTRS256

	#endif			#endif

lib/Headers/avx512vbmi2intrin.h

	Show All 23 Lines
	#ifndef __IMMINTRIN_H			#ifndef __IMMINTRIN_H
	#error "Never use <avx512vbmi2intrin.h> directly; include <immintrin.h> instead."			#error "Never use <avx512vbmi2intrin.h> directly; include <immintrin.h> instead."
	#endif			#endif

	#ifndef __AVX512VBMI2INTRIN_H			#ifndef __AVX512VBMI2INTRIN_H
	#define __AVX512VBMI2INTRIN_H			#define __AVX512VBMI2INTRIN_H

	/* Define the default attributes for the functions in this file. */			/* Define the default attributes for the functions in this file. */
	#define __DEFAULT_FN_ATTRS __attribute__((__always_inline__, __nodebug__, __target__("avx512vbmi2")))			#define __DEFAULT_FN_ATTRS __attribute__((__always_inline__, __nodebug__, __target__("avx512vbmi2"), __min_vector_width__(512)))


	static __inline__ __m512i __DEFAULT_FN_ATTRS			static __inline__ __m512i __DEFAULT_FN_ATTRS
	_mm512_mask_compress_epi16(__m512i __S, __mmask32 __U, __m512i __D)			_mm512_mask_compress_epi16(__m512i __S, __mmask32 __U, __m512i __D)
	{			{
	return (__m512i) __builtin_ia32_compresshi512_mask ((__v32hi) __D,			return (__m512i) __builtin_ia32_compresshi512_mask ((__v32hi) __D,
	(__v32hi) __S,			(__v32hi) __S,
	__U);			__U);
	▲ Show 20 Lines • Show All 357 Lines • Show Last 20 Lines

lib/Headers/avx512vbmiintrin.h

	Show All 23 Lines
	#ifndef __IMMINTRIN_H			#ifndef __IMMINTRIN_H
	#error "Never use <avx512vbmiintrin.h> directly; include <immintrin.h> instead."			#error "Never use <avx512vbmiintrin.h> directly; include <immintrin.h> instead."
	#endif			#endif

	#ifndef __VBMIINTRIN_H			#ifndef __VBMIINTRIN_H
	#define __VBMIINTRIN_H			#define __VBMIINTRIN_H

	/* Define the default attributes for the functions in this file. */			/* Define the default attributes for the functions in this file. */
	#define __DEFAULT_FN_ATTRS __attribute__((__always_inline__, __nodebug__, __target__("avx512vbmi")))			#define __DEFAULT_FN_ATTRS __attribute__((__always_inline__, __nodebug__, __target__("avx512vbmi"), __min_vector_width__(512)))


	static __inline__ __m512i __DEFAULT_FN_ATTRS			static __inline__ __m512i __DEFAULT_FN_ATTRS
	_mm512_permutex2var_epi8(__m512i __A, __m512i __I, __m512i __B)			_mm512_permutex2var_epi8(__m512i __A, __m512i __I, __m512i __B)
	{			{
	return (__m512i)__builtin_ia32_vpermi2varqi512((__v64qi)__A, (__v64qi)__I,			return (__m512i)__builtin_ia32_vpermi2varqi512((__v64qi)__A, (__v64qi)__I,
	(__v64qi) __B);			(__v64qi) __B);
	}			}
	▲ Show 20 Lines • Show All 83 Lines • Show Last 20 Lines

lib/Headers/avx512vbmivlintrin.h

	Show All 23 Lines
	#ifndef __IMMINTRIN_H			#ifndef __IMMINTRIN_H
	#error "Never use <avx512vbmivlintrin.h> directly; include <immintrin.h> instead."			#error "Never use <avx512vbmivlintrin.h> directly; include <immintrin.h> instead."
	#endif			#endif

	#ifndef __VBMIVLINTRIN_H			#ifndef __VBMIVLINTRIN_H
	#define __VBMIVLINTRIN_H			#define __VBMIVLINTRIN_H

	/* Define the default attributes for the functions in this file. */			/* Define the default attributes for the functions in this file. */
	#define __DEFAULT_FN_ATTRS __attribute__((__always_inline__, __nodebug__, __target__("avx512vbmi,avx512vl")))			#define __DEFAULT_FN_ATTRS128 __attribute__((__always_inline__, __nodebug__, __target__("avx512vbmi,avx512vl"), __min_vector_width__(128)))
				#define __DEFAULT_FN_ATTRS256 __attribute__((__always_inline__, __nodebug__, __target__("avx512vbmi,avx512vl"), __min_vector_width__(256)))


	static __inline__ __m128i __DEFAULT_FN_ATTRS			static __inline__ __m128i __DEFAULT_FN_ATTRS128
	_mm_permutex2var_epi8(__m128i __A, __m128i __I, __m128i __B)			_mm_permutex2var_epi8(__m128i __A, __m128i __I, __m128i __B)
	{			{
	return (__m128i)__builtin_ia32_vpermi2varqi128((__v16qi)__A,			return (__m128i)__builtin_ia32_vpermi2varqi128((__v16qi)__A,
	(__v16qi)__I,			(__v16qi)__I,
	(__v16qi)__B);			(__v16qi)__B);
	}			}

	static __inline__ __m128i __DEFAULT_FN_ATTRS			static __inline__ __m128i __DEFAULT_FN_ATTRS128
	_mm_mask_permutex2var_epi8(__m128i __A, __mmask16 __U, __m128i __I,			_mm_mask_permutex2var_epi8(__m128i __A, __mmask16 __U, __m128i __I,
	__m128i __B)			__m128i __B)
	{			{
	return (__m128i)__builtin_ia32_selectb_128(__U,			return (__m128i)__builtin_ia32_selectb_128(__U,
	(__v16qi)_mm_permutex2var_epi8(__A, __I, __B),			(__v16qi)_mm_permutex2var_epi8(__A, __I, __B),
	(__v16qi)__A);			(__v16qi)__A);
	}			}

	static __inline__ __m128i __DEFAULT_FN_ATTRS			static __inline__ __m128i __DEFAULT_FN_ATTRS128
	_mm_mask2_permutex2var_epi8(__m128i __A, __m128i __I, __mmask16 __U,			_mm_mask2_permutex2var_epi8(__m128i __A, __m128i __I, __mmask16 __U,
	__m128i __B)			__m128i __B)
	{			{
	return (__m128i)__builtin_ia32_selectb_128(__U,			return (__m128i)__builtin_ia32_selectb_128(__U,
	(__v16qi)_mm_permutex2var_epi8(__A, __I, __B),			(__v16qi)_mm_permutex2var_epi8(__A, __I, __B),
	(__v16qi)__I);			(__v16qi)__I);
	}			}

	static __inline__ __m128i __DEFAULT_FN_ATTRS			static __inline__ __m128i __DEFAULT_FN_ATTRS128
	_mm_maskz_permutex2var_epi8(__mmask16 __U, __m128i __A, __m128i __I,			_mm_maskz_permutex2var_epi8(__mmask16 __U, __m128i __A, __m128i __I,
	__m128i __B)			__m128i __B)
	{			{
	return (__m128i)__builtin_ia32_selectb_128(__U,			return (__m128i)__builtin_ia32_selectb_128(__U,
	(__v16qi)_mm_permutex2var_epi8(__A, __I, __B),			(__v16qi)_mm_permutex2var_epi8(__A, __I, __B),
	(__v16qi)_mm_setzero_si128());			(__v16qi)_mm_setzero_si128());
	}			}

	static __inline__ __m256i __DEFAULT_FN_ATTRS			static __inline__ __m256i __DEFAULT_FN_ATTRS256
	_mm256_permutex2var_epi8(__m256i __A, __m256i __I, __m256i __B)			_mm256_permutex2var_epi8(__m256i __A, __m256i __I, __m256i __B)
	{			{
	return (__m256i)__builtin_ia32_vpermi2varqi256((__v32qi)__A, (__v32qi)__I,			return (__m256i)__builtin_ia32_vpermi2varqi256((__v32qi)__A, (__v32qi)__I,
	(__v32qi)__B);			(__v32qi)__B);
	}			}

	static __inline__ __m256i __DEFAULT_FN_ATTRS			static __inline__ __m256i __DEFAULT_FN_ATTRS256
	_mm256_mask_permutex2var_epi8(__m256i __A, __mmask32 __U, __m256i __I,			_mm256_mask_permutex2var_epi8(__m256i __A, __mmask32 __U, __m256i __I,
	__m256i __B)			__m256i __B)
	{			{
	return (__m256i)__builtin_ia32_selectb_256(__U,			return (__m256i)__builtin_ia32_selectb_256(__U,
	(__v32qi)_mm256_permutex2var_epi8(__A, __I, __B),			(__v32qi)_mm256_permutex2var_epi8(__A, __I, __B),
	(__v32qi)__A);			(__v32qi)__A);
	}			}

	static __inline__ __m256i __DEFAULT_FN_ATTRS			static __inline__ __m256i __DEFAULT_FN_ATTRS256
	_mm256_mask2_permutex2var_epi8(__m256i __A, __m256i __I, __mmask32 __U,			_mm256_mask2_permutex2var_epi8(__m256i __A, __m256i __I, __mmask32 __U,
	__m256i __B)			__m256i __B)
	{			{
	return (__m256i)__builtin_ia32_selectb_256(__U,			return (__m256i)__builtin_ia32_selectb_256(__U,
	(__v32qi)_mm256_permutex2var_epi8(__A, __I, __B),			(__v32qi)_mm256_permutex2var_epi8(__A, __I, __B),
	(__v32qi)__I);			(__v32qi)__I);
	}			}

	static __inline__ __m256i __DEFAULT_FN_ATTRS			static __inline__ __m256i __DEFAULT_FN_ATTRS256
	_mm256_maskz_permutex2var_epi8(__mmask32 __U, __m256i __A, __m256i __I,			_mm256_maskz_permutex2var_epi8(__mmask32 __U, __m256i __A, __m256i __I,
	__m256i __B)			__m256i __B)
	{			{
	return (__m256i)__builtin_ia32_selectb_256(__U,			return (__m256i)__builtin_ia32_selectb_256(__U,
	(__v32qi)_mm256_permutex2var_epi8(__A, __I, __B),			(__v32qi)_mm256_permutex2var_epi8(__A, __I, __B),
	(__v32qi)_mm256_setzero_si256());			(__v32qi)_mm256_setzero_si256());
	}			}

	static __inline__ __m128i __DEFAULT_FN_ATTRS			static __inline__ __m128i __DEFAULT_FN_ATTRS128
	_mm_permutexvar_epi8 (__m128i __A, __m128i __B)			_mm_permutexvar_epi8 (__m128i __A, __m128i __B)
	{			{
	return (__m128i)__builtin_ia32_permvarqi128((__v16qi)__B, (__v16qi)__A);			return (__m128i)__builtin_ia32_permvarqi128((__v16qi)__B, (__v16qi)__A);
	}			}

	static __inline__ __m128i __DEFAULT_FN_ATTRS			static __inline__ __m128i __DEFAULT_FN_ATTRS128
	_mm_maskz_permutexvar_epi8 (__mmask16 __M, __m128i __A, __m128i __B)			_mm_maskz_permutexvar_epi8 (__mmask16 __M, __m128i __A, __m128i __B)
	{			{
	return (__m128i)__builtin_ia32_selectb_128((__mmask16)__M,			return (__m128i)__builtin_ia32_selectb_128((__mmask16)__M,
	(__v16qi)_mm_permutexvar_epi8(__A, __B),			(__v16qi)_mm_permutexvar_epi8(__A, __B),
	(__v16qi)_mm_setzero_si128());			(__v16qi)_mm_setzero_si128());
	}			}

	static __inline__ __m128i __DEFAULT_FN_ATTRS			static __inline__ __m128i __DEFAULT_FN_ATTRS128
	_mm_mask_permutexvar_epi8 (__m128i __W, __mmask16 __M, __m128i __A,			_mm_mask_permutexvar_epi8 (__m128i __W, __mmask16 __M, __m128i __A,
	__m128i __B)			__m128i __B)
	{			{
	return (__m128i)__builtin_ia32_selectb_128((__mmask16)__M,			return (__m128i)__builtin_ia32_selectb_128((__mmask16)__M,
	(__v16qi)_mm_permutexvar_epi8(__A, __B),			(__v16qi)_mm_permutexvar_epi8(__A, __B),
	(__v16qi)__W);			(__v16qi)__W);
	}			}

	static __inline__ __m256i __DEFAULT_FN_ATTRS			static __inline__ __m256i __DEFAULT_FN_ATTRS256
	_mm256_permutexvar_epi8 (__m256i __A, __m256i __B)			_mm256_permutexvar_epi8 (__m256i __A, __m256i __B)
	{			{
	return (__m256i)__builtin_ia32_permvarqi256((__v32qi) __B, (__v32qi) __A);			return (__m256i)__builtin_ia32_permvarqi256((__v32qi) __B, (__v32qi) __A);
	}			}

	static __inline__ __m256i __DEFAULT_FN_ATTRS			static __inline__ __m256i __DEFAULT_FN_ATTRS256
	_mm256_maskz_permutexvar_epi8 (__mmask32 __M, __m256i __A,			_mm256_maskz_permutexvar_epi8 (__mmask32 __M, __m256i __A,
	__m256i __B)			__m256i __B)
	{			{
	return (__m256i)__builtin_ia32_selectb_256((__mmask32)__M,			return (__m256i)__builtin_ia32_selectb_256((__mmask32)__M,
	(__v32qi)_mm256_permutexvar_epi8(__A, __B),			(__v32qi)_mm256_permutexvar_epi8(__A, __B),
	(__v32qi)_mm256_setzero_si256());			(__v32qi)_mm256_setzero_si256());
	}			}

	static __inline__ __m256i __DEFAULT_FN_ATTRS			static __inline__ __m256i __DEFAULT_FN_ATTRS256
	_mm256_mask_permutexvar_epi8 (__m256i __W, __mmask32 __M, __m256i __A,			_mm256_mask_permutexvar_epi8 (__m256i __W, __mmask32 __M, __m256i __A,
	__m256i __B)			__m256i __B)
	{			{
	return (__m256i)__builtin_ia32_selectb_256((__mmask32)__M,			return (__m256i)__builtin_ia32_selectb_256((__mmask32)__M,
	(__v32qi)_mm256_permutexvar_epi8(__A, __B),			(__v32qi)_mm256_permutexvar_epi8(__A, __B),
	(__v32qi)__W);			(__v32qi)__W);
	}			}

	static __inline__ __m128i __DEFAULT_FN_ATTRS			static __inline__ __m128i __DEFAULT_FN_ATTRS128
	_mm_mask_multishift_epi64_epi8 (__m128i __W, __mmask16 __M, __m128i __X, __m128i __Y)			_mm_mask_multishift_epi64_epi8 (__m128i __W, __mmask16 __M, __m128i __X, __m128i __Y)
	{			{
	return (__m128i) __builtin_ia32_vpmultishiftqb128_mask ((__v16qi) __X,			return (__m128i) __builtin_ia32_vpmultishiftqb128_mask ((__v16qi) __X,
	(__v16qi) __Y,			(__v16qi) __Y,
	(__v16qi) __W,			(__v16qi) __W,
	(__mmask16) __M);			(__mmask16) __M);
	}			}

	static __inline__ __m128i __DEFAULT_FN_ATTRS			static __inline__ __m128i __DEFAULT_FN_ATTRS128
	_mm_maskz_multishift_epi64_epi8 (__mmask16 __M, __m128i __X, __m128i __Y)			_mm_maskz_multishift_epi64_epi8 (__mmask16 __M, __m128i __X, __m128i __Y)
	{			{
	return (__m128i) __builtin_ia32_vpmultishiftqb128_mask ((__v16qi) __X,			return (__m128i) __builtin_ia32_vpmultishiftqb128_mask ((__v16qi) __X,
	(__v16qi) __Y,			(__v16qi) __Y,
	(__v16qi)			(__v16qi)
	_mm_setzero_si128 (),			_mm_setzero_si128 (),
	(__mmask16) __M);			(__mmask16) __M);
	}			}

	static __inline__ __m128i __DEFAULT_FN_ATTRS			static __inline__ __m128i __DEFAULT_FN_ATTRS128
	_mm_multishift_epi64_epi8 (__m128i __X, __m128i __Y)			_mm_multishift_epi64_epi8 (__m128i __X, __m128i __Y)
	{			{
	return (__m128i) __builtin_ia32_vpmultishiftqb128_mask ((__v16qi) __X,			return (__m128i) __builtin_ia32_vpmultishiftqb128_mask ((__v16qi) __X,
	(__v16qi) __Y,			(__v16qi) __Y,
	(__v16qi)			(__v16qi)
	_mm_undefined_si128 (),			_mm_undefined_si128 (),
	(__mmask16) -1);			(__mmask16) -1);
	}			}

	static __inline__ __m256i __DEFAULT_FN_ATTRS			static __inline__ __m256i __DEFAULT_FN_ATTRS256
	_mm256_mask_multishift_epi64_epi8 (__m256i __W, __mmask32 __M, __m256i __X, __m256i __Y)			_mm256_mask_multishift_epi64_epi8 (__m256i __W, __mmask32 __M, __m256i __X, __m256i __Y)
	{			{
	return (__m256i) __builtin_ia32_vpmultishiftqb256_mask ((__v32qi) __X,			return (__m256i) __builtin_ia32_vpmultishiftqb256_mask ((__v32qi) __X,
	(__v32qi) __Y,			(__v32qi) __Y,
	(__v32qi) __W,			(__v32qi) __W,
	(__mmask32) __M);			(__mmask32) __M);
	}			}

	static __inline__ __m256i __DEFAULT_FN_ATTRS			static __inline__ __m256i __DEFAULT_FN_ATTRS256
	_mm256_maskz_multishift_epi64_epi8 (__mmask32 __M, __m256i __X, __m256i __Y)			_mm256_maskz_multishift_epi64_epi8 (__mmask32 __M, __m256i __X, __m256i __Y)
	{			{
	return (__m256i) __builtin_ia32_vpmultishiftqb256_mask ((__v32qi) __X,			return (__m256i) __builtin_ia32_vpmultishiftqb256_mask ((__v32qi) __X,
	(__v32qi) __Y,			(__v32qi) __Y,
	(__v32qi)			(__v32qi)
	_mm256_setzero_si256 (),			_mm256_setzero_si256 (),
	(__mmask32) __M);			(__mmask32) __M);
	}			}

	static __inline__ __m256i __DEFAULT_FN_ATTRS			static __inline__ __m256i __DEFAULT_FN_ATTRS256
	_mm256_multishift_epi64_epi8 (__m256i __X, __m256i __Y)			_mm256_multishift_epi64_epi8 (__m256i __X, __m256i __Y)
	{			{
	return (__m256i) __builtin_ia32_vpmultishiftqb256_mask ((__v32qi) __X,			return (__m256i) __builtin_ia32_vpmultishiftqb256_mask ((__v32qi) __X,
	(__v32qi) __Y,			(__v32qi) __Y,
	(__v32qi)			(__v32qi)
	_mm256_undefined_si256 (),			_mm256_undefined_si256 (),
	(__mmask32) -1);			(__mmask32) -1);
	}			}


	#undef __DEFAULT_FN_ATTRS			#undef __DEFAULT_FN_ATTRS128
				#undef __DEFAULT_FN_ATTRS256

	#endif			#endif

lib/Headers/avx512vlbitalgintrin.h

	Show All 23 Lines
	#ifndef __IMMINTRIN_H			#ifndef __IMMINTRIN_H
	#error "Never use <avx512vlbitalgintrin.h> directly; include <immintrin.h> instead."			#error "Never use <avx512vlbitalgintrin.h> directly; include <immintrin.h> instead."
	#endif			#endif

	#ifndef __AVX512VLBITALGINTRIN_H			#ifndef __AVX512VLBITALGINTRIN_H
	#define __AVX512VLBITALGINTRIN_H			#define __AVX512VLBITALGINTRIN_H

	/* Define the default attributes for the functions in this file. */			/* Define the default attributes for the functions in this file. */
	#define __DEFAULT_FN_ATTRS __attribute__((__always_inline__, __nodebug__, __target__("avx512vl,avx512bitalg")))			#define __DEFAULT_FN_ATTRS128 __attribute__((__always_inline__, __nodebug__, __target__("avx512vl,avx512bitalg"), __min_vector_width__(128)))
				#define __DEFAULT_FN_ATTRS256 __attribute__((__always_inline__, __nodebug__, __target__("avx512vl,avx512bitalg"), __min_vector_width__(256)))

	static __inline__ __m256i __DEFAULT_FN_ATTRS			static __inline__ __m256i __DEFAULT_FN_ATTRS256
	_mm256_popcnt_epi16(__m256i __A)			_mm256_popcnt_epi16(__m256i __A)
	{			{
	return (__m256i) __builtin_ia32_vpopcntw_256((__v16hi) __A);			return (__m256i) __builtin_ia32_vpopcntw_256((__v16hi) __A);
	}			}

	static __inline__ __m256i __DEFAULT_FN_ATTRS			static __inline__ __m256i __DEFAULT_FN_ATTRS256
	_mm256_mask_popcnt_epi16(__m256i __A, __mmask16 __U, __m256i __B)			_mm256_mask_popcnt_epi16(__m256i __A, __mmask16 __U, __m256i __B)
	{			{
	return (__m256i) __builtin_ia32_selectw_256((__mmask16) __U,			return (__m256i) __builtin_ia32_selectw_256((__mmask16) __U,
	(__v16hi) _mm256_popcnt_epi16(__B),			(__v16hi) _mm256_popcnt_epi16(__B),
	(__v16hi) __A);			(__v16hi) __A);
	}			}

	static __inline__ __m256i __DEFAULT_FN_ATTRS			static __inline__ __m256i __DEFAULT_FN_ATTRS256
	_mm256_maskz_popcnt_epi16(__mmask16 __U, __m256i __B)			_mm256_maskz_popcnt_epi16(__mmask16 __U, __m256i __B)
	{			{
	return _mm256_mask_popcnt_epi16((__m256i) _mm256_setzero_si256(),			return _mm256_mask_popcnt_epi16((__m256i) _mm256_setzero_si256(),
	__U,			__U,
	__B);			__B);
	}			}

	static __inline__ __m128i __DEFAULT_FN_ATTRS			static __inline__ __m128i __DEFAULT_FN_ATTRS128
	_mm_popcnt_epi16(__m128i __A)			_mm_popcnt_epi16(__m128i __A)
	{			{
	return (__m128i) __builtin_ia32_vpopcntw_128((__v8hi) __A);			return (__m128i) __builtin_ia32_vpopcntw_128((__v8hi) __A);
	}			}

	static __inline__ __m128i __DEFAULT_FN_ATTRS			static __inline__ __m128i __DEFAULT_FN_ATTRS128
	_mm_mask_popcnt_epi16(__m128i __A, __mmask8 __U, __m128i __B)			_mm_mask_popcnt_epi16(__m128i __A, __mmask8 __U, __m128i __B)
	{			{
	return (__m128i) __builtin_ia32_selectw_128((__mmask8) __U,			return (__m128i) __builtin_ia32_selectw_128((__mmask8) __U,
	(__v8hi) _mm_popcnt_epi16(__B),			(__v8hi) _mm_popcnt_epi16(__B),
	(__v8hi) __A);			(__v8hi) __A);
	}			}

	static __inline__ __m128i __DEFAULT_FN_ATTRS			static __inline__ __m128i __DEFAULT_FN_ATTRS128
	_mm_maskz_popcnt_epi16(__mmask8 __U, __m128i __B)			_mm_maskz_popcnt_epi16(__mmask8 __U, __m128i __B)
	{			{
	return _mm_mask_popcnt_epi16((__m128i) _mm_setzero_si128(),			return _mm_mask_popcnt_epi16((__m128i) _mm_setzero_si128(),
	__U,			__U,
	__B);			__B);
	}			}

	static __inline__ __m256i __DEFAULT_FN_ATTRS			static __inline__ __m256i __DEFAULT_FN_ATTRS256
	_mm256_popcnt_epi8(__m256i __A)			_mm256_popcnt_epi8(__m256i __A)
	{			{
	return (__m256i) __builtin_ia32_vpopcntb_256((__v32qi) __A);			return (__m256i) __builtin_ia32_vpopcntb_256((__v32qi) __A);
	}			}

	static __inline__ __m256i __DEFAULT_FN_ATTRS			static __inline__ __m256i __DEFAULT_FN_ATTRS256
	_mm256_mask_popcnt_epi8(__m256i __A, __mmask32 __U, __m256i __B)			_mm256_mask_popcnt_epi8(__m256i __A, __mmask32 __U, __m256i __B)
	{			{
	return (__m256i) __builtin_ia32_selectb_256((__mmask32) __U,			return (__m256i) __builtin_ia32_selectb_256((__mmask32) __U,
	(__v32qi) _mm256_popcnt_epi8(__B),			(__v32qi) _mm256_popcnt_epi8(__B),
	(__v32qi) __A);			(__v32qi) __A);
	}			}

	static __inline__ __m256i __DEFAULT_FN_ATTRS			static __inline__ __m256i __DEFAULT_FN_ATTRS256
	_mm256_maskz_popcnt_epi8(__mmask32 __U, __m256i __B)			_mm256_maskz_popcnt_epi8(__mmask32 __U, __m256i __B)
	{			{
	return _mm256_mask_popcnt_epi8((__m256i) _mm256_setzero_si256(),			return _mm256_mask_popcnt_epi8((__m256i) _mm256_setzero_si256(),
	__U,			__U,
	__B);			__B);
	}			}

	static __inline__ __m128i __DEFAULT_FN_ATTRS			static __inline__ __m128i __DEFAULT_FN_ATTRS128
	_mm_popcnt_epi8(__m128i __A)			_mm_popcnt_epi8(__m128i __A)
	{			{
	return (__m128i) __builtin_ia32_vpopcntb_128((__v16qi) __A);			return (__m128i) __builtin_ia32_vpopcntb_128((__v16qi) __A);
	}			}

	static __inline__ __m128i __DEFAULT_FN_ATTRS			static __inline__ __m128i __DEFAULT_FN_ATTRS128
	_mm_mask_popcnt_epi8(__m128i __A, __mmask16 __U, __m128i __B)			_mm_mask_popcnt_epi8(__m128i __A, __mmask16 __U, __m128i __B)
	{			{
	return (__m128i) __builtin_ia32_selectb_128((__mmask16) __U,			return (__m128i) __builtin_ia32_selectb_128((__mmask16) __U,
	(__v16qi) _mm_popcnt_epi8(__B),			(__v16qi) _mm_popcnt_epi8(__B),
	(__v16qi) __A);			(__v16qi) __A);
	}			}

	static __inline__ __m128i __DEFAULT_FN_ATTRS			static __inline__ __m128i __DEFAULT_FN_ATTRS128
	_mm_maskz_popcnt_epi8(__mmask16 __U, __m128i __B)			_mm_maskz_popcnt_epi8(__mmask16 __U, __m128i __B)
	{			{
	return _mm_mask_popcnt_epi8((__m128i) _mm_setzero_si128(),			return _mm_mask_popcnt_epi8((__m128i) _mm_setzero_si128(),
	__U,			__U,
	__B);			__B);
	}			}

	static __inline__ __mmask32 __DEFAULT_FN_ATTRS			static __inline__ __mmask32 __DEFAULT_FN_ATTRS256
	_mm256_mask_bitshuffle_epi64_mask(__mmask32 __U, __m256i __A, __m256i __B)			_mm256_mask_bitshuffle_epi64_mask(__mmask32 __U, __m256i __A, __m256i __B)
	{			{
	return (__mmask32) __builtin_ia32_vpshufbitqmb256_mask((__v32qi) __A,			return (__mmask32) __builtin_ia32_vpshufbitqmb256_mask((__v32qi) __A,
	(__v32qi) __B,			(__v32qi) __B,
	__U);			__U);
	}			}

	static __inline__ __mmask32 __DEFAULT_FN_ATTRS			static __inline__ __mmask32 __DEFAULT_FN_ATTRS256
	_mm256_bitshuffle_epi64_mask(__m256i __A, __m256i __B)			_mm256_bitshuffle_epi64_mask(__m256i __A, __m256i __B)
	{			{
	return _mm256_mask_bitshuffle_epi64_mask((__mmask32) -1,			return _mm256_mask_bitshuffle_epi64_mask((__mmask32) -1,
	__A,			__A,
	__B);			__B);
	}			}

	static __inline__ __mmask16 __DEFAULT_FN_ATTRS			static __inline__ __mmask16 __DEFAULT_FN_ATTRS128
	_mm_mask_bitshuffle_epi64_mask(__mmask16 __U, __m128i __A, __m128i __B)			_mm_mask_bitshuffle_epi64_mask(__mmask16 __U, __m128i __A, __m128i __B)
	{			{
	return (__mmask16) __builtin_ia32_vpshufbitqmb128_mask((__v16qi) __A,			return (__mmask16) __builtin_ia32_vpshufbitqmb128_mask((__v16qi) __A,
	(__v16qi) __B,			(__v16qi) __B,
	__U);			__U);
	}			}

	static __inline__ __mmask16 __DEFAULT_FN_ATTRS			static __inline__ __mmask16 __DEFAULT_FN_ATTRS128
	_mm_bitshuffle_epi64_mask(__m128i __A, __m128i __B)			_mm_bitshuffle_epi64_mask(__m128i __A, __m128i __B)
	{			{
	return _mm_mask_bitshuffle_epi64_mask((__mmask16) -1,			return _mm_mask_bitshuffle_epi64_mask((__mmask16) -1,
	__A,			__A,
	__B);			__B);
	}			}


	#undef __DEFAULT_FN_ATTRS			#undef __DEFAULT_FN_ATTRS128
				#undef __DEFAULT_FN_ATTRS256

	#endif			#endif

lib/Headers/avx512vlbwintrin.h

Show All 23 Lines
#ifndef __IMMINTRIN_H		#ifndef __IMMINTRIN_H
#error "Never use <avx512vlbwintrin.h> directly; include <immintrin.h> instead."		#error "Never use <avx512vlbwintrin.h> directly; include <immintrin.h> instead."
#endif		#endif

#ifndef __AVX512VLBWINTRIN_H		#ifndef __AVX512VLBWINTRIN_H
#define __AVX512VLBWINTRIN_H		#define __AVX512VLBWINTRIN_H

/* Define the default attributes for the functions in this file. */		/* Define the default attributes for the functions in this file. */
#define __DEFAULT_FN_ATTRS __attribute__((__always_inline__, __nodebug__, __target__("avx512vl,avx512bw")))		#define __DEFAULT_FN_ATTRS128 __attribute__((__always_inline__, __nodebug__, __target__("avx512vl,avx512bw"), __min_vector_width__(128)))
		#define __DEFAULT_FN_ATTRS256 __attribute__((__always_inline__, __nodebug__, __target__("avx512vl,avx512bw"), __min_vector_width__(256)))

/* Integer compare */		/* Integer compare */

#define _mm_cmp_epi8_mask(a, b, p) \		#define _mm_cmp_epi8_mask(a, b, p) \
(__mmask16)__builtin_ia32_cmpb128_mask((__v16qi)(__m128i)(a), \		(__mmask16)__builtin_ia32_cmpb128_mask((__v16qi)(__m128i)(a), \
(__v16qi)(__m128i)(b), (int)(p), \		(__v16qi)(__m128i)(b), (int)(p), \
(__mmask16)-1)		(__mmask16)-1)

▲ Show 20 Lines • Show All 267 Lines • ▼ Show 20 Lines	#define _mm256_cmplt_epu16_mask(A, B) \
_mm256_cmp_epu16_mask((A), (B), _MM_CMPINT_LT)		_mm256_cmp_epu16_mask((A), (B), _MM_CMPINT_LT)
#define _mm256_mask_cmplt_epu16_mask(k, A, B) \		#define _mm256_mask_cmplt_epu16_mask(k, A, B) \
_mm256_mask_cmp_epu16_mask((k), (A), (B), _MM_CMPINT_LT)		_mm256_mask_cmp_epu16_mask((k), (A), (B), _MM_CMPINT_LT)
#define _mm256_cmpneq_epu16_mask(A, B) \		#define _mm256_cmpneq_epu16_mask(A, B) \
_mm256_cmp_epu16_mask((A), (B), _MM_CMPINT_NE)		_mm256_cmp_epu16_mask((A), (B), _MM_CMPINT_NE)
#define _mm256_mask_cmpneq_epu16_mask(k, A, B) \		#define _mm256_mask_cmpneq_epu16_mask(k, A, B) \
_mm256_mask_cmp_epu16_mask((k), (A), (B), _MM_CMPINT_NE)		_mm256_mask_cmp_epu16_mask((k), (A), (B), _MM_CMPINT_NE)

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_add_epi8(__m256i __W, __mmask32 __U, __m256i __A, __m256i __B){		_mm256_mask_add_epi8(__m256i __W, __mmask32 __U, __m256i __A, __m256i __B){
return (__m256i)__builtin_ia32_selectb_256((__mmask32)__U,		return (__m256i)__builtin_ia32_selectb_256((__mmask32)__U,
(__v32qi)_mm256_add_epi8(__A, __B),		(__v32qi)_mm256_add_epi8(__A, __B),
(__v32qi)__W);		(__v32qi)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_add_epi8(__mmask32 __U, __m256i __A, __m256i __B) {		_mm256_maskz_add_epi8(__mmask32 __U, __m256i __A, __m256i __B) {
return (__m256i)__builtin_ia32_selectb_256((__mmask32)__U,		return (__m256i)__builtin_ia32_selectb_256((__mmask32)__U,
(__v32qi)_mm256_add_epi8(__A, __B),		(__v32qi)_mm256_add_epi8(__A, __B),
(__v32qi)_mm256_setzero_si256());		(__v32qi)_mm256_setzero_si256());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_add_epi16(__m256i __W, __mmask16 __U, __m256i __A, __m256i __B) {		_mm256_mask_add_epi16(__m256i __W, __mmask16 __U, __m256i __A, __m256i __B) {
return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,		return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,
(__v16hi)_mm256_add_epi16(__A, __B),		(__v16hi)_mm256_add_epi16(__A, __B),
(__v16hi)__W);		(__v16hi)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_add_epi16(__mmask16 __U, __m256i __A, __m256i __B) {		_mm256_maskz_add_epi16(__mmask16 __U, __m256i __A, __m256i __B) {
return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,		return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,
(__v16hi)_mm256_add_epi16(__A, __B),		(__v16hi)_mm256_add_epi16(__A, __B),
(__v16hi)_mm256_setzero_si256());		(__v16hi)_mm256_setzero_si256());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_sub_epi8(__m256i __W, __mmask32 __U, __m256i __A, __m256i __B) {		_mm256_mask_sub_epi8(__m256i __W, __mmask32 __U, __m256i __A, __m256i __B) {
return (__m256i)__builtin_ia32_selectb_256((__mmask32)__U,		return (__m256i)__builtin_ia32_selectb_256((__mmask32)__U,
(__v32qi)_mm256_sub_epi8(__A, __B),		(__v32qi)_mm256_sub_epi8(__A, __B),
(__v32qi)__W);		(__v32qi)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_sub_epi8(__mmask32 __U, __m256i __A, __m256i __B) {		_mm256_maskz_sub_epi8(__mmask32 __U, __m256i __A, __m256i __B) {
return (__m256i)__builtin_ia32_selectb_256((__mmask32)__U,		return (__m256i)__builtin_ia32_selectb_256((__mmask32)__U,
(__v32qi)_mm256_sub_epi8(__A, __B),		(__v32qi)_mm256_sub_epi8(__A, __B),
(__v32qi)_mm256_setzero_si256());		(__v32qi)_mm256_setzero_si256());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_sub_epi16(__m256i __W, __mmask16 __U, __m256i __A, __m256i __B) {		_mm256_mask_sub_epi16(__m256i __W, __mmask16 __U, __m256i __A, __m256i __B) {
return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,		return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,
(__v16hi)_mm256_sub_epi16(__A, __B),		(__v16hi)_mm256_sub_epi16(__A, __B),
(__v16hi)__W);		(__v16hi)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_sub_epi16(__mmask16 __U, __m256i __A, __m256i __B) {		_mm256_maskz_sub_epi16(__mmask16 __U, __m256i __A, __m256i __B) {
return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,		return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,
(__v16hi)_mm256_sub_epi16(__A, __B),		(__v16hi)_mm256_sub_epi16(__A, __B),
(__v16hi)_mm256_setzero_si256());		(__v16hi)_mm256_setzero_si256());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_add_epi8(__m128i __W, __mmask16 __U, __m128i __A, __m128i __B) {		_mm_mask_add_epi8(__m128i __W, __mmask16 __U, __m128i __A, __m128i __B) {
return (__m128i)__builtin_ia32_selectb_128((__mmask16)__U,		return (__m128i)__builtin_ia32_selectb_128((__mmask16)__U,
(__v16qi)_mm_add_epi8(__A, __B),		(__v16qi)_mm_add_epi8(__A, __B),
(__v16qi)__W);		(__v16qi)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_add_epi8(__mmask16 __U, __m128i __A, __m128i __B) {		_mm_maskz_add_epi8(__mmask16 __U, __m128i __A, __m128i __B) {
return (__m128i)__builtin_ia32_selectb_128((__mmask16)__U,		return (__m128i)__builtin_ia32_selectb_128((__mmask16)__U,
(__v16qi)_mm_add_epi8(__A, __B),		(__v16qi)_mm_add_epi8(__A, __B),
(__v16qi)_mm_setzero_si128());		(__v16qi)_mm_setzero_si128());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_add_epi16(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) {		_mm_mask_add_epi16(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) {
return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,
(__v8hi)_mm_add_epi16(__A, __B),		(__v8hi)_mm_add_epi16(__A, __B),
(__v8hi)__W);		(__v8hi)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_add_epi16(__mmask8 __U, __m128i __A, __m128i __B) {		_mm_maskz_add_epi16(__mmask8 __U, __m128i __A, __m128i __B) {
return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,
(__v8hi)_mm_add_epi16(__A, __B),		(__v8hi)_mm_add_epi16(__A, __B),
(__v8hi)_mm_setzero_si128());		(__v8hi)_mm_setzero_si128());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_sub_epi8(__m128i __W, __mmask16 __U, __m128i __A, __m128i __B) {		_mm_mask_sub_epi8(__m128i __W, __mmask16 __U, __m128i __A, __m128i __B) {
return (__m128i)__builtin_ia32_selectb_128((__mmask16)__U,		return (__m128i)__builtin_ia32_selectb_128((__mmask16)__U,
(__v16qi)_mm_sub_epi8(__A, __B),		(__v16qi)_mm_sub_epi8(__A, __B),
(__v16qi)__W);		(__v16qi)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_sub_epi8(__mmask16 __U, __m128i __A, __m128i __B) {		_mm_maskz_sub_epi8(__mmask16 __U, __m128i __A, __m128i __B) {
return (__m128i)__builtin_ia32_selectb_128((__mmask16)__U,		return (__m128i)__builtin_ia32_selectb_128((__mmask16)__U,
(__v16qi)_mm_sub_epi8(__A, __B),		(__v16qi)_mm_sub_epi8(__A, __B),
(__v16qi)_mm_setzero_si128());		(__v16qi)_mm_setzero_si128());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_sub_epi16(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) {		_mm_mask_sub_epi16(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) {
return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,
(__v8hi)_mm_sub_epi16(__A, __B),		(__v8hi)_mm_sub_epi16(__A, __B),
(__v8hi)__W);		(__v8hi)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_sub_epi16(__mmask8 __U, __m128i __A, __m128i __B) {		_mm_maskz_sub_epi16(__mmask8 __U, __m128i __A, __m128i __B) {
return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,
(__v8hi)_mm_sub_epi16(__A, __B),		(__v8hi)_mm_sub_epi16(__A, __B),
(__v8hi)_mm_setzero_si128());		(__v8hi)_mm_setzero_si128());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_mullo_epi16(__m256i __W, __mmask16 __U, __m256i __A, __m256i __B) {		_mm256_mask_mullo_epi16(__m256i __W, __mmask16 __U, __m256i __A, __m256i __B) {
return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,		return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,
(__v16hi)_mm256_mullo_epi16(__A, __B),		(__v16hi)_mm256_mullo_epi16(__A, __B),
(__v16hi)__W);		(__v16hi)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_mullo_epi16(__mmask16 __U, __m256i __A, __m256i __B) {		_mm256_maskz_mullo_epi16(__mmask16 __U, __m256i __A, __m256i __B) {
return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,		return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,
(__v16hi)_mm256_mullo_epi16(__A, __B),		(__v16hi)_mm256_mullo_epi16(__A, __B),
(__v16hi)_mm256_setzero_si256());		(__v16hi)_mm256_setzero_si256());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_mullo_epi16(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) {		_mm_mask_mullo_epi16(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) {
return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,
(__v8hi)_mm_mullo_epi16(__A, __B),		(__v8hi)_mm_mullo_epi16(__A, __B),
(__v8hi)__W);		(__v8hi)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_mullo_epi16(__mmask8 __U, __m128i __A, __m128i __B) {		_mm_maskz_mullo_epi16(__mmask8 __U, __m128i __A, __m128i __B) {
return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,
(__v8hi)_mm_mullo_epi16(__A, __B),		(__v8hi)_mm_mullo_epi16(__A, __B),
(__v8hi)_mm_setzero_si128());		(__v8hi)_mm_setzero_si128());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_blend_epi8 (__mmask16 __U, __m128i __A, __m128i __W)		_mm_mask_blend_epi8 (__mmask16 __U, __m128i __A, __m128i __W)
{		{
return (__m128i) __builtin_ia32_selectb_128 ((__mmask16) __U,		return (__m128i) __builtin_ia32_selectb_128 ((__mmask16) __U,
(__v16qi) __W,		(__v16qi) __W,
(__v16qi) __A);		(__v16qi) __A);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_blend_epi8 (__mmask32 __U, __m256i __A, __m256i __W)		_mm256_mask_blend_epi8 (__mmask32 __U, __m256i __A, __m256i __W)
{		{
return (__m256i) __builtin_ia32_selectb_256 ((__mmask32) __U,		return (__m256i) __builtin_ia32_selectb_256 ((__mmask32) __U,
(__v32qi) __W,		(__v32qi) __W,
(__v32qi) __A);		(__v32qi) __A);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_blend_epi16 (__mmask8 __U, __m128i __A, __m128i __W)		_mm_mask_blend_epi16 (__mmask8 __U, __m128i __A, __m128i __W)
{		{
return (__m128i) __builtin_ia32_selectw_128 ((__mmask8) __U,		return (__m128i) __builtin_ia32_selectw_128 ((__mmask8) __U,
(__v8hi) __W,		(__v8hi) __W,
(__v8hi) __A);		(__v8hi) __A);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_blend_epi16 (__mmask16 __U, __m256i __A, __m256i __W)		_mm256_mask_blend_epi16 (__mmask16 __U, __m256i __A, __m256i __W)
{		{
return (__m256i) __builtin_ia32_selectw_256 ((__mmask16) __U,		return (__m256i) __builtin_ia32_selectw_256 ((__mmask16) __U,
(__v16hi) __W,		(__v16hi) __W,
(__v16hi) __A);		(__v16hi) __A);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_abs_epi8(__m128i __W, __mmask16 __U, __m128i __A)		_mm_mask_abs_epi8(__m128i __W, __mmask16 __U, __m128i __A)
{		{
return (__m128i)__builtin_ia32_selectb_128((__mmask16)__U,		return (__m128i)__builtin_ia32_selectb_128((__mmask16)__U,
(__v16qi)_mm_abs_epi8(__A),		(__v16qi)_mm_abs_epi8(__A),
(__v16qi)__W);		(__v16qi)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_abs_epi8(__mmask16 __U, __m128i __A)		_mm_maskz_abs_epi8(__mmask16 __U, __m128i __A)
{		{
return (__m128i)__builtin_ia32_selectb_128((__mmask16)__U,		return (__m128i)__builtin_ia32_selectb_128((__mmask16)__U,
(__v16qi)_mm_abs_epi8(__A),		(__v16qi)_mm_abs_epi8(__A),
(__v16qi)_mm_setzero_si128());		(__v16qi)_mm_setzero_si128());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_abs_epi8(__m256i __W, __mmask32 __U, __m256i __A)		_mm256_mask_abs_epi8(__m256i __W, __mmask32 __U, __m256i __A)
{		{
return (__m256i)__builtin_ia32_selectb_256((__mmask32)__U,		return (__m256i)__builtin_ia32_selectb_256((__mmask32)__U,
(__v32qi)_mm256_abs_epi8(__A),		(__v32qi)_mm256_abs_epi8(__A),
(__v32qi)__W);		(__v32qi)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_abs_epi8 (__mmask32 __U, __m256i __A)		_mm256_maskz_abs_epi8 (__mmask32 __U, __m256i __A)
{		{
return (__m256i)__builtin_ia32_selectb_256((__mmask32)__U,		return (__m256i)__builtin_ia32_selectb_256((__mmask32)__U,
(__v32qi)_mm256_abs_epi8(__A),		(__v32qi)_mm256_abs_epi8(__A),
(__v32qi)_mm256_setzero_si256());		(__v32qi)_mm256_setzero_si256());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_abs_epi16(__m128i __W, __mmask8 __U, __m128i __A)		_mm_mask_abs_epi16(__m128i __W, __mmask8 __U, __m128i __A)
{		{
return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,
(__v8hi)_mm_abs_epi16(__A),		(__v8hi)_mm_abs_epi16(__A),
(__v8hi)__W);		(__v8hi)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_abs_epi16(__mmask8 __U, __m128i __A)		_mm_maskz_abs_epi16(__mmask8 __U, __m128i __A)
{		{
return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,
(__v8hi)_mm_abs_epi16(__A),		(__v8hi)_mm_abs_epi16(__A),
(__v8hi)_mm_setzero_si128());		(__v8hi)_mm_setzero_si128());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_abs_epi16(__m256i __W, __mmask16 __U, __m256i __A)		_mm256_mask_abs_epi16(__m256i __W, __mmask16 __U, __m256i __A)
{		{
return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,		return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,
(__v16hi)_mm256_abs_epi16(__A),		(__v16hi)_mm256_abs_epi16(__A),
(__v16hi)__W);		(__v16hi)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_abs_epi16(__mmask16 __U, __m256i __A)		_mm256_maskz_abs_epi16(__mmask16 __U, __m256i __A)
{		{
return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,		return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,
(__v16hi)_mm256_abs_epi16(__A),		(__v16hi)_mm256_abs_epi16(__A),
(__v16hi)_mm256_setzero_si256());		(__v16hi)_mm256_setzero_si256());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_packs_epi32(__mmask8 __M, __m128i __A, __m128i __B) {		_mm_maskz_packs_epi32(__mmask8 __M, __m128i __A, __m128i __B) {
return (__m128i)__builtin_ia32_selectw_128((__mmask8)__M,		return (__m128i)__builtin_ia32_selectw_128((__mmask8)__M,
(__v8hi)_mm_packs_epi32(__A, __B),		(__v8hi)_mm_packs_epi32(__A, __B),
(__v8hi)_mm_setzero_si128());		(__v8hi)_mm_setzero_si128());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_packs_epi32(__m128i __W, __mmask16 __M, __m128i __A, __m128i __B)		_mm_mask_packs_epi32(__m128i __W, __mmask16 __M, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectw_128((__mmask8)__M,		return (__m128i)__builtin_ia32_selectw_128((__mmask8)__M,
(__v8hi)_mm_packs_epi32(__A, __B),		(__v8hi)_mm_packs_epi32(__A, __B),
(__v8hi)__W);		(__v8hi)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_packs_epi32(__mmask16 __M, __m256i __A, __m256i __B)		_mm256_maskz_packs_epi32(__mmask16 __M, __m256i __A, __m256i __B)
{		{
return (__m256i)__builtin_ia32_selectw_256((__mmask16)__M,		return (__m256i)__builtin_ia32_selectw_256((__mmask16)__M,
(__v16hi)_mm256_packs_epi32(__A, __B),		(__v16hi)_mm256_packs_epi32(__A, __B),
(__v16hi)_mm256_setzero_si256());		(__v16hi)_mm256_setzero_si256());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_packs_epi32(__m256i __W, __mmask16 __M, __m256i __A, __m256i __B)		_mm256_mask_packs_epi32(__m256i __W, __mmask16 __M, __m256i __A, __m256i __B)
{		{
return (__m256i)__builtin_ia32_selectw_256((__mmask16)__M,		return (__m256i)__builtin_ia32_selectw_256((__mmask16)__M,
(__v16hi)_mm256_packs_epi32(__A, __B),		(__v16hi)_mm256_packs_epi32(__A, __B),
(__v16hi)__W);		(__v16hi)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_packs_epi16(__mmask16 __M, __m128i __A, __m128i __B)		_mm_maskz_packs_epi16(__mmask16 __M, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectb_128((__mmask16)__M,		return (__m128i)__builtin_ia32_selectb_128((__mmask16)__M,
(__v16qi)_mm_packs_epi16(__A, __B),		(__v16qi)_mm_packs_epi16(__A, __B),
(__v16qi)_mm_setzero_si128());		(__v16qi)_mm_setzero_si128());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_packs_epi16(__m128i __W, __mmask16 __M, __m128i __A, __m128i __B)		_mm_mask_packs_epi16(__m128i __W, __mmask16 __M, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectb_128((__mmask16)__M,		return (__m128i)__builtin_ia32_selectb_128((__mmask16)__M,
(__v16qi)_mm_packs_epi16(__A, __B),		(__v16qi)_mm_packs_epi16(__A, __B),
(__v16qi)__W);		(__v16qi)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_packs_epi16(__mmask32 __M, __m256i __A, __m256i __B)		_mm256_maskz_packs_epi16(__mmask32 __M, __m256i __A, __m256i __B)
{		{
return (__m256i)__builtin_ia32_selectb_256((__mmask32)__M,		return (__m256i)__builtin_ia32_selectb_256((__mmask32)__M,
(__v32qi)_mm256_packs_epi16(__A, __B),		(__v32qi)_mm256_packs_epi16(__A, __B),
(__v32qi)_mm256_setzero_si256());		(__v32qi)_mm256_setzero_si256());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_packs_epi16(__m256i __W, __mmask32 __M, __m256i __A, __m256i __B)		_mm256_mask_packs_epi16(__m256i __W, __mmask32 __M, __m256i __A, __m256i __B)
{		{
return (__m256i)__builtin_ia32_selectb_256((__mmask32)__M,		return (__m256i)__builtin_ia32_selectb_256((__mmask32)__M,
(__v32qi)_mm256_packs_epi16(__A, __B),		(__v32qi)_mm256_packs_epi16(__A, __B),
(__v32qi)__W);		(__v32qi)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_packus_epi32(__mmask8 __M, __m128i __A, __m128i __B)		_mm_maskz_packus_epi32(__mmask8 __M, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectw_128((__mmask8)__M,		return (__m128i)__builtin_ia32_selectw_128((__mmask8)__M,
(__v8hi)_mm_packus_epi32(__A, __B),		(__v8hi)_mm_packus_epi32(__A, __B),
(__v8hi)_mm_setzero_si128());		(__v8hi)_mm_setzero_si128());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_packus_epi32(__m128i __W, __mmask16 __M, __m128i __A, __m128i __B)		_mm_mask_packus_epi32(__m128i __W, __mmask16 __M, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectw_128((__mmask8)__M,		return (__m128i)__builtin_ia32_selectw_128((__mmask8)__M,
(__v8hi)_mm_packus_epi32(__A, __B),		(__v8hi)_mm_packus_epi32(__A, __B),
(__v8hi)__W);		(__v8hi)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_packus_epi32(__mmask16 __M, __m256i __A, __m256i __B)		_mm256_maskz_packus_epi32(__mmask16 __M, __m256i __A, __m256i __B)
{		{
return (__m256i)__builtin_ia32_selectw_256((__mmask16)__M,		return (__m256i)__builtin_ia32_selectw_256((__mmask16)__M,
(__v16hi)_mm256_packus_epi32(__A, __B),		(__v16hi)_mm256_packus_epi32(__A, __B),
(__v16hi)_mm256_setzero_si256());		(__v16hi)_mm256_setzero_si256());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_packus_epi32(__m256i __W, __mmask16 __M, __m256i __A, __m256i __B)		_mm256_mask_packus_epi32(__m256i __W, __mmask16 __M, __m256i __A, __m256i __B)
{		{
return (__m256i)__builtin_ia32_selectw_256((__mmask16)__M,		return (__m256i)__builtin_ia32_selectw_256((__mmask16)__M,
(__v16hi)_mm256_packus_epi32(__A, __B),		(__v16hi)_mm256_packus_epi32(__A, __B),
(__v16hi)__W);		(__v16hi)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_packus_epi16(__mmask16 __M, __m128i __A, __m128i __B)		_mm_maskz_packus_epi16(__mmask16 __M, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectb_128((__mmask16)__M,		return (__m128i)__builtin_ia32_selectb_128((__mmask16)__M,
(__v16qi)_mm_packus_epi16(__A, __B),		(__v16qi)_mm_packus_epi16(__A, __B),
(__v16qi)_mm_setzero_si128());		(__v16qi)_mm_setzero_si128());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_packus_epi16(__m128i __W, __mmask16 __M, __m128i __A, __m128i __B)		_mm_mask_packus_epi16(__m128i __W, __mmask16 __M, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectb_128((__mmask16)__M,		return (__m128i)__builtin_ia32_selectb_128((__mmask16)__M,
(__v16qi)_mm_packus_epi16(__A, __B),		(__v16qi)_mm_packus_epi16(__A, __B),
(__v16qi)__W);		(__v16qi)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_packus_epi16(__mmask32 __M, __m256i __A, __m256i __B)		_mm256_maskz_packus_epi16(__mmask32 __M, __m256i __A, __m256i __B)
{		{
return (__m256i)__builtin_ia32_selectb_256((__mmask32)__M,		return (__m256i)__builtin_ia32_selectb_256((__mmask32)__M,
(__v32qi)_mm256_packus_epi16(__A, __B),		(__v32qi)_mm256_packus_epi16(__A, __B),
(__v32qi)_mm256_setzero_si256());		(__v32qi)_mm256_setzero_si256());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_packus_epi16(__m256i __W, __mmask32 __M, __m256i __A, __m256i __B)		_mm256_mask_packus_epi16(__m256i __W, __mmask32 __M, __m256i __A, __m256i __B)
{		{
return (__m256i)__builtin_ia32_selectb_256((__mmask32)__M,		return (__m256i)__builtin_ia32_selectb_256((__mmask32)__M,
(__v32qi)_mm256_packus_epi16(__A, __B),		(__v32qi)_mm256_packus_epi16(__A, __B),
(__v32qi)__W);		(__v32qi)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_adds_epi8(__m128i __W, __mmask16 __U, __m128i __A, __m128i __B)		_mm_mask_adds_epi8(__m128i __W, __mmask16 __U, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectb_128((__mmask16)__U,		return (__m128i)__builtin_ia32_selectb_128((__mmask16)__U,
(__v16qi)_mm_adds_epi8(__A, __B),		(__v16qi)_mm_adds_epi8(__A, __B),
(__v16qi)__W);		(__v16qi)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_adds_epi8(__mmask16 __U, __m128i __A, __m128i __B)		_mm_maskz_adds_epi8(__mmask16 __U, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectb_128((__mmask16)__U,		return (__m128i)__builtin_ia32_selectb_128((__mmask16)__U,
(__v16qi)_mm_adds_epi8(__A, __B),		(__v16qi)_mm_adds_epi8(__A, __B),
(__v16qi)_mm_setzero_si128());		(__v16qi)_mm_setzero_si128());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_adds_epi8(__m256i __W, __mmask32 __U, __m256i __A, __m256i __B)		_mm256_mask_adds_epi8(__m256i __W, __mmask32 __U, __m256i __A, __m256i __B)
{		{
return (__m256i)__builtin_ia32_selectb_256((__mmask32)__U,		return (__m256i)__builtin_ia32_selectb_256((__mmask32)__U,
(__v32qi)_mm256_adds_epi8(__A, __B),		(__v32qi)_mm256_adds_epi8(__A, __B),
(__v32qi)__W);		(__v32qi)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_adds_epi8(__mmask32 __U, __m256i __A, __m256i __B)		_mm256_maskz_adds_epi8(__mmask32 __U, __m256i __A, __m256i __B)
{		{
return (__m256i)__builtin_ia32_selectb_256((__mmask32)__U,		return (__m256i)__builtin_ia32_selectb_256((__mmask32)__U,
(__v32qi)_mm256_adds_epi8(__A, __B),		(__v32qi)_mm256_adds_epi8(__A, __B),
(__v32qi)_mm256_setzero_si256());		(__v32qi)_mm256_setzero_si256());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_adds_epi16(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)		_mm_mask_adds_epi16(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,
(__v8hi)_mm_adds_epi16(__A, __B),		(__v8hi)_mm_adds_epi16(__A, __B),
(__v8hi)__W);		(__v8hi)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_adds_epi16(__mmask8 __U, __m128i __A, __m128i __B)		_mm_maskz_adds_epi16(__mmask8 __U, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,
(__v8hi)_mm_adds_epi16(__A, __B),		(__v8hi)_mm_adds_epi16(__A, __B),
(__v8hi)_mm_setzero_si128());		(__v8hi)_mm_setzero_si128());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_adds_epi16(__m256i __W, __mmask16 __U, __m256i __A, __m256i __B)		_mm256_mask_adds_epi16(__m256i __W, __mmask16 __U, __m256i __A, __m256i __B)
{		{
return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,		return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,
(__v16hi)_mm256_adds_epi16(__A, __B),		(__v16hi)_mm256_adds_epi16(__A, __B),
(__v16hi)__W);		(__v16hi)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_adds_epi16(__mmask16 __U, __m256i __A, __m256i __B)		_mm256_maskz_adds_epi16(__mmask16 __U, __m256i __A, __m256i __B)
{		{
return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,		return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,
(__v16hi)_mm256_adds_epi16(__A, __B),		(__v16hi)_mm256_adds_epi16(__A, __B),
(__v16hi)_mm256_setzero_si256());		(__v16hi)_mm256_setzero_si256());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_adds_epu8(__m128i __W, __mmask16 __U, __m128i __A, __m128i __B)		_mm_mask_adds_epu8(__m128i __W, __mmask16 __U, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectb_128((__mmask16)__U,		return (__m128i)__builtin_ia32_selectb_128((__mmask16)__U,
(__v16qi)_mm_adds_epu8(__A, __B),		(__v16qi)_mm_adds_epu8(__A, __B),
(__v16qi)__W);		(__v16qi)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_adds_epu8(__mmask16 __U, __m128i __A, __m128i __B)		_mm_maskz_adds_epu8(__mmask16 __U, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectb_128((__mmask16)__U,		return (__m128i)__builtin_ia32_selectb_128((__mmask16)__U,
(__v16qi)_mm_adds_epu8(__A, __B),		(__v16qi)_mm_adds_epu8(__A, __B),
(__v16qi)_mm_setzero_si128());		(__v16qi)_mm_setzero_si128());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_adds_epu8(__m256i __W, __mmask32 __U, __m256i __A, __m256i __B)		_mm256_mask_adds_epu8(__m256i __W, __mmask32 __U, __m256i __A, __m256i __B)
{		{
return (__m256i)__builtin_ia32_selectb_256((__mmask32)__U,		return (__m256i)__builtin_ia32_selectb_256((__mmask32)__U,
(__v32qi)_mm256_adds_epu8(__A, __B),		(__v32qi)_mm256_adds_epu8(__A, __B),
(__v32qi)__W);		(__v32qi)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_adds_epu8(__mmask32 __U, __m256i __A, __m256i __B)		_mm256_maskz_adds_epu8(__mmask32 __U, __m256i __A, __m256i __B)
{		{
return (__m256i)__builtin_ia32_selectb_256((__mmask32)__U,		return (__m256i)__builtin_ia32_selectb_256((__mmask32)__U,
(__v32qi)_mm256_adds_epu8(__A, __B),		(__v32qi)_mm256_adds_epu8(__A, __B),
(__v32qi)_mm256_setzero_si256());		(__v32qi)_mm256_setzero_si256());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_adds_epu16(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)		_mm_mask_adds_epu16(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,
(__v8hi)_mm_adds_epu16(__A, __B),		(__v8hi)_mm_adds_epu16(__A, __B),
(__v8hi)__W);		(__v8hi)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_adds_epu16(__mmask8 __U, __m128i __A, __m128i __B)		_mm_maskz_adds_epu16(__mmask8 __U, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,
(__v8hi)_mm_adds_epu16(__A, __B),		(__v8hi)_mm_adds_epu16(__A, __B),
(__v8hi)_mm_setzero_si128());		(__v8hi)_mm_setzero_si128());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_adds_epu16(__m256i __W, __mmask16 __U, __m256i __A, __m256i __B)		_mm256_mask_adds_epu16(__m256i __W, __mmask16 __U, __m256i __A, __m256i __B)
{		{
return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,		return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,
(__v16hi)_mm256_adds_epu16(__A, __B),		(__v16hi)_mm256_adds_epu16(__A, __B),
(__v16hi)__W);		(__v16hi)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_adds_epu16(__mmask16 __U, __m256i __A, __m256i __B)		_mm256_maskz_adds_epu16(__mmask16 __U, __m256i __A, __m256i __B)
{		{
return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,		return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,
(__v16hi)_mm256_adds_epu16(__A, __B),		(__v16hi)_mm256_adds_epu16(__A, __B),
(__v16hi)_mm256_setzero_si256());		(__v16hi)_mm256_setzero_si256());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_avg_epu8(__m128i __W, __mmask16 __U, __m128i __A, __m128i __B)		_mm_mask_avg_epu8(__m128i __W, __mmask16 __U, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectb_128((__mmask16)__U,		return (__m128i)__builtin_ia32_selectb_128((__mmask16)__U,
(__v16qi)_mm_avg_epu8(__A, __B),		(__v16qi)_mm_avg_epu8(__A, __B),
(__v16qi)__W);		(__v16qi)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_avg_epu8(__mmask16 __U, __m128i __A, __m128i __B)		_mm_maskz_avg_epu8(__mmask16 __U, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectb_128((__mmask16)__U,		return (__m128i)__builtin_ia32_selectb_128((__mmask16)__U,
(__v16qi)_mm_avg_epu8(__A, __B),		(__v16qi)_mm_avg_epu8(__A, __B),
(__v16qi)_mm_setzero_si128());		(__v16qi)_mm_setzero_si128());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_avg_epu8(__m256i __W, __mmask32 __U, __m256i __A, __m256i __B)		_mm256_mask_avg_epu8(__m256i __W, __mmask32 __U, __m256i __A, __m256i __B)
{		{
return (__m256i)__builtin_ia32_selectb_256((__mmask32)__U,		return (__m256i)__builtin_ia32_selectb_256((__mmask32)__U,
(__v32qi)_mm256_avg_epu8(__A, __B),		(__v32qi)_mm256_avg_epu8(__A, __B),
(__v32qi)__W);		(__v32qi)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_avg_epu8(__mmask32 __U, __m256i __A, __m256i __B)		_mm256_maskz_avg_epu8(__mmask32 __U, __m256i __A, __m256i __B)
{		{
return (__m256i)__builtin_ia32_selectb_256((__mmask32)__U,		return (__m256i)__builtin_ia32_selectb_256((__mmask32)__U,
(__v32qi)_mm256_avg_epu8(__A, __B),		(__v32qi)_mm256_avg_epu8(__A, __B),
(__v32qi)_mm256_setzero_si256());		(__v32qi)_mm256_setzero_si256());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_avg_epu16(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)		_mm_mask_avg_epu16(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,
(__v8hi)_mm_avg_epu16(__A, __B),		(__v8hi)_mm_avg_epu16(__A, __B),
(__v8hi)__W);		(__v8hi)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_avg_epu16(__mmask8 __U, __m128i __A, __m128i __B)		_mm_maskz_avg_epu16(__mmask8 __U, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,
(__v8hi)_mm_avg_epu16(__A, __B),		(__v8hi)_mm_avg_epu16(__A, __B),
(__v8hi)_mm_setzero_si128());		(__v8hi)_mm_setzero_si128());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_avg_epu16(__m256i __W, __mmask16 __U, __m256i __A, __m256i __B)		_mm256_mask_avg_epu16(__m256i __W, __mmask16 __U, __m256i __A, __m256i __B)
{		{
return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,		return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,
(__v16hi)_mm256_avg_epu16(__A, __B),		(__v16hi)_mm256_avg_epu16(__A, __B),
(__v16hi)__W);		(__v16hi)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_avg_epu16(__mmask16 __U, __m256i __A, __m256i __B)		_mm256_maskz_avg_epu16(__mmask16 __U, __m256i __A, __m256i __B)
{		{
return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,		return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,
(__v16hi)_mm256_avg_epu16(__A, __B),		(__v16hi)_mm256_avg_epu16(__A, __B),
(__v16hi)_mm256_setzero_si256());		(__v16hi)_mm256_setzero_si256());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_max_epi8(__mmask16 __M, __m128i __A, __m128i __B)		_mm_maskz_max_epi8(__mmask16 __M, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectb_128((__mmask16)__M,		return (__m128i)__builtin_ia32_selectb_128((__mmask16)__M,
(__v16qi)_mm_max_epi8(__A, __B),		(__v16qi)_mm_max_epi8(__A, __B),
(__v16qi)_mm_setzero_si128());		(__v16qi)_mm_setzero_si128());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_max_epi8(__m128i __W, __mmask16 __M, __m128i __A, __m128i __B)		_mm_mask_max_epi8(__m128i __W, __mmask16 __M, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectb_128((__mmask16)__M,		return (__m128i)__builtin_ia32_selectb_128((__mmask16)__M,
(__v16qi)_mm_max_epi8(__A, __B),		(__v16qi)_mm_max_epi8(__A, __B),
(__v16qi)__W);		(__v16qi)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_max_epi8(__mmask32 __M, __m256i __A, __m256i __B)		_mm256_maskz_max_epi8(__mmask32 __M, __m256i __A, __m256i __B)
{		{
return (__m256i)__builtin_ia32_selectb_256((__mmask32)__M,		return (__m256i)__builtin_ia32_selectb_256((__mmask32)__M,
(__v32qi)_mm256_max_epi8(__A, __B),		(__v32qi)_mm256_max_epi8(__A, __B),
(__v32qi)_mm256_setzero_si256());		(__v32qi)_mm256_setzero_si256());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_max_epi8(__m256i __W, __mmask32 __M, __m256i __A, __m256i __B)		_mm256_mask_max_epi8(__m256i __W, __mmask32 __M, __m256i __A, __m256i __B)
{		{
return (__m256i)__builtin_ia32_selectb_256((__mmask32)__M,		return (__m256i)__builtin_ia32_selectb_256((__mmask32)__M,
(__v32qi)_mm256_max_epi8(__A, __B),		(__v32qi)_mm256_max_epi8(__A, __B),
(__v32qi)__W);		(__v32qi)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_max_epi16(__mmask8 __M, __m128i __A, __m128i __B)		_mm_maskz_max_epi16(__mmask8 __M, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectw_128((__mmask8)__M,		return (__m128i)__builtin_ia32_selectw_128((__mmask8)__M,
(__v8hi)_mm_max_epi16(__A, __B),		(__v8hi)_mm_max_epi16(__A, __B),
(__v8hi)_mm_setzero_si128());		(__v8hi)_mm_setzero_si128());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_max_epi16(__m128i __W, __mmask8 __M, __m128i __A, __m128i __B)		_mm_mask_max_epi16(__m128i __W, __mmask8 __M, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectw_128((__mmask8)__M,		return (__m128i)__builtin_ia32_selectw_128((__mmask8)__M,
(__v8hi)_mm_max_epi16(__A, __B),		(__v8hi)_mm_max_epi16(__A, __B),
(__v8hi)__W);		(__v8hi)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_max_epi16(__mmask16 __M, __m256i __A, __m256i __B)		_mm256_maskz_max_epi16(__mmask16 __M, __m256i __A, __m256i __B)
{		{
return (__m256i)__builtin_ia32_selectw_256((__mmask16)__M,		return (__m256i)__builtin_ia32_selectw_256((__mmask16)__M,
(__v16hi)_mm256_max_epi16(__A, __B),		(__v16hi)_mm256_max_epi16(__A, __B),
(__v16hi)_mm256_setzero_si256());		(__v16hi)_mm256_setzero_si256());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_max_epi16(__m256i __W, __mmask16 __M, __m256i __A, __m256i __B)		_mm256_mask_max_epi16(__m256i __W, __mmask16 __M, __m256i __A, __m256i __B)
{		{
return (__m256i)__builtin_ia32_selectw_256((__mmask16)__M,		return (__m256i)__builtin_ia32_selectw_256((__mmask16)__M,
(__v16hi)_mm256_max_epi16(__A, __B),		(__v16hi)_mm256_max_epi16(__A, __B),
(__v16hi)__W);		(__v16hi)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_max_epu8(__mmask16 __M, __m128i __A, __m128i __B)		_mm_maskz_max_epu8(__mmask16 __M, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectb_128((__mmask16)__M,		return (__m128i)__builtin_ia32_selectb_128((__mmask16)__M,
(__v16qi)_mm_max_epu8(__A, __B),		(__v16qi)_mm_max_epu8(__A, __B),
(__v16qi)_mm_setzero_si128());		(__v16qi)_mm_setzero_si128());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_max_epu8(__m128i __W, __mmask16 __M, __m128i __A, __m128i __B)		_mm_mask_max_epu8(__m128i __W, __mmask16 __M, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectb_128((__mmask16)__M,		return (__m128i)__builtin_ia32_selectb_128((__mmask16)__M,
(__v16qi)_mm_max_epu8(__A, __B),		(__v16qi)_mm_max_epu8(__A, __B),
(__v16qi)__W);		(__v16qi)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_max_epu8 (__mmask32 __M, __m256i __A, __m256i __B)		_mm256_maskz_max_epu8 (__mmask32 __M, __m256i __A, __m256i __B)
{		{
return (__m256i)__builtin_ia32_selectb_256((__mmask32)__M,		return (__m256i)__builtin_ia32_selectb_256((__mmask32)__M,
(__v32qi)_mm256_max_epu8(__A, __B),		(__v32qi)_mm256_max_epu8(__A, __B),
(__v32qi)_mm256_setzero_si256());		(__v32qi)_mm256_setzero_si256());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_max_epu8(__m256i __W, __mmask32 __M, __m256i __A, __m256i __B)		_mm256_mask_max_epu8(__m256i __W, __mmask32 __M, __m256i __A, __m256i __B)
{		{
return (__m256i)__builtin_ia32_selectb_256((__mmask32)__M,		return (__m256i)__builtin_ia32_selectb_256((__mmask32)__M,
(__v32qi)_mm256_max_epu8(__A, __B),		(__v32qi)_mm256_max_epu8(__A, __B),
(__v32qi)__W);		(__v32qi)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_max_epu16(__mmask8 __M, __m128i __A, __m128i __B)		_mm_maskz_max_epu16(__mmask8 __M, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectw_128((__mmask8)__M,		return (__m128i)__builtin_ia32_selectw_128((__mmask8)__M,
(__v8hi)_mm_max_epu16(__A, __B),		(__v8hi)_mm_max_epu16(__A, __B),
(__v8hi)_mm_setzero_si128());		(__v8hi)_mm_setzero_si128());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_max_epu16(__m128i __W, __mmask8 __M, __m128i __A, __m128i __B)		_mm_mask_max_epu16(__m128i __W, __mmask8 __M, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectw_128((__mmask8)__M,		return (__m128i)__builtin_ia32_selectw_128((__mmask8)__M,
(__v8hi)_mm_max_epu16(__A, __B),		(__v8hi)_mm_max_epu16(__A, __B),
(__v8hi)__W);		(__v8hi)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_max_epu16(__mmask16 __M, __m256i __A, __m256i __B)		_mm256_maskz_max_epu16(__mmask16 __M, __m256i __A, __m256i __B)
{		{
return (__m256i)__builtin_ia32_selectw_256((__mmask16)__M,		return (__m256i)__builtin_ia32_selectw_256((__mmask16)__M,
(__v16hi)_mm256_max_epu16(__A, __B),		(__v16hi)_mm256_max_epu16(__A, __B),
(__v16hi)_mm256_setzero_si256());		(__v16hi)_mm256_setzero_si256());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_max_epu16(__m256i __W, __mmask16 __M, __m256i __A, __m256i __B)		_mm256_mask_max_epu16(__m256i __W, __mmask16 __M, __m256i __A, __m256i __B)
{		{
return (__m256i)__builtin_ia32_selectw_256((__mmask16)__M,		return (__m256i)__builtin_ia32_selectw_256((__mmask16)__M,
(__v16hi)_mm256_max_epu16(__A, __B),		(__v16hi)_mm256_max_epu16(__A, __B),
(__v16hi)__W);		(__v16hi)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_min_epi8(__mmask16 __M, __m128i __A, __m128i __B)		_mm_maskz_min_epi8(__mmask16 __M, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectb_128((__mmask16)__M,		return (__m128i)__builtin_ia32_selectb_128((__mmask16)__M,
(__v16qi)_mm_min_epi8(__A, __B),		(__v16qi)_mm_min_epi8(__A, __B),
(__v16qi)_mm_setzero_si128());		(__v16qi)_mm_setzero_si128());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_min_epi8(__m128i __W, __mmask16 __M, __m128i __A, __m128i __B)		_mm_mask_min_epi8(__m128i __W, __mmask16 __M, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectb_128((__mmask16)__M,		return (__m128i)__builtin_ia32_selectb_128((__mmask16)__M,
(__v16qi)_mm_min_epi8(__A, __B),		(__v16qi)_mm_min_epi8(__A, __B),
(__v16qi)__W);		(__v16qi)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_min_epi8(__mmask32 __M, __m256i __A, __m256i __B)		_mm256_maskz_min_epi8(__mmask32 __M, __m256i __A, __m256i __B)
{		{
return (__m256i)__builtin_ia32_selectb_256((__mmask32)__M,		return (__m256i)__builtin_ia32_selectb_256((__mmask32)__M,
(__v32qi)_mm256_min_epi8(__A, __B),		(__v32qi)_mm256_min_epi8(__A, __B),
(__v32qi)_mm256_setzero_si256());		(__v32qi)_mm256_setzero_si256());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_min_epi8(__m256i __W, __mmask32 __M, __m256i __A, __m256i __B)		_mm256_mask_min_epi8(__m256i __W, __mmask32 __M, __m256i __A, __m256i __B)
{		{
return (__m256i)__builtin_ia32_selectb_256((__mmask32)__M,		return (__m256i)__builtin_ia32_selectb_256((__mmask32)__M,
(__v32qi)_mm256_min_epi8(__A, __B),		(__v32qi)_mm256_min_epi8(__A, __B),
(__v32qi)__W);		(__v32qi)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_min_epi16(__mmask8 __M, __m128i __A, __m128i __B)		_mm_maskz_min_epi16(__mmask8 __M, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectw_128((__mmask8)__M,		return (__m128i)__builtin_ia32_selectw_128((__mmask8)__M,
(__v8hi)_mm_min_epi16(__A, __B),		(__v8hi)_mm_min_epi16(__A, __B),
(__v8hi)_mm_setzero_si128());		(__v8hi)_mm_setzero_si128());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_min_epi16(__m128i __W, __mmask8 __M, __m128i __A, __m128i __B)		_mm_mask_min_epi16(__m128i __W, __mmask8 __M, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectw_128((__mmask8)__M,		return (__m128i)__builtin_ia32_selectw_128((__mmask8)__M,
(__v8hi)_mm_min_epi16(__A, __B),		(__v8hi)_mm_min_epi16(__A, __B),
(__v8hi)__W);		(__v8hi)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_min_epi16(__mmask16 __M, __m256i __A, __m256i __B)		_mm256_maskz_min_epi16(__mmask16 __M, __m256i __A, __m256i __B)
{		{
return (__m256i)__builtin_ia32_selectw_256((__mmask16)__M,		return (__m256i)__builtin_ia32_selectw_256((__mmask16)__M,
(__v16hi)_mm256_min_epi16(__A, __B),		(__v16hi)_mm256_min_epi16(__A, __B),
(__v16hi)_mm256_setzero_si256());		(__v16hi)_mm256_setzero_si256());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_min_epi16(__m256i __W, __mmask16 __M, __m256i __A, __m256i __B)		_mm256_mask_min_epi16(__m256i __W, __mmask16 __M, __m256i __A, __m256i __B)
{		{
return (__m256i)__builtin_ia32_selectw_256((__mmask16)__M,		return (__m256i)__builtin_ia32_selectw_256((__mmask16)__M,
(__v16hi)_mm256_min_epi16(__A, __B),		(__v16hi)_mm256_min_epi16(__A, __B),
(__v16hi)__W);		(__v16hi)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_min_epu8(__mmask16 __M, __m128i __A, __m128i __B)		_mm_maskz_min_epu8(__mmask16 __M, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectb_128((__mmask16)__M,		return (__m128i)__builtin_ia32_selectb_128((__mmask16)__M,
(__v16qi)_mm_min_epu8(__A, __B),		(__v16qi)_mm_min_epu8(__A, __B),
(__v16qi)_mm_setzero_si128());		(__v16qi)_mm_setzero_si128());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_min_epu8(__m128i __W, __mmask16 __M, __m128i __A, __m128i __B)		_mm_mask_min_epu8(__m128i __W, __mmask16 __M, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectb_128((__mmask16)__M,		return (__m128i)__builtin_ia32_selectb_128((__mmask16)__M,
(__v16qi)_mm_min_epu8(__A, __B),		(__v16qi)_mm_min_epu8(__A, __B),
(__v16qi)__W);		(__v16qi)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_min_epu8 (__mmask32 __M, __m256i __A, __m256i __B)		_mm256_maskz_min_epu8 (__mmask32 __M, __m256i __A, __m256i __B)
{		{
return (__m256i)__builtin_ia32_selectb_256((__mmask32)__M,		return (__m256i)__builtin_ia32_selectb_256((__mmask32)__M,
(__v32qi)_mm256_min_epu8(__A, __B),		(__v32qi)_mm256_min_epu8(__A, __B),
(__v32qi)_mm256_setzero_si256());		(__v32qi)_mm256_setzero_si256());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_min_epu8(__m256i __W, __mmask32 __M, __m256i __A, __m256i __B)		_mm256_mask_min_epu8(__m256i __W, __mmask32 __M, __m256i __A, __m256i __B)
{		{
return (__m256i)__builtin_ia32_selectb_256((__mmask32)__M,		return (__m256i)__builtin_ia32_selectb_256((__mmask32)__M,
(__v32qi)_mm256_min_epu8(__A, __B),		(__v32qi)_mm256_min_epu8(__A, __B),
(__v32qi)__W);		(__v32qi)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_min_epu16(__mmask8 __M, __m128i __A, __m128i __B)		_mm_maskz_min_epu16(__mmask8 __M, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectw_128((__mmask8)__M,		return (__m128i)__builtin_ia32_selectw_128((__mmask8)__M,
(__v8hi)_mm_min_epu16(__A, __B),		(__v8hi)_mm_min_epu16(__A, __B),
(__v8hi)_mm_setzero_si128());		(__v8hi)_mm_setzero_si128());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_min_epu16(__m128i __W, __mmask8 __M, __m128i __A, __m128i __B)		_mm_mask_min_epu16(__m128i __W, __mmask8 __M, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectw_128((__mmask8)__M,		return (__m128i)__builtin_ia32_selectw_128((__mmask8)__M,
(__v8hi)_mm_min_epu16(__A, __B),		(__v8hi)_mm_min_epu16(__A, __B),
(__v8hi)__W);		(__v8hi)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_min_epu16(__mmask16 __M, __m256i __A, __m256i __B)		_mm256_maskz_min_epu16(__mmask16 __M, __m256i __A, __m256i __B)
{		{
return (__m256i)__builtin_ia32_selectw_256((__mmask16)__M,		return (__m256i)__builtin_ia32_selectw_256((__mmask16)__M,
(__v16hi)_mm256_min_epu16(__A, __B),		(__v16hi)_mm256_min_epu16(__A, __B),
(__v16hi)_mm256_setzero_si256());		(__v16hi)_mm256_setzero_si256());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_min_epu16(__m256i __W, __mmask16 __M, __m256i __A, __m256i __B)		_mm256_mask_min_epu16(__m256i __W, __mmask16 __M, __m256i __A, __m256i __B)
{		{
return (__m256i)__builtin_ia32_selectw_256((__mmask16)__M,		return (__m256i)__builtin_ia32_selectw_256((__mmask16)__M,
(__v16hi)_mm256_min_epu16(__A, __B),		(__v16hi)_mm256_min_epu16(__A, __B),
(__v16hi)__W);		(__v16hi)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_shuffle_epi8(__m128i __W, __mmask16 __U, __m128i __A, __m128i __B)		_mm_mask_shuffle_epi8(__m128i __W, __mmask16 __U, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectb_128((__mmask16)__U,		return (__m128i)__builtin_ia32_selectb_128((__mmask16)__U,
(__v16qi)_mm_shuffle_epi8(__A, __B),		(__v16qi)_mm_shuffle_epi8(__A, __B),
(__v16qi)__W);		(__v16qi)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_shuffle_epi8(__mmask16 __U, __m128i __A, __m128i __B)		_mm_maskz_shuffle_epi8(__mmask16 __U, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectb_128((__mmask16)__U,		return (__m128i)__builtin_ia32_selectb_128((__mmask16)__U,
(__v16qi)_mm_shuffle_epi8(__A, __B),		(__v16qi)_mm_shuffle_epi8(__A, __B),
(__v16qi)_mm_setzero_si128());		(__v16qi)_mm_setzero_si128());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_shuffle_epi8(__m256i __W, __mmask32 __U, __m256i __A, __m256i __B)		_mm256_mask_shuffle_epi8(__m256i __W, __mmask32 __U, __m256i __A, __m256i __B)
{		{
return (__m256i)__builtin_ia32_selectb_256((__mmask32)__U,		return (__m256i)__builtin_ia32_selectb_256((__mmask32)__U,
(__v32qi)_mm256_shuffle_epi8(__A, __B),		(__v32qi)_mm256_shuffle_epi8(__A, __B),
(__v32qi)__W);		(__v32qi)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_shuffle_epi8(__mmask32 __U, __m256i __A, __m256i __B)		_mm256_maskz_shuffle_epi8(__mmask32 __U, __m256i __A, __m256i __B)
{		{
return (__m256i)__builtin_ia32_selectb_256((__mmask32)__U,		return (__m256i)__builtin_ia32_selectb_256((__mmask32)__U,
(__v32qi)_mm256_shuffle_epi8(__A, __B),		(__v32qi)_mm256_shuffle_epi8(__A, __B),
(__v32qi)_mm256_setzero_si256());		(__v32qi)_mm256_setzero_si256());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_subs_epi8(__m128i __W, __mmask16 __U, __m128i __A, __m128i __B)		_mm_mask_subs_epi8(__m128i __W, __mmask16 __U, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectb_128((__mmask16)__U,		return (__m128i)__builtin_ia32_selectb_128((__mmask16)__U,
(__v16qi)_mm_subs_epi8(__A, __B),		(__v16qi)_mm_subs_epi8(__A, __B),
(__v16qi)__W);		(__v16qi)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_subs_epi8(__mmask16 __U, __m128i __A, __m128i __B)		_mm_maskz_subs_epi8(__mmask16 __U, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectb_128((__mmask16)__U,		return (__m128i)__builtin_ia32_selectb_128((__mmask16)__U,
(__v16qi)_mm_subs_epi8(__A, __B),		(__v16qi)_mm_subs_epi8(__A, __B),
(__v16qi)_mm_setzero_si128());		(__v16qi)_mm_setzero_si128());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_subs_epi8(__m256i __W, __mmask32 __U, __m256i __A, __m256i __B)		_mm256_mask_subs_epi8(__m256i __W, __mmask32 __U, __m256i __A, __m256i __B)
{		{
return (__m256i)__builtin_ia32_selectb_256((__mmask32)__U,		return (__m256i)__builtin_ia32_selectb_256((__mmask32)__U,
(__v32qi)_mm256_subs_epi8(__A, __B),		(__v32qi)_mm256_subs_epi8(__A, __B),
(__v32qi)__W);		(__v32qi)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_subs_epi8(__mmask32 __U, __m256i __A, __m256i __B)		_mm256_maskz_subs_epi8(__mmask32 __U, __m256i __A, __m256i __B)
{		{
return (__m256i)__builtin_ia32_selectb_256((__mmask32)__U,		return (__m256i)__builtin_ia32_selectb_256((__mmask32)__U,
(__v32qi)_mm256_subs_epi8(__A, __B),		(__v32qi)_mm256_subs_epi8(__A, __B),
(__v32qi)_mm256_setzero_si256());		(__v32qi)_mm256_setzero_si256());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_subs_epi16(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)		_mm_mask_subs_epi16(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,
(__v8hi)_mm_subs_epi16(__A, __B),		(__v8hi)_mm_subs_epi16(__A, __B),
(__v8hi)__W);		(__v8hi)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_subs_epi16(__mmask8 __U, __m128i __A, __m128i __B)		_mm_maskz_subs_epi16(__mmask8 __U, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,
(__v8hi)_mm_subs_epi16(__A, __B),		(__v8hi)_mm_subs_epi16(__A, __B),
(__v8hi)_mm_setzero_si128());		(__v8hi)_mm_setzero_si128());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_subs_epi16(__m256i __W, __mmask16 __U, __m256i __A, __m256i __B)		_mm256_mask_subs_epi16(__m256i __W, __mmask16 __U, __m256i __A, __m256i __B)
{		{
return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,		return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,
(__v16hi)_mm256_subs_epi16(__A, __B),		(__v16hi)_mm256_subs_epi16(__A, __B),
(__v16hi)__W);		(__v16hi)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_subs_epi16(__mmask16 __U, __m256i __A, __m256i __B)		_mm256_maskz_subs_epi16(__mmask16 __U, __m256i __A, __m256i __B)
{		{
return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,		return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,
(__v16hi)_mm256_subs_epi16(__A, __B),		(__v16hi)_mm256_subs_epi16(__A, __B),
(__v16hi)_mm256_setzero_si256());		(__v16hi)_mm256_setzero_si256());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_subs_epu8(__m128i __W, __mmask16 __U, __m128i __A, __m128i __B)		_mm_mask_subs_epu8(__m128i __W, __mmask16 __U, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectb_128((__mmask16)__U,		return (__m128i)__builtin_ia32_selectb_128((__mmask16)__U,
(__v16qi)_mm_subs_epu8(__A, __B),		(__v16qi)_mm_subs_epu8(__A, __B),
(__v16qi)__W);		(__v16qi)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_subs_epu8(__mmask16 __U, __m128i __A, __m128i __B)		_mm_maskz_subs_epu8(__mmask16 __U, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectb_128((__mmask16)__U,		return (__m128i)__builtin_ia32_selectb_128((__mmask16)__U,
(__v16qi)_mm_subs_epu8(__A, __B),		(__v16qi)_mm_subs_epu8(__A, __B),
(__v16qi)_mm_setzero_si128());		(__v16qi)_mm_setzero_si128());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_subs_epu8(__m256i __W, __mmask32 __U, __m256i __A, __m256i __B)		_mm256_mask_subs_epu8(__m256i __W, __mmask32 __U, __m256i __A, __m256i __B)
{		{
return (__m256i)__builtin_ia32_selectb_256((__mmask32)__U,		return (__m256i)__builtin_ia32_selectb_256((__mmask32)__U,
(__v32qi)_mm256_subs_epu8(__A, __B),		(__v32qi)_mm256_subs_epu8(__A, __B),
(__v32qi)__W);		(__v32qi)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_subs_epu8(__mmask32 __U, __m256i __A, __m256i __B)		_mm256_maskz_subs_epu8(__mmask32 __U, __m256i __A, __m256i __B)
{		{
return (__m256i)__builtin_ia32_selectb_256((__mmask32)__U,		return (__m256i)__builtin_ia32_selectb_256((__mmask32)__U,
(__v32qi)_mm256_subs_epu8(__A, __B),		(__v32qi)_mm256_subs_epu8(__A, __B),
(__v32qi)_mm256_setzero_si256());		(__v32qi)_mm256_setzero_si256());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_subs_epu16(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)		_mm_mask_subs_epu16(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,
(__v8hi)_mm_subs_epu16(__A, __B),		(__v8hi)_mm_subs_epu16(__A, __B),
(__v8hi)__W);		(__v8hi)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_subs_epu16(__mmask8 __U, __m128i __A, __m128i __B)		_mm_maskz_subs_epu16(__mmask8 __U, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,
(__v8hi)_mm_subs_epu16(__A, __B),		(__v8hi)_mm_subs_epu16(__A, __B),
(__v8hi)_mm_setzero_si128());		(__v8hi)_mm_setzero_si128());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_subs_epu16(__m256i __W, __mmask16 __U, __m256i __A,		_mm256_mask_subs_epu16(__m256i __W, __mmask16 __U, __m256i __A,
__m256i __B) {		__m256i __B) {
return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,		return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,
(__v16hi)_mm256_subs_epu16(__A, __B),		(__v16hi)_mm256_subs_epu16(__A, __B),
(__v16hi)__W);		(__v16hi)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_subs_epu16(__mmask16 __U, __m256i __A, __m256i __B)		_mm256_maskz_subs_epu16(__mmask16 __U, __m256i __A, __m256i __B)
{		{
return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,		return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,
(__v16hi)_mm256_subs_epu16(__A, __B),		(__v16hi)_mm256_subs_epu16(__A, __B),
(__v16hi)_mm256_setzero_si256());		(__v16hi)_mm256_setzero_si256());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_permutex2var_epi16(__m128i __A, __m128i __I, __m128i __B)		_mm_permutex2var_epi16(__m128i __A, __m128i __I, __m128i __B)
{		{
return (__m128i)__builtin_ia32_vpermi2varhi128((__v8hi)__A, (__v8hi)__I,		return (__m128i)__builtin_ia32_vpermi2varhi128((__v8hi)__A, (__v8hi)__I,
(__v8hi) __B);		(__v8hi) __B);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_permutex2var_epi16(__m128i __A, __mmask8 __U, __m128i __I,		_mm_mask_permutex2var_epi16(__m128i __A, __mmask8 __U, __m128i __I,
__m128i __B)		__m128i __B)
{		{
return (__m128i)__builtin_ia32_selectw_128(__U,		return (__m128i)__builtin_ia32_selectw_128(__U,
(__v8hi)_mm_permutex2var_epi16(__A, __I, __B),		(__v8hi)_mm_permutex2var_epi16(__A, __I, __B),
(__v8hi)__A);		(__v8hi)__A);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask2_permutex2var_epi16(__m128i __A, __m128i __I, __mmask8 __U,		_mm_mask2_permutex2var_epi16(__m128i __A, __m128i __I, __mmask8 __U,
__m128i __B)		__m128i __B)
{		{
return (__m128i)__builtin_ia32_selectw_128(__U,		return (__m128i)__builtin_ia32_selectw_128(__U,
(__v8hi)_mm_permutex2var_epi16(__A, __I, __B),		(__v8hi)_mm_permutex2var_epi16(__A, __I, __B),
(__v8hi)__I);		(__v8hi)__I);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_permutex2var_epi16 (__mmask8 __U, __m128i __A, __m128i __I,		_mm_maskz_permutex2var_epi16 (__mmask8 __U, __m128i __A, __m128i __I,
__m128i __B)		__m128i __B)
{		{
return (__m128i)__builtin_ia32_selectw_128(__U,		return (__m128i)__builtin_ia32_selectw_128(__U,
(__v8hi)_mm_permutex2var_epi16(__A, __I, __B),		(__v8hi)_mm_permutex2var_epi16(__A, __I, __B),
(__v8hi)_mm_setzero_si128());		(__v8hi)_mm_setzero_si128());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_permutex2var_epi16(__m256i __A, __m256i __I, __m256i __B)		_mm256_permutex2var_epi16(__m256i __A, __m256i __I, __m256i __B)
{		{
return (__m256i)__builtin_ia32_vpermi2varhi256((__v16hi)__A, (__v16hi)__I,		return (__m256i)__builtin_ia32_vpermi2varhi256((__v16hi)__A, (__v16hi)__I,
(__v16hi)__B);		(__v16hi)__B);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_permutex2var_epi16(__m256i __A, __mmask16 __U, __m256i __I,		_mm256_mask_permutex2var_epi16(__m256i __A, __mmask16 __U, __m256i __I,
__m256i __B)		__m256i __B)
{		{
return (__m256i)__builtin_ia32_selectw_256(__U,		return (__m256i)__builtin_ia32_selectw_256(__U,
(__v16hi)_mm256_permutex2var_epi16(__A, __I, __B),		(__v16hi)_mm256_permutex2var_epi16(__A, __I, __B),
(__v16hi)__A);		(__v16hi)__A);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask2_permutex2var_epi16(__m256i __A, __m256i __I, __mmask16 __U,		_mm256_mask2_permutex2var_epi16(__m256i __A, __m256i __I, __mmask16 __U,
__m256i __B)		__m256i __B)
{		{
return (__m256i)__builtin_ia32_selectw_256(__U,		return (__m256i)__builtin_ia32_selectw_256(__U,
(__v16hi)_mm256_permutex2var_epi16(__A, __I, __B),		(__v16hi)_mm256_permutex2var_epi16(__A, __I, __B),
(__v16hi)__I);		(__v16hi)__I);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_permutex2var_epi16 (__mmask16 __U, __m256i __A, __m256i __I,		_mm256_maskz_permutex2var_epi16 (__mmask16 __U, __m256i __A, __m256i __I,
__m256i __B)		__m256i __B)
{		{
return (__m256i)__builtin_ia32_selectw_256(__U,		return (__m256i)__builtin_ia32_selectw_256(__U,
(__v16hi)_mm256_permutex2var_epi16(__A, __I, __B),		(__v16hi)_mm256_permutex2var_epi16(__A, __I, __B),
(__v16hi)_mm256_setzero_si256());		(__v16hi)_mm256_setzero_si256());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_maddubs_epi16(__m128i __W, __mmask8 __U, __m128i __X, __m128i __Y) {		_mm_mask_maddubs_epi16(__m128i __W, __mmask8 __U, __m128i __X, __m128i __Y) {
return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,
(__v8hi)_mm_maddubs_epi16(__X, __Y),		(__v8hi)_mm_maddubs_epi16(__X, __Y),
(__v8hi)__W);		(__v8hi)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_maddubs_epi16(__mmask8 __U, __m128i __X, __m128i __Y) {		_mm_maskz_maddubs_epi16(__mmask8 __U, __m128i __X, __m128i __Y) {
return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,
(__v8hi)_mm_maddubs_epi16(__X, __Y),		(__v8hi)_mm_maddubs_epi16(__X, __Y),
(__v8hi)_mm_setzero_si128());		(__v8hi)_mm_setzero_si128());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_maddubs_epi16(__m256i __W, __mmask16 __U, __m256i __X,		_mm256_mask_maddubs_epi16(__m256i __W, __mmask16 __U, __m256i __X,
__m256i __Y) {		__m256i __Y) {
return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,		return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,
(__v16hi)_mm256_maddubs_epi16(__X, __Y),		(__v16hi)_mm256_maddubs_epi16(__X, __Y),
(__v16hi)__W);		(__v16hi)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_maddubs_epi16(__mmask16 __U, __m256i __X, __m256i __Y) {		_mm256_maskz_maddubs_epi16(__mmask16 __U, __m256i __X, __m256i __Y) {
return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,		return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,
(__v16hi)_mm256_maddubs_epi16(__X, __Y),		(__v16hi)_mm256_maddubs_epi16(__X, __Y),
(__v16hi)_mm256_setzero_si256());		(__v16hi)_mm256_setzero_si256());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_madd_epi16(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) {		_mm_mask_madd_epi16(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) {
return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,
(__v4si)_mm_madd_epi16(__A, __B),		(__v4si)_mm_madd_epi16(__A, __B),
(__v4si)__W);		(__v4si)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_madd_epi16(__mmask8 __U, __m128i __A, __m128i __B) {		_mm_maskz_madd_epi16(__mmask8 __U, __m128i __A, __m128i __B) {
return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,
(__v4si)_mm_madd_epi16(__A, __B),		(__v4si)_mm_madd_epi16(__A, __B),
(__v4si)_mm_setzero_si128());		(__v4si)_mm_setzero_si128());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_madd_epi16(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B) {		_mm256_mask_madd_epi16(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B) {
return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,
(__v8si)_mm256_madd_epi16(__A, __B),		(__v8si)_mm256_madd_epi16(__A, __B),
(__v8si)__W);		(__v8si)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_madd_epi16(__mmask8 __U, __m256i __A, __m256i __B) {		_mm256_maskz_madd_epi16(__mmask8 __U, __m256i __A, __m256i __B) {
return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,
(__v8si)_mm256_madd_epi16(__A, __B),		(__v8si)_mm256_madd_epi16(__A, __B),
(__v8si)_mm256_setzero_si256());		(__v8si)_mm256_setzero_si256());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_cvtsepi16_epi8 (__m128i __A) {		_mm_cvtsepi16_epi8 (__m128i __A) {
return (__m128i) __builtin_ia32_pmovswb128_mask ((__v8hi) __A,		return (__m128i) __builtin_ia32_pmovswb128_mask ((__v8hi) __A,
(__v16qi) _mm_setzero_si128(),		(__v16qi) _mm_setzero_si128(),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_cvtsepi16_epi8 (__m128i __O, __mmask8 __M, __m128i __A) {		_mm_mask_cvtsepi16_epi8 (__m128i __O, __mmask8 __M, __m128i __A) {
return (__m128i) __builtin_ia32_pmovswb128_mask ((__v8hi) __A,		return (__m128i) __builtin_ia32_pmovswb128_mask ((__v8hi) __A,
(__v16qi) __O,		(__v16qi) __O,
__M);		__M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_cvtsepi16_epi8 (__mmask8 __M, __m128i __A) {		_mm_maskz_cvtsepi16_epi8 (__mmask8 __M, __m128i __A) {
return (__m128i) __builtin_ia32_pmovswb128_mask ((__v8hi) __A,		return (__m128i) __builtin_ia32_pmovswb128_mask ((__v8hi) __A,
(__v16qi) _mm_setzero_si128(),		(__v16qi) _mm_setzero_si128(),
__M);		__M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS256
_mm256_cvtsepi16_epi8 (__m256i __A) {		_mm256_cvtsepi16_epi8 (__m256i __A) {
return (__m128i) __builtin_ia32_pmovswb256_mask ((__v16hi) __A,		return (__m128i) __builtin_ia32_pmovswb256_mask ((__v16hi) __A,
(__v16qi) _mm_setzero_si128(),		(__v16qi) _mm_setzero_si128(),
(__mmask16) -1);		(__mmask16) -1);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS256
_mm256_mask_cvtsepi16_epi8 (__m128i __O, __mmask16 __M, __m256i __A) {		_mm256_mask_cvtsepi16_epi8 (__m128i __O, __mmask16 __M, __m256i __A) {
return (__m128i) __builtin_ia32_pmovswb256_mask ((__v16hi) __A,		return (__m128i) __builtin_ia32_pmovswb256_mask ((__v16hi) __A,
(__v16qi) __O,		(__v16qi) __O,
__M);		__M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS256
_mm256_maskz_cvtsepi16_epi8 (__mmask16 __M, __m256i __A) {		_mm256_maskz_cvtsepi16_epi8 (__mmask16 __M, __m256i __A) {
return (__m128i) __builtin_ia32_pmovswb256_mask ((__v16hi) __A,		return (__m128i) __builtin_ia32_pmovswb256_mask ((__v16hi) __A,
(__v16qi) _mm_setzero_si128(),		(__v16qi) _mm_setzero_si128(),
__M);		__M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_cvtusepi16_epi8 (__m128i __A) {		_mm_cvtusepi16_epi8 (__m128i __A) {
return (__m128i) __builtin_ia32_pmovuswb128_mask ((__v8hi) __A,		return (__m128i) __builtin_ia32_pmovuswb128_mask ((__v8hi) __A,
(__v16qi) _mm_setzero_si128(),		(__v16qi) _mm_setzero_si128(),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_cvtusepi16_epi8 (__m128i __O, __mmask8 __M, __m128i __A) {		_mm_mask_cvtusepi16_epi8 (__m128i __O, __mmask8 __M, __m128i __A) {
return (__m128i) __builtin_ia32_pmovuswb128_mask ((__v8hi) __A,		return (__m128i) __builtin_ia32_pmovuswb128_mask ((__v8hi) __A,
(__v16qi) __O,		(__v16qi) __O,
__M);		__M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_cvtusepi16_epi8 (__mmask8 __M, __m128i __A) {		_mm_maskz_cvtusepi16_epi8 (__mmask8 __M, __m128i __A) {
return (__m128i) __builtin_ia32_pmovuswb128_mask ((__v8hi) __A,		return (__m128i) __builtin_ia32_pmovuswb128_mask ((__v8hi) __A,
(__v16qi) _mm_setzero_si128(),		(__v16qi) _mm_setzero_si128(),
__M);		__M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS256
_mm256_cvtusepi16_epi8 (__m256i __A) {		_mm256_cvtusepi16_epi8 (__m256i __A) {
return (__m128i) __builtin_ia32_pmovuswb256_mask ((__v16hi) __A,		return (__m128i) __builtin_ia32_pmovuswb256_mask ((__v16hi) __A,
(__v16qi) _mm_setzero_si128(),		(__v16qi) _mm_setzero_si128(),
(__mmask16) -1);		(__mmask16) -1);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS256
_mm256_mask_cvtusepi16_epi8 (__m128i __O, __mmask16 __M, __m256i __A) {		_mm256_mask_cvtusepi16_epi8 (__m128i __O, __mmask16 __M, __m256i __A) {
return (__m128i) __builtin_ia32_pmovuswb256_mask ((__v16hi) __A,		return (__m128i) __builtin_ia32_pmovuswb256_mask ((__v16hi) __A,
(__v16qi) __O,		(__v16qi) __O,
__M);		__M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS256
_mm256_maskz_cvtusepi16_epi8 (__mmask16 __M, __m256i __A) {		_mm256_maskz_cvtusepi16_epi8 (__mmask16 __M, __m256i __A) {
return (__m128i) __builtin_ia32_pmovuswb256_mask ((__v16hi) __A,		return (__m128i) __builtin_ia32_pmovuswb256_mask ((__v16hi) __A,
(__v16qi) _mm_setzero_si128(),		(__v16qi) _mm_setzero_si128(),
__M);		__M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_cvtepi16_epi8 (__m128i __A) {		_mm_cvtepi16_epi8 (__m128i __A) {

return (__m128i) __builtin_ia32_pmovwb128_mask ((__v8hi) __A,		return (__m128i) __builtin_ia32_pmovwb128_mask ((__v8hi) __A,
(__v16qi) _mm_setzero_si128(),		(__v16qi) _mm_setzero_si128(),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_cvtepi16_epi8 (__m128i __O, __mmask8 __M, __m128i __A) {		_mm_mask_cvtepi16_epi8 (__m128i __O, __mmask8 __M, __m128i __A) {
return (__m128i) __builtin_ia32_pmovwb128_mask ((__v8hi) __A,		return (__m128i) __builtin_ia32_pmovwb128_mask ((__v8hi) __A,
(__v16qi) __O,		(__v16qi) __O,
__M);		__M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_cvtepi16_epi8 (__mmask8 __M, __m128i __A) {		_mm_maskz_cvtepi16_epi8 (__mmask8 __M, __m128i __A) {
return (__m128i) __builtin_ia32_pmovwb128_mask ((__v8hi) __A,		return (__m128i) __builtin_ia32_pmovwb128_mask ((__v8hi) __A,
(__v16qi) _mm_setzero_si128(),		(__v16qi) _mm_setzero_si128(),
__M);		__M);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS128
_mm_mask_cvtepi16_storeu_epi8 (void * __P, __mmask8 __M, __m128i __A)		_mm_mask_cvtepi16_storeu_epi8 (void * __P, __mmask8 __M, __m128i __A)
{		{
__builtin_ia32_pmovwb128mem_mask ((__v16qi *) __P, (__v8hi) __A, __M);		__builtin_ia32_pmovwb128mem_mask ((__v16qi *) __P, (__v8hi) __A, __M);
}		}


static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS128
_mm_mask_cvtsepi16_storeu_epi8 (void * __P, __mmask8 __M, __m128i __A)		_mm_mask_cvtsepi16_storeu_epi8 (void * __P, __mmask8 __M, __m128i __A)
{		{
__builtin_ia32_pmovswb128mem_mask ((__v16qi *) __P, (__v8hi) __A, __M);		__builtin_ia32_pmovswb128mem_mask ((__v16qi *) __P, (__v8hi) __A, __M);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS128
_mm_mask_cvtusepi16_storeu_epi8 (void * __P, __mmask8 __M, __m128i __A)		_mm_mask_cvtusepi16_storeu_epi8 (void * __P, __mmask8 __M, __m128i __A)
{		{
__builtin_ia32_pmovuswb128mem_mask ((__v16qi *) __P, (__v8hi) __A, __M);		__builtin_ia32_pmovuswb128mem_mask ((__v16qi *) __P, (__v8hi) __A, __M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS256
_mm256_cvtepi16_epi8 (__m256i __A) {		_mm256_cvtepi16_epi8 (__m256i __A) {
return (__m128i)__builtin_convertvector((__v16hi) __A, __v16qi);		return (__m128i)__builtin_convertvector((__v16hi) __A, __v16qi);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS256
_mm256_mask_cvtepi16_epi8 (__m128i __O, __mmask16 __M, __m256i __A) {		_mm256_mask_cvtepi16_epi8 (__m128i __O, __mmask16 __M, __m256i __A) {
return (__m128i)__builtin_ia32_selectb_128((__mmask16)__M,		return (__m128i)__builtin_ia32_selectb_128((__mmask16)__M,
(__v16qi)_mm256_cvtepi16_epi8(__A),		(__v16qi)_mm256_cvtepi16_epi8(__A),
(__v16qi)__O);		(__v16qi)__O);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS256
_mm256_maskz_cvtepi16_epi8 (__mmask16 __M, __m256i __A) {		_mm256_maskz_cvtepi16_epi8 (__mmask16 __M, __m256i __A) {
return (__m128i)__builtin_ia32_selectb_128((__mmask16)__M,		return (__m128i)__builtin_ia32_selectb_128((__mmask16)__M,
(__v16qi)_mm256_cvtepi16_epi8(__A),		(__v16qi)_mm256_cvtepi16_epi8(__A),
(__v16qi)_mm_setzero_si128());		(__v16qi)_mm_setzero_si128());
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS256
_mm256_mask_cvtepi16_storeu_epi8 (void * __P, __mmask16 __M, __m256i __A)		_mm256_mask_cvtepi16_storeu_epi8 (void * __P, __mmask16 __M, __m256i __A)
{		{
__builtin_ia32_pmovwb256mem_mask ((__v16qi *) __P, (__v16hi) __A, __M);		__builtin_ia32_pmovwb256mem_mask ((__v16qi *) __P, (__v16hi) __A, __M);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS256
_mm256_mask_cvtsepi16_storeu_epi8 (void * __P, __mmask16 __M, __m256i __A)		_mm256_mask_cvtsepi16_storeu_epi8 (void * __P, __mmask16 __M, __m256i __A)
{		{
__builtin_ia32_pmovswb256mem_mask ((__v16qi *) __P, (__v16hi) __A, __M);		__builtin_ia32_pmovswb256mem_mask ((__v16qi *) __P, (__v16hi) __A, __M);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS256
_mm256_mask_cvtusepi16_storeu_epi8 (void * __P, __mmask8 __M, __m256i __A)		_mm256_mask_cvtusepi16_storeu_epi8 (void * __P, __mmask8 __M, __m256i __A)
{		{
__builtin_ia32_pmovuswb256mem_mask ((__v16qi*) __P, (__v16hi) __A, __M);		__builtin_ia32_pmovuswb256mem_mask ((__v16qi*) __P, (__v16hi) __A, __M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_mulhrs_epi16(__m128i __W, __mmask8 __U, __m128i __X, __m128i __Y) {		_mm_mask_mulhrs_epi16(__m128i __W, __mmask8 __U, __m128i __X, __m128i __Y) {
return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,
(__v8hi)_mm_mulhrs_epi16(__X, __Y),		(__v8hi)_mm_mulhrs_epi16(__X, __Y),
(__v8hi)__W);		(__v8hi)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_mulhrs_epi16(__mmask8 __U, __m128i __X, __m128i __Y) {		_mm_maskz_mulhrs_epi16(__mmask8 __U, __m128i __X, __m128i __Y) {
return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,
(__v8hi)_mm_mulhrs_epi16(__X, __Y),		(__v8hi)_mm_mulhrs_epi16(__X, __Y),
(__v8hi)_mm_setzero_si128());		(__v8hi)_mm_setzero_si128());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_mulhrs_epi16(__m256i __W, __mmask16 __U, __m256i __X, __m256i __Y) {		_mm256_mask_mulhrs_epi16(__m256i __W, __mmask16 __U, __m256i __X, __m256i __Y) {
return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,		return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,
(__v16hi)_mm256_mulhrs_epi16(__X, __Y),		(__v16hi)_mm256_mulhrs_epi16(__X, __Y),
(__v16hi)__W);		(__v16hi)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_mulhrs_epi16(__mmask16 __U, __m256i __X, __m256i __Y) {		_mm256_maskz_mulhrs_epi16(__mmask16 __U, __m256i __X, __m256i __Y) {
return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,		return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,
(__v16hi)_mm256_mulhrs_epi16(__X, __Y),		(__v16hi)_mm256_mulhrs_epi16(__X, __Y),
(__v16hi)_mm256_setzero_si256());		(__v16hi)_mm256_setzero_si256());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_mulhi_epu16(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) {		_mm_mask_mulhi_epu16(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) {
return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,
(__v8hi)_mm_mulhi_epu16(__A, __B),		(__v8hi)_mm_mulhi_epu16(__A, __B),
(__v8hi)__W);		(__v8hi)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_mulhi_epu16(__mmask8 __U, __m128i __A, __m128i __B) {		_mm_maskz_mulhi_epu16(__mmask8 __U, __m128i __A, __m128i __B) {
return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,
(__v8hi)_mm_mulhi_epu16(__A, __B),		(__v8hi)_mm_mulhi_epu16(__A, __B),
(__v8hi)_mm_setzero_si128());		(__v8hi)_mm_setzero_si128());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_mulhi_epu16(__m256i __W, __mmask16 __U, __m256i __A, __m256i __B) {		_mm256_mask_mulhi_epu16(__m256i __W, __mmask16 __U, __m256i __A, __m256i __B) {
return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,		return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,
(__v16hi)_mm256_mulhi_epu16(__A, __B),		(__v16hi)_mm256_mulhi_epu16(__A, __B),
(__v16hi)__W);		(__v16hi)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_mulhi_epu16(__mmask16 __U, __m256i __A, __m256i __B) {		_mm256_maskz_mulhi_epu16(__mmask16 __U, __m256i __A, __m256i __B) {
return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,		return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,
(__v16hi)_mm256_mulhi_epu16(__A, __B),		(__v16hi)_mm256_mulhi_epu16(__A, __B),
(__v16hi)_mm256_setzero_si256());		(__v16hi)_mm256_setzero_si256());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_mulhi_epi16(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) {		_mm_mask_mulhi_epi16(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) {
return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,
(__v8hi)_mm_mulhi_epi16(__A, __B),		(__v8hi)_mm_mulhi_epi16(__A, __B),
(__v8hi)__W);		(__v8hi)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_mulhi_epi16(__mmask8 __U, __m128i __A, __m128i __B) {		_mm_maskz_mulhi_epi16(__mmask8 __U, __m128i __A, __m128i __B) {
return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,
(__v8hi)_mm_mulhi_epi16(__A, __B),		(__v8hi)_mm_mulhi_epi16(__A, __B),
(__v8hi)_mm_setzero_si128());		(__v8hi)_mm_setzero_si128());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_mulhi_epi16(__m256i __W, __mmask16 __U, __m256i __A, __m256i __B) {		_mm256_mask_mulhi_epi16(__m256i __W, __mmask16 __U, __m256i __A, __m256i __B) {
return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,		return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,
(__v16hi)_mm256_mulhi_epi16(__A, __B),		(__v16hi)_mm256_mulhi_epi16(__A, __B),
(__v16hi)__W);		(__v16hi)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_mulhi_epi16(__mmask16 __U, __m256i __A, __m256i __B) {		_mm256_maskz_mulhi_epi16(__mmask16 __U, __m256i __A, __m256i __B) {
return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,		return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,
(__v16hi)_mm256_mulhi_epi16(__A, __B),		(__v16hi)_mm256_mulhi_epi16(__A, __B),
(__v16hi)_mm256_setzero_si256());		(__v16hi)_mm256_setzero_si256());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_unpackhi_epi8(__m128i __W, __mmask16 __U, __m128i __A, __m128i __B) {		_mm_mask_unpackhi_epi8(__m128i __W, __mmask16 __U, __m128i __A, __m128i __B) {
return (__m128i)__builtin_ia32_selectb_128((__mmask16)__U,		return (__m128i)__builtin_ia32_selectb_128((__mmask16)__U,
(__v16qi)_mm_unpackhi_epi8(__A, __B),		(__v16qi)_mm_unpackhi_epi8(__A, __B),
(__v16qi)__W);		(__v16qi)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_unpackhi_epi8(__mmask16 __U, __m128i __A, __m128i __B) {		_mm_maskz_unpackhi_epi8(__mmask16 __U, __m128i __A, __m128i __B) {
return (__m128i)__builtin_ia32_selectb_128((__mmask16)__U,		return (__m128i)__builtin_ia32_selectb_128((__mmask16)__U,
(__v16qi)_mm_unpackhi_epi8(__A, __B),		(__v16qi)_mm_unpackhi_epi8(__A, __B),
(__v16qi)_mm_setzero_si128());		(__v16qi)_mm_setzero_si128());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_unpackhi_epi8(__m256i __W, __mmask32 __U, __m256i __A, __m256i __B) {		_mm256_mask_unpackhi_epi8(__m256i __W, __mmask32 __U, __m256i __A, __m256i __B) {
return (__m256i)__builtin_ia32_selectb_256((__mmask32)__U,		return (__m256i)__builtin_ia32_selectb_256((__mmask32)__U,
(__v32qi)_mm256_unpackhi_epi8(__A, __B),		(__v32qi)_mm256_unpackhi_epi8(__A, __B),
(__v32qi)__W);		(__v32qi)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_unpackhi_epi8(__mmask32 __U, __m256i __A, __m256i __B) {		_mm256_maskz_unpackhi_epi8(__mmask32 __U, __m256i __A, __m256i __B) {
return (__m256i)__builtin_ia32_selectb_256((__mmask32)__U,		return (__m256i)__builtin_ia32_selectb_256((__mmask32)__U,
(__v32qi)_mm256_unpackhi_epi8(__A, __B),		(__v32qi)_mm256_unpackhi_epi8(__A, __B),
(__v32qi)_mm256_setzero_si256());		(__v32qi)_mm256_setzero_si256());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_unpackhi_epi16(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) {		_mm_mask_unpackhi_epi16(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) {
return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,
(__v8hi)_mm_unpackhi_epi16(__A, __B),		(__v8hi)_mm_unpackhi_epi16(__A, __B),
(__v8hi)__W);		(__v8hi)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_unpackhi_epi16(__mmask8 __U, __m128i __A, __m128i __B) {		_mm_maskz_unpackhi_epi16(__mmask8 __U, __m128i __A, __m128i __B) {
return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,
(__v8hi)_mm_unpackhi_epi16(__A, __B),		(__v8hi)_mm_unpackhi_epi16(__A, __B),
(__v8hi) _mm_setzero_si128());		(__v8hi) _mm_setzero_si128());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_unpackhi_epi16(__m256i __W, __mmask16 __U, __m256i __A, __m256i __B) {		_mm256_mask_unpackhi_epi16(__m256i __W, __mmask16 __U, __m256i __A, __m256i __B) {
return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,		return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,
(__v16hi)_mm256_unpackhi_epi16(__A, __B),		(__v16hi)_mm256_unpackhi_epi16(__A, __B),
(__v16hi)__W);		(__v16hi)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_unpackhi_epi16(__mmask16 __U, __m256i __A, __m256i __B) {		_mm256_maskz_unpackhi_epi16(__mmask16 __U, __m256i __A, __m256i __B) {
return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,		return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,
(__v16hi)_mm256_unpackhi_epi16(__A, __B),		(__v16hi)_mm256_unpackhi_epi16(__A, __B),
(__v16hi)_mm256_setzero_si256());		(__v16hi)_mm256_setzero_si256());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_unpacklo_epi8(__m128i __W, __mmask16 __U, __m128i __A, __m128i __B) {		_mm_mask_unpacklo_epi8(__m128i __W, __mmask16 __U, __m128i __A, __m128i __B) {
return (__m128i)__builtin_ia32_selectb_128((__mmask16)__U,		return (__m128i)__builtin_ia32_selectb_128((__mmask16)__U,
(__v16qi)_mm_unpacklo_epi8(__A, __B),		(__v16qi)_mm_unpacklo_epi8(__A, __B),
(__v16qi)__W);		(__v16qi)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_unpacklo_epi8(__mmask16 __U, __m128i __A, __m128i __B) {		_mm_maskz_unpacklo_epi8(__mmask16 __U, __m128i __A, __m128i __B) {
return (__m128i)__builtin_ia32_selectb_128((__mmask16)__U,		return (__m128i)__builtin_ia32_selectb_128((__mmask16)__U,
(__v16qi)_mm_unpacklo_epi8(__A, __B),		(__v16qi)_mm_unpacklo_epi8(__A, __B),
(__v16qi)_mm_setzero_si128());		(__v16qi)_mm_setzero_si128());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_unpacklo_epi8(__m256i __W, __mmask32 __U, __m256i __A, __m256i __B) {		_mm256_mask_unpacklo_epi8(__m256i __W, __mmask32 __U, __m256i __A, __m256i __B) {
return (__m256i)__builtin_ia32_selectb_256((__mmask32)__U,		return (__m256i)__builtin_ia32_selectb_256((__mmask32)__U,
(__v32qi)_mm256_unpacklo_epi8(__A, __B),		(__v32qi)_mm256_unpacklo_epi8(__A, __B),
(__v32qi)__W);		(__v32qi)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_unpacklo_epi8(__mmask32 __U, __m256i __A, __m256i __B) {		_mm256_maskz_unpacklo_epi8(__mmask32 __U, __m256i __A, __m256i __B) {
return (__m256i)__builtin_ia32_selectb_256((__mmask32)__U,		return (__m256i)__builtin_ia32_selectb_256((__mmask32)__U,
(__v32qi)_mm256_unpacklo_epi8(__A, __B),		(__v32qi)_mm256_unpacklo_epi8(__A, __B),
(__v32qi)_mm256_setzero_si256());		(__v32qi)_mm256_setzero_si256());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_unpacklo_epi16(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) {		_mm_mask_unpacklo_epi16(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) {
return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,
(__v8hi)_mm_unpacklo_epi16(__A, __B),		(__v8hi)_mm_unpacklo_epi16(__A, __B),
(__v8hi)__W);		(__v8hi)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_unpacklo_epi16(__mmask8 __U, __m128i __A, __m128i __B) {		_mm_maskz_unpacklo_epi16(__mmask8 __U, __m128i __A, __m128i __B) {
return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,
(__v8hi)_mm_unpacklo_epi16(__A, __B),		(__v8hi)_mm_unpacklo_epi16(__A, __B),
(__v8hi) _mm_setzero_si128());		(__v8hi) _mm_setzero_si128());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_unpacklo_epi16(__m256i __W, __mmask16 __U, __m256i __A, __m256i __B) {		_mm256_mask_unpacklo_epi16(__m256i __W, __mmask16 __U, __m256i __A, __m256i __B) {
return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,		return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,
(__v16hi)_mm256_unpacklo_epi16(__A, __B),		(__v16hi)_mm256_unpacklo_epi16(__A, __B),
(__v16hi)__W);		(__v16hi)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_unpacklo_epi16(__mmask16 __U, __m256i __A, __m256i __B) {		_mm256_maskz_unpacklo_epi16(__mmask16 __U, __m256i __A, __m256i __B) {
return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,		return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,
(__v16hi)_mm256_unpacklo_epi16(__A, __B),		(__v16hi)_mm256_unpacklo_epi16(__A, __B),
(__v16hi)_mm256_setzero_si256());		(__v16hi)_mm256_setzero_si256());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_cvtepi8_epi16(__m128i __W, __mmask8 __U, __m128i __A)		_mm_mask_cvtepi8_epi16(__m128i __W, __mmask8 __U, __m128i __A)
{		{
return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,
(__v8hi)_mm_cvtepi8_epi16(__A),		(__v8hi)_mm_cvtepi8_epi16(__A),
(__v8hi)__W);		(__v8hi)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_cvtepi8_epi16(__mmask8 __U, __m128i __A)		_mm_maskz_cvtepi8_epi16(__mmask8 __U, __m128i __A)
{		{
return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,
(__v8hi)_mm_cvtepi8_epi16(__A),		(__v8hi)_mm_cvtepi8_epi16(__A),
(__v8hi)_mm_setzero_si128());		(__v8hi)_mm_setzero_si128());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_cvtepi8_epi16(__m256i __W, __mmask16 __U, __m128i __A)		_mm256_mask_cvtepi8_epi16(__m256i __W, __mmask16 __U, __m128i __A)
{		{
return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,		return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,
(__v16hi)_mm256_cvtepi8_epi16(__A),		(__v16hi)_mm256_cvtepi8_epi16(__A),
(__v16hi)__W);		(__v16hi)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_cvtepi8_epi16(__mmask16 __U, __m128i __A)		_mm256_maskz_cvtepi8_epi16(__mmask16 __U, __m128i __A)
{		{
return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,		return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,
(__v16hi)_mm256_cvtepi8_epi16(__A),		(__v16hi)_mm256_cvtepi8_epi16(__A),
(__v16hi)_mm256_setzero_si256());		(__v16hi)_mm256_setzero_si256());
}		}


static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_cvtepu8_epi16(__m128i __W, __mmask8 __U, __m128i __A)		_mm_mask_cvtepu8_epi16(__m128i __W, __mmask8 __U, __m128i __A)
{		{
return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,
(__v8hi)_mm_cvtepu8_epi16(__A),		(__v8hi)_mm_cvtepu8_epi16(__A),
(__v8hi)__W);		(__v8hi)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_cvtepu8_epi16(__mmask8 __U, __m128i __A)		_mm_maskz_cvtepu8_epi16(__mmask8 __U, __m128i __A)
{		{
return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,
(__v8hi)_mm_cvtepu8_epi16(__A),		(__v8hi)_mm_cvtepu8_epi16(__A),
(__v8hi)_mm_setzero_si128());		(__v8hi)_mm_setzero_si128());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_cvtepu8_epi16(__m256i __W, __mmask16 __U, __m128i __A)		_mm256_mask_cvtepu8_epi16(__m256i __W, __mmask16 __U, __m128i __A)
{		{
return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,		return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,
(__v16hi)_mm256_cvtepu8_epi16(__A),		(__v16hi)_mm256_cvtepu8_epi16(__A),
(__v16hi)__W);		(__v16hi)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_cvtepu8_epi16 (__mmask16 __U, __m128i __A)		_mm256_maskz_cvtepu8_epi16 (__mmask16 __U, __m128i __A)
{		{
return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,		return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,
(__v16hi)_mm256_cvtepu8_epi16(__A),		(__v16hi)_mm256_cvtepu8_epi16(__A),
(__v16hi)_mm256_setzero_si256());		(__v16hi)_mm256_setzero_si256());
}		}


Show All 34 Lines	(__m256i)__builtin_ia32_selectw_256((__mmask16)(U), \
(__v16hi)(__m256i)(W))		(__v16hi)(__m256i)(W))

#define _mm256_maskz_shufflelo_epi16(U, A, imm) \		#define _mm256_maskz_shufflelo_epi16(U, A, imm) \
(__m256i)__builtin_ia32_selectw_256((__mmask16)(U), \		(__m256i)__builtin_ia32_selectw_256((__mmask16)(U), \
(__v16hi)_mm256_shufflelo_epi16((A), \		(__v16hi)_mm256_shufflelo_epi16((A), \
(imm)), \		(imm)), \
(__v16hi)_mm256_setzero_si256())		(__v16hi)_mm256_setzero_si256())

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_sllv_epi16(__m256i __A, __m256i __B)		_mm256_sllv_epi16(__m256i __A, __m256i __B)
{		{
return (__m256i)__builtin_ia32_psllv16hi((__v16hi)__A, (__v16hi)__B);		return (__m256i)__builtin_ia32_psllv16hi((__v16hi)__A, (__v16hi)__B);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_sllv_epi16(__m256i __W, __mmask16 __U, __m256i __A, __m256i __B)		_mm256_mask_sllv_epi16(__m256i __W, __mmask16 __U, __m256i __A, __m256i __B)
{		{
return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,		return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,
(__v16hi)_mm256_sllv_epi16(__A, __B),		(__v16hi)_mm256_sllv_epi16(__A, __B),
(__v16hi)__W);		(__v16hi)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_sllv_epi16(__mmask16 __U, __m256i __A, __m256i __B)		_mm256_maskz_sllv_epi16(__mmask16 __U, __m256i __A, __m256i __B)
{		{
return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,		return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,
(__v16hi)_mm256_sllv_epi16(__A, __B),		(__v16hi)_mm256_sllv_epi16(__A, __B),
(__v16hi)_mm256_setzero_si256());		(__v16hi)_mm256_setzero_si256());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_sllv_epi16(__m128i __A, __m128i __B)		_mm_sllv_epi16(__m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_psllv8hi((__v8hi)__A, (__v8hi)__B);		return (__m128i)__builtin_ia32_psllv8hi((__v8hi)__A, (__v8hi)__B);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_sllv_epi16(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)		_mm_mask_sllv_epi16(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,
(__v8hi)_mm_sllv_epi16(__A, __B),		(__v8hi)_mm_sllv_epi16(__A, __B),
(__v8hi)__W);		(__v8hi)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_sllv_epi16(__mmask8 __U, __m128i __A, __m128i __B)		_mm_maskz_sllv_epi16(__mmask8 __U, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,
(__v8hi)_mm_sllv_epi16(__A, __B),		(__v8hi)_mm_sllv_epi16(__A, __B),
(__v8hi)_mm_setzero_si128());		(__v8hi)_mm_setzero_si128());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_sll_epi16(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)		_mm_mask_sll_epi16(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,
(__v8hi)_mm_sll_epi16(__A, __B),		(__v8hi)_mm_sll_epi16(__A, __B),
(__v8hi)__W);		(__v8hi)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_sll_epi16 (__mmask8 __U, __m128i __A, __m128i __B)		_mm_maskz_sll_epi16 (__mmask8 __U, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,
(__v8hi)_mm_sll_epi16(__A, __B),		(__v8hi)_mm_sll_epi16(__A, __B),
(__v8hi)_mm_setzero_si128());		(__v8hi)_mm_setzero_si128());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_sll_epi16(__m256i __W, __mmask16 __U, __m256i __A, __m128i __B)		_mm256_mask_sll_epi16(__m256i __W, __mmask16 __U, __m256i __A, __m128i __B)
{		{
return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,		return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,
(__v16hi)_mm256_sll_epi16(__A, __B),		(__v16hi)_mm256_sll_epi16(__A, __B),
(__v16hi)__W);		(__v16hi)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_sll_epi16(__mmask16 __U, __m256i __A, __m128i __B)		_mm256_maskz_sll_epi16(__mmask16 __U, __m256i __A, __m128i __B)
{		{
return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,		return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,
(__v16hi)_mm256_sll_epi16(__A, __B),		(__v16hi)_mm256_sll_epi16(__A, __B),
(__v16hi)_mm256_setzero_si256());		(__v16hi)_mm256_setzero_si256());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_slli_epi16(__m128i __W, __mmask8 __U, __m128i __A, int __B)		_mm_mask_slli_epi16(__m128i __W, __mmask8 __U, __m128i __A, int __B)
{		{
return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,
(__v8hi)_mm_slli_epi16(__A, __B),		(__v8hi)_mm_slli_epi16(__A, __B),
(__v8hi)__W);		(__v8hi)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_slli_epi16 (__mmask8 __U, __m128i __A, int __B)		_mm_maskz_slli_epi16 (__mmask8 __U, __m128i __A, int __B)
{		{
return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,
(__v8hi)_mm_slli_epi16(__A, __B),		(__v8hi)_mm_slli_epi16(__A, __B),
(__v8hi)_mm_setzero_si128());		(__v8hi)_mm_setzero_si128());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_slli_epi16(__m256i __W, __mmask16 __U, __m256i __A, int __B)		_mm256_mask_slli_epi16(__m256i __W, __mmask16 __U, __m256i __A, int __B)
{		{
return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,		return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,
(__v16hi)_mm256_slli_epi16(__A, __B),		(__v16hi)_mm256_slli_epi16(__A, __B),
(__v16hi)__W);		(__v16hi)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_slli_epi16(__mmask16 __U, __m256i __A, int __B)		_mm256_maskz_slli_epi16(__mmask16 __U, __m256i __A, int __B)
{		{
return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,		return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,
(__v16hi)_mm256_slli_epi16(__A, __B),		(__v16hi)_mm256_slli_epi16(__A, __B),
(__v16hi)_mm256_setzero_si256());		(__v16hi)_mm256_setzero_si256());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_srlv_epi16(__m256i __A, __m256i __B)		_mm256_srlv_epi16(__m256i __A, __m256i __B)
{		{
return (__m256i)__builtin_ia32_psrlv16hi((__v16hi)__A, (__v16hi)__B);		return (__m256i)__builtin_ia32_psrlv16hi((__v16hi)__A, (__v16hi)__B);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_srlv_epi16(__m256i __W, __mmask16 __U, __m256i __A, __m256i __B)		_mm256_mask_srlv_epi16(__m256i __W, __mmask16 __U, __m256i __A, __m256i __B)
{		{
return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,		return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,
(__v16hi)_mm256_srlv_epi16(__A, __B),		(__v16hi)_mm256_srlv_epi16(__A, __B),
(__v16hi)__W);		(__v16hi)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_srlv_epi16(__mmask16 __U, __m256i __A, __m256i __B)		_mm256_maskz_srlv_epi16(__mmask16 __U, __m256i __A, __m256i __B)
{		{
return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,		return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,
(__v16hi)_mm256_srlv_epi16(__A, __B),		(__v16hi)_mm256_srlv_epi16(__A, __B),
(__v16hi)_mm256_setzero_si256());		(__v16hi)_mm256_setzero_si256());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_srlv_epi16(__m128i __A, __m128i __B)		_mm_srlv_epi16(__m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_psrlv8hi((__v8hi)__A, (__v8hi)__B);		return (__m128i)__builtin_ia32_psrlv8hi((__v8hi)__A, (__v8hi)__B);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_srlv_epi16(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)		_mm_mask_srlv_epi16(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,
(__v8hi)_mm_srlv_epi16(__A, __B),		(__v8hi)_mm_srlv_epi16(__A, __B),
(__v8hi)__W);		(__v8hi)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_srlv_epi16(__mmask8 __U, __m128i __A, __m128i __B)		_mm_maskz_srlv_epi16(__mmask8 __U, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,
(__v8hi)_mm_srlv_epi16(__A, __B),		(__v8hi)_mm_srlv_epi16(__A, __B),
(__v8hi)_mm_setzero_si128());		(__v8hi)_mm_setzero_si128());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_srav_epi16(__m256i __A, __m256i __B)		_mm256_srav_epi16(__m256i __A, __m256i __B)
{		{
return (__m256i)__builtin_ia32_psrav16hi((__v16hi)__A, (__v16hi)__B);		return (__m256i)__builtin_ia32_psrav16hi((__v16hi)__A, (__v16hi)__B);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_srav_epi16(__m256i __W, __mmask16 __U, __m256i __A, __m256i __B)		_mm256_mask_srav_epi16(__m256i __W, __mmask16 __U, __m256i __A, __m256i __B)
{		{
return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,		return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,
(__v16hi)_mm256_srav_epi16(__A, __B),		(__v16hi)_mm256_srav_epi16(__A, __B),
(__v16hi)__W);		(__v16hi)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_srav_epi16(__mmask16 __U, __m256i __A, __m256i __B)		_mm256_maskz_srav_epi16(__mmask16 __U, __m256i __A, __m256i __B)
{		{
return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,		return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,
(__v16hi)_mm256_srav_epi16(__A, __B),		(__v16hi)_mm256_srav_epi16(__A, __B),
(__v16hi)_mm256_setzero_si256());		(__v16hi)_mm256_setzero_si256());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_srav_epi16(__m128i __A, __m128i __B)		_mm_srav_epi16(__m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_psrav8hi((__v8hi)__A, (__v8hi)__B);		return (__m128i)__builtin_ia32_psrav8hi((__v8hi)__A, (__v8hi)__B);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_srav_epi16(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)		_mm_mask_srav_epi16(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,
(__v8hi)_mm_srav_epi16(__A, __B),		(__v8hi)_mm_srav_epi16(__A, __B),
(__v8hi)__W);		(__v8hi)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_srav_epi16(__mmask8 __U, __m128i __A, __m128i __B)		_mm_maskz_srav_epi16(__mmask8 __U, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,
(__v8hi)_mm_srav_epi16(__A, __B),		(__v8hi)_mm_srav_epi16(__A, __B),
(__v8hi)_mm_setzero_si128());		(__v8hi)_mm_setzero_si128());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_sra_epi16(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)		_mm_mask_sra_epi16(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,
(__v8hi)_mm_sra_epi16(__A, __B),		(__v8hi)_mm_sra_epi16(__A, __B),
(__v8hi)__W);		(__v8hi)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_sra_epi16(__mmask8 __U, __m128i __A, __m128i __B)		_mm_maskz_sra_epi16(__mmask8 __U, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,
(__v8hi)_mm_sra_epi16(__A, __B),		(__v8hi)_mm_sra_epi16(__A, __B),
(__v8hi)_mm_setzero_si128());		(__v8hi)_mm_setzero_si128());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_sra_epi16(__m256i __W, __mmask16 __U, __m256i __A, __m128i __B)		_mm256_mask_sra_epi16(__m256i __W, __mmask16 __U, __m256i __A, __m128i __B)
{		{
return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,		return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,
(__v16hi)_mm256_sra_epi16(__A, __B),		(__v16hi)_mm256_sra_epi16(__A, __B),
(__v16hi)__W);		(__v16hi)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_sra_epi16(__mmask16 __U, __m256i __A, __m128i __B)		_mm256_maskz_sra_epi16(__mmask16 __U, __m256i __A, __m128i __B)
{		{
return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,		return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,
(__v16hi)_mm256_sra_epi16(__A, __B),		(__v16hi)_mm256_sra_epi16(__A, __B),
(__v16hi)_mm256_setzero_si256());		(__v16hi)_mm256_setzero_si256());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_srai_epi16(__m128i __W, __mmask8 __U, __m128i __A, int __B)		_mm_mask_srai_epi16(__m128i __W, __mmask8 __U, __m128i __A, int __B)
{		{
return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,
(__v8hi)_mm_srai_epi16(__A, __B),		(__v8hi)_mm_srai_epi16(__A, __B),
(__v8hi)__W);		(__v8hi)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_srai_epi16(__mmask8 __U, __m128i __A, int __B)		_mm_maskz_srai_epi16(__mmask8 __U, __m128i __A, int __B)
{		{
return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,
(__v8hi)_mm_srai_epi16(__A, __B),		(__v8hi)_mm_srai_epi16(__A, __B),
(__v8hi)_mm_setzero_si128());		(__v8hi)_mm_setzero_si128());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_srai_epi16(__m256i __W, __mmask16 __U, __m256i __A, int __B)		_mm256_mask_srai_epi16(__m256i __W, __mmask16 __U, __m256i __A, int __B)
{		{
return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,		return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,
(__v16hi)_mm256_srai_epi16(__A, __B),		(__v16hi)_mm256_srai_epi16(__A, __B),
(__v16hi)__W);		(__v16hi)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_srai_epi16(__mmask16 __U, __m256i __A, int __B)		_mm256_maskz_srai_epi16(__mmask16 __U, __m256i __A, int __B)
{		{
return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,		return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,
(__v16hi)_mm256_srai_epi16(__A, __B),		(__v16hi)_mm256_srai_epi16(__A, __B),
(__v16hi)_mm256_setzero_si256());		(__v16hi)_mm256_setzero_si256());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_srl_epi16(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)		_mm_mask_srl_epi16(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,
(__v8hi)_mm_srl_epi16(__A, __B),		(__v8hi)_mm_srl_epi16(__A, __B),
(__v8hi)__W);		(__v8hi)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_srl_epi16 (__mmask8 __U, __m128i __A, __m128i __B)		_mm_maskz_srl_epi16 (__mmask8 __U, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,
(__v8hi)_mm_srl_epi16(__A, __B),		(__v8hi)_mm_srl_epi16(__A, __B),
(__v8hi)_mm_setzero_si128());		(__v8hi)_mm_setzero_si128());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_srl_epi16(__m256i __W, __mmask16 __U, __m256i __A, __m128i __B)		_mm256_mask_srl_epi16(__m256i __W, __mmask16 __U, __m256i __A, __m128i __B)
{		{
return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,		return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,
(__v16hi)_mm256_srl_epi16(__A, __B),		(__v16hi)_mm256_srl_epi16(__A, __B),
(__v16hi)__W);		(__v16hi)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_srl_epi16(__mmask16 __U, __m256i __A, __m128i __B)		_mm256_maskz_srl_epi16(__mmask16 __U, __m256i __A, __m128i __B)
{		{
return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,		return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,
(__v16hi)_mm256_srl_epi16(__A, __B),		(__v16hi)_mm256_srl_epi16(__A, __B),
(__v16hi)_mm256_setzero_si256());		(__v16hi)_mm256_setzero_si256());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_srli_epi16(__m128i __W, __mmask8 __U, __m128i __A, int __B)		_mm_mask_srli_epi16(__m128i __W, __mmask8 __U, __m128i __A, int __B)
{		{
return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,
(__v8hi)_mm_srli_epi16(__A, __B),		(__v8hi)_mm_srli_epi16(__A, __B),
(__v8hi)__W);		(__v8hi)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_srli_epi16 (__mmask8 __U, __m128i __A, int __B)		_mm_maskz_srli_epi16 (__mmask8 __U, __m128i __A, int __B)
{		{
return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectw_128((__mmask8)__U,
(__v8hi)_mm_srli_epi16(__A, __B),		(__v8hi)_mm_srli_epi16(__A, __B),
(__v8hi)_mm_setzero_si128());		(__v8hi)_mm_setzero_si128());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_srli_epi16(__m256i __W, __mmask16 __U, __m256i __A, int __B)		_mm256_mask_srli_epi16(__m256i __W, __mmask16 __U, __m256i __A, int __B)
{		{
return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,		return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,
(__v16hi)_mm256_srli_epi16(__A, __B),		(__v16hi)_mm256_srli_epi16(__A, __B),
(__v16hi)__W);		(__v16hi)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_srli_epi16(__mmask16 __U, __m256i __A, int __B)		_mm256_maskz_srli_epi16(__mmask16 __U, __m256i __A, int __B)
{		{
return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,		return (__m256i)__builtin_ia32_selectw_256((__mmask16)__U,
(__v16hi)_mm256_srli_epi16(__A, __B),		(__v16hi)_mm256_srli_epi16(__A, __B),
(__v16hi)_mm256_setzero_si256());		(__v16hi)_mm256_setzero_si256());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_mov_epi16 (__m128i __W, __mmask8 __U, __m128i __A)		_mm_mask_mov_epi16 (__m128i __W, __mmask8 __U, __m128i __A)
{		{
return (__m128i) __builtin_ia32_selectw_128 ((__mmask8) __U,		return (__m128i) __builtin_ia32_selectw_128 ((__mmask8) __U,
(__v8hi) __A,		(__v8hi) __A,
(__v8hi) __W);		(__v8hi) __W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_mov_epi16 (__mmask8 __U, __m128i __A)		_mm_maskz_mov_epi16 (__mmask8 __U, __m128i __A)
{		{
return (__m128i) __builtin_ia32_selectw_128 ((__mmask8) __U,		return (__m128i) __builtin_ia32_selectw_128 ((__mmask8) __U,
(__v8hi) __A,		(__v8hi) __A,
(__v8hi) _mm_setzero_si128 ());		(__v8hi) _mm_setzero_si128 ());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_mov_epi16 (__m256i __W, __mmask16 __U, __m256i __A)		_mm256_mask_mov_epi16 (__m256i __W, __mmask16 __U, __m256i __A)
{		{
return (__m256i) __builtin_ia32_selectw_256 ((__mmask16) __U,		return (__m256i) __builtin_ia32_selectw_256 ((__mmask16) __U,
(__v16hi) __A,		(__v16hi) __A,
(__v16hi) __W);		(__v16hi) __W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_mov_epi16 (__mmask16 __U, __m256i __A)		_mm256_maskz_mov_epi16 (__mmask16 __U, __m256i __A)
{		{
return (__m256i) __builtin_ia32_selectw_256 ((__mmask16) __U,		return (__m256i) __builtin_ia32_selectw_256 ((__mmask16) __U,
(__v16hi) __A,		(__v16hi) __A,
(__v16hi) _mm256_setzero_si256 ());		(__v16hi) _mm256_setzero_si256 ());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_mov_epi8 (__m128i __W, __mmask16 __U, __m128i __A)		_mm_mask_mov_epi8 (__m128i __W, __mmask16 __U, __m128i __A)
{		{
return (__m128i) __builtin_ia32_selectb_128 ((__mmask16) __U,		return (__m128i) __builtin_ia32_selectb_128 ((__mmask16) __U,
(__v16qi) __A,		(__v16qi) __A,
(__v16qi) __W);		(__v16qi) __W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_mov_epi8 (__mmask16 __U, __m128i __A)		_mm_maskz_mov_epi8 (__mmask16 __U, __m128i __A)
{		{
return (__m128i) __builtin_ia32_selectb_128 ((__mmask16) __U,		return (__m128i) __builtin_ia32_selectb_128 ((__mmask16) __U,
(__v16qi) __A,		(__v16qi) __A,
(__v16qi) _mm_setzero_si128 ());		(__v16qi) _mm_setzero_si128 ());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_mov_epi8 (__m256i __W, __mmask32 __U, __m256i __A)		_mm256_mask_mov_epi8 (__m256i __W, __mmask32 __U, __m256i __A)
{		{
return (__m256i) __builtin_ia32_selectb_256 ((__mmask32) __U,		return (__m256i) __builtin_ia32_selectb_256 ((__mmask32) __U,
(__v32qi) __A,		(__v32qi) __A,
(__v32qi) __W);		(__v32qi) __W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_mov_epi8 (__mmask32 __U, __m256i __A)		_mm256_maskz_mov_epi8 (__mmask32 __U, __m256i __A)
{		{
return (__m256i) __builtin_ia32_selectb_256 ((__mmask32) __U,		return (__m256i) __builtin_ia32_selectb_256 ((__mmask32) __U,
(__v32qi) __A,		(__v32qi) __A,
(__v32qi) _mm256_setzero_si256 ());		(__v32qi) _mm256_setzero_si256 ());
}		}


static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_set1_epi8 (__m128i __O, __mmask16 __M, char __A)		_mm_mask_set1_epi8 (__m128i __O, __mmask16 __M, char __A)
{		{
return (__m128i) __builtin_ia32_selectb_128(__M,		return (__m128i) __builtin_ia32_selectb_128(__M,
(__v16qi) _mm_set1_epi8(__A),		(__v16qi) _mm_set1_epi8(__A),
(__v16qi) __O);		(__v16qi) __O);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_set1_epi8 (__mmask16 __M, char __A)		_mm_maskz_set1_epi8 (__mmask16 __M, char __A)
{		{
return (__m128i) __builtin_ia32_selectb_128(__M,		return (__m128i) __builtin_ia32_selectb_128(__M,
(__v16qi) _mm_set1_epi8(__A),		(__v16qi) _mm_set1_epi8(__A),
(__v16qi) _mm_setzero_si128());		(__v16qi) _mm_setzero_si128());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_set1_epi8 (__m256i __O, __mmask32 __M, char __A)		_mm256_mask_set1_epi8 (__m256i __O, __mmask32 __M, char __A)
{		{
return (__m256i) __builtin_ia32_selectb_256(__M,		return (__m256i) __builtin_ia32_selectb_256(__M,
(__v32qi) _mm256_set1_epi8(__A),		(__v32qi) _mm256_set1_epi8(__A),
(__v32qi) __O);		(__v32qi) __O);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_set1_epi8 (__mmask32 __M, char __A)		_mm256_maskz_set1_epi8 (__mmask32 __M, char __A)
{		{
return (__m256i) __builtin_ia32_selectb_256(__M,		return (__m256i) __builtin_ia32_selectb_256(__M,
(__v32qi) _mm256_set1_epi8(__A),		(__v32qi) _mm256_set1_epi8(__A),
(__v32qi) _mm256_setzero_si256());		(__v32qi) _mm256_setzero_si256());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_loadu_epi16 (__m128i __W, __mmask8 __U, void const *__P)		_mm_mask_loadu_epi16 (__m128i __W, __mmask8 __U, void const *__P)
{		{
return (__m128i) __builtin_ia32_loaddquhi128_mask ((__v8hi *) __P,		return (__m128i) __builtin_ia32_loaddquhi128_mask ((__v8hi *) __P,
(__v8hi) __W,		(__v8hi) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_loadu_epi16 (__mmask8 __U, void const *__P)		_mm_maskz_loadu_epi16 (__mmask8 __U, void const *__P)
{		{
return (__m128i) __builtin_ia32_loaddquhi128_mask ((__v8hi *) __P,		return (__m128i) __builtin_ia32_loaddquhi128_mask ((__v8hi *) __P,
(__v8hi)		(__v8hi)
_mm_setzero_si128 (),		_mm_setzero_si128 (),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_loadu_epi16 (__m256i __W, __mmask16 __U, void const *__P)		_mm256_mask_loadu_epi16 (__m256i __W, __mmask16 __U, void const *__P)
{		{
return (__m256i) __builtin_ia32_loaddquhi256_mask ((__v16hi *) __P,		return (__m256i) __builtin_ia32_loaddquhi256_mask ((__v16hi *) __P,
(__v16hi) __W,		(__v16hi) __W,
(__mmask16) __U);		(__mmask16) __U);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_loadu_epi16 (__mmask16 __U, void const *__P)		_mm256_maskz_loadu_epi16 (__mmask16 __U, void const *__P)
{		{
return (__m256i) __builtin_ia32_loaddquhi256_mask ((__v16hi *) __P,		return (__m256i) __builtin_ia32_loaddquhi256_mask ((__v16hi *) __P,
(__v16hi)		(__v16hi)
_mm256_setzero_si256 (),		_mm256_setzero_si256 (),
(__mmask16) __U);		(__mmask16) __U);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_loadu_epi8 (__m128i __W, __mmask16 __U, void const *__P)		_mm_mask_loadu_epi8 (__m128i __W, __mmask16 __U, void const *__P)
{		{
return (__m128i) __builtin_ia32_loaddquqi128_mask ((__v16qi *) __P,		return (__m128i) __builtin_ia32_loaddquqi128_mask ((__v16qi *) __P,
(__v16qi) __W,		(__v16qi) __W,
(__mmask16) __U);		(__mmask16) __U);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_loadu_epi8 (__mmask16 __U, void const *__P)		_mm_maskz_loadu_epi8 (__mmask16 __U, void const *__P)
{		{
return (__m128i) __builtin_ia32_loaddquqi128_mask ((__v16qi *) __P,		return (__m128i) __builtin_ia32_loaddquqi128_mask ((__v16qi *) __P,
(__v16qi)		(__v16qi)
_mm_setzero_si128 (),		_mm_setzero_si128 (),
(__mmask16) __U);		(__mmask16) __U);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_loadu_epi8 (__m256i __W, __mmask32 __U, void const *__P)		_mm256_mask_loadu_epi8 (__m256i __W, __mmask32 __U, void const *__P)
{		{
return (__m256i) __builtin_ia32_loaddquqi256_mask ((__v32qi *) __P,		return (__m256i) __builtin_ia32_loaddquqi256_mask ((__v32qi *) __P,
(__v32qi) __W,		(__v32qi) __W,
(__mmask32) __U);		(__mmask32) __U);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_loadu_epi8 (__mmask32 __U, void const *__P)		_mm256_maskz_loadu_epi8 (__mmask32 __U, void const *__P)
{		{
return (__m256i) __builtin_ia32_loaddquqi256_mask ((__v32qi *) __P,		return (__m256i) __builtin_ia32_loaddquqi256_mask ((__v32qi *) __P,
(__v32qi)		(__v32qi)
_mm256_setzero_si256 (),		_mm256_setzero_si256 (),
(__mmask32) __U);		(__mmask32) __U);
}		}
static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS256
_mm_mask_storeu_epi16 (void *__P, __mmask8 __U, __m128i __A)		_mm_mask_storeu_epi16 (void *__P, __mmask8 __U, __m128i __A)
{		{
__builtin_ia32_storedquhi128_mask ((__v8hi *) __P,		__builtin_ia32_storedquhi128_mask ((__v8hi *) __P,
(__v8hi) __A,		(__v8hi) __A,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS256
_mm256_mask_storeu_epi16 (void *__P, __mmask16 __U, __m256i __A)		_mm256_mask_storeu_epi16 (void *__P, __mmask16 __U, __m256i __A)
{		{
__builtin_ia32_storedquhi256_mask ((__v16hi *) __P,		__builtin_ia32_storedquhi256_mask ((__v16hi *) __P,
(__v16hi) __A,		(__v16hi) __A,
(__mmask16) __U);		(__mmask16) __U);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS128
_mm_mask_storeu_epi8 (void *__P, __mmask16 __U, __m128i __A)		_mm_mask_storeu_epi8 (void *__P, __mmask16 __U, __m128i __A)
{		{
__builtin_ia32_storedquqi128_mask ((__v16qi *) __P,		__builtin_ia32_storedquqi128_mask ((__v16qi *) __P,
(__v16qi) __A,		(__v16qi) __A,
(__mmask16) __U);		(__mmask16) __U);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS256
_mm256_mask_storeu_epi8 (void *__P, __mmask32 __U, __m256i __A)		_mm256_mask_storeu_epi8 (void *__P, __mmask32 __U, __m256i __A)
{		{
__builtin_ia32_storedquqi256_mask ((__v32qi *) __P,		__builtin_ia32_storedquqi256_mask ((__v32qi *) __P,
(__v32qi) __A,		(__v32qi) __A,
(__mmask32) __U);		(__mmask32) __U);
}		}

static __inline__ __mmask16 __DEFAULT_FN_ATTRS		static __inline__ __mmask16 __DEFAULT_FN_ATTRS128
_mm_test_epi8_mask (__m128i __A, __m128i __B)		_mm_test_epi8_mask (__m128i __A, __m128i __B)
{		{
return _mm_cmpneq_epi8_mask (_mm_and_si128(__A, __B), _mm_setzero_si128());		return _mm_cmpneq_epi8_mask (_mm_and_si128(__A, __B), _mm_setzero_si128());
}		}

static __inline__ __mmask16 __DEFAULT_FN_ATTRS		static __inline__ __mmask16 __DEFAULT_FN_ATTRS128
_mm_mask_test_epi8_mask (__mmask16 __U, __m128i __A, __m128i __B)		_mm_mask_test_epi8_mask (__mmask16 __U, __m128i __A, __m128i __B)
{		{
return _mm_mask_cmpneq_epi8_mask (__U, _mm_and_si128 (__A, __B),		return _mm_mask_cmpneq_epi8_mask (__U, _mm_and_si128 (__A, __B),
_mm_setzero_si128());		_mm_setzero_si128());
}		}

static __inline__ __mmask32 __DEFAULT_FN_ATTRS		static __inline__ __mmask32 __DEFAULT_FN_ATTRS256
_mm256_test_epi8_mask (__m256i __A, __m256i __B)		_mm256_test_epi8_mask (__m256i __A, __m256i __B)
{		{
return _mm256_cmpneq_epi8_mask (_mm256_and_si256(__A, __B),		return _mm256_cmpneq_epi8_mask (_mm256_and_si256(__A, __B),
_mm256_setzero_si256());		_mm256_setzero_si256());
}		}

static __inline__ __mmask32 __DEFAULT_FN_ATTRS		static __inline__ __mmask32 __DEFAULT_FN_ATTRS256
_mm256_mask_test_epi8_mask (__mmask32 __U, __m256i __A, __m256i __B)		_mm256_mask_test_epi8_mask (__mmask32 __U, __m256i __A, __m256i __B)
{		{
return _mm256_mask_cmpneq_epi8_mask (__U, _mm256_and_si256(__A, __B),		return _mm256_mask_cmpneq_epi8_mask (__U, _mm256_and_si256(__A, __B),
_mm256_setzero_si256());		_mm256_setzero_si256());
}		}

static __inline__ __mmask8 __DEFAULT_FN_ATTRS		static __inline__ __mmask8 __DEFAULT_FN_ATTRS128
_mm_test_epi16_mask (__m128i __A, __m128i __B)		_mm_test_epi16_mask (__m128i __A, __m128i __B)
{		{
return _mm_cmpneq_epi16_mask (_mm_and_si128 (__A, __B), _mm_setzero_si128());		return _mm_cmpneq_epi16_mask (_mm_and_si128 (__A, __B), _mm_setzero_si128());
}		}

static __inline__ __mmask8 __DEFAULT_FN_ATTRS		static __inline__ __mmask8 __DEFAULT_FN_ATTRS128
_mm_mask_test_epi16_mask (__mmask8 __U, __m128i __A, __m128i __B)		_mm_mask_test_epi16_mask (__mmask8 __U, __m128i __A, __m128i __B)
{		{
return _mm_mask_cmpneq_epi16_mask (__U, _mm_and_si128 (__A, __B),		return _mm_mask_cmpneq_epi16_mask (__U, _mm_and_si128 (__A, __B),
_mm_setzero_si128());		_mm_setzero_si128());
}		}

static __inline__ __mmask16 __DEFAULT_FN_ATTRS		static __inline__ __mmask16 __DEFAULT_FN_ATTRS256
_mm256_test_epi16_mask (__m256i __A, __m256i __B)		_mm256_test_epi16_mask (__m256i __A, __m256i __B)
{		{
return _mm256_cmpneq_epi16_mask (_mm256_and_si256 (__A, __B),		return _mm256_cmpneq_epi16_mask (_mm256_and_si256 (__A, __B),
_mm256_setzero_si256 ());		_mm256_setzero_si256 ());
}		}

static __inline__ __mmask16 __DEFAULT_FN_ATTRS		static __inline__ __mmask16 __DEFAULT_FN_ATTRS256
_mm256_mask_test_epi16_mask (__mmask16 __U, __m256i __A, __m256i __B)		_mm256_mask_test_epi16_mask (__mmask16 __U, __m256i __A, __m256i __B)
{		{
return _mm256_mask_cmpneq_epi16_mask (__U, _mm256_and_si256(__A, __B),		return _mm256_mask_cmpneq_epi16_mask (__U, _mm256_and_si256(__A, __B),
_mm256_setzero_si256());		_mm256_setzero_si256());
}		}

static __inline__ __mmask16 __DEFAULT_FN_ATTRS		static __inline__ __mmask16 __DEFAULT_FN_ATTRS128
_mm_testn_epi8_mask (__m128i __A, __m128i __B)		_mm_testn_epi8_mask (__m128i __A, __m128i __B)
{		{
return _mm_cmpeq_epi8_mask (_mm_and_si128 (__A, __B), _mm_setzero_si128());		return _mm_cmpeq_epi8_mask (_mm_and_si128 (__A, __B), _mm_setzero_si128());
}		}

static __inline__ __mmask16 __DEFAULT_FN_ATTRS		static __inline__ __mmask16 __DEFAULT_FN_ATTRS128
_mm_mask_testn_epi8_mask (__mmask16 __U, __m128i __A, __m128i __B)		_mm_mask_testn_epi8_mask (__mmask16 __U, __m128i __A, __m128i __B)
{		{
return _mm_mask_cmpeq_epi8_mask (__U, _mm_and_si128 (__A, __B),		return _mm_mask_cmpeq_epi8_mask (__U, _mm_and_si128 (__A, __B),
_mm_setzero_si128());		_mm_setzero_si128());
}		}

static __inline__ __mmask32 __DEFAULT_FN_ATTRS		static __inline__ __mmask32 __DEFAULT_FN_ATTRS256
_mm256_testn_epi8_mask (__m256i __A, __m256i __B)		_mm256_testn_epi8_mask (__m256i __A, __m256i __B)
{		{
return _mm256_cmpeq_epi8_mask (_mm256_and_si256 (__A, __B),		return _mm256_cmpeq_epi8_mask (_mm256_and_si256 (__A, __B),
_mm256_setzero_si256());		_mm256_setzero_si256());
}		}

static __inline__ __mmask32 __DEFAULT_FN_ATTRS		static __inline__ __mmask32 __DEFAULT_FN_ATTRS256
_mm256_mask_testn_epi8_mask (__mmask32 __U, __m256i __A, __m256i __B)		_mm256_mask_testn_epi8_mask (__mmask32 __U, __m256i __A, __m256i __B)
{		{
return _mm256_mask_cmpeq_epi8_mask (__U, _mm256_and_si256 (__A, __B),		return _mm256_mask_cmpeq_epi8_mask (__U, _mm256_and_si256 (__A, __B),
_mm256_setzero_si256());		_mm256_setzero_si256());
}		}

static __inline__ __mmask8 __DEFAULT_FN_ATTRS		static __inline__ __mmask8 __DEFAULT_FN_ATTRS128
_mm_testn_epi16_mask (__m128i __A, __m128i __B)		_mm_testn_epi16_mask (__m128i __A, __m128i __B)
{		{
return _mm_cmpeq_epi16_mask (_mm_and_si128 (__A, __B), _mm_setzero_si128());		return _mm_cmpeq_epi16_mask (_mm_and_si128 (__A, __B), _mm_setzero_si128());
}		}

static __inline__ __mmask8 __DEFAULT_FN_ATTRS		static __inline__ __mmask8 __DEFAULT_FN_ATTRS128
_mm_mask_testn_epi16_mask (__mmask8 __U, __m128i __A, __m128i __B)		_mm_mask_testn_epi16_mask (__mmask8 __U, __m128i __A, __m128i __B)
{		{
return _mm_mask_cmpeq_epi16_mask (__U, _mm_and_si128(__A, __B), _mm_setzero_si128());		return _mm_mask_cmpeq_epi16_mask (__U, _mm_and_si128(__A, __B), _mm_setzero_si128());
}		}

static __inline__ __mmask16 __DEFAULT_FN_ATTRS		static __inline__ __mmask16 __DEFAULT_FN_ATTRS256
_mm256_testn_epi16_mask (__m256i __A, __m256i __B)		_mm256_testn_epi16_mask (__m256i __A, __m256i __B)
{		{
return _mm256_cmpeq_epi16_mask (_mm256_and_si256(__A, __B),		return _mm256_cmpeq_epi16_mask (_mm256_and_si256(__A, __B),
_mm256_setzero_si256());		_mm256_setzero_si256());
}		}

static __inline__ __mmask16 __DEFAULT_FN_ATTRS		static __inline__ __mmask16 __DEFAULT_FN_ATTRS256
_mm256_mask_testn_epi16_mask (__mmask16 __U, __m256i __A, __m256i __B)		_mm256_mask_testn_epi16_mask (__mmask16 __U, __m256i __A, __m256i __B)
{		{
return _mm256_mask_cmpeq_epi16_mask (__U, _mm256_and_si256 (__A, __B),		return _mm256_mask_cmpeq_epi16_mask (__U, _mm256_and_si256 (__A, __B),
_mm256_setzero_si256());		_mm256_setzero_si256());
}		}

static __inline__ __mmask16 __DEFAULT_FN_ATTRS		static __inline__ __mmask16 __DEFAULT_FN_ATTRS128
_mm_movepi8_mask (__m128i __A)		_mm_movepi8_mask (__m128i __A)
{		{
return (__mmask16) __builtin_ia32_cvtb2mask128 ((__v16qi) __A);		return (__mmask16) __builtin_ia32_cvtb2mask128 ((__v16qi) __A);
}		}

static __inline__ __mmask32 __DEFAULT_FN_ATTRS		static __inline__ __mmask32 __DEFAULT_FN_ATTRS256
_mm256_movepi8_mask (__m256i __A)		_mm256_movepi8_mask (__m256i __A)
{		{
return (__mmask32) __builtin_ia32_cvtb2mask256 ((__v32qi) __A);		return (__mmask32) __builtin_ia32_cvtb2mask256 ((__v32qi) __A);
}		}

static __inline__ __mmask8 __DEFAULT_FN_ATTRS		static __inline__ __mmask8 __DEFAULT_FN_ATTRS128
_mm_movepi16_mask (__m128i __A)		_mm_movepi16_mask (__m128i __A)
{		{
return (__mmask8) __builtin_ia32_cvtw2mask128 ((__v8hi) __A);		return (__mmask8) __builtin_ia32_cvtw2mask128 ((__v8hi) __A);
}		}

static __inline__ __mmask16 __DEFAULT_FN_ATTRS		static __inline__ __mmask16 __DEFAULT_FN_ATTRS256
_mm256_movepi16_mask (__m256i __A)		_mm256_movepi16_mask (__m256i __A)
{		{
return (__mmask16) __builtin_ia32_cvtw2mask256 ((__v16hi) __A);		return (__mmask16) __builtin_ia32_cvtw2mask256 ((__v16hi) __A);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_movm_epi8 (__mmask16 __A)		_mm_movm_epi8 (__mmask16 __A)
{		{
return (__m128i) __builtin_ia32_cvtmask2b128 (__A);		return (__m128i) __builtin_ia32_cvtmask2b128 (__A);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_movm_epi8 (__mmask32 __A)		_mm256_movm_epi8 (__mmask32 __A)
{		{
return (__m256i) __builtin_ia32_cvtmask2b256 (__A);		return (__m256i) __builtin_ia32_cvtmask2b256 (__A);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_movm_epi16 (__mmask8 __A)		_mm_movm_epi16 (__mmask8 __A)
{		{
return (__m128i) __builtin_ia32_cvtmask2w128 (__A);		return (__m128i) __builtin_ia32_cvtmask2w128 (__A);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_movm_epi16 (__mmask16 __A)		_mm256_movm_epi16 (__mmask16 __A)
{		{
return (__m256i) __builtin_ia32_cvtmask2w256 (__A);		return (__m256i) __builtin_ia32_cvtmask2w256 (__A);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_broadcastb_epi8 (__m128i __O, __mmask16 __M, __m128i __A)		_mm_mask_broadcastb_epi8 (__m128i __O, __mmask16 __M, __m128i __A)
{		{
return (__m128i)__builtin_ia32_selectb_128(__M,		return (__m128i)__builtin_ia32_selectb_128(__M,
(__v16qi) _mm_broadcastb_epi8(__A),		(__v16qi) _mm_broadcastb_epi8(__A),
(__v16qi) __O);		(__v16qi) __O);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_broadcastb_epi8 (__mmask16 __M, __m128i __A)		_mm_maskz_broadcastb_epi8 (__mmask16 __M, __m128i __A)
{		{
return (__m128i)__builtin_ia32_selectb_128(__M,		return (__m128i)__builtin_ia32_selectb_128(__M,
(__v16qi) _mm_broadcastb_epi8(__A),		(__v16qi) _mm_broadcastb_epi8(__A),
(__v16qi) _mm_setzero_si128());		(__v16qi) _mm_setzero_si128());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_broadcastb_epi8 (__m256i __O, __mmask32 __M, __m128i __A)		_mm256_mask_broadcastb_epi8 (__m256i __O, __mmask32 __M, __m128i __A)
{		{
return (__m256i)__builtin_ia32_selectb_256(__M,		return (__m256i)__builtin_ia32_selectb_256(__M,
(__v32qi) _mm256_broadcastb_epi8(__A),		(__v32qi) _mm256_broadcastb_epi8(__A),
(__v32qi) __O);		(__v32qi) __O);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_broadcastb_epi8 (__mmask32 __M, __m128i __A)		_mm256_maskz_broadcastb_epi8 (__mmask32 __M, __m128i __A)
{		{
return (__m256i)__builtin_ia32_selectb_256(__M,		return (__m256i)__builtin_ia32_selectb_256(__M,
(__v32qi) _mm256_broadcastb_epi8(__A),		(__v32qi) _mm256_broadcastb_epi8(__A),
(__v32qi) _mm256_setzero_si256());		(__v32qi) _mm256_setzero_si256());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_broadcastw_epi16 (__m128i __O, __mmask8 __M, __m128i __A)		_mm_mask_broadcastw_epi16 (__m128i __O, __mmask8 __M, __m128i __A)
{		{
return (__m128i)__builtin_ia32_selectw_128(__M,		return (__m128i)__builtin_ia32_selectw_128(__M,
(__v8hi) _mm_broadcastw_epi16(__A),		(__v8hi) _mm_broadcastw_epi16(__A),
(__v8hi) __O);		(__v8hi) __O);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_broadcastw_epi16 (__mmask8 __M, __m128i __A)		_mm_maskz_broadcastw_epi16 (__mmask8 __M, __m128i __A)
{		{
return (__m128i)__builtin_ia32_selectw_128(__M,		return (__m128i)__builtin_ia32_selectw_128(__M,
(__v8hi) _mm_broadcastw_epi16(__A),		(__v8hi) _mm_broadcastw_epi16(__A),
(__v8hi) _mm_setzero_si128());		(__v8hi) _mm_setzero_si128());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_broadcastw_epi16 (__m256i __O, __mmask16 __M, __m128i __A)		_mm256_mask_broadcastw_epi16 (__m256i __O, __mmask16 __M, __m128i __A)
{		{
return (__m256i)__builtin_ia32_selectw_256(__M,		return (__m256i)__builtin_ia32_selectw_256(__M,
(__v16hi) _mm256_broadcastw_epi16(__A),		(__v16hi) _mm256_broadcastw_epi16(__A),
(__v16hi) __O);		(__v16hi) __O);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_broadcastw_epi16 (__mmask16 __M, __m128i __A)		_mm256_maskz_broadcastw_epi16 (__mmask16 __M, __m128i __A)
{		{
return (__m256i)__builtin_ia32_selectw_256(__M,		return (__m256i)__builtin_ia32_selectw_256(__M,
(__v16hi) _mm256_broadcastw_epi16(__A),		(__v16hi) _mm256_broadcastw_epi16(__A),
(__v16hi) _mm256_setzero_si256());		(__v16hi) _mm256_setzero_si256());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_set1_epi16 (__m256i __O, __mmask16 __M, short __A)		_mm256_mask_set1_epi16 (__m256i __O, __mmask16 __M, short __A)
{		{
return (__m256i) __builtin_ia32_selectw_256 (__M,		return (__m256i) __builtin_ia32_selectw_256 (__M,
(__v16hi) _mm256_set1_epi16(__A),		(__v16hi) _mm256_set1_epi16(__A),
(__v16hi) __O);		(__v16hi) __O);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_set1_epi16 (__mmask16 __M, short __A)		_mm256_maskz_set1_epi16 (__mmask16 __M, short __A)
{		{
return (__m256i) __builtin_ia32_selectw_256(__M,		return (__m256i) __builtin_ia32_selectw_256(__M,
(__v16hi)_mm256_set1_epi16(__A),		(__v16hi)_mm256_set1_epi16(__A),
(__v16hi) _mm256_setzero_si256());		(__v16hi) _mm256_setzero_si256());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_set1_epi16 (__m128i __O, __mmask8 __M, short __A)		_mm_mask_set1_epi16 (__m128i __O, __mmask8 __M, short __A)
{		{
return (__m128i) __builtin_ia32_selectw_128(__M,		return (__m128i) __builtin_ia32_selectw_128(__M,
(__v8hi) _mm_set1_epi16(__A),		(__v8hi) _mm_set1_epi16(__A),
(__v8hi) __O);		(__v8hi) __O);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_set1_epi16 (__mmask8 __M, short __A)		_mm_maskz_set1_epi16 (__mmask8 __M, short __A)
{		{
return (__m128i) __builtin_ia32_selectw_128(__M,		return (__m128i) __builtin_ia32_selectw_128(__M,
(__v8hi) _mm_set1_epi16(__A),		(__v8hi) _mm_set1_epi16(__A),
(__v8hi) _mm_setzero_si128());		(__v8hi) _mm_setzero_si128());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_permutexvar_epi16 (__m128i __A, __m128i __B)		_mm_permutexvar_epi16 (__m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_permvarhi128((__v8hi) __B, (__v8hi) __A);		return (__m128i)__builtin_ia32_permvarhi128((__v8hi) __B, (__v8hi) __A);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_permutexvar_epi16 (__mmask8 __M, __m128i __A, __m128i __B)		_mm_maskz_permutexvar_epi16 (__mmask8 __M, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectw_128((__mmask8)__M,		return (__m128i)__builtin_ia32_selectw_128((__mmask8)__M,
(__v8hi)_mm_permutexvar_epi16(__A, __B),		(__v8hi)_mm_permutexvar_epi16(__A, __B),
(__v8hi) _mm_setzero_si128());		(__v8hi) _mm_setzero_si128());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_permutexvar_epi16 (__m128i __W, __mmask8 __M, __m128i __A,		_mm_mask_permutexvar_epi16 (__m128i __W, __mmask8 __M, __m128i __A,
__m128i __B)		__m128i __B)
{		{
return (__m128i)__builtin_ia32_selectw_128((__mmask8)__M,		return (__m128i)__builtin_ia32_selectw_128((__mmask8)__M,
(__v8hi)_mm_permutexvar_epi16(__A, __B),		(__v8hi)_mm_permutexvar_epi16(__A, __B),
(__v8hi)__W);		(__v8hi)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_permutexvar_epi16 (__m256i __A, __m256i __B)		_mm256_permutexvar_epi16 (__m256i __A, __m256i __B)
{		{
return (__m256i)__builtin_ia32_permvarhi256((__v16hi) __B, (__v16hi) __A);		return (__m256i)__builtin_ia32_permvarhi256((__v16hi) __B, (__v16hi) __A);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_permutexvar_epi16 (__mmask16 __M, __m256i __A,		_mm256_maskz_permutexvar_epi16 (__mmask16 __M, __m256i __A,
__m256i __B)		__m256i __B)
{		{
return (__m256i)__builtin_ia32_selectw_256((__mmask16)__M,		return (__m256i)__builtin_ia32_selectw_256((__mmask16)__M,
(__v16hi)_mm256_permutexvar_epi16(__A, __B),		(__v16hi)_mm256_permutexvar_epi16(__A, __B),
(__v16hi)_mm256_setzero_si256());		(__v16hi)_mm256_setzero_si256());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_permutexvar_epi16 (__m256i __W, __mmask16 __M, __m256i __A,		_mm256_mask_permutexvar_epi16 (__m256i __W, __mmask16 __M, __m256i __A,
__m256i __B)		__m256i __B)
{		{
return (__m256i)__builtin_ia32_selectw_256((__mmask16)__M,		return (__m256i)__builtin_ia32_selectw_256((__mmask16)__M,
(__v16hi)_mm256_permutexvar_epi16(__A, __B),		(__v16hi)_mm256_permutexvar_epi16(__A, __B),
(__v16hi)__W);		(__v16hi)__W);
}		}

Show All 40 Lines	(__m256i)__builtin_ia32_selectw_256((__mmask16)(U), \
(__v16hi)_mm256_dbsad_epu8((A), (B), (imm)), \		(__v16hi)_mm256_dbsad_epu8((A), (B), (imm)), \
(__v16hi)(__m256i)(W))		(__v16hi)(__m256i)(W))

#define _mm256_maskz_dbsad_epu8(U, A, B, imm) \		#define _mm256_maskz_dbsad_epu8(U, A, B, imm) \
(__m256i)__builtin_ia32_selectw_256((__mmask16)(U), \		(__m256i)__builtin_ia32_selectw_256((__mmask16)(U), \
(__v16hi)_mm256_dbsad_epu8((A), (B), (imm)), \		(__v16hi)_mm256_dbsad_epu8((A), (B), (imm)), \
(__v16hi)_mm256_setzero_si256())		(__v16hi)_mm256_setzero_si256())

#undef __DEFAULT_FN_ATTRS		#undef __DEFAULT_FN_ATTRS128
		#undef __DEFAULT_FN_ATTRS256

#endif /* __AVX512VLBWINTRIN_H */		#endif /* __AVX512VLBWINTRIN_H */

lib/Headers/avx512vlcdintrin.h

	Show All 22 Lines
	#ifndef __IMMINTRIN_H			#ifndef __IMMINTRIN_H
	#error "Never use <avx512vlcdintrin.h> directly; include <immintrin.h> instead."			#error "Never use <avx512vlcdintrin.h> directly; include <immintrin.h> instead."
	#endif			#endif

	#ifndef __AVX512VLCDINTRIN_H			#ifndef __AVX512VLCDINTRIN_H
	#define __AVX512VLCDINTRIN_H			#define __AVX512VLCDINTRIN_H

	/* Define the default attributes for the functions in this file. */			/* Define the default attributes for the functions in this file. */
	#define __DEFAULT_FN_ATTRS __attribute__((__always_inline__, __nodebug__, __target__("avx512vl,avx512cd")))			#define __DEFAULT_FN_ATTRS128 __attribute__((__always_inline__, __nodebug__, __target__("avx512vl,avx512cd"), __min_vector_width__(128)))
				#define __DEFAULT_FN_ATTRS256 __attribute__((__always_inline__, __nodebug__, __target__("avx512vl,avx512cd"), __min_vector_width__(256)))


	static __inline__ __m128i __DEFAULT_FN_ATTRS			static __inline__ __m128i __DEFAULT_FN_ATTRS128
	_mm_broadcastmb_epi64 (__mmask8 __A)			_mm_broadcastmb_epi64 (__mmask8 __A)
	{			{
	return (__m128i) _mm_set1_epi64x((long long) __A);			return (__m128i) _mm_set1_epi64x((long long) __A);
	}			}

	static __inline__ __m256i __DEFAULT_FN_ATTRS			static __inline__ __m256i __DEFAULT_FN_ATTRS256
	_mm256_broadcastmb_epi64 (__mmask8 __A)			_mm256_broadcastmb_epi64 (__mmask8 __A)
	{			{
	return (__m256i) _mm256_set1_epi64x((long long)__A);			return (__m256i) _mm256_set1_epi64x((long long)__A);
	}			}

	static __inline__ __m128i __DEFAULT_FN_ATTRS			static __inline__ __m128i __DEFAULT_FN_ATTRS128
	_mm_broadcastmw_epi32 (__mmask16 __A)			_mm_broadcastmw_epi32 (__mmask16 __A)
	{			{
	return (__m128i) _mm_set1_epi32((int)__A);			return (__m128i) _mm_set1_epi32((int)__A);
	}			}

	static __inline__ __m256i __DEFAULT_FN_ATTRS			static __inline__ __m256i __DEFAULT_FN_ATTRS256
	_mm256_broadcastmw_epi32 (__mmask16 __A)			_mm256_broadcastmw_epi32 (__mmask16 __A)
	{			{
	return (__m256i) _mm256_set1_epi32((int)__A);			return (__m256i) _mm256_set1_epi32((int)__A);
	}			}


	static __inline__ __m128i __DEFAULT_FN_ATTRS			static __inline__ __m128i __DEFAULT_FN_ATTRS128
	_mm_conflict_epi64 (__m128i __A)			_mm_conflict_epi64 (__m128i __A)
	{			{
	return (__m128i) __builtin_ia32_vpconflictdi_128_mask ((__v2di) __A,			return (__m128i) __builtin_ia32_vpconflictdi_128_mask ((__v2di) __A,
	(__v2di) _mm_undefined_si128 (),			(__v2di) _mm_undefined_si128 (),
	(__mmask8) -1);			(__mmask8) -1);
	}			}

	static __inline__ __m128i __DEFAULT_FN_ATTRS			static __inline__ __m128i __DEFAULT_FN_ATTRS128
	_mm_mask_conflict_epi64 (__m128i __W, __mmask8 __U, __m128i __A)			_mm_mask_conflict_epi64 (__m128i __W, __mmask8 __U, __m128i __A)
	{			{
	return (__m128i) __builtin_ia32_vpconflictdi_128_mask ((__v2di) __A,			return (__m128i) __builtin_ia32_vpconflictdi_128_mask ((__v2di) __A,
	(__v2di) __W,			(__v2di) __W,
	(__mmask8) __U);			(__mmask8) __U);
	}			}

	static __inline__ __m128i __DEFAULT_FN_ATTRS			static __inline__ __m128i __DEFAULT_FN_ATTRS128
	_mm_maskz_conflict_epi64 (__mmask8 __U, __m128i __A)			_mm_maskz_conflict_epi64 (__mmask8 __U, __m128i __A)
	{			{
	return (__m128i) __builtin_ia32_vpconflictdi_128_mask ((__v2di) __A,			return (__m128i) __builtin_ia32_vpconflictdi_128_mask ((__v2di) __A,
	(__v2di)			(__v2di)
	_mm_setzero_si128 (),			_mm_setzero_si128 (),
	(__mmask8) __U);			(__mmask8) __U);
	}			}

	static __inline__ __m256i __DEFAULT_FN_ATTRS			static __inline__ __m256i __DEFAULT_FN_ATTRS256
	_mm256_conflict_epi64 (__m256i __A)			_mm256_conflict_epi64 (__m256i __A)
	{			{
	return (__m256i) __builtin_ia32_vpconflictdi_256_mask ((__v4di) __A,			return (__m256i) __builtin_ia32_vpconflictdi_256_mask ((__v4di) __A,
	(__v4di) _mm256_undefined_si256 (),			(__v4di) _mm256_undefined_si256 (),
	(__mmask8) -1);			(__mmask8) -1);
	}			}

	static __inline__ __m256i __DEFAULT_FN_ATTRS			static __inline__ __m256i __DEFAULT_FN_ATTRS256
	_mm256_mask_conflict_epi64 (__m256i __W, __mmask8 __U, __m256i __A)			_mm256_mask_conflict_epi64 (__m256i __W, __mmask8 __U, __m256i __A)
	{			{
	return (__m256i) __builtin_ia32_vpconflictdi_256_mask ((__v4di) __A,			return (__m256i) __builtin_ia32_vpconflictdi_256_mask ((__v4di) __A,
	(__v4di) __W,			(__v4di) __W,
	(__mmask8) __U);			(__mmask8) __U);
	}			}

	static __inline__ __m256i __DEFAULT_FN_ATTRS			static __inline__ __m256i __DEFAULT_FN_ATTRS256
	_mm256_maskz_conflict_epi64 (__mmask8 __U, __m256i __A)			_mm256_maskz_conflict_epi64 (__mmask8 __U, __m256i __A)
	{			{
	return (__m256i) __builtin_ia32_vpconflictdi_256_mask ((__v4di) __A,			return (__m256i) __builtin_ia32_vpconflictdi_256_mask ((__v4di) __A,
	(__v4di) _mm256_setzero_si256 (),			(__v4di) _mm256_setzero_si256 (),
	(__mmask8) __U);			(__mmask8) __U);
	}			}

	static __inline__ __m128i __DEFAULT_FN_ATTRS			static __inline__ __m128i __DEFAULT_FN_ATTRS128
	_mm_conflict_epi32 (__m128i __A)			_mm_conflict_epi32 (__m128i __A)
	{			{
	return (__m128i) __builtin_ia32_vpconflictsi_128_mask ((__v4si) __A,			return (__m128i) __builtin_ia32_vpconflictsi_128_mask ((__v4si) __A,
	(__v4si) _mm_undefined_si128 (),			(__v4si) _mm_undefined_si128 (),
	(__mmask8) -1);			(__mmask8) -1);
	}			}

	static __inline__ __m128i __DEFAULT_FN_ATTRS			static __inline__ __m128i __DEFAULT_FN_ATTRS128
	_mm_mask_conflict_epi32 (__m128i __W, __mmask8 __U, __m128i __A)			_mm_mask_conflict_epi32 (__m128i __W, __mmask8 __U, __m128i __A)
	{			{
	return (__m128i) __builtin_ia32_vpconflictsi_128_mask ((__v4si) __A,			return (__m128i) __builtin_ia32_vpconflictsi_128_mask ((__v4si) __A,
	(__v4si) __W,			(__v4si) __W,
	(__mmask8) __U);			(__mmask8) __U);
	}			}

	static __inline__ __m128i __DEFAULT_FN_ATTRS			static __inline__ __m128i __DEFAULT_FN_ATTRS128
	_mm_maskz_conflict_epi32 (__mmask8 __U, __m128i __A)			_mm_maskz_conflict_epi32 (__mmask8 __U, __m128i __A)
	{			{
	return (__m128i) __builtin_ia32_vpconflictsi_128_mask ((__v4si) __A,			return (__m128i) __builtin_ia32_vpconflictsi_128_mask ((__v4si) __A,
	(__v4si) _mm_setzero_si128 (),			(__v4si) _mm_setzero_si128 (),
	(__mmask8) __U);			(__mmask8) __U);
	}			}

	static __inline__ __m256i __DEFAULT_FN_ATTRS			static __inline__ __m256i __DEFAULT_FN_ATTRS256
	_mm256_conflict_epi32 (__m256i __A)			_mm256_conflict_epi32 (__m256i __A)
	{			{
	return (__m256i) __builtin_ia32_vpconflictsi_256_mask ((__v8si) __A,			return (__m256i) __builtin_ia32_vpconflictsi_256_mask ((__v8si) __A,
	(__v8si) _mm256_undefined_si256 (),			(__v8si) _mm256_undefined_si256 (),
	(__mmask8) -1);			(__mmask8) -1);
	}			}

	static __inline__ __m256i __DEFAULT_FN_ATTRS			static __inline__ __m256i __DEFAULT_FN_ATTRS256
	_mm256_mask_conflict_epi32 (__m256i __W, __mmask8 __U, __m256i __A)			_mm256_mask_conflict_epi32 (__m256i __W, __mmask8 __U, __m256i __A)
	{			{
	return (__m256i) __builtin_ia32_vpconflictsi_256_mask ((__v8si) __A,			return (__m256i) __builtin_ia32_vpconflictsi_256_mask ((__v8si) __A,
	(__v8si) __W,			(__v8si) __W,
	(__mmask8) __U);			(__mmask8) __U);
	}			}

	static __inline__ __m256i __DEFAULT_FN_ATTRS			static __inline__ __m256i __DEFAULT_FN_ATTRS256
	_mm256_maskz_conflict_epi32 (__mmask8 __U, __m256i __A)			_mm256_maskz_conflict_epi32 (__mmask8 __U, __m256i __A)
	{			{
	return (__m256i) __builtin_ia32_vpconflictsi_256_mask ((__v8si) __A,			return (__m256i) __builtin_ia32_vpconflictsi_256_mask ((__v8si) __A,
	(__v8si)			(__v8si)
	_mm256_setzero_si256 (),			_mm256_setzero_si256 (),
	(__mmask8) __U);			(__mmask8) __U);
	}			}

	static __inline__ __m128i __DEFAULT_FN_ATTRS			static __inline__ __m128i __DEFAULT_FN_ATTRS128
	_mm_lzcnt_epi32 (__m128i __A)			_mm_lzcnt_epi32 (__m128i __A)
	{			{
	return (__m128i) __builtin_ia32_vplzcntd_128 ((__v4si) __A);			return (__m128i) __builtin_ia32_vplzcntd_128 ((__v4si) __A);
	}			}

	static __inline__ __m128i __DEFAULT_FN_ATTRS			static __inline__ __m128i __DEFAULT_FN_ATTRS128
	_mm_mask_lzcnt_epi32 (__m128i __W, __mmask8 __U, __m128i __A)			_mm_mask_lzcnt_epi32 (__m128i __W, __mmask8 __U, __m128i __A)
	{			{
	return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,			return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,
	(__v4si)_mm_lzcnt_epi32(__A),			(__v4si)_mm_lzcnt_epi32(__A),
	(__v4si)__W);			(__v4si)__W);
	}			}

	static __inline__ __m128i __DEFAULT_FN_ATTRS			static __inline__ __m128i __DEFAULT_FN_ATTRS128
	_mm_maskz_lzcnt_epi32 (__mmask8 __U, __m128i __A)			_mm_maskz_lzcnt_epi32 (__mmask8 __U, __m128i __A)
	{			{
	return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,			return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,
	(__v4si)_mm_lzcnt_epi32(__A),			(__v4si)_mm_lzcnt_epi32(__A),
	(__v4si)_mm_setzero_si128());			(__v4si)_mm_setzero_si128());
	}			}

	static __inline__ __m256i __DEFAULT_FN_ATTRS			static __inline__ __m256i __DEFAULT_FN_ATTRS256
	_mm256_lzcnt_epi32 (__m256i __A)			_mm256_lzcnt_epi32 (__m256i __A)
	{			{
	return (__m256i) __builtin_ia32_vplzcntd_256 ((__v8si) __A);			return (__m256i) __builtin_ia32_vplzcntd_256 ((__v8si) __A);
	}			}

	static __inline__ __m256i __DEFAULT_FN_ATTRS			static __inline__ __m256i __DEFAULT_FN_ATTRS256
	_mm256_mask_lzcnt_epi32 (__m256i __W, __mmask8 __U, __m256i __A)			_mm256_mask_lzcnt_epi32 (__m256i __W, __mmask8 __U, __m256i __A)
	{			{
	return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,			return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,
	(__v8si)_mm256_lzcnt_epi32(__A),			(__v8si)_mm256_lzcnt_epi32(__A),
	(__v8si)__W);			(__v8si)__W);
	}			}

	static __inline__ __m256i __DEFAULT_FN_ATTRS			static __inline__ __m256i __DEFAULT_FN_ATTRS256
	_mm256_maskz_lzcnt_epi32 (__mmask8 __U, __m256i __A)			_mm256_maskz_lzcnt_epi32 (__mmask8 __U, __m256i __A)
	{			{
	return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,			return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,
	(__v8si)_mm256_lzcnt_epi32(__A),			(__v8si)_mm256_lzcnt_epi32(__A),
	(__v8si)_mm256_setzero_si256());			(__v8si)_mm256_setzero_si256());
	}			}

	static __inline__ __m128i __DEFAULT_FN_ATTRS			static __inline__ __m128i __DEFAULT_FN_ATTRS128
	_mm_lzcnt_epi64 (__m128i __A)			_mm_lzcnt_epi64 (__m128i __A)
	{			{
	return (__m128i) __builtin_ia32_vplzcntq_128 ((__v2di) __A);			return (__m128i) __builtin_ia32_vplzcntq_128 ((__v2di) __A);
	}			}

	static __inline__ __m128i __DEFAULT_FN_ATTRS			static __inline__ __m128i __DEFAULT_FN_ATTRS128
	_mm_mask_lzcnt_epi64 (__m128i __W, __mmask8 __U, __m128i __A)			_mm_mask_lzcnt_epi64 (__m128i __W, __mmask8 __U, __m128i __A)
	{			{
	return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,			return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,
	(__v2di)_mm_lzcnt_epi64(__A),			(__v2di)_mm_lzcnt_epi64(__A),
	(__v2di)__W);			(__v2di)__W);
	}			}

	static __inline__ __m128i __DEFAULT_FN_ATTRS			static __inline__ __m128i __DEFAULT_FN_ATTRS128
	_mm_maskz_lzcnt_epi64 (__mmask8 __U, __m128i __A)			_mm_maskz_lzcnt_epi64 (__mmask8 __U, __m128i __A)
	{			{
	return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,			return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,
	(__v2di)_mm_lzcnt_epi64(__A),			(__v2di)_mm_lzcnt_epi64(__A),
	(__v2di)_mm_setzero_si128());			(__v2di)_mm_setzero_si128());
	}			}

	static __inline__ __m256i __DEFAULT_FN_ATTRS			static __inline__ __m256i __DEFAULT_FN_ATTRS256
	_mm256_lzcnt_epi64 (__m256i __A)			_mm256_lzcnt_epi64 (__m256i __A)
	{			{
	return (__m256i) __builtin_ia32_vplzcntq_256 ((__v4di) __A);			return (__m256i) __builtin_ia32_vplzcntq_256 ((__v4di) __A);
	}			}

	static __inline__ __m256i __DEFAULT_FN_ATTRS			static __inline__ __m256i __DEFAULT_FN_ATTRS256
	_mm256_mask_lzcnt_epi64 (__m256i __W, __mmask8 __U, __m256i __A)			_mm256_mask_lzcnt_epi64 (__m256i __W, __mmask8 __U, __m256i __A)
	{			{
	return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,			return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,
	(__v4di)_mm256_lzcnt_epi64(__A),			(__v4di)_mm256_lzcnt_epi64(__A),
	(__v4di)__W);			(__v4di)__W);
	}			}

	static __inline__ __m256i __DEFAULT_FN_ATTRS			static __inline__ __m256i __DEFAULT_FN_ATTRS256
	_mm256_maskz_lzcnt_epi64 (__mmask8 __U, __m256i __A)			_mm256_maskz_lzcnt_epi64 (__mmask8 __U, __m256i __A)
	{			{
	return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,			return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,
	(__v4di)_mm256_lzcnt_epi64(__A),			(__v4di)_mm256_lzcnt_epi64(__A),
	(__v4di)_mm256_setzero_si256());			(__v4di)_mm256_setzero_si256());
	}			}

	#undef __DEFAULT_FN_ATTRS			#undef __DEFAULT_FN_ATTRS128
				#undef __DEFAULT_FN_ATTRS256

	#endif /* __AVX512VLCDINTRIN_H */			#endif /* __AVX512VLCDINTRIN_H */

lib/Headers/avx512vldqintrin.h

Show All 23 Lines
#ifndef __IMMINTRIN_H		#ifndef __IMMINTRIN_H
#error "Never use <avx512vldqintrin.h> directly; include <immintrin.h> instead."		#error "Never use <avx512vldqintrin.h> directly; include <immintrin.h> instead."
#endif		#endif

#ifndef __AVX512VLDQINTRIN_H		#ifndef __AVX512VLDQINTRIN_H
#define __AVX512VLDQINTRIN_H		#define __AVX512VLDQINTRIN_H

/* Define the default attributes for the functions in this file. */		/* Define the default attributes for the functions in this file. */
#define __DEFAULT_FN_ATTRS __attribute__((__always_inline__, __nodebug__, __target__("avx512vl,avx512dq")))		#define __DEFAULT_FN_ATTRS128 __attribute__((__always_inline__, __nodebug__, __target__("avx512vl,avx512dq"), __min_vector_width__(128)))
		#define __DEFAULT_FN_ATTRS256 __attribute__((__always_inline__, __nodebug__, __target__("avx512vl,avx512dq"), __min_vector_width__(256)))

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mullo_epi64 (__m256i __A, __m256i __B) {		_mm256_mullo_epi64 (__m256i __A, __m256i __B) {
return (__m256i) ((__v4du) __A * (__v4du) __B);		return (__m256i) ((__v4du) __A * (__v4du) __B);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_mullo_epi64(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B) {		_mm256_mask_mullo_epi64(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B) {
return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,
(__v4di)_mm256_mullo_epi64(__A, __B),		(__v4di)_mm256_mullo_epi64(__A, __B),
(__v4di)__W);		(__v4di)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_mullo_epi64(__mmask8 __U, __m256i __A, __m256i __B) {		_mm256_maskz_mullo_epi64(__mmask8 __U, __m256i __A, __m256i __B) {
return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,
(__v4di)_mm256_mullo_epi64(__A, __B),		(__v4di)_mm256_mullo_epi64(__A, __B),
(__v4di)_mm256_setzero_si256());		(__v4di)_mm256_setzero_si256());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mullo_epi64 (__m128i __A, __m128i __B) {		_mm_mullo_epi64 (__m128i __A, __m128i __B) {
return (__m128i) ((__v2du) __A * (__v2du) __B);		return (__m128i) ((__v2du) __A * (__v2du) __B);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_mullo_epi64(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) {		_mm_mask_mullo_epi64(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) {
return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,
(__v2di)_mm_mullo_epi64(__A, __B),		(__v2di)_mm_mullo_epi64(__A, __B),
(__v2di)__W);		(__v2di)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_mullo_epi64(__mmask8 __U, __m128i __A, __m128i __B) {		_mm_maskz_mullo_epi64(__mmask8 __U, __m128i __A, __m128i __B) {
return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,
(__v2di)_mm_mullo_epi64(__A, __B),		(__v2di)_mm_mullo_epi64(__A, __B),
(__v2di)_mm_setzero_si128());		(__v2di)_mm_setzero_si128());
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_mask_andnot_pd(__m256d __W, __mmask8 __U, __m256d __A, __m256d __B) {		_mm256_mask_andnot_pd(__m256d __W, __mmask8 __U, __m256d __A, __m256d __B) {
return (__m256d)__builtin_ia32_selectpd_256((__mmask8)__U,		return (__m256d)__builtin_ia32_selectpd_256((__mmask8)__U,
(__v4df)_mm256_andnot_pd(__A, __B),		(__v4df)_mm256_andnot_pd(__A, __B),
(__v4df)__W);		(__v4df)__W);
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_maskz_andnot_pd(__mmask8 __U, __m256d __A, __m256d __B) {		_mm256_maskz_andnot_pd(__mmask8 __U, __m256d __A, __m256d __B) {
return (__m256d)__builtin_ia32_selectpd_256((__mmask8)__U,		return (__m256d)__builtin_ia32_selectpd_256((__mmask8)__U,
(__v4df)_mm256_andnot_pd(__A, __B),		(__v4df)_mm256_andnot_pd(__A, __B),
(__v4df)_mm256_setzero_pd());		(__v4df)_mm256_setzero_pd());
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_mask_andnot_pd(__m128d __W, __mmask8 __U, __m128d __A, __m128d __B) {		_mm_mask_andnot_pd(__m128d __W, __mmask8 __U, __m128d __A, __m128d __B) {
return (__m128d)__builtin_ia32_selectpd_128((__mmask8)__U,		return (__m128d)__builtin_ia32_selectpd_128((__mmask8)__U,
(__v2df)_mm_andnot_pd(__A, __B),		(__v2df)_mm_andnot_pd(__A, __B),
(__v2df)__W);		(__v2df)__W);
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_maskz_andnot_pd(__mmask8 __U, __m128d __A, __m128d __B) {		_mm_maskz_andnot_pd(__mmask8 __U, __m128d __A, __m128d __B) {
return (__m128d)__builtin_ia32_selectpd_128((__mmask8)__U,		return (__m128d)__builtin_ia32_selectpd_128((__mmask8)__U,
(__v2df)_mm_andnot_pd(__A, __B),		(__v2df)_mm_andnot_pd(__A, __B),
(__v2df)_mm_setzero_pd());		(__v2df)_mm_setzero_pd());
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_mask_andnot_ps(__m256 __W, __mmask8 __U, __m256 __A, __m256 __B) {		_mm256_mask_andnot_ps(__m256 __W, __mmask8 __U, __m256 __A, __m256 __B) {
return (__m256)__builtin_ia32_selectps_256((__mmask8)__U,		return (__m256)__builtin_ia32_selectps_256((__mmask8)__U,
(__v8sf)_mm256_andnot_ps(__A, __B),		(__v8sf)_mm256_andnot_ps(__A, __B),
(__v8sf)__W);		(__v8sf)__W);
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_maskz_andnot_ps(__mmask8 __U, __m256 __A, __m256 __B) {		_mm256_maskz_andnot_ps(__mmask8 __U, __m256 __A, __m256 __B) {
return (__m256)__builtin_ia32_selectps_256((__mmask8)__U,		return (__m256)__builtin_ia32_selectps_256((__mmask8)__U,
(__v8sf)_mm256_andnot_ps(__A, __B),		(__v8sf)_mm256_andnot_ps(__A, __B),
(__v8sf)_mm256_setzero_ps());		(__v8sf)_mm256_setzero_ps());
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_mask_andnot_ps(__m128 __W, __mmask8 __U, __m128 __A, __m128 __B) {		_mm_mask_andnot_ps(__m128 __W, __mmask8 __U, __m128 __A, __m128 __B) {
return (__m128)__builtin_ia32_selectps_128((__mmask8)__U,		return (__m128)__builtin_ia32_selectps_128((__mmask8)__U,
(__v4sf)_mm_andnot_ps(__A, __B),		(__v4sf)_mm_andnot_ps(__A, __B),
(__v4sf)__W);		(__v4sf)__W);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_maskz_andnot_ps(__mmask8 __U, __m128 __A, __m128 __B) {		_mm_maskz_andnot_ps(__mmask8 __U, __m128 __A, __m128 __B) {
return (__m128)__builtin_ia32_selectps_128((__mmask8)__U,		return (__m128)__builtin_ia32_selectps_128((__mmask8)__U,
(__v4sf)_mm_andnot_ps(__A, __B),		(__v4sf)_mm_andnot_ps(__A, __B),
(__v4sf)_mm_setzero_ps());		(__v4sf)_mm_setzero_ps());
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_mask_and_pd(__m256d __W, __mmask8 __U, __m256d __A, __m256d __B) {		_mm256_mask_and_pd(__m256d __W, __mmask8 __U, __m256d __A, __m256d __B) {
return (__m256d)__builtin_ia32_selectpd_256((__mmask8)__U,		return (__m256d)__builtin_ia32_selectpd_256((__mmask8)__U,
(__v4df)_mm256_and_pd(__A, __B),		(__v4df)_mm256_and_pd(__A, __B),
(__v4df)__W);		(__v4df)__W);
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_maskz_and_pd(__mmask8 __U, __m256d __A, __m256d __B) {		_mm256_maskz_and_pd(__mmask8 __U, __m256d __A, __m256d __B) {
return (__m256d)__builtin_ia32_selectpd_256((__mmask8)__U,		return (__m256d)__builtin_ia32_selectpd_256((__mmask8)__U,
(__v4df)_mm256_and_pd(__A, __B),		(__v4df)_mm256_and_pd(__A, __B),
(__v4df)_mm256_setzero_pd());		(__v4df)_mm256_setzero_pd());
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_mask_and_pd(__m128d __W, __mmask8 __U, __m128d __A, __m128d __B) {		_mm_mask_and_pd(__m128d __W, __mmask8 __U, __m128d __A, __m128d __B) {
return (__m128d)__builtin_ia32_selectpd_128((__mmask8)__U,		return (__m128d)__builtin_ia32_selectpd_128((__mmask8)__U,
(__v2df)_mm_and_pd(__A, __B),		(__v2df)_mm_and_pd(__A, __B),
(__v2df)__W);		(__v2df)__W);
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_maskz_and_pd(__mmask8 __U, __m128d __A, __m128d __B) {		_mm_maskz_and_pd(__mmask8 __U, __m128d __A, __m128d __B) {
return (__m128d)__builtin_ia32_selectpd_128((__mmask8)__U,		return (__m128d)__builtin_ia32_selectpd_128((__mmask8)__U,
(__v2df)_mm_and_pd(__A, __B),		(__v2df)_mm_and_pd(__A, __B),
(__v2df)_mm_setzero_pd());		(__v2df)_mm_setzero_pd());
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_mask_and_ps(__m256 __W, __mmask8 __U, __m256 __A, __m256 __B) {		_mm256_mask_and_ps(__m256 __W, __mmask8 __U, __m256 __A, __m256 __B) {
return (__m256)__builtin_ia32_selectps_256((__mmask8)__U,		return (__m256)__builtin_ia32_selectps_256((__mmask8)__U,
(__v8sf)_mm256_and_ps(__A, __B),		(__v8sf)_mm256_and_ps(__A, __B),
(__v8sf)__W);		(__v8sf)__W);
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_maskz_and_ps(__mmask8 __U, __m256 __A, __m256 __B) {		_mm256_maskz_and_ps(__mmask8 __U, __m256 __A, __m256 __B) {
return (__m256)__builtin_ia32_selectps_256((__mmask8)__U,		return (__m256)__builtin_ia32_selectps_256((__mmask8)__U,
(__v8sf)_mm256_and_ps(__A, __B),		(__v8sf)_mm256_and_ps(__A, __B),
(__v8sf)_mm256_setzero_ps());		(__v8sf)_mm256_setzero_ps());
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_mask_and_ps(__m128 __W, __mmask8 __U, __m128 __A, __m128 __B) {		_mm_mask_and_ps(__m128 __W, __mmask8 __U, __m128 __A, __m128 __B) {
return (__m128)__builtin_ia32_selectps_128((__mmask8)__U,		return (__m128)__builtin_ia32_selectps_128((__mmask8)__U,
(__v4sf)_mm_and_ps(__A, __B),		(__v4sf)_mm_and_ps(__A, __B),
(__v4sf)__W);		(__v4sf)__W);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_maskz_and_ps(__mmask8 __U, __m128 __A, __m128 __B) {		_mm_maskz_and_ps(__mmask8 __U, __m128 __A, __m128 __B) {
return (__m128)__builtin_ia32_selectps_128((__mmask8)__U,		return (__m128)__builtin_ia32_selectps_128((__mmask8)__U,
(__v4sf)_mm_and_ps(__A, __B),		(__v4sf)_mm_and_ps(__A, __B),
(__v4sf)_mm_setzero_ps());		(__v4sf)_mm_setzero_ps());
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_mask_xor_pd(__m256d __W, __mmask8 __U, __m256d __A, __m256d __B) {		_mm256_mask_xor_pd(__m256d __W, __mmask8 __U, __m256d __A, __m256d __B) {
return (__m256d)__builtin_ia32_selectpd_256((__mmask8)__U,		return (__m256d)__builtin_ia32_selectpd_256((__mmask8)__U,
(__v4df)_mm256_xor_pd(__A, __B),		(__v4df)_mm256_xor_pd(__A, __B),
(__v4df)__W);		(__v4df)__W);
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_maskz_xor_pd(__mmask8 __U, __m256d __A, __m256d __B) {		_mm256_maskz_xor_pd(__mmask8 __U, __m256d __A, __m256d __B) {
return (__m256d)__builtin_ia32_selectpd_256((__mmask8)__U,		return (__m256d)__builtin_ia32_selectpd_256((__mmask8)__U,
(__v4df)_mm256_xor_pd(__A, __B),		(__v4df)_mm256_xor_pd(__A, __B),
(__v4df)_mm256_setzero_pd());		(__v4df)_mm256_setzero_pd());
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_mask_xor_pd(__m128d __W, __mmask8 __U, __m128d __A, __m128d __B) {		_mm_mask_xor_pd(__m128d __W, __mmask8 __U, __m128d __A, __m128d __B) {
return (__m128d)__builtin_ia32_selectpd_128((__mmask8)__U,		return (__m128d)__builtin_ia32_selectpd_128((__mmask8)__U,
(__v2df)_mm_xor_pd(__A, __B),		(__v2df)_mm_xor_pd(__A, __B),
(__v2df)__W);		(__v2df)__W);
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_maskz_xor_pd (__mmask8 __U, __m128d __A, __m128d __B) {		_mm_maskz_xor_pd (__mmask8 __U, __m128d __A, __m128d __B) {
return (__m128d)__builtin_ia32_selectpd_128((__mmask8)__U,		return (__m128d)__builtin_ia32_selectpd_128((__mmask8)__U,
(__v2df)_mm_xor_pd(__A, __B),		(__v2df)_mm_xor_pd(__A, __B),
(__v2df)_mm_setzero_pd());		(__v2df)_mm_setzero_pd());
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_mask_xor_ps(__m256 __W, __mmask8 __U, __m256 __A, __m256 __B) {		_mm256_mask_xor_ps(__m256 __W, __mmask8 __U, __m256 __A, __m256 __B) {
return (__m256)__builtin_ia32_selectps_256((__mmask8)__U,		return (__m256)__builtin_ia32_selectps_256((__mmask8)__U,
(__v8sf)_mm256_xor_ps(__A, __B),		(__v8sf)_mm256_xor_ps(__A, __B),
(__v8sf)__W);		(__v8sf)__W);
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_maskz_xor_ps(__mmask8 __U, __m256 __A, __m256 __B) {		_mm256_maskz_xor_ps(__mmask8 __U, __m256 __A, __m256 __B) {
return (__m256)__builtin_ia32_selectps_256((__mmask8)__U,		return (__m256)__builtin_ia32_selectps_256((__mmask8)__U,
(__v8sf)_mm256_xor_ps(__A, __B),		(__v8sf)_mm256_xor_ps(__A, __B),
(__v8sf)_mm256_setzero_ps());		(__v8sf)_mm256_setzero_ps());
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_mask_xor_ps(__m128 __W, __mmask8 __U, __m128 __A, __m128 __B) {		_mm_mask_xor_ps(__m128 __W, __mmask8 __U, __m128 __A, __m128 __B) {
return (__m128)__builtin_ia32_selectps_128((__mmask8)__U,		return (__m128)__builtin_ia32_selectps_128((__mmask8)__U,
(__v4sf)_mm_xor_ps(__A, __B),		(__v4sf)_mm_xor_ps(__A, __B),
(__v4sf)__W);		(__v4sf)__W);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_maskz_xor_ps(__mmask8 __U, __m128 __A, __m128 __B) {		_mm_maskz_xor_ps(__mmask8 __U, __m128 __A, __m128 __B) {
return (__m128)__builtin_ia32_selectps_128((__mmask8)__U,		return (__m128)__builtin_ia32_selectps_128((__mmask8)__U,
(__v4sf)_mm_xor_ps(__A, __B),		(__v4sf)_mm_xor_ps(__A, __B),
(__v4sf)_mm_setzero_ps());		(__v4sf)_mm_setzero_ps());
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_mask_or_pd(__m256d __W, __mmask8 __U, __m256d __A, __m256d __B) {		_mm256_mask_or_pd(__m256d __W, __mmask8 __U, __m256d __A, __m256d __B) {
return (__m256d)__builtin_ia32_selectpd_256((__mmask8)__U,		return (__m256d)__builtin_ia32_selectpd_256((__mmask8)__U,
(__v4df)_mm256_or_pd(__A, __B),		(__v4df)_mm256_or_pd(__A, __B),
(__v4df)__W);		(__v4df)__W);
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_maskz_or_pd(__mmask8 __U, __m256d __A, __m256d __B) {		_mm256_maskz_or_pd(__mmask8 __U, __m256d __A, __m256d __B) {
return (__m256d)__builtin_ia32_selectpd_256((__mmask8)__U,		return (__m256d)__builtin_ia32_selectpd_256((__mmask8)__U,
(__v4df)_mm256_or_pd(__A, __B),		(__v4df)_mm256_or_pd(__A, __B),
(__v4df)_mm256_setzero_pd());		(__v4df)_mm256_setzero_pd());
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_mask_or_pd(__m128d __W, __mmask8 __U, __m128d __A, __m128d __B) {		_mm_mask_or_pd(__m128d __W, __mmask8 __U, __m128d __A, __m128d __B) {
return (__m128d)__builtin_ia32_selectpd_128((__mmask8)__U,		return (__m128d)__builtin_ia32_selectpd_128((__mmask8)__U,
(__v2df)_mm_or_pd(__A, __B),		(__v2df)_mm_or_pd(__A, __B),
(__v2df)__W);		(__v2df)__W);
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_maskz_or_pd(__mmask8 __U, __m128d __A, __m128d __B) {		_mm_maskz_or_pd(__mmask8 __U, __m128d __A, __m128d __B) {
return (__m128d)__builtin_ia32_selectpd_128((__mmask8)__U,		return (__m128d)__builtin_ia32_selectpd_128((__mmask8)__U,
(__v2df)_mm_or_pd(__A, __B),		(__v2df)_mm_or_pd(__A, __B),
(__v2df)_mm_setzero_pd());		(__v2df)_mm_setzero_pd());
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_mask_or_ps(__m256 __W, __mmask8 __U, __m256 __A, __m256 __B) {		_mm256_mask_or_ps(__m256 __W, __mmask8 __U, __m256 __A, __m256 __B) {
return (__m256)__builtin_ia32_selectps_256((__mmask8)__U,		return (__m256)__builtin_ia32_selectps_256((__mmask8)__U,
(__v8sf)_mm256_or_ps(__A, __B),		(__v8sf)_mm256_or_ps(__A, __B),
(__v8sf)__W);		(__v8sf)__W);
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_maskz_or_ps(__mmask8 __U, __m256 __A, __m256 __B) {		_mm256_maskz_or_ps(__mmask8 __U, __m256 __A, __m256 __B) {
return (__m256)__builtin_ia32_selectps_256((__mmask8)__U,		return (__m256)__builtin_ia32_selectps_256((__mmask8)__U,
(__v8sf)_mm256_or_ps(__A, __B),		(__v8sf)_mm256_or_ps(__A, __B),
(__v8sf)_mm256_setzero_ps());		(__v8sf)_mm256_setzero_ps());
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_mask_or_ps(__m128 __W, __mmask8 __U, __m128 __A, __m128 __B) {		_mm_mask_or_ps(__m128 __W, __mmask8 __U, __m128 __A, __m128 __B) {
return (__m128)__builtin_ia32_selectps_128((__mmask8)__U,		return (__m128)__builtin_ia32_selectps_128((__mmask8)__U,
(__v4sf)_mm_or_ps(__A, __B),		(__v4sf)_mm_or_ps(__A, __B),
(__v4sf)__W);		(__v4sf)__W);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_maskz_or_ps(__mmask8 __U, __m128 __A, __m128 __B) {		_mm_maskz_or_ps(__mmask8 __U, __m128 __A, __m128 __B) {
return (__m128)__builtin_ia32_selectps_128((__mmask8)__U,		return (__m128)__builtin_ia32_selectps_128((__mmask8)__U,
(__v4sf)_mm_or_ps(__A, __B),		(__v4sf)_mm_or_ps(__A, __B),
(__v4sf)_mm_setzero_ps());		(__v4sf)_mm_setzero_ps());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_cvtpd_epi64 (__m128d __A) {		_mm_cvtpd_epi64 (__m128d __A) {
return (__m128i) __builtin_ia32_cvtpd2qq128_mask ((__v2df) __A,		return (__m128i) __builtin_ia32_cvtpd2qq128_mask ((__v2df) __A,
(__v2di) _mm_setzero_si128(),		(__v2di) _mm_setzero_si128(),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_cvtpd_epi64 (__m128i __W, __mmask8 __U, __m128d __A) {		_mm_mask_cvtpd_epi64 (__m128i __W, __mmask8 __U, __m128d __A) {
return (__m128i) __builtin_ia32_cvtpd2qq128_mask ((__v2df) __A,		return (__m128i) __builtin_ia32_cvtpd2qq128_mask ((__v2df) __A,
(__v2di) __W,		(__v2di) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_cvtpd_epi64 (__mmask8 __U, __m128d __A) {		_mm_maskz_cvtpd_epi64 (__mmask8 __U, __m128d __A) {
return (__m128i) __builtin_ia32_cvtpd2qq128_mask ((__v2df) __A,		return (__m128i) __builtin_ia32_cvtpd2qq128_mask ((__v2df) __A,
(__v2di) _mm_setzero_si128(),		(__v2di) _mm_setzero_si128(),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_cvtpd_epi64 (__m256d __A) {		_mm256_cvtpd_epi64 (__m256d __A) {
return (__m256i) __builtin_ia32_cvtpd2qq256_mask ((__v4df) __A,		return (__m256i) __builtin_ia32_cvtpd2qq256_mask ((__v4df) __A,
(__v4di) _mm256_setzero_si256(),		(__v4di) _mm256_setzero_si256(),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_cvtpd_epi64 (__m256i __W, __mmask8 __U, __m256d __A) {		_mm256_mask_cvtpd_epi64 (__m256i __W, __mmask8 __U, __m256d __A) {
return (__m256i) __builtin_ia32_cvtpd2qq256_mask ((__v4df) __A,		return (__m256i) __builtin_ia32_cvtpd2qq256_mask ((__v4df) __A,
(__v4di) __W,		(__v4di) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_cvtpd_epi64 (__mmask8 __U, __m256d __A) {		_mm256_maskz_cvtpd_epi64 (__mmask8 __U, __m256d __A) {
return (__m256i) __builtin_ia32_cvtpd2qq256_mask ((__v4df) __A,		return (__m256i) __builtin_ia32_cvtpd2qq256_mask ((__v4df) __A,
(__v4di) _mm256_setzero_si256(),		(__v4di) _mm256_setzero_si256(),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_cvtpd_epu64 (__m128d __A) {		_mm_cvtpd_epu64 (__m128d __A) {
return (__m128i) __builtin_ia32_cvtpd2uqq128_mask ((__v2df) __A,		return (__m128i) __builtin_ia32_cvtpd2uqq128_mask ((__v2df) __A,
(__v2di) _mm_setzero_si128(),		(__v2di) _mm_setzero_si128(),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_cvtpd_epu64 (__m128i __W, __mmask8 __U, __m128d __A) {		_mm_mask_cvtpd_epu64 (__m128i __W, __mmask8 __U, __m128d __A) {
return (__m128i) __builtin_ia32_cvtpd2uqq128_mask ((__v2df) __A,		return (__m128i) __builtin_ia32_cvtpd2uqq128_mask ((__v2df) __A,
(__v2di) __W,		(__v2di) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_cvtpd_epu64 (__mmask8 __U, __m128d __A) {		_mm_maskz_cvtpd_epu64 (__mmask8 __U, __m128d __A) {
return (__m128i) __builtin_ia32_cvtpd2uqq128_mask ((__v2df) __A,		return (__m128i) __builtin_ia32_cvtpd2uqq128_mask ((__v2df) __A,
(__v2di) _mm_setzero_si128(),		(__v2di) _mm_setzero_si128(),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_cvtpd_epu64 (__m256d __A) {		_mm256_cvtpd_epu64 (__m256d __A) {
return (__m256i) __builtin_ia32_cvtpd2uqq256_mask ((__v4df) __A,		return (__m256i) __builtin_ia32_cvtpd2uqq256_mask ((__v4df) __A,
(__v4di) _mm256_setzero_si256(),		(__v4di) _mm256_setzero_si256(),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_cvtpd_epu64 (__m256i __W, __mmask8 __U, __m256d __A) {		_mm256_mask_cvtpd_epu64 (__m256i __W, __mmask8 __U, __m256d __A) {
return (__m256i) __builtin_ia32_cvtpd2uqq256_mask ((__v4df) __A,		return (__m256i) __builtin_ia32_cvtpd2uqq256_mask ((__v4df) __A,
(__v4di) __W,		(__v4di) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_cvtpd_epu64 (__mmask8 __U, __m256d __A) {		_mm256_maskz_cvtpd_epu64 (__mmask8 __U, __m256d __A) {
return (__m256i) __builtin_ia32_cvtpd2uqq256_mask ((__v4df) __A,		return (__m256i) __builtin_ia32_cvtpd2uqq256_mask ((__v4df) __A,
(__v4di) _mm256_setzero_si256(),		(__v4di) _mm256_setzero_si256(),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_cvtps_epi64 (__m128 __A) {		_mm_cvtps_epi64 (__m128 __A) {
return (__m128i) __builtin_ia32_cvtps2qq128_mask ((__v4sf) __A,		return (__m128i) __builtin_ia32_cvtps2qq128_mask ((__v4sf) __A,
(__v2di) _mm_setzero_si128(),		(__v2di) _mm_setzero_si128(),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_cvtps_epi64 (__m128i __W, __mmask8 __U, __m128 __A) {		_mm_mask_cvtps_epi64 (__m128i __W, __mmask8 __U, __m128 __A) {
return (__m128i) __builtin_ia32_cvtps2qq128_mask ((__v4sf) __A,		return (__m128i) __builtin_ia32_cvtps2qq128_mask ((__v4sf) __A,
(__v2di) __W,		(__v2di) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_cvtps_epi64 (__mmask8 __U, __m128 __A) {		_mm_maskz_cvtps_epi64 (__mmask8 __U, __m128 __A) {
return (__m128i) __builtin_ia32_cvtps2qq128_mask ((__v4sf) __A,		return (__m128i) __builtin_ia32_cvtps2qq128_mask ((__v4sf) __A,
(__v2di) _mm_setzero_si128(),		(__v2di) _mm_setzero_si128(),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_cvtps_epi64 (__m128 __A) {		_mm256_cvtps_epi64 (__m128 __A) {
return (__m256i) __builtin_ia32_cvtps2qq256_mask ((__v4sf) __A,		return (__m256i) __builtin_ia32_cvtps2qq256_mask ((__v4sf) __A,
(__v4di) _mm256_setzero_si256(),		(__v4di) _mm256_setzero_si256(),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_cvtps_epi64 (__m256i __W, __mmask8 __U, __m128 __A) {		_mm256_mask_cvtps_epi64 (__m256i __W, __mmask8 __U, __m128 __A) {
return (__m256i) __builtin_ia32_cvtps2qq256_mask ((__v4sf) __A,		return (__m256i) __builtin_ia32_cvtps2qq256_mask ((__v4sf) __A,
(__v4di) __W,		(__v4di) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_cvtps_epi64 (__mmask8 __U, __m128 __A) {		_mm256_maskz_cvtps_epi64 (__mmask8 __U, __m128 __A) {
return (__m256i) __builtin_ia32_cvtps2qq256_mask ((__v4sf) __A,		return (__m256i) __builtin_ia32_cvtps2qq256_mask ((__v4sf) __A,
(__v4di) _mm256_setzero_si256(),		(__v4di) _mm256_setzero_si256(),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_cvtps_epu64 (__m128 __A) {		_mm_cvtps_epu64 (__m128 __A) {
return (__m128i) __builtin_ia32_cvtps2uqq128_mask ((__v4sf) __A,		return (__m128i) __builtin_ia32_cvtps2uqq128_mask ((__v4sf) __A,
(__v2di) _mm_setzero_si128(),		(__v2di) _mm_setzero_si128(),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_cvtps_epu64 (__m128i __W, __mmask8 __U, __m128 __A) {		_mm_mask_cvtps_epu64 (__m128i __W, __mmask8 __U, __m128 __A) {
return (__m128i) __builtin_ia32_cvtps2uqq128_mask ((__v4sf) __A,		return (__m128i) __builtin_ia32_cvtps2uqq128_mask ((__v4sf) __A,
(__v2di) __W,		(__v2di) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_cvtps_epu64 (__mmask8 __U, __m128 __A) {		_mm_maskz_cvtps_epu64 (__mmask8 __U, __m128 __A) {
return (__m128i) __builtin_ia32_cvtps2uqq128_mask ((__v4sf) __A,		return (__m128i) __builtin_ia32_cvtps2uqq128_mask ((__v4sf) __A,
(__v2di) _mm_setzero_si128(),		(__v2di) _mm_setzero_si128(),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_cvtps_epu64 (__m128 __A) {		_mm256_cvtps_epu64 (__m128 __A) {
return (__m256i) __builtin_ia32_cvtps2uqq256_mask ((__v4sf) __A,		return (__m256i) __builtin_ia32_cvtps2uqq256_mask ((__v4sf) __A,
(__v4di) _mm256_setzero_si256(),		(__v4di) _mm256_setzero_si256(),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_cvtps_epu64 (__m256i __W, __mmask8 __U, __m128 __A) {		_mm256_mask_cvtps_epu64 (__m256i __W, __mmask8 __U, __m128 __A) {
return (__m256i) __builtin_ia32_cvtps2uqq256_mask ((__v4sf) __A,		return (__m256i) __builtin_ia32_cvtps2uqq256_mask ((__v4sf) __A,
(__v4di) __W,		(__v4di) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_cvtps_epu64 (__mmask8 __U, __m128 __A) {		_mm256_maskz_cvtps_epu64 (__mmask8 __U, __m128 __A) {
return (__m256i) __builtin_ia32_cvtps2uqq256_mask ((__v4sf) __A,		return (__m256i) __builtin_ia32_cvtps2uqq256_mask ((__v4sf) __A,
(__v4di) _mm256_setzero_si256(),		(__v4di) _mm256_setzero_si256(),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_cvtepi64_pd (__m128i __A) {		_mm_cvtepi64_pd (__m128i __A) {
return (__m128d)__builtin_convertvector((__v2di)__A, __v2df);		return (__m128d)__builtin_convertvector((__v2di)__A, __v2df);
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_mask_cvtepi64_pd (__m128d __W, __mmask8 __U, __m128i __A) {		_mm_mask_cvtepi64_pd (__m128d __W, __mmask8 __U, __m128i __A) {
return (__m128d)__builtin_ia32_selectpd_128((__mmask8)__U,		return (__m128d)__builtin_ia32_selectpd_128((__mmask8)__U,
(__v2df)_mm_cvtepi64_pd(__A),		(__v2df)_mm_cvtepi64_pd(__A),
(__v2df)__W);		(__v2df)__W);
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_maskz_cvtepi64_pd (__mmask8 __U, __m128i __A) {		_mm_maskz_cvtepi64_pd (__mmask8 __U, __m128i __A) {
return (__m128d)__builtin_ia32_selectpd_128((__mmask8)__U,		return (__m128d)__builtin_ia32_selectpd_128((__mmask8)__U,
(__v2df)_mm_cvtepi64_pd(__A),		(__v2df)_mm_cvtepi64_pd(__A),
(__v2df)_mm_setzero_pd());		(__v2df)_mm_setzero_pd());
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_cvtepi64_pd (__m256i __A) {		_mm256_cvtepi64_pd (__m256i __A) {
return (__m256d)__builtin_convertvector((__v4di)__A, __v4df);		return (__m256d)__builtin_convertvector((__v4di)__A, __v4df);
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_mask_cvtepi64_pd (__m256d __W, __mmask8 __U, __m256i __A) {		_mm256_mask_cvtepi64_pd (__m256d __W, __mmask8 __U, __m256i __A) {
return (__m256d)__builtin_ia32_selectpd_256((__mmask8)__U,		return (__m256d)__builtin_ia32_selectpd_256((__mmask8)__U,
(__v4df)_mm256_cvtepi64_pd(__A),		(__v4df)_mm256_cvtepi64_pd(__A),
(__v4df)__W);		(__v4df)__W);
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_maskz_cvtepi64_pd (__mmask8 __U, __m256i __A) {		_mm256_maskz_cvtepi64_pd (__mmask8 __U, __m256i __A) {
return (__m256d)__builtin_ia32_selectpd_256((__mmask8)__U,		return (__m256d)__builtin_ia32_selectpd_256((__mmask8)__U,
(__v4df)_mm256_cvtepi64_pd(__A),		(__v4df)_mm256_cvtepi64_pd(__A),
(__v4df)_mm256_setzero_pd());		(__v4df)_mm256_setzero_pd());
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_cvtepi64_ps (__m128i __A) {		_mm_cvtepi64_ps (__m128i __A) {
return (__m128) __builtin_ia32_cvtqq2ps128_mask ((__v2di) __A,		return (__m128) __builtin_ia32_cvtqq2ps128_mask ((__v2di) __A,
(__v4sf) _mm_setzero_ps(),		(__v4sf) _mm_setzero_ps(),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_mask_cvtepi64_ps (__m128 __W, __mmask8 __U, __m128i __A) {		_mm_mask_cvtepi64_ps (__m128 __W, __mmask8 __U, __m128i __A) {
return (__m128) __builtin_ia32_cvtqq2ps128_mask ((__v2di) __A,		return (__m128) __builtin_ia32_cvtqq2ps128_mask ((__v2di) __A,
(__v4sf) __W,		(__v4sf) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_maskz_cvtepi64_ps (__mmask8 __U, __m128i __A) {		_mm_maskz_cvtepi64_ps (__mmask8 __U, __m128i __A) {
return (__m128) __builtin_ia32_cvtqq2ps128_mask ((__v2di) __A,		return (__m128) __builtin_ia32_cvtqq2ps128_mask ((__v2di) __A,
(__v4sf) _mm_setzero_ps(),		(__v4sf) _mm_setzero_ps(),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS256
_mm256_cvtepi64_ps (__m256i __A) {		_mm256_cvtepi64_ps (__m256i __A) {
return (__m128) __builtin_ia32_cvtqq2ps256_mask ((__v4di) __A,		return (__m128) __builtin_ia32_cvtqq2ps256_mask ((__v4di) __A,
(__v4sf) _mm_setzero_ps(),		(__v4sf) _mm_setzero_ps(),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS256
_mm256_mask_cvtepi64_ps (__m128 __W, __mmask8 __U, __m256i __A) {		_mm256_mask_cvtepi64_ps (__m128 __W, __mmask8 __U, __m256i __A) {
return (__m128) __builtin_ia32_cvtqq2ps256_mask ((__v4di) __A,		return (__m128) __builtin_ia32_cvtqq2ps256_mask ((__v4di) __A,
(__v4sf) __W,		(__v4sf) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS256
_mm256_maskz_cvtepi64_ps (__mmask8 __U, __m256i __A) {		_mm256_maskz_cvtepi64_ps (__mmask8 __U, __m256i __A) {
return (__m128) __builtin_ia32_cvtqq2ps256_mask ((__v4di) __A,		return (__m128) __builtin_ia32_cvtqq2ps256_mask ((__v4di) __A,
(__v4sf) _mm_setzero_ps(),		(__v4sf) _mm_setzero_ps(),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_cvttpd_epi64 (__m128d __A) {		_mm_cvttpd_epi64 (__m128d __A) {
return (__m128i) __builtin_ia32_cvttpd2qq128_mask ((__v2df) __A,		return (__m128i) __builtin_ia32_cvttpd2qq128_mask ((__v2df) __A,
(__v2di) _mm_setzero_si128(),		(__v2di) _mm_setzero_si128(),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_cvttpd_epi64 (__m128i __W, __mmask8 __U, __m128d __A) {		_mm_mask_cvttpd_epi64 (__m128i __W, __mmask8 __U, __m128d __A) {
return (__m128i) __builtin_ia32_cvttpd2qq128_mask ((__v2df) __A,		return (__m128i) __builtin_ia32_cvttpd2qq128_mask ((__v2df) __A,
(__v2di) __W,		(__v2di) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_cvttpd_epi64 (__mmask8 __U, __m128d __A) {		_mm_maskz_cvttpd_epi64 (__mmask8 __U, __m128d __A) {
return (__m128i) __builtin_ia32_cvttpd2qq128_mask ((__v2df) __A,		return (__m128i) __builtin_ia32_cvttpd2qq128_mask ((__v2df) __A,
(__v2di) _mm_setzero_si128(),		(__v2di) _mm_setzero_si128(),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_cvttpd_epi64 (__m256d __A) {		_mm256_cvttpd_epi64 (__m256d __A) {
return (__m256i) __builtin_ia32_cvttpd2qq256_mask ((__v4df) __A,		return (__m256i) __builtin_ia32_cvttpd2qq256_mask ((__v4df) __A,
(__v4di) _mm256_setzero_si256(),		(__v4di) _mm256_setzero_si256(),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_cvttpd_epi64 (__m256i __W, __mmask8 __U, __m256d __A) {		_mm256_mask_cvttpd_epi64 (__m256i __W, __mmask8 __U, __m256d __A) {
return (__m256i) __builtin_ia32_cvttpd2qq256_mask ((__v4df) __A,		return (__m256i) __builtin_ia32_cvttpd2qq256_mask ((__v4df) __A,
(__v4di) __W,		(__v4di) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_cvttpd_epi64 (__mmask8 __U, __m256d __A) {		_mm256_maskz_cvttpd_epi64 (__mmask8 __U, __m256d __A) {
return (__m256i) __builtin_ia32_cvttpd2qq256_mask ((__v4df) __A,		return (__m256i) __builtin_ia32_cvttpd2qq256_mask ((__v4df) __A,
(__v4di) _mm256_setzero_si256(),		(__v4di) _mm256_setzero_si256(),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_cvttpd_epu64 (__m128d __A) {		_mm_cvttpd_epu64 (__m128d __A) {
return (__m128i) __builtin_ia32_cvttpd2uqq128_mask ((__v2df) __A,		return (__m128i) __builtin_ia32_cvttpd2uqq128_mask ((__v2df) __A,
(__v2di) _mm_setzero_si128(),		(__v2di) _mm_setzero_si128(),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_cvttpd_epu64 (__m128i __W, __mmask8 __U, __m128d __A) {		_mm_mask_cvttpd_epu64 (__m128i __W, __mmask8 __U, __m128d __A) {
return (__m128i) __builtin_ia32_cvttpd2uqq128_mask ((__v2df) __A,		return (__m128i) __builtin_ia32_cvttpd2uqq128_mask ((__v2df) __A,
(__v2di) __W,		(__v2di) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_cvttpd_epu64 (__mmask8 __U, __m128d __A) {		_mm_maskz_cvttpd_epu64 (__mmask8 __U, __m128d __A) {
return (__m128i) __builtin_ia32_cvttpd2uqq128_mask ((__v2df) __A,		return (__m128i) __builtin_ia32_cvttpd2uqq128_mask ((__v2df) __A,
(__v2di) _mm_setzero_si128(),		(__v2di) _mm_setzero_si128(),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_cvttpd_epu64 (__m256d __A) {		_mm256_cvttpd_epu64 (__m256d __A) {
return (__m256i) __builtin_ia32_cvttpd2uqq256_mask ((__v4df) __A,		return (__m256i) __builtin_ia32_cvttpd2uqq256_mask ((__v4df) __A,
(__v4di) _mm256_setzero_si256(),		(__v4di) _mm256_setzero_si256(),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_cvttpd_epu64 (__m256i __W, __mmask8 __U, __m256d __A) {		_mm256_mask_cvttpd_epu64 (__m256i __W, __mmask8 __U, __m256d __A) {
return (__m256i) __builtin_ia32_cvttpd2uqq256_mask ((__v4df) __A,		return (__m256i) __builtin_ia32_cvttpd2uqq256_mask ((__v4df) __A,
(__v4di) __W,		(__v4di) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_cvttpd_epu64 (__mmask8 __U, __m256d __A) {		_mm256_maskz_cvttpd_epu64 (__mmask8 __U, __m256d __A) {
return (__m256i) __builtin_ia32_cvttpd2uqq256_mask ((__v4df) __A,		return (__m256i) __builtin_ia32_cvttpd2uqq256_mask ((__v4df) __A,
(__v4di) _mm256_setzero_si256(),		(__v4di) _mm256_setzero_si256(),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_cvttps_epi64 (__m128 __A) {		_mm_cvttps_epi64 (__m128 __A) {
return (__m128i) __builtin_ia32_cvttps2qq128_mask ((__v4sf) __A,		return (__m128i) __builtin_ia32_cvttps2qq128_mask ((__v4sf) __A,
(__v2di) _mm_setzero_si128(),		(__v2di) _mm_setzero_si128(),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_cvttps_epi64 (__m128i __W, __mmask8 __U, __m128 __A) {		_mm_mask_cvttps_epi64 (__m128i __W, __mmask8 __U, __m128 __A) {
return (__m128i) __builtin_ia32_cvttps2qq128_mask ((__v4sf) __A,		return (__m128i) __builtin_ia32_cvttps2qq128_mask ((__v4sf) __A,
(__v2di) __W,		(__v2di) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_cvttps_epi64 (__mmask8 __U, __m128 __A) {		_mm_maskz_cvttps_epi64 (__mmask8 __U, __m128 __A) {
return (__m128i) __builtin_ia32_cvttps2qq128_mask ((__v4sf) __A,		return (__m128i) __builtin_ia32_cvttps2qq128_mask ((__v4sf) __A,
(__v2di) _mm_setzero_si128(),		(__v2di) _mm_setzero_si128(),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_cvttps_epi64 (__m128 __A) {		_mm256_cvttps_epi64 (__m128 __A) {
return (__m256i) __builtin_ia32_cvttps2qq256_mask ((__v4sf) __A,		return (__m256i) __builtin_ia32_cvttps2qq256_mask ((__v4sf) __A,
(__v4di) _mm256_setzero_si256(),		(__v4di) _mm256_setzero_si256(),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_cvttps_epi64 (__m256i __W, __mmask8 __U, __m128 __A) {		_mm256_mask_cvttps_epi64 (__m256i __W, __mmask8 __U, __m128 __A) {
return (__m256i) __builtin_ia32_cvttps2qq256_mask ((__v4sf) __A,		return (__m256i) __builtin_ia32_cvttps2qq256_mask ((__v4sf) __A,
(__v4di) __W,		(__v4di) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_cvttps_epi64 (__mmask8 __U, __m128 __A) {		_mm256_maskz_cvttps_epi64 (__mmask8 __U, __m128 __A) {
return (__m256i) __builtin_ia32_cvttps2qq256_mask ((__v4sf) __A,		return (__m256i) __builtin_ia32_cvttps2qq256_mask ((__v4sf) __A,
(__v4di) _mm256_setzero_si256(),		(__v4di) _mm256_setzero_si256(),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_cvttps_epu64 (__m128 __A) {		_mm_cvttps_epu64 (__m128 __A) {
return (__m128i) __builtin_ia32_cvttps2uqq128_mask ((__v4sf) __A,		return (__m128i) __builtin_ia32_cvttps2uqq128_mask ((__v4sf) __A,
(__v2di) _mm_setzero_si128(),		(__v2di) _mm_setzero_si128(),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_cvttps_epu64 (__m128i __W, __mmask8 __U, __m128 __A) {		_mm_mask_cvttps_epu64 (__m128i __W, __mmask8 __U, __m128 __A) {
return (__m128i) __builtin_ia32_cvttps2uqq128_mask ((__v4sf) __A,		return (__m128i) __builtin_ia32_cvttps2uqq128_mask ((__v4sf) __A,
(__v2di) __W,		(__v2di) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_cvttps_epu64 (__mmask8 __U, __m128 __A) {		_mm_maskz_cvttps_epu64 (__mmask8 __U, __m128 __A) {
return (__m128i) __builtin_ia32_cvttps2uqq128_mask ((__v4sf) __A,		return (__m128i) __builtin_ia32_cvttps2uqq128_mask ((__v4sf) __A,
(__v2di) _mm_setzero_si128(),		(__v2di) _mm_setzero_si128(),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_cvttps_epu64 (__m128 __A) {		_mm256_cvttps_epu64 (__m128 __A) {
return (__m256i) __builtin_ia32_cvttps2uqq256_mask ((__v4sf) __A,		return (__m256i) __builtin_ia32_cvttps2uqq256_mask ((__v4sf) __A,
(__v4di) _mm256_setzero_si256(),		(__v4di) _mm256_setzero_si256(),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_cvttps_epu64 (__m256i __W, __mmask8 __U, __m128 __A) {		_mm256_mask_cvttps_epu64 (__m256i __W, __mmask8 __U, __m128 __A) {
return (__m256i) __builtin_ia32_cvttps2uqq256_mask ((__v4sf) __A,		return (__m256i) __builtin_ia32_cvttps2uqq256_mask ((__v4sf) __A,
(__v4di) __W,		(__v4di) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_cvttps_epu64 (__mmask8 __U, __m128 __A) {		_mm256_maskz_cvttps_epu64 (__mmask8 __U, __m128 __A) {
return (__m256i) __builtin_ia32_cvttps2uqq256_mask ((__v4sf) __A,		return (__m256i) __builtin_ia32_cvttps2uqq256_mask ((__v4sf) __A,
(__v4di) _mm256_setzero_si256(),		(__v4di) _mm256_setzero_si256(),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_cvtepu64_pd (__m128i __A) {		_mm_cvtepu64_pd (__m128i __A) {
return (__m128d)__builtin_convertvector((__v2du)__A, __v2df);		return (__m128d)__builtin_convertvector((__v2du)__A, __v2df);
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_mask_cvtepu64_pd (__m128d __W, __mmask8 __U, __m128i __A) {		_mm_mask_cvtepu64_pd (__m128d __W, __mmask8 __U, __m128i __A) {
return (__m128d)__builtin_ia32_selectpd_128((__mmask8)__U,		return (__m128d)__builtin_ia32_selectpd_128((__mmask8)__U,
(__v2df)_mm_cvtepu64_pd(__A),		(__v2df)_mm_cvtepu64_pd(__A),
(__v2df)__W);		(__v2df)__W);
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_maskz_cvtepu64_pd (__mmask8 __U, __m128i __A) {		_mm_maskz_cvtepu64_pd (__mmask8 __U, __m128i __A) {
return (__m128d)__builtin_ia32_selectpd_128((__mmask8)__U,		return (__m128d)__builtin_ia32_selectpd_128((__mmask8)__U,
(__v2df)_mm_cvtepu64_pd(__A),		(__v2df)_mm_cvtepu64_pd(__A),
(__v2df)_mm_setzero_pd());		(__v2df)_mm_setzero_pd());
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_cvtepu64_pd (__m256i __A) {		_mm256_cvtepu64_pd (__m256i __A) {
return (__m256d)__builtin_convertvector((__v4du)__A, __v4df);		return (__m256d)__builtin_convertvector((__v4du)__A, __v4df);
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_mask_cvtepu64_pd (__m256d __W, __mmask8 __U, __m256i __A) {		_mm256_mask_cvtepu64_pd (__m256d __W, __mmask8 __U, __m256i __A) {
return (__m256d)__builtin_ia32_selectpd_256((__mmask8)__U,		return (__m256d)__builtin_ia32_selectpd_256((__mmask8)__U,
(__v4df)_mm256_cvtepu64_pd(__A),		(__v4df)_mm256_cvtepu64_pd(__A),
(__v4df)__W);		(__v4df)__W);
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_maskz_cvtepu64_pd (__mmask8 __U, __m256i __A) {		_mm256_maskz_cvtepu64_pd (__mmask8 __U, __m256i __A) {
return (__m256d)__builtin_ia32_selectpd_256((__mmask8)__U,		return (__m256d)__builtin_ia32_selectpd_256((__mmask8)__U,
(__v4df)_mm256_cvtepu64_pd(__A),		(__v4df)_mm256_cvtepu64_pd(__A),
(__v4df)_mm256_setzero_pd());		(__v4df)_mm256_setzero_pd());
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_cvtepu64_ps (__m128i __A) {		_mm_cvtepu64_ps (__m128i __A) {
return (__m128) __builtin_ia32_cvtuqq2ps128_mask ((__v2di) __A,		return (__m128) __builtin_ia32_cvtuqq2ps128_mask ((__v2di) __A,
(__v4sf) _mm_setzero_ps(),		(__v4sf) _mm_setzero_ps(),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_mask_cvtepu64_ps (__m128 __W, __mmask8 __U, __m128i __A) {		_mm_mask_cvtepu64_ps (__m128 __W, __mmask8 __U, __m128i __A) {
return (__m128) __builtin_ia32_cvtuqq2ps128_mask ((__v2di) __A,		return (__m128) __builtin_ia32_cvtuqq2ps128_mask ((__v2di) __A,
(__v4sf) __W,		(__v4sf) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_maskz_cvtepu64_ps (__mmask8 __U, __m128i __A) {		_mm_maskz_cvtepu64_ps (__mmask8 __U, __m128i __A) {
return (__m128) __builtin_ia32_cvtuqq2ps128_mask ((__v2di) __A,		return (__m128) __builtin_ia32_cvtuqq2ps128_mask ((__v2di) __A,
(__v4sf) _mm_setzero_ps(),		(__v4sf) _mm_setzero_ps(),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS256
_mm256_cvtepu64_ps (__m256i __A) {		_mm256_cvtepu64_ps (__m256i __A) {
return (__m128) __builtin_ia32_cvtuqq2ps256_mask ((__v4di) __A,		return (__m128) __builtin_ia32_cvtuqq2ps256_mask ((__v4di) __A,
(__v4sf) _mm_setzero_ps(),		(__v4sf) _mm_setzero_ps(),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS256
_mm256_mask_cvtepu64_ps (__m128 __W, __mmask8 __U, __m256i __A) {		_mm256_mask_cvtepu64_ps (__m128 __W, __mmask8 __U, __m256i __A) {
return (__m128) __builtin_ia32_cvtuqq2ps256_mask ((__v4di) __A,		return (__m128) __builtin_ia32_cvtuqq2ps256_mask ((__v4di) __A,
(__v4sf) __W,		(__v4sf) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS256
_mm256_maskz_cvtepu64_ps (__mmask8 __U, __m256i __A) {		_mm256_maskz_cvtepu64_ps (__mmask8 __U, __m256i __A) {
return (__m128) __builtin_ia32_cvtuqq2ps256_mask ((__v4di) __A,		return (__m128) __builtin_ia32_cvtuqq2ps256_mask ((__v4di) __A,
(__v4sf) _mm_setzero_ps(),		(__v4sf) _mm_setzero_ps(),
(__mmask8) __U);		(__mmask8) __U);
}		}

#define _mm_range_pd(A, B, C) \		#define _mm_range_pd(A, B, C) \
(__m128d)__builtin_ia32_rangepd128_mask((__v2df)(__m128d)(A), \		(__m128d)__builtin_ia32_rangepd128_mask((__v2df)(__m128d)(A), \
▲ Show 20 Lines • Show All 120 Lines • ▼ Show 20 Lines	(__m256)__builtin_ia32_reduceps256_mask((__v8sf)(__m256)(A), (int)(B), \
(__v8sf)(__m256)(W), \		(__v8sf)(__m256)(W), \
(__mmask8)(U))		(__mmask8)(U))

#define _mm256_maskz_reduce_ps(U, A, B) \		#define _mm256_maskz_reduce_ps(U, A, B) \
(__m256)__builtin_ia32_reduceps256_mask((__v8sf)(__m256)(A), (int)(B), \		(__m256)__builtin_ia32_reduceps256_mask((__v8sf)(__m256)(A), (int)(B), \
(__v8sf)_mm256_setzero_ps(), \		(__v8sf)_mm256_setzero_ps(), \
(__mmask8)(U))		(__mmask8)(U))

static __inline__ __mmask8 __DEFAULT_FN_ATTRS		static __inline__ __mmask8 __DEFAULT_FN_ATTRS128
_mm_movepi32_mask (__m128i __A)		_mm_movepi32_mask (__m128i __A)
{		{
return (__mmask8) __builtin_ia32_cvtd2mask128 ((__v4si) __A);		return (__mmask8) __builtin_ia32_cvtd2mask128 ((__v4si) __A);
}		}

static __inline__ __mmask8 __DEFAULT_FN_ATTRS		static __inline__ __mmask8 __DEFAULT_FN_ATTRS256
_mm256_movepi32_mask (__m256i __A)		_mm256_movepi32_mask (__m256i __A)
{		{
return (__mmask8) __builtin_ia32_cvtd2mask256 ((__v8si) __A);		return (__mmask8) __builtin_ia32_cvtd2mask256 ((__v8si) __A);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_movm_epi32 (__mmask8 __A)		_mm_movm_epi32 (__mmask8 __A)
{		{
return (__m128i) __builtin_ia32_cvtmask2d128 (__A);		return (__m128i) __builtin_ia32_cvtmask2d128 (__A);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_movm_epi32 (__mmask8 __A)		_mm256_movm_epi32 (__mmask8 __A)
{		{
return (__m256i) __builtin_ia32_cvtmask2d256 (__A);		return (__m256i) __builtin_ia32_cvtmask2d256 (__A);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_movm_epi64 (__mmask8 __A)		_mm_movm_epi64 (__mmask8 __A)
{		{
return (__m128i) __builtin_ia32_cvtmask2q128 (__A);		return (__m128i) __builtin_ia32_cvtmask2q128 (__A);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_movm_epi64 (__mmask8 __A)		_mm256_movm_epi64 (__mmask8 __A)
{		{
return (__m256i) __builtin_ia32_cvtmask2q256 (__A);		return (__m256i) __builtin_ia32_cvtmask2q256 (__A);
}		}

static __inline__ __mmask8 __DEFAULT_FN_ATTRS		static __inline__ __mmask8 __DEFAULT_FN_ATTRS128
_mm_movepi64_mask (__m128i __A)		_mm_movepi64_mask (__m128i __A)
{		{
return (__mmask8) __builtin_ia32_cvtq2mask128 ((__v2di) __A);		return (__mmask8) __builtin_ia32_cvtq2mask128 ((__v2di) __A);
}		}

static __inline__ __mmask8 __DEFAULT_FN_ATTRS		static __inline__ __mmask8 __DEFAULT_FN_ATTRS256
_mm256_movepi64_mask (__m256i __A)		_mm256_movepi64_mask (__m256i __A)
{		{
return (__mmask8) __builtin_ia32_cvtq2mask256 ((__v4di) __A);		return (__mmask8) __builtin_ia32_cvtq2mask256 ((__v4di) __A);
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_broadcast_f32x2 (__m128 __A)		_mm256_broadcast_f32x2 (__m128 __A)
{		{
return (__m256)__builtin_shufflevector((__v4sf)__A, (__v4sf)__A,		return (__m256)__builtin_shufflevector((__v4sf)__A, (__v4sf)__A,
0, 1, 0, 1, 0, 1, 0, 1);		0, 1, 0, 1, 0, 1, 0, 1);
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_mask_broadcast_f32x2 (__m256 __O, __mmask8 __M, __m128 __A)		_mm256_mask_broadcast_f32x2 (__m256 __O, __mmask8 __M, __m128 __A)
{		{
return (__m256)__builtin_ia32_selectps_256((__mmask8)__M,		return (__m256)__builtin_ia32_selectps_256((__mmask8)__M,
(__v8sf)_mm256_broadcast_f32x2(__A),		(__v8sf)_mm256_broadcast_f32x2(__A),
(__v8sf)__O);		(__v8sf)__O);
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_maskz_broadcast_f32x2 (__mmask8 __M, __m128 __A)		_mm256_maskz_broadcast_f32x2 (__mmask8 __M, __m128 __A)
{		{
return (__m256)__builtin_ia32_selectps_256((__mmask8)__M,		return (__m256)__builtin_ia32_selectps_256((__mmask8)__M,
(__v8sf)_mm256_broadcast_f32x2(__A),		(__v8sf)_mm256_broadcast_f32x2(__A),
(__v8sf)_mm256_setzero_ps());		(__v8sf)_mm256_setzero_ps());
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_broadcast_f64x2(__m128d __A)		_mm256_broadcast_f64x2(__m128d __A)
{		{
return (__m256d)__builtin_shufflevector((__v2df)__A, (__v2df)__A,		return (__m256d)__builtin_shufflevector((__v2df)__A, (__v2df)__A,
0, 1, 0, 1);		0, 1, 0, 1);
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_mask_broadcast_f64x2(__m256d __O, __mmask8 __M, __m128d __A)		_mm256_mask_broadcast_f64x2(__m256d __O, __mmask8 __M, __m128d __A)
{		{
return (__m256d)__builtin_ia32_selectpd_256((__mmask8)__M,		return (__m256d)__builtin_ia32_selectpd_256((__mmask8)__M,
(__v4df)_mm256_broadcast_f64x2(__A),		(__v4df)_mm256_broadcast_f64x2(__A),
(__v4df)__O);		(__v4df)__O);
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_maskz_broadcast_f64x2 (__mmask8 __M, __m128d __A)		_mm256_maskz_broadcast_f64x2 (__mmask8 __M, __m128d __A)
{		{
return (__m256d)__builtin_ia32_selectpd_256((__mmask8)__M,		return (__m256d)__builtin_ia32_selectpd_256((__mmask8)__M,
(__v4df)_mm256_broadcast_f64x2(__A),		(__v4df)_mm256_broadcast_f64x2(__A),
(__v4df)_mm256_setzero_pd());		(__v4df)_mm256_setzero_pd());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_broadcast_i32x2 (__m128i __A)		_mm_broadcast_i32x2 (__m128i __A)
{		{
return (__m128i)__builtin_shufflevector((__v4si)__A, (__v4si)__A,		return (__m128i)__builtin_shufflevector((__v4si)__A, (__v4si)__A,
0, 1, 0, 1);		0, 1, 0, 1);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_broadcast_i32x2 (__m128i __O, __mmask8 __M, __m128i __A)		_mm_mask_broadcast_i32x2 (__m128i __O, __mmask8 __M, __m128i __A)
{		{
return (__m128i)__builtin_ia32_selectd_128((__mmask8)__M,		return (__m128i)__builtin_ia32_selectd_128((__mmask8)__M,
(__v4si)_mm_broadcast_i32x2(__A),		(__v4si)_mm_broadcast_i32x2(__A),
(__v4si)__O);		(__v4si)__O);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_broadcast_i32x2 (__mmask8 __M, __m128i __A)		_mm_maskz_broadcast_i32x2 (__mmask8 __M, __m128i __A)
{		{
return (__m128i)__builtin_ia32_selectd_128((__mmask8)__M,		return (__m128i)__builtin_ia32_selectd_128((__mmask8)__M,
(__v4si)_mm_broadcast_i32x2(__A),		(__v4si)_mm_broadcast_i32x2(__A),
(__v4si)_mm_setzero_si128());		(__v4si)_mm_setzero_si128());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_broadcast_i32x2 (__m128i __A)		_mm256_broadcast_i32x2 (__m128i __A)
{		{
return (__m256i)__builtin_shufflevector((__v4si)__A, (__v4si)__A,		return (__m256i)__builtin_shufflevector((__v4si)__A, (__v4si)__A,
0, 1, 0, 1, 0, 1, 0, 1);		0, 1, 0, 1, 0, 1, 0, 1);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_broadcast_i32x2 (__m256i __O, __mmask8 __M, __m128i __A)		_mm256_mask_broadcast_i32x2 (__m256i __O, __mmask8 __M, __m128i __A)
{		{
return (__m256i)__builtin_ia32_selectd_256((__mmask8)__M,		return (__m256i)__builtin_ia32_selectd_256((__mmask8)__M,
(__v8si)_mm256_broadcast_i32x2(__A),		(__v8si)_mm256_broadcast_i32x2(__A),
(__v8si)__O);		(__v8si)__O);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_broadcast_i32x2 (__mmask8 __M, __m128i __A)		_mm256_maskz_broadcast_i32x2 (__mmask8 __M, __m128i __A)
{		{
return (__m256i)__builtin_ia32_selectd_256((__mmask8)__M,		return (__m256i)__builtin_ia32_selectd_256((__mmask8)__M,
(__v8si)_mm256_broadcast_i32x2(__A),		(__v8si)_mm256_broadcast_i32x2(__A),
(__v8si)_mm256_setzero_si256());		(__v8si)_mm256_setzero_si256());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_broadcast_i64x2(__m128i __A)		_mm256_broadcast_i64x2(__m128i __A)
{		{
return (__m256i)__builtin_shufflevector((__v2di)__A, (__v2di)__A,		return (__m256i)__builtin_shufflevector((__v2di)__A, (__v2di)__A,
0, 1, 0, 1);		0, 1, 0, 1);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_broadcast_i64x2(__m256i __O, __mmask8 __M, __m128i __A)		_mm256_mask_broadcast_i64x2(__m256i __O, __mmask8 __M, __m128i __A)
{		{
return (__m256i)__builtin_ia32_selectq_256((__mmask8)__M,		return (__m256i)__builtin_ia32_selectq_256((__mmask8)__M,
(__v4di)_mm256_broadcast_i64x2(__A),		(__v4di)_mm256_broadcast_i64x2(__A),
(__v4di)__O);		(__v4di)__O);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_broadcast_i64x2 (__mmask8 __M, __m128i __A)		_mm256_maskz_broadcast_i64x2 (__mmask8 __M, __m128i __A)
{		{
return (__m256i)__builtin_ia32_selectq_256((__mmask8)__M,		return (__m256i)__builtin_ia32_selectq_256((__mmask8)__M,
(__v4di)_mm256_broadcast_i64x2(__A),		(__v4di)_mm256_broadcast_i64x2(__A),
(__v4di)_mm256_setzero_si256());		(__v4di)_mm256_setzero_si256());
}		}

#define _mm256_extractf64x2_pd(A, imm) \		#define _mm256_extractf64x2_pd(A, imm) \
▲ Show 20 Lines • Show All 87 Lines • ▼ Show 20 Lines
#define _mm256_mask_fpclass_ps_mask(U, A, imm) \		#define _mm256_mask_fpclass_ps_mask(U, A, imm) \
(__mmask8)__builtin_ia32_fpclassps256_mask((__v8sf)(__m256)(A), (int)(imm), \		(__mmask8)__builtin_ia32_fpclassps256_mask((__v8sf)(__m256)(A), (int)(imm), \
(__mmask8)(U))		(__mmask8)(U))

#define _mm256_fpclass_ps_mask(A, imm) \		#define _mm256_fpclass_ps_mask(A, imm) \
(__mmask8)__builtin_ia32_fpclassps256_mask((__v8sf)(__m256)(A), (int)(imm), \		(__mmask8)__builtin_ia32_fpclassps256_mask((__v8sf)(__m256)(A), (int)(imm), \
(__mmask8)-1)		(__mmask8)-1)

#undef __DEFAULT_FN_ATTRS		#undef __DEFAULT_FN_ATTRS128
		#undef __DEFAULT_FN_ATTRS256

#endif		#endif

lib/Headers/avx512vlintrin.h

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show All 22 Lines

#ifndef __IMMINTRIN_H		#ifndef __IMMINTRIN_H
#error "Never use <avx512vlintrin.h> directly; include <immintrin.h> instead."		#error "Never use <avx512vlintrin.h> directly; include <immintrin.h> instead."
#endif		#endif

#ifndef __AVX512VLINTRIN_H		#ifndef __AVX512VLINTRIN_H
#define __AVX512VLINTRIN_H		#define __AVX512VLINTRIN_H

#define __DEFAULT_FN_ATTRS __attribute__((__always_inline__, __nodebug__, __target__("avx512vl")))		#define __DEFAULT_FN_ATTRS128 __attribute__((__always_inline__, __nodebug__, __target__("avx512vl"), __min_vector_width__(128)))
		#define __DEFAULT_FN_ATTRS256 __attribute__((__always_inline__, __nodebug__, __target__("avx512vl"), __min_vector_width__(256)))

/* Integer compare */		/* Integer compare */

#define _mm_cmpeq_epi32_mask(A, B) \		#define _mm_cmpeq_epi32_mask(A, B) \
_mm_cmp_epi32_mask((A), (B), _MM_CMPINT_EQ)		_mm_cmp_epi32_mask((A), (B), _MM_CMPINT_EQ)
#define _mm_mask_cmpeq_epi32_mask(k, A, B) \		#define _mm_mask_cmpeq_epi32_mask(k, A, B) \
_mm_mask_cmp_epi32_mask((k), (A), (B), _MM_CMPINT_EQ)		_mm_mask_cmp_epi32_mask((k), (A), (B), _MM_CMPINT_EQ)
#define _mm_cmpge_epi32_mask(A, B) \		#define _mm_cmpge_epi32_mask(A, B) \
▲ Show 20 Lines • Show All 187 Lines • ▼ Show 20 Lines	#define _mm256_cmplt_epu64_mask(A, B) \
_mm256_cmp_epu64_mask((A), (B), _MM_CMPINT_LT)		_mm256_cmp_epu64_mask((A), (B), _MM_CMPINT_LT)
#define _mm256_mask_cmplt_epu64_mask(k, A, B) \		#define _mm256_mask_cmplt_epu64_mask(k, A, B) \
_mm256_mask_cmp_epu64_mask((k), (A), (B), _MM_CMPINT_LT)		_mm256_mask_cmp_epu64_mask((k), (A), (B), _MM_CMPINT_LT)
#define _mm256_cmpneq_epu64_mask(A, B) \		#define _mm256_cmpneq_epu64_mask(A, B) \
_mm256_cmp_epu64_mask((A), (B), _MM_CMPINT_NE)		_mm256_cmp_epu64_mask((A), (B), _MM_CMPINT_NE)
#define _mm256_mask_cmpneq_epu64_mask(k, A, B) \		#define _mm256_mask_cmpneq_epu64_mask(k, A, B) \
_mm256_mask_cmp_epu64_mask((k), (A), (B), _MM_CMPINT_NE)		_mm256_mask_cmp_epu64_mask((k), (A), (B), _MM_CMPINT_NE)

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_add_epi32(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B)		_mm256_mask_add_epi32(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B)
{		{
return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,
(__v8si)_mm256_add_epi32(__A, __B),		(__v8si)_mm256_add_epi32(__A, __B),
(__v8si)__W);		(__v8si)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_add_epi32(__mmask8 __U, __m256i __A, __m256i __B)		_mm256_maskz_add_epi32(__mmask8 __U, __m256i __A, __m256i __B)
{		{
return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,
(__v8si)_mm256_add_epi32(__A, __B),		(__v8si)_mm256_add_epi32(__A, __B),
(__v8si)_mm256_setzero_si256());		(__v8si)_mm256_setzero_si256());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_add_epi64(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B)		_mm256_mask_add_epi64(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B)
{		{
return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,
(__v4di)_mm256_add_epi64(__A, __B),		(__v4di)_mm256_add_epi64(__A, __B),
(__v4di)__W);		(__v4di)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_add_epi64(__mmask8 __U, __m256i __A, __m256i __B)		_mm256_maskz_add_epi64(__mmask8 __U, __m256i __A, __m256i __B)
{		{
return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,
(__v4di)_mm256_add_epi64(__A, __B),		(__v4di)_mm256_add_epi64(__A, __B),
(__v4di)_mm256_setzero_si256());		(__v4di)_mm256_setzero_si256());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_sub_epi32(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B)		_mm256_mask_sub_epi32(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B)
{		{
return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,
(__v8si)_mm256_sub_epi32(__A, __B),		(__v8si)_mm256_sub_epi32(__A, __B),
(__v8si)__W);		(__v8si)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_sub_epi32(__mmask8 __U, __m256i __A, __m256i __B)		_mm256_maskz_sub_epi32(__mmask8 __U, __m256i __A, __m256i __B)
{		{
return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,
(__v8si)_mm256_sub_epi32(__A, __B),		(__v8si)_mm256_sub_epi32(__A, __B),
(__v8si)_mm256_setzero_si256());		(__v8si)_mm256_setzero_si256());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_sub_epi64(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B)		_mm256_mask_sub_epi64(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B)
{		{
return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,
(__v4di)_mm256_sub_epi64(__A, __B),		(__v4di)_mm256_sub_epi64(__A, __B),
(__v4di)__W);		(__v4di)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_sub_epi64(__mmask8 __U, __m256i __A, __m256i __B)		_mm256_maskz_sub_epi64(__mmask8 __U, __m256i __A, __m256i __B)
{		{
return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,
(__v4di)_mm256_sub_epi64(__A, __B),		(__v4di)_mm256_sub_epi64(__A, __B),
(__v4di)_mm256_setzero_si256());		(__v4di)_mm256_setzero_si256());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_add_epi32(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)		_mm_mask_add_epi32(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,
(__v4si)_mm_add_epi32(__A, __B),		(__v4si)_mm_add_epi32(__A, __B),
(__v4si)__W);		(__v4si)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_add_epi32(__mmask8 __U, __m128i __A, __m128i __B)		_mm_maskz_add_epi32(__mmask8 __U, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,
(__v4si)_mm_add_epi32(__A, __B),		(__v4si)_mm_add_epi32(__A, __B),
(__v4si)_mm_setzero_si128());		(__v4si)_mm_setzero_si128());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_add_epi64(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)		_mm_mask_add_epi64(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,
(__v2di)_mm_add_epi64(__A, __B),		(__v2di)_mm_add_epi64(__A, __B),
(__v2di)__W);		(__v2di)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_add_epi64(__mmask8 __U, __m128i __A, __m128i __B)		_mm_maskz_add_epi64(__mmask8 __U, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,
(__v2di)_mm_add_epi64(__A, __B),		(__v2di)_mm_add_epi64(__A, __B),
(__v2di)_mm_setzero_si128());		(__v2di)_mm_setzero_si128());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_sub_epi32(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)		_mm_mask_sub_epi32(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,
(__v4si)_mm_sub_epi32(__A, __B),		(__v4si)_mm_sub_epi32(__A, __B),
(__v4si)__W);		(__v4si)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_sub_epi32(__mmask8 __U, __m128i __A, __m128i __B)		_mm_maskz_sub_epi32(__mmask8 __U, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,
(__v4si)_mm_sub_epi32(__A, __B),		(__v4si)_mm_sub_epi32(__A, __B),
(__v4si)_mm_setzero_si128());		(__v4si)_mm_setzero_si128());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_sub_epi64(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)		_mm_mask_sub_epi64(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,
(__v2di)_mm_sub_epi64(__A, __B),		(__v2di)_mm_sub_epi64(__A, __B),
(__v2di)__W);		(__v2di)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_sub_epi64(__mmask8 __U, __m128i __A, __m128i __B)		_mm_maskz_sub_epi64(__mmask8 __U, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,
(__v2di)_mm_sub_epi64(__A, __B),		(__v2di)_mm_sub_epi64(__A, __B),
(__v2di)_mm_setzero_si128());		(__v2di)_mm_setzero_si128());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_mul_epi32(__m256i __W, __mmask8 __M, __m256i __X, __m256i __Y)		_mm256_mask_mul_epi32(__m256i __W, __mmask8 __M, __m256i __X, __m256i __Y)
{		{
return (__m256i)__builtin_ia32_selectq_256((__mmask8)__M,		return (__m256i)__builtin_ia32_selectq_256((__mmask8)__M,
(__v4di)_mm256_mul_epi32(__X, __Y),		(__v4di)_mm256_mul_epi32(__X, __Y),
(__v4di)__W);		(__v4di)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_mul_epi32(__mmask8 __M, __m256i __X, __m256i __Y)		_mm256_maskz_mul_epi32(__mmask8 __M, __m256i __X, __m256i __Y)
{		{
return (__m256i)__builtin_ia32_selectq_256((__mmask8)__M,		return (__m256i)__builtin_ia32_selectq_256((__mmask8)__M,
(__v4di)_mm256_mul_epi32(__X, __Y),		(__v4di)_mm256_mul_epi32(__X, __Y),
(__v4di)_mm256_setzero_si256());		(__v4di)_mm256_setzero_si256());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_mul_epi32(__m128i __W, __mmask8 __M, __m128i __X, __m128i __Y)		_mm_mask_mul_epi32(__m128i __W, __mmask8 __M, __m128i __X, __m128i __Y)
{		{
return (__m128i)__builtin_ia32_selectq_128((__mmask8)__M,		return (__m128i)__builtin_ia32_selectq_128((__mmask8)__M,
(__v2di)_mm_mul_epi32(__X, __Y),		(__v2di)_mm_mul_epi32(__X, __Y),
(__v2di)__W);		(__v2di)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_mul_epi32(__mmask8 __M, __m128i __X, __m128i __Y)		_mm_maskz_mul_epi32(__mmask8 __M, __m128i __X, __m128i __Y)
{		{
return (__m128i)__builtin_ia32_selectq_128((__mmask8)__M,		return (__m128i)__builtin_ia32_selectq_128((__mmask8)__M,
(__v2di)_mm_mul_epi32(__X, __Y),		(__v2di)_mm_mul_epi32(__X, __Y),
(__v2di)_mm_setzero_si128());		(__v2di)_mm_setzero_si128());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_mul_epu32(__m256i __W, __mmask8 __M, __m256i __X, __m256i __Y)		_mm256_mask_mul_epu32(__m256i __W, __mmask8 __M, __m256i __X, __m256i __Y)
{		{
return (__m256i)__builtin_ia32_selectq_256((__mmask8)__M,		return (__m256i)__builtin_ia32_selectq_256((__mmask8)__M,
(__v4di)_mm256_mul_epu32(__X, __Y),		(__v4di)_mm256_mul_epu32(__X, __Y),
(__v4di)__W);		(__v4di)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_mul_epu32(__mmask8 __M, __m256i __X, __m256i __Y)		_mm256_maskz_mul_epu32(__mmask8 __M, __m256i __X, __m256i __Y)
{		{
return (__m256i)__builtin_ia32_selectq_256((__mmask8)__M,		return (__m256i)__builtin_ia32_selectq_256((__mmask8)__M,
(__v4di)_mm256_mul_epu32(__X, __Y),		(__v4di)_mm256_mul_epu32(__X, __Y),
(__v4di)_mm256_setzero_si256());		(__v4di)_mm256_setzero_si256());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_mul_epu32(__m128i __W, __mmask8 __M, __m128i __X, __m128i __Y)		_mm_mask_mul_epu32(__m128i __W, __mmask8 __M, __m128i __X, __m128i __Y)
{		{
return (__m128i)__builtin_ia32_selectq_128((__mmask8)__M,		return (__m128i)__builtin_ia32_selectq_128((__mmask8)__M,
(__v2di)_mm_mul_epu32(__X, __Y),		(__v2di)_mm_mul_epu32(__X, __Y),
(__v2di)__W);		(__v2di)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_mul_epu32(__mmask8 __M, __m128i __X, __m128i __Y)		_mm_maskz_mul_epu32(__mmask8 __M, __m128i __X, __m128i __Y)
{		{
return (__m128i)__builtin_ia32_selectq_128((__mmask8)__M,		return (__m128i)__builtin_ia32_selectq_128((__mmask8)__M,
(__v2di)_mm_mul_epu32(__X, __Y),		(__v2di)_mm_mul_epu32(__X, __Y),
(__v2di)_mm_setzero_si128());		(__v2di)_mm_setzero_si128());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_mullo_epi32(__mmask8 __M, __m256i __A, __m256i __B)		_mm256_maskz_mullo_epi32(__mmask8 __M, __m256i __A, __m256i __B)
{		{
return (__m256i)__builtin_ia32_selectd_256((__mmask8)__M,		return (__m256i)__builtin_ia32_selectd_256((__mmask8)__M,
(__v8si)_mm256_mullo_epi32(__A, __B),		(__v8si)_mm256_mullo_epi32(__A, __B),
(__v8si)_mm256_setzero_si256());		(__v8si)_mm256_setzero_si256());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_mullo_epi32(__m256i __W, __mmask8 __M, __m256i __A, __m256i __B)		_mm256_mask_mullo_epi32(__m256i __W, __mmask8 __M, __m256i __A, __m256i __B)
{		{
return (__m256i)__builtin_ia32_selectd_256((__mmask8)__M,		return (__m256i)__builtin_ia32_selectd_256((__mmask8)__M,
(__v8si)_mm256_mullo_epi32(__A, __B),		(__v8si)_mm256_mullo_epi32(__A, __B),
(__v8si)__W);		(__v8si)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_mullo_epi32(__mmask8 __M, __m128i __A, __m128i __B)		_mm_maskz_mullo_epi32(__mmask8 __M, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectd_128((__mmask8)__M,		return (__m128i)__builtin_ia32_selectd_128((__mmask8)__M,
(__v4si)_mm_mullo_epi32(__A, __B),		(__v4si)_mm_mullo_epi32(__A, __B),
(__v4si)_mm_setzero_si128());		(__v4si)_mm_setzero_si128());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_mullo_epi32(__m128i __W, __mmask8 __M, __m128i __A, __m128i __B)		_mm_mask_mullo_epi32(__m128i __W, __mmask8 __M, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectd_128((__mmask8)__M,		return (__m128i)__builtin_ia32_selectd_128((__mmask8)__M,
(__v4si)_mm_mullo_epi32(__A, __B),		(__v4si)_mm_mullo_epi32(__A, __B),
(__v4si)__W);		(__v4si)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_and_epi32(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B)		_mm256_mask_and_epi32(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B)
{		{
return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,
(__v8si)_mm256_and_si256(__A, __B),		(__v8si)_mm256_and_si256(__A, __B),
(__v8si)__W);		(__v8si)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_and_epi32(__mmask8 __U, __m256i __A, __m256i __B)		_mm256_maskz_and_epi32(__mmask8 __U, __m256i __A, __m256i __B)
{		{
return (__m256i)_mm256_mask_and_epi32(_mm256_setzero_si256(), __U, __A, __B);		return (__m256i)_mm256_mask_and_epi32(_mm256_setzero_si256(), __U, __A, __B);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_and_epi32(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)		_mm_mask_and_epi32(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,
(__v4si)_mm_and_si128(__A, __B),		(__v4si)_mm_and_si128(__A, __B),
(__v4si)__W);		(__v4si)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_and_epi32(__mmask8 __U, __m128i __A, __m128i __B)		_mm_maskz_and_epi32(__mmask8 __U, __m128i __A, __m128i __B)
{		{
return (__m128i)_mm_mask_and_epi32(_mm_setzero_si128(), __U, __A, __B);		return (__m128i)_mm_mask_and_epi32(_mm_setzero_si128(), __U, __A, __B);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_andnot_epi32(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B)		_mm256_mask_andnot_epi32(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B)
{		{
return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,
(__v8si)_mm256_andnot_si256(__A, __B),		(__v8si)_mm256_andnot_si256(__A, __B),
(__v8si)__W);		(__v8si)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_andnot_epi32(__mmask8 __U, __m256i __A, __m256i __B)		_mm256_maskz_andnot_epi32(__mmask8 __U, __m256i __A, __m256i __B)
{		{
return (__m256i)_mm256_mask_andnot_epi32(_mm256_setzero_si256(),		return (__m256i)_mm256_mask_andnot_epi32(_mm256_setzero_si256(),
__U, __A, __B);		__U, __A, __B);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_andnot_epi32(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)		_mm_mask_andnot_epi32(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,
(__v4si)_mm_andnot_si128(__A, __B),		(__v4si)_mm_andnot_si128(__A, __B),
(__v4si)__W);		(__v4si)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_andnot_epi32 (__mmask8 __U, __m128i __A, __m128i __B)		_mm_maskz_andnot_epi32 (__mmask8 __U, __m128i __A, __m128i __B)
{		{
return (__m128i)_mm_mask_andnot_epi32(_mm_setzero_si128(), __U, __A, __B);		return (__m128i)_mm_mask_andnot_epi32(_mm_setzero_si128(), __U, __A, __B);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_or_epi32 (__m256i __W, __mmask8 __U, __m256i __A, __m256i __B)		_mm256_mask_or_epi32 (__m256i __W, __mmask8 __U, __m256i __A, __m256i __B)
{		{
return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,
(__v8si)_mm256_or_si256(__A, __B),		(__v8si)_mm256_or_si256(__A, __B),
(__v8si)__W);		(__v8si)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_or_epi32(__mmask8 __U, __m256i __A, __m256i __B)		_mm256_maskz_or_epi32(__mmask8 __U, __m256i __A, __m256i __B)
{		{
return (__m256i)_mm256_mask_or_epi32(_mm256_setzero_si256(), __U, __A, __B);		return (__m256i)_mm256_mask_or_epi32(_mm256_setzero_si256(), __U, __A, __B);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_or_epi32(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)		_mm_mask_or_epi32(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,
(__v4si)_mm_or_si128(__A, __B),		(__v4si)_mm_or_si128(__A, __B),
(__v4si)__W);		(__v4si)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_or_epi32(__mmask8 __U, __m128i __A, __m128i __B)		_mm_maskz_or_epi32(__mmask8 __U, __m128i __A, __m128i __B)
{		{
return (__m128i)_mm_mask_or_epi32(_mm_setzero_si128(), __U, __A, __B);		return (__m128i)_mm_mask_or_epi32(_mm_setzero_si128(), __U, __A, __B);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_xor_epi32(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B)		_mm256_mask_xor_epi32(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B)
{		{
return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,
(__v8si)_mm256_xor_si256(__A, __B),		(__v8si)_mm256_xor_si256(__A, __B),
(__v8si)__W);		(__v8si)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_xor_epi32(__mmask8 __U, __m256i __A, __m256i __B)		_mm256_maskz_xor_epi32(__mmask8 __U, __m256i __A, __m256i __B)
{		{
return (__m256i)_mm256_mask_xor_epi32(_mm256_setzero_si256(), __U, __A, __B);		return (__m256i)_mm256_mask_xor_epi32(_mm256_setzero_si256(), __U, __A, __B);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_xor_epi32(__m128i __W, __mmask8 __U, __m128i __A,		_mm_mask_xor_epi32(__m128i __W, __mmask8 __U, __m128i __A,
__m128i __B)		__m128i __B)
{		{
return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,
(__v4si)_mm_xor_si128(__A, __B),		(__v4si)_mm_xor_si128(__A, __B),
(__v4si)__W);		(__v4si)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_xor_epi32(__mmask8 __U, __m128i __A, __m128i __B)		_mm_maskz_xor_epi32(__mmask8 __U, __m128i __A, __m128i __B)
{		{
return (__m128i)_mm_mask_xor_epi32(_mm_setzero_si128(), __U, __A, __B);		return (__m128i)_mm_mask_xor_epi32(_mm_setzero_si128(), __U, __A, __B);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_and_epi64(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B)		_mm256_mask_and_epi64(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B)
{		{
return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,
(__v4di)_mm256_and_si256(__A, __B),		(__v4di)_mm256_and_si256(__A, __B),
(__v4di)__W);		(__v4di)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_and_epi64(__mmask8 __U, __m256i __A, __m256i __B)		_mm256_maskz_and_epi64(__mmask8 __U, __m256i __A, __m256i __B)
{		{
return (__m256i)_mm256_mask_and_epi64(_mm256_setzero_si256(), __U, __A, __B);		return (__m256i)_mm256_mask_and_epi64(_mm256_setzero_si256(), __U, __A, __B);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_and_epi64(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)		_mm_mask_and_epi64(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,
(__v2di)_mm_and_si128(__A, __B),		(__v2di)_mm_and_si128(__A, __B),
(__v2di)__W);		(__v2di)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_and_epi64(__mmask8 __U, __m128i __A, __m128i __B)		_mm_maskz_and_epi64(__mmask8 __U, __m128i __A, __m128i __B)
{		{
return (__m128i)_mm_mask_and_epi64(_mm_setzero_si128(), __U, __A, __B);		return (__m128i)_mm_mask_and_epi64(_mm_setzero_si128(), __U, __A, __B);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_andnot_epi64(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B)		_mm256_mask_andnot_epi64(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B)
{		{
return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,
(__v4di)_mm256_andnot_si256(__A, __B),		(__v4di)_mm256_andnot_si256(__A, __B),
(__v4di)__W);		(__v4di)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_andnot_epi64(__mmask8 __U, __m256i __A, __m256i __B)		_mm256_maskz_andnot_epi64(__mmask8 __U, __m256i __A, __m256i __B)
{		{
return (__m256i)_mm256_mask_andnot_epi64(_mm256_setzero_si256(),		return (__m256i)_mm256_mask_andnot_epi64(_mm256_setzero_si256(),
__U, __A, __B);		__U, __A, __B);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_andnot_epi64(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)		_mm_mask_andnot_epi64(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,
(__v2di)_mm_andnot_si128(__A, __B),		(__v2di)_mm_andnot_si128(__A, __B),
(__v2di)__W);		(__v2di)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_andnot_epi64(__mmask8 __U, __m128i __A, __m128i __B)		_mm_maskz_andnot_epi64(__mmask8 __U, __m128i __A, __m128i __B)
{		{
return (__m128i)_mm_mask_andnot_epi64(_mm_setzero_si128(), __U, __A, __B);		return (__m128i)_mm_mask_andnot_epi64(_mm_setzero_si128(), __U, __A, __B);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_or_epi64(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B)		_mm256_mask_or_epi64(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B)
{		{
return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,
(__v4di)_mm256_or_si256(__A, __B),		(__v4di)_mm256_or_si256(__A, __B),
(__v4di)__W);		(__v4di)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_or_epi64(__mmask8 __U, __m256i __A, __m256i __B)		_mm256_maskz_or_epi64(__mmask8 __U, __m256i __A, __m256i __B)
{		{
return (__m256i)_mm256_mask_or_epi64(_mm256_setzero_si256(), __U, __A, __B);		return (__m256i)_mm256_mask_or_epi64(_mm256_setzero_si256(), __U, __A, __B);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_or_epi64(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)		_mm_mask_or_epi64(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,
(__v2di)_mm_or_si128(__A, __B),		(__v2di)_mm_or_si128(__A, __B),
(__v2di)__W);		(__v2di)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_or_epi64(__mmask8 __U, __m128i __A, __m128i __B)		_mm_maskz_or_epi64(__mmask8 __U, __m128i __A, __m128i __B)
{		{
return (__m128i)_mm_mask_or_epi64(_mm_setzero_si128(), __U, __A, __B);		return (__m128i)_mm_mask_or_epi64(_mm_setzero_si128(), __U, __A, __B);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_xor_epi64(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B)		_mm256_mask_xor_epi64(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B)
{		{
return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,
(__v4di)_mm256_xor_si256(__A, __B),		(__v4di)_mm256_xor_si256(__A, __B),
(__v4di)__W);		(__v4di)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_xor_epi64(__mmask8 __U, __m256i __A, __m256i __B)		_mm256_maskz_xor_epi64(__mmask8 __U, __m256i __A, __m256i __B)
{		{
return (__m256i)_mm256_mask_xor_epi64(_mm256_setzero_si256(), __U, __A, __B);		return (__m256i)_mm256_mask_xor_epi64(_mm256_setzero_si256(), __U, __A, __B);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_xor_epi64(__m128i __W, __mmask8 __U, __m128i __A,		_mm_mask_xor_epi64(__m128i __W, __mmask8 __U, __m128i __A,
__m128i __B)		__m128i __B)
{		{
return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,
(__v2di)_mm_xor_si128(__A, __B),		(__v2di)_mm_xor_si128(__A, __B),
(__v2di)__W);		(__v2di)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_xor_epi64(__mmask8 __U, __m128i __A, __m128i __B)		_mm_maskz_xor_epi64(__mmask8 __U, __m128i __A, __m128i __B)
{		{
return (__m128i)_mm_mask_xor_epi64(_mm_setzero_si128(), __U, __A, __B);		return (__m128i)_mm_mask_xor_epi64(_mm_setzero_si128(), __U, __A, __B);
}		}

#define _mm_cmp_epi32_mask(a, b, p) \		#define _mm_cmp_epi32_mask(a, b, p) \
(__mmask8)__builtin_ia32_cmpd128_mask((__v4si)(__m128i)(a), \		(__mmask8)__builtin_ia32_cmpd128_mask((__v4si)(__m128i)(a), \
(__v4si)(__m128i)(b), (int)(p), \		(__v4si)(__m128i)(b), (int)(p), \
▲ Show 20 Lines • Show All 109 Lines • ▼ Show 20 Lines	(__mmask8)__builtin_ia32_cmppd128_mask((__v2df)(__m128d)(a), \
(__v2df)(__m128d)(b), (int)(p), \		(__v2df)(__m128d)(b), (int)(p), \
(__mmask8)-1)		(__mmask8)-1)

#define _mm_mask_cmp_pd_mask(m, a, b, p) \		#define _mm_mask_cmp_pd_mask(m, a, b, p) \
(__mmask8)__builtin_ia32_cmppd128_mask((__v2df)(__m128d)(a), \		(__mmask8)__builtin_ia32_cmppd128_mask((__v2df)(__m128d)(a), \
(__v2df)(__m128d)(b), (int)(p), \		(__v2df)(__m128d)(b), (int)(p), \
(__mmask8)(m))		(__mmask8)(m))

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_mask_fmadd_pd(__m128d __A, __mmask8 __U, __m128d __B, __m128d __C)		_mm_mask_fmadd_pd(__m128d __A, __mmask8 __U, __m128d __B, __m128d __C)
{		{
return (__m128d) __builtin_ia32_selectpd_128((__mmask8) __U,		return (__m128d) __builtin_ia32_selectpd_128((__mmask8) __U,
__builtin_ia32_vfmaddpd ((__v2df) __A,		__builtin_ia32_vfmaddpd ((__v2df) __A,
(__v2df) __B,		(__v2df) __B,
(__v2df) __C),		(__v2df) __C),
(__v2df) __A);		(__v2df) __A);
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_mask3_fmadd_pd(__m128d __A, __m128d __B, __m128d __C, __mmask8 __U)		_mm_mask3_fmadd_pd(__m128d __A, __m128d __B, __m128d __C, __mmask8 __U)
{		{
return (__m128d) __builtin_ia32_selectpd_128((__mmask8) __U,		return (__m128d) __builtin_ia32_selectpd_128((__mmask8) __U,
__builtin_ia32_vfmaddpd ((__v2df) __A,		__builtin_ia32_vfmaddpd ((__v2df) __A,
(__v2df) __B,		(__v2df) __B,
(__v2df) __C),		(__v2df) __C),
(__v2df) __C);		(__v2df) __C);
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_maskz_fmadd_pd(__mmask8 __U, __m128d __A, __m128d __B, __m128d __C)		_mm_maskz_fmadd_pd(__mmask8 __U, __m128d __A, __m128d __B, __m128d __C)
{		{
return (__m128d) __builtin_ia32_selectpd_128((__mmask8) __U,		return (__m128d) __builtin_ia32_selectpd_128((__mmask8) __U,
__builtin_ia32_vfmaddpd ((__v2df) __A,		__builtin_ia32_vfmaddpd ((__v2df) __A,
(__v2df) __B,		(__v2df) __B,
(__v2df) __C),		(__v2df) __C),
(__v2df)_mm_setzero_pd());		(__v2df)_mm_setzero_pd());
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_mask_fmsub_pd(__m128d __A, __mmask8 __U, __m128d __B, __m128d __C)		_mm_mask_fmsub_pd(__m128d __A, __mmask8 __U, __m128d __B, __m128d __C)
{		{
return (__m128d) __builtin_ia32_selectpd_128((__mmask8) __U,		return (__m128d) __builtin_ia32_selectpd_128((__mmask8) __U,
__builtin_ia32_vfmaddpd ((__v2df) __A,		__builtin_ia32_vfmaddpd ((__v2df) __A,
(__v2df) __B,		(__v2df) __B,
-(__v2df) __C),		-(__v2df) __C),
(__v2df) __A);		(__v2df) __A);
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_maskz_fmsub_pd(__mmask8 __U, __m128d __A, __m128d __B, __m128d __C)		_mm_maskz_fmsub_pd(__mmask8 __U, __m128d __A, __m128d __B, __m128d __C)
{		{
return (__m128d) __builtin_ia32_selectpd_128((__mmask8) __U,		return (__m128d) __builtin_ia32_selectpd_128((__mmask8) __U,
__builtin_ia32_vfmaddpd ((__v2df) __A,		__builtin_ia32_vfmaddpd ((__v2df) __A,
(__v2df) __B,		(__v2df) __B,
-(__v2df) __C),		-(__v2df) __C),
(__v2df)_mm_setzero_pd());		(__v2df)_mm_setzero_pd());
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_mask3_fnmadd_pd(__m128d __A, __m128d __B, __m128d __C, __mmask8 __U)		_mm_mask3_fnmadd_pd(__m128d __A, __m128d __B, __m128d __C, __mmask8 __U)
{		{
return (__m128d) __builtin_ia32_selectpd_128((__mmask8) __U,		return (__m128d) __builtin_ia32_selectpd_128((__mmask8) __U,
__builtin_ia32_vfmaddpd (-(__v2df) __A,		__builtin_ia32_vfmaddpd (-(__v2df) __A,
(__v2df) __B,		(__v2df) __B,
(__v2df) __C),		(__v2df) __C),
(__v2df) __C);		(__v2df) __C);
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_maskz_fnmadd_pd(__mmask8 __U, __m128d __A, __m128d __B, __m128d __C)		_mm_maskz_fnmadd_pd(__mmask8 __U, __m128d __A, __m128d __B, __m128d __C)
{		{
return (__m128d) __builtin_ia32_selectpd_128((__mmask8) __U,		return (__m128d) __builtin_ia32_selectpd_128((__mmask8) __U,
__builtin_ia32_vfmaddpd (-(__v2df) __A,		__builtin_ia32_vfmaddpd (-(__v2df) __A,
(__v2df) __B,		(__v2df) __B,
(__v2df) __C),		(__v2df) __C),
(__v2df)_mm_setzero_pd());		(__v2df)_mm_setzero_pd());
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_maskz_fnmsub_pd(__mmask8 __U, __m128d __A, __m128d __B, __m128d __C)		_mm_maskz_fnmsub_pd(__mmask8 __U, __m128d __A, __m128d __B, __m128d __C)
{		{
return (__m128d) __builtin_ia32_selectpd_128((__mmask8) __U,		return (__m128d) __builtin_ia32_selectpd_128((__mmask8) __U,
__builtin_ia32_vfmaddpd (-(__v2df) __A,		__builtin_ia32_vfmaddpd (-(__v2df) __A,
(__v2df) __B,		(__v2df) __B,
-(__v2df) __C),		-(__v2df) __C),
(__v2df)_mm_setzero_pd());		(__v2df)_mm_setzero_pd());
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_mask_fmadd_pd(__m256d __A, __mmask8 __U, __m256d __B, __m256d __C)		_mm256_mask_fmadd_pd(__m256d __A, __mmask8 __U, __m256d __B, __m256d __C)
{		{
return (__m256d) __builtin_ia32_selectpd_256((__mmask8) __U,		return (__m256d) __builtin_ia32_selectpd_256((__mmask8) __U,
__builtin_ia32_vfmaddpd256 ((__v4df) __A,		__builtin_ia32_vfmaddpd256 ((__v4df) __A,
(__v4df) __B,		(__v4df) __B,
(__v4df) __C),		(__v4df) __C),
(__v4df) __A);		(__v4df) __A);
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_mask3_fmadd_pd(__m256d __A, __m256d __B, __m256d __C, __mmask8 __U)		_mm256_mask3_fmadd_pd(__m256d __A, __m256d __B, __m256d __C, __mmask8 __U)
{		{
return (__m256d) __builtin_ia32_selectpd_256((__mmask8) __U,		return (__m256d) __builtin_ia32_selectpd_256((__mmask8) __U,
__builtin_ia32_vfmaddpd256 ((__v4df) __A,		__builtin_ia32_vfmaddpd256 ((__v4df) __A,
(__v4df) __B,		(__v4df) __B,
(__v4df) __C),		(__v4df) __C),
(__v4df) __C);		(__v4df) __C);
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_maskz_fmadd_pd(__mmask8 __U, __m256d __A, __m256d __B, __m256d __C)		_mm256_maskz_fmadd_pd(__mmask8 __U, __m256d __A, __m256d __B, __m256d __C)
{		{
return (__m256d) __builtin_ia32_selectpd_256((__mmask8) __U,		return (__m256d) __builtin_ia32_selectpd_256((__mmask8) __U,
__builtin_ia32_vfmaddpd256 ((__v4df) __A,		__builtin_ia32_vfmaddpd256 ((__v4df) __A,
(__v4df) __B,		(__v4df) __B,
(__v4df) __C),		(__v4df) __C),
(__v4df)_mm256_setzero_pd());		(__v4df)_mm256_setzero_pd());
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_mask_fmsub_pd(__m256d __A, __mmask8 __U, __m256d __B, __m256d __C)		_mm256_mask_fmsub_pd(__m256d __A, __mmask8 __U, __m256d __B, __m256d __C)
{		{
return (__m256d) __builtin_ia32_selectpd_256((__mmask8) __U,		return (__m256d) __builtin_ia32_selectpd_256((__mmask8) __U,
__builtin_ia32_vfmaddpd256 ((__v4df) __A,		__builtin_ia32_vfmaddpd256 ((__v4df) __A,
(__v4df) __B,		(__v4df) __B,
-(__v4df) __C),		-(__v4df) __C),
(__v4df) __A);		(__v4df) __A);
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_maskz_fmsub_pd(__mmask8 __U, __m256d __A, __m256d __B, __m256d __C)		_mm256_maskz_fmsub_pd(__mmask8 __U, __m256d __A, __m256d __B, __m256d __C)
{		{
return (__m256d) __builtin_ia32_selectpd_256((__mmask8) __U,		return (__m256d) __builtin_ia32_selectpd_256((__mmask8) __U,
__builtin_ia32_vfmaddpd256 ((__v4df) __A,		__builtin_ia32_vfmaddpd256 ((__v4df) __A,
(__v4df) __B,		(__v4df) __B,
-(__v4df) __C),		-(__v4df) __C),
(__v4df)_mm256_setzero_pd());		(__v4df)_mm256_setzero_pd());
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_mask3_fnmadd_pd(__m256d __A, __m256d __B, __m256d __C, __mmask8 __U)		_mm256_mask3_fnmadd_pd(__m256d __A, __m256d __B, __m256d __C, __mmask8 __U)
{		{
return (__m256d) __builtin_ia32_selectpd_256((__mmask8) __U,		return (__m256d) __builtin_ia32_selectpd_256((__mmask8) __U,
__builtin_ia32_vfmaddpd256 (-(__v4df) __A,		__builtin_ia32_vfmaddpd256 (-(__v4df) __A,
(__v4df) __B,		(__v4df) __B,
(__v4df) __C),		(__v4df) __C),
(__v4df) __C);		(__v4df) __C);
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_maskz_fnmadd_pd(__mmask8 __U, __m256d __A, __m256d __B, __m256d __C)		_mm256_maskz_fnmadd_pd(__mmask8 __U, __m256d __A, __m256d __B, __m256d __C)
{		{
return (__m256d) __builtin_ia32_selectpd_256((__mmask8) __U,		return (__m256d) __builtin_ia32_selectpd_256((__mmask8) __U,
__builtin_ia32_vfmaddpd256 (-(__v4df) __A,		__builtin_ia32_vfmaddpd256 (-(__v4df) __A,
(__v4df) __B,		(__v4df) __B,
(__v4df) __C),		(__v4df) __C),
(__v4df)_mm256_setzero_pd());		(__v4df)_mm256_setzero_pd());
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_maskz_fnmsub_pd(__mmask8 __U, __m256d __A, __m256d __B, __m256d __C)		_mm256_maskz_fnmsub_pd(__mmask8 __U, __m256d __A, __m256d __B, __m256d __C)
{		{
return (__m256d) __builtin_ia32_selectpd_256((__mmask8) __U,		return (__m256d) __builtin_ia32_selectpd_256((__mmask8) __U,
__builtin_ia32_vfmaddpd256 (-(__v4df) __A,		__builtin_ia32_vfmaddpd256 (-(__v4df) __A,
(__v4df) __B,		(__v4df) __B,
-(__v4df) __C),		-(__v4df) __C),
(__v4df)_mm256_setzero_pd());		(__v4df)_mm256_setzero_pd());
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_mask_fmadd_ps(__m128 __A, __mmask8 __U, __m128 __B, __m128 __C)		_mm_mask_fmadd_ps(__m128 __A, __mmask8 __U, __m128 __B, __m128 __C)
{		{
return (__m128) __builtin_ia32_selectps_128((__mmask8) __U,		return (__m128) __builtin_ia32_selectps_128((__mmask8) __U,
__builtin_ia32_vfmaddps ((__v4sf) __A,		__builtin_ia32_vfmaddps ((__v4sf) __A,
(__v4sf) __B,		(__v4sf) __B,
(__v4sf) __C),		(__v4sf) __C),
(__v4sf) __A);		(__v4sf) __A);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_mask3_fmadd_ps(__m128 __A, __m128 __B, __m128 __C, __mmask8 __U)		_mm_mask3_fmadd_ps(__m128 __A, __m128 __B, __m128 __C, __mmask8 __U)
{		{
return (__m128) __builtin_ia32_selectps_128((__mmask8) __U,		return (__m128) __builtin_ia32_selectps_128((__mmask8) __U,
__builtin_ia32_vfmaddps ((__v4sf) __A,		__builtin_ia32_vfmaddps ((__v4sf) __A,
(__v4sf) __B,		(__v4sf) __B,
(__v4sf) __C),		(__v4sf) __C),
(__v4sf) __C);		(__v4sf) __C);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_maskz_fmadd_ps(__mmask8 __U, __m128 __A, __m128 __B, __m128 __C)		_mm_maskz_fmadd_ps(__mmask8 __U, __m128 __A, __m128 __B, __m128 __C)
{		{
return (__m128) __builtin_ia32_selectps_128((__mmask8) __U,		return (__m128) __builtin_ia32_selectps_128((__mmask8) __U,
__builtin_ia32_vfmaddps ((__v4sf) __A,		__builtin_ia32_vfmaddps ((__v4sf) __A,
(__v4sf) __B,		(__v4sf) __B,
(__v4sf) __C),		(__v4sf) __C),
(__v4sf)_mm_setzero_ps());		(__v4sf)_mm_setzero_ps());
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_mask_fmsub_ps(__m128 __A, __mmask8 __U, __m128 __B, __m128 __C)		_mm_mask_fmsub_ps(__m128 __A, __mmask8 __U, __m128 __B, __m128 __C)
{		{
return (__m128) __builtin_ia32_selectps_128((__mmask8) __U,		return (__m128) __builtin_ia32_selectps_128((__mmask8) __U,
__builtin_ia32_vfmaddps ((__v4sf) __A,		__builtin_ia32_vfmaddps ((__v4sf) __A,
(__v4sf) __B,		(__v4sf) __B,
-(__v4sf) __C),		-(__v4sf) __C),
(__v4sf) __A);		(__v4sf) __A);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_maskz_fmsub_ps(__mmask8 __U, __m128 __A, __m128 __B, __m128 __C)		_mm_maskz_fmsub_ps(__mmask8 __U, __m128 __A, __m128 __B, __m128 __C)
{		{
return (__m128) __builtin_ia32_selectps_128((__mmask8) __U,		return (__m128) __builtin_ia32_selectps_128((__mmask8) __U,
__builtin_ia32_vfmaddps ((__v4sf) __A,		__builtin_ia32_vfmaddps ((__v4sf) __A,
(__v4sf) __B,		(__v4sf) __B,
-(__v4sf) __C),		-(__v4sf) __C),
(__v4sf)_mm_setzero_ps());		(__v4sf)_mm_setzero_ps());
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_mask3_fnmadd_ps(__m128 __A, __m128 __B, __m128 __C, __mmask8 __U)		_mm_mask3_fnmadd_ps(__m128 __A, __m128 __B, __m128 __C, __mmask8 __U)
{		{
return (__m128) __builtin_ia32_selectps_128((__mmask8) __U,		return (__m128) __builtin_ia32_selectps_128((__mmask8) __U,
__builtin_ia32_vfmaddps (-(__v4sf) __A,		__builtin_ia32_vfmaddps (-(__v4sf) __A,
(__v4sf) __B,		(__v4sf) __B,
(__v4sf) __C),		(__v4sf) __C),
(__v4sf) __C);		(__v4sf) __C);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_maskz_fnmadd_ps(__mmask8 __U, __m128 __A, __m128 __B, __m128 __C)		_mm_maskz_fnmadd_ps(__mmask8 __U, __m128 __A, __m128 __B, __m128 __C)
{		{
return (__m128) __builtin_ia32_selectps_128((__mmask8) __U,		return (__m128) __builtin_ia32_selectps_128((__mmask8) __U,
__builtin_ia32_vfmaddps (-(__v4sf) __A,		__builtin_ia32_vfmaddps (-(__v4sf) __A,
(__v4sf) __B,		(__v4sf) __B,
(__v4sf) __C),		(__v4sf) __C),
(__v4sf)_mm_setzero_ps());		(__v4sf)_mm_setzero_ps());
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_maskz_fnmsub_ps(__mmask8 __U, __m128 __A, __m128 __B, __m128 __C)		_mm_maskz_fnmsub_ps(__mmask8 __U, __m128 __A, __m128 __B, __m128 __C)
{		{
return (__m128) __builtin_ia32_selectps_128((__mmask8) __U,		return (__m128) __builtin_ia32_selectps_128((__mmask8) __U,
__builtin_ia32_vfmaddps (-(__v4sf) __A,		__builtin_ia32_vfmaddps (-(__v4sf) __A,
(__v4sf) __B,		(__v4sf) __B,
-(__v4sf) __C),		-(__v4sf) __C),
(__v4sf)_mm_setzero_ps());		(__v4sf)_mm_setzero_ps());
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_mask_fmadd_ps(__m256 __A, __mmask8 __U, __m256 __B, __m256 __C)		_mm256_mask_fmadd_ps(__m256 __A, __mmask8 __U, __m256 __B, __m256 __C)
{		{
return (__m256) __builtin_ia32_selectps_256((__mmask8) __U,		return (__m256) __builtin_ia32_selectps_256((__mmask8) __U,
__builtin_ia32_vfmaddps256 ((__v8sf) __A,		__builtin_ia32_vfmaddps256 ((__v8sf) __A,
(__v8sf) __B,		(__v8sf) __B,
(__v8sf) __C),		(__v8sf) __C),
(__v8sf) __A);		(__v8sf) __A);
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_mask3_fmadd_ps(__m256 __A, __m256 __B, __m256 __C, __mmask8 __U)		_mm256_mask3_fmadd_ps(__m256 __A, __m256 __B, __m256 __C, __mmask8 __U)
{		{
return (__m256) __builtin_ia32_selectps_256((__mmask8) __U,		return (__m256) __builtin_ia32_selectps_256((__mmask8) __U,
__builtin_ia32_vfmaddps256 ((__v8sf) __A,		__builtin_ia32_vfmaddps256 ((__v8sf) __A,
(__v8sf) __B,		(__v8sf) __B,
(__v8sf) __C),		(__v8sf) __C),
(__v8sf) __C);		(__v8sf) __C);
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_maskz_fmadd_ps(__mmask8 __U, __m256 __A, __m256 __B, __m256 __C)		_mm256_maskz_fmadd_ps(__mmask8 __U, __m256 __A, __m256 __B, __m256 __C)
{		{
return (__m256) __builtin_ia32_selectps_256((__mmask8) __U,		return (__m256) __builtin_ia32_selectps_256((__mmask8) __U,
__builtin_ia32_vfmaddps256 ((__v8sf) __A,		__builtin_ia32_vfmaddps256 ((__v8sf) __A,
(__v8sf) __B,		(__v8sf) __B,
(__v8sf) __C),		(__v8sf) __C),
(__v8sf)_mm256_setzero_ps());		(__v8sf)_mm256_setzero_ps());
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_mask_fmsub_ps(__m256 __A, __mmask8 __U, __m256 __B, __m256 __C)		_mm256_mask_fmsub_ps(__m256 __A, __mmask8 __U, __m256 __B, __m256 __C)
{		{
return (__m256) __builtin_ia32_selectps_256((__mmask8) __U,		return (__m256) __builtin_ia32_selectps_256((__mmask8) __U,
__builtin_ia32_vfmaddps256 ((__v8sf) __A,		__builtin_ia32_vfmaddps256 ((__v8sf) __A,
(__v8sf) __B,		(__v8sf) __B,
-(__v8sf) __C),		-(__v8sf) __C),
(__v8sf) __A);		(__v8sf) __A);
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_maskz_fmsub_ps(__mmask8 __U, __m256 __A, __m256 __B, __m256 __C)		_mm256_maskz_fmsub_ps(__mmask8 __U, __m256 __A, __m256 __B, __m256 __C)
{		{
return (__m256) __builtin_ia32_selectps_256((__mmask8) __U,		return (__m256) __builtin_ia32_selectps_256((__mmask8) __U,
__builtin_ia32_vfmaddps256 ((__v8sf) __A,		__builtin_ia32_vfmaddps256 ((__v8sf) __A,
(__v8sf) __B,		(__v8sf) __B,
-(__v8sf) __C),		-(__v8sf) __C),
(__v8sf)_mm256_setzero_ps());		(__v8sf)_mm256_setzero_ps());
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_mask3_fnmadd_ps(__m256 __A, __m256 __B, __m256 __C, __mmask8 __U)		_mm256_mask3_fnmadd_ps(__m256 __A, __m256 __B, __m256 __C, __mmask8 __U)
{		{
return (__m256) __builtin_ia32_selectps_256((__mmask8) __U,		return (__m256) __builtin_ia32_selectps_256((__mmask8) __U,
__builtin_ia32_vfmaddps256 (-(__v8sf) __A,		__builtin_ia32_vfmaddps256 (-(__v8sf) __A,
(__v8sf) __B,		(__v8sf) __B,
(__v8sf) __C),		(__v8sf) __C),
(__v8sf) __C);		(__v8sf) __C);
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_maskz_fnmadd_ps(__mmask8 __U, __m256 __A, __m256 __B, __m256 __C)		_mm256_maskz_fnmadd_ps(__mmask8 __U, __m256 __A, __m256 __B, __m256 __C)
{		{
return (__m256) __builtin_ia32_selectps_256((__mmask8) __U,		return (__m256) __builtin_ia32_selectps_256((__mmask8) __U,
__builtin_ia32_vfmaddps256 (-(__v8sf) __A,		__builtin_ia32_vfmaddps256 (-(__v8sf) __A,
(__v8sf) __B,		(__v8sf) __B,
(__v8sf) __C),		(__v8sf) __C),
(__v8sf)_mm256_setzero_ps());		(__v8sf)_mm256_setzero_ps());
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_maskz_fnmsub_ps(__mmask8 __U, __m256 __A, __m256 __B, __m256 __C)		_mm256_maskz_fnmsub_ps(__mmask8 __U, __m256 __A, __m256 __B, __m256 __C)
{		{
return (__m256) __builtin_ia32_selectps_256((__mmask8) __U,		return (__m256) __builtin_ia32_selectps_256((__mmask8) __U,
__builtin_ia32_vfmaddps256 (-(__v8sf) __A,		__builtin_ia32_vfmaddps256 (-(__v8sf) __A,
(__v8sf) __B,		(__v8sf) __B,
-(__v8sf) __C),		-(__v8sf) __C),
(__v8sf)_mm256_setzero_ps());		(__v8sf)_mm256_setzero_ps());
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_mask_fmaddsub_pd(__m128d __A, __mmask8 __U, __m128d __B, __m128d __C)		_mm_mask_fmaddsub_pd(__m128d __A, __mmask8 __U, __m128d __B, __m128d __C)
{		{
return (__m128d) __builtin_ia32_selectpd_128((__mmask8) __U,		return (__m128d) __builtin_ia32_selectpd_128((__mmask8) __U,
__builtin_ia32_vfmaddsubpd ((__v2df) __A,		__builtin_ia32_vfmaddsubpd ((__v2df) __A,
(__v2df) __B,		(__v2df) __B,
(__v2df) __C),		(__v2df) __C),
(__v2df) __A);		(__v2df) __A);
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_mask3_fmaddsub_pd(__m128d __A, __m128d __B, __m128d __C, __mmask8 __U)		_mm_mask3_fmaddsub_pd(__m128d __A, __m128d __B, __m128d __C, __mmask8 __U)
{		{
return (__m128d) __builtin_ia32_selectpd_128((__mmask8) __U,		return (__m128d) __builtin_ia32_selectpd_128((__mmask8) __U,
__builtin_ia32_vfmaddsubpd ((__v2df) __A,		__builtin_ia32_vfmaddsubpd ((__v2df) __A,
(__v2df) __B,		(__v2df) __B,
(__v2df) __C),		(__v2df) __C),
(__v2df) __C);		(__v2df) __C);
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_maskz_fmaddsub_pd(__mmask8 __U, __m128d __A, __m128d __B, __m128d __C)		_mm_maskz_fmaddsub_pd(__mmask8 __U, __m128d __A, __m128d __B, __m128d __C)
{		{
return (__m128d) __builtin_ia32_selectpd_128((__mmask8) __U,		return (__m128d) __builtin_ia32_selectpd_128((__mmask8) __U,
__builtin_ia32_vfmaddsubpd ((__v2df) __A,		__builtin_ia32_vfmaddsubpd ((__v2df) __A,
(__v2df) __B,		(__v2df) __B,
(__v2df) __C),		(__v2df) __C),
(__v2df)_mm_setzero_pd());		(__v2df)_mm_setzero_pd());
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_mask_fmsubadd_pd(__m128d __A, __mmask8 __U, __m128d __B, __m128d __C)		_mm_mask_fmsubadd_pd(__m128d __A, __mmask8 __U, __m128d __B, __m128d __C)
{		{
return (__m128d) __builtin_ia32_selectpd_128((__mmask8) __U,		return (__m128d) __builtin_ia32_selectpd_128((__mmask8) __U,
__builtin_ia32_vfmaddsubpd ((__v2df) __A,		__builtin_ia32_vfmaddsubpd ((__v2df) __A,
(__v2df) __B,		(__v2df) __B,
-(__v2df) __C),		-(__v2df) __C),
(__v2df) __A);		(__v2df) __A);
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_maskz_fmsubadd_pd(__mmask8 __U, __m128d __A, __m128d __B, __m128d __C)		_mm_maskz_fmsubadd_pd(__mmask8 __U, __m128d __A, __m128d __B, __m128d __C)
{		{
return (__m128d) __builtin_ia32_selectpd_128((__mmask8) __U,		return (__m128d) __builtin_ia32_selectpd_128((__mmask8) __U,
__builtin_ia32_vfmaddsubpd ((__v2df) __A,		__builtin_ia32_vfmaddsubpd ((__v2df) __A,
(__v2df) __B,		(__v2df) __B,
-(__v2df) __C),		-(__v2df) __C),
(__v2df)_mm_setzero_pd());		(__v2df)_mm_setzero_pd());
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_mask_fmaddsub_pd(__m256d __A, __mmask8 __U, __m256d __B, __m256d __C)		_mm256_mask_fmaddsub_pd(__m256d __A, __mmask8 __U, __m256d __B, __m256d __C)
{		{
return (__m256d) __builtin_ia32_selectpd_256((__mmask8) __U,		return (__m256d) __builtin_ia32_selectpd_256((__mmask8) __U,
__builtin_ia32_vfmaddsubpd256 ((__v4df) __A,		__builtin_ia32_vfmaddsubpd256 ((__v4df) __A,
(__v4df) __B,		(__v4df) __B,
(__v4df) __C),		(__v4df) __C),
(__v4df) __A);		(__v4df) __A);
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_mask3_fmaddsub_pd(__m256d __A, __m256d __B, __m256d __C, __mmask8 __U)		_mm256_mask3_fmaddsub_pd(__m256d __A, __m256d __B, __m256d __C, __mmask8 __U)
{		{
return (__m256d) __builtin_ia32_selectpd_256((__mmask8) __U,		return (__m256d) __builtin_ia32_selectpd_256((__mmask8) __U,
__builtin_ia32_vfmaddsubpd256 ((__v4df) __A,		__builtin_ia32_vfmaddsubpd256 ((__v4df) __A,
(__v4df) __B,		(__v4df) __B,
(__v4df) __C),		(__v4df) __C),
(__v4df) __C);		(__v4df) __C);
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_maskz_fmaddsub_pd(__mmask8 __U, __m256d __A, __m256d __B, __m256d __C)		_mm256_maskz_fmaddsub_pd(__mmask8 __U, __m256d __A, __m256d __B, __m256d __C)
{		{
return (__m256d) __builtin_ia32_selectpd_256((__mmask8) __U,		return (__m256d) __builtin_ia32_selectpd_256((__mmask8) __U,
__builtin_ia32_vfmaddsubpd256 ((__v4df) __A,		__builtin_ia32_vfmaddsubpd256 ((__v4df) __A,
(__v4df) __B,		(__v4df) __B,
(__v4df) __C),		(__v4df) __C),
(__v4df)_mm256_setzero_pd());		(__v4df)_mm256_setzero_pd());
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_mask_fmsubadd_pd(__m256d __A, __mmask8 __U, __m256d __B, __m256d __C)		_mm256_mask_fmsubadd_pd(__m256d __A, __mmask8 __U, __m256d __B, __m256d __C)
{		{
return (__m256d) __builtin_ia32_selectpd_256((__mmask8) __U,		return (__m256d) __builtin_ia32_selectpd_256((__mmask8) __U,
__builtin_ia32_vfmaddsubpd256 ((__v4df) __A,		__builtin_ia32_vfmaddsubpd256 ((__v4df) __A,
(__v4df) __B,		(__v4df) __B,
-(__v4df) __C),		-(__v4df) __C),
(__v4df) __A);		(__v4df) __A);
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_maskz_fmsubadd_pd(__mmask8 __U, __m256d __A, __m256d __B, __m256d __C)		_mm256_maskz_fmsubadd_pd(__mmask8 __U, __m256d __A, __m256d __B, __m256d __C)
{		{
return (__m256d) __builtin_ia32_selectpd_256((__mmask8) __U,		return (__m256d) __builtin_ia32_selectpd_256((__mmask8) __U,
__builtin_ia32_vfmaddsubpd256 ((__v4df) __A,		__builtin_ia32_vfmaddsubpd256 ((__v4df) __A,
(__v4df) __B,		(__v4df) __B,
-(__v4df) __C),		-(__v4df) __C),
(__v4df)_mm256_setzero_pd());		(__v4df)_mm256_setzero_pd());
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_mask_fmaddsub_ps(__m128 __A, __mmask8 __U, __m128 __B, __m128 __C)		_mm_mask_fmaddsub_ps(__m128 __A, __mmask8 __U, __m128 __B, __m128 __C)
{		{
return (__m128) __builtin_ia32_selectps_128((__mmask8) __U,		return (__m128) __builtin_ia32_selectps_128((__mmask8) __U,
__builtin_ia32_vfmaddsubps ((__v4sf) __A,		__builtin_ia32_vfmaddsubps ((__v4sf) __A,
(__v4sf) __B,		(__v4sf) __B,
(__v4sf) __C),		(__v4sf) __C),
(__v4sf) __A);		(__v4sf) __A);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_mask3_fmaddsub_ps(__m128 __A, __m128 __B, __m128 __C, __mmask8 __U)		_mm_mask3_fmaddsub_ps(__m128 __A, __m128 __B, __m128 __C, __mmask8 __U)
{		{
return (__m128) __builtin_ia32_selectps_128((__mmask8) __U,		return (__m128) __builtin_ia32_selectps_128((__mmask8) __U,
__builtin_ia32_vfmaddsubps ((__v4sf) __A,		__builtin_ia32_vfmaddsubps ((__v4sf) __A,
(__v4sf) __B,		(__v4sf) __B,
(__v4sf) __C),		(__v4sf) __C),
(__v4sf) __C);		(__v4sf) __C);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_maskz_fmaddsub_ps(__mmask8 __U, __m128 __A, __m128 __B, __m128 __C)		_mm_maskz_fmaddsub_ps(__mmask8 __U, __m128 __A, __m128 __B, __m128 __C)
{		{
return (__m128) __builtin_ia32_selectps_128((__mmask8) __U,		return (__m128) __builtin_ia32_selectps_128((__mmask8) __U,
__builtin_ia32_vfmaddsubps ((__v4sf) __A,		__builtin_ia32_vfmaddsubps ((__v4sf) __A,
(__v4sf) __B,		(__v4sf) __B,
(__v4sf) __C),		(__v4sf) __C),
(__v4sf)_mm_setzero_ps());		(__v4sf)_mm_setzero_ps());
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_mask_fmsubadd_ps(__m128 __A, __mmask8 __U, __m128 __B, __m128 __C)		_mm_mask_fmsubadd_ps(__m128 __A, __mmask8 __U, __m128 __B, __m128 __C)
{		{
return (__m128) __builtin_ia32_selectps_128((__mmask8) __U,		return (__m128) __builtin_ia32_selectps_128((__mmask8) __U,
__builtin_ia32_vfmaddsubps ((__v4sf) __A,		__builtin_ia32_vfmaddsubps ((__v4sf) __A,
(__v4sf) __B,		(__v4sf) __B,
-(__v4sf) __C),		-(__v4sf) __C),
(__v4sf) __A);		(__v4sf) __A);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_maskz_fmsubadd_ps(__mmask8 __U, __m128 __A, __m128 __B, __m128 __C)		_mm_maskz_fmsubadd_ps(__mmask8 __U, __m128 __A, __m128 __B, __m128 __C)
{		{
return (__m128) __builtin_ia32_selectps_128((__mmask8) __U,		return (__m128) __builtin_ia32_selectps_128((__mmask8) __U,
__builtin_ia32_vfmaddsubps ((__v4sf) __A,		__builtin_ia32_vfmaddsubps ((__v4sf) __A,
(__v4sf) __B,		(__v4sf) __B,
-(__v4sf) __C),		-(__v4sf) __C),
(__v4sf)_mm_setzero_ps());		(__v4sf)_mm_setzero_ps());
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_mask_fmaddsub_ps(__m256 __A, __mmask8 __U, __m256 __B,		_mm256_mask_fmaddsub_ps(__m256 __A, __mmask8 __U, __m256 __B,
__m256 __C)		__m256 __C)
{		{
return (__m256) __builtin_ia32_selectps_256((__mmask8) __U,		return (__m256) __builtin_ia32_selectps_256((__mmask8) __U,
__builtin_ia32_vfmaddsubps256 ((__v8sf) __A,		__builtin_ia32_vfmaddsubps256 ((__v8sf) __A,
(__v8sf) __B,		(__v8sf) __B,
(__v8sf) __C),		(__v8sf) __C),
(__v8sf) __A);		(__v8sf) __A);
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_mask3_fmaddsub_ps(__m256 __A, __m256 __B, __m256 __C, __mmask8 __U)		_mm256_mask3_fmaddsub_ps(__m256 __A, __m256 __B, __m256 __C, __mmask8 __U)
{		{
return (__m256) __builtin_ia32_selectps_256((__mmask8) __U,		return (__m256) __builtin_ia32_selectps_256((__mmask8) __U,
__builtin_ia32_vfmaddsubps256 ((__v8sf) __A,		__builtin_ia32_vfmaddsubps256 ((__v8sf) __A,
(__v8sf) __B,		(__v8sf) __B,
(__v8sf) __C),		(__v8sf) __C),
(__v8sf) __C);		(__v8sf) __C);
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_maskz_fmaddsub_ps(__mmask8 __U, __m256 __A, __m256 __B, __m256 __C)		_mm256_maskz_fmaddsub_ps(__mmask8 __U, __m256 __A, __m256 __B, __m256 __C)
{		{
return (__m256) __builtin_ia32_selectps_256((__mmask8) __U,		return (__m256) __builtin_ia32_selectps_256((__mmask8) __U,
__builtin_ia32_vfmaddsubps256 ((__v8sf) __A,		__builtin_ia32_vfmaddsubps256 ((__v8sf) __A,
(__v8sf) __B,		(__v8sf) __B,
(__v8sf) __C),		(__v8sf) __C),
(__v8sf)_mm256_setzero_ps());		(__v8sf)_mm256_setzero_ps());
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_mask_fmsubadd_ps(__m256 __A, __mmask8 __U, __m256 __B, __m256 __C)		_mm256_mask_fmsubadd_ps(__m256 __A, __mmask8 __U, __m256 __B, __m256 __C)
{		{
return (__m256) __builtin_ia32_selectps_256((__mmask8) __U,		return (__m256) __builtin_ia32_selectps_256((__mmask8) __U,
__builtin_ia32_vfmaddsubps256 ((__v8sf) __A,		__builtin_ia32_vfmaddsubps256 ((__v8sf) __A,
(__v8sf) __B,		(__v8sf) __B,
-(__v8sf) __C),		-(__v8sf) __C),
(__v8sf) __A);		(__v8sf) __A);
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_maskz_fmsubadd_ps(__mmask8 __U, __m256 __A, __m256 __B, __m256 __C)		_mm256_maskz_fmsubadd_ps(__mmask8 __U, __m256 __A, __m256 __B, __m256 __C)
{		{
return (__m256) __builtin_ia32_selectps_256((__mmask8) __U,		return (__m256) __builtin_ia32_selectps_256((__mmask8) __U,
__builtin_ia32_vfmaddsubps256 ((__v8sf) __A,		__builtin_ia32_vfmaddsubps256 ((__v8sf) __A,
(__v8sf) __B,		(__v8sf) __B,
-(__v8sf) __C),		-(__v8sf) __C),
(__v8sf)_mm256_setzero_ps());		(__v8sf)_mm256_setzero_ps());
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_mask3_fmsub_pd(__m128d __A, __m128d __B, __m128d __C, __mmask8 __U)		_mm_mask3_fmsub_pd(__m128d __A, __m128d __B, __m128d __C, __mmask8 __U)
{		{
return (__m128d) __builtin_ia32_selectpd_128((__mmask8) __U,		return (__m128d) __builtin_ia32_selectpd_128((__mmask8) __U,
__builtin_ia32_vfmaddpd ((__v2df) __A,		__builtin_ia32_vfmaddpd ((__v2df) __A,
(__v2df) __B,		(__v2df) __B,
-(__v2df) __C),		-(__v2df) __C),
(__v2df) __C);		(__v2df) __C);
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_mask3_fmsub_pd(__m256d __A, __m256d __B, __m256d __C, __mmask8 __U)		_mm256_mask3_fmsub_pd(__m256d __A, __m256d __B, __m256d __C, __mmask8 __U)
{		{
return (__m256d) __builtin_ia32_selectpd_256((__mmask8) __U,		return (__m256d) __builtin_ia32_selectpd_256((__mmask8) __U,
__builtin_ia32_vfmaddpd256 ((__v4df) __A,		__builtin_ia32_vfmaddpd256 ((__v4df) __A,
(__v4df) __B,		(__v4df) __B,
-(__v4df) __C),		-(__v4df) __C),
(__v4df) __C);		(__v4df) __C);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_mask3_fmsub_ps(__m128 __A, __m128 __B, __m128 __C, __mmask8 __U)		_mm_mask3_fmsub_ps(__m128 __A, __m128 __B, __m128 __C, __mmask8 __U)
{		{
return (__m128) __builtin_ia32_selectps_128((__mmask8) __U,		return (__m128) __builtin_ia32_selectps_128((__mmask8) __U,
__builtin_ia32_vfmaddps ((__v4sf) __A,		__builtin_ia32_vfmaddps ((__v4sf) __A,
(__v4sf) __B,		(__v4sf) __B,
-(__v4sf) __C),		-(__v4sf) __C),
(__v4sf) __C);		(__v4sf) __C);
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_mask3_fmsub_ps(__m256 __A, __m256 __B, __m256 __C, __mmask8 __U)		_mm256_mask3_fmsub_ps(__m256 __A, __m256 __B, __m256 __C, __mmask8 __U)
{		{
return (__m256) __builtin_ia32_selectps_256((__mmask8) __U,		return (__m256) __builtin_ia32_selectps_256((__mmask8) __U,
__builtin_ia32_vfmaddps256 ((__v8sf) __A,		__builtin_ia32_vfmaddps256 ((__v8sf) __A,
(__v8sf) __B,		(__v8sf) __B,
-(__v8sf) __C),		-(__v8sf) __C),
(__v8sf) __C);		(__v8sf) __C);
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_mask3_fmsubadd_pd(__m128d __A, __m128d __B, __m128d __C, __mmask8 __U)		_mm_mask3_fmsubadd_pd(__m128d __A, __m128d __B, __m128d __C, __mmask8 __U)
{		{
return (__m128d) __builtin_ia32_selectpd_128((__mmask8) __U,		return (__m128d) __builtin_ia32_selectpd_128((__mmask8) __U,
__builtin_ia32_vfmaddsubpd ((__v2df) __A,		__builtin_ia32_vfmaddsubpd ((__v2df) __A,
(__v2df) __B,		(__v2df) __B,
-(__v2df) __C),		-(__v2df) __C),
(__v2df) __C);		(__v2df) __C);
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_mask3_fmsubadd_pd(__m256d __A, __m256d __B, __m256d __C, __mmask8 __U)		_mm256_mask3_fmsubadd_pd(__m256d __A, __m256d __B, __m256d __C, __mmask8 __U)
{		{
return (__m256d) __builtin_ia32_selectpd_256((__mmask8) __U,		return (__m256d) __builtin_ia32_selectpd_256((__mmask8) __U,
__builtin_ia32_vfmaddsubpd256 ((__v4df) __A,		__builtin_ia32_vfmaddsubpd256 ((__v4df) __A,
(__v4df) __B,		(__v4df) __B,
-(__v4df) __C),		-(__v4df) __C),
(__v4df) __C);		(__v4df) __C);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_mask3_fmsubadd_ps(__m128 __A, __m128 __B, __m128 __C, __mmask8 __U)		_mm_mask3_fmsubadd_ps(__m128 __A, __m128 __B, __m128 __C, __mmask8 __U)
{		{
return (__m128) __builtin_ia32_selectps_128((__mmask8) __U,		return (__m128) __builtin_ia32_selectps_128((__mmask8) __U,
__builtin_ia32_vfmaddsubps ((__v4sf) __A,		__builtin_ia32_vfmaddsubps ((__v4sf) __A,
(__v4sf) __B,		(__v4sf) __B,
-(__v4sf) __C),		-(__v4sf) __C),
(__v4sf) __C);		(__v4sf) __C);
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_mask3_fmsubadd_ps(__m256 __A, __m256 __B, __m256 __C, __mmask8 __U)		_mm256_mask3_fmsubadd_ps(__m256 __A, __m256 __B, __m256 __C, __mmask8 __U)
{		{
return (__m256) __builtin_ia32_selectps_256((__mmask8) __U,		return (__m256) __builtin_ia32_selectps_256((__mmask8) __U,
__builtin_ia32_vfmaddsubps256 ((__v8sf) __A,		__builtin_ia32_vfmaddsubps256 ((__v8sf) __A,
(__v8sf) __B,		(__v8sf) __B,
-(__v8sf) __C),		-(__v8sf) __C),
(__v8sf) __C);		(__v8sf) __C);
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_mask_fnmadd_pd(__m128d __A, __mmask8 __U, __m128d __B, __m128d __C)		_mm_mask_fnmadd_pd(__m128d __A, __mmask8 __U, __m128d __B, __m128d __C)
{		{
return (__m128d) __builtin_ia32_selectpd_128((__mmask8) __U,		return (__m128d) __builtin_ia32_selectpd_128((__mmask8) __U,
__builtin_ia32_vfmaddpd ((__v2df) __A,		__builtin_ia32_vfmaddpd ((__v2df) __A,
-(__v2df) __B,		-(__v2df) __B,
(__v2df) __C),		(__v2df) __C),
(__v2df) __A);		(__v2df) __A);
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_mask_fnmadd_pd(__m256d __A, __mmask8 __U, __m256d __B, __m256d __C)		_mm256_mask_fnmadd_pd(__m256d __A, __mmask8 __U, __m256d __B, __m256d __C)
{		{
return (__m256d) __builtin_ia32_selectpd_256((__mmask8) __U,		return (__m256d) __builtin_ia32_selectpd_256((__mmask8) __U,
__builtin_ia32_vfmaddpd256 ((__v4df) __A,		__builtin_ia32_vfmaddpd256 ((__v4df) __A,
-(__v4df) __B,		-(__v4df) __B,
(__v4df) __C),		(__v4df) __C),
(__v4df) __A);		(__v4df) __A);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_mask_fnmadd_ps(__m128 __A, __mmask8 __U, __m128 __B, __m128 __C)		_mm_mask_fnmadd_ps(__m128 __A, __mmask8 __U, __m128 __B, __m128 __C)
{		{
return (__m128) __builtin_ia32_selectps_128((__mmask8) __U,		return (__m128) __builtin_ia32_selectps_128((__mmask8) __U,
__builtin_ia32_vfmaddps ((__v4sf) __A,		__builtin_ia32_vfmaddps ((__v4sf) __A,
-(__v4sf) __B,		-(__v4sf) __B,
(__v4sf) __C),		(__v4sf) __C),
(__v4sf) __A);		(__v4sf) __A);
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_mask_fnmadd_ps(__m256 __A, __mmask8 __U, __m256 __B, __m256 __C)		_mm256_mask_fnmadd_ps(__m256 __A, __mmask8 __U, __m256 __B, __m256 __C)
{		{
return (__m256) __builtin_ia32_selectps_256((__mmask8) __U,		return (__m256) __builtin_ia32_selectps_256((__mmask8) __U,
__builtin_ia32_vfmaddps256 ((__v8sf) __A,		__builtin_ia32_vfmaddps256 ((__v8sf) __A,
-(__v8sf) __B,		-(__v8sf) __B,
(__v8sf) __C),		(__v8sf) __C),
(__v8sf) __A);		(__v8sf) __A);
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_mask_fnmsub_pd(__m128d __A, __mmask8 __U, __m128d __B, __m128d __C)		_mm_mask_fnmsub_pd(__m128d __A, __mmask8 __U, __m128d __B, __m128d __C)
{		{
return (__m128d) __builtin_ia32_selectpd_128((__mmask8) __U,		return (__m128d) __builtin_ia32_selectpd_128((__mmask8) __U,
__builtin_ia32_vfmaddpd ((__v2df) __A,		__builtin_ia32_vfmaddpd ((__v2df) __A,
-(__v2df) __B,		-(__v2df) __B,
-(__v2df) __C),		-(__v2df) __C),
(__v2df) __A);		(__v2df) __A);
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_mask3_fnmsub_pd(__m128d __A, __m128d __B, __m128d __C, __mmask8 __U)		_mm_mask3_fnmsub_pd(__m128d __A, __m128d __B, __m128d __C, __mmask8 __U)
{		{
return (__m128d) __builtin_ia32_selectpd_128((__mmask8) __U,		return (__m128d) __builtin_ia32_selectpd_128((__mmask8) __U,
__builtin_ia32_vfmaddpd ((__v2df) __A,		__builtin_ia32_vfmaddpd ((__v2df) __A,
-(__v2df) __B,		-(__v2df) __B,
-(__v2df) __C),		-(__v2df) __C),
(__v2df) __C);		(__v2df) __C);
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_mask_fnmsub_pd(__m256d __A, __mmask8 __U, __m256d __B, __m256d __C)		_mm256_mask_fnmsub_pd(__m256d __A, __mmask8 __U, __m256d __B, __m256d __C)
{		{
return (__m256d) __builtin_ia32_selectpd_256((__mmask8) __U,		return (__m256d) __builtin_ia32_selectpd_256((__mmask8) __U,
__builtin_ia32_vfmaddpd256 ((__v4df) __A,		__builtin_ia32_vfmaddpd256 ((__v4df) __A,
-(__v4df) __B,		-(__v4df) __B,
-(__v4df) __C),		-(__v4df) __C),
(__v4df) __A);		(__v4df) __A);
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_mask3_fnmsub_pd(__m256d __A, __m256d __B, __m256d __C, __mmask8 __U)		_mm256_mask3_fnmsub_pd(__m256d __A, __m256d __B, __m256d __C, __mmask8 __U)
{		{
return (__m256d) __builtin_ia32_selectpd_256((__mmask8) __U,		return (__m256d) __builtin_ia32_selectpd_256((__mmask8) __U,
__builtin_ia32_vfmaddpd256 ((__v4df) __A,		__builtin_ia32_vfmaddpd256 ((__v4df) __A,
-(__v4df) __B,		-(__v4df) __B,
-(__v4df) __C),		-(__v4df) __C),
(__v4df) __C);		(__v4df) __C);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_mask_fnmsub_ps(__m128 __A, __mmask8 __U, __m128 __B, __m128 __C)		_mm_mask_fnmsub_ps(__m128 __A, __mmask8 __U, __m128 __B, __m128 __C)
{		{
return (__m128) __builtin_ia32_selectps_128((__mmask8) __U,		return (__m128) __builtin_ia32_selectps_128((__mmask8) __U,
__builtin_ia32_vfmaddps ((__v4sf) __A,		__builtin_ia32_vfmaddps ((__v4sf) __A,
-(__v4sf) __B,		-(__v4sf) __B,
-(__v4sf) __C),		-(__v4sf) __C),
(__v4sf) __A);		(__v4sf) __A);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_mask3_fnmsub_ps(__m128 __A, __m128 __B, __m128 __C, __mmask8 __U)		_mm_mask3_fnmsub_ps(__m128 __A, __m128 __B, __m128 __C, __mmask8 __U)
{		{
return (__m128) __builtin_ia32_selectps_128((__mmask8) __U,		return (__m128) __builtin_ia32_selectps_128((__mmask8) __U,
__builtin_ia32_vfmaddps ((__v4sf) __A,		__builtin_ia32_vfmaddps ((__v4sf) __A,
-(__v4sf) __B,		-(__v4sf) __B,
-(__v4sf) __C),		-(__v4sf) __C),
(__v4sf) __C);		(__v4sf) __C);
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_mask_fnmsub_ps(__m256 __A, __mmask8 __U, __m256 __B, __m256 __C)		_mm256_mask_fnmsub_ps(__m256 __A, __mmask8 __U, __m256 __B, __m256 __C)
{		{
return (__m256) __builtin_ia32_selectps_256((__mmask8) __U,		return (__m256) __builtin_ia32_selectps_256((__mmask8) __U,
__builtin_ia32_vfmaddps256 ((__v8sf) __A,		__builtin_ia32_vfmaddps256 ((__v8sf) __A,
-(__v8sf) __B,		-(__v8sf) __B,
-(__v8sf) __C),		-(__v8sf) __C),
(__v8sf) __A);		(__v8sf) __A);
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_mask3_fnmsub_ps(__m256 __A, __m256 __B, __m256 __C, __mmask8 __U)		_mm256_mask3_fnmsub_ps(__m256 __A, __m256 __B, __m256 __C, __mmask8 __U)
{		{
return (__m256) __builtin_ia32_selectps_256((__mmask8) __U,		return (__m256) __builtin_ia32_selectps_256((__mmask8) __U,
__builtin_ia32_vfmaddps256 ((__v8sf) __A,		__builtin_ia32_vfmaddps256 ((__v8sf) __A,
-(__v8sf) __B,		-(__v8sf) __B,
-(__v8sf) __C),		-(__v8sf) __C),
(__v8sf) __C);		(__v8sf) __C);
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_mask_add_pd(__m128d __W, __mmask8 __U, __m128d __A, __m128d __B) {		_mm_mask_add_pd(__m128d __W, __mmask8 __U, __m128d __A, __m128d __B) {
return (__m128d)__builtin_ia32_selectpd_128((__mmask8)__U,		return (__m128d)__builtin_ia32_selectpd_128((__mmask8)__U,
(__v2df)_mm_add_pd(__A, __B),		(__v2df)_mm_add_pd(__A, __B),
(__v2df)__W);		(__v2df)__W);
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_maskz_add_pd(__mmask8 __U, __m128d __A, __m128d __B) {		_mm_maskz_add_pd(__mmask8 __U, __m128d __A, __m128d __B) {
return (__m128d)__builtin_ia32_selectpd_128((__mmask8)__U,		return (__m128d)__builtin_ia32_selectpd_128((__mmask8)__U,
(__v2df)_mm_add_pd(__A, __B),		(__v2df)_mm_add_pd(__A, __B),
(__v2df)_mm_setzero_pd());		(__v2df)_mm_setzero_pd());
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_mask_add_pd(__m256d __W, __mmask8 __U, __m256d __A, __m256d __B) {		_mm256_mask_add_pd(__m256d __W, __mmask8 __U, __m256d __A, __m256d __B) {
return (__m256d)__builtin_ia32_selectpd_256((__mmask8)__U,		return (__m256d)__builtin_ia32_selectpd_256((__mmask8)__U,
(__v4df)_mm256_add_pd(__A, __B),		(__v4df)_mm256_add_pd(__A, __B),
(__v4df)__W);		(__v4df)__W);
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_maskz_add_pd(__mmask8 __U, __m256d __A, __m256d __B) {		_mm256_maskz_add_pd(__mmask8 __U, __m256d __A, __m256d __B) {
return (__m256d)__builtin_ia32_selectpd_256((__mmask8)__U,		return (__m256d)__builtin_ia32_selectpd_256((__mmask8)__U,
(__v4df)_mm256_add_pd(__A, __B),		(__v4df)_mm256_add_pd(__A, __B),
(__v4df)_mm256_setzero_pd());		(__v4df)_mm256_setzero_pd());
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_mask_add_ps(__m128 __W, __mmask8 __U, __m128 __A, __m128 __B) {		_mm_mask_add_ps(__m128 __W, __mmask8 __U, __m128 __A, __m128 __B) {
return (__m128)__builtin_ia32_selectps_128((__mmask8)__U,		return (__m128)__builtin_ia32_selectps_128((__mmask8)__U,
(__v4sf)_mm_add_ps(__A, __B),		(__v4sf)_mm_add_ps(__A, __B),
(__v4sf)__W);		(__v4sf)__W);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_maskz_add_ps(__mmask8 __U, __m128 __A, __m128 __B) {		_mm_maskz_add_ps(__mmask8 __U, __m128 __A, __m128 __B) {
return (__m128)__builtin_ia32_selectps_128((__mmask8)__U,		return (__m128)__builtin_ia32_selectps_128((__mmask8)__U,
(__v4sf)_mm_add_ps(__A, __B),		(__v4sf)_mm_add_ps(__A, __B),
(__v4sf)_mm_setzero_ps());		(__v4sf)_mm_setzero_ps());
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_mask_add_ps(__m256 __W, __mmask8 __U, __m256 __A, __m256 __B) {		_mm256_mask_add_ps(__m256 __W, __mmask8 __U, __m256 __A, __m256 __B) {
return (__m256)__builtin_ia32_selectps_256((__mmask8)__U,		return (__m256)__builtin_ia32_selectps_256((__mmask8)__U,
(__v8sf)_mm256_add_ps(__A, __B),		(__v8sf)_mm256_add_ps(__A, __B),
(__v8sf)__W);		(__v8sf)__W);
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_maskz_add_ps(__mmask8 __U, __m256 __A, __m256 __B) {		_mm256_maskz_add_ps(__mmask8 __U, __m256 __A, __m256 __B) {
return (__m256)__builtin_ia32_selectps_256((__mmask8)__U,		return (__m256)__builtin_ia32_selectps_256((__mmask8)__U,
(__v8sf)_mm256_add_ps(__A, __B),		(__v8sf)_mm256_add_ps(__A, __B),
(__v8sf)_mm256_setzero_ps());		(__v8sf)_mm256_setzero_ps());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_blend_epi32 (__mmask8 __U, __m128i __A, __m128i __W) {		_mm_mask_blend_epi32 (__mmask8 __U, __m128i __A, __m128i __W) {
return (__m128i) __builtin_ia32_selectd_128 ((__mmask8) __U,		return (__m128i) __builtin_ia32_selectd_128 ((__mmask8) __U,
(__v4si) __W,		(__v4si) __W,
(__v4si) __A);		(__v4si) __A);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_blend_epi32 (__mmask8 __U, __m256i __A, __m256i __W) {		_mm256_mask_blend_epi32 (__mmask8 __U, __m256i __A, __m256i __W) {
return (__m256i) __builtin_ia32_selectd_256 ((__mmask8) __U,		return (__m256i) __builtin_ia32_selectd_256 ((__mmask8) __U,
(__v8si) __W,		(__v8si) __W,
(__v8si) __A);		(__v8si) __A);
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_mask_blend_pd (__mmask8 __U, __m128d __A, __m128d __W) {		_mm_mask_blend_pd (__mmask8 __U, __m128d __A, __m128d __W) {
return (__m128d) __builtin_ia32_selectpd_128 ((__mmask8) __U,		return (__m128d) __builtin_ia32_selectpd_128 ((__mmask8) __U,
(__v2df) __W,		(__v2df) __W,
(__v2df) __A);		(__v2df) __A);
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_mask_blend_pd (__mmask8 __U, __m256d __A, __m256d __W) {		_mm256_mask_blend_pd (__mmask8 __U, __m256d __A, __m256d __W) {
return (__m256d) __builtin_ia32_selectpd_256 ((__mmask8) __U,		return (__m256d) __builtin_ia32_selectpd_256 ((__mmask8) __U,
(__v4df) __W,		(__v4df) __W,
(__v4df) __A);		(__v4df) __A);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_mask_blend_ps (__mmask8 __U, __m128 __A, __m128 __W) {		_mm_mask_blend_ps (__mmask8 __U, __m128 __A, __m128 __W) {
return (__m128) __builtin_ia32_selectps_128 ((__mmask8) __U,		return (__m128) __builtin_ia32_selectps_128 ((__mmask8) __U,
(__v4sf) __W,		(__v4sf) __W,
(__v4sf) __A);		(__v4sf) __A);
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_mask_blend_ps (__mmask8 __U, __m256 __A, __m256 __W) {		_mm256_mask_blend_ps (__mmask8 __U, __m256 __A, __m256 __W) {
return (__m256) __builtin_ia32_selectps_256 ((__mmask8) __U,		return (__m256) __builtin_ia32_selectps_256 ((__mmask8) __U,
(__v8sf) __W,		(__v8sf) __W,
(__v8sf) __A);		(__v8sf) __A);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_blend_epi64 (__mmask8 __U, __m128i __A, __m128i __W) {		_mm_mask_blend_epi64 (__mmask8 __U, __m128i __A, __m128i __W) {
return (__m128i) __builtin_ia32_selectq_128 ((__mmask8) __U,		return (__m128i) __builtin_ia32_selectq_128 ((__mmask8) __U,
(__v2di) __W,		(__v2di) __W,
(__v2di) __A);		(__v2di) __A);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_blend_epi64 (__mmask8 __U, __m256i __A, __m256i __W) {		_mm256_mask_blend_epi64 (__mmask8 __U, __m256i __A, __m256i __W) {
return (__m256i) __builtin_ia32_selectq_256 ((__mmask8) __U,		return (__m256i) __builtin_ia32_selectq_256 ((__mmask8) __U,
(__v4di) __W,		(__v4di) __W,
(__v4di) __A);		(__v4di) __A);
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_mask_compress_pd (__m128d __W, __mmask8 __U, __m128d __A) {		_mm_mask_compress_pd (__m128d __W, __mmask8 __U, __m128d __A) {
return (__m128d) __builtin_ia32_compressdf128_mask ((__v2df) __A,		return (__m128d) __builtin_ia32_compressdf128_mask ((__v2df) __A,
(__v2df) __W,		(__v2df) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_maskz_compress_pd (__mmask8 __U, __m128d __A) {		_mm_maskz_compress_pd (__mmask8 __U, __m128d __A) {
return (__m128d) __builtin_ia32_compressdf128_mask ((__v2df) __A,		return (__m128d) __builtin_ia32_compressdf128_mask ((__v2df) __A,
(__v2df)		(__v2df)
_mm_setzero_pd (),		_mm_setzero_pd (),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_mask_compress_pd (__m256d __W, __mmask8 __U, __m256d __A) {		_mm256_mask_compress_pd (__m256d __W, __mmask8 __U, __m256d __A) {
return (__m256d) __builtin_ia32_compressdf256_mask ((__v4df) __A,		return (__m256d) __builtin_ia32_compressdf256_mask ((__v4df) __A,
(__v4df) __W,		(__v4df) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_maskz_compress_pd (__mmask8 __U, __m256d __A) {		_mm256_maskz_compress_pd (__mmask8 __U, __m256d __A) {
return (__m256d) __builtin_ia32_compressdf256_mask ((__v4df) __A,		return (__m256d) __builtin_ia32_compressdf256_mask ((__v4df) __A,
(__v4df)		(__v4df)
_mm256_setzero_pd (),		_mm256_setzero_pd (),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_compress_epi64 (__m128i __W, __mmask8 __U, __m128i __A) {		_mm_mask_compress_epi64 (__m128i __W, __mmask8 __U, __m128i __A) {
return (__m128i) __builtin_ia32_compressdi128_mask ((__v2di) __A,		return (__m128i) __builtin_ia32_compressdi128_mask ((__v2di) __A,
(__v2di) __W,		(__v2di) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_compress_epi64 (__mmask8 __U, __m128i __A) {		_mm_maskz_compress_epi64 (__mmask8 __U, __m128i __A) {
return (__m128i) __builtin_ia32_compressdi128_mask ((__v2di) __A,		return (__m128i) __builtin_ia32_compressdi128_mask ((__v2di) __A,
(__v2di)		(__v2di)
_mm_setzero_si128 (),		_mm_setzero_si128 (),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_compress_epi64 (__m256i __W, __mmask8 __U, __m256i __A) {		_mm256_mask_compress_epi64 (__m256i __W, __mmask8 __U, __m256i __A) {
return (__m256i) __builtin_ia32_compressdi256_mask ((__v4di) __A,		return (__m256i) __builtin_ia32_compressdi256_mask ((__v4di) __A,
(__v4di) __W,		(__v4di) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_compress_epi64 (__mmask8 __U, __m256i __A) {		_mm256_maskz_compress_epi64 (__mmask8 __U, __m256i __A) {
return (__m256i) __builtin_ia32_compressdi256_mask ((__v4di) __A,		return (__m256i) __builtin_ia32_compressdi256_mask ((__v4di) __A,
(__v4di)		(__v4di)
_mm256_setzero_si256 (),		_mm256_setzero_si256 (),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_mask_compress_ps (__m128 __W, __mmask8 __U, __m128 __A) {		_mm_mask_compress_ps (__m128 __W, __mmask8 __U, __m128 __A) {
return (__m128) __builtin_ia32_compresssf128_mask ((__v4sf) __A,		return (__m128) __builtin_ia32_compresssf128_mask ((__v4sf) __A,
(__v4sf) __W,		(__v4sf) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_maskz_compress_ps (__mmask8 __U, __m128 __A) {		_mm_maskz_compress_ps (__mmask8 __U, __m128 __A) {
return (__m128) __builtin_ia32_compresssf128_mask ((__v4sf) __A,		return (__m128) __builtin_ia32_compresssf128_mask ((__v4sf) __A,
(__v4sf)		(__v4sf)
_mm_setzero_ps (),		_mm_setzero_ps (),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_mask_compress_ps (__m256 __W, __mmask8 __U, __m256 __A) {		_mm256_mask_compress_ps (__m256 __W, __mmask8 __U, __m256 __A) {
return (__m256) __builtin_ia32_compresssf256_mask ((__v8sf) __A,		return (__m256) __builtin_ia32_compresssf256_mask ((__v8sf) __A,
(__v8sf) __W,		(__v8sf) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_maskz_compress_ps (__mmask8 __U, __m256 __A) {		_mm256_maskz_compress_ps (__mmask8 __U, __m256 __A) {
return (__m256) __builtin_ia32_compresssf256_mask ((__v8sf) __A,		return (__m256) __builtin_ia32_compresssf256_mask ((__v8sf) __A,
(__v8sf)		(__v8sf)
_mm256_setzero_ps (),		_mm256_setzero_ps (),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_compress_epi32 (__m128i __W, __mmask8 __U, __m128i __A) {		_mm_mask_compress_epi32 (__m128i __W, __mmask8 __U, __m128i __A) {
return (__m128i) __builtin_ia32_compresssi128_mask ((__v4si) __A,		return (__m128i) __builtin_ia32_compresssi128_mask ((__v4si) __A,
(__v4si) __W,		(__v4si) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_compress_epi32 (__mmask8 __U, __m128i __A) {		_mm_maskz_compress_epi32 (__mmask8 __U, __m128i __A) {
return (__m128i) __builtin_ia32_compresssi128_mask ((__v4si) __A,		return (__m128i) __builtin_ia32_compresssi128_mask ((__v4si) __A,
(__v4si)		(__v4si)
_mm_setzero_si128 (),		_mm_setzero_si128 (),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_compress_epi32 (__m256i __W, __mmask8 __U, __m256i __A) {		_mm256_mask_compress_epi32 (__m256i __W, __mmask8 __U, __m256i __A) {
return (__m256i) __builtin_ia32_compresssi256_mask ((__v8si) __A,		return (__m256i) __builtin_ia32_compresssi256_mask ((__v8si) __A,
(__v8si) __W,		(__v8si) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_compress_epi32 (__mmask8 __U, __m256i __A) {		_mm256_maskz_compress_epi32 (__mmask8 __U, __m256i __A) {
return (__m256i) __builtin_ia32_compresssi256_mask ((__v8si) __A,		return (__m256i) __builtin_ia32_compresssi256_mask ((__v8si) __A,
(__v8si)		(__v8si)
_mm256_setzero_si256 (),		_mm256_setzero_si256 (),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS128
_mm_mask_compressstoreu_pd (void *__P, __mmask8 __U, __m128d __A) {		_mm_mask_compressstoreu_pd (void *__P, __mmask8 __U, __m128d __A) {
__builtin_ia32_compressstoredf128_mask ((__v2df *) __P,		__builtin_ia32_compressstoredf128_mask ((__v2df *) __P,
(__v2df) __A,		(__v2df) __A,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS256
_mm256_mask_compressstoreu_pd (void *__P, __mmask8 __U, __m256d __A) {		_mm256_mask_compressstoreu_pd (void *__P, __mmask8 __U, __m256d __A) {
__builtin_ia32_compressstoredf256_mask ((__v4df *) __P,		__builtin_ia32_compressstoredf256_mask ((__v4df *) __P,
(__v4df) __A,		(__v4df) __A,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS128
_mm_mask_compressstoreu_epi64 (void *__P, __mmask8 __U, __m128i __A) {		_mm_mask_compressstoreu_epi64 (void *__P, __mmask8 __U, __m128i __A) {
__builtin_ia32_compressstoredi128_mask ((__v2di *) __P,		__builtin_ia32_compressstoredi128_mask ((__v2di *) __P,
(__v2di) __A,		(__v2di) __A,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS256
_mm256_mask_compressstoreu_epi64 (void *__P, __mmask8 __U, __m256i __A) {		_mm256_mask_compressstoreu_epi64 (void *__P, __mmask8 __U, __m256i __A) {
__builtin_ia32_compressstoredi256_mask ((__v4di *) __P,		__builtin_ia32_compressstoredi256_mask ((__v4di *) __P,
(__v4di) __A,		(__v4di) __A,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS128
_mm_mask_compressstoreu_ps (void *__P, __mmask8 __U, __m128 __A) {		_mm_mask_compressstoreu_ps (void *__P, __mmask8 __U, __m128 __A) {
__builtin_ia32_compressstoresf128_mask ((__v4sf *) __P,		__builtin_ia32_compressstoresf128_mask ((__v4sf *) __P,
(__v4sf) __A,		(__v4sf) __A,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS256
_mm256_mask_compressstoreu_ps (void *__P, __mmask8 __U, __m256 __A) {		_mm256_mask_compressstoreu_ps (void *__P, __mmask8 __U, __m256 __A) {
__builtin_ia32_compressstoresf256_mask ((__v8sf *) __P,		__builtin_ia32_compressstoresf256_mask ((__v8sf *) __P,
(__v8sf) __A,		(__v8sf) __A,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS128
_mm_mask_compressstoreu_epi32 (void *__P, __mmask8 __U, __m128i __A) {		_mm_mask_compressstoreu_epi32 (void *__P, __mmask8 __U, __m128i __A) {
__builtin_ia32_compressstoresi128_mask ((__v4si *) __P,		__builtin_ia32_compressstoresi128_mask ((__v4si *) __P,
(__v4si) __A,		(__v4si) __A,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS256
_mm256_mask_compressstoreu_epi32 (void *__P, __mmask8 __U, __m256i __A) {		_mm256_mask_compressstoreu_epi32 (void *__P, __mmask8 __U, __m256i __A) {
__builtin_ia32_compressstoresi256_mask ((__v8si *) __P,		__builtin_ia32_compressstoresi256_mask ((__v8si *) __P,
(__v8si) __A,		(__v8si) __A,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_mask_cvtepi32_pd (__m128d __W, __mmask8 __U, __m128i __A) {		_mm_mask_cvtepi32_pd (__m128d __W, __mmask8 __U, __m128i __A) {
return (__m128d)__builtin_ia32_selectpd_128((__mmask8) __U,		return (__m128d)__builtin_ia32_selectpd_128((__mmask8) __U,
(__v2df)_mm_cvtepi32_pd(__A),		(__v2df)_mm_cvtepi32_pd(__A),
(__v2df)__W);		(__v2df)__W);
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_maskz_cvtepi32_pd (__mmask8 __U, __m128i __A) {		_mm_maskz_cvtepi32_pd (__mmask8 __U, __m128i __A) {
return (__m128d)__builtin_ia32_selectpd_128((__mmask8) __U,		return (__m128d)__builtin_ia32_selectpd_128((__mmask8) __U,
(__v2df)_mm_cvtepi32_pd(__A),		(__v2df)_mm_cvtepi32_pd(__A),
(__v2df)_mm_setzero_pd());		(__v2df)_mm_setzero_pd());
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_mask_cvtepi32_pd (__m256d __W, __mmask8 __U, __m128i __A) {		_mm256_mask_cvtepi32_pd (__m256d __W, __mmask8 __U, __m128i __A) {
return (__m256d)__builtin_ia32_selectpd_256((__mmask8) __U,		return (__m256d)__builtin_ia32_selectpd_256((__mmask8) __U,
(__v4df)_mm256_cvtepi32_pd(__A),		(__v4df)_mm256_cvtepi32_pd(__A),
(__v4df)__W);		(__v4df)__W);
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_maskz_cvtepi32_pd (__mmask8 __U, __m128i __A) {		_mm256_maskz_cvtepi32_pd (__mmask8 __U, __m128i __A) {
return (__m256d)__builtin_ia32_selectpd_256((__mmask8) __U,		return (__m256d)__builtin_ia32_selectpd_256((__mmask8) __U,
(__v4df)_mm256_cvtepi32_pd(__A),		(__v4df)_mm256_cvtepi32_pd(__A),
(__v4df)_mm256_setzero_pd());		(__v4df)_mm256_setzero_pd());
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_mask_cvtepi32_ps (__m128 __W, __mmask8 __U, __m128i __A) {		_mm_mask_cvtepi32_ps (__m128 __W, __mmask8 __U, __m128i __A) {
return (__m128)__builtin_ia32_selectps_128((__mmask8)__U,		return (__m128)__builtin_ia32_selectps_128((__mmask8)__U,
(__v4sf)_mm_cvtepi32_ps(__A),		(__v4sf)_mm_cvtepi32_ps(__A),
(__v4sf)__W);		(__v4sf)__W);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_maskz_cvtepi32_ps (__mmask16 __U, __m128i __A) {		_mm_maskz_cvtepi32_ps (__mmask16 __U, __m128i __A) {
return (__m128)__builtin_ia32_selectps_128((__mmask8)__U,		return (__m128)__builtin_ia32_selectps_128((__mmask8)__U,
(__v4sf)_mm_cvtepi32_ps(__A),		(__v4sf)_mm_cvtepi32_ps(__A),
(__v4sf)_mm_setzero_ps());		(__v4sf)_mm_setzero_ps());
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_mask_cvtepi32_ps (__m256 __W, __mmask8 __U, __m256i __A) {		_mm256_mask_cvtepi32_ps (__m256 __W, __mmask8 __U, __m256i __A) {
return (__m256)__builtin_ia32_selectps_256((__mmask8)__U,		return (__m256)__builtin_ia32_selectps_256((__mmask8)__U,
(__v8sf)_mm256_cvtepi32_ps(__A),		(__v8sf)_mm256_cvtepi32_ps(__A),
(__v8sf)__W);		(__v8sf)__W);
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_maskz_cvtepi32_ps (__mmask16 __U, __m256i __A) {		_mm256_maskz_cvtepi32_ps (__mmask16 __U, __m256i __A) {
return (__m256)__builtin_ia32_selectps_256((__mmask8)__U,		return (__m256)__builtin_ia32_selectps_256((__mmask8)__U,
(__v8sf)_mm256_cvtepi32_ps(__A),		(__v8sf)_mm256_cvtepi32_ps(__A),
(__v8sf)_mm256_setzero_ps());		(__v8sf)_mm256_setzero_ps());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_cvtpd_epi32 (__m128i __W, __mmask8 __U, __m128d __A) {		_mm_mask_cvtpd_epi32 (__m128i __W, __mmask8 __U, __m128d __A) {
return (__m128i) __builtin_ia32_cvtpd2dq128_mask ((__v2df) __A,		return (__m128i) __builtin_ia32_cvtpd2dq128_mask ((__v2df) __A,
(__v4si) __W,		(__v4si) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_cvtpd_epi32 (__mmask8 __U, __m128d __A) {		_mm_maskz_cvtpd_epi32 (__mmask8 __U, __m128d __A) {
return (__m128i) __builtin_ia32_cvtpd2dq128_mask ((__v2df) __A,		return (__m128i) __builtin_ia32_cvtpd2dq128_mask ((__v2df) __A,
(__v4si)		(__v4si)
_mm_setzero_si128 (),		_mm_setzero_si128 (),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS256
_mm256_mask_cvtpd_epi32 (__m128i __W, __mmask8 __U, __m256d __A) {		_mm256_mask_cvtpd_epi32 (__m128i __W, __mmask8 __U, __m256d __A) {
return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,
(__v4si)_mm256_cvtpd_epi32(__A),		(__v4si)_mm256_cvtpd_epi32(__A),
(__v4si)__W);		(__v4si)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS256
_mm256_maskz_cvtpd_epi32 (__mmask8 __U, __m256d __A) {		_mm256_maskz_cvtpd_epi32 (__mmask8 __U, __m256d __A) {
return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,
(__v4si)_mm256_cvtpd_epi32(__A),		(__v4si)_mm256_cvtpd_epi32(__A),
(__v4si)_mm_setzero_si128());		(__v4si)_mm_setzero_si128());
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_mask_cvtpd_ps (__m128 __W, __mmask8 __U, __m128d __A) {		_mm_mask_cvtpd_ps (__m128 __W, __mmask8 __U, __m128d __A) {
return (__m128) __builtin_ia32_cvtpd2ps_mask ((__v2df) __A,		return (__m128) __builtin_ia32_cvtpd2ps_mask ((__v2df) __A,
(__v4sf) __W,		(__v4sf) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_maskz_cvtpd_ps (__mmask8 __U, __m128d __A) {		_mm_maskz_cvtpd_ps (__mmask8 __U, __m128d __A) {
return (__m128) __builtin_ia32_cvtpd2ps_mask ((__v2df) __A,		return (__m128) __builtin_ia32_cvtpd2ps_mask ((__v2df) __A,
(__v4sf)		(__v4sf)
_mm_setzero_ps (),		_mm_setzero_ps (),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS256
_mm256_mask_cvtpd_ps (__m128 __W, __mmask8 __U, __m256d __A) {		_mm256_mask_cvtpd_ps (__m128 __W, __mmask8 __U, __m256d __A) {
return (__m128)__builtin_ia32_selectps_128((__mmask8)__U,		return (__m128)__builtin_ia32_selectps_128((__mmask8)__U,
(__v4sf)_mm256_cvtpd_ps(__A),		(__v4sf)_mm256_cvtpd_ps(__A),
(__v4sf)__W);		(__v4sf)__W);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS256
_mm256_maskz_cvtpd_ps (__mmask8 __U, __m256d __A) {		_mm256_maskz_cvtpd_ps (__mmask8 __U, __m256d __A) {
return (__m128)__builtin_ia32_selectps_128((__mmask8)__U,		return (__m128)__builtin_ia32_selectps_128((__mmask8)__U,
(__v4sf)_mm256_cvtpd_ps(__A),		(__v4sf)_mm256_cvtpd_ps(__A),
(__v4sf)_mm_setzero_ps());		(__v4sf)_mm_setzero_ps());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_cvtpd_epu32 (__m128d __A) {		_mm_cvtpd_epu32 (__m128d __A) {
return (__m128i) __builtin_ia32_cvtpd2udq128_mask ((__v2df) __A,		return (__m128i) __builtin_ia32_cvtpd2udq128_mask ((__v2df) __A,
(__v4si)		(__v4si)
_mm_setzero_si128 (),		_mm_setzero_si128 (),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_cvtpd_epu32 (__m128i __W, __mmask8 __U, __m128d __A) {		_mm_mask_cvtpd_epu32 (__m128i __W, __mmask8 __U, __m128d __A) {
return (__m128i) __builtin_ia32_cvtpd2udq128_mask ((__v2df) __A,		return (__m128i) __builtin_ia32_cvtpd2udq128_mask ((__v2df) __A,
(__v4si) __W,		(__v4si) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_cvtpd_epu32 (__mmask8 __U, __m128d __A) {		_mm_maskz_cvtpd_epu32 (__mmask8 __U, __m128d __A) {
return (__m128i) __builtin_ia32_cvtpd2udq128_mask ((__v2df) __A,		return (__m128i) __builtin_ia32_cvtpd2udq128_mask ((__v2df) __A,
(__v4si)		(__v4si)
_mm_setzero_si128 (),		_mm_setzero_si128 (),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS256
_mm256_cvtpd_epu32 (__m256d __A) {		_mm256_cvtpd_epu32 (__m256d __A) {
return (__m128i) __builtin_ia32_cvtpd2udq256_mask ((__v4df) __A,		return (__m128i) __builtin_ia32_cvtpd2udq256_mask ((__v4df) __A,
(__v4si)		(__v4si)
_mm_setzero_si128 (),		_mm_setzero_si128 (),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS256
_mm256_mask_cvtpd_epu32 (__m128i __W, __mmask8 __U, __m256d __A) {		_mm256_mask_cvtpd_epu32 (__m128i __W, __mmask8 __U, __m256d __A) {
return (__m128i) __builtin_ia32_cvtpd2udq256_mask ((__v4df) __A,		return (__m128i) __builtin_ia32_cvtpd2udq256_mask ((__v4df) __A,
(__v4si) __W,		(__v4si) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS256
_mm256_maskz_cvtpd_epu32 (__mmask8 __U, __m256d __A) {		_mm256_maskz_cvtpd_epu32 (__mmask8 __U, __m256d __A) {
return (__m128i) __builtin_ia32_cvtpd2udq256_mask ((__v4df) __A,		return (__m128i) __builtin_ia32_cvtpd2udq256_mask ((__v4df) __A,
(__v4si)		(__v4si)
_mm_setzero_si128 (),		_mm_setzero_si128 (),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_cvtps_epi32 (__m128i __W, __mmask8 __U, __m128 __A) {		_mm_mask_cvtps_epi32 (__m128i __W, __mmask8 __U, __m128 __A) {
return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,
(__v4si)_mm_cvtps_epi32(__A),		(__v4si)_mm_cvtps_epi32(__A),
(__v4si)__W);		(__v4si)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_cvtps_epi32 (__mmask8 __U, __m128 __A) {		_mm_maskz_cvtps_epi32 (__mmask8 __U, __m128 __A) {
return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,
(__v4si)_mm_cvtps_epi32(__A),		(__v4si)_mm_cvtps_epi32(__A),
(__v4si)_mm_setzero_si128());		(__v4si)_mm_setzero_si128());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_cvtps_epi32 (__m256i __W, __mmask8 __U, __m256 __A) {		_mm256_mask_cvtps_epi32 (__m256i __W, __mmask8 __U, __m256 __A) {
return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,
(__v8si)_mm256_cvtps_epi32(__A),		(__v8si)_mm256_cvtps_epi32(__A),
(__v8si)__W);		(__v8si)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_cvtps_epi32 (__mmask8 __U, __m256 __A) {		_mm256_maskz_cvtps_epi32 (__mmask8 __U, __m256 __A) {
return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,
(__v8si)_mm256_cvtps_epi32(__A),		(__v8si)_mm256_cvtps_epi32(__A),
(__v8si)_mm256_setzero_si256());		(__v8si)_mm256_setzero_si256());
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_mask_cvtps_pd (__m128d __W, __mmask8 __U, __m128 __A) {		_mm_mask_cvtps_pd (__m128d __W, __mmask8 __U, __m128 __A) {
return (__m128d)__builtin_ia32_selectpd_128((__mmask8)__U,		return (__m128d)__builtin_ia32_selectpd_128((__mmask8)__U,
(__v2df)_mm_cvtps_pd(__A),		(__v2df)_mm_cvtps_pd(__A),
(__v2df)__W);		(__v2df)__W);
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_maskz_cvtps_pd (__mmask8 __U, __m128 __A) {		_mm_maskz_cvtps_pd (__mmask8 __U, __m128 __A) {
return (__m128d)__builtin_ia32_selectpd_128((__mmask8)__U,		return (__m128d)__builtin_ia32_selectpd_128((__mmask8)__U,
(__v2df)_mm_cvtps_pd(__A),		(__v2df)_mm_cvtps_pd(__A),
(__v2df)_mm_setzero_pd());		(__v2df)_mm_setzero_pd());
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_mask_cvtps_pd (__m256d __W, __mmask8 __U, __m128 __A) {		_mm256_mask_cvtps_pd (__m256d __W, __mmask8 __U, __m128 __A) {
return (__m256d)__builtin_ia32_selectpd_256((__mmask8)__U,		return (__m256d)__builtin_ia32_selectpd_256((__mmask8)__U,
(__v4df)_mm256_cvtps_pd(__A),		(__v4df)_mm256_cvtps_pd(__A),
(__v4df)__W);		(__v4df)__W);
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_maskz_cvtps_pd (__mmask8 __U, __m128 __A) {		_mm256_maskz_cvtps_pd (__mmask8 __U, __m128 __A) {
return (__m256d)__builtin_ia32_selectpd_256((__mmask8)__U,		return (__m256d)__builtin_ia32_selectpd_256((__mmask8)__U,
(__v4df)_mm256_cvtps_pd(__A),		(__v4df)_mm256_cvtps_pd(__A),
(__v4df)_mm256_setzero_pd());		(__v4df)_mm256_setzero_pd());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_cvtps_epu32 (__m128 __A) {		_mm_cvtps_epu32 (__m128 __A) {
return (__m128i) __builtin_ia32_cvtps2udq128_mask ((__v4sf) __A,		return (__m128i) __builtin_ia32_cvtps2udq128_mask ((__v4sf) __A,
(__v4si)		(__v4si)
_mm_setzero_si128 (),		_mm_setzero_si128 (),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_cvtps_epu32 (__m128i __W, __mmask8 __U, __m128 __A) {		_mm_mask_cvtps_epu32 (__m128i __W, __mmask8 __U, __m128 __A) {
return (__m128i) __builtin_ia32_cvtps2udq128_mask ((__v4sf) __A,		return (__m128i) __builtin_ia32_cvtps2udq128_mask ((__v4sf) __A,
(__v4si) __W,		(__v4si) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_cvtps_epu32 (__mmask8 __U, __m128 __A) {		_mm_maskz_cvtps_epu32 (__mmask8 __U, __m128 __A) {
return (__m128i) __builtin_ia32_cvtps2udq128_mask ((__v4sf) __A,		return (__m128i) __builtin_ia32_cvtps2udq128_mask ((__v4sf) __A,
(__v4si)		(__v4si)
_mm_setzero_si128 (),		_mm_setzero_si128 (),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_cvtps_epu32 (__m256 __A) {		_mm256_cvtps_epu32 (__m256 __A) {
return (__m256i) __builtin_ia32_cvtps2udq256_mask ((__v8sf) __A,		return (__m256i) __builtin_ia32_cvtps2udq256_mask ((__v8sf) __A,
(__v8si)		(__v8si)
_mm256_setzero_si256 (),		_mm256_setzero_si256 (),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_cvtps_epu32 (__m256i __W, __mmask8 __U, __m256 __A) {		_mm256_mask_cvtps_epu32 (__m256i __W, __mmask8 __U, __m256 __A) {
return (__m256i) __builtin_ia32_cvtps2udq256_mask ((__v8sf) __A,		return (__m256i) __builtin_ia32_cvtps2udq256_mask ((__v8sf) __A,
(__v8si) __W,		(__v8si) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_cvtps_epu32 (__mmask8 __U, __m256 __A) {		_mm256_maskz_cvtps_epu32 (__mmask8 __U, __m256 __A) {
return (__m256i) __builtin_ia32_cvtps2udq256_mask ((__v8sf) __A,		return (__m256i) __builtin_ia32_cvtps2udq256_mask ((__v8sf) __A,
(__v8si)		(__v8si)
_mm256_setzero_si256 (),		_mm256_setzero_si256 (),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_cvttpd_epi32 (__m128i __W, __mmask8 __U, __m128d __A) {		_mm_mask_cvttpd_epi32 (__m128i __W, __mmask8 __U, __m128d __A) {
return (__m128i) __builtin_ia32_cvttpd2dq128_mask ((__v2df) __A,		return (__m128i) __builtin_ia32_cvttpd2dq128_mask ((__v2df) __A,
(__v4si) __W,		(__v4si) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_cvttpd_epi32 (__mmask8 __U, __m128d __A) {		_mm_maskz_cvttpd_epi32 (__mmask8 __U, __m128d __A) {
return (__m128i) __builtin_ia32_cvttpd2dq128_mask ((__v2df) __A,		return (__m128i) __builtin_ia32_cvttpd2dq128_mask ((__v2df) __A,
(__v4si)		(__v4si)
_mm_setzero_si128 (),		_mm_setzero_si128 (),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS256
_mm256_mask_cvttpd_epi32 (__m128i __W, __mmask8 __U, __m256d __A) {		_mm256_mask_cvttpd_epi32 (__m128i __W, __mmask8 __U, __m256d __A) {
return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,
(__v4si)_mm256_cvttpd_epi32(__A),		(__v4si)_mm256_cvttpd_epi32(__A),
(__v4si)__W);		(__v4si)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS256
_mm256_maskz_cvttpd_epi32 (__mmask8 __U, __m256d __A) {		_mm256_maskz_cvttpd_epi32 (__mmask8 __U, __m256d __A) {
return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,
(__v4si)_mm256_cvttpd_epi32(__A),		(__v4si)_mm256_cvttpd_epi32(__A),
(__v4si)_mm_setzero_si128());		(__v4si)_mm_setzero_si128());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_cvttpd_epu32 (__m128d __A) {		_mm_cvttpd_epu32 (__m128d __A) {
return (__m128i) __builtin_ia32_cvttpd2udq128_mask ((__v2df) __A,		return (__m128i) __builtin_ia32_cvttpd2udq128_mask ((__v2df) __A,
(__v4si)		(__v4si)
_mm_setzero_si128 (),		_mm_setzero_si128 (),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_cvttpd_epu32 (__m128i __W, __mmask8 __U, __m128d __A) {		_mm_mask_cvttpd_epu32 (__m128i __W, __mmask8 __U, __m128d __A) {
return (__m128i) __builtin_ia32_cvttpd2udq128_mask ((__v2df) __A,		return (__m128i) __builtin_ia32_cvttpd2udq128_mask ((__v2df) __A,
(__v4si) __W,		(__v4si) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_cvttpd_epu32 (__mmask8 __U, __m128d __A) {		_mm_maskz_cvttpd_epu32 (__mmask8 __U, __m128d __A) {
return (__m128i) __builtin_ia32_cvttpd2udq128_mask ((__v2df) __A,		return (__m128i) __builtin_ia32_cvttpd2udq128_mask ((__v2df) __A,
(__v4si)		(__v4si)
_mm_setzero_si128 (),		_mm_setzero_si128 (),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS256
_mm256_cvttpd_epu32 (__m256d __A) {		_mm256_cvttpd_epu32 (__m256d __A) {
return (__m128i) __builtin_ia32_cvttpd2udq256_mask ((__v4df) __A,		return (__m128i) __builtin_ia32_cvttpd2udq256_mask ((__v4df) __A,
(__v4si)		(__v4si)
_mm_setzero_si128 (),		_mm_setzero_si128 (),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS256
_mm256_mask_cvttpd_epu32 (__m128i __W, __mmask8 __U, __m256d __A) {		_mm256_mask_cvttpd_epu32 (__m128i __W, __mmask8 __U, __m256d __A) {
return (__m128i) __builtin_ia32_cvttpd2udq256_mask ((__v4df) __A,		return (__m128i) __builtin_ia32_cvttpd2udq256_mask ((__v4df) __A,
(__v4si) __W,		(__v4si) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS256
_mm256_maskz_cvttpd_epu32 (__mmask8 __U, __m256d __A) {		_mm256_maskz_cvttpd_epu32 (__mmask8 __U, __m256d __A) {
return (__m128i) __builtin_ia32_cvttpd2udq256_mask ((__v4df) __A,		return (__m128i) __builtin_ia32_cvttpd2udq256_mask ((__v4df) __A,
(__v4si)		(__v4si)
_mm_setzero_si128 (),		_mm_setzero_si128 (),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_cvttps_epi32 (__m128i __W, __mmask8 __U, __m128 __A) {		_mm_mask_cvttps_epi32 (__m128i __W, __mmask8 __U, __m128 __A) {
return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,
(__v4si)_mm_cvttps_epi32(__A),		(__v4si)_mm_cvttps_epi32(__A),
(__v4si)__W);		(__v4si)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_cvttps_epi32 (__mmask8 __U, __m128 __A) {		_mm_maskz_cvttps_epi32 (__mmask8 __U, __m128 __A) {
return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,
(__v4si)_mm_cvttps_epi32(__A),		(__v4si)_mm_cvttps_epi32(__A),
(__v4si)_mm_setzero_si128());		(__v4si)_mm_setzero_si128());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_cvttps_epi32 (__m256i __W, __mmask8 __U, __m256 __A) {		_mm256_mask_cvttps_epi32 (__m256i __W, __mmask8 __U, __m256 __A) {
return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,
(__v8si)_mm256_cvttps_epi32(__A),		(__v8si)_mm256_cvttps_epi32(__A),
(__v8si)__W);		(__v8si)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_cvttps_epi32 (__mmask8 __U, __m256 __A) {		_mm256_maskz_cvttps_epi32 (__mmask8 __U, __m256 __A) {
return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,
(__v8si)_mm256_cvttps_epi32(__A),		(__v8si)_mm256_cvttps_epi32(__A),
(__v8si)_mm256_setzero_si256());		(__v8si)_mm256_setzero_si256());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_cvttps_epu32 (__m128 __A) {		_mm_cvttps_epu32 (__m128 __A) {
return (__m128i) __builtin_ia32_cvttps2udq128_mask ((__v4sf) __A,		return (__m128i) __builtin_ia32_cvttps2udq128_mask ((__v4sf) __A,
(__v4si)		(__v4si)
_mm_setzero_si128 (),		_mm_setzero_si128 (),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_cvttps_epu32 (__m128i __W, __mmask8 __U, __m128 __A) {		_mm_mask_cvttps_epu32 (__m128i __W, __mmask8 __U, __m128 __A) {
return (__m128i) __builtin_ia32_cvttps2udq128_mask ((__v4sf) __A,		return (__m128i) __builtin_ia32_cvttps2udq128_mask ((__v4sf) __A,
(__v4si) __W,		(__v4si) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_cvttps_epu32 (__mmask8 __U, __m128 __A) {		_mm_maskz_cvttps_epu32 (__mmask8 __U, __m128 __A) {
return (__m128i) __builtin_ia32_cvttps2udq128_mask ((__v4sf) __A,		return (__m128i) __builtin_ia32_cvttps2udq128_mask ((__v4sf) __A,
(__v4si)		(__v4si)
_mm_setzero_si128 (),		_mm_setzero_si128 (),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_cvttps_epu32 (__m256 __A) {		_mm256_cvttps_epu32 (__m256 __A) {
return (__m256i) __builtin_ia32_cvttps2udq256_mask ((__v8sf) __A,		return (__m256i) __builtin_ia32_cvttps2udq256_mask ((__v8sf) __A,
(__v8si)		(__v8si)
_mm256_setzero_si256 (),		_mm256_setzero_si256 (),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_cvttps_epu32 (__m256i __W, __mmask8 __U, __m256 __A) {		_mm256_mask_cvttps_epu32 (__m256i __W, __mmask8 __U, __m256 __A) {
return (__m256i) __builtin_ia32_cvttps2udq256_mask ((__v8sf) __A,		return (__m256i) __builtin_ia32_cvttps2udq256_mask ((__v8sf) __A,
(__v8si) __W,		(__v8si) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_cvttps_epu32 (__mmask8 __U, __m256 __A) {		_mm256_maskz_cvttps_epu32 (__mmask8 __U, __m256 __A) {
return (__m256i) __builtin_ia32_cvttps2udq256_mask ((__v8sf) __A,		return (__m256i) __builtin_ia32_cvttps2udq256_mask ((__v8sf) __A,
(__v8si)		(__v8si)
_mm256_setzero_si256 (),		_mm256_setzero_si256 (),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_cvtepu32_pd (__m128i __A) {		_mm_cvtepu32_pd (__m128i __A) {
return (__m128d) __builtin_convertvector(		return (__m128d) __builtin_convertvector(
__builtin_shufflevector((__v4su)__A, (__v4su)__A, 0, 1), __v2df);		__builtin_shufflevector((__v4su)__A, (__v4su)__A, 0, 1), __v2df);
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_mask_cvtepu32_pd (__m128d __W, __mmask8 __U, __m128i __A) {		_mm_mask_cvtepu32_pd (__m128d __W, __mmask8 __U, __m128i __A) {
return (__m128d)__builtin_ia32_selectpd_128((__mmask8) __U,		return (__m128d)__builtin_ia32_selectpd_128((__mmask8) __U,
(__v2df)_mm_cvtepu32_pd(__A),		(__v2df)_mm_cvtepu32_pd(__A),
(__v2df)__W);		(__v2df)__W);
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_maskz_cvtepu32_pd (__mmask8 __U, __m128i __A) {		_mm_maskz_cvtepu32_pd (__mmask8 __U, __m128i __A) {
return (__m128d)__builtin_ia32_selectpd_128((__mmask8) __U,		return (__m128d)__builtin_ia32_selectpd_128((__mmask8) __U,
(__v2df)_mm_cvtepu32_pd(__A),		(__v2df)_mm_cvtepu32_pd(__A),
(__v2df)_mm_setzero_pd());		(__v2df)_mm_setzero_pd());
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_cvtepu32_pd (__m128i __A) {		_mm256_cvtepu32_pd (__m128i __A) {
return (__m256d)__builtin_convertvector((__v4su)__A, __v4df);		return (__m256d)__builtin_convertvector((__v4su)__A, __v4df);
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_mask_cvtepu32_pd (__m256d __W, __mmask8 __U, __m128i __A) {		_mm256_mask_cvtepu32_pd (__m256d __W, __mmask8 __U, __m128i __A) {
return (__m256d)__builtin_ia32_selectpd_256((__mmask8) __U,		return (__m256d)__builtin_ia32_selectpd_256((__mmask8) __U,
(__v4df)_mm256_cvtepu32_pd(__A),		(__v4df)_mm256_cvtepu32_pd(__A),
(__v4df)__W);		(__v4df)__W);
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_maskz_cvtepu32_pd (__mmask8 __U, __m128i __A) {		_mm256_maskz_cvtepu32_pd (__mmask8 __U, __m128i __A) {
return (__m256d)__builtin_ia32_selectpd_256((__mmask8) __U,		return (__m256d)__builtin_ia32_selectpd_256((__mmask8) __U,
(__v4df)_mm256_cvtepu32_pd(__A),		(__v4df)_mm256_cvtepu32_pd(__A),
(__v4df)_mm256_setzero_pd());		(__v4df)_mm256_setzero_pd());
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_cvtepu32_ps (__m128i __A) {		_mm_cvtepu32_ps (__m128i __A) {
return (__m128)__builtin_convertvector((__v4su)__A, __v4sf);		return (__m128)__builtin_convertvector((__v4su)__A, __v4sf);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_mask_cvtepu32_ps (__m128 __W, __mmask8 __U, __m128i __A) {		_mm_mask_cvtepu32_ps (__m128 __W, __mmask8 __U, __m128i __A) {
return (__m128)__builtin_ia32_selectps_128((__mmask8)__U,		return (__m128)__builtin_ia32_selectps_128((__mmask8)__U,
(__v4sf)_mm_cvtepu32_ps(__A),		(__v4sf)_mm_cvtepu32_ps(__A),
(__v4sf)__W);		(__v4sf)__W);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_maskz_cvtepu32_ps (__mmask8 __U, __m128i __A) {		_mm_maskz_cvtepu32_ps (__mmask8 __U, __m128i __A) {
return (__m128)__builtin_ia32_selectps_128((__mmask8)__U,		return (__m128)__builtin_ia32_selectps_128((__mmask8)__U,
(__v4sf)_mm_cvtepu32_ps(__A),		(__v4sf)_mm_cvtepu32_ps(__A),
(__v4sf)_mm_setzero_ps());		(__v4sf)_mm_setzero_ps());
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_cvtepu32_ps (__m256i __A) {		_mm256_cvtepu32_ps (__m256i __A) {
return (__m256)__builtin_convertvector((__v8su)__A, __v8sf);		return (__m256)__builtin_convertvector((__v8su)__A, __v8sf);
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_mask_cvtepu32_ps (__m256 __W, __mmask8 __U, __m256i __A) {		_mm256_mask_cvtepu32_ps (__m256 __W, __mmask8 __U, __m256i __A) {
return (__m256)__builtin_ia32_selectps_256((__mmask8)__U,		return (__m256)__builtin_ia32_selectps_256((__mmask8)__U,
(__v8sf)_mm256_cvtepu32_ps(__A),		(__v8sf)_mm256_cvtepu32_ps(__A),
(__v8sf)__W);		(__v8sf)__W);
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_maskz_cvtepu32_ps (__mmask8 __U, __m256i __A) {		_mm256_maskz_cvtepu32_ps (__mmask8 __U, __m256i __A) {
return (__m256)__builtin_ia32_selectps_256((__mmask8)__U,		return (__m256)__builtin_ia32_selectps_256((__mmask8)__U,
(__v8sf)_mm256_cvtepu32_ps(__A),		(__v8sf)_mm256_cvtepu32_ps(__A),
(__v8sf)_mm256_setzero_ps());		(__v8sf)_mm256_setzero_ps());
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_mask_div_pd(__m128d __W, __mmask8 __U, __m128d __A, __m128d __B) {		_mm_mask_div_pd(__m128d __W, __mmask8 __U, __m128d __A, __m128d __B) {
return (__m128d)__builtin_ia32_selectpd_128((__mmask8)__U,		return (__m128d)__builtin_ia32_selectpd_128((__mmask8)__U,
(__v2df)_mm_div_pd(__A, __B),		(__v2df)_mm_div_pd(__A, __B),
(__v2df)__W);		(__v2df)__W);
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_maskz_div_pd(__mmask8 __U, __m128d __A, __m128d __B) {		_mm_maskz_div_pd(__mmask8 __U, __m128d __A, __m128d __B) {
return (__m128d)__builtin_ia32_selectpd_128((__mmask8)__U,		return (__m128d)__builtin_ia32_selectpd_128((__mmask8)__U,
(__v2df)_mm_div_pd(__A, __B),		(__v2df)_mm_div_pd(__A, __B),
(__v2df)_mm_setzero_pd());		(__v2df)_mm_setzero_pd());
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_mask_div_pd(__m256d __W, __mmask8 __U, __m256d __A, __m256d __B) {		_mm256_mask_div_pd(__m256d __W, __mmask8 __U, __m256d __A, __m256d __B) {
return (__m256d)__builtin_ia32_selectpd_256((__mmask8)__U,		return (__m256d)__builtin_ia32_selectpd_256((__mmask8)__U,
(__v4df)_mm256_div_pd(__A, __B),		(__v4df)_mm256_div_pd(__A, __B),
(__v4df)__W);		(__v4df)__W);
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_maskz_div_pd(__mmask8 __U, __m256d __A, __m256d __B) {		_mm256_maskz_div_pd(__mmask8 __U, __m256d __A, __m256d __B) {
return (__m256d)__builtin_ia32_selectpd_256((__mmask8)__U,		return (__m256d)__builtin_ia32_selectpd_256((__mmask8)__U,
(__v4df)_mm256_div_pd(__A, __B),		(__v4df)_mm256_div_pd(__A, __B),
(__v4df)_mm256_setzero_pd());		(__v4df)_mm256_setzero_pd());
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_mask_div_ps(__m128 __W, __mmask8 __U, __m128 __A, __m128 __B) {		_mm_mask_div_ps(__m128 __W, __mmask8 __U, __m128 __A, __m128 __B) {
return (__m128)__builtin_ia32_selectps_128((__mmask8)__U,		return (__m128)__builtin_ia32_selectps_128((__mmask8)__U,
(__v4sf)_mm_div_ps(__A, __B),		(__v4sf)_mm_div_ps(__A, __B),
(__v4sf)__W);		(__v4sf)__W);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_maskz_div_ps(__mmask8 __U, __m128 __A, __m128 __B) {		_mm_maskz_div_ps(__mmask8 __U, __m128 __A, __m128 __B) {
return (__m128)__builtin_ia32_selectps_128((__mmask8)__U,		return (__m128)__builtin_ia32_selectps_128((__mmask8)__U,
(__v4sf)_mm_div_ps(__A, __B),		(__v4sf)_mm_div_ps(__A, __B),
(__v4sf)_mm_setzero_ps());		(__v4sf)_mm_setzero_ps());
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_mask_div_ps(__m256 __W, __mmask8 __U, __m256 __A, __m256 __B) {		_mm256_mask_div_ps(__m256 __W, __mmask8 __U, __m256 __A, __m256 __B) {
return (__m256)__builtin_ia32_selectps_256((__mmask8)__U,		return (__m256)__builtin_ia32_selectps_256((__mmask8)__U,
(__v8sf)_mm256_div_ps(__A, __B),		(__v8sf)_mm256_div_ps(__A, __B),
(__v8sf)__W);		(__v8sf)__W);
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_maskz_div_ps(__mmask8 __U, __m256 __A, __m256 __B) {		_mm256_maskz_div_ps(__mmask8 __U, __m256 __A, __m256 __B) {
return (__m256)__builtin_ia32_selectps_256((__mmask8)__U,		return (__m256)__builtin_ia32_selectps_256((__mmask8)__U,
(__v8sf)_mm256_div_ps(__A, __B),		(__v8sf)_mm256_div_ps(__A, __B),
(__v8sf)_mm256_setzero_ps());		(__v8sf)_mm256_setzero_ps());
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_mask_expand_pd (__m128d __W, __mmask8 __U, __m128d __A) {		_mm_mask_expand_pd (__m128d __W, __mmask8 __U, __m128d __A) {
return (__m128d) __builtin_ia32_expanddf128_mask ((__v2df) __A,		return (__m128d) __builtin_ia32_expanddf128_mask ((__v2df) __A,
(__v2df) __W,		(__v2df) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_maskz_expand_pd (__mmask8 __U, __m128d __A) {		_mm_maskz_expand_pd (__mmask8 __U, __m128d __A) {
return (__m128d) __builtin_ia32_expanddf128_mask ((__v2df) __A,		return (__m128d) __builtin_ia32_expanddf128_mask ((__v2df) __A,
(__v2df)		(__v2df)
_mm_setzero_pd (),		_mm_setzero_pd (),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_mask_expand_pd (__m256d __W, __mmask8 __U, __m256d __A) {		_mm256_mask_expand_pd (__m256d __W, __mmask8 __U, __m256d __A) {
return (__m256d) __builtin_ia32_expanddf256_mask ((__v4df) __A,		return (__m256d) __builtin_ia32_expanddf256_mask ((__v4df) __A,
(__v4df) __W,		(__v4df) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_maskz_expand_pd (__mmask8 __U, __m256d __A) {		_mm256_maskz_expand_pd (__mmask8 __U, __m256d __A) {
return (__m256d) __builtin_ia32_expanddf256_mask ((__v4df) __A,		return (__m256d) __builtin_ia32_expanddf256_mask ((__v4df) __A,
(__v4df)		(__v4df)
_mm256_setzero_pd (),		_mm256_setzero_pd (),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_expand_epi64 (__m128i __W, __mmask8 __U, __m128i __A) {		_mm_mask_expand_epi64 (__m128i __W, __mmask8 __U, __m128i __A) {
return (__m128i) __builtin_ia32_expanddi128_mask ((__v2di) __A,		return (__m128i) __builtin_ia32_expanddi128_mask ((__v2di) __A,
(__v2di) __W,		(__v2di) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_expand_epi64 (__mmask8 __U, __m128i __A) {		_mm_maskz_expand_epi64 (__mmask8 __U, __m128i __A) {
return (__m128i) __builtin_ia32_expanddi128_mask ((__v2di) __A,		return (__m128i) __builtin_ia32_expanddi128_mask ((__v2di) __A,
(__v2di)		(__v2di)
_mm_setzero_si128 (),		_mm_setzero_si128 (),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_expand_epi64 (__m256i __W, __mmask8 __U, __m256i __A) {		_mm256_mask_expand_epi64 (__m256i __W, __mmask8 __U, __m256i __A) {
return (__m256i) __builtin_ia32_expanddi256_mask ((__v4di) __A,		return (__m256i) __builtin_ia32_expanddi256_mask ((__v4di) __A,
(__v4di) __W,		(__v4di) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_expand_epi64 (__mmask8 __U, __m256i __A) {		_mm256_maskz_expand_epi64 (__mmask8 __U, __m256i __A) {
return (__m256i) __builtin_ia32_expanddi256_mask ((__v4di) __A,		return (__m256i) __builtin_ia32_expanddi256_mask ((__v4di) __A,
(__v4di)		(__v4di)
_mm256_setzero_si256 (),		_mm256_setzero_si256 (),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_mask_expandloadu_pd (__m128d __W, __mmask8 __U, void const *__P) {		_mm_mask_expandloadu_pd (__m128d __W, __mmask8 __U, void const *__P) {
return (__m128d) __builtin_ia32_expandloaddf128_mask ((__v2df *) __P,		return (__m128d) __builtin_ia32_expandloaddf128_mask ((__v2df *) __P,
(__v2df) __W,		(__v2df) __W,
(__mmask8)		(__mmask8)
__U);		__U);
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_maskz_expandloadu_pd (__mmask8 __U, void const *__P) {		_mm_maskz_expandloadu_pd (__mmask8 __U, void const *__P) {
return (__m128d) __builtin_ia32_expandloaddf128_mask ((__v2df *) __P,		return (__m128d) __builtin_ia32_expandloaddf128_mask ((__v2df *) __P,
(__v2df)		(__v2df)
_mm_setzero_pd (),		_mm_setzero_pd (),
(__mmask8)		(__mmask8)
__U);		__U);
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_mask_expandloadu_pd (__m256d __W, __mmask8 __U, void const *__P) {		_mm256_mask_expandloadu_pd (__m256d __W, __mmask8 __U, void const *__P) {
return (__m256d) __builtin_ia32_expandloaddf256_mask ((__v4df *) __P,		return (__m256d) __builtin_ia32_expandloaddf256_mask ((__v4df *) __P,
(__v4df) __W,		(__v4df) __W,
(__mmask8)		(__mmask8)
__U);		__U);
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_maskz_expandloadu_pd (__mmask8 __U, void const *__P) {		_mm256_maskz_expandloadu_pd (__mmask8 __U, void const *__P) {
return (__m256d) __builtin_ia32_expandloaddf256_mask ((__v4df *) __P,		return (__m256d) __builtin_ia32_expandloaddf256_mask ((__v4df *) __P,
(__v4df)		(__v4df)
_mm256_setzero_pd (),		_mm256_setzero_pd (),
(__mmask8)		(__mmask8)
__U);		__U);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_expandloadu_epi64 (__m128i __W, __mmask8 __U, void const *__P) {		_mm_mask_expandloadu_epi64 (__m128i __W, __mmask8 __U, void const *__P) {
return (__m128i) __builtin_ia32_expandloaddi128_mask ((__v2di *) __P,		return (__m128i) __builtin_ia32_expandloaddi128_mask ((__v2di *) __P,
(__v2di) __W,		(__v2di) __W,
(__mmask8)		(__mmask8)
__U);		__U);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_expandloadu_epi64 (__mmask8 __U, void const *__P) {		_mm_maskz_expandloadu_epi64 (__mmask8 __U, void const *__P) {
return (__m128i) __builtin_ia32_expandloaddi128_mask ((__v2di *) __P,		return (__m128i) __builtin_ia32_expandloaddi128_mask ((__v2di *) __P,
(__v2di)		(__v2di)
_mm_setzero_si128 (),		_mm_setzero_si128 (),
(__mmask8)		(__mmask8)
__U);		__U);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_expandloadu_epi64 (__m256i __W, __mmask8 __U,		_mm256_mask_expandloadu_epi64 (__m256i __W, __mmask8 __U,
void const *__P) {		void const *__P) {
return (__m256i) __builtin_ia32_expandloaddi256_mask ((__v4di *) __P,		return (__m256i) __builtin_ia32_expandloaddi256_mask ((__v4di *) __P,
(__v4di) __W,		(__v4di) __W,
(__mmask8)		(__mmask8)
__U);		__U);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_expandloadu_epi64 (__mmask8 __U, void const *__P) {		_mm256_maskz_expandloadu_epi64 (__mmask8 __U, void const *__P) {
return (__m256i) __builtin_ia32_expandloaddi256_mask ((__v4di *) __P,		return (__m256i) __builtin_ia32_expandloaddi256_mask ((__v4di *) __P,
(__v4di)		(__v4di)
_mm256_setzero_si256 (),		_mm256_setzero_si256 (),
(__mmask8)		(__mmask8)
__U);		__U);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_mask_expandloadu_ps (__m128 __W, __mmask8 __U, void const *__P) {		_mm_mask_expandloadu_ps (__m128 __W, __mmask8 __U, void const *__P) {
return (__m128) __builtin_ia32_expandloadsf128_mask ((__v4sf *) __P,		return (__m128) __builtin_ia32_expandloadsf128_mask ((__v4sf *) __P,
(__v4sf) __W,		(__v4sf) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_maskz_expandloadu_ps (__mmask8 __U, void const *__P) {		_mm_maskz_expandloadu_ps (__mmask8 __U, void const *__P) {
return (__m128) __builtin_ia32_expandloadsf128_mask ((__v4sf *) __P,		return (__m128) __builtin_ia32_expandloadsf128_mask ((__v4sf *) __P,
(__v4sf)		(__v4sf)
_mm_setzero_ps (),		_mm_setzero_ps (),
(__mmask8)		(__mmask8)
__U);		__U);
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_mask_expandloadu_ps (__m256 __W, __mmask8 __U, void const *__P) {		_mm256_mask_expandloadu_ps (__m256 __W, __mmask8 __U, void const *__P) {
return (__m256) __builtin_ia32_expandloadsf256_mask ((__v8sf *) __P,		return (__m256) __builtin_ia32_expandloadsf256_mask ((__v8sf *) __P,
(__v8sf) __W,		(__v8sf) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_maskz_expandloadu_ps (__mmask8 __U, void const *__P) {		_mm256_maskz_expandloadu_ps (__mmask8 __U, void const *__P) {
return (__m256) __builtin_ia32_expandloadsf256_mask ((__v8sf *) __P,		return (__m256) __builtin_ia32_expandloadsf256_mask ((__v8sf *) __P,
(__v8sf)		(__v8sf)
_mm256_setzero_ps (),		_mm256_setzero_ps (),
(__mmask8)		(__mmask8)
__U);		__U);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_expandloadu_epi32 (__m128i __W, __mmask8 __U, void const *__P) {		_mm_mask_expandloadu_epi32 (__m128i __W, __mmask8 __U, void const *__P) {
return (__m128i) __builtin_ia32_expandloadsi128_mask ((__v4si *) __P,		return (__m128i) __builtin_ia32_expandloadsi128_mask ((__v4si *) __P,
(__v4si) __W,		(__v4si) __W,
(__mmask8)		(__mmask8)
__U);		__U);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_expandloadu_epi32 (__mmask8 __U, void const *__P) {		_mm_maskz_expandloadu_epi32 (__mmask8 __U, void const *__P) {
return (__m128i) __builtin_ia32_expandloadsi128_mask ((__v4si *) __P,		return (__m128i) __builtin_ia32_expandloadsi128_mask ((__v4si *) __P,
(__v4si)		(__v4si)
_mm_setzero_si128 (),		_mm_setzero_si128 (),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_expandloadu_epi32 (__m256i __W, __mmask8 __U,		_mm256_mask_expandloadu_epi32 (__m256i __W, __mmask8 __U,
void const *__P) {		void const *__P) {
return (__m256i) __builtin_ia32_expandloadsi256_mask ((__v8si *) __P,		return (__m256i) __builtin_ia32_expandloadsi256_mask ((__v8si *) __P,
(__v8si) __W,		(__v8si) __W,
(__mmask8)		(__mmask8)
__U);		__U);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_expandloadu_epi32 (__mmask8 __U, void const *__P) {		_mm256_maskz_expandloadu_epi32 (__mmask8 __U, void const *__P) {
return (__m256i) __builtin_ia32_expandloadsi256_mask ((__v8si *) __P,		return (__m256i) __builtin_ia32_expandloadsi256_mask ((__v8si *) __P,
(__v8si)		(__v8si)
_mm256_setzero_si256 (),		_mm256_setzero_si256 (),
(__mmask8)		(__mmask8)
__U);		__U);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_mask_expand_ps (__m128 __W, __mmask8 __U, __m128 __A) {		_mm_mask_expand_ps (__m128 __W, __mmask8 __U, __m128 __A) {
return (__m128) __builtin_ia32_expandsf128_mask ((__v4sf) __A,		return (__m128) __builtin_ia32_expandsf128_mask ((__v4sf) __A,
(__v4sf) __W,		(__v4sf) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_maskz_expand_ps (__mmask8 __U, __m128 __A) {		_mm_maskz_expand_ps (__mmask8 __U, __m128 __A) {
return (__m128) __builtin_ia32_expandsf128_mask ((__v4sf) __A,		return (__m128) __builtin_ia32_expandsf128_mask ((__v4sf) __A,
(__v4sf)		(__v4sf)
_mm_setzero_ps (),		_mm_setzero_ps (),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_mask_expand_ps (__m256 __W, __mmask8 __U, __m256 __A) {		_mm256_mask_expand_ps (__m256 __W, __mmask8 __U, __m256 __A) {
return (__m256) __builtin_ia32_expandsf256_mask ((__v8sf) __A,		return (__m256) __builtin_ia32_expandsf256_mask ((__v8sf) __A,
(__v8sf) __W,		(__v8sf) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_maskz_expand_ps (__mmask8 __U, __m256 __A) {		_mm256_maskz_expand_ps (__mmask8 __U, __m256 __A) {
return (__m256) __builtin_ia32_expandsf256_mask ((__v8sf) __A,		return (__m256) __builtin_ia32_expandsf256_mask ((__v8sf) __A,
(__v8sf)		(__v8sf)
_mm256_setzero_ps (),		_mm256_setzero_ps (),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_expand_epi32 (__m128i __W, __mmask8 __U, __m128i __A) {		_mm_mask_expand_epi32 (__m128i __W, __mmask8 __U, __m128i __A) {
return (__m128i) __builtin_ia32_expandsi128_mask ((__v4si) __A,		return (__m128i) __builtin_ia32_expandsi128_mask ((__v4si) __A,
(__v4si) __W,		(__v4si) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_expand_epi32 (__mmask8 __U, __m128i __A) {		_mm_maskz_expand_epi32 (__mmask8 __U, __m128i __A) {
return (__m128i) __builtin_ia32_expandsi128_mask ((__v4si) __A,		return (__m128i) __builtin_ia32_expandsi128_mask ((__v4si) __A,
(__v4si)		(__v4si)
_mm_setzero_si128 (),		_mm_setzero_si128 (),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_expand_epi32 (__m256i __W, __mmask8 __U, __m256i __A) {		_mm256_mask_expand_epi32 (__m256i __W, __mmask8 __U, __m256i __A) {
return (__m256i) __builtin_ia32_expandsi256_mask ((__v8si) __A,		return (__m256i) __builtin_ia32_expandsi256_mask ((__v8si) __A,
(__v8si) __W,		(__v8si) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_expand_epi32 (__mmask8 __U, __m256i __A) {		_mm256_maskz_expand_epi32 (__mmask8 __U, __m256i __A) {
return (__m256i) __builtin_ia32_expandsi256_mask ((__v8si) __A,		return (__m256i) __builtin_ia32_expandsi256_mask ((__v8si) __A,
(__v8si)		(__v8si)
_mm256_setzero_si256 (),		_mm256_setzero_si256 (),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_getexp_pd (__m128d __A) {		_mm_getexp_pd (__m128d __A) {
return (__m128d) __builtin_ia32_getexppd128_mask ((__v2df) __A,		return (__m128d) __builtin_ia32_getexppd128_mask ((__v2df) __A,
(__v2df)		(__v2df)
_mm_setzero_pd (),		_mm_setzero_pd (),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_mask_getexp_pd (__m128d __W, __mmask8 __U, __m128d __A) {		_mm_mask_getexp_pd (__m128d __W, __mmask8 __U, __m128d __A) {
return (__m128d) __builtin_ia32_getexppd128_mask ((__v2df) __A,		return (__m128d) __builtin_ia32_getexppd128_mask ((__v2df) __A,
(__v2df) __W,		(__v2df) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_maskz_getexp_pd (__mmask8 __U, __m128d __A) {		_mm_maskz_getexp_pd (__mmask8 __U, __m128d __A) {
return (__m128d) __builtin_ia32_getexppd128_mask ((__v2df) __A,		return (__m128d) __builtin_ia32_getexppd128_mask ((__v2df) __A,
(__v2df)		(__v2df)
_mm_setzero_pd (),		_mm_setzero_pd (),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_getexp_pd (__m256d __A) {		_mm256_getexp_pd (__m256d __A) {
return (__m256d) __builtin_ia32_getexppd256_mask ((__v4df) __A,		return (__m256d) __builtin_ia32_getexppd256_mask ((__v4df) __A,
(__v4df)		(__v4df)
_mm256_setzero_pd (),		_mm256_setzero_pd (),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_mask_getexp_pd (__m256d __W, __mmask8 __U, __m256d __A) {		_mm256_mask_getexp_pd (__m256d __W, __mmask8 __U, __m256d __A) {
return (__m256d) __builtin_ia32_getexppd256_mask ((__v4df) __A,		return (__m256d) __builtin_ia32_getexppd256_mask ((__v4df) __A,
(__v4df) __W,		(__v4df) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_maskz_getexp_pd (__mmask8 __U, __m256d __A) {		_mm256_maskz_getexp_pd (__mmask8 __U, __m256d __A) {
return (__m256d) __builtin_ia32_getexppd256_mask ((__v4df) __A,		return (__m256d) __builtin_ia32_getexppd256_mask ((__v4df) __A,
(__v4df)		(__v4df)
_mm256_setzero_pd (),		_mm256_setzero_pd (),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_getexp_ps (__m128 __A) {		_mm_getexp_ps (__m128 __A) {
return (__m128) __builtin_ia32_getexpps128_mask ((__v4sf) __A,		return (__m128) __builtin_ia32_getexpps128_mask ((__v4sf) __A,
(__v4sf)		(__v4sf)
_mm_setzero_ps (),		_mm_setzero_ps (),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_mask_getexp_ps (__m128 __W, __mmask8 __U, __m128 __A) {		_mm_mask_getexp_ps (__m128 __W, __mmask8 __U, __m128 __A) {
return (__m128) __builtin_ia32_getexpps128_mask ((__v4sf) __A,		return (__m128) __builtin_ia32_getexpps128_mask ((__v4sf) __A,
(__v4sf) __W,		(__v4sf) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_maskz_getexp_ps (__mmask8 __U, __m128 __A) {		_mm_maskz_getexp_ps (__mmask8 __U, __m128 __A) {
return (__m128) __builtin_ia32_getexpps128_mask ((__v4sf) __A,		return (__m128) __builtin_ia32_getexpps128_mask ((__v4sf) __A,
(__v4sf)		(__v4sf)
_mm_setzero_ps (),		_mm_setzero_ps (),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_getexp_ps (__m256 __A) {		_mm256_getexp_ps (__m256 __A) {
return (__m256) __builtin_ia32_getexpps256_mask ((__v8sf) __A,		return (__m256) __builtin_ia32_getexpps256_mask ((__v8sf) __A,
(__v8sf)		(__v8sf)
_mm256_setzero_ps (),		_mm256_setzero_ps (),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_mask_getexp_ps (__m256 __W, __mmask8 __U, __m256 __A) {		_mm256_mask_getexp_ps (__m256 __W, __mmask8 __U, __m256 __A) {
return (__m256) __builtin_ia32_getexpps256_mask ((__v8sf) __A,		return (__m256) __builtin_ia32_getexpps256_mask ((__v8sf) __A,
(__v8sf) __W,		(__v8sf) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_maskz_getexp_ps (__mmask8 __U, __m256 __A) {		_mm256_maskz_getexp_ps (__mmask8 __U, __m256 __A) {
return (__m256) __builtin_ia32_getexpps256_mask ((__v8sf) __A,		return (__m256) __builtin_ia32_getexpps256_mask ((__v8sf) __A,
(__v8sf)		(__v8sf)
_mm256_setzero_ps (),		_mm256_setzero_ps (),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_mask_max_pd(__m128d __W, __mmask8 __U, __m128d __A, __m128d __B) {		_mm_mask_max_pd(__m128d __W, __mmask8 __U, __m128d __A, __m128d __B) {
return (__m128d)__builtin_ia32_selectpd_128((__mmask8)__U,		return (__m128d)__builtin_ia32_selectpd_128((__mmask8)__U,
(__v2df)_mm_max_pd(__A, __B),		(__v2df)_mm_max_pd(__A, __B),
(__v2df)__W);		(__v2df)__W);
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_maskz_max_pd(__mmask8 __U, __m128d __A, __m128d __B) {		_mm_maskz_max_pd(__mmask8 __U, __m128d __A, __m128d __B) {
return (__m128d)__builtin_ia32_selectpd_128((__mmask8)__U,		return (__m128d)__builtin_ia32_selectpd_128((__mmask8)__U,
(__v2df)_mm_max_pd(__A, __B),		(__v2df)_mm_max_pd(__A, __B),
(__v2df)_mm_setzero_pd());		(__v2df)_mm_setzero_pd());
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_mask_max_pd(__m256d __W, __mmask8 __U, __m256d __A, __m256d __B) {		_mm256_mask_max_pd(__m256d __W, __mmask8 __U, __m256d __A, __m256d __B) {
return (__m256d)__builtin_ia32_selectpd_256((__mmask8)__U,		return (__m256d)__builtin_ia32_selectpd_256((__mmask8)__U,
(__v4df)_mm256_max_pd(__A, __B),		(__v4df)_mm256_max_pd(__A, __B),
(__v4df)__W);		(__v4df)__W);
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_maskz_max_pd(__mmask8 __U, __m256d __A, __m256d __B) {		_mm256_maskz_max_pd(__mmask8 __U, __m256d __A, __m256d __B) {
return (__m256d)__builtin_ia32_selectpd_256((__mmask8)__U,		return (__m256d)__builtin_ia32_selectpd_256((__mmask8)__U,
(__v4df)_mm256_max_pd(__A, __B),		(__v4df)_mm256_max_pd(__A, __B),
(__v4df)_mm256_setzero_pd());		(__v4df)_mm256_setzero_pd());
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_mask_max_ps(__m128 __W, __mmask8 __U, __m128 __A, __m128 __B) {		_mm_mask_max_ps(__m128 __W, __mmask8 __U, __m128 __A, __m128 __B) {
return (__m128)__builtin_ia32_selectps_128((__mmask8)__U,		return (__m128)__builtin_ia32_selectps_128((__mmask8)__U,
(__v4sf)_mm_max_ps(__A, __B),		(__v4sf)_mm_max_ps(__A, __B),
(__v4sf)__W);		(__v4sf)__W);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_maskz_max_ps(__mmask8 __U, __m128 __A, __m128 __B) {		_mm_maskz_max_ps(__mmask8 __U, __m128 __A, __m128 __B) {
return (__m128)__builtin_ia32_selectps_128((__mmask8)__U,		return (__m128)__builtin_ia32_selectps_128((__mmask8)__U,
(__v4sf)_mm_max_ps(__A, __B),		(__v4sf)_mm_max_ps(__A, __B),
(__v4sf)_mm_setzero_ps());		(__v4sf)_mm_setzero_ps());
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_mask_max_ps(__m256 __W, __mmask8 __U, __m256 __A, __m256 __B) {		_mm256_mask_max_ps(__m256 __W, __mmask8 __U, __m256 __A, __m256 __B) {
return (__m256)__builtin_ia32_selectps_256((__mmask8)__U,		return (__m256)__builtin_ia32_selectps_256((__mmask8)__U,
(__v8sf)_mm256_max_ps(__A, __B),		(__v8sf)_mm256_max_ps(__A, __B),
(__v8sf)__W);		(__v8sf)__W);
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_maskz_max_ps(__mmask8 __U, __m256 __A, __m256 __B) {		_mm256_maskz_max_ps(__mmask8 __U, __m256 __A, __m256 __B) {
return (__m256)__builtin_ia32_selectps_256((__mmask8)__U,		return (__m256)__builtin_ia32_selectps_256((__mmask8)__U,
(__v8sf)_mm256_max_ps(__A, __B),		(__v8sf)_mm256_max_ps(__A, __B),
(__v8sf)_mm256_setzero_ps());		(__v8sf)_mm256_setzero_ps());
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_mask_min_pd(__m128d __W, __mmask8 __U, __m128d __A, __m128d __B) {		_mm_mask_min_pd(__m128d __W, __mmask8 __U, __m128d __A, __m128d __B) {
return (__m128d)__builtin_ia32_selectpd_128((__mmask8)__U,		return (__m128d)__builtin_ia32_selectpd_128((__mmask8)__U,
(__v2df)_mm_min_pd(__A, __B),		(__v2df)_mm_min_pd(__A, __B),
(__v2df)__W);		(__v2df)__W);
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_maskz_min_pd(__mmask8 __U, __m128d __A, __m128d __B) {		_mm_maskz_min_pd(__mmask8 __U, __m128d __A, __m128d __B) {
return (__m128d)__builtin_ia32_selectpd_128((__mmask8)__U,		return (__m128d)__builtin_ia32_selectpd_128((__mmask8)__U,
(__v2df)_mm_min_pd(__A, __B),		(__v2df)_mm_min_pd(__A, __B),
(__v2df)_mm_setzero_pd());		(__v2df)_mm_setzero_pd());
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_mask_min_pd(__m256d __W, __mmask8 __U, __m256d __A, __m256d __B) {		_mm256_mask_min_pd(__m256d __W, __mmask8 __U, __m256d __A, __m256d __B) {
return (__m256d)__builtin_ia32_selectpd_256((__mmask8)__U,		return (__m256d)__builtin_ia32_selectpd_256((__mmask8)__U,
(__v4df)_mm256_min_pd(__A, __B),		(__v4df)_mm256_min_pd(__A, __B),
(__v4df)__W);		(__v4df)__W);
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_maskz_min_pd(__mmask8 __U, __m256d __A, __m256d __B) {		_mm256_maskz_min_pd(__mmask8 __U, __m256d __A, __m256d __B) {
return (__m256d)__builtin_ia32_selectpd_256((__mmask8)__U,		return (__m256d)__builtin_ia32_selectpd_256((__mmask8)__U,
(__v4df)_mm256_min_pd(__A, __B),		(__v4df)_mm256_min_pd(__A, __B),
(__v4df)_mm256_setzero_pd());		(__v4df)_mm256_setzero_pd());
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_mask_min_ps(__m128 __W, __mmask8 __U, __m128 __A, __m128 __B) {		_mm_mask_min_ps(__m128 __W, __mmask8 __U, __m128 __A, __m128 __B) {
return (__m128)__builtin_ia32_selectps_128((__mmask8)__U,		return (__m128)__builtin_ia32_selectps_128((__mmask8)__U,
(__v4sf)_mm_min_ps(__A, __B),		(__v4sf)_mm_min_ps(__A, __B),
(__v4sf)__W);		(__v4sf)__W);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_maskz_min_ps(__mmask8 __U, __m128 __A, __m128 __B) {		_mm_maskz_min_ps(__mmask8 __U, __m128 __A, __m128 __B) {
return (__m128)__builtin_ia32_selectps_128((__mmask8)__U,		return (__m128)__builtin_ia32_selectps_128((__mmask8)__U,
(__v4sf)_mm_min_ps(__A, __B),		(__v4sf)_mm_min_ps(__A, __B),
(__v4sf)_mm_setzero_ps());		(__v4sf)_mm_setzero_ps());
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_mask_min_ps(__m256 __W, __mmask8 __U, __m256 __A, __m256 __B) {		_mm256_mask_min_ps(__m256 __W, __mmask8 __U, __m256 __A, __m256 __B) {
return (__m256)__builtin_ia32_selectps_256((__mmask8)__U,		return (__m256)__builtin_ia32_selectps_256((__mmask8)__U,
(__v8sf)_mm256_min_ps(__A, __B),		(__v8sf)_mm256_min_ps(__A, __B),
(__v8sf)__W);		(__v8sf)__W);
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_maskz_min_ps(__mmask8 __U, __m256 __A, __m256 __B) {		_mm256_maskz_min_ps(__mmask8 __U, __m256 __A, __m256 __B) {
return (__m256)__builtin_ia32_selectps_256((__mmask8)__U,		return (__m256)__builtin_ia32_selectps_256((__mmask8)__U,
(__v8sf)_mm256_min_ps(__A, __B),		(__v8sf)_mm256_min_ps(__A, __B),
(__v8sf)_mm256_setzero_ps());		(__v8sf)_mm256_setzero_ps());
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_mask_mul_pd(__m128d __W, __mmask8 __U, __m128d __A, __m128d __B) {		_mm_mask_mul_pd(__m128d __W, __mmask8 __U, __m128d __A, __m128d __B) {
return (__m128d)__builtin_ia32_selectpd_128((__mmask8)__U,		return (__m128d)__builtin_ia32_selectpd_128((__mmask8)__U,
(__v2df)_mm_mul_pd(__A, __B),		(__v2df)_mm_mul_pd(__A, __B),
(__v2df)__W);		(__v2df)__W);
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_maskz_mul_pd(__mmask8 __U, __m128d __A, __m128d __B) {		_mm_maskz_mul_pd(__mmask8 __U, __m128d __A, __m128d __B) {
return (__m128d)__builtin_ia32_selectpd_128((__mmask8)__U,		return (__m128d)__builtin_ia32_selectpd_128((__mmask8)__U,
(__v2df)_mm_mul_pd(__A, __B),		(__v2df)_mm_mul_pd(__A, __B),
(__v2df)_mm_setzero_pd());		(__v2df)_mm_setzero_pd());
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_mask_mul_pd(__m256d __W, __mmask8 __U, __m256d __A, __m256d __B) {		_mm256_mask_mul_pd(__m256d __W, __mmask8 __U, __m256d __A, __m256d __B) {
return (__m256d)__builtin_ia32_selectpd_256((__mmask8)__U,		return (__m256d)__builtin_ia32_selectpd_256((__mmask8)__U,
(__v4df)_mm256_mul_pd(__A, __B),		(__v4df)_mm256_mul_pd(__A, __B),
(__v4df)__W);		(__v4df)__W);
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_maskz_mul_pd(__mmask8 __U, __m256d __A, __m256d __B) {		_mm256_maskz_mul_pd(__mmask8 __U, __m256d __A, __m256d __B) {
return (__m256d)__builtin_ia32_selectpd_256((__mmask8)__U,		return (__m256d)__builtin_ia32_selectpd_256((__mmask8)__U,
(__v4df)_mm256_mul_pd(__A, __B),		(__v4df)_mm256_mul_pd(__A, __B),
(__v4df)_mm256_setzero_pd());		(__v4df)_mm256_setzero_pd());
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_mask_mul_ps(__m128 __W, __mmask8 __U, __m128 __A, __m128 __B) {		_mm_mask_mul_ps(__m128 __W, __mmask8 __U, __m128 __A, __m128 __B) {
return (__m128)__builtin_ia32_selectps_128((__mmask8)__U,		return (__m128)__builtin_ia32_selectps_128((__mmask8)__U,
(__v4sf)_mm_mul_ps(__A, __B),		(__v4sf)_mm_mul_ps(__A, __B),
(__v4sf)__W);		(__v4sf)__W);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_maskz_mul_ps(__mmask8 __U, __m128 __A, __m128 __B) {		_mm_maskz_mul_ps(__mmask8 __U, __m128 __A, __m128 __B) {
return (__m128)__builtin_ia32_selectps_128((__mmask8)__U,		return (__m128)__builtin_ia32_selectps_128((__mmask8)__U,
(__v4sf)_mm_mul_ps(__A, __B),		(__v4sf)_mm_mul_ps(__A, __B),
(__v4sf)_mm_setzero_ps());		(__v4sf)_mm_setzero_ps());
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_mask_mul_ps(__m256 __W, __mmask8 __U, __m256 __A, __m256 __B) {		_mm256_mask_mul_ps(__m256 __W, __mmask8 __U, __m256 __A, __m256 __B) {
return (__m256)__builtin_ia32_selectps_256((__mmask8)__U,		return (__m256)__builtin_ia32_selectps_256((__mmask8)__U,
(__v8sf)_mm256_mul_ps(__A, __B),		(__v8sf)_mm256_mul_ps(__A, __B),
(__v8sf)__W);		(__v8sf)__W);
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_maskz_mul_ps(__mmask8 __U, __m256 __A, __m256 __B) {		_mm256_maskz_mul_ps(__mmask8 __U, __m256 __A, __m256 __B) {
return (__m256)__builtin_ia32_selectps_256((__mmask8)__U,		return (__m256)__builtin_ia32_selectps_256((__mmask8)__U,
(__v8sf)_mm256_mul_ps(__A, __B),		(__v8sf)_mm256_mul_ps(__A, __B),
(__v8sf)_mm256_setzero_ps());		(__v8sf)_mm256_setzero_ps());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_abs_epi32(__m128i __W, __mmask8 __U, __m128i __A) {		_mm_mask_abs_epi32(__m128i __W, __mmask8 __U, __m128i __A) {
return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,
(__v4si)_mm_abs_epi32(__A),		(__v4si)_mm_abs_epi32(__A),
(__v4si)__W);		(__v4si)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_abs_epi32(__mmask8 __U, __m128i __A) {		_mm_maskz_abs_epi32(__mmask8 __U, __m128i __A) {
return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,
(__v4si)_mm_abs_epi32(__A),		(__v4si)_mm_abs_epi32(__A),
(__v4si)_mm_setzero_si128());		(__v4si)_mm_setzero_si128());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_abs_epi32(__m256i __W, __mmask8 __U, __m256i __A) {		_mm256_mask_abs_epi32(__m256i __W, __mmask8 __U, __m256i __A) {
return (__m256i)__builtin_ia32_selectd_256((__mmask16)__U,		return (__m256i)__builtin_ia32_selectd_256((__mmask16)__U,
(__v8si)_mm256_abs_epi32(__A),		(__v8si)_mm256_abs_epi32(__A),
(__v8si)__W);		(__v8si)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_abs_epi32(__mmask8 __U, __m256i __A) {		_mm256_maskz_abs_epi32(__mmask8 __U, __m256i __A) {
return (__m256i)__builtin_ia32_selectd_256((__mmask16)__U,		return (__m256i)__builtin_ia32_selectd_256((__mmask16)__U,
(__v8si)_mm256_abs_epi32(__A),		(__v8si)_mm256_abs_epi32(__A),
(__v8si)_mm256_setzero_si256());		(__v8si)_mm256_setzero_si256());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_abs_epi64 (__m128i __A) {		_mm_abs_epi64 (__m128i __A) {
return (__m128i)__builtin_ia32_pabsq128((__v2di)__A);		return (__m128i)__builtin_ia32_pabsq128((__v2di)__A);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_abs_epi64 (__m128i __W, __mmask8 __U, __m128i __A) {		_mm_mask_abs_epi64 (__m128i __W, __mmask8 __U, __m128i __A) {
return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,
(__v2di)_mm_abs_epi64(__A),		(__v2di)_mm_abs_epi64(__A),
(__v2di)__W);		(__v2di)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_abs_epi64 (__mmask8 __U, __m128i __A) {		_mm_maskz_abs_epi64 (__mmask8 __U, __m128i __A) {
return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,
(__v2di)_mm_abs_epi64(__A),		(__v2di)_mm_abs_epi64(__A),
(__v2di)_mm_setzero_si128());		(__v2di)_mm_setzero_si128());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_abs_epi64 (__m256i __A) {		_mm256_abs_epi64 (__m256i __A) {
return (__m256i)__builtin_ia32_pabsq256 ((__v4di)__A);		return (__m256i)__builtin_ia32_pabsq256 ((__v4di)__A);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_abs_epi64 (__m256i __W, __mmask8 __U, __m256i __A) {		_mm256_mask_abs_epi64 (__m256i __W, __mmask8 __U, __m256i __A) {
return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,
(__v4di)_mm256_abs_epi64(__A),		(__v4di)_mm256_abs_epi64(__A),
(__v4di)__W);		(__v4di)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_abs_epi64 (__mmask8 __U, __m256i __A) {		_mm256_maskz_abs_epi64 (__mmask8 __U, __m256i __A) {
return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,
(__v4di)_mm256_abs_epi64(__A),		(__v4di)_mm256_abs_epi64(__A),
(__v4di)_mm256_setzero_si256());		(__v4di)_mm256_setzero_si256());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_max_epi32(__mmask8 __M, __m128i __A, __m128i __B) {		_mm_maskz_max_epi32(__mmask8 __M, __m128i __A, __m128i __B) {
return (__m128i)__builtin_ia32_selectd_128((__mmask8)__M,		return (__m128i)__builtin_ia32_selectd_128((__mmask8)__M,
(__v4si)_mm_max_epi32(__A, __B),		(__v4si)_mm_max_epi32(__A, __B),
(__v4si)_mm_setzero_si128());		(__v4si)_mm_setzero_si128());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_max_epi32(__m128i __W, __mmask8 __M, __m128i __A, __m128i __B) {		_mm_mask_max_epi32(__m128i __W, __mmask8 __M, __m128i __A, __m128i __B) {
return (__m128i)__builtin_ia32_selectd_128((__mmask8)__M,		return (__m128i)__builtin_ia32_selectd_128((__mmask8)__M,
(__v4si)_mm_max_epi32(__A, __B),		(__v4si)_mm_max_epi32(__A, __B),
(__v4si)__W);		(__v4si)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_max_epi32(__mmask8 __M, __m256i __A, __m256i __B) {		_mm256_maskz_max_epi32(__mmask8 __M, __m256i __A, __m256i __B) {
return (__m256i)__builtin_ia32_selectd_256((__mmask8)__M,		return (__m256i)__builtin_ia32_selectd_256((__mmask8)__M,
(__v8si)_mm256_max_epi32(__A, __B),		(__v8si)_mm256_max_epi32(__A, __B),
(__v8si)_mm256_setzero_si256());		(__v8si)_mm256_setzero_si256());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_max_epi32(__m256i __W, __mmask8 __M, __m256i __A, __m256i __B) {		_mm256_mask_max_epi32(__m256i __W, __mmask8 __M, __m256i __A, __m256i __B) {
return (__m256i)__builtin_ia32_selectd_256((__mmask8)__M,		return (__m256i)__builtin_ia32_selectd_256((__mmask8)__M,
(__v8si)_mm256_max_epi32(__A, __B),		(__v8si)_mm256_max_epi32(__A, __B),
(__v8si)__W);		(__v8si)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_max_epi64 (__m128i __A, __m128i __B) {		_mm_max_epi64 (__m128i __A, __m128i __B) {
return (__m128i)__builtin_ia32_pmaxsq128((__v2di)__A, (__v2di)__B);		return (__m128i)__builtin_ia32_pmaxsq128((__v2di)__A, (__v2di)__B);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_max_epi64 (__mmask8 __M, __m128i __A, __m128i __B) {		_mm_maskz_max_epi64 (__mmask8 __M, __m128i __A, __m128i __B) {
return (__m128i)__builtin_ia32_selectq_128((__mmask8)__M,		return (__m128i)__builtin_ia32_selectq_128((__mmask8)__M,
(__v2di)_mm_max_epi64(__A, __B),		(__v2di)_mm_max_epi64(__A, __B),
(__v2di)_mm_setzero_si128());		(__v2di)_mm_setzero_si128());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_max_epi64 (__m128i __W, __mmask8 __M, __m128i __A, __m128i __B) {		_mm_mask_max_epi64 (__m128i __W, __mmask8 __M, __m128i __A, __m128i __B) {
return (__m128i)__builtin_ia32_selectq_128((__mmask8)__M,		return (__m128i)__builtin_ia32_selectq_128((__mmask8)__M,
(__v2di)_mm_max_epi64(__A, __B),		(__v2di)_mm_max_epi64(__A, __B),
(__v2di)__W);		(__v2di)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_max_epi64 (__m256i __A, __m256i __B) {		_mm256_max_epi64 (__m256i __A, __m256i __B) {
return (__m256i)__builtin_ia32_pmaxsq256((__v4di)__A, (__v4di)__B);		return (__m256i)__builtin_ia32_pmaxsq256((__v4di)__A, (__v4di)__B);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_max_epi64 (__mmask8 __M, __m256i __A, __m256i __B) {		_mm256_maskz_max_epi64 (__mmask8 __M, __m256i __A, __m256i __B) {
return (__m256i)__builtin_ia32_selectq_256((__mmask8)__M,		return (__m256i)__builtin_ia32_selectq_256((__mmask8)__M,
(__v4di)_mm256_max_epi64(__A, __B),		(__v4di)_mm256_max_epi64(__A, __B),
(__v4di)_mm256_setzero_si256());		(__v4di)_mm256_setzero_si256());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_max_epi64 (__m256i __W, __mmask8 __M, __m256i __A, __m256i __B) {		_mm256_mask_max_epi64 (__m256i __W, __mmask8 __M, __m256i __A, __m256i __B) {
return (__m256i)__builtin_ia32_selectq_256((__mmask8)__M,		return (__m256i)__builtin_ia32_selectq_256((__mmask8)__M,
(__v4di)_mm256_max_epi64(__A, __B),		(__v4di)_mm256_max_epi64(__A, __B),
(__v4di)__W);		(__v4di)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_max_epu32(__mmask8 __M, __m128i __A, __m128i __B) {		_mm_maskz_max_epu32(__mmask8 __M, __m128i __A, __m128i __B) {
return (__m128i)__builtin_ia32_selectd_128((__mmask8)__M,		return (__m128i)__builtin_ia32_selectd_128((__mmask8)__M,
(__v4si)_mm_max_epu32(__A, __B),		(__v4si)_mm_max_epu32(__A, __B),
(__v4si)_mm_setzero_si128());		(__v4si)_mm_setzero_si128());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_max_epu32(__m128i __W, __mmask8 __M, __m128i __A, __m128i __B) {		_mm_mask_max_epu32(__m128i __W, __mmask8 __M, __m128i __A, __m128i __B) {
return (__m128i)__builtin_ia32_selectd_128((__mmask8)__M,		return (__m128i)__builtin_ia32_selectd_128((__mmask8)__M,
(__v4si)_mm_max_epu32(__A, __B),		(__v4si)_mm_max_epu32(__A, __B),
(__v4si)__W);		(__v4si)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_max_epu32(__mmask8 __M, __m256i __A, __m256i __B) {		_mm256_maskz_max_epu32(__mmask8 __M, __m256i __A, __m256i __B) {
return (__m256i)__builtin_ia32_selectd_256((__mmask8)__M,		return (__m256i)__builtin_ia32_selectd_256((__mmask8)__M,
(__v8si)_mm256_max_epu32(__A, __B),		(__v8si)_mm256_max_epu32(__A, __B),
(__v8si)_mm256_setzero_si256());		(__v8si)_mm256_setzero_si256());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_max_epu32(__m256i __W, __mmask8 __M, __m256i __A, __m256i __B) {		_mm256_mask_max_epu32(__m256i __W, __mmask8 __M, __m256i __A, __m256i __B) {
return (__m256i)__builtin_ia32_selectd_256((__mmask8)__M,		return (__m256i)__builtin_ia32_selectd_256((__mmask8)__M,
(__v8si)_mm256_max_epu32(__A, __B),		(__v8si)_mm256_max_epu32(__A, __B),
(__v8si)__W);		(__v8si)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_max_epu64 (__m128i __A, __m128i __B) {		_mm_max_epu64 (__m128i __A, __m128i __B) {
return (__m128i)__builtin_ia32_pmaxuq128((__v2di)__A, (__v2di)__B);		return (__m128i)__builtin_ia32_pmaxuq128((__v2di)__A, (__v2di)__B);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_max_epu64 (__mmask8 __M, __m128i __A, __m128i __B) {		_mm_maskz_max_epu64 (__mmask8 __M, __m128i __A, __m128i __B) {
return (__m128i)__builtin_ia32_selectq_128((__mmask8)__M,		return (__m128i)__builtin_ia32_selectq_128((__mmask8)__M,
(__v2di)_mm_max_epu64(__A, __B),		(__v2di)_mm_max_epu64(__A, __B),
(__v2di)_mm_setzero_si128());		(__v2di)_mm_setzero_si128());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_max_epu64 (__m128i __W, __mmask8 __M, __m128i __A, __m128i __B) {		_mm_mask_max_epu64 (__m128i __W, __mmask8 __M, __m128i __A, __m128i __B) {
return (__m128i)__builtin_ia32_selectq_128((__mmask8)__M,		return (__m128i)__builtin_ia32_selectq_128((__mmask8)__M,
(__v2di)_mm_max_epu64(__A, __B),		(__v2di)_mm_max_epu64(__A, __B),
(__v2di)__W);		(__v2di)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_max_epu64 (__m256i __A, __m256i __B) {		_mm256_max_epu64 (__m256i __A, __m256i __B) {
return (__m256i)__builtin_ia32_pmaxuq256((__v4di)__A, (__v4di)__B);		return (__m256i)__builtin_ia32_pmaxuq256((__v4di)__A, (__v4di)__B);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_max_epu64 (__mmask8 __M, __m256i __A, __m256i __B) {		_mm256_maskz_max_epu64 (__mmask8 __M, __m256i __A, __m256i __B) {
return (__m256i)__builtin_ia32_selectq_256((__mmask8)__M,		return (__m256i)__builtin_ia32_selectq_256((__mmask8)__M,
(__v4di)_mm256_max_epu64(__A, __B),		(__v4di)_mm256_max_epu64(__A, __B),
(__v4di)_mm256_setzero_si256());		(__v4di)_mm256_setzero_si256());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_max_epu64 (__m256i __W, __mmask8 __M, __m256i __A, __m256i __B) {		_mm256_mask_max_epu64 (__m256i __W, __mmask8 __M, __m256i __A, __m256i __B) {
return (__m256i)__builtin_ia32_selectq_256((__mmask8)__M,		return (__m256i)__builtin_ia32_selectq_256((__mmask8)__M,
(__v4di)_mm256_max_epu64(__A, __B),		(__v4di)_mm256_max_epu64(__A, __B),
(__v4di)__W);		(__v4di)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_min_epi32(__mmask8 __M, __m128i __A, __m128i __B) {		_mm_maskz_min_epi32(__mmask8 __M, __m128i __A, __m128i __B) {
return (__m128i)__builtin_ia32_selectd_128((__mmask8)__M,		return (__m128i)__builtin_ia32_selectd_128((__mmask8)__M,
(__v4si)_mm_min_epi32(__A, __B),		(__v4si)_mm_min_epi32(__A, __B),
(__v4si)_mm_setzero_si128());		(__v4si)_mm_setzero_si128());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_min_epi32(__m128i __W, __mmask8 __M, __m128i __A, __m128i __B) {		_mm_mask_min_epi32(__m128i __W, __mmask8 __M, __m128i __A, __m128i __B) {
return (__m128i)__builtin_ia32_selectd_128((__mmask8)__M,		return (__m128i)__builtin_ia32_selectd_128((__mmask8)__M,
(__v4si)_mm_min_epi32(__A, __B),		(__v4si)_mm_min_epi32(__A, __B),
(__v4si)__W);		(__v4si)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_min_epi32(__mmask8 __M, __m256i __A, __m256i __B) {		_mm256_maskz_min_epi32(__mmask8 __M, __m256i __A, __m256i __B) {
return (__m256i)__builtin_ia32_selectd_256((__mmask8)__M,		return (__m256i)__builtin_ia32_selectd_256((__mmask8)__M,
(__v8si)_mm256_min_epi32(__A, __B),		(__v8si)_mm256_min_epi32(__A, __B),
(__v8si)_mm256_setzero_si256());		(__v8si)_mm256_setzero_si256());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_min_epi32(__m256i __W, __mmask8 __M, __m256i __A, __m256i __B) {		_mm256_mask_min_epi32(__m256i __W, __mmask8 __M, __m256i __A, __m256i __B) {
return (__m256i)__builtin_ia32_selectd_256((__mmask8)__M,		return (__m256i)__builtin_ia32_selectd_256((__mmask8)__M,
(__v8si)_mm256_min_epi32(__A, __B),		(__v8si)_mm256_min_epi32(__A, __B),
(__v8si)__W);		(__v8si)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_min_epi64 (__m128i __A, __m128i __B) {		_mm_min_epi64 (__m128i __A, __m128i __B) {
return (__m128i)__builtin_ia32_pminsq128((__v2di)__A, (__v2di)__B);		return (__m128i)__builtin_ia32_pminsq128((__v2di)__A, (__v2di)__B);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_min_epi64 (__m128i __W, __mmask8 __M, __m128i __A, __m128i __B) {		_mm_mask_min_epi64 (__m128i __W, __mmask8 __M, __m128i __A, __m128i __B) {
return (__m128i)__builtin_ia32_selectq_128((__mmask8)__M,		return (__m128i)__builtin_ia32_selectq_128((__mmask8)__M,
(__v2di)_mm_min_epi64(__A, __B),		(__v2di)_mm_min_epi64(__A, __B),
(__v2di)__W);		(__v2di)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_min_epi64 (__mmask8 __M, __m128i __A, __m128i __B) {		_mm_maskz_min_epi64 (__mmask8 __M, __m128i __A, __m128i __B) {
return (__m128i)__builtin_ia32_selectq_128((__mmask8)__M,		return (__m128i)__builtin_ia32_selectq_128((__mmask8)__M,
(__v2di)_mm_min_epi64(__A, __B),		(__v2di)_mm_min_epi64(__A, __B),
(__v2di)_mm_setzero_si128());		(__v2di)_mm_setzero_si128());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_min_epi64 (__m256i __A, __m256i __B) {		_mm256_min_epi64 (__m256i __A, __m256i __B) {
return (__m256i)__builtin_ia32_pminsq256((__v4di)__A, (__v4di)__B);		return (__m256i)__builtin_ia32_pminsq256((__v4di)__A, (__v4di)__B);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_min_epi64 (__m256i __W, __mmask8 __M, __m256i __A, __m256i __B) {		_mm256_mask_min_epi64 (__m256i __W, __mmask8 __M, __m256i __A, __m256i __B) {
return (__m256i)__builtin_ia32_selectq_256((__mmask8)__M,		return (__m256i)__builtin_ia32_selectq_256((__mmask8)__M,
(__v4di)_mm256_min_epi64(__A, __B),		(__v4di)_mm256_min_epi64(__A, __B),
(__v4di)__W);		(__v4di)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_min_epi64 (__mmask8 __M, __m256i __A, __m256i __B) {		_mm256_maskz_min_epi64 (__mmask8 __M, __m256i __A, __m256i __B) {
return (__m256i)__builtin_ia32_selectq_256((__mmask8)__M,		return (__m256i)__builtin_ia32_selectq_256((__mmask8)__M,
(__v4di)_mm256_min_epi64(__A, __B),		(__v4di)_mm256_min_epi64(__A, __B),
(__v4di)_mm256_setzero_si256());		(__v4di)_mm256_setzero_si256());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_min_epu32(__mmask8 __M, __m128i __A, __m128i __B) {		_mm_maskz_min_epu32(__mmask8 __M, __m128i __A, __m128i __B) {
return (__m128i)__builtin_ia32_selectd_128((__mmask8)__M,		return (__m128i)__builtin_ia32_selectd_128((__mmask8)__M,
(__v4si)_mm_min_epu32(__A, __B),		(__v4si)_mm_min_epu32(__A, __B),
(__v4si)_mm_setzero_si128());		(__v4si)_mm_setzero_si128());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_min_epu32(__m128i __W, __mmask8 __M, __m128i __A, __m128i __B) {		_mm_mask_min_epu32(__m128i __W, __mmask8 __M, __m128i __A, __m128i __B) {
return (__m128i)__builtin_ia32_selectd_128((__mmask8)__M,		return (__m128i)__builtin_ia32_selectd_128((__mmask8)__M,
(__v4si)_mm_min_epu32(__A, __B),		(__v4si)_mm_min_epu32(__A, __B),
(__v4si)__W);		(__v4si)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_min_epu32(__mmask8 __M, __m256i __A, __m256i __B) {		_mm256_maskz_min_epu32(__mmask8 __M, __m256i __A, __m256i __B) {
return (__m256i)__builtin_ia32_selectd_256((__mmask8)__M,		return (__m256i)__builtin_ia32_selectd_256((__mmask8)__M,
(__v8si)_mm256_min_epu32(__A, __B),		(__v8si)_mm256_min_epu32(__A, __B),
(__v8si)_mm256_setzero_si256());		(__v8si)_mm256_setzero_si256());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_min_epu32(__m256i __W, __mmask8 __M, __m256i __A, __m256i __B) {		_mm256_mask_min_epu32(__m256i __W, __mmask8 __M, __m256i __A, __m256i __B) {
return (__m256i)__builtin_ia32_selectd_256((__mmask8)__M,		return (__m256i)__builtin_ia32_selectd_256((__mmask8)__M,
(__v8si)_mm256_min_epu32(__A, __B),		(__v8si)_mm256_min_epu32(__A, __B),
(__v8si)__W);		(__v8si)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_min_epu64 (__m128i __A, __m128i __B) {		_mm_min_epu64 (__m128i __A, __m128i __B) {
return (__m128i)__builtin_ia32_pminuq128((__v2di)__A, (__v2di)__B);		return (__m128i)__builtin_ia32_pminuq128((__v2di)__A, (__v2di)__B);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_min_epu64 (__m128i __W, __mmask8 __M, __m128i __A, __m128i __B) {		_mm_mask_min_epu64 (__m128i __W, __mmask8 __M, __m128i __A, __m128i __B) {
return (__m128i)__builtin_ia32_selectq_128((__mmask8)__M,		return (__m128i)__builtin_ia32_selectq_128((__mmask8)__M,
(__v2di)_mm_min_epu64(__A, __B),		(__v2di)_mm_min_epu64(__A, __B),
(__v2di)__W);		(__v2di)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_min_epu64 (__mmask8 __M, __m128i __A, __m128i __B) {		_mm_maskz_min_epu64 (__mmask8 __M, __m128i __A, __m128i __B) {
return (__m128i)__builtin_ia32_selectq_128((__mmask8)__M,		return (__m128i)__builtin_ia32_selectq_128((__mmask8)__M,
(__v2di)_mm_min_epu64(__A, __B),		(__v2di)_mm_min_epu64(__A, __B),
(__v2di)_mm_setzero_si128());		(__v2di)_mm_setzero_si128());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_min_epu64 (__m256i __A, __m256i __B) {		_mm256_min_epu64 (__m256i __A, __m256i __B) {
return (__m256i)__builtin_ia32_pminuq256((__v4di)__A, (__v4di)__B);		return (__m256i)__builtin_ia32_pminuq256((__v4di)__A, (__v4di)__B);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_min_epu64 (__m256i __W, __mmask8 __M, __m256i __A, __m256i __B) {		_mm256_mask_min_epu64 (__m256i __W, __mmask8 __M, __m256i __A, __m256i __B) {
return (__m256i)__builtin_ia32_selectq_256((__mmask8)__M,		return (__m256i)__builtin_ia32_selectq_256((__mmask8)__M,
(__v4di)_mm256_min_epu64(__A, __B),		(__v4di)_mm256_min_epu64(__A, __B),
(__v4di)__W);		(__v4di)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_min_epu64 (__mmask8 __M, __m256i __A, __m256i __B) {		_mm256_maskz_min_epu64 (__mmask8 __M, __m256i __A, __m256i __B) {
return (__m256i)__builtin_ia32_selectq_256((__mmask8)__M,		return (__m256i)__builtin_ia32_selectq_256((__mmask8)__M,
(__v4di)_mm256_min_epu64(__A, __B),		(__v4di)_mm256_min_epu64(__A, __B),
(__v4di)_mm256_setzero_si256());		(__v4di)_mm256_setzero_si256());
}		}

#define _mm_roundscale_pd(A, imm) \		#define _mm_roundscale_pd(A, imm) \
(__m128d)__builtin_ia32_rndscalepd_128_mask((__v2df)(__m128d)(A), \		(__m128d)__builtin_ia32_rndscalepd_128_mask((__v2df)(__m128d)(A), \
▲ Show 20 Lines • Show All 64 Lines • ▼ Show 20 Lines	(__m256)__builtin_ia32_rndscaleps_256_mask((__v8sf)(__m256)(A), (int)(imm), \
(__mmask8)(U))		(__mmask8)(U))


#define _mm256_maskz_roundscale_ps(U, A, imm) \		#define _mm256_maskz_roundscale_ps(U, A, imm) \
(__m256)__builtin_ia32_rndscaleps_256_mask((__v8sf)(__m256)(A), (int)(imm), \		(__m256)__builtin_ia32_rndscaleps_256_mask((__v8sf)(__m256)(A), (int)(imm), \
(__v8sf)_mm256_setzero_ps(), \		(__v8sf)_mm256_setzero_ps(), \
(__mmask8)(U))		(__mmask8)(U))

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_scalef_pd (__m128d __A, __m128d __B) {		_mm_scalef_pd (__m128d __A, __m128d __B) {
return (__m128d) __builtin_ia32_scalefpd128_mask ((__v2df) __A,		return (__m128d) __builtin_ia32_scalefpd128_mask ((__v2df) __A,
(__v2df) __B,		(__v2df) __B,
(__v2df)		(__v2df)
_mm_setzero_pd (),		_mm_setzero_pd (),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_mask_scalef_pd (__m128d __W, __mmask8 __U, __m128d __A,		_mm_mask_scalef_pd (__m128d __W, __mmask8 __U, __m128d __A,
__m128d __B) {		__m128d __B) {
return (__m128d) __builtin_ia32_scalefpd128_mask ((__v2df) __A,		return (__m128d) __builtin_ia32_scalefpd128_mask ((__v2df) __A,
(__v2df) __B,		(__v2df) __B,
(__v2df) __W,		(__v2df) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_maskz_scalef_pd (__mmask8 __U, __m128d __A, __m128d __B) {		_mm_maskz_scalef_pd (__mmask8 __U, __m128d __A, __m128d __B) {
return (__m128d) __builtin_ia32_scalefpd128_mask ((__v2df) __A,		return (__m128d) __builtin_ia32_scalefpd128_mask ((__v2df) __A,
(__v2df) __B,		(__v2df) __B,
(__v2df)		(__v2df)
_mm_setzero_pd (),		_mm_setzero_pd (),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_scalef_pd (__m256d __A, __m256d __B) {		_mm256_scalef_pd (__m256d __A, __m256d __B) {
return (__m256d) __builtin_ia32_scalefpd256_mask ((__v4df) __A,		return (__m256d) __builtin_ia32_scalefpd256_mask ((__v4df) __A,
(__v4df) __B,		(__v4df) __B,
(__v4df)		(__v4df)
_mm256_setzero_pd (),		_mm256_setzero_pd (),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_mask_scalef_pd (__m256d __W, __mmask8 __U, __m256d __A,		_mm256_mask_scalef_pd (__m256d __W, __mmask8 __U, __m256d __A,
__m256d __B) {		__m256d __B) {
return (__m256d) __builtin_ia32_scalefpd256_mask ((__v4df) __A,		return (__m256d) __builtin_ia32_scalefpd256_mask ((__v4df) __A,
(__v4df) __B,		(__v4df) __B,
(__v4df) __W,		(__v4df) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_maskz_scalef_pd (__mmask8 __U, __m256d __A, __m256d __B) {		_mm256_maskz_scalef_pd (__mmask8 __U, __m256d __A, __m256d __B) {
return (__m256d) __builtin_ia32_scalefpd256_mask ((__v4df) __A,		return (__m256d) __builtin_ia32_scalefpd256_mask ((__v4df) __A,
(__v4df) __B,		(__v4df) __B,
(__v4df)		(__v4df)
_mm256_setzero_pd (),		_mm256_setzero_pd (),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_scalef_ps (__m128 __A, __m128 __B) {		_mm_scalef_ps (__m128 __A, __m128 __B) {
return (__m128) __builtin_ia32_scalefps128_mask ((__v4sf) __A,		return (__m128) __builtin_ia32_scalefps128_mask ((__v4sf) __A,
(__v4sf) __B,		(__v4sf) __B,
(__v4sf)		(__v4sf)
_mm_setzero_ps (),		_mm_setzero_ps (),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_mask_scalef_ps (__m128 __W, __mmask8 __U, __m128 __A, __m128 __B) {		_mm_mask_scalef_ps (__m128 __W, __mmask8 __U, __m128 __A, __m128 __B) {
return (__m128) __builtin_ia32_scalefps128_mask ((__v4sf) __A,		return (__m128) __builtin_ia32_scalefps128_mask ((__v4sf) __A,
(__v4sf) __B,		(__v4sf) __B,
(__v4sf) __W,		(__v4sf) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_maskz_scalef_ps (__mmask8 __U, __m128 __A, __m128 __B) {		_mm_maskz_scalef_ps (__mmask8 __U, __m128 __A, __m128 __B) {
return (__m128) __builtin_ia32_scalefps128_mask ((__v4sf) __A,		return (__m128) __builtin_ia32_scalefps128_mask ((__v4sf) __A,
(__v4sf) __B,		(__v4sf) __B,
(__v4sf)		(__v4sf)
_mm_setzero_ps (),		_mm_setzero_ps (),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_scalef_ps (__m256 __A, __m256 __B) {		_mm256_scalef_ps (__m256 __A, __m256 __B) {
return (__m256) __builtin_ia32_scalefps256_mask ((__v8sf) __A,		return (__m256) __builtin_ia32_scalefps256_mask ((__v8sf) __A,
(__v8sf) __B,		(__v8sf) __B,
(__v8sf)		(__v8sf)
_mm256_setzero_ps (),		_mm256_setzero_ps (),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_mask_scalef_ps (__m256 __W, __mmask8 __U, __m256 __A,		_mm256_mask_scalef_ps (__m256 __W, __mmask8 __U, __m256 __A,
__m256 __B) {		__m256 __B) {
return (__m256) __builtin_ia32_scalefps256_mask ((__v8sf) __A,		return (__m256) __builtin_ia32_scalefps256_mask ((__v8sf) __A,
(__v8sf) __B,		(__v8sf) __B,
(__v8sf) __W,		(__v8sf) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_maskz_scalef_ps (__mmask8 __U, __m256 __A, __m256 __B) {		_mm256_maskz_scalef_ps (__mmask8 __U, __m256 __A, __m256 __B) {
return (__m256) __builtin_ia32_scalefps256_mask ((__v8sf) __A,		return (__m256) __builtin_ia32_scalefps256_mask ((__v8sf) __A,
(__v8sf) __B,		(__v8sf) __B,
(__v8sf)		(__v8sf)
_mm256_setzero_ps (),		_mm256_setzero_ps (),
(__mmask8) __U);		(__mmask8) __U);
}		}

▲ Show 20 Lines • Show All 152 Lines • ▼ Show 20 Lines	__builtin_ia32_scattersiv8si((int *)(addr), (__mmask8)-1, \
(__v8si)(__m256i)(index), \		(__v8si)(__m256i)(index), \
(__v8si)(__m256i)(v1), (int)(scale))		(__v8si)(__m256i)(v1), (int)(scale))

#define _mm256_mask_i32scatter_epi32(addr, mask, index, v1, scale) \		#define _mm256_mask_i32scatter_epi32(addr, mask, index, v1, scale) \
__builtin_ia32_scattersiv8si((int *)(addr), (__mmask8)(mask), \		__builtin_ia32_scattersiv8si((int *)(addr), (__mmask8)(mask), \
(__v8si)(__m256i)(index), \		(__v8si)(__m256i)(index), \
(__v8si)(__m256i)(v1), (int)(scale))		(__v8si)(__m256i)(v1), (int)(scale))

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_mask_sqrt_pd(__m128d __W, __mmask8 __U, __m128d __A) {		_mm_mask_sqrt_pd(__m128d __W, __mmask8 __U, __m128d __A) {
return (__m128d)__builtin_ia32_selectpd_128((__mmask8)__U,		return (__m128d)__builtin_ia32_selectpd_128((__mmask8)__U,
(__v2df)_mm_sqrt_pd(__A),		(__v2df)_mm_sqrt_pd(__A),
(__v2df)__W);		(__v2df)__W);
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_maskz_sqrt_pd(__mmask8 __U, __m128d __A) {		_mm_maskz_sqrt_pd(__mmask8 __U, __m128d __A) {
return (__m128d)__builtin_ia32_selectpd_128((__mmask8)__U,		return (__m128d)__builtin_ia32_selectpd_128((__mmask8)__U,
(__v2df)_mm_sqrt_pd(__A),		(__v2df)_mm_sqrt_pd(__A),
(__v2df)_mm_setzero_pd());		(__v2df)_mm_setzero_pd());
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_mask_sqrt_pd(__m256d __W, __mmask8 __U, __m256d __A) {		_mm256_mask_sqrt_pd(__m256d __W, __mmask8 __U, __m256d __A) {
return (__m256d)__builtin_ia32_selectpd_256((__mmask8)__U,		return (__m256d)__builtin_ia32_selectpd_256((__mmask8)__U,
(__v4df)_mm256_sqrt_pd(__A),		(__v4df)_mm256_sqrt_pd(__A),
(__v4df)__W);		(__v4df)__W);
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_maskz_sqrt_pd(__mmask8 __U, __m256d __A) {		_mm256_maskz_sqrt_pd(__mmask8 __U, __m256d __A) {
return (__m256d)__builtin_ia32_selectpd_256((__mmask8)__U,		return (__m256d)__builtin_ia32_selectpd_256((__mmask8)__U,
(__v4df)_mm256_sqrt_pd(__A),		(__v4df)_mm256_sqrt_pd(__A),
(__v4df)_mm256_setzero_pd());		(__v4df)_mm256_setzero_pd());
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_mask_sqrt_ps(__m128 __W, __mmask8 __U, __m128 __A) {		_mm_mask_sqrt_ps(__m128 __W, __mmask8 __U, __m128 __A) {
return (__m128)__builtin_ia32_selectps_128((__mmask8)__U,		return (__m128)__builtin_ia32_selectps_128((__mmask8)__U,
(__v4sf)_mm_sqrt_ps(__A),		(__v4sf)_mm_sqrt_ps(__A),
(__v4sf)__W);		(__v4sf)__W);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_maskz_sqrt_ps(__mmask8 __U, __m128 __A) {		_mm_maskz_sqrt_ps(__mmask8 __U, __m128 __A) {
return (__m128)__builtin_ia32_selectps_128((__mmask8)__U,		return (__m128)__builtin_ia32_selectps_128((__mmask8)__U,
(__v4sf)_mm_sqrt_ps(__A),		(__v4sf)_mm_sqrt_ps(__A),
(__v4sf)_mm_setzero_pd());		(__v4sf)_mm_setzero_pd());
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_mask_sqrt_ps(__m256 __W, __mmask8 __U, __m256 __A) {		_mm256_mask_sqrt_ps(__m256 __W, __mmask8 __U, __m256 __A) {
return (__m256)__builtin_ia32_selectps_256((__mmask8)__U,		return (__m256)__builtin_ia32_selectps_256((__mmask8)__U,
(__v8sf)_mm256_sqrt_ps(__A),		(__v8sf)_mm256_sqrt_ps(__A),
(__v8sf)__W);		(__v8sf)__W);
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_maskz_sqrt_ps(__mmask8 __U, __m256 __A) {		_mm256_maskz_sqrt_ps(__mmask8 __U, __m256 __A) {
return (__m256)__builtin_ia32_selectps_256((__mmask8)__U,		return (__m256)__builtin_ia32_selectps_256((__mmask8)__U,
(__v8sf)_mm256_sqrt_ps(__A),		(__v8sf)_mm256_sqrt_ps(__A),
(__v8sf)_mm256_setzero_ps());		(__v8sf)_mm256_setzero_ps());
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_mask_sub_pd(__m128d __W, __mmask8 __U, __m128d __A, __m128d __B) {		_mm_mask_sub_pd(__m128d __W, __mmask8 __U, __m128d __A, __m128d __B) {
return (__m128d)__builtin_ia32_selectpd_128((__mmask8)__U,		return (__m128d)__builtin_ia32_selectpd_128((__mmask8)__U,
(__v2df)_mm_sub_pd(__A, __B),		(__v2df)_mm_sub_pd(__A, __B),
(__v2df)__W);		(__v2df)__W);
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_maskz_sub_pd(__mmask8 __U, __m128d __A, __m128d __B) {		_mm_maskz_sub_pd(__mmask8 __U, __m128d __A, __m128d __B) {
return (__m128d)__builtin_ia32_selectpd_128((__mmask8)__U,		return (__m128d)__builtin_ia32_selectpd_128((__mmask8)__U,
(__v2df)_mm_sub_pd(__A, __B),		(__v2df)_mm_sub_pd(__A, __B),
(__v2df)_mm_setzero_pd());		(__v2df)_mm_setzero_pd());
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_mask_sub_pd(__m256d __W, __mmask8 __U, __m256d __A, __m256d __B) {		_mm256_mask_sub_pd(__m256d __W, __mmask8 __U, __m256d __A, __m256d __B) {
return (__m256d)__builtin_ia32_selectpd_256((__mmask8)__U,		return (__m256d)__builtin_ia32_selectpd_256((__mmask8)__U,
(__v4df)_mm256_sub_pd(__A, __B),		(__v4df)_mm256_sub_pd(__A, __B),
(__v4df)__W);		(__v4df)__W);
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_maskz_sub_pd(__mmask8 __U, __m256d __A, __m256d __B) {		_mm256_maskz_sub_pd(__mmask8 __U, __m256d __A, __m256d __B) {
return (__m256d)__builtin_ia32_selectpd_256((__mmask8)__U,		return (__m256d)__builtin_ia32_selectpd_256((__mmask8)__U,
(__v4df)_mm256_sub_pd(__A, __B),		(__v4df)_mm256_sub_pd(__A, __B),
(__v4df)_mm256_setzero_pd());		(__v4df)_mm256_setzero_pd());
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_mask_sub_ps(__m128 __W, __mmask8 __U, __m128 __A, __m128 __B) {		_mm_mask_sub_ps(__m128 __W, __mmask8 __U, __m128 __A, __m128 __B) {
return (__m128)__builtin_ia32_selectps_128((__mmask8)__U,		return (__m128)__builtin_ia32_selectps_128((__mmask8)__U,
(__v4sf)_mm_sub_ps(__A, __B),		(__v4sf)_mm_sub_ps(__A, __B),
(__v4sf)__W);		(__v4sf)__W);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_maskz_sub_ps(__mmask8 __U, __m128 __A, __m128 __B) {		_mm_maskz_sub_ps(__mmask8 __U, __m128 __A, __m128 __B) {
return (__m128)__builtin_ia32_selectps_128((__mmask8)__U,		return (__m128)__builtin_ia32_selectps_128((__mmask8)__U,
(__v4sf)_mm_sub_ps(__A, __B),		(__v4sf)_mm_sub_ps(__A, __B),
(__v4sf)_mm_setzero_ps());		(__v4sf)_mm_setzero_ps());
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_mask_sub_ps(__m256 __W, __mmask8 __U, __m256 __A, __m256 __B) {		_mm256_mask_sub_ps(__m256 __W, __mmask8 __U, __m256 __A, __m256 __B) {
return (__m256)__builtin_ia32_selectps_256((__mmask8)__U,		return (__m256)__builtin_ia32_selectps_256((__mmask8)__U,
(__v8sf)_mm256_sub_ps(__A, __B),		(__v8sf)_mm256_sub_ps(__A, __B),
(__v8sf)__W);		(__v8sf)__W);
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_maskz_sub_ps(__mmask8 __U, __m256 __A, __m256 __B) {		_mm256_maskz_sub_ps(__mmask8 __U, __m256 __A, __m256 __B) {
return (__m256)__builtin_ia32_selectps_256((__mmask8)__U,		return (__m256)__builtin_ia32_selectps_256((__mmask8)__U,
(__v8sf)_mm256_sub_ps(__A, __B),		(__v8sf)_mm256_sub_ps(__A, __B),
(__v8sf)_mm256_setzero_ps());		(__v8sf)_mm256_setzero_ps());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_permutex2var_epi32(__m128i __A, __m128i __I, __m128i __B) {		_mm_permutex2var_epi32(__m128i __A, __m128i __I, __m128i __B) {
return (__m128i)__builtin_ia32_vpermi2vard128((__v4si) __A, (__v4si)__I,		return (__m128i)__builtin_ia32_vpermi2vard128((__v4si) __A, (__v4si)__I,
(__v4si)__B);		(__v4si)__B);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_permutex2var_epi32(__m128i __A, __mmask8 __U, __m128i __I,		_mm_mask_permutex2var_epi32(__m128i __A, __mmask8 __U, __m128i __I,
__m128i __B) {		__m128i __B) {
return (__m128i)__builtin_ia32_selectd_128(__U,		return (__m128i)__builtin_ia32_selectd_128(__U,
(__v4si)_mm_permutex2var_epi32(__A, __I, __B),		(__v4si)_mm_permutex2var_epi32(__A, __I, __B),
(__v4si)__A);		(__v4si)__A);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask2_permutex2var_epi32(__m128i __A, __m128i __I, __mmask8 __U,		_mm_mask2_permutex2var_epi32(__m128i __A, __m128i __I, __mmask8 __U,
__m128i __B) {		__m128i __B) {
return (__m128i)__builtin_ia32_selectd_128(__U,		return (__m128i)__builtin_ia32_selectd_128(__U,
(__v4si)_mm_permutex2var_epi32(__A, __I, __B),		(__v4si)_mm_permutex2var_epi32(__A, __I, __B),
(__v4si)__I);		(__v4si)__I);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_permutex2var_epi32(__mmask8 __U, __m128i __A, __m128i __I,		_mm_maskz_permutex2var_epi32(__mmask8 __U, __m128i __A, __m128i __I,
__m128i __B) {		__m128i __B) {
return (__m128i)__builtin_ia32_selectd_128(__U,		return (__m128i)__builtin_ia32_selectd_128(__U,
(__v4si)_mm_permutex2var_epi32(__A, __I, __B),		(__v4si)_mm_permutex2var_epi32(__A, __I, __B),
(__v4si)_mm_setzero_si128());		(__v4si)_mm_setzero_si128());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_permutex2var_epi32(__m256i __A, __m256i __I, __m256i __B) {		_mm256_permutex2var_epi32(__m256i __A, __m256i __I, __m256i __B) {
return (__m256i)__builtin_ia32_vpermi2vard256((__v8si)__A, (__v8si) __I,		return (__m256i)__builtin_ia32_vpermi2vard256((__v8si)__A, (__v8si) __I,
(__v8si) __B);		(__v8si) __B);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_permutex2var_epi32(__m256i __A, __mmask8 __U, __m256i __I,		_mm256_mask_permutex2var_epi32(__m256i __A, __mmask8 __U, __m256i __I,
__m256i __B) {		__m256i __B) {
return (__m256i)__builtin_ia32_selectd_256(__U,		return (__m256i)__builtin_ia32_selectd_256(__U,
(__v8si)_mm256_permutex2var_epi32(__A, __I, __B),		(__v8si)_mm256_permutex2var_epi32(__A, __I, __B),
(__v8si)__A);		(__v8si)__A);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask2_permutex2var_epi32(__m256i __A, __m256i __I, __mmask8 __U,		_mm256_mask2_permutex2var_epi32(__m256i __A, __m256i __I, __mmask8 __U,
__m256i __B) {		__m256i __B) {
return (__m256i)__builtin_ia32_selectd_256(__U,		return (__m256i)__builtin_ia32_selectd_256(__U,
(__v8si)_mm256_permutex2var_epi32(__A, __I, __B),		(__v8si)_mm256_permutex2var_epi32(__A, __I, __B),
(__v8si)__I);		(__v8si)__I);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_permutex2var_epi32(__mmask8 __U, __m256i __A, __m256i __I,		_mm256_maskz_permutex2var_epi32(__mmask8 __U, __m256i __A, __m256i __I,
__m256i __B) {		__m256i __B) {
return (__m256i)__builtin_ia32_selectd_256(__U,		return (__m256i)__builtin_ia32_selectd_256(__U,
(__v8si)_mm256_permutex2var_epi32(__A, __I, __B),		(__v8si)_mm256_permutex2var_epi32(__A, __I, __B),
(__v8si)_mm256_setzero_si256());		(__v8si)_mm256_setzero_si256());
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_permutex2var_pd(__m128d __A, __m128i __I, __m128d __B) {		_mm_permutex2var_pd(__m128d __A, __m128i __I, __m128d __B) {
return (__m128d)__builtin_ia32_vpermi2varpd128((__v2df)__A, (__v2di)__I,		return (__m128d)__builtin_ia32_vpermi2varpd128((__v2df)__A, (__v2di)__I,
(__v2df)__B);		(__v2df)__B);
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_mask_permutex2var_pd(__m128d __A, __mmask8 __U, __m128i __I, __m128d __B) {		_mm_mask_permutex2var_pd(__m128d __A, __mmask8 __U, __m128i __I, __m128d __B) {
return (__m128d)__builtin_ia32_selectpd_128(__U,		return (__m128d)__builtin_ia32_selectpd_128(__U,
(__v2df)_mm_permutex2var_pd(__A, __I, __B),		(__v2df)_mm_permutex2var_pd(__A, __I, __B),
(__v2df)__A);		(__v2df)__A);
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_mask2_permutex2var_pd(__m128d __A, __m128i __I, __mmask8 __U, __m128d __B) {		_mm_mask2_permutex2var_pd(__m128d __A, __m128i __I, __mmask8 __U, __m128d __B) {
return (__m128d)__builtin_ia32_selectpd_128(__U,		return (__m128d)__builtin_ia32_selectpd_128(__U,
(__v2df)_mm_permutex2var_pd(__A, __I, __B),		(__v2df)_mm_permutex2var_pd(__A, __I, __B),
(__v2df)(__m128d)__I);		(__v2df)(__m128d)__I);
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_maskz_permutex2var_pd(__mmask8 __U, __m128d __A, __m128i __I, __m128d __B) {		_mm_maskz_permutex2var_pd(__mmask8 __U, __m128d __A, __m128i __I, __m128d __B) {
return (__m128d)__builtin_ia32_selectpd_128(__U,		return (__m128d)__builtin_ia32_selectpd_128(__U,
(__v2df)_mm_permutex2var_pd(__A, __I, __B),		(__v2df)_mm_permutex2var_pd(__A, __I, __B),
(__v2df)_mm_setzero_pd());		(__v2df)_mm_setzero_pd());
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_permutex2var_pd(__m256d __A, __m256i __I, __m256d __B) {		_mm256_permutex2var_pd(__m256d __A, __m256i __I, __m256d __B) {
return (__m256d)__builtin_ia32_vpermi2varpd256((__v4df)__A, (__v4di)__I,		return (__m256d)__builtin_ia32_vpermi2varpd256((__v4df)__A, (__v4di)__I,
(__v4df)__B);		(__v4df)__B);
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_mask_permutex2var_pd(__m256d __A, __mmask8 __U, __m256i __I,		_mm256_mask_permutex2var_pd(__m256d __A, __mmask8 __U, __m256i __I,
__m256d __B) {		__m256d __B) {
return (__m256d)__builtin_ia32_selectpd_256(__U,		return (__m256d)__builtin_ia32_selectpd_256(__U,
(__v4df)_mm256_permutex2var_pd(__A, __I, __B),		(__v4df)_mm256_permutex2var_pd(__A, __I, __B),
(__v4df)__A);		(__v4df)__A);
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_mask2_permutex2var_pd(__m256d __A, __m256i __I, __mmask8 __U,		_mm256_mask2_permutex2var_pd(__m256d __A, __m256i __I, __mmask8 __U,
__m256d __B) {		__m256d __B) {
return (__m256d)__builtin_ia32_selectpd_256(__U,		return (__m256d)__builtin_ia32_selectpd_256(__U,
(__v4df)_mm256_permutex2var_pd(__A, __I, __B),		(__v4df)_mm256_permutex2var_pd(__A, __I, __B),
(__v4df)(__m256d)__I);		(__v4df)(__m256d)__I);
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_maskz_permutex2var_pd(__mmask8 __U, __m256d __A, __m256i __I,		_mm256_maskz_permutex2var_pd(__mmask8 __U, __m256d __A, __m256i __I,
__m256d __B) {		__m256d __B) {
return (__m256d)__builtin_ia32_selectpd_256(__U,		return (__m256d)__builtin_ia32_selectpd_256(__U,
(__v4df)_mm256_permutex2var_pd(__A, __I, __B),		(__v4df)_mm256_permutex2var_pd(__A, __I, __B),
(__v4df)_mm256_setzero_pd());		(__v4df)_mm256_setzero_pd());
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_permutex2var_ps(__m128 __A, __m128i __I, __m128 __B) {		_mm_permutex2var_ps(__m128 __A, __m128i __I, __m128 __B) {
return (__m128)__builtin_ia32_vpermi2varps128((__v4sf)__A, (__v4si)__I,		return (__m128)__builtin_ia32_vpermi2varps128((__v4sf)__A, (__v4si)__I,
(__v4sf)__B);		(__v4sf)__B);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_mask_permutex2var_ps(__m128 __A, __mmask8 __U, __m128i __I, __m128 __B) {		_mm_mask_permutex2var_ps(__m128 __A, __mmask8 __U, __m128i __I, __m128 __B) {
return (__m128)__builtin_ia32_selectps_128(__U,		return (__m128)__builtin_ia32_selectps_128(__U,
(__v4sf)_mm_permutex2var_ps(__A, __I, __B),		(__v4sf)_mm_permutex2var_ps(__A, __I, __B),
(__v4sf)__A);		(__v4sf)__A);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_mask2_permutex2var_ps(__m128 __A, __m128i __I, __mmask8 __U, __m128 __B) {		_mm_mask2_permutex2var_ps(__m128 __A, __m128i __I, __mmask8 __U, __m128 __B) {
return (__m128)__builtin_ia32_selectps_128(__U,		return (__m128)__builtin_ia32_selectps_128(__U,
(__v4sf)_mm_permutex2var_ps(__A, __I, __B),		(__v4sf)_mm_permutex2var_ps(__A, __I, __B),
(__v4sf)(__m128)__I);		(__v4sf)(__m128)__I);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_maskz_permutex2var_ps(__mmask8 __U, __m128 __A, __m128i __I, __m128 __B) {		_mm_maskz_permutex2var_ps(__mmask8 __U, __m128 __A, __m128i __I, __m128 __B) {
return (__m128)__builtin_ia32_selectps_128(__U,		return (__m128)__builtin_ia32_selectps_128(__U,
(__v4sf)_mm_permutex2var_ps(__A, __I, __B),		(__v4sf)_mm_permutex2var_ps(__A, __I, __B),
(__v4sf)_mm_setzero_ps());		(__v4sf)_mm_setzero_ps());
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_permutex2var_ps(__m256 __A, __m256i __I, __m256 __B) {		_mm256_permutex2var_ps(__m256 __A, __m256i __I, __m256 __B) {
return (__m256)__builtin_ia32_vpermi2varps256((__v8sf)__A, (__v8si)__I,		return (__m256)__builtin_ia32_vpermi2varps256((__v8sf)__A, (__v8si)__I,
(__v8sf) __B);		(__v8sf) __B);
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_mask_permutex2var_ps(__m256 __A, __mmask8 __U, __m256i __I, __m256 __B) {		_mm256_mask_permutex2var_ps(__m256 __A, __mmask8 __U, __m256i __I, __m256 __B) {
return (__m256)__builtin_ia32_selectps_256(__U,		return (__m256)__builtin_ia32_selectps_256(__U,
(__v8sf)_mm256_permutex2var_ps(__A, __I, __B),		(__v8sf)_mm256_permutex2var_ps(__A, __I, __B),
(__v8sf)__A);		(__v8sf)__A);
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_mask2_permutex2var_ps(__m256 __A, __m256i __I, __mmask8 __U,		_mm256_mask2_permutex2var_ps(__m256 __A, __m256i __I, __mmask8 __U,
__m256 __B) {		__m256 __B) {
return (__m256)__builtin_ia32_selectps_256(__U,		return (__m256)__builtin_ia32_selectps_256(__U,
(__v8sf)_mm256_permutex2var_ps(__A, __I, __B),		(__v8sf)_mm256_permutex2var_ps(__A, __I, __B),
(__v8sf)(__m256)__I);		(__v8sf)(__m256)__I);
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_maskz_permutex2var_ps(__mmask8 __U, __m256 __A, __m256i __I,		_mm256_maskz_permutex2var_ps(__mmask8 __U, __m256 __A, __m256i __I,
__m256 __B) {		__m256 __B) {
return (__m256)__builtin_ia32_selectps_256(__U,		return (__m256)__builtin_ia32_selectps_256(__U,
(__v8sf)_mm256_permutex2var_ps(__A, __I, __B),		(__v8sf)_mm256_permutex2var_ps(__A, __I, __B),
(__v8sf)_mm256_setzero_ps());		(__v8sf)_mm256_setzero_ps());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_permutex2var_epi64(__m128i __A, __m128i __I, __m128i __B) {		_mm_permutex2var_epi64(__m128i __A, __m128i __I, __m128i __B) {
return (__m128i)__builtin_ia32_vpermi2varq128((__v2di)__A, (__v2di)__I,		return (__m128i)__builtin_ia32_vpermi2varq128((__v2di)__A, (__v2di)__I,
(__v2di)__B);		(__v2di)__B);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_permutex2var_epi64(__m128i __A, __mmask8 __U, __m128i __I,		_mm_mask_permutex2var_epi64(__m128i __A, __mmask8 __U, __m128i __I,
__m128i __B) {		__m128i __B) {
return (__m128i)__builtin_ia32_selectq_128(__U,		return (__m128i)__builtin_ia32_selectq_128(__U,
(__v2di)_mm_permutex2var_epi64(__A, __I, __B),		(__v2di)_mm_permutex2var_epi64(__A, __I, __B),
(__v2di)__A);		(__v2di)__A);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask2_permutex2var_epi64(__m128i __A, __m128i __I, __mmask8 __U,		_mm_mask2_permutex2var_epi64(__m128i __A, __m128i __I, __mmask8 __U,
__m128i __B) {		__m128i __B) {
return (__m128i)__builtin_ia32_selectq_128(__U,		return (__m128i)__builtin_ia32_selectq_128(__U,
(__v2di)_mm_permutex2var_epi64(__A, __I, __B),		(__v2di)_mm_permutex2var_epi64(__A, __I, __B),
(__v2di)__I);		(__v2di)__I);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_permutex2var_epi64(__mmask8 __U, __m128i __A, __m128i __I,		_mm_maskz_permutex2var_epi64(__mmask8 __U, __m128i __A, __m128i __I,
__m128i __B) {		__m128i __B) {
return (__m128i)__builtin_ia32_selectq_128(__U,		return (__m128i)__builtin_ia32_selectq_128(__U,
(__v2di)_mm_permutex2var_epi64(__A, __I, __B),		(__v2di)_mm_permutex2var_epi64(__A, __I, __B),
(__v2di)_mm_setzero_si128());		(__v2di)_mm_setzero_si128());
}		}


static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_permutex2var_epi64(__m256i __A, __m256i __I, __m256i __B) {		_mm256_permutex2var_epi64(__m256i __A, __m256i __I, __m256i __B) {
return (__m256i)__builtin_ia32_vpermi2varq256((__v4di)__A, (__v4di) __I,		return (__m256i)__builtin_ia32_vpermi2varq256((__v4di)__A, (__v4di) __I,
(__v4di) __B);		(__v4di) __B);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_permutex2var_epi64(__m256i __A, __mmask8 __U, __m256i __I,		_mm256_mask_permutex2var_epi64(__m256i __A, __mmask8 __U, __m256i __I,
__m256i __B) {		__m256i __B) {
return (__m256i)__builtin_ia32_selectq_256(__U,		return (__m256i)__builtin_ia32_selectq_256(__U,
(__v4di)_mm256_permutex2var_epi64(__A, __I, __B),		(__v4di)_mm256_permutex2var_epi64(__A, __I, __B),
(__v4di)__A);		(__v4di)__A);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask2_permutex2var_epi64(__m256i __A, __m256i __I, __mmask8 __U,		_mm256_mask2_permutex2var_epi64(__m256i __A, __m256i __I, __mmask8 __U,
__m256i __B) {		__m256i __B) {
return (__m256i)__builtin_ia32_selectq_256(__U,		return (__m256i)__builtin_ia32_selectq_256(__U,
(__v4di)_mm256_permutex2var_epi64(__A, __I, __B),		(__v4di)_mm256_permutex2var_epi64(__A, __I, __B),
(__v4di)__I);		(__v4di)__I);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_permutex2var_epi64(__mmask8 __U, __m256i __A, __m256i __I,		_mm256_maskz_permutex2var_epi64(__mmask8 __U, __m256i __A, __m256i __I,
__m256i __B) {		__m256i __B) {
return (__m256i)__builtin_ia32_selectq_256(__U,		return (__m256i)__builtin_ia32_selectq_256(__U,
(__v4di)_mm256_permutex2var_epi64(__A, __I, __B),		(__v4di)_mm256_permutex2var_epi64(__A, __I, __B),
(__v4di)_mm256_setzero_si256());		(__v4di)_mm256_setzero_si256());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_cvtepi8_epi32(__m128i __W, __mmask8 __U, __m128i __A)		_mm_mask_cvtepi8_epi32(__m128i __W, __mmask8 __U, __m128i __A)
{		{
return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,
(__v4si)_mm_cvtepi8_epi32(__A),		(__v4si)_mm_cvtepi8_epi32(__A),
(__v4si)__W);		(__v4si)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_cvtepi8_epi32(__mmask8 __U, __m128i __A)		_mm_maskz_cvtepi8_epi32(__mmask8 __U, __m128i __A)
{		{
return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,
(__v4si)_mm_cvtepi8_epi32(__A),		(__v4si)_mm_cvtepi8_epi32(__A),
(__v4si)_mm_setzero_si128());		(__v4si)_mm_setzero_si128());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_cvtepi8_epi32 (__m256i __W, __mmask8 __U, __m128i __A)		_mm256_mask_cvtepi8_epi32 (__m256i __W, __mmask8 __U, __m128i __A)
{		{
return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,
(__v8si)_mm256_cvtepi8_epi32(__A),		(__v8si)_mm256_cvtepi8_epi32(__A),
(__v8si)__W);		(__v8si)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_cvtepi8_epi32 (__mmask8 __U, __m128i __A)		_mm256_maskz_cvtepi8_epi32 (__mmask8 __U, __m128i __A)
{		{
return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,
(__v8si)_mm256_cvtepi8_epi32(__A),		(__v8si)_mm256_cvtepi8_epi32(__A),
(__v8si)_mm256_setzero_si256());		(__v8si)_mm256_setzero_si256());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_cvtepi8_epi64(__m128i __W, __mmask8 __U, __m128i __A)		_mm_mask_cvtepi8_epi64(__m128i __W, __mmask8 __U, __m128i __A)
{		{
return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,
(__v2di)_mm_cvtepi8_epi64(__A),		(__v2di)_mm_cvtepi8_epi64(__A),
(__v2di)__W);		(__v2di)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_cvtepi8_epi64(__mmask8 __U, __m128i __A)		_mm_maskz_cvtepi8_epi64(__mmask8 __U, __m128i __A)
{		{
return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,
(__v2di)_mm_cvtepi8_epi64(__A),		(__v2di)_mm_cvtepi8_epi64(__A),
(__v2di)_mm_setzero_si128());		(__v2di)_mm_setzero_si128());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_cvtepi8_epi64(__m256i __W, __mmask8 __U, __m128i __A)		_mm256_mask_cvtepi8_epi64(__m256i __W, __mmask8 __U, __m128i __A)
{		{
return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,
(__v4di)_mm256_cvtepi8_epi64(__A),		(__v4di)_mm256_cvtepi8_epi64(__A),
(__v4di)__W);		(__v4di)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_cvtepi8_epi64(__mmask8 __U, __m128i __A)		_mm256_maskz_cvtepi8_epi64(__mmask8 __U, __m128i __A)
{		{
return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,
(__v4di)_mm256_cvtepi8_epi64(__A),		(__v4di)_mm256_cvtepi8_epi64(__A),
(__v4di)_mm256_setzero_si256());		(__v4di)_mm256_setzero_si256());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_cvtepi32_epi64(__m128i __W, __mmask8 __U, __m128i __X)		_mm_mask_cvtepi32_epi64(__m128i __W, __mmask8 __U, __m128i __X)
{		{
return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,
(__v2di)_mm_cvtepi32_epi64(__X),		(__v2di)_mm_cvtepi32_epi64(__X),
(__v2di)__W);		(__v2di)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_cvtepi32_epi64(__mmask8 __U, __m128i __X)		_mm_maskz_cvtepi32_epi64(__mmask8 __U, __m128i __X)
{		{
return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,
(__v2di)_mm_cvtepi32_epi64(__X),		(__v2di)_mm_cvtepi32_epi64(__X),
(__v2di)_mm_setzero_si128());		(__v2di)_mm_setzero_si128());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_cvtepi32_epi64(__m256i __W, __mmask8 __U, __m128i __X)		_mm256_mask_cvtepi32_epi64(__m256i __W, __mmask8 __U, __m128i __X)
{		{
return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,
(__v4di)_mm256_cvtepi32_epi64(__X),		(__v4di)_mm256_cvtepi32_epi64(__X),
(__v4di)__W);		(__v4di)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_cvtepi32_epi64(__mmask8 __U, __m128i __X)		_mm256_maskz_cvtepi32_epi64(__mmask8 __U, __m128i __X)
{		{
return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,
(__v4di)_mm256_cvtepi32_epi64(__X),		(__v4di)_mm256_cvtepi32_epi64(__X),
(__v4di)_mm256_setzero_si256());		(__v4di)_mm256_setzero_si256());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_cvtepi16_epi32(__m128i __W, __mmask8 __U, __m128i __A)		_mm_mask_cvtepi16_epi32(__m128i __W, __mmask8 __U, __m128i __A)
{		{
return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,
(__v4si)_mm_cvtepi16_epi32(__A),		(__v4si)_mm_cvtepi16_epi32(__A),
(__v4si)__W);		(__v4si)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_cvtepi16_epi32(__mmask8 __U, __m128i __A)		_mm_maskz_cvtepi16_epi32(__mmask8 __U, __m128i __A)
{		{
return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,
(__v4si)_mm_cvtepi16_epi32(__A),		(__v4si)_mm_cvtepi16_epi32(__A),
(__v4si)_mm_setzero_si128());		(__v4si)_mm_setzero_si128());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_cvtepi16_epi32(__m256i __W, __mmask8 __U, __m128i __A)		_mm256_mask_cvtepi16_epi32(__m256i __W, __mmask8 __U, __m128i __A)
{		{
return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,
(__v8si)_mm256_cvtepi16_epi32(__A),		(__v8si)_mm256_cvtepi16_epi32(__A),
(__v8si)__W);		(__v8si)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_cvtepi16_epi32 (__mmask8 __U, __m128i __A)		_mm256_maskz_cvtepi16_epi32 (__mmask8 __U, __m128i __A)
{		{
return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,
(__v8si)_mm256_cvtepi16_epi32(__A),		(__v8si)_mm256_cvtepi16_epi32(__A),
(__v8si)_mm256_setzero_si256());		(__v8si)_mm256_setzero_si256());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_cvtepi16_epi64(__m128i __W, __mmask8 __U, __m128i __A)		_mm_mask_cvtepi16_epi64(__m128i __W, __mmask8 __U, __m128i __A)
{		{
return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,
(__v2di)_mm_cvtepi16_epi64(__A),		(__v2di)_mm_cvtepi16_epi64(__A),
(__v2di)__W);		(__v2di)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_cvtepi16_epi64(__mmask8 __U, __m128i __A)		_mm_maskz_cvtepi16_epi64(__mmask8 __U, __m128i __A)
{		{
return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,
(__v2di)_mm_cvtepi16_epi64(__A),		(__v2di)_mm_cvtepi16_epi64(__A),
(__v2di)_mm_setzero_si128());		(__v2di)_mm_setzero_si128());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_cvtepi16_epi64(__m256i __W, __mmask8 __U, __m128i __A)		_mm256_mask_cvtepi16_epi64(__m256i __W, __mmask8 __U, __m128i __A)
{		{
return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,
(__v4di)_mm256_cvtepi16_epi64(__A),		(__v4di)_mm256_cvtepi16_epi64(__A),
(__v4di)__W);		(__v4di)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_cvtepi16_epi64(__mmask8 __U, __m128i __A)		_mm256_maskz_cvtepi16_epi64(__mmask8 __U, __m128i __A)
{		{
return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,
(__v4di)_mm256_cvtepi16_epi64(__A),		(__v4di)_mm256_cvtepi16_epi64(__A),
(__v4di)_mm256_setzero_si256());		(__v4di)_mm256_setzero_si256());
}		}


static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_cvtepu8_epi32(__m128i __W, __mmask8 __U, __m128i __A)		_mm_mask_cvtepu8_epi32(__m128i __W, __mmask8 __U, __m128i __A)
{		{
return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,
(__v4si)_mm_cvtepu8_epi32(__A),		(__v4si)_mm_cvtepu8_epi32(__A),
(__v4si)__W);		(__v4si)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_cvtepu8_epi32(__mmask8 __U, __m128i __A)		_mm_maskz_cvtepu8_epi32(__mmask8 __U, __m128i __A)
{		{
return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,
(__v4si)_mm_cvtepu8_epi32(__A),		(__v4si)_mm_cvtepu8_epi32(__A),
(__v4si)_mm_setzero_si128());		(__v4si)_mm_setzero_si128());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_cvtepu8_epi32(__m256i __W, __mmask8 __U, __m128i __A)		_mm256_mask_cvtepu8_epi32(__m256i __W, __mmask8 __U, __m128i __A)
{		{
return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,
(__v8si)_mm256_cvtepu8_epi32(__A),		(__v8si)_mm256_cvtepu8_epi32(__A),
(__v8si)__W);		(__v8si)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_cvtepu8_epi32(__mmask8 __U, __m128i __A)		_mm256_maskz_cvtepu8_epi32(__mmask8 __U, __m128i __A)
{		{
return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,
(__v8si)_mm256_cvtepu8_epi32(__A),		(__v8si)_mm256_cvtepu8_epi32(__A),
(__v8si)_mm256_setzero_si256());		(__v8si)_mm256_setzero_si256());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_cvtepu8_epi64(__m128i __W, __mmask8 __U, __m128i __A)		_mm_mask_cvtepu8_epi64(__m128i __W, __mmask8 __U, __m128i __A)
{		{
return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,
(__v2di)_mm_cvtepu8_epi64(__A),		(__v2di)_mm_cvtepu8_epi64(__A),
(__v2di)__W);		(__v2di)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_cvtepu8_epi64(__mmask8 __U, __m128i __A)		_mm_maskz_cvtepu8_epi64(__mmask8 __U, __m128i __A)
{		{
return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,
(__v2di)_mm_cvtepu8_epi64(__A),		(__v2di)_mm_cvtepu8_epi64(__A),
(__v2di)_mm_setzero_si128());		(__v2di)_mm_setzero_si128());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_cvtepu8_epi64(__m256i __W, __mmask8 __U, __m128i __A)		_mm256_mask_cvtepu8_epi64(__m256i __W, __mmask8 __U, __m128i __A)
{		{
return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,
(__v4di)_mm256_cvtepu8_epi64(__A),		(__v4di)_mm256_cvtepu8_epi64(__A),
(__v4di)__W);		(__v4di)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_cvtepu8_epi64 (__mmask8 __U, __m128i __A)		_mm256_maskz_cvtepu8_epi64 (__mmask8 __U, __m128i __A)
{		{
return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,
(__v4di)_mm256_cvtepu8_epi64(__A),		(__v4di)_mm256_cvtepu8_epi64(__A),
(__v4di)_mm256_setzero_si256());		(__v4di)_mm256_setzero_si256());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_cvtepu32_epi64(__m128i __W, __mmask8 __U, __m128i __X)		_mm_mask_cvtepu32_epi64(__m128i __W, __mmask8 __U, __m128i __X)
{		{
return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,
(__v2di)_mm_cvtepu32_epi64(__X),		(__v2di)_mm_cvtepu32_epi64(__X),
(__v2di)__W);		(__v2di)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_cvtepu32_epi64(__mmask8 __U, __m128i __X)		_mm_maskz_cvtepu32_epi64(__mmask8 __U, __m128i __X)
{		{
return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,
(__v2di)_mm_cvtepu32_epi64(__X),		(__v2di)_mm_cvtepu32_epi64(__X),
(__v2di)_mm_setzero_si128());		(__v2di)_mm_setzero_si128());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_cvtepu32_epi64(__m256i __W, __mmask8 __U, __m128i __X)		_mm256_mask_cvtepu32_epi64(__m256i __W, __mmask8 __U, __m128i __X)
{		{
return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,
(__v4di)_mm256_cvtepu32_epi64(__X),		(__v4di)_mm256_cvtepu32_epi64(__X),
(__v4di)__W);		(__v4di)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_cvtepu32_epi64(__mmask8 __U, __m128i __X)		_mm256_maskz_cvtepu32_epi64(__mmask8 __U, __m128i __X)
{		{
return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,
(__v4di)_mm256_cvtepu32_epi64(__X),		(__v4di)_mm256_cvtepu32_epi64(__X),
(__v4di)_mm256_setzero_si256());		(__v4di)_mm256_setzero_si256());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_cvtepu16_epi32(__m128i __W, __mmask8 __U, __m128i __A)		_mm_mask_cvtepu16_epi32(__m128i __W, __mmask8 __U, __m128i __A)
{		{
return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,
(__v4si)_mm_cvtepu16_epi32(__A),		(__v4si)_mm_cvtepu16_epi32(__A),
(__v4si)__W);		(__v4si)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_cvtepu16_epi32(__mmask8 __U, __m128i __A)		_mm_maskz_cvtepu16_epi32(__mmask8 __U, __m128i __A)
{		{
return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,
(__v4si)_mm_cvtepu16_epi32(__A),		(__v4si)_mm_cvtepu16_epi32(__A),
(__v4si)_mm_setzero_si128());		(__v4si)_mm_setzero_si128());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_cvtepu16_epi32(__m256i __W, __mmask8 __U, __m128i __A)		_mm256_mask_cvtepu16_epi32(__m256i __W, __mmask8 __U, __m128i __A)
{		{
return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,
(__v8si)_mm256_cvtepu16_epi32(__A),		(__v8si)_mm256_cvtepu16_epi32(__A),
(__v8si)__W);		(__v8si)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_cvtepu16_epi32(__mmask8 __U, __m128i __A)		_mm256_maskz_cvtepu16_epi32(__mmask8 __U, __m128i __A)
{		{
return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,
(__v8si)_mm256_cvtepu16_epi32(__A),		(__v8si)_mm256_cvtepu16_epi32(__A),
(__v8si)_mm256_setzero_si256());		(__v8si)_mm256_setzero_si256());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_cvtepu16_epi64(__m128i __W, __mmask8 __U, __m128i __A)		_mm_mask_cvtepu16_epi64(__m128i __W, __mmask8 __U, __m128i __A)
{		{
return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,
(__v2di)_mm_cvtepu16_epi64(__A),		(__v2di)_mm_cvtepu16_epi64(__A),
(__v2di)__W);		(__v2di)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_cvtepu16_epi64(__mmask8 __U, __m128i __A)		_mm_maskz_cvtepu16_epi64(__mmask8 __U, __m128i __A)
{		{
return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,
(__v2di)_mm_cvtepu16_epi64(__A),		(__v2di)_mm_cvtepu16_epi64(__A),
(__v2di)_mm_setzero_si128());		(__v2di)_mm_setzero_si128());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_cvtepu16_epi64(__m256i __W, __mmask8 __U, __m128i __A)		_mm256_mask_cvtepu16_epi64(__m256i __W, __mmask8 __U, __m128i __A)
{		{
return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,
(__v4di)_mm256_cvtepu16_epi64(__A),		(__v4di)_mm256_cvtepu16_epi64(__A),
(__v4di)__W);		(__v4di)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_cvtepu16_epi64(__mmask8 __U, __m128i __A)		_mm256_maskz_cvtepu16_epi64(__mmask8 __U, __m128i __A)
{		{
return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,
(__v4di)_mm256_cvtepu16_epi64(__A),		(__v4di)_mm256_cvtepu16_epi64(__A),
(__v4di)_mm256_setzero_si256());		(__v4di)_mm256_setzero_si256());
}		}


▲ Show 20 Lines • Show All 48 Lines • ▼ Show 20 Lines	#define _mm256_mask_rol_epi64(w, u, a, b) \
(__m256i)__builtin_ia32_prolq256_mask((__v4di)(__m256i)(a), (int)(b), \		(__m256i)__builtin_ia32_prolq256_mask((__v4di)(__m256i)(a), (int)(b), \
(__v4di)(__m256i)(w), (__mmask8)(u))		(__v4di)(__m256i)(w), (__mmask8)(u))

#define _mm256_maskz_rol_epi64(u, a, b) \		#define _mm256_maskz_rol_epi64(u, a, b) \
(__m256i)__builtin_ia32_prolq256_mask((__v4di)(__m256i)(a), (int)(b), \		(__m256i)__builtin_ia32_prolq256_mask((__v4di)(__m256i)(a), (int)(b), \
(__v4di)_mm256_setzero_si256(), \		(__v4di)_mm256_setzero_si256(), \
(__mmask8)(u))		(__mmask8)(u))

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_rolv_epi32 (__m128i __A, __m128i __B)		_mm_rolv_epi32 (__m128i __A, __m128i __B)
{		{
return (__m128i) __builtin_ia32_prolvd128_mask ((__v4si) __A,		return (__m128i) __builtin_ia32_prolvd128_mask ((__v4si) __A,
(__v4si) __B,		(__v4si) __B,
(__v4si)		(__v4si)
_mm_setzero_si128 (),		_mm_setzero_si128 (),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_rolv_epi32 (__m128i __W, __mmask8 __U, __m128i __A,		_mm_mask_rolv_epi32 (__m128i __W, __mmask8 __U, __m128i __A,
__m128i __B)		__m128i __B)
{		{
return (__m128i) __builtin_ia32_prolvd128_mask ((__v4si) __A,		return (__m128i) __builtin_ia32_prolvd128_mask ((__v4si) __A,
(__v4si) __B,		(__v4si) __B,
(__v4si) __W,		(__v4si) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_rolv_epi32 (__mmask8 __U, __m128i __A, __m128i __B)		_mm_maskz_rolv_epi32 (__mmask8 __U, __m128i __A, __m128i __B)
{		{
return (__m128i) __builtin_ia32_prolvd128_mask ((__v4si) __A,		return (__m128i) __builtin_ia32_prolvd128_mask ((__v4si) __A,
(__v4si) __B,		(__v4si) __B,
(__v4si)		(__v4si)
_mm_setzero_si128 (),		_mm_setzero_si128 (),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_rolv_epi32 (__m256i __A, __m256i __B)		_mm256_rolv_epi32 (__m256i __A, __m256i __B)
{		{
return (__m256i) __builtin_ia32_prolvd256_mask ((__v8si) __A,		return (__m256i) __builtin_ia32_prolvd256_mask ((__v8si) __A,
(__v8si) __B,		(__v8si) __B,
(__v8si)		(__v8si)
_mm256_setzero_si256 (),		_mm256_setzero_si256 (),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_rolv_epi32 (__m256i __W, __mmask8 __U, __m256i __A,		_mm256_mask_rolv_epi32 (__m256i __W, __mmask8 __U, __m256i __A,
__m256i __B)		__m256i __B)
{		{
return (__m256i) __builtin_ia32_prolvd256_mask ((__v8si) __A,		return (__m256i) __builtin_ia32_prolvd256_mask ((__v8si) __A,
(__v8si) __B,		(__v8si) __B,
(__v8si) __W,		(__v8si) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_rolv_epi32 (__mmask8 __U, __m256i __A, __m256i __B)		_mm256_maskz_rolv_epi32 (__mmask8 __U, __m256i __A, __m256i __B)
{		{
return (__m256i) __builtin_ia32_prolvd256_mask ((__v8si) __A,		return (__m256i) __builtin_ia32_prolvd256_mask ((__v8si) __A,
(__v8si) __B,		(__v8si) __B,
(__v8si)		(__v8si)
_mm256_setzero_si256 (),		_mm256_setzero_si256 (),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_rolv_epi64 (__m128i __A, __m128i __B)		_mm_rolv_epi64 (__m128i __A, __m128i __B)
{		{
return (__m128i) __builtin_ia32_prolvq128_mask ((__v2di) __A,		return (__m128i) __builtin_ia32_prolvq128_mask ((__v2di) __A,
(__v2di) __B,		(__v2di) __B,
(__v2di)		(__v2di)
_mm_setzero_si128 (),		_mm_setzero_si128 (),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_rolv_epi64 (__m128i __W, __mmask8 __U, __m128i __A,		_mm_mask_rolv_epi64 (__m128i __W, __mmask8 __U, __m128i __A,
__m128i __B)		__m128i __B)
{		{
return (__m128i) __builtin_ia32_prolvq128_mask ((__v2di) __A,		return (__m128i) __builtin_ia32_prolvq128_mask ((__v2di) __A,
(__v2di) __B,		(__v2di) __B,
(__v2di) __W,		(__v2di) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_rolv_epi64 (__mmask8 __U, __m128i __A, __m128i __B)		_mm_maskz_rolv_epi64 (__mmask8 __U, __m128i __A, __m128i __B)
{		{
return (__m128i) __builtin_ia32_prolvq128_mask ((__v2di) __A,		return (__m128i) __builtin_ia32_prolvq128_mask ((__v2di) __A,
(__v2di) __B,		(__v2di) __B,
(__v2di)		(__v2di)
_mm_setzero_si128 (),		_mm_setzero_si128 (),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_rolv_epi64 (__m256i __A, __m256i __B)		_mm256_rolv_epi64 (__m256i __A, __m256i __B)
{		{
return (__m256i) __builtin_ia32_prolvq256_mask ((__v4di) __A,		return (__m256i) __builtin_ia32_prolvq256_mask ((__v4di) __A,
(__v4di) __B,		(__v4di) __B,
(__v4di)		(__v4di)
_mm256_setzero_si256 (),		_mm256_setzero_si256 (),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_rolv_epi64 (__m256i __W, __mmask8 __U, __m256i __A,		_mm256_mask_rolv_epi64 (__m256i __W, __mmask8 __U, __m256i __A,
__m256i __B)		__m256i __B)
{		{
return (__m256i) __builtin_ia32_prolvq256_mask ((__v4di) __A,		return (__m256i) __builtin_ia32_prolvq256_mask ((__v4di) __A,
(__v4di) __B,		(__v4di) __B,
(__v4di) __W,		(__v4di) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_rolv_epi64 (__mmask8 __U, __m256i __A, __m256i __B)		_mm256_maskz_rolv_epi64 (__mmask8 __U, __m256i __A, __m256i __B)
{		{
return (__m256i) __builtin_ia32_prolvq256_mask ((__v4di) __A,		return (__m256i) __builtin_ia32_prolvq256_mask ((__v4di) __A,
(__v4di) __B,		(__v4di) __B,
(__v4di)		(__v4di)
_mm256_setzero_si256 (),		_mm256_setzero_si256 (),
(__mmask8) __U);		(__mmask8) __U);
}		}
▲ Show 20 Lines • Show All 49 Lines • ▼ Show 20 Lines	#define _mm256_mask_ror_epi64(W, U, A, B) \
(__m256i)__builtin_ia32_prorq256_mask((__v4di)(__m256i)(A), (int)(B), \		(__m256i)__builtin_ia32_prorq256_mask((__v4di)(__m256i)(A), (int)(B), \
(__v4di)(__m256i)(W), (__mmask8)(U))		(__v4di)(__m256i)(W), (__mmask8)(U))

#define _mm256_maskz_ror_epi64(U, A, B) \		#define _mm256_maskz_ror_epi64(U, A, B) \
(__m256i)__builtin_ia32_prorq256_mask((__v4di)(__m256i)(A), (int)(B), \		(__m256i)__builtin_ia32_prorq256_mask((__v4di)(__m256i)(A), (int)(B), \
(__v4di)_mm256_setzero_si256(), \		(__v4di)_mm256_setzero_si256(), \
(__mmask8)(U))		(__mmask8)(U))

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_sll_epi32(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)		_mm_mask_sll_epi32(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,
(__v4si)_mm_sll_epi32(__A, __B),		(__v4si)_mm_sll_epi32(__A, __B),
(__v4si)__W);		(__v4si)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_sll_epi32(__mmask8 __U, __m128i __A, __m128i __B)		_mm_maskz_sll_epi32(__mmask8 __U, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,
(__v4si)_mm_sll_epi32(__A, __B),		(__v4si)_mm_sll_epi32(__A, __B),
(__v4si)_mm_setzero_si128());		(__v4si)_mm_setzero_si128());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_sll_epi32(__m256i __W, __mmask8 __U, __m256i __A, __m128i __B)		_mm256_mask_sll_epi32(__m256i __W, __mmask8 __U, __m256i __A, __m128i __B)
{		{
return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,
(__v8si)_mm256_sll_epi32(__A, __B),		(__v8si)_mm256_sll_epi32(__A, __B),
(__v8si)__W);		(__v8si)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_sll_epi32(__mmask8 __U, __m256i __A, __m128i __B)		_mm256_maskz_sll_epi32(__mmask8 __U, __m256i __A, __m128i __B)
{		{
return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,
(__v8si)_mm256_sll_epi32(__A, __B),		(__v8si)_mm256_sll_epi32(__A, __B),
(__v8si)_mm256_setzero_si256());		(__v8si)_mm256_setzero_si256());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_slli_epi32(__m128i __W, __mmask8 __U, __m128i __A, int __B)		_mm_mask_slli_epi32(__m128i __W, __mmask8 __U, __m128i __A, int __B)
{		{
return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,
(__v4si)_mm_slli_epi32(__A, __B),		(__v4si)_mm_slli_epi32(__A, __B),
(__v4si)__W);		(__v4si)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_slli_epi32(__mmask8 __U, __m128i __A, int __B)		_mm_maskz_slli_epi32(__mmask8 __U, __m128i __A, int __B)
{		{
return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,
(__v4si)_mm_slli_epi32(__A, __B),		(__v4si)_mm_slli_epi32(__A, __B),
(__v4si)_mm_setzero_si128());		(__v4si)_mm_setzero_si128());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_slli_epi32(__m256i __W, __mmask8 __U, __m256i __A, int __B)		_mm256_mask_slli_epi32(__m256i __W, __mmask8 __U, __m256i __A, int __B)
{		{
return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,
(__v8si)_mm256_slli_epi32(__A, __B),		(__v8si)_mm256_slli_epi32(__A, __B),
(__v8si)__W);		(__v8si)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_slli_epi32(__mmask8 __U, __m256i __A, int __B)		_mm256_maskz_slli_epi32(__mmask8 __U, __m256i __A, int __B)
{		{
return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,
(__v8si)_mm256_slli_epi32(__A, __B),		(__v8si)_mm256_slli_epi32(__A, __B),
(__v8si)_mm256_setzero_si256());		(__v8si)_mm256_setzero_si256());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_sll_epi64(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)		_mm_mask_sll_epi64(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,
(__v2di)_mm_sll_epi64(__A, __B),		(__v2di)_mm_sll_epi64(__A, __B),
(__v2di)__W);		(__v2di)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_sll_epi64(__mmask8 __U, __m128i __A, __m128i __B)		_mm_maskz_sll_epi64(__mmask8 __U, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,
(__v2di)_mm_sll_epi64(__A, __B),		(__v2di)_mm_sll_epi64(__A, __B),
(__v2di)_mm_setzero_si128());		(__v2di)_mm_setzero_si128());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_sll_epi64(__m256i __W, __mmask8 __U, __m256i __A, __m128i __B)		_mm256_mask_sll_epi64(__m256i __W, __mmask8 __U, __m256i __A, __m128i __B)
{		{
return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,
(__v4di)_mm256_sll_epi64(__A, __B),		(__v4di)_mm256_sll_epi64(__A, __B),
(__v4di)__W);		(__v4di)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_sll_epi64(__mmask8 __U, __m256i __A, __m128i __B)		_mm256_maskz_sll_epi64(__mmask8 __U, __m256i __A, __m128i __B)
{		{
return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,
(__v4di)_mm256_sll_epi64(__A, __B),		(__v4di)_mm256_sll_epi64(__A, __B),
(__v4di)_mm256_setzero_si256());		(__v4di)_mm256_setzero_si256());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_slli_epi64(__m128i __W, __mmask8 __U, __m128i __A, int __B)		_mm_mask_slli_epi64(__m128i __W, __mmask8 __U, __m128i __A, int __B)
{		{
return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,
(__v2di)_mm_slli_epi64(__A, __B),		(__v2di)_mm_slli_epi64(__A, __B),
(__v2di)__W);		(__v2di)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_slli_epi64(__mmask8 __U, __m128i __A, int __B)		_mm_maskz_slli_epi64(__mmask8 __U, __m128i __A, int __B)
{		{
return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,
(__v2di)_mm_slli_epi64(__A, __B),		(__v2di)_mm_slli_epi64(__A, __B),
(__v2di)_mm_setzero_si128());		(__v2di)_mm_setzero_si128());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_slli_epi64(__m256i __W, __mmask8 __U, __m256i __A, int __B)		_mm256_mask_slli_epi64(__m256i __W, __mmask8 __U, __m256i __A, int __B)
{		{
return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,
(__v4di)_mm256_slli_epi64(__A, __B),		(__v4di)_mm256_slli_epi64(__A, __B),
(__v4di)__W);		(__v4di)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_slli_epi64(__mmask8 __U, __m256i __A, int __B)		_mm256_maskz_slli_epi64(__mmask8 __U, __m256i __A, int __B)
{		{
return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,
(__v4di)_mm256_slli_epi64(__A, __B),		(__v4di)_mm256_slli_epi64(__A, __B),
(__v4di)_mm256_setzero_si256());		(__v4di)_mm256_setzero_si256());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_rorv_epi32 (__m128i __A, __m128i __B)		_mm_rorv_epi32 (__m128i __A, __m128i __B)
{		{
return (__m128i) __builtin_ia32_prorvd128_mask ((__v4si) __A,		return (__m128i) __builtin_ia32_prorvd128_mask ((__v4si) __A,
(__v4si) __B,		(__v4si) __B,
(__v4si)		(__v4si)
_mm_setzero_si128 (),		_mm_setzero_si128 (),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_rorv_epi32 (__m128i __W, __mmask8 __U, __m128i __A,		_mm_mask_rorv_epi32 (__m128i __W, __mmask8 __U, __m128i __A,
__m128i __B)		__m128i __B)
{		{
return (__m128i) __builtin_ia32_prorvd128_mask ((__v4si) __A,		return (__m128i) __builtin_ia32_prorvd128_mask ((__v4si) __A,
(__v4si) __B,		(__v4si) __B,
(__v4si) __W,		(__v4si) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_rorv_epi32 (__mmask8 __U, __m128i __A, __m128i __B)		_mm_maskz_rorv_epi32 (__mmask8 __U, __m128i __A, __m128i __B)
{		{
return (__m128i) __builtin_ia32_prorvd128_mask ((__v4si) __A,		return (__m128i) __builtin_ia32_prorvd128_mask ((__v4si) __A,
(__v4si) __B,		(__v4si) __B,
(__v4si)		(__v4si)
_mm_setzero_si128 (),		_mm_setzero_si128 (),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_rorv_epi32 (__m256i __A, __m256i __B)		_mm256_rorv_epi32 (__m256i __A, __m256i __B)
{		{
return (__m256i) __builtin_ia32_prorvd256_mask ((__v8si) __A,		return (__m256i) __builtin_ia32_prorvd256_mask ((__v8si) __A,
(__v8si) __B,		(__v8si) __B,
(__v8si)		(__v8si)
_mm256_setzero_si256 (),		_mm256_setzero_si256 (),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_rorv_epi32 (__m256i __W, __mmask8 __U, __m256i __A,		_mm256_mask_rorv_epi32 (__m256i __W, __mmask8 __U, __m256i __A,
__m256i __B)		__m256i __B)
{		{
return (__m256i) __builtin_ia32_prorvd256_mask ((__v8si) __A,		return (__m256i) __builtin_ia32_prorvd256_mask ((__v8si) __A,
(__v8si) __B,		(__v8si) __B,
(__v8si) __W,		(__v8si) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_rorv_epi32 (__mmask8 __U, __m256i __A, __m256i __B)		_mm256_maskz_rorv_epi32 (__mmask8 __U, __m256i __A, __m256i __B)
{		{
return (__m256i) __builtin_ia32_prorvd256_mask ((__v8si) __A,		return (__m256i) __builtin_ia32_prorvd256_mask ((__v8si) __A,
(__v8si) __B,		(__v8si) __B,
(__v8si)		(__v8si)
_mm256_setzero_si256 (),		_mm256_setzero_si256 (),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_rorv_epi64 (__m128i __A, __m128i __B)		_mm_rorv_epi64 (__m128i __A, __m128i __B)
{		{
return (__m128i) __builtin_ia32_prorvq128_mask ((__v2di) __A,		return (__m128i) __builtin_ia32_prorvq128_mask ((__v2di) __A,
(__v2di) __B,		(__v2di) __B,
(__v2di)		(__v2di)
_mm_setzero_si128 (),		_mm_setzero_si128 (),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_rorv_epi64 (__m128i __W, __mmask8 __U, __m128i __A,		_mm_mask_rorv_epi64 (__m128i __W, __mmask8 __U, __m128i __A,
__m128i __B)		__m128i __B)
{		{
return (__m128i) __builtin_ia32_prorvq128_mask ((__v2di) __A,		return (__m128i) __builtin_ia32_prorvq128_mask ((__v2di) __A,
(__v2di) __B,		(__v2di) __B,
(__v2di) __W,		(__v2di) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_rorv_epi64 (__mmask8 __U, __m128i __A, __m128i __B)		_mm_maskz_rorv_epi64 (__mmask8 __U, __m128i __A, __m128i __B)
{		{
return (__m128i) __builtin_ia32_prorvq128_mask ((__v2di) __A,		return (__m128i) __builtin_ia32_prorvq128_mask ((__v2di) __A,
(__v2di) __B,		(__v2di) __B,
(__v2di)		(__v2di)
_mm_setzero_si128 (),		_mm_setzero_si128 (),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_rorv_epi64 (__m256i __A, __m256i __B)		_mm256_rorv_epi64 (__m256i __A, __m256i __B)
{		{
return (__m256i) __builtin_ia32_prorvq256_mask ((__v4di) __A,		return (__m256i) __builtin_ia32_prorvq256_mask ((__v4di) __A,
(__v4di) __B,		(__v4di) __B,
(__v4di)		(__v4di)
_mm256_setzero_si256 (),		_mm256_setzero_si256 (),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_rorv_epi64 (__m256i __W, __mmask8 __U, __m256i __A,		_mm256_mask_rorv_epi64 (__m256i __W, __mmask8 __U, __m256i __A,
__m256i __B)		__m256i __B)
{		{
return (__m256i) __builtin_ia32_prorvq256_mask ((__v4di) __A,		return (__m256i) __builtin_ia32_prorvq256_mask ((__v4di) __A,
(__v4di) __B,		(__v4di) __B,
(__v4di) __W,		(__v4di) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_rorv_epi64 (__mmask8 __U, __m256i __A, __m256i __B)		_mm256_maskz_rorv_epi64 (__mmask8 __U, __m256i __A, __m256i __B)
{		{
return (__m256i) __builtin_ia32_prorvq256_mask ((__v4di) __A,		return (__m256i) __builtin_ia32_prorvq256_mask ((__v4di) __A,
(__v4di) __B,		(__v4di) __B,
(__v4di)		(__v4di)
_mm256_setzero_si256 (),		_mm256_setzero_si256 (),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_sllv_epi64(__m128i __W, __mmask8 __U, __m128i __X, __m128i __Y)		_mm_mask_sllv_epi64(__m128i __W, __mmask8 __U, __m128i __X, __m128i __Y)
{		{
return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,
(__v2di)_mm_sllv_epi64(__X, __Y),		(__v2di)_mm_sllv_epi64(__X, __Y),
(__v2di)__W);		(__v2di)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_sllv_epi64(__mmask8 __U, __m128i __X, __m128i __Y)		_mm_maskz_sllv_epi64(__mmask8 __U, __m128i __X, __m128i __Y)
{		{
return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,
(__v2di)_mm_sllv_epi64(__X, __Y),		(__v2di)_mm_sllv_epi64(__X, __Y),
(__v2di)_mm_setzero_si128());		(__v2di)_mm_setzero_si128());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_sllv_epi64(__m256i __W, __mmask8 __U, __m256i __X, __m256i __Y)		_mm256_mask_sllv_epi64(__m256i __W, __mmask8 __U, __m256i __X, __m256i __Y)
{		{
return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,
(__v4di)_mm256_sllv_epi64(__X, __Y),		(__v4di)_mm256_sllv_epi64(__X, __Y),
(__v4di)__W);		(__v4di)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_sllv_epi64(__mmask8 __U, __m256i __X, __m256i __Y)		_mm256_maskz_sllv_epi64(__mmask8 __U, __m256i __X, __m256i __Y)
{		{
return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,
(__v4di)_mm256_sllv_epi64(__X, __Y),		(__v4di)_mm256_sllv_epi64(__X, __Y),
(__v4di)_mm256_setzero_si256());		(__v4di)_mm256_setzero_si256());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_sllv_epi32(__m128i __W, __mmask8 __U, __m128i __X, __m128i __Y)		_mm_mask_sllv_epi32(__m128i __W, __mmask8 __U, __m128i __X, __m128i __Y)
{		{
return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,
(__v4si)_mm_sllv_epi32(__X, __Y),		(__v4si)_mm_sllv_epi32(__X, __Y),
(__v4si)__W);		(__v4si)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_sllv_epi32(__mmask8 __U, __m128i __X, __m128i __Y)		_mm_maskz_sllv_epi32(__mmask8 __U, __m128i __X, __m128i __Y)
{		{
return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,
(__v4si)_mm_sllv_epi32(__X, __Y),		(__v4si)_mm_sllv_epi32(__X, __Y),
(__v4si)_mm_setzero_si128());		(__v4si)_mm_setzero_si128());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_sllv_epi32(__m256i __W, __mmask8 __U, __m256i __X, __m256i __Y)		_mm256_mask_sllv_epi32(__m256i __W, __mmask8 __U, __m256i __X, __m256i __Y)
{		{
return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,
(__v8si)_mm256_sllv_epi32(__X, __Y),		(__v8si)_mm256_sllv_epi32(__X, __Y),
(__v8si)__W);		(__v8si)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_sllv_epi32(__mmask8 __U, __m256i __X, __m256i __Y)		_mm256_maskz_sllv_epi32(__mmask8 __U, __m256i __X, __m256i __Y)
{		{
return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,
(__v8si)_mm256_sllv_epi32(__X, __Y),		(__v8si)_mm256_sllv_epi32(__X, __Y),
(__v8si)_mm256_setzero_si256());		(__v8si)_mm256_setzero_si256());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_srlv_epi64(__m128i __W, __mmask8 __U, __m128i __X, __m128i __Y)		_mm_mask_srlv_epi64(__m128i __W, __mmask8 __U, __m128i __X, __m128i __Y)
{		{
return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,
(__v2di)_mm_srlv_epi64(__X, __Y),		(__v2di)_mm_srlv_epi64(__X, __Y),
(__v2di)__W);		(__v2di)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_srlv_epi64(__mmask8 __U, __m128i __X, __m128i __Y)		_mm_maskz_srlv_epi64(__mmask8 __U, __m128i __X, __m128i __Y)
{		{
return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,
(__v2di)_mm_srlv_epi64(__X, __Y),		(__v2di)_mm_srlv_epi64(__X, __Y),
(__v2di)_mm_setzero_si128());		(__v2di)_mm_setzero_si128());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_srlv_epi64(__m256i __W, __mmask8 __U, __m256i __X, __m256i __Y)		_mm256_mask_srlv_epi64(__m256i __W, __mmask8 __U, __m256i __X, __m256i __Y)
{		{
return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,
(__v4di)_mm256_srlv_epi64(__X, __Y),		(__v4di)_mm256_srlv_epi64(__X, __Y),
(__v4di)__W);		(__v4di)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_srlv_epi64(__mmask8 __U, __m256i __X, __m256i __Y)		_mm256_maskz_srlv_epi64(__mmask8 __U, __m256i __X, __m256i __Y)
{		{
return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,
(__v4di)_mm256_srlv_epi64(__X, __Y),		(__v4di)_mm256_srlv_epi64(__X, __Y),
(__v4di)_mm256_setzero_si256());		(__v4di)_mm256_setzero_si256());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_srlv_epi32(__m128i __W, __mmask8 __U, __m128i __X, __m128i __Y)		_mm_mask_srlv_epi32(__m128i __W, __mmask8 __U, __m128i __X, __m128i __Y)
{		{
return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,
(__v4si)_mm_srlv_epi32(__X, __Y),		(__v4si)_mm_srlv_epi32(__X, __Y),
(__v4si)__W);		(__v4si)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_srlv_epi32(__mmask8 __U, __m128i __X, __m128i __Y)		_mm_maskz_srlv_epi32(__mmask8 __U, __m128i __X, __m128i __Y)
{		{
return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,
(__v4si)_mm_srlv_epi32(__X, __Y),		(__v4si)_mm_srlv_epi32(__X, __Y),
(__v4si)_mm_setzero_si128());		(__v4si)_mm_setzero_si128());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_srlv_epi32(__m256i __W, __mmask8 __U, __m256i __X, __m256i __Y)		_mm256_mask_srlv_epi32(__m256i __W, __mmask8 __U, __m256i __X, __m256i __Y)
{		{
return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,
(__v8si)_mm256_srlv_epi32(__X, __Y),		(__v8si)_mm256_srlv_epi32(__X, __Y),
(__v8si)__W);		(__v8si)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_srlv_epi32(__mmask8 __U, __m256i __X, __m256i __Y)		_mm256_maskz_srlv_epi32(__mmask8 __U, __m256i __X, __m256i __Y)
{		{
return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,
(__v8si)_mm256_srlv_epi32(__X, __Y),		(__v8si)_mm256_srlv_epi32(__X, __Y),
(__v8si)_mm256_setzero_si256());		(__v8si)_mm256_setzero_si256());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_srl_epi32(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)		_mm_mask_srl_epi32(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,
(__v4si)_mm_srl_epi32(__A, __B),		(__v4si)_mm_srl_epi32(__A, __B),
(__v4si)__W);		(__v4si)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_srl_epi32(__mmask8 __U, __m128i __A, __m128i __B)		_mm_maskz_srl_epi32(__mmask8 __U, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,
(__v4si)_mm_srl_epi32(__A, __B),		(__v4si)_mm_srl_epi32(__A, __B),
(__v4si)_mm_setzero_si128());		(__v4si)_mm_setzero_si128());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_srl_epi32(__m256i __W, __mmask8 __U, __m256i __A, __m128i __B)		_mm256_mask_srl_epi32(__m256i __W, __mmask8 __U, __m256i __A, __m128i __B)
{		{
return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,
(__v8si)_mm256_srl_epi32(__A, __B),		(__v8si)_mm256_srl_epi32(__A, __B),
(__v8si)__W);		(__v8si)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_srl_epi32(__mmask8 __U, __m256i __A, __m128i __B)		_mm256_maskz_srl_epi32(__mmask8 __U, __m256i __A, __m128i __B)
{		{
return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,
(__v8si)_mm256_srl_epi32(__A, __B),		(__v8si)_mm256_srl_epi32(__A, __B),
(__v8si)_mm256_setzero_si256());		(__v8si)_mm256_setzero_si256());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_srli_epi32(__m128i __W, __mmask8 __U, __m128i __A, int __B)		_mm_mask_srli_epi32(__m128i __W, __mmask8 __U, __m128i __A, int __B)
{		{
return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,
(__v4si)_mm_srli_epi32(__A, __B),		(__v4si)_mm_srli_epi32(__A, __B),
(__v4si)__W);		(__v4si)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_srli_epi32(__mmask8 __U, __m128i __A, int __B)		_mm_maskz_srli_epi32(__mmask8 __U, __m128i __A, int __B)
{		{
return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,
(__v4si)_mm_srli_epi32(__A, __B),		(__v4si)_mm_srli_epi32(__A, __B),
(__v4si)_mm_setzero_si128());		(__v4si)_mm_setzero_si128());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_srli_epi32(__m256i __W, __mmask8 __U, __m256i __A, int __B)		_mm256_mask_srli_epi32(__m256i __W, __mmask8 __U, __m256i __A, int __B)
{		{
return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,
(__v8si)_mm256_srli_epi32(__A, __B),		(__v8si)_mm256_srli_epi32(__A, __B),
(__v8si)__W);		(__v8si)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_srli_epi32(__mmask8 __U, __m256i __A, int __B)		_mm256_maskz_srli_epi32(__mmask8 __U, __m256i __A, int __B)
{		{
return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,
(__v8si)_mm256_srli_epi32(__A, __B),		(__v8si)_mm256_srli_epi32(__A, __B),
(__v8si)_mm256_setzero_si256());		(__v8si)_mm256_setzero_si256());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_srl_epi64(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)		_mm_mask_srl_epi64(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,
(__v2di)_mm_srl_epi64(__A, __B),		(__v2di)_mm_srl_epi64(__A, __B),
(__v2di)__W);		(__v2di)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_srl_epi64(__mmask8 __U, __m128i __A, __m128i __B)		_mm_maskz_srl_epi64(__mmask8 __U, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,
(__v2di)_mm_srl_epi64(__A, __B),		(__v2di)_mm_srl_epi64(__A, __B),
(__v2di)_mm_setzero_si128());		(__v2di)_mm_setzero_si128());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_srl_epi64(__m256i __W, __mmask8 __U, __m256i __A, __m128i __B)		_mm256_mask_srl_epi64(__m256i __W, __mmask8 __U, __m256i __A, __m128i __B)
{		{
return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,
(__v4di)_mm256_srl_epi64(__A, __B),		(__v4di)_mm256_srl_epi64(__A, __B),
(__v4di)__W);		(__v4di)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_srl_epi64(__mmask8 __U, __m256i __A, __m128i __B)		_mm256_maskz_srl_epi64(__mmask8 __U, __m256i __A, __m128i __B)
{		{
return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,
(__v4di)_mm256_srl_epi64(__A, __B),		(__v4di)_mm256_srl_epi64(__A, __B),
(__v4di)_mm256_setzero_si256());		(__v4di)_mm256_setzero_si256());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_srli_epi64(__m128i __W, __mmask8 __U, __m128i __A, int __B)		_mm_mask_srli_epi64(__m128i __W, __mmask8 __U, __m128i __A, int __B)
{		{
return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,
(__v2di)_mm_srli_epi64(__A, __B),		(__v2di)_mm_srli_epi64(__A, __B),
(__v2di)__W);		(__v2di)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_srli_epi64(__mmask8 __U, __m128i __A, int __B)		_mm_maskz_srli_epi64(__mmask8 __U, __m128i __A, int __B)
{		{
return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,
(__v2di)_mm_srli_epi64(__A, __B),		(__v2di)_mm_srli_epi64(__A, __B),
(__v2di)_mm_setzero_si128());		(__v2di)_mm_setzero_si128());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_srli_epi64(__m256i __W, __mmask8 __U, __m256i __A, int __B)		_mm256_mask_srli_epi64(__m256i __W, __mmask8 __U, __m256i __A, int __B)
{		{
return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,
(__v4di)_mm256_srli_epi64(__A, __B),		(__v4di)_mm256_srli_epi64(__A, __B),
(__v4di)__W);		(__v4di)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_srli_epi64(__mmask8 __U, __m256i __A, int __B)		_mm256_maskz_srli_epi64(__mmask8 __U, __m256i __A, int __B)
{		{
return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,
(__v4di)_mm256_srli_epi64(__A, __B),		(__v4di)_mm256_srli_epi64(__A, __B),
(__v4di)_mm256_setzero_si256());		(__v4di)_mm256_setzero_si256());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_srav_epi32(__m128i __W, __mmask8 __U, __m128i __X, __m128i __Y)		_mm_mask_srav_epi32(__m128i __W, __mmask8 __U, __m128i __X, __m128i __Y)
{		{
return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,
(__v4si)_mm_srav_epi32(__X, __Y),		(__v4si)_mm_srav_epi32(__X, __Y),
(__v4si)__W);		(__v4si)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_srav_epi32(__mmask8 __U, __m128i __X, __m128i __Y)		_mm_maskz_srav_epi32(__mmask8 __U, __m128i __X, __m128i __Y)
{		{
return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,
(__v4si)_mm_srav_epi32(__X, __Y),		(__v4si)_mm_srav_epi32(__X, __Y),
(__v4si)_mm_setzero_si128());		(__v4si)_mm_setzero_si128());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_srav_epi32(__m256i __W, __mmask8 __U, __m256i __X, __m256i __Y)		_mm256_mask_srav_epi32(__m256i __W, __mmask8 __U, __m256i __X, __m256i __Y)
{		{
return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,
(__v8si)_mm256_srav_epi32(__X, __Y),		(__v8si)_mm256_srav_epi32(__X, __Y),
(__v8si)__W);		(__v8si)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_srav_epi32(__mmask8 __U, __m256i __X, __m256i __Y)		_mm256_maskz_srav_epi32(__mmask8 __U, __m256i __X, __m256i __Y)
{		{
return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,
(__v8si)_mm256_srav_epi32(__X, __Y),		(__v8si)_mm256_srav_epi32(__X, __Y),
(__v8si)_mm256_setzero_si256());		(__v8si)_mm256_setzero_si256());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_srav_epi64(__m128i __X, __m128i __Y)		_mm_srav_epi64(__m128i __X, __m128i __Y)
{		{
return (__m128i)__builtin_ia32_psravq128((__v2di)__X, (__v2di)__Y);		return (__m128i)__builtin_ia32_psravq128((__v2di)__X, (__v2di)__Y);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_srav_epi64(__m128i __W, __mmask8 __U, __m128i __X, __m128i __Y)		_mm_mask_srav_epi64(__m128i __W, __mmask8 __U, __m128i __X, __m128i __Y)
{		{
return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,
(__v2di)_mm_srav_epi64(__X, __Y),		(__v2di)_mm_srav_epi64(__X, __Y),
(__v2di)__W);		(__v2di)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_srav_epi64(__mmask8 __U, __m128i __X, __m128i __Y)		_mm_maskz_srav_epi64(__mmask8 __U, __m128i __X, __m128i __Y)
{		{
return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,
(__v2di)_mm_srav_epi64(__X, __Y),		(__v2di)_mm_srav_epi64(__X, __Y),
(__v2di)_mm_setzero_si128());		(__v2di)_mm_setzero_si128());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_srav_epi64(__m256i __X, __m256i __Y)		_mm256_srav_epi64(__m256i __X, __m256i __Y)
{		{
return (__m256i)__builtin_ia32_psravq256((__v4di)__X, (__v4di) __Y);		return (__m256i)__builtin_ia32_psravq256((__v4di)__X, (__v4di) __Y);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_srav_epi64(__m256i __W, __mmask8 __U, __m256i __X, __m256i __Y)		_mm256_mask_srav_epi64(__m256i __W, __mmask8 __U, __m256i __X, __m256i __Y)
{		{
return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,
(__v4di)_mm256_srav_epi64(__X, __Y),		(__v4di)_mm256_srav_epi64(__X, __Y),
(__v4di)__W);		(__v4di)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_srav_epi64 (__mmask8 __U, __m256i __X, __m256i __Y)		_mm256_maskz_srav_epi64 (__mmask8 __U, __m256i __X, __m256i __Y)
{		{
return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,
(__v4di)_mm256_srav_epi64(__X, __Y),		(__v4di)_mm256_srav_epi64(__X, __Y),
(__v4di)_mm256_setzero_si256());		(__v4di)_mm256_setzero_si256());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_mov_epi32 (__m128i __W, __mmask8 __U, __m128i __A)		_mm_mask_mov_epi32 (__m128i __W, __mmask8 __U, __m128i __A)
{		{
return (__m128i) __builtin_ia32_selectd_128 ((__mmask8) __U,		return (__m128i) __builtin_ia32_selectd_128 ((__mmask8) __U,
(__v4si) __A,		(__v4si) __A,
(__v4si) __W);		(__v4si) __W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_mov_epi32 (__mmask8 __U, __m128i __A)		_mm_maskz_mov_epi32 (__mmask8 __U, __m128i __A)
{		{
return (__m128i) __builtin_ia32_selectd_128 ((__mmask8) __U,		return (__m128i) __builtin_ia32_selectd_128 ((__mmask8) __U,
(__v4si) __A,		(__v4si) __A,
(__v4si) _mm_setzero_si128 ());		(__v4si) _mm_setzero_si128 ());
}		}


static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_mov_epi32 (__m256i __W, __mmask8 __U, __m256i __A)		_mm256_mask_mov_epi32 (__m256i __W, __mmask8 __U, __m256i __A)
{		{
return (__m256i) __builtin_ia32_selectd_256 ((__mmask8) __U,		return (__m256i) __builtin_ia32_selectd_256 ((__mmask8) __U,
(__v8si) __A,		(__v8si) __A,
(__v8si) __W);		(__v8si) __W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_mov_epi32 (__mmask8 __U, __m256i __A)		_mm256_maskz_mov_epi32 (__mmask8 __U, __m256i __A)
{		{
return (__m256i) __builtin_ia32_selectd_256 ((__mmask8) __U,		return (__m256i) __builtin_ia32_selectd_256 ((__mmask8) __U,
(__v8si) __A,		(__v8si) __A,
(__v8si) _mm256_setzero_si256 ());		(__v8si) _mm256_setzero_si256 ());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_load_epi32 (__m128i __W, __mmask8 __U, void const *__P)		_mm_mask_load_epi32 (__m128i __W, __mmask8 __U, void const *__P)
{		{
return (__m128i) __builtin_ia32_movdqa32load128_mask ((__v4si *) __P,		return (__m128i) __builtin_ia32_movdqa32load128_mask ((__v4si *) __P,
(__v4si) __W,		(__v4si) __W,
(__mmask8)		(__mmask8)
__U);		__U);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_load_epi32 (__mmask8 __U, void const *__P)		_mm_maskz_load_epi32 (__mmask8 __U, void const *__P)
{		{
return (__m128i) __builtin_ia32_movdqa32load128_mask ((__v4si *) __P,		return (__m128i) __builtin_ia32_movdqa32load128_mask ((__v4si *) __P,
(__v4si)		(__v4si)
_mm_setzero_si128 (),		_mm_setzero_si128 (),
(__mmask8)		(__mmask8)
__U);		__U);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_load_epi32 (__m256i __W, __mmask8 __U, void const *__P)		_mm256_mask_load_epi32 (__m256i __W, __mmask8 __U, void const *__P)
{		{
return (__m256i) __builtin_ia32_movdqa32load256_mask ((__v8si *) __P,		return (__m256i) __builtin_ia32_movdqa32load256_mask ((__v8si *) __P,
(__v8si) __W,		(__v8si) __W,
(__mmask8)		(__mmask8)
__U);		__U);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_load_epi32 (__mmask8 __U, void const *__P)		_mm256_maskz_load_epi32 (__mmask8 __U, void const *__P)
{		{
return (__m256i) __builtin_ia32_movdqa32load256_mask ((__v8si *) __P,		return (__m256i) __builtin_ia32_movdqa32load256_mask ((__v8si *) __P,
(__v8si)		(__v8si)
_mm256_setzero_si256 (),		_mm256_setzero_si256 (),
(__mmask8)		(__mmask8)
__U);		__U);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS128
_mm_mask_store_epi32 (void *__P, __mmask8 __U, __m128i __A)		_mm_mask_store_epi32 (void *__P, __mmask8 __U, __m128i __A)
{		{
__builtin_ia32_movdqa32store128_mask ((__v4si *) __P,		__builtin_ia32_movdqa32store128_mask ((__v4si *) __P,
(__v4si) __A,		(__v4si) __A,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS256
_mm256_mask_store_epi32 (void *__P, __mmask8 __U, __m256i __A)		_mm256_mask_store_epi32 (void *__P, __mmask8 __U, __m256i __A)
{		{
__builtin_ia32_movdqa32store256_mask ((__v8si *) __P,		__builtin_ia32_movdqa32store256_mask ((__v8si *) __P,
(__v8si) __A,		(__v8si) __A,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_mov_epi64 (__m128i __W, __mmask8 __U, __m128i __A)		_mm_mask_mov_epi64 (__m128i __W, __mmask8 __U, __m128i __A)
{		{
return (__m128i) __builtin_ia32_selectq_128 ((__mmask8) __U,		return (__m128i) __builtin_ia32_selectq_128 ((__mmask8) __U,
(__v2di) __A,		(__v2di) __A,
(__v2di) __W);		(__v2di) __W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_mov_epi64 (__mmask8 __U, __m128i __A)		_mm_maskz_mov_epi64 (__mmask8 __U, __m128i __A)
{		{
return (__m128i) __builtin_ia32_selectq_128 ((__mmask8) __U,		return (__m128i) __builtin_ia32_selectq_128 ((__mmask8) __U,
(__v2di) __A,		(__v2di) __A,
(__v2di) _mm_setzero_si128 ());		(__v2di) _mm_setzero_si128 ());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_mov_epi64 (__m256i __W, __mmask8 __U, __m256i __A)		_mm256_mask_mov_epi64 (__m256i __W, __mmask8 __U, __m256i __A)
{		{
return (__m256i) __builtin_ia32_selectq_256 ((__mmask8) __U,		return (__m256i) __builtin_ia32_selectq_256 ((__mmask8) __U,
(__v4di) __A,		(__v4di) __A,
(__v4di) __W);		(__v4di) __W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_mov_epi64 (__mmask8 __U, __m256i __A)		_mm256_maskz_mov_epi64 (__mmask8 __U, __m256i __A)
{		{
return (__m256i) __builtin_ia32_selectq_256 ((__mmask8) __U,		return (__m256i) __builtin_ia32_selectq_256 ((__mmask8) __U,
(__v4di) __A,		(__v4di) __A,
(__v4di) _mm256_setzero_si256 ());		(__v4di) _mm256_setzero_si256 ());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_load_epi64 (__m128i __W, __mmask8 __U, void const *__P)		_mm_mask_load_epi64 (__m128i __W, __mmask8 __U, void const *__P)
{		{
return (__m128i) __builtin_ia32_movdqa64load128_mask ((__v2di *) __P,		return (__m128i) __builtin_ia32_movdqa64load128_mask ((__v2di *) __P,
(__v2di) __W,		(__v2di) __W,
(__mmask8)		(__mmask8)
__U);		__U);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_load_epi64 (__mmask8 __U, void const *__P)		_mm_maskz_load_epi64 (__mmask8 __U, void const *__P)
{		{
return (__m128i) __builtin_ia32_movdqa64load128_mask ((__v2di *) __P,		return (__m128i) __builtin_ia32_movdqa64load128_mask ((__v2di *) __P,
(__v2di)		(__v2di)
_mm_setzero_si128 (),		_mm_setzero_si128 (),
(__mmask8)		(__mmask8)
__U);		__U);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_load_epi64 (__m256i __W, __mmask8 __U, void const *__P)		_mm256_mask_load_epi64 (__m256i __W, __mmask8 __U, void const *__P)
{		{
return (__m256i) __builtin_ia32_movdqa64load256_mask ((__v4di *) __P,		return (__m256i) __builtin_ia32_movdqa64load256_mask ((__v4di *) __P,
(__v4di) __W,		(__v4di) __W,
(__mmask8)		(__mmask8)
__U);		__U);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_load_epi64 (__mmask8 __U, void const *__P)		_mm256_maskz_load_epi64 (__mmask8 __U, void const *__P)
{		{
return (__m256i) __builtin_ia32_movdqa64load256_mask ((__v4di *) __P,		return (__m256i) __builtin_ia32_movdqa64load256_mask ((__v4di *) __P,
(__v4di)		(__v4di)
_mm256_setzero_si256 (),		_mm256_setzero_si256 (),
(__mmask8)		(__mmask8)
__U);		__U);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS128
_mm_mask_store_epi64 (void *__P, __mmask8 __U, __m128i __A)		_mm_mask_store_epi64 (void *__P, __mmask8 __U, __m128i __A)
{		{
__builtin_ia32_movdqa64store128_mask ((__v2di *) __P,		__builtin_ia32_movdqa64store128_mask ((__v2di *) __P,
(__v2di) __A,		(__v2di) __A,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS256
_mm256_mask_store_epi64 (void *__P, __mmask8 __U, __m256i __A)		_mm256_mask_store_epi64 (void *__P, __mmask8 __U, __m256i __A)
{		{
__builtin_ia32_movdqa64store256_mask ((__v4di *) __P,		__builtin_ia32_movdqa64store256_mask ((__v4di *) __P,
(__v4di) __A,		(__v4di) __A,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_mask_movedup_pd (__m128d __W, __mmask8 __U, __m128d __A)		_mm_mask_movedup_pd (__m128d __W, __mmask8 __U, __m128d __A)
{		{
return (__m128d)__builtin_ia32_selectpd_128((__mmask8)__U,		return (__m128d)__builtin_ia32_selectpd_128((__mmask8)__U,
(__v2df)_mm_movedup_pd(__A),		(__v2df)_mm_movedup_pd(__A),
(__v2df)__W);		(__v2df)__W);
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_maskz_movedup_pd (__mmask8 __U, __m128d __A)		_mm_maskz_movedup_pd (__mmask8 __U, __m128d __A)
{		{
return (__m128d)__builtin_ia32_selectpd_128((__mmask8)__U,		return (__m128d)__builtin_ia32_selectpd_128((__mmask8)__U,
(__v2df)_mm_movedup_pd(__A),		(__v2df)_mm_movedup_pd(__A),
(__v2df)_mm_setzero_pd());		(__v2df)_mm_setzero_pd());
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_mask_movedup_pd (__m256d __W, __mmask8 __U, __m256d __A)		_mm256_mask_movedup_pd (__m256d __W, __mmask8 __U, __m256d __A)
{		{
return (__m256d)__builtin_ia32_selectpd_256((__mmask8)__U,		return (__m256d)__builtin_ia32_selectpd_256((__mmask8)__U,
(__v4df)_mm256_movedup_pd(__A),		(__v4df)_mm256_movedup_pd(__A),
(__v4df)__W);		(__v4df)__W);
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_maskz_movedup_pd (__mmask8 __U, __m256d __A)		_mm256_maskz_movedup_pd (__mmask8 __U, __m256d __A)
{		{
return (__m256d)__builtin_ia32_selectpd_256((__mmask8)__U,		return (__m256d)__builtin_ia32_selectpd_256((__mmask8)__U,
(__v4df)_mm256_movedup_pd(__A),		(__v4df)_mm256_movedup_pd(__A),
(__v4df)_mm256_setzero_pd());		(__v4df)_mm256_setzero_pd());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_set1_epi32(__m128i __O, __mmask8 __M, int __A)		_mm_mask_set1_epi32(__m128i __O, __mmask8 __M, int __A)
{		{
return (__m128i)__builtin_ia32_selectd_128(__M,		return (__m128i)__builtin_ia32_selectd_128(__M,
(__v4si) _mm_set1_epi32(__A),		(__v4si) _mm_set1_epi32(__A),
(__v4si)__O);		(__v4si)__O);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_set1_epi32( __mmask8 __M, int __A)		_mm_maskz_set1_epi32( __mmask8 __M, int __A)
{		{
return (__m128i)__builtin_ia32_selectd_128(__M,		return (__m128i)__builtin_ia32_selectd_128(__M,
(__v4si) _mm_set1_epi32(__A),		(__v4si) _mm_set1_epi32(__A),
(__v4si)_mm_setzero_si128());		(__v4si)_mm_setzero_si128());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_set1_epi32(__m256i __O, __mmask8 __M, int __A)		_mm256_mask_set1_epi32(__m256i __O, __mmask8 __M, int __A)
{		{
return (__m256i)__builtin_ia32_selectd_256(__M,		return (__m256i)__builtin_ia32_selectd_256(__M,
(__v8si) _mm256_set1_epi32(__A),		(__v8si) _mm256_set1_epi32(__A),
(__v8si)__O);		(__v8si)__O);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_set1_epi32( __mmask8 __M, int __A)		_mm256_maskz_set1_epi32( __mmask8 __M, int __A)
{		{
return (__m256i)__builtin_ia32_selectd_256(__M,		return (__m256i)__builtin_ia32_selectd_256(__M,
(__v8si) _mm256_set1_epi32(__A),		(__v8si) _mm256_set1_epi32(__A),
(__v8si)_mm256_setzero_si256());		(__v8si)_mm256_setzero_si256());
}		}


static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_set1_epi64 (__m128i __O, __mmask8 __M, long long __A)		_mm_mask_set1_epi64 (__m128i __O, __mmask8 __M, long long __A)
{		{
return (__m128i) __builtin_ia32_selectq_128(__M,		return (__m128i) __builtin_ia32_selectq_128(__M,
(__v2di) _mm_set1_epi64x(__A),		(__v2di) _mm_set1_epi64x(__A),
(__v2di) __O);		(__v2di) __O);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_set1_epi64 (__mmask8 __M, long long __A)		_mm_maskz_set1_epi64 (__mmask8 __M, long long __A)
{		{
return (__m128i) __builtin_ia32_selectq_128(__M,		return (__m128i) __builtin_ia32_selectq_128(__M,
(__v2di) _mm_set1_epi64x(__A),		(__v2di) _mm_set1_epi64x(__A),
(__v2di) _mm_setzero_si128());		(__v2di) _mm_setzero_si128());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_set1_epi64 (__m256i __O, __mmask8 __M, long long __A)		_mm256_mask_set1_epi64 (__m256i __O, __mmask8 __M, long long __A)
{		{
return (__m256i) __builtin_ia32_selectq_256(__M,		return (__m256i) __builtin_ia32_selectq_256(__M,
(__v4di) _mm256_set1_epi64x(__A),		(__v4di) _mm256_set1_epi64x(__A),
(__v4di) __O) ;		(__v4di) __O) ;
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_set1_epi64 (__mmask8 __M, long long __A)		_mm256_maskz_set1_epi64 (__mmask8 __M, long long __A)
{		{
return (__m256i) __builtin_ia32_selectq_256(__M,		return (__m256i) __builtin_ia32_selectq_256(__M,
(__v4di) _mm256_set1_epi64x(__A),		(__v4di) _mm256_set1_epi64x(__A),
(__v4di) _mm256_setzero_si256());		(__v4di) _mm256_setzero_si256());
}		}

#define _mm_fixupimm_pd(A, B, C, imm) \		#define _mm_fixupimm_pd(A, B, C, imm) \
▲ Show 20 Lines • Show All 63 Lines • ▼ Show 20 Lines	(__m256)__builtin_ia32_fixupimmps256_mask((__v8sf)(__m256)(A), \
(__mmask8)(U))		(__mmask8)(U))

#define _mm256_maskz_fixupimm_ps(U, A, B, C, imm) \		#define _mm256_maskz_fixupimm_ps(U, A, B, C, imm) \
(__m256)__builtin_ia32_fixupimmps256_maskz((__v8sf)(__m256)(A), \		(__m256)__builtin_ia32_fixupimmps256_maskz((__v8sf)(__m256)(A), \
(__v8sf)(__m256)(B), \		(__v8sf)(__m256)(B), \
(__v8si)(__m256i)(C), (int)(imm), \		(__v8si)(__m256i)(C), (int)(imm), \
(__mmask8)(U))		(__mmask8)(U))

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_mask_load_pd (__m128d __W, __mmask8 __U, void const *__P)		_mm_mask_load_pd (__m128d __W, __mmask8 __U, void const *__P)
{		{
return (__m128d) __builtin_ia32_loadapd128_mask ((__v2df *) __P,		return (__m128d) __builtin_ia32_loadapd128_mask ((__v2df *) __P,
(__v2df) __W,		(__v2df) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_maskz_load_pd (__mmask8 __U, void const *__P)		_mm_maskz_load_pd (__mmask8 __U, void const *__P)
{		{
return (__m128d) __builtin_ia32_loadapd128_mask ((__v2df *) __P,		return (__m128d) __builtin_ia32_loadapd128_mask ((__v2df *) __P,
(__v2df)		(__v2df)
_mm_setzero_pd (),		_mm_setzero_pd (),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_mask_load_pd (__m256d __W, __mmask8 __U, void const *__P)		_mm256_mask_load_pd (__m256d __W, __mmask8 __U, void const *__P)
{		{
return (__m256d) __builtin_ia32_loadapd256_mask ((__v4df *) __P,		return (__m256d) __builtin_ia32_loadapd256_mask ((__v4df *) __P,
(__v4df) __W,		(__v4df) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_maskz_load_pd (__mmask8 __U, void const *__P)		_mm256_maskz_load_pd (__mmask8 __U, void const *__P)
{		{
return (__m256d) __builtin_ia32_loadapd256_mask ((__v4df *) __P,		return (__m256d) __builtin_ia32_loadapd256_mask ((__v4df *) __P,
(__v4df)		(__v4df)
_mm256_setzero_pd (),		_mm256_setzero_pd (),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_mask_load_ps (__m128 __W, __mmask8 __U, void const *__P)		_mm_mask_load_ps (__m128 __W, __mmask8 __U, void const *__P)
{		{
return (__m128) __builtin_ia32_loadaps128_mask ((__v4sf *) __P,		return (__m128) __builtin_ia32_loadaps128_mask ((__v4sf *) __P,
(__v4sf) __W,		(__v4sf) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_maskz_load_ps (__mmask8 __U, void const *__P)		_mm_maskz_load_ps (__mmask8 __U, void const *__P)
{		{
return (__m128) __builtin_ia32_loadaps128_mask ((__v4sf *) __P,		return (__m128) __builtin_ia32_loadaps128_mask ((__v4sf *) __P,
(__v4sf)		(__v4sf)
_mm_setzero_ps (),		_mm_setzero_ps (),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_mask_load_ps (__m256 __W, __mmask8 __U, void const *__P)		_mm256_mask_load_ps (__m256 __W, __mmask8 __U, void const *__P)
{		{
return (__m256) __builtin_ia32_loadaps256_mask ((__v8sf *) __P,		return (__m256) __builtin_ia32_loadaps256_mask ((__v8sf *) __P,
(__v8sf) __W,		(__v8sf) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_maskz_load_ps (__mmask8 __U, void const *__P)		_mm256_maskz_load_ps (__mmask8 __U, void const *__P)
{		{
return (__m256) __builtin_ia32_loadaps256_mask ((__v8sf *) __P,		return (__m256) __builtin_ia32_loadaps256_mask ((__v8sf *) __P,
(__v8sf)		(__v8sf)
_mm256_setzero_ps (),		_mm256_setzero_ps (),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_loadu_epi64 (__m128i __W, __mmask8 __U, void const *__P)		_mm_mask_loadu_epi64 (__m128i __W, __mmask8 __U, void const *__P)
{		{
return (__m128i) __builtin_ia32_loaddqudi128_mask ((__v2di *) __P,		return (__m128i) __builtin_ia32_loaddqudi128_mask ((__v2di *) __P,
(__v2di) __W,		(__v2di) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_loadu_epi64 (__mmask8 __U, void const *__P)		_mm_maskz_loadu_epi64 (__mmask8 __U, void const *__P)
{		{
return (__m128i) __builtin_ia32_loaddqudi128_mask ((__v2di *) __P,		return (__m128i) __builtin_ia32_loaddqudi128_mask ((__v2di *) __P,
(__v2di)		(__v2di)
_mm_setzero_si128 (),		_mm_setzero_si128 (),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_loadu_epi64 (__m256i __W, __mmask8 __U, void const *__P)		_mm256_mask_loadu_epi64 (__m256i __W, __mmask8 __U, void const *__P)
{		{
return (__m256i) __builtin_ia32_loaddqudi256_mask ((__v4di *) __P,		return (__m256i) __builtin_ia32_loaddqudi256_mask ((__v4di *) __P,
(__v4di) __W,		(__v4di) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_loadu_epi64 (__mmask8 __U, void const *__P)		_mm256_maskz_loadu_epi64 (__mmask8 __U, void const *__P)
{		{
return (__m256i) __builtin_ia32_loaddqudi256_mask ((__v4di *) __P,		return (__m256i) __builtin_ia32_loaddqudi256_mask ((__v4di *) __P,
(__v4di)		(__v4di)
_mm256_setzero_si256 (),		_mm256_setzero_si256 (),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_loadu_epi32 (__m128i __W, __mmask8 __U, void const *__P)		_mm_mask_loadu_epi32 (__m128i __W, __mmask8 __U, void const *__P)
{		{
return (__m128i) __builtin_ia32_loaddqusi128_mask ((__v4si *) __P,		return (__m128i) __builtin_ia32_loaddqusi128_mask ((__v4si *) __P,
(__v4si) __W,		(__v4si) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_loadu_epi32 (__mmask8 __U, void const *__P)		_mm_maskz_loadu_epi32 (__mmask8 __U, void const *__P)
{		{
return (__m128i) __builtin_ia32_loaddqusi128_mask ((__v4si *) __P,		return (__m128i) __builtin_ia32_loaddqusi128_mask ((__v4si *) __P,
(__v4si)		(__v4si)
_mm_setzero_si128 (),		_mm_setzero_si128 (),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_loadu_epi32 (__m256i __W, __mmask8 __U, void const *__P)		_mm256_mask_loadu_epi32 (__m256i __W, __mmask8 __U, void const *__P)
{		{
return (__m256i) __builtin_ia32_loaddqusi256_mask ((__v8si *) __P,		return (__m256i) __builtin_ia32_loaddqusi256_mask ((__v8si *) __P,
(__v8si) __W,		(__v8si) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_loadu_epi32 (__mmask8 __U, void const *__P)		_mm256_maskz_loadu_epi32 (__mmask8 __U, void const *__P)
{		{
return (__m256i) __builtin_ia32_loaddqusi256_mask ((__v8si *) __P,		return (__m256i) __builtin_ia32_loaddqusi256_mask ((__v8si *) __P,
(__v8si)		(__v8si)
_mm256_setzero_si256 (),		_mm256_setzero_si256 (),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_mask_loadu_pd (__m128d __W, __mmask8 __U, void const *__P)		_mm_mask_loadu_pd (__m128d __W, __mmask8 __U, void const *__P)
{		{
return (__m128d) __builtin_ia32_loadupd128_mask ((__v2df *) __P,		return (__m128d) __builtin_ia32_loadupd128_mask ((__v2df *) __P,
(__v2df) __W,		(__v2df) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_maskz_loadu_pd (__mmask8 __U, void const *__P)		_mm_maskz_loadu_pd (__mmask8 __U, void const *__P)
{		{
return (__m128d) __builtin_ia32_loadupd128_mask ((__v2df *) __P,		return (__m128d) __builtin_ia32_loadupd128_mask ((__v2df *) __P,
(__v2df)		(__v2df)
_mm_setzero_pd (),		_mm_setzero_pd (),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_mask_loadu_pd (__m256d __W, __mmask8 __U, void const *__P)		_mm256_mask_loadu_pd (__m256d __W, __mmask8 __U, void const *__P)
{		{
return (__m256d) __builtin_ia32_loadupd256_mask ((__v4df *) __P,		return (__m256d) __builtin_ia32_loadupd256_mask ((__v4df *) __P,
(__v4df) __W,		(__v4df) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_maskz_loadu_pd (__mmask8 __U, void const *__P)		_mm256_maskz_loadu_pd (__mmask8 __U, void const *__P)
{		{
return (__m256d) __builtin_ia32_loadupd256_mask ((__v4df *) __P,		return (__m256d) __builtin_ia32_loadupd256_mask ((__v4df *) __P,
(__v4df)		(__v4df)
_mm256_setzero_pd (),		_mm256_setzero_pd (),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_mask_loadu_ps (__m128 __W, __mmask8 __U, void const *__P)		_mm_mask_loadu_ps (__m128 __W, __mmask8 __U, void const *__P)
{		{
return (__m128) __builtin_ia32_loadups128_mask ((__v4sf *) __P,		return (__m128) __builtin_ia32_loadups128_mask ((__v4sf *) __P,
(__v4sf) __W,		(__v4sf) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_maskz_loadu_ps (__mmask8 __U, void const *__P)		_mm_maskz_loadu_ps (__mmask8 __U, void const *__P)
{		{
return (__m128) __builtin_ia32_loadups128_mask ((__v4sf *) __P,		return (__m128) __builtin_ia32_loadups128_mask ((__v4sf *) __P,
(__v4sf)		(__v4sf)
_mm_setzero_ps (),		_mm_setzero_ps (),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_mask_loadu_ps (__m256 __W, __mmask8 __U, void const *__P)		_mm256_mask_loadu_ps (__m256 __W, __mmask8 __U, void const *__P)
{		{
return (__m256) __builtin_ia32_loadups256_mask ((__v8sf *) __P,		return (__m256) __builtin_ia32_loadups256_mask ((__v8sf *) __P,
(__v8sf) __W,		(__v8sf) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_maskz_loadu_ps (__mmask8 __U, void const *__P)		_mm256_maskz_loadu_ps (__mmask8 __U, void const *__P)
{		{
return (__m256) __builtin_ia32_loadups256_mask ((__v8sf *) __P,		return (__m256) __builtin_ia32_loadups256_mask ((__v8sf *) __P,
(__v8sf)		(__v8sf)
_mm256_setzero_ps (),		_mm256_setzero_ps (),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS128
_mm_mask_store_pd (void *__P, __mmask8 __U, __m128d __A)		_mm_mask_store_pd (void *__P, __mmask8 __U, __m128d __A)
{		{
__builtin_ia32_storeapd128_mask ((__v2df *) __P,		__builtin_ia32_storeapd128_mask ((__v2df *) __P,
(__v2df) __A,		(__v2df) __A,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS256
_mm256_mask_store_pd (void *__P, __mmask8 __U, __m256d __A)		_mm256_mask_store_pd (void *__P, __mmask8 __U, __m256d __A)
{		{
__builtin_ia32_storeapd256_mask ((__v4df *) __P,		__builtin_ia32_storeapd256_mask ((__v4df *) __P,
(__v4df) __A,		(__v4df) __A,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS128
_mm_mask_store_ps (void *__P, __mmask8 __U, __m128 __A)		_mm_mask_store_ps (void *__P, __mmask8 __U, __m128 __A)
{		{
__builtin_ia32_storeaps128_mask ((__v4sf *) __P,		__builtin_ia32_storeaps128_mask ((__v4sf *) __P,
(__v4sf) __A,		(__v4sf) __A,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS256
_mm256_mask_store_ps (void *__P, __mmask8 __U, __m256 __A)		_mm256_mask_store_ps (void *__P, __mmask8 __U, __m256 __A)
{		{
__builtin_ia32_storeaps256_mask ((__v8sf *) __P,		__builtin_ia32_storeaps256_mask ((__v8sf *) __P,
(__v8sf) __A,		(__v8sf) __A,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS128
_mm_mask_storeu_epi64 (void *__P, __mmask8 __U, __m128i __A)		_mm_mask_storeu_epi64 (void *__P, __mmask8 __U, __m128i __A)
{		{
__builtin_ia32_storedqudi128_mask ((__v2di *) __P,		__builtin_ia32_storedqudi128_mask ((__v2di *) __P,
(__v2di) __A,		(__v2di) __A,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS256
_mm256_mask_storeu_epi64 (void *__P, __mmask8 __U, __m256i __A)		_mm256_mask_storeu_epi64 (void *__P, __mmask8 __U, __m256i __A)
{		{
__builtin_ia32_storedqudi256_mask ((__v4di *) __P,		__builtin_ia32_storedqudi256_mask ((__v4di *) __P,
(__v4di) __A,		(__v4di) __A,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS128
_mm_mask_storeu_epi32 (void *__P, __mmask8 __U, __m128i __A)		_mm_mask_storeu_epi32 (void *__P, __mmask8 __U, __m128i __A)
{		{
__builtin_ia32_storedqusi128_mask ((__v4si *) __P,		__builtin_ia32_storedqusi128_mask ((__v4si *) __P,
(__v4si) __A,		(__v4si) __A,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS256
_mm256_mask_storeu_epi32 (void *__P, __mmask8 __U, __m256i __A)		_mm256_mask_storeu_epi32 (void *__P, __mmask8 __U, __m256i __A)
{		{
__builtin_ia32_storedqusi256_mask ((__v8si *) __P,		__builtin_ia32_storedqusi256_mask ((__v8si *) __P,
(__v8si) __A,		(__v8si) __A,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS128
_mm_mask_storeu_pd (void *__P, __mmask8 __U, __m128d __A)		_mm_mask_storeu_pd (void *__P, __mmask8 __U, __m128d __A)
{		{
__builtin_ia32_storeupd128_mask ((__v2df *) __P,		__builtin_ia32_storeupd128_mask ((__v2df *) __P,
(__v2df) __A,		(__v2df) __A,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS256
_mm256_mask_storeu_pd (void *__P, __mmask8 __U, __m256d __A)		_mm256_mask_storeu_pd (void *__P, __mmask8 __U, __m256d __A)
{		{
__builtin_ia32_storeupd256_mask ((__v4df *) __P,		__builtin_ia32_storeupd256_mask ((__v4df *) __P,
(__v4df) __A,		(__v4df) __A,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS128
_mm_mask_storeu_ps (void *__P, __mmask8 __U, __m128 __A)		_mm_mask_storeu_ps (void *__P, __mmask8 __U, __m128 __A)
{		{
__builtin_ia32_storeups128_mask ((__v4sf *) __P,		__builtin_ia32_storeups128_mask ((__v4sf *) __P,
(__v4sf) __A,		(__v4sf) __A,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS256
_mm256_mask_storeu_ps (void *__P, __mmask8 __U, __m256 __A)		_mm256_mask_storeu_ps (void *__P, __mmask8 __U, __m256 __A)
{		{
__builtin_ia32_storeups256_mask ((__v8sf *) __P,		__builtin_ia32_storeups256_mask ((__v8sf *) __P,
(__v8sf) __A,		(__v8sf) __A,
(__mmask8) __U);		(__mmask8) __U);
}		}


static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_mask_unpackhi_pd(__m128d __W, __mmask8 __U, __m128d __A, __m128d __B)		_mm_mask_unpackhi_pd(__m128d __W, __mmask8 __U, __m128d __A, __m128d __B)
{		{
return (__m128d)__builtin_ia32_selectpd_128((__mmask8)__U,		return (__m128d)__builtin_ia32_selectpd_128((__mmask8)__U,
(__v2df)_mm_unpackhi_pd(__A, __B),		(__v2df)_mm_unpackhi_pd(__A, __B),
(__v2df)__W);		(__v2df)__W);
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_maskz_unpackhi_pd(__mmask8 __U, __m128d __A, __m128d __B)		_mm_maskz_unpackhi_pd(__mmask8 __U, __m128d __A, __m128d __B)
{		{
return (__m128d)__builtin_ia32_selectpd_128((__mmask8)__U,		return (__m128d)__builtin_ia32_selectpd_128((__mmask8)__U,
(__v2df)_mm_unpackhi_pd(__A, __B),		(__v2df)_mm_unpackhi_pd(__A, __B),
(__v2df)_mm_setzero_pd());		(__v2df)_mm_setzero_pd());
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_mask_unpackhi_pd(__m256d __W, __mmask8 __U, __m256d __A, __m256d __B)		_mm256_mask_unpackhi_pd(__m256d __W, __mmask8 __U, __m256d __A, __m256d __B)
{		{
return (__m256d)__builtin_ia32_selectpd_256((__mmask8)__U,		return (__m256d)__builtin_ia32_selectpd_256((__mmask8)__U,
(__v4df)_mm256_unpackhi_pd(__A, __B),		(__v4df)_mm256_unpackhi_pd(__A, __B),
(__v4df)__W);		(__v4df)__W);
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_maskz_unpackhi_pd(__mmask8 __U, __m256d __A, __m256d __B)		_mm256_maskz_unpackhi_pd(__mmask8 __U, __m256d __A, __m256d __B)
{		{
return (__m256d)__builtin_ia32_selectpd_256((__mmask8)__U,		return (__m256d)__builtin_ia32_selectpd_256((__mmask8)__U,
(__v4df)_mm256_unpackhi_pd(__A, __B),		(__v4df)_mm256_unpackhi_pd(__A, __B),
(__v4df)_mm256_setzero_pd());		(__v4df)_mm256_setzero_pd());
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_mask_unpackhi_ps(__m128 __W, __mmask8 __U, __m128 __A, __m128 __B)		_mm_mask_unpackhi_ps(__m128 __W, __mmask8 __U, __m128 __A, __m128 __B)
{		{
return (__m128)__builtin_ia32_selectps_128((__mmask8)__U,		return (__m128)__builtin_ia32_selectps_128((__mmask8)__U,
(__v4sf)_mm_unpackhi_ps(__A, __B),		(__v4sf)_mm_unpackhi_ps(__A, __B),
(__v4sf)__W);		(__v4sf)__W);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_maskz_unpackhi_ps(__mmask8 __U, __m128 __A, __m128 __B)		_mm_maskz_unpackhi_ps(__mmask8 __U, __m128 __A, __m128 __B)
{		{
return (__m128)__builtin_ia32_selectps_128((__mmask8)__U,		return (__m128)__builtin_ia32_selectps_128((__mmask8)__U,
(__v4sf)_mm_unpackhi_ps(__A, __B),		(__v4sf)_mm_unpackhi_ps(__A, __B),
(__v4sf)_mm_setzero_ps());		(__v4sf)_mm_setzero_ps());
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_mask_unpackhi_ps(__m256 __W, __mmask8 __U, __m256 __A, __m256 __B)		_mm256_mask_unpackhi_ps(__m256 __W, __mmask8 __U, __m256 __A, __m256 __B)
{		{
return (__m256)__builtin_ia32_selectps_256((__mmask8)__U,		return (__m256)__builtin_ia32_selectps_256((__mmask8)__U,
(__v8sf)_mm256_unpackhi_ps(__A, __B),		(__v8sf)_mm256_unpackhi_ps(__A, __B),
(__v8sf)__W);		(__v8sf)__W);
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_maskz_unpackhi_ps(__mmask8 __U, __m256 __A, __m256 __B)		_mm256_maskz_unpackhi_ps(__mmask8 __U, __m256 __A, __m256 __B)
{		{
return (__m256)__builtin_ia32_selectps_256((__mmask8)__U,		return (__m256)__builtin_ia32_selectps_256((__mmask8)__U,
(__v8sf)_mm256_unpackhi_ps(__A, __B),		(__v8sf)_mm256_unpackhi_ps(__A, __B),
(__v8sf)_mm256_setzero_ps());		(__v8sf)_mm256_setzero_ps());
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_mask_unpacklo_pd(__m128d __W, __mmask8 __U, __m128d __A, __m128d __B)		_mm_mask_unpacklo_pd(__m128d __W, __mmask8 __U, __m128d __A, __m128d __B)
{		{
return (__m128d)__builtin_ia32_selectpd_128((__mmask8)__U,		return (__m128d)__builtin_ia32_selectpd_128((__mmask8)__U,
(__v2df)_mm_unpacklo_pd(__A, __B),		(__v2df)_mm_unpacklo_pd(__A, __B),
(__v2df)__W);		(__v2df)__W);
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_maskz_unpacklo_pd(__mmask8 __U, __m128d __A, __m128d __B)		_mm_maskz_unpacklo_pd(__mmask8 __U, __m128d __A, __m128d __B)
{		{
return (__m128d)__builtin_ia32_selectpd_128((__mmask8)__U,		return (__m128d)__builtin_ia32_selectpd_128((__mmask8)__U,
(__v2df)_mm_unpacklo_pd(__A, __B),		(__v2df)_mm_unpacklo_pd(__A, __B),
(__v2df)_mm_setzero_pd());		(__v2df)_mm_setzero_pd());
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_mask_unpacklo_pd(__m256d __W, __mmask8 __U, __m256d __A, __m256d __B)		_mm256_mask_unpacklo_pd(__m256d __W, __mmask8 __U, __m256d __A, __m256d __B)
{		{
return (__m256d)__builtin_ia32_selectpd_256((__mmask8)__U,		return (__m256d)__builtin_ia32_selectpd_256((__mmask8)__U,
(__v4df)_mm256_unpacklo_pd(__A, __B),		(__v4df)_mm256_unpacklo_pd(__A, __B),
(__v4df)__W);		(__v4df)__W);
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_maskz_unpacklo_pd(__mmask8 __U, __m256d __A, __m256d __B)		_mm256_maskz_unpacklo_pd(__mmask8 __U, __m256d __A, __m256d __B)
{		{
return (__m256d)__builtin_ia32_selectpd_256((__mmask8)__U,		return (__m256d)__builtin_ia32_selectpd_256((__mmask8)__U,
(__v4df)_mm256_unpacklo_pd(__A, __B),		(__v4df)_mm256_unpacklo_pd(__A, __B),
(__v4df)_mm256_setzero_pd());		(__v4df)_mm256_setzero_pd());
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_mask_unpacklo_ps(__m128 __W, __mmask8 __U, __m128 __A, __m128 __B)		_mm_mask_unpacklo_ps(__m128 __W, __mmask8 __U, __m128 __A, __m128 __B)
{		{
return (__m128)__builtin_ia32_selectps_128((__mmask8)__U,		return (__m128)__builtin_ia32_selectps_128((__mmask8)__U,
(__v4sf)_mm_unpacklo_ps(__A, __B),		(__v4sf)_mm_unpacklo_ps(__A, __B),
(__v4sf)__W);		(__v4sf)__W);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_maskz_unpacklo_ps(__mmask8 __U, __m128 __A, __m128 __B)		_mm_maskz_unpacklo_ps(__mmask8 __U, __m128 __A, __m128 __B)
{		{
return (__m128)__builtin_ia32_selectps_128((__mmask8)__U,		return (__m128)__builtin_ia32_selectps_128((__mmask8)__U,
(__v4sf)_mm_unpacklo_ps(__A, __B),		(__v4sf)_mm_unpacklo_ps(__A, __B),
(__v4sf)_mm_setzero_ps());		(__v4sf)_mm_setzero_ps());
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_mask_unpacklo_ps(__m256 __W, __mmask8 __U, __m256 __A, __m256 __B)		_mm256_mask_unpacklo_ps(__m256 __W, __mmask8 __U, __m256 __A, __m256 __B)
{		{
return (__m256)__builtin_ia32_selectps_256((__mmask8)__U,		return (__m256)__builtin_ia32_selectps_256((__mmask8)__U,
(__v8sf)_mm256_unpacklo_ps(__A, __B),		(__v8sf)_mm256_unpacklo_ps(__A, __B),
(__v8sf)__W);		(__v8sf)__W);
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_maskz_unpacklo_ps(__mmask8 __U, __m256 __A, __m256 __B)		_mm256_maskz_unpacklo_ps(__mmask8 __U, __m256 __A, __m256 __B)
{		{
return (__m256)__builtin_ia32_selectps_256((__mmask8)__U,		return (__m256)__builtin_ia32_selectps_256((__mmask8)__U,
(__v8sf)_mm256_unpacklo_ps(__A, __B),		(__v8sf)_mm256_unpacklo_ps(__A, __B),
(__v8sf)_mm256_setzero_ps());		(__v8sf)_mm256_setzero_ps());
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_rcp14_pd (__m128d __A)		_mm_rcp14_pd (__m128d __A)
{		{
return (__m128d) __builtin_ia32_rcp14pd128_mask ((__v2df) __A,		return (__m128d) __builtin_ia32_rcp14pd128_mask ((__v2df) __A,
(__v2df)		(__v2df)
_mm_setzero_pd (),		_mm_setzero_pd (),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_mask_rcp14_pd (__m128d __W, __mmask8 __U, __m128d __A)		_mm_mask_rcp14_pd (__m128d __W, __mmask8 __U, __m128d __A)
{		{
return (__m128d) __builtin_ia32_rcp14pd128_mask ((__v2df) __A,		return (__m128d) __builtin_ia32_rcp14pd128_mask ((__v2df) __A,
(__v2df) __W,		(__v2df) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_maskz_rcp14_pd (__mmask8 __U, __m128d __A)		_mm_maskz_rcp14_pd (__mmask8 __U, __m128d __A)
{		{
return (__m128d) __builtin_ia32_rcp14pd128_mask ((__v2df) __A,		return (__m128d) __builtin_ia32_rcp14pd128_mask ((__v2df) __A,
(__v2df)		(__v2df)
_mm_setzero_pd (),		_mm_setzero_pd (),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_rcp14_pd (__m256d __A)		_mm256_rcp14_pd (__m256d __A)
{		{
return (__m256d) __builtin_ia32_rcp14pd256_mask ((__v4df) __A,		return (__m256d) __builtin_ia32_rcp14pd256_mask ((__v4df) __A,
(__v4df)		(__v4df)
_mm256_setzero_pd (),		_mm256_setzero_pd (),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_mask_rcp14_pd (__m256d __W, __mmask8 __U, __m256d __A)		_mm256_mask_rcp14_pd (__m256d __W, __mmask8 __U, __m256d __A)
{		{
return (__m256d) __builtin_ia32_rcp14pd256_mask ((__v4df) __A,		return (__m256d) __builtin_ia32_rcp14pd256_mask ((__v4df) __A,
(__v4df) __W,		(__v4df) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_maskz_rcp14_pd (__mmask8 __U, __m256d __A)		_mm256_maskz_rcp14_pd (__mmask8 __U, __m256d __A)
{		{
return (__m256d) __builtin_ia32_rcp14pd256_mask ((__v4df) __A,		return (__m256d) __builtin_ia32_rcp14pd256_mask ((__v4df) __A,
(__v4df)		(__v4df)
_mm256_setzero_pd (),		_mm256_setzero_pd (),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_rcp14_ps (__m128 __A)		_mm_rcp14_ps (__m128 __A)
{		{
return (__m128) __builtin_ia32_rcp14ps128_mask ((__v4sf) __A,		return (__m128) __builtin_ia32_rcp14ps128_mask ((__v4sf) __A,
(__v4sf)		(__v4sf)
_mm_setzero_ps (),		_mm_setzero_ps (),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_mask_rcp14_ps (__m128 __W, __mmask8 __U, __m128 __A)		_mm_mask_rcp14_ps (__m128 __W, __mmask8 __U, __m128 __A)
{		{
return (__m128) __builtin_ia32_rcp14ps128_mask ((__v4sf) __A,		return (__m128) __builtin_ia32_rcp14ps128_mask ((__v4sf) __A,
(__v4sf) __W,		(__v4sf) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_maskz_rcp14_ps (__mmask8 __U, __m128 __A)		_mm_maskz_rcp14_ps (__mmask8 __U, __m128 __A)
{		{
return (__m128) __builtin_ia32_rcp14ps128_mask ((__v4sf) __A,		return (__m128) __builtin_ia32_rcp14ps128_mask ((__v4sf) __A,
(__v4sf)		(__v4sf)
_mm_setzero_ps (),		_mm_setzero_ps (),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_rcp14_ps (__m256 __A)		_mm256_rcp14_ps (__m256 __A)
{		{
return (__m256) __builtin_ia32_rcp14ps256_mask ((__v8sf) __A,		return (__m256) __builtin_ia32_rcp14ps256_mask ((__v8sf) __A,
(__v8sf)		(__v8sf)
_mm256_setzero_ps (),		_mm256_setzero_ps (),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_mask_rcp14_ps (__m256 __W, __mmask8 __U, __m256 __A)		_mm256_mask_rcp14_ps (__m256 __W, __mmask8 __U, __m256 __A)
{		{
return (__m256) __builtin_ia32_rcp14ps256_mask ((__v8sf) __A,		return (__m256) __builtin_ia32_rcp14ps256_mask ((__v8sf) __A,
(__v8sf) __W,		(__v8sf) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_maskz_rcp14_ps (__mmask8 __U, __m256 __A)		_mm256_maskz_rcp14_ps (__mmask8 __U, __m256 __A)
{		{
return (__m256) __builtin_ia32_rcp14ps256_mask ((__v8sf) __A,		return (__m256) __builtin_ia32_rcp14ps256_mask ((__v8sf) __A,
(__v8sf)		(__v8sf)
_mm256_setzero_ps (),		_mm256_setzero_ps (),
(__mmask8) __U);		(__mmask8) __U);
}		}

Show All 32 Lines	(__m256)__builtin_ia32_selectps_256((__mmask8)(U), \
(__v8sf)_mm256_permute_ps((X), (C)), \		(__v8sf)_mm256_permute_ps((X), (C)), \
(__v8sf)(__m256)(W))		(__v8sf)(__m256)(W))

#define _mm256_maskz_permute_ps(U, X, C) \		#define _mm256_maskz_permute_ps(U, X, C) \
(__m256)__builtin_ia32_selectps_256((__mmask8)(U), \		(__m256)__builtin_ia32_selectps_256((__mmask8)(U), \
(__v8sf)_mm256_permute_ps((X), (C)), \		(__v8sf)_mm256_permute_ps((X), (C)), \
(__v8sf)_mm256_setzero_ps())		(__v8sf)_mm256_setzero_ps())

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_mask_permutevar_pd(__m128d __W, __mmask8 __U, __m128d __A, __m128i __C)		_mm_mask_permutevar_pd(__m128d __W, __mmask8 __U, __m128d __A, __m128i __C)
{		{
return (__m128d)__builtin_ia32_selectpd_128((__mmask8)__U,		return (__m128d)__builtin_ia32_selectpd_128((__mmask8)__U,
(__v2df)_mm_permutevar_pd(__A, __C),		(__v2df)_mm_permutevar_pd(__A, __C),
(__v2df)__W);		(__v2df)__W);
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_maskz_permutevar_pd(__mmask8 __U, __m128d __A, __m128i __C)		_mm_maskz_permutevar_pd(__mmask8 __U, __m128d __A, __m128i __C)
{		{
return (__m128d)__builtin_ia32_selectpd_128((__mmask8)__U,		return (__m128d)__builtin_ia32_selectpd_128((__mmask8)__U,
(__v2df)_mm_permutevar_pd(__A, __C),		(__v2df)_mm_permutevar_pd(__A, __C),
(__v2df)_mm_setzero_pd());		(__v2df)_mm_setzero_pd());
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_mask_permutevar_pd(__m256d __W, __mmask8 __U, __m256d __A, __m256i __C)		_mm256_mask_permutevar_pd(__m256d __W, __mmask8 __U, __m256d __A, __m256i __C)
{		{
return (__m256d)__builtin_ia32_selectpd_256((__mmask8)__U,		return (__m256d)__builtin_ia32_selectpd_256((__mmask8)__U,
(__v4df)_mm256_permutevar_pd(__A, __C),		(__v4df)_mm256_permutevar_pd(__A, __C),
(__v4df)__W);		(__v4df)__W);
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_maskz_permutevar_pd(__mmask8 __U, __m256d __A, __m256i __C)		_mm256_maskz_permutevar_pd(__mmask8 __U, __m256d __A, __m256i __C)
{		{
return (__m256d)__builtin_ia32_selectpd_256((__mmask8)__U,		return (__m256d)__builtin_ia32_selectpd_256((__mmask8)__U,
(__v4df)_mm256_permutevar_pd(__A, __C),		(__v4df)_mm256_permutevar_pd(__A, __C),
(__v4df)_mm256_setzero_pd());		(__v4df)_mm256_setzero_pd());
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_mask_permutevar_ps(__m128 __W, __mmask8 __U, __m128 __A, __m128i __C)		_mm_mask_permutevar_ps(__m128 __W, __mmask8 __U, __m128 __A, __m128i __C)
{		{
return (__m128)__builtin_ia32_selectps_128((__mmask8)__U,		return (__m128)__builtin_ia32_selectps_128((__mmask8)__U,
(__v4sf)_mm_permutevar_ps(__A, __C),		(__v4sf)_mm_permutevar_ps(__A, __C),
(__v4sf)__W);		(__v4sf)__W);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_maskz_permutevar_ps(__mmask8 __U, __m128 __A, __m128i __C)		_mm_maskz_permutevar_ps(__mmask8 __U, __m128 __A, __m128i __C)
{		{
return (__m128)__builtin_ia32_selectps_128((__mmask8)__U,		return (__m128)__builtin_ia32_selectps_128((__mmask8)__U,
(__v4sf)_mm_permutevar_ps(__A, __C),		(__v4sf)_mm_permutevar_ps(__A, __C),
(__v4sf)_mm_setzero_ps());		(__v4sf)_mm_setzero_ps());
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_mask_permutevar_ps(__m256 __W, __mmask8 __U, __m256 __A, __m256i __C)		_mm256_mask_permutevar_ps(__m256 __W, __mmask8 __U, __m256 __A, __m256i __C)
{		{
return (__m256)__builtin_ia32_selectps_256((__mmask8)__U,		return (__m256)__builtin_ia32_selectps_256((__mmask8)__U,
(__v8sf)_mm256_permutevar_ps(__A, __C),		(__v8sf)_mm256_permutevar_ps(__A, __C),
(__v8sf)__W);		(__v8sf)__W);
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_maskz_permutevar_ps(__mmask8 __U, __m256 __A, __m256i __C)		_mm256_maskz_permutevar_ps(__mmask8 __U, __m256 __A, __m256i __C)
{		{
return (__m256)__builtin_ia32_selectps_256((__mmask8)__U,		return (__m256)__builtin_ia32_selectps_256((__mmask8)__U,
(__v8sf)_mm256_permutevar_ps(__A, __C),		(__v8sf)_mm256_permutevar_ps(__A, __C),
(__v8sf)_mm256_setzero_ps());		(__v8sf)_mm256_setzero_ps());
}		}

static __inline__ __mmask8 __DEFAULT_FN_ATTRS		static __inline__ __mmask8 __DEFAULT_FN_ATTRS128
_mm_test_epi32_mask (__m128i __A, __m128i __B)		_mm_test_epi32_mask (__m128i __A, __m128i __B)
{		{
return _mm_cmpneq_epi32_mask (_mm_and_si128 (__A, __B), _mm_setzero_si128());		return _mm_cmpneq_epi32_mask (_mm_and_si128 (__A, __B), _mm_setzero_si128());
}		}

static __inline__ __mmask8 __DEFAULT_FN_ATTRS		static __inline__ __mmask8 __DEFAULT_FN_ATTRS128
_mm_mask_test_epi32_mask (__mmask8 __U, __m128i __A, __m128i __B)		_mm_mask_test_epi32_mask (__mmask8 __U, __m128i __A, __m128i __B)
{		{
return _mm_mask_cmpneq_epi32_mask (__U, _mm_and_si128 (__A, __B),		return _mm_mask_cmpneq_epi32_mask (__U, _mm_and_si128 (__A, __B),
_mm_setzero_si128());		_mm_setzero_si128());
}		}

static __inline__ __mmask8 __DEFAULT_FN_ATTRS		static __inline__ __mmask8 __DEFAULT_FN_ATTRS256
_mm256_test_epi32_mask (__m256i __A, __m256i __B)		_mm256_test_epi32_mask (__m256i __A, __m256i __B)
{		{
return _mm256_cmpneq_epi32_mask (_mm256_and_si256 (__A, __B),		return _mm256_cmpneq_epi32_mask (_mm256_and_si256 (__A, __B),
_mm256_setzero_si256());		_mm256_setzero_si256());
}		}

static __inline__ __mmask8 __DEFAULT_FN_ATTRS		static __inline__ __mmask8 __DEFAULT_FN_ATTRS256
_mm256_mask_test_epi32_mask (__mmask8 __U, __m256i __A, __m256i __B)		_mm256_mask_test_epi32_mask (__mmask8 __U, __m256i __A, __m256i __B)
{		{
return _mm256_mask_cmpneq_epi32_mask (__U, _mm256_and_si256 (__A, __B),		return _mm256_mask_cmpneq_epi32_mask (__U, _mm256_and_si256 (__A, __B),
_mm256_setzero_si256());		_mm256_setzero_si256());
}		}

static __inline__ __mmask8 __DEFAULT_FN_ATTRS		static __inline__ __mmask8 __DEFAULT_FN_ATTRS128
_mm_test_epi64_mask (__m128i __A, __m128i __B)		_mm_test_epi64_mask (__m128i __A, __m128i __B)
{		{
return _mm_cmpneq_epi64_mask (_mm_and_si128 (__A, __B), _mm_setzero_si128());		return _mm_cmpneq_epi64_mask (_mm_and_si128 (__A, __B), _mm_setzero_si128());
}		}

static __inline__ __mmask8 __DEFAULT_FN_ATTRS		static __inline__ __mmask8 __DEFAULT_FN_ATTRS128
_mm_mask_test_epi64_mask (__mmask8 __U, __m128i __A, __m128i __B)		_mm_mask_test_epi64_mask (__mmask8 __U, __m128i __A, __m128i __B)
{		{
return _mm_mask_cmpneq_epi64_mask (__U, _mm_and_si128 (__A, __B),		return _mm_mask_cmpneq_epi64_mask (__U, _mm_and_si128 (__A, __B),
_mm_setzero_si128());		_mm_setzero_si128());
}		}

static __inline__ __mmask8 __DEFAULT_FN_ATTRS		static __inline__ __mmask8 __DEFAULT_FN_ATTRS256
_mm256_test_epi64_mask (__m256i __A, __m256i __B)		_mm256_test_epi64_mask (__m256i __A, __m256i __B)
{		{
return _mm256_cmpneq_epi64_mask (_mm256_and_si256 (__A, __B),		return _mm256_cmpneq_epi64_mask (_mm256_and_si256 (__A, __B),
_mm256_setzero_si256());		_mm256_setzero_si256());
}		}

static __inline__ __mmask8 __DEFAULT_FN_ATTRS		static __inline__ __mmask8 __DEFAULT_FN_ATTRS256
_mm256_mask_test_epi64_mask (__mmask8 __U, __m256i __A, __m256i __B)		_mm256_mask_test_epi64_mask (__mmask8 __U, __m256i __A, __m256i __B)
{		{
return _mm256_mask_cmpneq_epi64_mask (__U, _mm256_and_si256 (__A, __B),		return _mm256_mask_cmpneq_epi64_mask (__U, _mm256_and_si256 (__A, __B),
_mm256_setzero_si256());		_mm256_setzero_si256());
}		}

static __inline__ __mmask8 __DEFAULT_FN_ATTRS		static __inline__ __mmask8 __DEFAULT_FN_ATTRS128
_mm_testn_epi32_mask (__m128i __A, __m128i __B)		_mm_testn_epi32_mask (__m128i __A, __m128i __B)
{		{
return _mm_cmpeq_epi32_mask (_mm_and_si128 (__A, __B), _mm_setzero_si128());		return _mm_cmpeq_epi32_mask (_mm_and_si128 (__A, __B), _mm_setzero_si128());
}		}

static __inline__ __mmask8 __DEFAULT_FN_ATTRS		static __inline__ __mmask8 __DEFAULT_FN_ATTRS128
_mm_mask_testn_epi32_mask (__mmask8 __U, __m128i __A, __m128i __B)		_mm_mask_testn_epi32_mask (__mmask8 __U, __m128i __A, __m128i __B)
{		{
return _mm_mask_cmpeq_epi32_mask (__U, _mm_and_si128 (__A, __B),		return _mm_mask_cmpeq_epi32_mask (__U, _mm_and_si128 (__A, __B),
_mm_setzero_si128());		_mm_setzero_si128());
}		}

static __inline__ __mmask8 __DEFAULT_FN_ATTRS		static __inline__ __mmask8 __DEFAULT_FN_ATTRS256
_mm256_testn_epi32_mask (__m256i __A, __m256i __B)		_mm256_testn_epi32_mask (__m256i __A, __m256i __B)
{		{
return _mm256_cmpeq_epi32_mask (_mm256_and_si256 (__A, __B),		return _mm256_cmpeq_epi32_mask (_mm256_and_si256 (__A, __B),
_mm256_setzero_si256());		_mm256_setzero_si256());
}		}

static __inline__ __mmask8 __DEFAULT_FN_ATTRS		static __inline__ __mmask8 __DEFAULT_FN_ATTRS256
_mm256_mask_testn_epi32_mask (__mmask8 __U, __m256i __A, __m256i __B)		_mm256_mask_testn_epi32_mask (__mmask8 __U, __m256i __A, __m256i __B)
{		{
return _mm256_mask_cmpeq_epi32_mask (__U, _mm256_and_si256 (__A, __B),		return _mm256_mask_cmpeq_epi32_mask (__U, _mm256_and_si256 (__A, __B),
_mm256_setzero_si256());		_mm256_setzero_si256());
}		}

static __inline__ __mmask8 __DEFAULT_FN_ATTRS		static __inline__ __mmask8 __DEFAULT_FN_ATTRS128
_mm_testn_epi64_mask (__m128i __A, __m128i __B)		_mm_testn_epi64_mask (__m128i __A, __m128i __B)
{		{
return _mm_cmpeq_epi64_mask (_mm_and_si128 (__A, __B), _mm_setzero_si128());		return _mm_cmpeq_epi64_mask (_mm_and_si128 (__A, __B), _mm_setzero_si128());
}		}

static __inline__ __mmask8 __DEFAULT_FN_ATTRS		static __inline__ __mmask8 __DEFAULT_FN_ATTRS128
_mm_mask_testn_epi64_mask (__mmask8 __U, __m128i __A, __m128i __B)		_mm_mask_testn_epi64_mask (__mmask8 __U, __m128i __A, __m128i __B)
{		{
return _mm_mask_cmpeq_epi64_mask (__U, _mm_and_si128 (__A, __B),		return _mm_mask_cmpeq_epi64_mask (__U, _mm_and_si128 (__A, __B),
_mm_setzero_si128());		_mm_setzero_si128());
}		}

static __inline__ __mmask8 __DEFAULT_FN_ATTRS		static __inline__ __mmask8 __DEFAULT_FN_ATTRS256
_mm256_testn_epi64_mask (__m256i __A, __m256i __B)		_mm256_testn_epi64_mask (__m256i __A, __m256i __B)
{		{
return _mm256_cmpeq_epi64_mask (_mm256_and_si256 (__A, __B),		return _mm256_cmpeq_epi64_mask (_mm256_and_si256 (__A, __B),
_mm256_setzero_si256());		_mm256_setzero_si256());
}		}

static __inline__ __mmask8 __DEFAULT_FN_ATTRS		static __inline__ __mmask8 __DEFAULT_FN_ATTRS256
_mm256_mask_testn_epi64_mask (__mmask8 __U, __m256i __A, __m256i __B)		_mm256_mask_testn_epi64_mask (__mmask8 __U, __m256i __A, __m256i __B)
{		{
return _mm256_mask_cmpeq_epi64_mask (__U, _mm256_and_si256 (__A, __B),		return _mm256_mask_cmpeq_epi64_mask (__U, _mm256_and_si256 (__A, __B),
_mm256_setzero_si256());		_mm256_setzero_si256());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_unpackhi_epi32(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)		_mm_mask_unpackhi_epi32(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,
(__v4si)_mm_unpackhi_epi32(__A, __B),		(__v4si)_mm_unpackhi_epi32(__A, __B),
(__v4si)__W);		(__v4si)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_unpackhi_epi32(__mmask8 __U, __m128i __A, __m128i __B)		_mm_maskz_unpackhi_epi32(__mmask8 __U, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,
(__v4si)_mm_unpackhi_epi32(__A, __B),		(__v4si)_mm_unpackhi_epi32(__A, __B),
(__v4si)_mm_setzero_si128());		(__v4si)_mm_setzero_si128());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_unpackhi_epi32(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B)		_mm256_mask_unpackhi_epi32(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B)
{		{
return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,
(__v8si)_mm256_unpackhi_epi32(__A, __B),		(__v8si)_mm256_unpackhi_epi32(__A, __B),
(__v8si)__W);		(__v8si)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_unpackhi_epi32(__mmask8 __U, __m256i __A, __m256i __B)		_mm256_maskz_unpackhi_epi32(__mmask8 __U, __m256i __A, __m256i __B)
{		{
return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,
(__v8si)_mm256_unpackhi_epi32(__A, __B),		(__v8si)_mm256_unpackhi_epi32(__A, __B),
(__v8si)_mm256_setzero_si256());		(__v8si)_mm256_setzero_si256());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_unpackhi_epi64(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)		_mm_mask_unpackhi_epi64(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,
(__v2di)_mm_unpackhi_epi64(__A, __B),		(__v2di)_mm_unpackhi_epi64(__A, __B),
(__v2di)__W);		(__v2di)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_unpackhi_epi64(__mmask8 __U, __m128i __A, __m128i __B)		_mm_maskz_unpackhi_epi64(__mmask8 __U, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,
(__v2di)_mm_unpackhi_epi64(__A, __B),		(__v2di)_mm_unpackhi_epi64(__A, __B),
(__v2di)_mm_setzero_si128());		(__v2di)_mm_setzero_si128());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_unpackhi_epi64(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B)		_mm256_mask_unpackhi_epi64(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B)
{		{
return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,
(__v4di)_mm256_unpackhi_epi64(__A, __B),		(__v4di)_mm256_unpackhi_epi64(__A, __B),
(__v4di)__W);		(__v4di)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_unpackhi_epi64(__mmask8 __U, __m256i __A, __m256i __B)		_mm256_maskz_unpackhi_epi64(__mmask8 __U, __m256i __A, __m256i __B)
{		{
return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,
(__v4di)_mm256_unpackhi_epi64(__A, __B),		(__v4di)_mm256_unpackhi_epi64(__A, __B),
(__v4di)_mm256_setzero_si256());		(__v4di)_mm256_setzero_si256());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_unpacklo_epi32(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)		_mm_mask_unpacklo_epi32(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,
(__v4si)_mm_unpacklo_epi32(__A, __B),		(__v4si)_mm_unpacklo_epi32(__A, __B),
(__v4si)__W);		(__v4si)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_unpacklo_epi32(__mmask8 __U, __m128i __A, __m128i __B)		_mm_maskz_unpacklo_epi32(__mmask8 __U, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,
(__v4si)_mm_unpacklo_epi32(__A, __B),		(__v4si)_mm_unpacklo_epi32(__A, __B),
(__v4si)_mm_setzero_si128());		(__v4si)_mm_setzero_si128());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_unpacklo_epi32(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B)		_mm256_mask_unpacklo_epi32(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B)
{		{
return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,
(__v8si)_mm256_unpacklo_epi32(__A, __B),		(__v8si)_mm256_unpacklo_epi32(__A, __B),
(__v8si)__W);		(__v8si)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_unpacklo_epi32(__mmask8 __U, __m256i __A, __m256i __B)		_mm256_maskz_unpacklo_epi32(__mmask8 __U, __m256i __A, __m256i __B)
{		{
return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,
(__v8si)_mm256_unpacklo_epi32(__A, __B),		(__v8si)_mm256_unpacklo_epi32(__A, __B),
(__v8si)_mm256_setzero_si256());		(__v8si)_mm256_setzero_si256());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_unpacklo_epi64(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)		_mm_mask_unpacklo_epi64(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,
(__v2di)_mm_unpacklo_epi64(__A, __B),		(__v2di)_mm_unpacklo_epi64(__A, __B),
(__v2di)__W);		(__v2di)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_unpacklo_epi64(__mmask8 __U, __m128i __A, __m128i __B)		_mm_maskz_unpacklo_epi64(__mmask8 __U, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,
(__v2di)_mm_unpacklo_epi64(__A, __B),		(__v2di)_mm_unpacklo_epi64(__A, __B),
(__v2di)_mm_setzero_si128());		(__v2di)_mm_setzero_si128());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_unpacklo_epi64(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B)		_mm256_mask_unpacklo_epi64(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B)
{		{
return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,
(__v4di)_mm256_unpacklo_epi64(__A, __B),		(__v4di)_mm256_unpacklo_epi64(__A, __B),
(__v4di)__W);		(__v4di)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_unpacklo_epi64(__mmask8 __U, __m256i __A, __m256i __B)		_mm256_maskz_unpacklo_epi64(__mmask8 __U, __m256i __A, __m256i __B)
{		{
return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,
(__v4di)_mm256_unpacklo_epi64(__A, __B),		(__v4di)_mm256_unpacklo_epi64(__A, __B),
(__v4di)_mm256_setzero_si256());		(__v4di)_mm256_setzero_si256());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_sra_epi32(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)		_mm_mask_sra_epi32(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,
(__v4si)_mm_sra_epi32(__A, __B),		(__v4si)_mm_sra_epi32(__A, __B),
(__v4si)__W);		(__v4si)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_sra_epi32(__mmask8 __U, __m128i __A, __m128i __B)		_mm_maskz_sra_epi32(__mmask8 __U, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,
(__v4si)_mm_sra_epi32(__A, __B),		(__v4si)_mm_sra_epi32(__A, __B),
(__v4si)_mm_setzero_si128());		(__v4si)_mm_setzero_si128());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_sra_epi32(__m256i __W, __mmask8 __U, __m256i __A, __m128i __B)		_mm256_mask_sra_epi32(__m256i __W, __mmask8 __U, __m256i __A, __m128i __B)
{		{
return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,
(__v8si)_mm256_sra_epi32(__A, __B),		(__v8si)_mm256_sra_epi32(__A, __B),
(__v8si)__W);		(__v8si)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_sra_epi32(__mmask8 __U, __m256i __A, __m128i __B)		_mm256_maskz_sra_epi32(__mmask8 __U, __m256i __A, __m128i __B)
{		{
return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,
(__v8si)_mm256_sra_epi32(__A, __B),		(__v8si)_mm256_sra_epi32(__A, __B),
(__v8si)_mm256_setzero_si256());		(__v8si)_mm256_setzero_si256());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_srai_epi32(__m128i __W, __mmask8 __U, __m128i __A, int __B)		_mm_mask_srai_epi32(__m128i __W, __mmask8 __U, __m128i __A, int __B)
{		{
return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,
(__v4si)_mm_srai_epi32(__A, __B),		(__v4si)_mm_srai_epi32(__A, __B),
(__v4si)__W);		(__v4si)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_srai_epi32(__mmask8 __U, __m128i __A, int __B)		_mm_maskz_srai_epi32(__mmask8 __U, __m128i __A, int __B)
{		{
return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,		return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,
(__v4si)_mm_srai_epi32(__A, __B),		(__v4si)_mm_srai_epi32(__A, __B),
(__v4si)_mm_setzero_si128());		(__v4si)_mm_setzero_si128());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_srai_epi32(__m256i __W, __mmask8 __U, __m256i __A, int __B)		_mm256_mask_srai_epi32(__m256i __W, __mmask8 __U, __m256i __A, int __B)
{		{
return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,
(__v8si)_mm256_srai_epi32(__A, __B),		(__v8si)_mm256_srai_epi32(__A, __B),
(__v8si)__W);		(__v8si)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_srai_epi32(__mmask8 __U, __m256i __A, int __B)		_mm256_maskz_srai_epi32(__mmask8 __U, __m256i __A, int __B)
{		{
return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,		return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,
(__v8si)_mm256_srai_epi32(__A, __B),		(__v8si)_mm256_srai_epi32(__A, __B),
(__v8si)_mm256_setzero_si256());		(__v8si)_mm256_setzero_si256());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_sra_epi64(__m128i __A, __m128i __B)		_mm_sra_epi64(__m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_psraq128((__v2di)__A, (__v2di)__B);		return (__m128i)__builtin_ia32_psraq128((__v2di)__A, (__v2di)__B);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_sra_epi64(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)		_mm_mask_sra_epi64(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U, \		return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U, \
(__v2di)_mm_sra_epi64(__A, __B), \		(__v2di)_mm_sra_epi64(__A, __B), \
(__v2di)__W);		(__v2di)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_sra_epi64(__mmask8 __U, __m128i __A, __m128i __B)		_mm_maskz_sra_epi64(__mmask8 __U, __m128i __A, __m128i __B)
{		{
return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U, \		return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U, \
(__v2di)_mm_sra_epi64(__A, __B), \		(__v2di)_mm_sra_epi64(__A, __B), \
(__v2di)_mm_setzero_si128());		(__v2di)_mm_setzero_si128());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_sra_epi64(__m256i __A, __m128i __B)		_mm256_sra_epi64(__m256i __A, __m128i __B)
{		{
return (__m256i)__builtin_ia32_psraq256((__v4di) __A, (__v2di) __B);		return (__m256i)__builtin_ia32_psraq256((__v4di) __A, (__v2di) __B);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_sra_epi64(__m256i __W, __mmask8 __U, __m256i __A, __m128i __B)		_mm256_mask_sra_epi64(__m256i __W, __mmask8 __U, __m256i __A, __m128i __B)
{		{
return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U, \		return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U, \
(__v4di)_mm256_sra_epi64(__A, __B), \		(__v4di)_mm256_sra_epi64(__A, __B), \
(__v4di)__W);		(__v4di)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_sra_epi64(__mmask8 __U, __m256i __A, __m128i __B)		_mm256_maskz_sra_epi64(__mmask8 __U, __m256i __A, __m128i __B)
{		{
return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U, \		return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U, \
(__v4di)_mm256_sra_epi64(__A, __B), \		(__v4di)_mm256_sra_epi64(__A, __B), \
(__v4di)_mm256_setzero_si256());		(__v4di)_mm256_setzero_si256());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_srai_epi64(__m128i __A, int __imm)		_mm_srai_epi64(__m128i __A, int __imm)
{		{
return (__m128i)__builtin_ia32_psraqi128((__v2di)__A, __imm);		return (__m128i)__builtin_ia32_psraqi128((__v2di)__A, __imm);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_srai_epi64(__m128i __W, __mmask8 __U, __m128i __A, int __imm)		_mm_mask_srai_epi64(__m128i __W, __mmask8 __U, __m128i __A, int __imm)
{		{
return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U, \		return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U, \
(__v2di)_mm_srai_epi64(__A, __imm), \		(__v2di)_mm_srai_epi64(__A, __imm), \
(__v2di)__W);		(__v2di)__W);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_srai_epi64(__mmask8 __U, __m128i __A, int __imm)		_mm_maskz_srai_epi64(__mmask8 __U, __m128i __A, int __imm)
{		{
return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U, \		return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U, \
(__v2di)_mm_srai_epi64(__A, __imm), \		(__v2di)_mm_srai_epi64(__A, __imm), \
(__v2di)_mm_setzero_si128());		(__v2di)_mm_setzero_si128());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_srai_epi64(__m256i __A, int __imm)		_mm256_srai_epi64(__m256i __A, int __imm)
{		{
return (__m256i)__builtin_ia32_psraqi256((__v4di)__A, __imm);		return (__m256i)__builtin_ia32_psraqi256((__v4di)__A, __imm);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_srai_epi64(__m256i __W, __mmask8 __U, __m256i __A, int __imm)		_mm256_mask_srai_epi64(__m256i __W, __mmask8 __U, __m256i __A, int __imm)
{		{
return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U, \		return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U, \
(__v4di)_mm256_srai_epi64(__A, __imm), \		(__v4di)_mm256_srai_epi64(__A, __imm), \
(__v4di)__W);		(__v4di)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_srai_epi64(__mmask8 __U, __m256i __A, int __imm)		_mm256_maskz_srai_epi64(__mmask8 __U, __m256i __A, int __imm)
{		{
return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U, \		return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U, \
(__v4di)_mm256_srai_epi64(__A, __imm), \		(__v4di)_mm256_srai_epi64(__A, __imm), \
(__v4di)_mm256_setzero_si256());		(__v4di)_mm256_setzero_si256());
}		}

#define _mm_ternarylogic_epi32(A, B, C, imm) \		#define _mm_ternarylogic_epi32(A, B, C, imm) \
▲ Show 20 Lines • Show All 162 Lines • ▼ Show 20 Lines	(__m256)__builtin_ia32_selectps_256((__mmask8)(U), \
(__v8sf)_mm256_shuffle_ps((A), (B), (M)), \		(__v8sf)_mm256_shuffle_ps((A), (B), (M)), \
(__v8sf)(__m256)(W))		(__v8sf)(__m256)(W))

#define _mm256_maskz_shuffle_ps(U, A, B, M) \		#define _mm256_maskz_shuffle_ps(U, A, B, M) \
(__m256)__builtin_ia32_selectps_256((__mmask8)(U), \		(__m256)__builtin_ia32_selectps_256((__mmask8)(U), \
(__v8sf)_mm256_shuffle_ps((A), (B), (M)), \		(__v8sf)_mm256_shuffle_ps((A), (B), (M)), \
(__v8sf)_mm256_setzero_ps())		(__v8sf)_mm256_setzero_ps())

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_rsqrt14_pd (__m128d __A)		_mm_rsqrt14_pd (__m128d __A)
{		{
return (__m128d) __builtin_ia32_rsqrt14pd128_mask ((__v2df) __A,		return (__m128d) __builtin_ia32_rsqrt14pd128_mask ((__v2df) __A,
(__v2df)		(__v2df)
_mm_setzero_pd (),		_mm_setzero_pd (),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_mask_rsqrt14_pd (__m128d __W, __mmask8 __U, __m128d __A)		_mm_mask_rsqrt14_pd (__m128d __W, __mmask8 __U, __m128d __A)
{		{
return (__m128d) __builtin_ia32_rsqrt14pd128_mask ((__v2df) __A,		return (__m128d) __builtin_ia32_rsqrt14pd128_mask ((__v2df) __A,
(__v2df) __W,		(__v2df) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_maskz_rsqrt14_pd (__mmask8 __U, __m128d __A)		_mm_maskz_rsqrt14_pd (__mmask8 __U, __m128d __A)
{		{
return (__m128d) __builtin_ia32_rsqrt14pd128_mask ((__v2df) __A,		return (__m128d) __builtin_ia32_rsqrt14pd128_mask ((__v2df) __A,
(__v2df)		(__v2df)
_mm_setzero_pd (),		_mm_setzero_pd (),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_rsqrt14_pd (__m256d __A)		_mm256_rsqrt14_pd (__m256d __A)
{		{
return (__m256d) __builtin_ia32_rsqrt14pd256_mask ((__v4df) __A,		return (__m256d) __builtin_ia32_rsqrt14pd256_mask ((__v4df) __A,
(__v4df)		(__v4df)
_mm256_setzero_pd (),		_mm256_setzero_pd (),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_mask_rsqrt14_pd (__m256d __W, __mmask8 __U, __m256d __A)		_mm256_mask_rsqrt14_pd (__m256d __W, __mmask8 __U, __m256d __A)
{		{
return (__m256d) __builtin_ia32_rsqrt14pd256_mask ((__v4df) __A,		return (__m256d) __builtin_ia32_rsqrt14pd256_mask ((__v4df) __A,
(__v4df) __W,		(__v4df) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_maskz_rsqrt14_pd (__mmask8 __U, __m256d __A)		_mm256_maskz_rsqrt14_pd (__mmask8 __U, __m256d __A)
{		{
return (__m256d) __builtin_ia32_rsqrt14pd256_mask ((__v4df) __A,		return (__m256d) __builtin_ia32_rsqrt14pd256_mask ((__v4df) __A,
(__v4df)		(__v4df)
_mm256_setzero_pd (),		_mm256_setzero_pd (),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_rsqrt14_ps (__m128 __A)		_mm_rsqrt14_ps (__m128 __A)
{		{
return (__m128) __builtin_ia32_rsqrt14ps128_mask ((__v4sf) __A,		return (__m128) __builtin_ia32_rsqrt14ps128_mask ((__v4sf) __A,
(__v4sf)		(__v4sf)
_mm_setzero_ps (),		_mm_setzero_ps (),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_mask_rsqrt14_ps (__m128 __W, __mmask8 __U, __m128 __A)		_mm_mask_rsqrt14_ps (__m128 __W, __mmask8 __U, __m128 __A)
{		{
return (__m128) __builtin_ia32_rsqrt14ps128_mask ((__v4sf) __A,		return (__m128) __builtin_ia32_rsqrt14ps128_mask ((__v4sf) __A,
(__v4sf) __W,		(__v4sf) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_maskz_rsqrt14_ps (__mmask8 __U, __m128 __A)		_mm_maskz_rsqrt14_ps (__mmask8 __U, __m128 __A)
{		{
return (__m128) __builtin_ia32_rsqrt14ps128_mask ((__v4sf) __A,		return (__m128) __builtin_ia32_rsqrt14ps128_mask ((__v4sf) __A,
(__v4sf)		(__v4sf)
_mm_setzero_ps (),		_mm_setzero_ps (),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_rsqrt14_ps (__m256 __A)		_mm256_rsqrt14_ps (__m256 __A)
{		{
return (__m256) __builtin_ia32_rsqrt14ps256_mask ((__v8sf) __A,		return (__m256) __builtin_ia32_rsqrt14ps256_mask ((__v8sf) __A,
(__v8sf)		(__v8sf)
_mm256_setzero_ps (),		_mm256_setzero_ps (),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_mask_rsqrt14_ps (__m256 __W, __mmask8 __U, __m256 __A)		_mm256_mask_rsqrt14_ps (__m256 __W, __mmask8 __U, __m256 __A)
{		{
return (__m256) __builtin_ia32_rsqrt14ps256_mask ((__v8sf) __A,		return (__m256) __builtin_ia32_rsqrt14ps256_mask ((__v8sf) __A,
(__v8sf) __W,		(__v8sf) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_maskz_rsqrt14_ps (__mmask8 __U, __m256 __A)		_mm256_maskz_rsqrt14_ps (__mmask8 __U, __m256 __A)
{		{
return (__m256) __builtin_ia32_rsqrt14ps256_mask ((__v8sf) __A,		return (__m256) __builtin_ia32_rsqrt14ps256_mask ((__v8sf) __A,
(__v8sf)		(__v8sf)
_mm256_setzero_ps (),		_mm256_setzero_ps (),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_broadcast_f32x4(__m128 __A)		_mm256_broadcast_f32x4(__m128 __A)
{		{
return (__m256)__builtin_shufflevector((__v4sf)__A, (__v4sf)__A,		return (__m256)__builtin_shufflevector((__v4sf)__A, (__v4sf)__A,
0, 1, 2, 3, 0, 1, 2, 3);		0, 1, 2, 3, 0, 1, 2, 3);
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_mask_broadcast_f32x4(__m256 __O, __mmask8 __M, __m128 __A)		_mm256_mask_broadcast_f32x4(__m256 __O, __mmask8 __M, __m128 __A)
{		{
return (__m256)__builtin_ia32_selectps_256((__mmask8)__M,		return (__m256)__builtin_ia32_selectps_256((__mmask8)__M,
(__v8sf)_mm256_broadcast_f32x4(__A),		(__v8sf)_mm256_broadcast_f32x4(__A),
(__v8sf)__O);		(__v8sf)__O);
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_maskz_broadcast_f32x4 (__mmask8 __M, __m128 __A)		_mm256_maskz_broadcast_f32x4 (__mmask8 __M, __m128 __A)
{		{
return (__m256)__builtin_ia32_selectps_256((__mmask8)__M,		return (__m256)__builtin_ia32_selectps_256((__mmask8)__M,
(__v8sf)_mm256_broadcast_f32x4(__A),		(__v8sf)_mm256_broadcast_f32x4(__A),
(__v8sf)_mm256_setzero_ps());		(__v8sf)_mm256_setzero_ps());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_broadcast_i32x4(__m128i __A)		_mm256_broadcast_i32x4(__m128i __A)
{		{
return (__m256i)__builtin_shufflevector((__v4si)__A, (__v4si)__A,		return (__m256i)__builtin_shufflevector((__v4si)__A, (__v4si)__A,
0, 1, 2, 3, 0, 1, 2, 3);		0, 1, 2, 3, 0, 1, 2, 3);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_broadcast_i32x4(__m256i __O, __mmask8 __M, __m128i __A)		_mm256_mask_broadcast_i32x4(__m256i __O, __mmask8 __M, __m128i __A)
{		{
return (__m256i)__builtin_ia32_selectd_256((__mmask8)__M,		return (__m256i)__builtin_ia32_selectd_256((__mmask8)__M,
(__v8si)_mm256_broadcast_i32x4(__A),		(__v8si)_mm256_broadcast_i32x4(__A),
(__v8si)__O);		(__v8si)__O);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_broadcast_i32x4(__mmask8 __M, __m128i __A)		_mm256_maskz_broadcast_i32x4(__mmask8 __M, __m128i __A)
{		{
return (__m256i)__builtin_ia32_selectd_256((__mmask8)__M,		return (__m256i)__builtin_ia32_selectd_256((__mmask8)__M,
(__v8si)_mm256_broadcast_i32x4(__A),		(__v8si)_mm256_broadcast_i32x4(__A),
(__v8si)_mm256_setzero_si256());		(__v8si)_mm256_setzero_si256());
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_mask_broadcastsd_pd (__m256d __O, __mmask8 __M, __m128d __A)		_mm256_mask_broadcastsd_pd (__m256d __O, __mmask8 __M, __m128d __A)
{		{
return (__m256d)__builtin_ia32_selectpd_256(__M,		return (__m256d)__builtin_ia32_selectpd_256(__M,
(__v4df) _mm256_broadcastsd_pd(__A),		(__v4df) _mm256_broadcastsd_pd(__A),
(__v4df) __O);		(__v4df) __O);
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_maskz_broadcastsd_pd (__mmask8 __M, __m128d __A)		_mm256_maskz_broadcastsd_pd (__mmask8 __M, __m128d __A)
{		{
return (__m256d)__builtin_ia32_selectpd_256(__M,		return (__m256d)__builtin_ia32_selectpd_256(__M,
(__v4df) _mm256_broadcastsd_pd(__A),		(__v4df) _mm256_broadcastsd_pd(__A),
(__v4df) _mm256_setzero_pd());		(__v4df) _mm256_setzero_pd());
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_mask_broadcastss_ps (__m128 __O, __mmask8 __M, __m128 __A)		_mm_mask_broadcastss_ps (__m128 __O, __mmask8 __M, __m128 __A)
{		{
return (__m128)__builtin_ia32_selectps_128(__M,		return (__m128)__builtin_ia32_selectps_128(__M,
(__v4sf) _mm_broadcastss_ps(__A),		(__v4sf) _mm_broadcastss_ps(__A),
(__v4sf) __O);		(__v4sf) __O);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_maskz_broadcastss_ps (__mmask8 __M, __m128 __A)		_mm_maskz_broadcastss_ps (__mmask8 __M, __m128 __A)
{		{
return (__m128)__builtin_ia32_selectps_128(__M,		return (__m128)__builtin_ia32_selectps_128(__M,
(__v4sf) _mm_broadcastss_ps(__A),		(__v4sf) _mm_broadcastss_ps(__A),
(__v4sf) _mm_setzero_ps());		(__v4sf) _mm_setzero_ps());
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_mask_broadcastss_ps (__m256 __O, __mmask8 __M, __m128 __A)		_mm256_mask_broadcastss_ps (__m256 __O, __mmask8 __M, __m128 __A)
{		{
return (__m256)__builtin_ia32_selectps_256(__M,		return (__m256)__builtin_ia32_selectps_256(__M,
(__v8sf) _mm256_broadcastss_ps(__A),		(__v8sf) _mm256_broadcastss_ps(__A),
(__v8sf) __O);		(__v8sf) __O);
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_maskz_broadcastss_ps (__mmask8 __M, __m128 __A)		_mm256_maskz_broadcastss_ps (__mmask8 __M, __m128 __A)
{		{
return (__m256)__builtin_ia32_selectps_256(__M,		return (__m256)__builtin_ia32_selectps_256(__M,
(__v8sf) _mm256_broadcastss_ps(__A),		(__v8sf) _mm256_broadcastss_ps(__A),
(__v8sf) _mm256_setzero_ps());		(__v8sf) _mm256_setzero_ps());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_broadcastd_epi32 (__m128i __O, __mmask8 __M, __m128i __A)		_mm_mask_broadcastd_epi32 (__m128i __O, __mmask8 __M, __m128i __A)
{		{
return (__m128i)__builtin_ia32_selectd_128(__M,		return (__m128i)__builtin_ia32_selectd_128(__M,
(__v4si) _mm_broadcastd_epi32(__A),		(__v4si) _mm_broadcastd_epi32(__A),
(__v4si) __O);		(__v4si) __O);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_broadcastd_epi32 (__mmask8 __M, __m128i __A)		_mm_maskz_broadcastd_epi32 (__mmask8 __M, __m128i __A)
{		{
return (__m128i)__builtin_ia32_selectd_128(__M,		return (__m128i)__builtin_ia32_selectd_128(__M,
(__v4si) _mm_broadcastd_epi32(__A),		(__v4si) _mm_broadcastd_epi32(__A),
(__v4si) _mm_setzero_si128());		(__v4si) _mm_setzero_si128());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_broadcastd_epi32 (__m256i __O, __mmask8 __M, __m128i __A)		_mm256_mask_broadcastd_epi32 (__m256i __O, __mmask8 __M, __m128i __A)
{		{
return (__m256i)__builtin_ia32_selectd_256(__M,		return (__m256i)__builtin_ia32_selectd_256(__M,
(__v8si) _mm256_broadcastd_epi32(__A),		(__v8si) _mm256_broadcastd_epi32(__A),
(__v8si) __O);		(__v8si) __O);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_broadcastd_epi32 (__mmask8 __M, __m128i __A)		_mm256_maskz_broadcastd_epi32 (__mmask8 __M, __m128i __A)
{		{
return (__m256i)__builtin_ia32_selectd_256(__M,		return (__m256i)__builtin_ia32_selectd_256(__M,
(__v8si) _mm256_broadcastd_epi32(__A),		(__v8si) _mm256_broadcastd_epi32(__A),
(__v8si) _mm256_setzero_si256());		(__v8si) _mm256_setzero_si256());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_broadcastq_epi64 (__m128i __O, __mmask8 __M, __m128i __A)		_mm_mask_broadcastq_epi64 (__m128i __O, __mmask8 __M, __m128i __A)
{		{
return (__m128i)__builtin_ia32_selectq_128(__M,		return (__m128i)__builtin_ia32_selectq_128(__M,
(__v2di) _mm_broadcastq_epi64(__A),		(__v2di) _mm_broadcastq_epi64(__A),
(__v2di) __O);		(__v2di) __O);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_broadcastq_epi64 (__mmask8 __M, __m128i __A)		_mm_maskz_broadcastq_epi64 (__mmask8 __M, __m128i __A)
{		{
return (__m128i)__builtin_ia32_selectq_128(__M,		return (__m128i)__builtin_ia32_selectq_128(__M,
(__v2di) _mm_broadcastq_epi64(__A),		(__v2di) _mm_broadcastq_epi64(__A),
(__v2di) _mm_setzero_si128());		(__v2di) _mm_setzero_si128());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_broadcastq_epi64 (__m256i __O, __mmask8 __M, __m128i __A)		_mm256_mask_broadcastq_epi64 (__m256i __O, __mmask8 __M, __m128i __A)
{		{
return (__m256i)__builtin_ia32_selectq_256(__M,		return (__m256i)__builtin_ia32_selectq_256(__M,
(__v4di) _mm256_broadcastq_epi64(__A),		(__v4di) _mm256_broadcastq_epi64(__A),
(__v4di) __O);		(__v4di) __O);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_broadcastq_epi64 (__mmask8 __M, __m128i __A)		_mm256_maskz_broadcastq_epi64 (__mmask8 __M, __m128i __A)
{		{
return (__m256i)__builtin_ia32_selectq_256(__M,		return (__m256i)__builtin_ia32_selectq_256(__M,
(__v4di) _mm256_broadcastq_epi64(__A),		(__v4di) _mm256_broadcastq_epi64(__A),
(__v4di) _mm256_setzero_si256());		(__v4di) _mm256_setzero_si256());
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_cvtsepi32_epi8 (__m128i __A)		_mm_cvtsepi32_epi8 (__m128i __A)
{		{
return (__m128i) __builtin_ia32_pmovsdb128_mask ((__v4si) __A,		return (__m128i) __builtin_ia32_pmovsdb128_mask ((__v4si) __A,
(__v16qi)_mm_undefined_si128(),		(__v16qi)_mm_undefined_si128(),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_cvtsepi32_epi8 (__m128i __O, __mmask8 __M, __m128i __A)		_mm_mask_cvtsepi32_epi8 (__m128i __O, __mmask8 __M, __m128i __A)
{		{
return (__m128i) __builtin_ia32_pmovsdb128_mask ((__v4si) __A,		return (__m128i) __builtin_ia32_pmovsdb128_mask ((__v4si) __A,
(__v16qi) __O, __M);		(__v16qi) __O, __M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_cvtsepi32_epi8 (__mmask8 __M, __m128i __A)		_mm_maskz_cvtsepi32_epi8 (__mmask8 __M, __m128i __A)
{		{
return (__m128i) __builtin_ia32_pmovsdb128_mask ((__v4si) __A,		return (__m128i) __builtin_ia32_pmovsdb128_mask ((__v4si) __A,
(__v16qi) _mm_setzero_si128 (),		(__v16qi) _mm_setzero_si128 (),
__M);		__M);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS128
_mm_mask_cvtsepi32_storeu_epi8 (void * __P, __mmask8 __M, __m128i __A)		_mm_mask_cvtsepi32_storeu_epi8 (void * __P, __mmask8 __M, __m128i __A)
{		{
__builtin_ia32_pmovsdb128mem_mask ((__v16qi *) __P, (__v4si) __A, __M);		__builtin_ia32_pmovsdb128mem_mask ((__v16qi *) __P, (__v4si) __A, __M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS256
_mm256_cvtsepi32_epi8 (__m256i __A)		_mm256_cvtsepi32_epi8 (__m256i __A)
{		{
return (__m128i) __builtin_ia32_pmovsdb256_mask ((__v8si) __A,		return (__m128i) __builtin_ia32_pmovsdb256_mask ((__v8si) __A,
(__v16qi)_mm_undefined_si128(),		(__v16qi)_mm_undefined_si128(),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS256
_mm256_mask_cvtsepi32_epi8 (__m128i __O, __mmask8 __M, __m256i __A)		_mm256_mask_cvtsepi32_epi8 (__m128i __O, __mmask8 __M, __m256i __A)
{		{
return (__m128i) __builtin_ia32_pmovsdb256_mask ((__v8si) __A,		return (__m128i) __builtin_ia32_pmovsdb256_mask ((__v8si) __A,
(__v16qi) __O, __M);		(__v16qi) __O, __M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS256
_mm256_maskz_cvtsepi32_epi8 (__mmask8 __M, __m256i __A)		_mm256_maskz_cvtsepi32_epi8 (__mmask8 __M, __m256i __A)
{		{
return (__m128i) __builtin_ia32_pmovsdb256_mask ((__v8si) __A,		return (__m128i) __builtin_ia32_pmovsdb256_mask ((__v8si) __A,
(__v16qi) _mm_setzero_si128 (),		(__v16qi) _mm_setzero_si128 (),
__M);		__M);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS256
_mm256_mask_cvtsepi32_storeu_epi8 (void * __P, __mmask8 __M, __m256i __A)		_mm256_mask_cvtsepi32_storeu_epi8 (void * __P, __mmask8 __M, __m256i __A)
{		{
__builtin_ia32_pmovsdb256mem_mask ((__v16qi *) __P, (__v8si) __A, __M);		__builtin_ia32_pmovsdb256mem_mask ((__v16qi *) __P, (__v8si) __A, __M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_cvtsepi32_epi16 (__m128i __A)		_mm_cvtsepi32_epi16 (__m128i __A)
{		{
return (__m128i) __builtin_ia32_pmovsdw128_mask ((__v4si) __A,		return (__m128i) __builtin_ia32_pmovsdw128_mask ((__v4si) __A,
(__v8hi)_mm_setzero_si128 (),		(__v8hi)_mm_setzero_si128 (),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_cvtsepi32_epi16 (__m128i __O, __mmask8 __M, __m128i __A)		_mm_mask_cvtsepi32_epi16 (__m128i __O, __mmask8 __M, __m128i __A)
{		{
return (__m128i) __builtin_ia32_pmovsdw128_mask ((__v4si) __A,		return (__m128i) __builtin_ia32_pmovsdw128_mask ((__v4si) __A,
(__v8hi)__O,		(__v8hi)__O,
__M);		__M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_cvtsepi32_epi16 (__mmask8 __M, __m128i __A)		_mm_maskz_cvtsepi32_epi16 (__mmask8 __M, __m128i __A)
{		{
return (__m128i) __builtin_ia32_pmovsdw128_mask ((__v4si) __A,		return (__m128i) __builtin_ia32_pmovsdw128_mask ((__v4si) __A,
(__v8hi) _mm_setzero_si128 (),		(__v8hi) _mm_setzero_si128 (),
__M);		__M);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS128
_mm_mask_cvtsepi32_storeu_epi16 (void * __P, __mmask8 __M, __m128i __A)		_mm_mask_cvtsepi32_storeu_epi16 (void * __P, __mmask8 __M, __m128i __A)
{		{
__builtin_ia32_pmovsdw128mem_mask ((__v8hi *) __P, (__v4si) __A, __M);		__builtin_ia32_pmovsdw128mem_mask ((__v8hi *) __P, (__v4si) __A, __M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS256
_mm256_cvtsepi32_epi16 (__m256i __A)		_mm256_cvtsepi32_epi16 (__m256i __A)
{		{
return (__m128i) __builtin_ia32_pmovsdw256_mask ((__v8si) __A,		return (__m128i) __builtin_ia32_pmovsdw256_mask ((__v8si) __A,
(__v8hi)_mm_undefined_si128(),		(__v8hi)_mm_undefined_si128(),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS256
_mm256_mask_cvtsepi32_epi16 (__m128i __O, __mmask8 __M, __m256i __A)		_mm256_mask_cvtsepi32_epi16 (__m128i __O, __mmask8 __M, __m256i __A)
{		{
return (__m128i) __builtin_ia32_pmovsdw256_mask ((__v8si) __A,		return (__m128i) __builtin_ia32_pmovsdw256_mask ((__v8si) __A,
(__v8hi) __O, __M);		(__v8hi) __O, __M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS256
_mm256_maskz_cvtsepi32_epi16 (__mmask8 __M, __m256i __A)		_mm256_maskz_cvtsepi32_epi16 (__mmask8 __M, __m256i __A)
{		{
return (__m128i) __builtin_ia32_pmovsdw256_mask ((__v8si) __A,		return (__m128i) __builtin_ia32_pmovsdw256_mask ((__v8si) __A,
(__v8hi) _mm_setzero_si128 (),		(__v8hi) _mm_setzero_si128 (),
__M);		__M);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS256
_mm256_mask_cvtsepi32_storeu_epi16 (void * __P, __mmask8 __M, __m256i __A)		_mm256_mask_cvtsepi32_storeu_epi16 (void * __P, __mmask8 __M, __m256i __A)
{		{
__builtin_ia32_pmovsdw256mem_mask ((__v8hi *) __P, (__v8si) __A, __M);		__builtin_ia32_pmovsdw256mem_mask ((__v8hi *) __P, (__v8si) __A, __M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_cvtsepi64_epi8 (__m128i __A)		_mm_cvtsepi64_epi8 (__m128i __A)
{		{
return (__m128i) __builtin_ia32_pmovsqb128_mask ((__v2di) __A,		return (__m128i) __builtin_ia32_pmovsqb128_mask ((__v2di) __A,
(__v16qi)_mm_undefined_si128(),		(__v16qi)_mm_undefined_si128(),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_cvtsepi64_epi8 (__m128i __O, __mmask8 __M, __m128i __A)		_mm_mask_cvtsepi64_epi8 (__m128i __O, __mmask8 __M, __m128i __A)
{		{
return (__m128i) __builtin_ia32_pmovsqb128_mask ((__v2di) __A,		return (__m128i) __builtin_ia32_pmovsqb128_mask ((__v2di) __A,
(__v16qi) __O, __M);		(__v16qi) __O, __M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_cvtsepi64_epi8 (__mmask8 __M, __m128i __A)		_mm_maskz_cvtsepi64_epi8 (__mmask8 __M, __m128i __A)
{		{
return (__m128i) __builtin_ia32_pmovsqb128_mask ((__v2di) __A,		return (__m128i) __builtin_ia32_pmovsqb128_mask ((__v2di) __A,
(__v16qi) _mm_setzero_si128 (),		(__v16qi) _mm_setzero_si128 (),
__M);		__M);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS128
_mm_mask_cvtsepi64_storeu_epi8 (void * __P, __mmask8 __M, __m128i __A)		_mm_mask_cvtsepi64_storeu_epi8 (void * __P, __mmask8 __M, __m128i __A)
{		{
__builtin_ia32_pmovsqb128mem_mask ((__v16qi *) __P, (__v2di) __A, __M);		__builtin_ia32_pmovsqb128mem_mask ((__v16qi *) __P, (__v2di) __A, __M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS256
_mm256_cvtsepi64_epi8 (__m256i __A)		_mm256_cvtsepi64_epi8 (__m256i __A)
{		{
return (__m128i) __builtin_ia32_pmovsqb256_mask ((__v4di) __A,		return (__m128i) __builtin_ia32_pmovsqb256_mask ((__v4di) __A,
(__v16qi)_mm_undefined_si128(),		(__v16qi)_mm_undefined_si128(),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS256
_mm256_mask_cvtsepi64_epi8 (__m128i __O, __mmask8 __M, __m256i __A)		_mm256_mask_cvtsepi64_epi8 (__m128i __O, __mmask8 __M, __m256i __A)
{		{
return (__m128i) __builtin_ia32_pmovsqb256_mask ((__v4di) __A,		return (__m128i) __builtin_ia32_pmovsqb256_mask ((__v4di) __A,
(__v16qi) __O, __M);		(__v16qi) __O, __M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS256
_mm256_maskz_cvtsepi64_epi8 (__mmask8 __M, __m256i __A)		_mm256_maskz_cvtsepi64_epi8 (__mmask8 __M, __m256i __A)
{		{
return (__m128i) __builtin_ia32_pmovsqb256_mask ((__v4di) __A,		return (__m128i) __builtin_ia32_pmovsqb256_mask ((__v4di) __A,
(__v16qi) _mm_setzero_si128 (),		(__v16qi) _mm_setzero_si128 (),
__M);		__M);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS256
_mm256_mask_cvtsepi64_storeu_epi8 (void * __P, __mmask8 __M, __m256i __A)		_mm256_mask_cvtsepi64_storeu_epi8 (void * __P, __mmask8 __M, __m256i __A)
{		{
__builtin_ia32_pmovsqb256mem_mask ((__v16qi *) __P, (__v4di) __A, __M);		__builtin_ia32_pmovsqb256mem_mask ((__v16qi *) __P, (__v4di) __A, __M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_cvtsepi64_epi32 (__m128i __A)		_mm_cvtsepi64_epi32 (__m128i __A)
{		{
return (__m128i) __builtin_ia32_pmovsqd128_mask ((__v2di) __A,		return (__m128i) __builtin_ia32_pmovsqd128_mask ((__v2di) __A,
(__v4si)_mm_undefined_si128(),		(__v4si)_mm_undefined_si128(),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_cvtsepi64_epi32 (__m128i __O, __mmask8 __M, __m128i __A)		_mm_mask_cvtsepi64_epi32 (__m128i __O, __mmask8 __M, __m128i __A)
{		{
return (__m128i) __builtin_ia32_pmovsqd128_mask ((__v2di) __A,		return (__m128i) __builtin_ia32_pmovsqd128_mask ((__v2di) __A,
(__v4si) __O, __M);		(__v4si) __O, __M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_cvtsepi64_epi32 (__mmask8 __M, __m128i __A)		_mm_maskz_cvtsepi64_epi32 (__mmask8 __M, __m128i __A)
{		{
return (__m128i) __builtin_ia32_pmovsqd128_mask ((__v2di) __A,		return (__m128i) __builtin_ia32_pmovsqd128_mask ((__v2di) __A,
(__v4si) _mm_setzero_si128 (),		(__v4si) _mm_setzero_si128 (),
__M);		__M);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS128
_mm_mask_cvtsepi64_storeu_epi32 (void * __P, __mmask8 __M, __m128i __A)		_mm_mask_cvtsepi64_storeu_epi32 (void * __P, __mmask8 __M, __m128i __A)
{		{
__builtin_ia32_pmovsqd128mem_mask ((__v4si *) __P, (__v2di) __A, __M);		__builtin_ia32_pmovsqd128mem_mask ((__v4si *) __P, (__v2di) __A, __M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS256
_mm256_cvtsepi64_epi32 (__m256i __A)		_mm256_cvtsepi64_epi32 (__m256i __A)
{		{
return (__m128i) __builtin_ia32_pmovsqd256_mask ((__v4di) __A,		return (__m128i) __builtin_ia32_pmovsqd256_mask ((__v4di) __A,
(__v4si)_mm_undefined_si128(),		(__v4si)_mm_undefined_si128(),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS256
_mm256_mask_cvtsepi64_epi32 (__m128i __O, __mmask8 __M, __m256i __A)		_mm256_mask_cvtsepi64_epi32 (__m128i __O, __mmask8 __M, __m256i __A)
{		{
return (__m128i) __builtin_ia32_pmovsqd256_mask ((__v4di) __A,		return (__m128i) __builtin_ia32_pmovsqd256_mask ((__v4di) __A,
(__v4si)__O,		(__v4si)__O,
__M);		__M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS256
_mm256_maskz_cvtsepi64_epi32 (__mmask8 __M, __m256i __A)		_mm256_maskz_cvtsepi64_epi32 (__mmask8 __M, __m256i __A)
{		{
return (__m128i) __builtin_ia32_pmovsqd256_mask ((__v4di) __A,		return (__m128i) __builtin_ia32_pmovsqd256_mask ((__v4di) __A,
(__v4si) _mm_setzero_si128 (),		(__v4si) _mm_setzero_si128 (),
__M);		__M);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS256
_mm256_mask_cvtsepi64_storeu_epi32 (void * __P, __mmask8 __M, __m256i __A)		_mm256_mask_cvtsepi64_storeu_epi32 (void * __P, __mmask8 __M, __m256i __A)
{		{
__builtin_ia32_pmovsqd256mem_mask ((__v4si *) __P, (__v4di) __A, __M);		__builtin_ia32_pmovsqd256mem_mask ((__v4si *) __P, (__v4di) __A, __M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_cvtsepi64_epi16 (__m128i __A)		_mm_cvtsepi64_epi16 (__m128i __A)
{		{
return (__m128i) __builtin_ia32_pmovsqw128_mask ((__v2di) __A,		return (__m128i) __builtin_ia32_pmovsqw128_mask ((__v2di) __A,
(__v8hi)_mm_undefined_si128(),		(__v8hi)_mm_undefined_si128(),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_cvtsepi64_epi16 (__m128i __O, __mmask8 __M, __m128i __A)		_mm_mask_cvtsepi64_epi16 (__m128i __O, __mmask8 __M, __m128i __A)
{		{
return (__m128i) __builtin_ia32_pmovsqw128_mask ((__v2di) __A,		return (__m128i) __builtin_ia32_pmovsqw128_mask ((__v2di) __A,
(__v8hi) __O, __M);		(__v8hi) __O, __M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_cvtsepi64_epi16 (__mmask8 __M, __m128i __A)		_mm_maskz_cvtsepi64_epi16 (__mmask8 __M, __m128i __A)
{		{
return (__m128i) __builtin_ia32_pmovsqw128_mask ((__v2di) __A,		return (__m128i) __builtin_ia32_pmovsqw128_mask ((__v2di) __A,
(__v8hi) _mm_setzero_si128 (),		(__v8hi) _mm_setzero_si128 (),
__M);		__M);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS128
_mm_mask_cvtsepi64_storeu_epi16 (void * __P, __mmask8 __M, __m128i __A)		_mm_mask_cvtsepi64_storeu_epi16 (void * __P, __mmask8 __M, __m128i __A)
{		{
__builtin_ia32_pmovsqw128mem_mask ((__v8hi *) __P, (__v2di) __A, __M);		__builtin_ia32_pmovsqw128mem_mask ((__v8hi *) __P, (__v2di) __A, __M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS256
_mm256_cvtsepi64_epi16 (__m256i __A)		_mm256_cvtsepi64_epi16 (__m256i __A)
{		{
return (__m128i) __builtin_ia32_pmovsqw256_mask ((__v4di) __A,		return (__m128i) __builtin_ia32_pmovsqw256_mask ((__v4di) __A,
(__v8hi)_mm_undefined_si128(),		(__v8hi)_mm_undefined_si128(),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS256
_mm256_mask_cvtsepi64_epi16 (__m128i __O, __mmask8 __M, __m256i __A)		_mm256_mask_cvtsepi64_epi16 (__m128i __O, __mmask8 __M, __m256i __A)
{		{
return (__m128i) __builtin_ia32_pmovsqw256_mask ((__v4di) __A,		return (__m128i) __builtin_ia32_pmovsqw256_mask ((__v4di) __A,
(__v8hi) __O, __M);		(__v8hi) __O, __M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS256
_mm256_maskz_cvtsepi64_epi16 (__mmask8 __M, __m256i __A)		_mm256_maskz_cvtsepi64_epi16 (__mmask8 __M, __m256i __A)
{		{
return (__m128i) __builtin_ia32_pmovsqw256_mask ((__v4di) __A,		return (__m128i) __builtin_ia32_pmovsqw256_mask ((__v4di) __A,
(__v8hi) _mm_setzero_si128 (),		(__v8hi) _mm_setzero_si128 (),
__M);		__M);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS256
_mm256_mask_cvtsepi64_storeu_epi16 (void * __P, __mmask8 __M, __m256i __A)		_mm256_mask_cvtsepi64_storeu_epi16 (void * __P, __mmask8 __M, __m256i __A)
{		{
__builtin_ia32_pmovsqw256mem_mask ((__v8hi *) __P, (__v4di) __A, __M);		__builtin_ia32_pmovsqw256mem_mask ((__v8hi *) __P, (__v4di) __A, __M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_cvtusepi32_epi8 (__m128i __A)		_mm_cvtusepi32_epi8 (__m128i __A)
{		{
return (__m128i) __builtin_ia32_pmovusdb128_mask ((__v4si) __A,		return (__m128i) __builtin_ia32_pmovusdb128_mask ((__v4si) __A,
(__v16qi)_mm_undefined_si128(),		(__v16qi)_mm_undefined_si128(),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_cvtusepi32_epi8 (__m128i __O, __mmask8 __M, __m128i __A)		_mm_mask_cvtusepi32_epi8 (__m128i __O, __mmask8 __M, __m128i __A)
{		{
return (__m128i) __builtin_ia32_pmovusdb128_mask ((__v4si) __A,		return (__m128i) __builtin_ia32_pmovusdb128_mask ((__v4si) __A,
(__v16qi) __O,		(__v16qi) __O,
__M);		__M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_cvtusepi32_epi8 (__mmask8 __M, __m128i __A)		_mm_maskz_cvtusepi32_epi8 (__mmask8 __M, __m128i __A)
{		{
return (__m128i) __builtin_ia32_pmovusdb128_mask ((__v4si) __A,		return (__m128i) __builtin_ia32_pmovusdb128_mask ((__v4si) __A,
(__v16qi) _mm_setzero_si128 (),		(__v16qi) _mm_setzero_si128 (),
__M);		__M);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS128
_mm_mask_cvtusepi32_storeu_epi8 (void * __P, __mmask8 __M, __m128i __A)		_mm_mask_cvtusepi32_storeu_epi8 (void * __P, __mmask8 __M, __m128i __A)
{		{
__builtin_ia32_pmovusdb128mem_mask ((__v16qi *) __P, (__v4si) __A, __M);		__builtin_ia32_pmovusdb128mem_mask ((__v16qi *) __P, (__v4si) __A, __M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS256
_mm256_cvtusepi32_epi8 (__m256i __A)		_mm256_cvtusepi32_epi8 (__m256i __A)
{		{
return (__m128i) __builtin_ia32_pmovusdb256_mask ((__v8si) __A,		return (__m128i) __builtin_ia32_pmovusdb256_mask ((__v8si) __A,
(__v16qi)_mm_undefined_si128(),		(__v16qi)_mm_undefined_si128(),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS256
_mm256_mask_cvtusepi32_epi8 (__m128i __O, __mmask8 __M, __m256i __A)		_mm256_mask_cvtusepi32_epi8 (__m128i __O, __mmask8 __M, __m256i __A)
{		{
return (__m128i) __builtin_ia32_pmovusdb256_mask ((__v8si) __A,		return (__m128i) __builtin_ia32_pmovusdb256_mask ((__v8si) __A,
(__v16qi) __O,		(__v16qi) __O,
__M);		__M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS256
_mm256_maskz_cvtusepi32_epi8 (__mmask8 __M, __m256i __A)		_mm256_maskz_cvtusepi32_epi8 (__mmask8 __M, __m256i __A)
{		{
return (__m128i) __builtin_ia32_pmovusdb256_mask ((__v8si) __A,		return (__m128i) __builtin_ia32_pmovusdb256_mask ((__v8si) __A,
(__v16qi) _mm_setzero_si128 (),		(__v16qi) _mm_setzero_si128 (),
__M);		__M);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS256
_mm256_mask_cvtusepi32_storeu_epi8 (void * __P, __mmask8 __M, __m256i __A)		_mm256_mask_cvtusepi32_storeu_epi8 (void * __P, __mmask8 __M, __m256i __A)
{		{
__builtin_ia32_pmovusdb256mem_mask ((__v16qi*) __P, (__v8si) __A, __M);		__builtin_ia32_pmovusdb256mem_mask ((__v16qi*) __P, (__v8si) __A, __M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_cvtusepi32_epi16 (__m128i __A)		_mm_cvtusepi32_epi16 (__m128i __A)
{		{
return (__m128i) __builtin_ia32_pmovusdw128_mask ((__v4si) __A,		return (__m128i) __builtin_ia32_pmovusdw128_mask ((__v4si) __A,
(__v8hi)_mm_undefined_si128(),		(__v8hi)_mm_undefined_si128(),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_cvtusepi32_epi16 (__m128i __O, __mmask8 __M, __m128i __A)		_mm_mask_cvtusepi32_epi16 (__m128i __O, __mmask8 __M, __m128i __A)
{		{
return (__m128i) __builtin_ia32_pmovusdw128_mask ((__v4si) __A,		return (__m128i) __builtin_ia32_pmovusdw128_mask ((__v4si) __A,
(__v8hi) __O, __M);		(__v8hi) __O, __M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_cvtusepi32_epi16 (__mmask8 __M, __m128i __A)		_mm_maskz_cvtusepi32_epi16 (__mmask8 __M, __m128i __A)
{		{
return (__m128i) __builtin_ia32_pmovusdw128_mask ((__v4si) __A,		return (__m128i) __builtin_ia32_pmovusdw128_mask ((__v4si) __A,
(__v8hi) _mm_setzero_si128 (),		(__v8hi) _mm_setzero_si128 (),
__M);		__M);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS128
_mm_mask_cvtusepi32_storeu_epi16 (void * __P, __mmask8 __M, __m128i __A)		_mm_mask_cvtusepi32_storeu_epi16 (void * __P, __mmask8 __M, __m128i __A)
{		{
__builtin_ia32_pmovusdw128mem_mask ((__v8hi *) __P, (__v4si) __A, __M);		__builtin_ia32_pmovusdw128mem_mask ((__v8hi *) __P, (__v4si) __A, __M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS256
_mm256_cvtusepi32_epi16 (__m256i __A)		_mm256_cvtusepi32_epi16 (__m256i __A)
{		{
return (__m128i) __builtin_ia32_pmovusdw256_mask ((__v8si) __A,		return (__m128i) __builtin_ia32_pmovusdw256_mask ((__v8si) __A,
(__v8hi) _mm_undefined_si128(),		(__v8hi) _mm_undefined_si128(),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS256
_mm256_mask_cvtusepi32_epi16 (__m128i __O, __mmask8 __M, __m256i __A)		_mm256_mask_cvtusepi32_epi16 (__m128i __O, __mmask8 __M, __m256i __A)
{		{
return (__m128i) __builtin_ia32_pmovusdw256_mask ((__v8si) __A,		return (__m128i) __builtin_ia32_pmovusdw256_mask ((__v8si) __A,
(__v8hi) __O, __M);		(__v8hi) __O, __M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS256
_mm256_maskz_cvtusepi32_epi16 (__mmask8 __M, __m256i __A)		_mm256_maskz_cvtusepi32_epi16 (__mmask8 __M, __m256i __A)
{		{
return (__m128i) __builtin_ia32_pmovusdw256_mask ((__v8si) __A,		return (__m128i) __builtin_ia32_pmovusdw256_mask ((__v8si) __A,
(__v8hi) _mm_setzero_si128 (),		(__v8hi) _mm_setzero_si128 (),
__M);		__M);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS256
_mm256_mask_cvtusepi32_storeu_epi16 (void * __P, __mmask8 __M, __m256i __A)		_mm256_mask_cvtusepi32_storeu_epi16 (void * __P, __mmask8 __M, __m256i __A)
{		{
__builtin_ia32_pmovusdw256mem_mask ((__v8hi *) __P, (__v8si) __A, __M);		__builtin_ia32_pmovusdw256mem_mask ((__v8hi *) __P, (__v8si) __A, __M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_cvtusepi64_epi8 (__m128i __A)		_mm_cvtusepi64_epi8 (__m128i __A)
{		{
return (__m128i) __builtin_ia32_pmovusqb128_mask ((__v2di) __A,		return (__m128i) __builtin_ia32_pmovusqb128_mask ((__v2di) __A,
(__v16qi)_mm_undefined_si128(),		(__v16qi)_mm_undefined_si128(),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_cvtusepi64_epi8 (__m128i __O, __mmask8 __M, __m128i __A)		_mm_mask_cvtusepi64_epi8 (__m128i __O, __mmask8 __M, __m128i __A)
{		{
return (__m128i) __builtin_ia32_pmovusqb128_mask ((__v2di) __A,		return (__m128i) __builtin_ia32_pmovusqb128_mask ((__v2di) __A,
(__v16qi) __O,		(__v16qi) __O,
__M);		__M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_cvtusepi64_epi8 (__mmask8 __M, __m128i __A)		_mm_maskz_cvtusepi64_epi8 (__mmask8 __M, __m128i __A)
{		{
return (__m128i) __builtin_ia32_pmovusqb128_mask ((__v2di) __A,		return (__m128i) __builtin_ia32_pmovusqb128_mask ((__v2di) __A,
(__v16qi) _mm_setzero_si128 (),		(__v16qi) _mm_setzero_si128 (),
__M);		__M);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS128
_mm_mask_cvtusepi64_storeu_epi8 (void * __P, __mmask8 __M, __m128i __A)		_mm_mask_cvtusepi64_storeu_epi8 (void * __P, __mmask8 __M, __m128i __A)
{		{
__builtin_ia32_pmovusqb128mem_mask ((__v16qi *) __P, (__v2di) __A, __M);		__builtin_ia32_pmovusqb128mem_mask ((__v16qi *) __P, (__v2di) __A, __M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS256
_mm256_cvtusepi64_epi8 (__m256i __A)		_mm256_cvtusepi64_epi8 (__m256i __A)
{		{
return (__m128i) __builtin_ia32_pmovusqb256_mask ((__v4di) __A,		return (__m128i) __builtin_ia32_pmovusqb256_mask ((__v4di) __A,
(__v16qi)_mm_undefined_si128(),		(__v16qi)_mm_undefined_si128(),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS256
_mm256_mask_cvtusepi64_epi8 (__m128i __O, __mmask8 __M, __m256i __A)		_mm256_mask_cvtusepi64_epi8 (__m128i __O, __mmask8 __M, __m256i __A)
{		{
return (__m128i) __builtin_ia32_pmovusqb256_mask ((__v4di) __A,		return (__m128i) __builtin_ia32_pmovusqb256_mask ((__v4di) __A,
(__v16qi) __O,		(__v16qi) __O,
__M);		__M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS256
_mm256_maskz_cvtusepi64_epi8 (__mmask8 __M, __m256i __A)		_mm256_maskz_cvtusepi64_epi8 (__mmask8 __M, __m256i __A)
{		{
return (__m128i) __builtin_ia32_pmovusqb256_mask ((__v4di) __A,		return (__m128i) __builtin_ia32_pmovusqb256_mask ((__v4di) __A,
(__v16qi) _mm_setzero_si128 (),		(__v16qi) _mm_setzero_si128 (),
__M);		__M);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS256
_mm256_mask_cvtusepi64_storeu_epi8 (void * __P, __mmask8 __M, __m256i __A)		_mm256_mask_cvtusepi64_storeu_epi8 (void * __P, __mmask8 __M, __m256i __A)
{		{
__builtin_ia32_pmovusqb256mem_mask ((__v16qi *) __P, (__v4di) __A, __M);		__builtin_ia32_pmovusqb256mem_mask ((__v16qi *) __P, (__v4di) __A, __M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_cvtusepi64_epi32 (__m128i __A)		_mm_cvtusepi64_epi32 (__m128i __A)
{		{
return (__m128i) __builtin_ia32_pmovusqd128_mask ((__v2di) __A,		return (__m128i) __builtin_ia32_pmovusqd128_mask ((__v2di) __A,
(__v4si)_mm_undefined_si128(),		(__v4si)_mm_undefined_si128(),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_cvtusepi64_epi32 (__m128i __O, __mmask8 __M, __m128i __A)		_mm_mask_cvtusepi64_epi32 (__m128i __O, __mmask8 __M, __m128i __A)
{		{
return (__m128i) __builtin_ia32_pmovusqd128_mask ((__v2di) __A,		return (__m128i) __builtin_ia32_pmovusqd128_mask ((__v2di) __A,
(__v4si) __O, __M);		(__v4si) __O, __M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_cvtusepi64_epi32 (__mmask8 __M, __m128i __A)		_mm_maskz_cvtusepi64_epi32 (__mmask8 __M, __m128i __A)
{		{
return (__m128i) __builtin_ia32_pmovusqd128_mask ((__v2di) __A,		return (__m128i) __builtin_ia32_pmovusqd128_mask ((__v2di) __A,
(__v4si) _mm_setzero_si128 (),		(__v4si) _mm_setzero_si128 (),
__M);		__M);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS128
_mm_mask_cvtusepi64_storeu_epi32 (void * __P, __mmask8 __M, __m128i __A)		_mm_mask_cvtusepi64_storeu_epi32 (void * __P, __mmask8 __M, __m128i __A)
{		{
__builtin_ia32_pmovusqd128mem_mask ((__v4si *) __P, (__v2di) __A, __M);		__builtin_ia32_pmovusqd128mem_mask ((__v4si *) __P, (__v2di) __A, __M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS256
_mm256_cvtusepi64_epi32 (__m256i __A)		_mm256_cvtusepi64_epi32 (__m256i __A)
{		{
return (__m128i) __builtin_ia32_pmovusqd256_mask ((__v4di) __A,		return (__m128i) __builtin_ia32_pmovusqd256_mask ((__v4di) __A,
(__v4si)_mm_undefined_si128(),		(__v4si)_mm_undefined_si128(),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS256
_mm256_mask_cvtusepi64_epi32 (__m128i __O, __mmask8 __M, __m256i __A)		_mm256_mask_cvtusepi64_epi32 (__m128i __O, __mmask8 __M, __m256i __A)
{		{
return (__m128i) __builtin_ia32_pmovusqd256_mask ((__v4di) __A,		return (__m128i) __builtin_ia32_pmovusqd256_mask ((__v4di) __A,
(__v4si) __O, __M);		(__v4si) __O, __M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS256
_mm256_maskz_cvtusepi64_epi32 (__mmask8 __M, __m256i __A)		_mm256_maskz_cvtusepi64_epi32 (__mmask8 __M, __m256i __A)
{		{
return (__m128i) __builtin_ia32_pmovusqd256_mask ((__v4di) __A,		return (__m128i) __builtin_ia32_pmovusqd256_mask ((__v4di) __A,
(__v4si) _mm_setzero_si128 (),		(__v4si) _mm_setzero_si128 (),
__M);		__M);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS256
_mm256_mask_cvtusepi64_storeu_epi32 (void * __P, __mmask8 __M, __m256i __A)		_mm256_mask_cvtusepi64_storeu_epi32 (void * __P, __mmask8 __M, __m256i __A)
{		{
__builtin_ia32_pmovusqd256mem_mask ((__v4si *) __P, (__v4di) __A, __M);		__builtin_ia32_pmovusqd256mem_mask ((__v4si *) __P, (__v4di) __A, __M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_cvtusepi64_epi16 (__m128i __A)		_mm_cvtusepi64_epi16 (__m128i __A)
{		{
return (__m128i) __builtin_ia32_pmovusqw128_mask ((__v2di) __A,		return (__m128i) __builtin_ia32_pmovusqw128_mask ((__v2di) __A,
(__v8hi)_mm_undefined_si128(),		(__v8hi)_mm_undefined_si128(),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_cvtusepi64_epi16 (__m128i __O, __mmask8 __M, __m128i __A)		_mm_mask_cvtusepi64_epi16 (__m128i __O, __mmask8 __M, __m128i __A)
{		{
return (__m128i) __builtin_ia32_pmovusqw128_mask ((__v2di) __A,		return (__m128i) __builtin_ia32_pmovusqw128_mask ((__v2di) __A,
(__v8hi) __O, __M);		(__v8hi) __O, __M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_cvtusepi64_epi16 (__mmask8 __M, __m128i __A)		_mm_maskz_cvtusepi64_epi16 (__mmask8 __M, __m128i __A)
{		{
return (__m128i) __builtin_ia32_pmovusqw128_mask ((__v2di) __A,		return (__m128i) __builtin_ia32_pmovusqw128_mask ((__v2di) __A,
(__v8hi) _mm_setzero_si128 (),		(__v8hi) _mm_setzero_si128 (),
__M);		__M);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS128
_mm_mask_cvtusepi64_storeu_epi16 (void * __P, __mmask8 __M, __m128i __A)		_mm_mask_cvtusepi64_storeu_epi16 (void * __P, __mmask8 __M, __m128i __A)
{		{
__builtin_ia32_pmovusqw128mem_mask ((__v8hi *) __P, (__v2di) __A, __M);		__builtin_ia32_pmovusqw128mem_mask ((__v8hi *) __P, (__v2di) __A, __M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS256
_mm256_cvtusepi64_epi16 (__m256i __A)		_mm256_cvtusepi64_epi16 (__m256i __A)
{		{
return (__m128i) __builtin_ia32_pmovusqw256_mask ((__v4di) __A,		return (__m128i) __builtin_ia32_pmovusqw256_mask ((__v4di) __A,
(__v8hi)_mm_undefined_si128(),		(__v8hi)_mm_undefined_si128(),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS256
_mm256_mask_cvtusepi64_epi16 (__m128i __O, __mmask8 __M, __m256i __A)		_mm256_mask_cvtusepi64_epi16 (__m128i __O, __mmask8 __M, __m256i __A)
{		{
return (__m128i) __builtin_ia32_pmovusqw256_mask ((__v4di) __A,		return (__m128i) __builtin_ia32_pmovusqw256_mask ((__v4di) __A,
(__v8hi) __O, __M);		(__v8hi) __O, __M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS256
_mm256_maskz_cvtusepi64_epi16 (__mmask8 __M, __m256i __A)		_mm256_maskz_cvtusepi64_epi16 (__mmask8 __M, __m256i __A)
{		{
return (__m128i) __builtin_ia32_pmovusqw256_mask ((__v4di) __A,		return (__m128i) __builtin_ia32_pmovusqw256_mask ((__v4di) __A,
(__v8hi) _mm_setzero_si128 (),		(__v8hi) _mm_setzero_si128 (),
__M);		__M);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS256
_mm256_mask_cvtusepi64_storeu_epi16 (void * __P, __mmask8 __M, __m256i __A)		_mm256_mask_cvtusepi64_storeu_epi16 (void * __P, __mmask8 __M, __m256i __A)
{		{
__builtin_ia32_pmovusqw256mem_mask ((__v8hi *) __P, (__v4di) __A, __M);		__builtin_ia32_pmovusqw256mem_mask ((__v8hi *) __P, (__v4di) __A, __M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_cvtepi32_epi8 (__m128i __A)		_mm_cvtepi32_epi8 (__m128i __A)
{		{
return (__m128i) __builtin_ia32_pmovdb128_mask ((__v4si) __A,		return (__m128i) __builtin_ia32_pmovdb128_mask ((__v4si) __A,
(__v16qi)_mm_undefined_si128(),		(__v16qi)_mm_undefined_si128(),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_cvtepi32_epi8 (__m128i __O, __mmask8 __M, __m128i __A)		_mm_mask_cvtepi32_epi8 (__m128i __O, __mmask8 __M, __m128i __A)
{		{
return (__m128i) __builtin_ia32_pmovdb128_mask ((__v4si) __A,		return (__m128i) __builtin_ia32_pmovdb128_mask ((__v4si) __A,
(__v16qi) __O, __M);		(__v16qi) __O, __M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_cvtepi32_epi8 (__mmask8 __M, __m128i __A)		_mm_maskz_cvtepi32_epi8 (__mmask8 __M, __m128i __A)
{		{
return (__m128i) __builtin_ia32_pmovdb128_mask ((__v4si) __A,		return (__m128i) __builtin_ia32_pmovdb128_mask ((__v4si) __A,
(__v16qi)		(__v16qi)
_mm_setzero_si128 (),		_mm_setzero_si128 (),
__M);		__M);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS128
_mm_mask_cvtepi32_storeu_epi8 (void * __P, __mmask8 __M, __m128i __A)		_mm_mask_cvtepi32_storeu_epi8 (void * __P, __mmask8 __M, __m128i __A)
{		{
__builtin_ia32_pmovdb128mem_mask ((__v16qi *) __P, (__v4si) __A, __M);		__builtin_ia32_pmovdb128mem_mask ((__v16qi *) __P, (__v4si) __A, __M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS256
_mm256_cvtepi32_epi8 (__m256i __A)		_mm256_cvtepi32_epi8 (__m256i __A)
{		{
return (__m128i) __builtin_ia32_pmovdb256_mask ((__v8si) __A,		return (__m128i) __builtin_ia32_pmovdb256_mask ((__v8si) __A,
(__v16qi)_mm_undefined_si128(),		(__v16qi)_mm_undefined_si128(),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS256
_mm256_mask_cvtepi32_epi8 (__m128i __O, __mmask8 __M, __m256i __A)		_mm256_mask_cvtepi32_epi8 (__m128i __O, __mmask8 __M, __m256i __A)
{		{
return (__m128i) __builtin_ia32_pmovdb256_mask ((__v8si) __A,		return (__m128i) __builtin_ia32_pmovdb256_mask ((__v8si) __A,
(__v16qi) __O, __M);		(__v16qi) __O, __M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS256
_mm256_maskz_cvtepi32_epi8 (__mmask8 __M, __m256i __A)		_mm256_maskz_cvtepi32_epi8 (__mmask8 __M, __m256i __A)
{		{
return (__m128i) __builtin_ia32_pmovdb256_mask ((__v8si) __A,		return (__m128i) __builtin_ia32_pmovdb256_mask ((__v8si) __A,
(__v16qi) _mm_setzero_si128 (),		(__v16qi) _mm_setzero_si128 (),
__M);		__M);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS256
_mm256_mask_cvtepi32_storeu_epi8 (void * __P, __mmask8 __M, __m256i __A)		_mm256_mask_cvtepi32_storeu_epi8 (void * __P, __mmask8 __M, __m256i __A)
{		{
__builtin_ia32_pmovdb256mem_mask ((__v16qi *) __P, (__v8si) __A, __M);		__builtin_ia32_pmovdb256mem_mask ((__v16qi *) __P, (__v8si) __A, __M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_cvtepi32_epi16 (__m128i __A)		_mm_cvtepi32_epi16 (__m128i __A)
{		{
return (__m128i) __builtin_ia32_pmovdw128_mask ((__v4si) __A,		return (__m128i) __builtin_ia32_pmovdw128_mask ((__v4si) __A,
(__v8hi) _mm_setzero_si128 (),		(__v8hi) _mm_setzero_si128 (),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_cvtepi32_epi16 (__m128i __O, __mmask8 __M, __m128i __A)		_mm_mask_cvtepi32_epi16 (__m128i __O, __mmask8 __M, __m128i __A)
{		{
return (__m128i) __builtin_ia32_pmovdw128_mask ((__v4si) __A,		return (__m128i) __builtin_ia32_pmovdw128_mask ((__v4si) __A,
(__v8hi) __O, __M);		(__v8hi) __O, __M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_cvtepi32_epi16 (__mmask8 __M, __m128i __A)		_mm_maskz_cvtepi32_epi16 (__mmask8 __M, __m128i __A)
{		{
return (__m128i) __builtin_ia32_pmovdw128_mask ((__v4si) __A,		return (__m128i) __builtin_ia32_pmovdw128_mask ((__v4si) __A,
(__v8hi) _mm_setzero_si128 (),		(__v8hi) _mm_setzero_si128 (),
__M);		__M);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS128
_mm_mask_cvtepi32_storeu_epi16 (void * __P, __mmask8 __M, __m128i __A)		_mm_mask_cvtepi32_storeu_epi16 (void * __P, __mmask8 __M, __m128i __A)
{		{
__builtin_ia32_pmovdw128mem_mask ((__v8hi *) __P, (__v4si) __A, __M);		__builtin_ia32_pmovdw128mem_mask ((__v8hi *) __P, (__v4si) __A, __M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS256
_mm256_cvtepi32_epi16 (__m256i __A)		_mm256_cvtepi32_epi16 (__m256i __A)
{		{
return (__m128i)__builtin_convertvector((__v8si)__A, __v8hi);		return (__m128i)__builtin_convertvector((__v8si)__A, __v8hi);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS256
_mm256_mask_cvtepi32_epi16 (__m128i __O, __mmask8 __M, __m256i __A)		_mm256_mask_cvtepi32_epi16 (__m128i __O, __mmask8 __M, __m256i __A)
{		{
return (__m128i) __builtin_ia32_pmovdw256_mask ((__v8si) __A,		return (__m128i) __builtin_ia32_pmovdw256_mask ((__v8si) __A,
(__v8hi) __O, __M);		(__v8hi) __O, __M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS256
_mm256_maskz_cvtepi32_epi16 (__mmask8 __M, __m256i __A)		_mm256_maskz_cvtepi32_epi16 (__mmask8 __M, __m256i __A)
{		{
return (__m128i) __builtin_ia32_pmovdw256_mask ((__v8si) __A,		return (__m128i) __builtin_ia32_pmovdw256_mask ((__v8si) __A,
(__v8hi) _mm_setzero_si128 (),		(__v8hi) _mm_setzero_si128 (),
__M);		__M);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS256
_mm256_mask_cvtepi32_storeu_epi16 (void * __P, __mmask8 __M, __m256i __A)		_mm256_mask_cvtepi32_storeu_epi16 (void * __P, __mmask8 __M, __m256i __A)
{		{
__builtin_ia32_pmovdw256mem_mask ((__v8hi *) __P, (__v8si) __A, __M);		__builtin_ia32_pmovdw256mem_mask ((__v8hi *) __P, (__v8si) __A, __M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_cvtepi64_epi8 (__m128i __A)		_mm_cvtepi64_epi8 (__m128i __A)
{		{
return (__m128i) __builtin_ia32_pmovqb128_mask ((__v2di) __A,		return (__m128i) __builtin_ia32_pmovqb128_mask ((__v2di) __A,
(__v16qi) _mm_undefined_si128(),		(__v16qi) _mm_undefined_si128(),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_cvtepi64_epi8 (__m128i __O, __mmask8 __M, __m128i __A)		_mm_mask_cvtepi64_epi8 (__m128i __O, __mmask8 __M, __m128i __A)
{		{
return (__m128i) __builtin_ia32_pmovqb128_mask ((__v2di) __A,		return (__m128i) __builtin_ia32_pmovqb128_mask ((__v2di) __A,
(__v16qi) __O, __M);		(__v16qi) __O, __M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_cvtepi64_epi8 (__mmask8 __M, __m128i __A)		_mm_maskz_cvtepi64_epi8 (__mmask8 __M, __m128i __A)
{		{
return (__m128i) __builtin_ia32_pmovqb128_mask ((__v2di) __A,		return (__m128i) __builtin_ia32_pmovqb128_mask ((__v2di) __A,
(__v16qi) _mm_setzero_si128 (),		(__v16qi) _mm_setzero_si128 (),
__M);		__M);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS128
_mm_mask_cvtepi64_storeu_epi8 (void * __P, __mmask8 __M, __m128i __A)		_mm_mask_cvtepi64_storeu_epi8 (void * __P, __mmask8 __M, __m128i __A)
{		{
__builtin_ia32_pmovqb128mem_mask ((__v16qi *) __P, (__v2di) __A, __M);		__builtin_ia32_pmovqb128mem_mask ((__v16qi *) __P, (__v2di) __A, __M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS256
_mm256_cvtepi64_epi8 (__m256i __A)		_mm256_cvtepi64_epi8 (__m256i __A)
{		{
return (__m128i) __builtin_ia32_pmovqb256_mask ((__v4di) __A,		return (__m128i) __builtin_ia32_pmovqb256_mask ((__v4di) __A,
(__v16qi) _mm_undefined_si128(),		(__v16qi) _mm_undefined_si128(),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS256
_mm256_mask_cvtepi64_epi8 (__m128i __O, __mmask8 __M, __m256i __A)		_mm256_mask_cvtepi64_epi8 (__m128i __O, __mmask8 __M, __m256i __A)
{		{
return (__m128i) __builtin_ia32_pmovqb256_mask ((__v4di) __A,		return (__m128i) __builtin_ia32_pmovqb256_mask ((__v4di) __A,
(__v16qi) __O, __M);		(__v16qi) __O, __M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS256
_mm256_maskz_cvtepi64_epi8 (__mmask8 __M, __m256i __A)		_mm256_maskz_cvtepi64_epi8 (__mmask8 __M, __m256i __A)
{		{
return (__m128i) __builtin_ia32_pmovqb256_mask ((__v4di) __A,		return (__m128i) __builtin_ia32_pmovqb256_mask ((__v4di) __A,
(__v16qi) _mm_setzero_si128 (),		(__v16qi) _mm_setzero_si128 (),
__M);		__M);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS256
_mm256_mask_cvtepi64_storeu_epi8 (void * __P, __mmask8 __M, __m256i __A)		_mm256_mask_cvtepi64_storeu_epi8 (void * __P, __mmask8 __M, __m256i __A)
{		{
__builtin_ia32_pmovqb256mem_mask ((__v16qi *) __P, (__v4di) __A, __M);		__builtin_ia32_pmovqb256mem_mask ((__v16qi *) __P, (__v4di) __A, __M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_cvtepi64_epi32 (__m128i __A)		_mm_cvtepi64_epi32 (__m128i __A)
{		{
return (__m128i) __builtin_ia32_pmovqd128_mask ((__v2di) __A,		return (__m128i) __builtin_ia32_pmovqd128_mask ((__v2di) __A,
(__v4si)_mm_undefined_si128(),		(__v4si)_mm_undefined_si128(),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_cvtepi64_epi32 (__m128i __O, __mmask8 __M, __m128i __A)		_mm_mask_cvtepi64_epi32 (__m128i __O, __mmask8 __M, __m128i __A)
{		{
return (__m128i) __builtin_ia32_pmovqd128_mask ((__v2di) __A,		return (__m128i) __builtin_ia32_pmovqd128_mask ((__v2di) __A,
(__v4si) __O, __M);		(__v4si) __O, __M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_cvtepi64_epi32 (__mmask8 __M, __m128i __A)		_mm_maskz_cvtepi64_epi32 (__mmask8 __M, __m128i __A)
{		{
return (__m128i) __builtin_ia32_pmovqd128_mask ((__v2di) __A,		return (__m128i) __builtin_ia32_pmovqd128_mask ((__v2di) __A,
(__v4si) _mm_setzero_si128 (),		(__v4si) _mm_setzero_si128 (),
__M);		__M);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS128
_mm_mask_cvtepi64_storeu_epi32 (void * __P, __mmask8 __M, __m128i __A)		_mm_mask_cvtepi64_storeu_epi32 (void * __P, __mmask8 __M, __m128i __A)
{		{
__builtin_ia32_pmovqd128mem_mask ((__v4si *) __P, (__v2di) __A, __M);		__builtin_ia32_pmovqd128mem_mask ((__v4si *) __P, (__v2di) __A, __M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS256
_mm256_cvtepi64_epi32 (__m256i __A)		_mm256_cvtepi64_epi32 (__m256i __A)
{		{
return (__m128i)__builtin_convertvector((__v4di)__A, __v4si);		return (__m128i)__builtin_convertvector((__v4di)__A, __v4si);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS256
_mm256_mask_cvtepi64_epi32 (__m128i __O, __mmask8 __M, __m256i __A)		_mm256_mask_cvtepi64_epi32 (__m128i __O, __mmask8 __M, __m256i __A)
{		{
return (__m128i)__builtin_ia32_selectd_128((__mmask8)__M,		return (__m128i)__builtin_ia32_selectd_128((__mmask8)__M,
(__v4si)_mm256_cvtepi64_epi32(__A),		(__v4si)_mm256_cvtepi64_epi32(__A),
(__v4si)__O);		(__v4si)__O);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS256
_mm256_maskz_cvtepi64_epi32 (__mmask8 __M, __m256i __A)		_mm256_maskz_cvtepi64_epi32 (__mmask8 __M, __m256i __A)
{		{
return (__m128i)__builtin_ia32_selectd_128((__mmask8)__M,		return (__m128i)__builtin_ia32_selectd_128((__mmask8)__M,
(__v4si)_mm256_cvtepi64_epi32(__A),		(__v4si)_mm256_cvtepi64_epi32(__A),
(__v4si)_mm_setzero_si128());		(__v4si)_mm_setzero_si128());
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS256
_mm256_mask_cvtepi64_storeu_epi32 (void * __P, __mmask8 __M, __m256i __A)		_mm256_mask_cvtepi64_storeu_epi32 (void * __P, __mmask8 __M, __m256i __A)
{		{
__builtin_ia32_pmovqd256mem_mask ((__v4si *) __P, (__v4di) __A, __M);		__builtin_ia32_pmovqd256mem_mask ((__v4si *) __P, (__v4di) __A, __M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS256
_mm_cvtepi64_epi16 (__m128i __A)		_mm_cvtepi64_epi16 (__m128i __A)
{		{
return (__m128i) __builtin_ia32_pmovqw128_mask ((__v2di) __A,		return (__m128i) __builtin_ia32_pmovqw128_mask ((__v2di) __A,
(__v8hi) _mm_undefined_si128(),		(__v8hi) _mm_undefined_si128(),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_cvtepi64_epi16 (__m128i __O, __mmask8 __M, __m128i __A)		_mm_mask_cvtepi64_epi16 (__m128i __O, __mmask8 __M, __m128i __A)
{		{
return (__m128i) __builtin_ia32_pmovqw128_mask ((__v2di) __A,		return (__m128i) __builtin_ia32_pmovqw128_mask ((__v2di) __A,
(__v8hi)__O,		(__v8hi)__O,
__M);		__M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_cvtepi64_epi16 (__mmask8 __M, __m128i __A)		_mm_maskz_cvtepi64_epi16 (__mmask8 __M, __m128i __A)
{		{
return (__m128i) __builtin_ia32_pmovqw128_mask ((__v2di) __A,		return (__m128i) __builtin_ia32_pmovqw128_mask ((__v2di) __A,
(__v8hi) _mm_setzero_si128 (),		(__v8hi) _mm_setzero_si128 (),
__M);		__M);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS128
_mm_mask_cvtepi64_storeu_epi16 (void * __P, __mmask8 __M, __m128i __A)		_mm_mask_cvtepi64_storeu_epi16 (void * __P, __mmask8 __M, __m128i __A)
{		{
__builtin_ia32_pmovqw128mem_mask ((__v8hi *) __P, (__v2di) __A, __M);		__builtin_ia32_pmovqw128mem_mask ((__v8hi *) __P, (__v2di) __A, __M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS256
_mm256_cvtepi64_epi16 (__m256i __A)		_mm256_cvtepi64_epi16 (__m256i __A)
{		{
return (__m128i) __builtin_ia32_pmovqw256_mask ((__v4di) __A,		return (__m128i) __builtin_ia32_pmovqw256_mask ((__v4di) __A,
(__v8hi)_mm_undefined_si128(),		(__v8hi)_mm_undefined_si128(),
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS256
_mm256_mask_cvtepi64_epi16 (__m128i __O, __mmask8 __M, __m256i __A)		_mm256_mask_cvtepi64_epi16 (__m128i __O, __mmask8 __M, __m256i __A)
{		{
return (__m128i) __builtin_ia32_pmovqw256_mask ((__v4di) __A,		return (__m128i) __builtin_ia32_pmovqw256_mask ((__v4di) __A,
(__v8hi) __O, __M);		(__v8hi) __O, __M);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS256
_mm256_maskz_cvtepi64_epi16 (__mmask8 __M, __m256i __A)		_mm256_maskz_cvtepi64_epi16 (__mmask8 __M, __m256i __A)
{		{
return (__m128i) __builtin_ia32_pmovqw256_mask ((__v4di) __A,		return (__m128i) __builtin_ia32_pmovqw256_mask ((__v4di) __A,
(__v8hi) _mm_setzero_si128 (),		(__v8hi) _mm_setzero_si128 (),
__M);		__M);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS256
_mm256_mask_cvtepi64_storeu_epi16 (void * __P, __mmask8 __M, __m256i __A)		_mm256_mask_cvtepi64_storeu_epi16 (void * __P, __mmask8 __M, __m256i __A)
{		{
__builtin_ia32_pmovqw256mem_mask ((__v8hi *) __P, (__v4di) __A, __M);		__builtin_ia32_pmovqw256mem_mask ((__v8hi *) __P, (__v4di) __A, __M);
}		}

#define _mm256_extractf32x4_ps(A, imm) \		#define _mm256_extractf32x4_ps(A, imm) \
(__m128)__builtin_ia32_extractf32x4_256_mask((__v8sf)(__m256)(A), \		(__m128)__builtin_ia32_extractf32x4_256_mask((__v8sf)(__m256)(A), \
(int)(imm), \		(int)(imm), \
▲ Show 20 Lines • Show All 247 Lines • ▼ Show 20 Lines	(__m256i)__builtin_ia32_selectq_256((__mmask8)(U), \
(__v4di)_mm256_permutex_epi64((X), (C)), \		(__v4di)_mm256_permutex_epi64((X), (C)), \
(__v4di)(__m256i)(W))		(__v4di)(__m256i)(W))

#define _mm256_maskz_permutex_epi64(U, X, C) \		#define _mm256_maskz_permutex_epi64(U, X, C) \
(__m256i)__builtin_ia32_selectq_256((__mmask8)(U), \		(__m256i)__builtin_ia32_selectq_256((__mmask8)(U), \
(__v4di)_mm256_permutex_epi64((X), (C)), \		(__v4di)_mm256_permutex_epi64((X), (C)), \
(__v4di)_mm256_setzero_si256())		(__v4di)_mm256_setzero_si256())

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_permutexvar_pd (__m256i __X, __m256d __Y)		_mm256_permutexvar_pd (__m256i __X, __m256d __Y)
{		{
return (__m256d)__builtin_ia32_permvardf256((__v4df)__Y, (__v4di)__X);		return (__m256d)__builtin_ia32_permvardf256((__v4df)__Y, (__v4di)__X);
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_mask_permutexvar_pd (__m256d __W, __mmask8 __U, __m256i __X,		_mm256_mask_permutexvar_pd (__m256d __W, __mmask8 __U, __m256i __X,
__m256d __Y)		__m256d __Y)
{		{
return (__m256d)__builtin_ia32_selectpd_256((__mmask8)__U,		return (__m256d)__builtin_ia32_selectpd_256((__mmask8)__U,
(__v4df)_mm256_permutexvar_pd(__X, __Y),		(__v4df)_mm256_permutexvar_pd(__X, __Y),
(__v4df)__W);		(__v4df)__W);
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_maskz_permutexvar_pd (__mmask8 __U, __m256i __X, __m256d __Y)		_mm256_maskz_permutexvar_pd (__mmask8 __U, __m256i __X, __m256d __Y)
{		{
return (__m256d)__builtin_ia32_selectpd_256((__mmask8)__U,		return (__m256d)__builtin_ia32_selectpd_256((__mmask8)__U,
(__v4df)_mm256_permutexvar_pd(__X, __Y),		(__v4df)_mm256_permutexvar_pd(__X, __Y),
(__v4df)_mm256_setzero_pd());		(__v4df)_mm256_setzero_pd());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_permutexvar_epi64 ( __m256i __X, __m256i __Y)		_mm256_permutexvar_epi64 ( __m256i __X, __m256i __Y)
{		{
return (__m256i)__builtin_ia32_permvardi256((__v4di) __Y, (__v4di) __X);		return (__m256i)__builtin_ia32_permvardi256((__v4di) __Y, (__v4di) __X);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_permutexvar_epi64 (__mmask8 __M, __m256i __X, __m256i __Y)		_mm256_maskz_permutexvar_epi64 (__mmask8 __M, __m256i __X, __m256i __Y)
{		{
return (__m256i)__builtin_ia32_selectq_256((__mmask8)__M,		return (__m256i)__builtin_ia32_selectq_256((__mmask8)__M,
(__v4di)_mm256_permutexvar_epi64(__X, __Y),		(__v4di)_mm256_permutexvar_epi64(__X, __Y),
(__v4di)_mm256_setzero_si256());		(__v4di)_mm256_setzero_si256());
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_permutexvar_epi64 (__m256i __W, __mmask8 __M, __m256i __X,		_mm256_mask_permutexvar_epi64 (__m256i __W, __mmask8 __M, __m256i __X,
__m256i __Y)		__m256i __Y)
{		{
return (__m256i)__builtin_ia32_selectq_256((__mmask8)__M,		return (__m256i)__builtin_ia32_selectq_256((__mmask8)__M,
(__v4di)_mm256_permutexvar_epi64(__X, __Y),		(__v4di)_mm256_permutexvar_epi64(__X, __Y),
(__v4di)__W);		(__v4di)__W);
}		}

#define _mm256_permutexvar_ps(A, B) _mm256_permutevar8x32_ps((B), (A))		#define _mm256_permutexvar_ps(A, B) _mm256_permutevar8x32_ps((B), (A))

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_mask_permutexvar_ps(__m256 __W, __mmask8 __U, __m256i __X, __m256 __Y)		_mm256_mask_permutexvar_ps(__m256 __W, __mmask8 __U, __m256i __X, __m256 __Y)
{		{
return (__m256)__builtin_ia32_selectps_256((__mmask8)__U,		return (__m256)__builtin_ia32_selectps_256((__mmask8)__U,
(__v8sf)_mm256_permutexvar_ps(__X, __Y),		(__v8sf)_mm256_permutexvar_ps(__X, __Y),
(__v8sf)__W);		(__v8sf)__W);
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_maskz_permutexvar_ps(__mmask8 __U, __m256i __X, __m256 __Y)		_mm256_maskz_permutexvar_ps(__mmask8 __U, __m256i __X, __m256 __Y)
{		{
return (__m256)__builtin_ia32_selectps_256((__mmask8)__U,		return (__m256)__builtin_ia32_selectps_256((__mmask8)__U,
(__v8sf)_mm256_permutexvar_ps(__X, __Y),		(__v8sf)_mm256_permutexvar_ps(__X, __Y),
(__v8sf)_mm256_setzero_ps());		(__v8sf)_mm256_setzero_ps());
}		}

#define _mm256_permutexvar_epi32(A, B) _mm256_permutevar8x32_epi32((B), (A))		#define _mm256_permutexvar_epi32(A, B) _mm256_permutevar8x32_epi32((B), (A))

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_permutexvar_epi32(__m256i __W, __mmask8 __M, __m256i __X,		_mm256_mask_permutexvar_epi32(__m256i __W, __mmask8 __M, __m256i __X,
__m256i __Y)		__m256i __Y)
{		{
return (__m256i)__builtin_ia32_selectd_256((__mmask8)__M,		return (__m256i)__builtin_ia32_selectd_256((__mmask8)__M,
(__v8si)_mm256_permutexvar_epi32(__X, __Y),		(__v8si)_mm256_permutexvar_epi32(__X, __Y),
(__v8si)__W);		(__v8si)__W);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_permutexvar_epi32(__mmask8 __M, __m256i __X, __m256i __Y)		_mm256_maskz_permutexvar_epi32(__mmask8 __M, __m256i __X, __m256i __Y)
{		{
return (__m256i)__builtin_ia32_selectd_256((__mmask8)__M,		return (__m256i)__builtin_ia32_selectd_256((__mmask8)__M,
(__v8si)_mm256_permutexvar_epi32(__X, __Y),		(__v8si)_mm256_permutexvar_epi32(__X, __Y),
(__v8si)_mm256_setzero_si256());		(__v8si)_mm256_setzero_si256());
}		}

#define _mm_alignr_epi32(A, B, imm) \		#define _mm_alignr_epi32(A, B, imm) \
▲ Show 20 Lines • Show All 47 Lines • ▼ Show 20 Lines	(__m256i)__builtin_ia32_selectq_256((__mmask8)(U), \
(__v4di)_mm256_alignr_epi64((A), (B), (imm)), \		(__v4di)_mm256_alignr_epi64((A), (B), (imm)), \
(__v4di)(__m256i)(W))		(__v4di)(__m256i)(W))

#define _mm256_maskz_alignr_epi64(U, A, B, imm) \		#define _mm256_maskz_alignr_epi64(U, A, B, imm) \
(__m256i)__builtin_ia32_selectq_256((__mmask8)(U), \		(__m256i)__builtin_ia32_selectq_256((__mmask8)(U), \
(__v4di)_mm256_alignr_epi64((A), (B), (imm)), \		(__v4di)_mm256_alignr_epi64((A), (B), (imm)), \
(__v4di)_mm256_setzero_si256())		(__v4di)_mm256_setzero_si256())

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_mask_movehdup_ps (__m128 __W, __mmask8 __U, __m128 __A)		_mm_mask_movehdup_ps (__m128 __W, __mmask8 __U, __m128 __A)
{		{
return (__m128)__builtin_ia32_selectps_128((__mmask8)__U,		return (__m128)__builtin_ia32_selectps_128((__mmask8)__U,
(__v4sf)_mm_movehdup_ps(__A),		(__v4sf)_mm_movehdup_ps(__A),
(__v4sf)__W);		(__v4sf)__W);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_maskz_movehdup_ps (__mmask8 __U, __m128 __A)		_mm_maskz_movehdup_ps (__mmask8 __U, __m128 __A)
{		{
return (__m128)__builtin_ia32_selectps_128((__mmask8)__U,		return (__m128)__builtin_ia32_selectps_128((__mmask8)__U,
(__v4sf)_mm_movehdup_ps(__A),		(__v4sf)_mm_movehdup_ps(__A),
(__v4sf)_mm_setzero_ps());		(__v4sf)_mm_setzero_ps());
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_mask_movehdup_ps (__m256 __W, __mmask8 __U, __m256 __A)		_mm256_mask_movehdup_ps (__m256 __W, __mmask8 __U, __m256 __A)
{		{
return (__m256)__builtin_ia32_selectps_256((__mmask8)__U,		return (__m256)__builtin_ia32_selectps_256((__mmask8)__U,
(__v8sf)_mm256_movehdup_ps(__A),		(__v8sf)_mm256_movehdup_ps(__A),
(__v8sf)__W);		(__v8sf)__W);
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_maskz_movehdup_ps (__mmask8 __U, __m256 __A)		_mm256_maskz_movehdup_ps (__mmask8 __U, __m256 __A)
{		{
return (__m256)__builtin_ia32_selectps_256((__mmask8)__U,		return (__m256)__builtin_ia32_selectps_256((__mmask8)__U,
(__v8sf)_mm256_movehdup_ps(__A),		(__v8sf)_mm256_movehdup_ps(__A),
(__v8sf)_mm256_setzero_ps());		(__v8sf)_mm256_setzero_ps());
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_mask_moveldup_ps (__m128 __W, __mmask8 __U, __m128 __A)		_mm_mask_moveldup_ps (__m128 __W, __mmask8 __U, __m128 __A)
{		{
return (__m128)__builtin_ia32_selectps_128((__mmask8)__U,		return (__m128)__builtin_ia32_selectps_128((__mmask8)__U,
(__v4sf)_mm_moveldup_ps(__A),		(__v4sf)_mm_moveldup_ps(__A),
(__v4sf)__W);		(__v4sf)__W);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_maskz_moveldup_ps (__mmask8 __U, __m128 __A)		_mm_maskz_moveldup_ps (__mmask8 __U, __m128 __A)
{		{
return (__m128)__builtin_ia32_selectps_128((__mmask8)__U,		return (__m128)__builtin_ia32_selectps_128((__mmask8)__U,
(__v4sf)_mm_moveldup_ps(__A),		(__v4sf)_mm_moveldup_ps(__A),
(__v4sf)_mm_setzero_ps());		(__v4sf)_mm_setzero_ps());
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_mask_moveldup_ps (__m256 __W, __mmask8 __U, __m256 __A)		_mm256_mask_moveldup_ps (__m256 __W, __mmask8 __U, __m256 __A)
{		{
return (__m256)__builtin_ia32_selectps_256((__mmask8)__U,		return (__m256)__builtin_ia32_selectps_256((__mmask8)__U,
(__v8sf)_mm256_moveldup_ps(__A),		(__v8sf)_mm256_moveldup_ps(__A),
(__v8sf)__W);		(__v8sf)__W);
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_maskz_moveldup_ps (__mmask8 __U, __m256 __A)		_mm256_maskz_moveldup_ps (__mmask8 __U, __m256 __A)
{		{
return (__m256)__builtin_ia32_selectps_256((__mmask8)__U,		return (__m256)__builtin_ia32_selectps_256((__mmask8)__U,
(__v8sf)_mm256_moveldup_ps(__A),		(__v8sf)_mm256_moveldup_ps(__A),
(__v8sf)_mm256_setzero_ps());		(__v8sf)_mm256_setzero_ps());
}		}

#define _mm256_mask_shuffle_epi32(W, U, A, I) \		#define _mm256_mask_shuffle_epi32(W, U, A, I) \
Show All 11 Lines	(__m128i)__builtin_ia32_selectd_128((__mmask8)(U), \
(__v4si)_mm_shuffle_epi32((A), (I)), \		(__v4si)_mm_shuffle_epi32((A), (I)), \
(__v4si)(__m128i)(W))		(__v4si)(__m128i)(W))

#define _mm_maskz_shuffle_epi32(U, A, I) \		#define _mm_maskz_shuffle_epi32(U, A, I) \
(__m128i)__builtin_ia32_selectd_128((__mmask8)(U), \		(__m128i)__builtin_ia32_selectd_128((__mmask8)(U), \
(__v4si)_mm_shuffle_epi32((A), (I)), \		(__v4si)_mm_shuffle_epi32((A), (I)), \
(__v4si)_mm_setzero_si128())		(__v4si)_mm_setzero_si128())

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_mask_mov_pd (__m128d __W, __mmask8 __U, __m128d __A)		_mm_mask_mov_pd (__m128d __W, __mmask8 __U, __m128d __A)
{		{
return (__m128d) __builtin_ia32_selectpd_128 ((__mmask8) __U,		return (__m128d) __builtin_ia32_selectpd_128 ((__mmask8) __U,
(__v2df) __A,		(__v2df) __A,
(__v2df) __W);		(__v2df) __W);
}		}

static __inline__ __m128d __DEFAULT_FN_ATTRS		static __inline__ __m128d __DEFAULT_FN_ATTRS128
_mm_maskz_mov_pd (__mmask8 __U, __m128d __A)		_mm_maskz_mov_pd (__mmask8 __U, __m128d __A)
{		{
return (__m128d) __builtin_ia32_selectpd_128 ((__mmask8) __U,		return (__m128d) __builtin_ia32_selectpd_128 ((__mmask8) __U,
(__v2df) __A,		(__v2df) __A,
(__v2df) _mm_setzero_pd ());		(__v2df) _mm_setzero_pd ());
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_mask_mov_pd (__m256d __W, __mmask8 __U, __m256d __A)		_mm256_mask_mov_pd (__m256d __W, __mmask8 __U, __m256d __A)
{		{
return (__m256d) __builtin_ia32_selectpd_256 ((__mmask8) __U,		return (__m256d) __builtin_ia32_selectpd_256 ((__mmask8) __U,
(__v4df) __A,		(__v4df) __A,
(__v4df) __W);		(__v4df) __W);
}		}

static __inline__ __m256d __DEFAULT_FN_ATTRS		static __inline__ __m256d __DEFAULT_FN_ATTRS256
_mm256_maskz_mov_pd (__mmask8 __U, __m256d __A)		_mm256_maskz_mov_pd (__mmask8 __U, __m256d __A)
{		{
return (__m256d) __builtin_ia32_selectpd_256 ((__mmask8) __U,		return (__m256d) __builtin_ia32_selectpd_256 ((__mmask8) __U,
(__v4df) __A,		(__v4df) __A,
(__v4df) _mm256_setzero_pd ());		(__v4df) _mm256_setzero_pd ());
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_mask_mov_ps (__m128 __W, __mmask8 __U, __m128 __A)		_mm_mask_mov_ps (__m128 __W, __mmask8 __U, __m128 __A)
{		{
return (__m128) __builtin_ia32_selectps_128 ((__mmask8) __U,		return (__m128) __builtin_ia32_selectps_128 ((__mmask8) __U,
(__v4sf) __A,		(__v4sf) __A,
(__v4sf) __W);		(__v4sf) __W);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_maskz_mov_ps (__mmask8 __U, __m128 __A)		_mm_maskz_mov_ps (__mmask8 __U, __m128 __A)
{		{
return (__m128) __builtin_ia32_selectps_128 ((__mmask8) __U,		return (__m128) __builtin_ia32_selectps_128 ((__mmask8) __U,
(__v4sf) __A,		(__v4sf) __A,
(__v4sf) _mm_setzero_ps ());		(__v4sf) _mm_setzero_ps ());
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_mask_mov_ps (__m256 __W, __mmask8 __U, __m256 __A)		_mm256_mask_mov_ps (__m256 __W, __mmask8 __U, __m256 __A)
{		{
return (__m256) __builtin_ia32_selectps_256 ((__mmask8) __U,		return (__m256) __builtin_ia32_selectps_256 ((__mmask8) __U,
(__v8sf) __A,		(__v8sf) __A,
(__v8sf) __W);		(__v8sf) __W);
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_maskz_mov_ps (__mmask8 __U, __m256 __A)		_mm256_maskz_mov_ps (__mmask8 __U, __m256 __A)
{		{
return (__m256) __builtin_ia32_selectps_256 ((__mmask8) __U,		return (__m256) __builtin_ia32_selectps_256 ((__mmask8) __U,
(__v8sf) __A,		(__v8sf) __A,
(__v8sf) _mm256_setzero_ps ());		(__v8sf) _mm256_setzero_ps ());
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_mask_cvtph_ps (__m128 __W, __mmask8 __U, __m128i __A)		_mm_mask_cvtph_ps (__m128 __W, __mmask8 __U, __m128i __A)
{		{
return (__m128) __builtin_ia32_vcvtph2ps_mask ((__v8hi) __A,		return (__m128) __builtin_ia32_vcvtph2ps_mask ((__v8hi) __A,
(__v4sf) __W,		(__v4sf) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m128 __DEFAULT_FN_ATTRS		static __inline__ __m128 __DEFAULT_FN_ATTRS128
_mm_maskz_cvtph_ps (__mmask8 __U, __m128i __A)		_mm_maskz_cvtph_ps (__mmask8 __U, __m128i __A)
{		{
return (__m128) __builtin_ia32_vcvtph2ps_mask ((__v8hi) __A,		return (__m128) __builtin_ia32_vcvtph2ps_mask ((__v8hi) __A,
(__v4sf)		(__v4sf)
_mm_setzero_ps (),		_mm_setzero_ps (),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_mask_cvtph_ps (__m256 __W, __mmask8 __U, __m128i __A)		_mm256_mask_cvtph_ps (__m256 __W, __mmask8 __U, __m128i __A)
{		{
return (__m256) __builtin_ia32_vcvtph2ps256_mask ((__v8hi) __A,		return (__m256) __builtin_ia32_vcvtph2ps256_mask ((__v8hi) __A,
(__v8sf) __W,		(__v8sf) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline__ __m256 __DEFAULT_FN_ATTRS		static __inline__ __m256 __DEFAULT_FN_ATTRS256
_mm256_maskz_cvtph_ps (__mmask8 __U, __m128i __A)		_mm256_maskz_cvtph_ps (__mmask8 __U, __m128i __A)
{		{
return (__m256) __builtin_ia32_vcvtph2ps256_mask ((__v8hi) __A,		return (__m256) __builtin_ia32_vcvtph2ps256_mask ((__v8hi) __A,
(__v8sf)		(__v8sf)
_mm256_setzero_ps (),		_mm256_setzero_ps (),
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline __m128i __DEFAULT_FN_ATTRS		static __inline __m128i __DEFAULT_FN_ATTRS128
_mm_mask_cvtps_ph (__m128i __W, __mmask8 __U, __m128 __A)		_mm_mask_cvtps_ph (__m128i __W, __mmask8 __U, __m128 __A)
{		{
return (__m128i) __builtin_ia32_vcvtps2ph_mask ((__v4sf) __A, _MM_FROUND_CUR_DIRECTION,		return (__m128i) __builtin_ia32_vcvtps2ph_mask ((__v4sf) __A, _MM_FROUND_CUR_DIRECTION,
(__v8hi) __W,		(__v8hi) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline __m128i __DEFAULT_FN_ATTRS		static __inline __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_cvtps_ph (__mmask8 __U, __m128 __A)		_mm_maskz_cvtps_ph (__mmask8 __U, __m128 __A)
{		{
return (__m128i) __builtin_ia32_vcvtps2ph_mask ((__v4sf) __A, _MM_FROUND_CUR_DIRECTION,		return (__m128i) __builtin_ia32_vcvtps2ph_mask ((__v4sf) __A, _MM_FROUND_CUR_DIRECTION,
(__v8hi) _mm_setzero_si128 (),		(__v8hi) _mm_setzero_si128 (),
(__mmask8) __U);		(__mmask8) __U);
}		}

#define _mm_mask_cvt_roundps_ph(W, U, A, I) \		#define _mm_mask_cvt_roundps_ph(W, U, A, I) \
(__m128i)__builtin_ia32_vcvtps2ph_mask((__v4sf)(__m128)(A), (int)(I), \		(__m128i)__builtin_ia32_vcvtps2ph_mask((__v4sf)(__m128)(A), (int)(I), \
(__v8hi)(__m128i)(W), \		(__v8hi)(__m128i)(W), \
(__mmask8)(U))		(__mmask8)(U))

#define _mm_maskz_cvt_roundps_ph(U, A, I) \		#define _mm_maskz_cvt_roundps_ph(U, A, I) \
(__m128i)__builtin_ia32_vcvtps2ph_mask((__v4sf)(__m128)(A), (int)(I), \		(__m128i)__builtin_ia32_vcvtps2ph_mask((__v4sf)(__m128)(A), (int)(I), \
(__v8hi)_mm_setzero_si128(), \		(__v8hi)_mm_setzero_si128(), \
(__mmask8)(U))		(__mmask8)(U))

static __inline __m128i __DEFAULT_FN_ATTRS		static __inline __m128i __DEFAULT_FN_ATTRS256
_mm256_mask_cvtps_ph (__m128i __W, __mmask8 __U, __m256 __A)		_mm256_mask_cvtps_ph (__m128i __W, __mmask8 __U, __m256 __A)
{		{
return (__m128i) __builtin_ia32_vcvtps2ph256_mask ((__v8sf) __A, _MM_FROUND_CUR_DIRECTION,		return (__m128i) __builtin_ia32_vcvtps2ph256_mask ((__v8sf) __A, _MM_FROUND_CUR_DIRECTION,
(__v8hi) __W,		(__v8hi) __W,
(__mmask8) __U);		(__mmask8) __U);
}		}

static __inline __m128i __DEFAULT_FN_ATTRS		static __inline __m128i __DEFAULT_FN_ATTRS256
_mm256_maskz_cvtps_ph ( __mmask8 __U, __m256 __A)		_mm256_maskz_cvtps_ph ( __mmask8 __U, __m256 __A)
{		{
return (__m128i) __builtin_ia32_vcvtps2ph256_mask ((__v8sf) __A, _MM_FROUND_CUR_DIRECTION,		return (__m128i) __builtin_ia32_vcvtps2ph256_mask ((__v8sf) __A, _MM_FROUND_CUR_DIRECTION,
(__v8hi) _mm_setzero_si128(),		(__v8hi) _mm_setzero_si128(),
(__mmask8) __U);		(__mmask8) __U);
}		}
#define _mm256_mask_cvt_roundps_ph(W, U, A, I) \		#define _mm256_mask_cvt_roundps_ph(W, U, A, I) \
(__m128i)__builtin_ia32_vcvtps2ph256_mask((__v8sf)(__m256)(A), (int)(I), \		(__m128i)__builtin_ia32_vcvtps2ph256_mask((__v8sf)(__m256)(A), (int)(I), \
(__v8hi)(__m128i)(W), \		(__v8hi)(__m128i)(W), \
(__mmask8)(U))		(__mmask8)(U))

#define _mm256_maskz_cvt_roundps_ph(U, A, I) \		#define _mm256_maskz_cvt_roundps_ph(U, A, I) \
(__m128i)__builtin_ia32_vcvtps2ph256_mask((__v8sf)(__m256)(A), (int)(I), \		(__m128i)__builtin_ia32_vcvtps2ph256_mask((__v8sf)(__m256)(A), (int)(I), \
(__v8hi)_mm_setzero_si128(), \		(__v8hi)_mm_setzero_si128(), \
(__mmask8)(U))		(__mmask8)(U))


#undef __DEFAULT_FN_ATTRS		#undef __DEFAULT_FN_ATTRS128
		#undef __DEFAULT_FN_ATTRS256

#endif /* __AVX512VLINTRIN_H */		#endif /* __AVX512VLINTRIN_H */

lib/Headers/avx512vlvbmi2intrin.h

Show All 23 Lines
#ifndef __IMMINTRIN_H		#ifndef __IMMINTRIN_H
#error "Never use <avx512vlvbmi2intrin.h> directly; include <immintrin.h> instead."		#error "Never use <avx512vlvbmi2intrin.h> directly; include <immintrin.h> instead."
#endif		#endif

#ifndef __AVX512VLVBMI2INTRIN_H		#ifndef __AVX512VLVBMI2INTRIN_H
#define __AVX512VLVBMI2INTRIN_H		#define __AVX512VLVBMI2INTRIN_H

/* Define the default attributes for the functions in this file. */		/* Define the default attributes for the functions in this file. */
#define __DEFAULT_FN_ATTRS __attribute__((__always_inline__, __nodebug__, __target__("avx512vl,avx512vbmi2")))		#define __DEFAULT_FN_ATTRS128 __attribute__((__always_inline__, __nodebug__, __target__("avx512vl,avx512vbmi2"), __min_vector_width__(128)))
		#define __DEFAULT_FN_ATTRS256 __attribute__((__always_inline__, __nodebug__, __target__("avx512vl,avx512vbmi2"), __min_vector_width__(256)))

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_compress_epi16(__m128i __S, __mmask8 __U, __m128i __D)		_mm_mask_compress_epi16(__m128i __S, __mmask8 __U, __m128i __D)
{		{
return (__m128i) __builtin_ia32_compresshi128_mask ((__v8hi) __D,		return (__m128i) __builtin_ia32_compresshi128_mask ((__v8hi) __D,
(__v8hi) __S,		(__v8hi) __S,
__U);		__U);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_compress_epi16(__mmask8 __U, __m128i __D)		_mm_maskz_compress_epi16(__mmask8 __U, __m128i __D)
{		{
return (__m128i) __builtin_ia32_compresshi128_mask ((__v8hi) __D,		return (__m128i) __builtin_ia32_compresshi128_mask ((__v8hi) __D,
(__v8hi) _mm_setzero_si128(),		(__v8hi) _mm_setzero_si128(),
__U);		__U);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_compress_epi8(__m128i __S, __mmask16 __U, __m128i __D)		_mm_mask_compress_epi8(__m128i __S, __mmask16 __U, __m128i __D)
{		{
return (__m128i) __builtin_ia32_compressqi128_mask ((__v16qi) __D,		return (__m128i) __builtin_ia32_compressqi128_mask ((__v16qi) __D,
(__v16qi) __S,		(__v16qi) __S,
__U);		__U);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_compress_epi8(__mmask16 __U, __m128i __D)		_mm_maskz_compress_epi8(__mmask16 __U, __m128i __D)
{		{
return (__m128i) __builtin_ia32_compressqi128_mask ((__v16qi) __D,		return (__m128i) __builtin_ia32_compressqi128_mask ((__v16qi) __D,
(__v16qi) _mm_setzero_si128(),		(__v16qi) _mm_setzero_si128(),
__U);		__U);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS128
_mm_mask_compressstoreu_epi16(void *__P, __mmask8 __U, __m128i __D)		_mm_mask_compressstoreu_epi16(void *__P, __mmask8 __U, __m128i __D)
{		{
__builtin_ia32_compressstorehi128_mask ((__v8hi *) __P, (__v8hi) __D,		__builtin_ia32_compressstorehi128_mask ((__v8hi *) __P, (__v8hi) __D,
__U);		__U);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS128
_mm_mask_compressstoreu_epi8(void *__P, __mmask16 __U, __m128i __D)		_mm_mask_compressstoreu_epi8(void *__P, __mmask16 __U, __m128i __D)
{		{
__builtin_ia32_compressstoreqi128_mask ((__v16qi *) __P, (__v16qi) __D,		__builtin_ia32_compressstoreqi128_mask ((__v16qi *) __P, (__v16qi) __D,
__U);		__U);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_expand_epi16(__m128i __S, __mmask8 __U, __m128i __D)		_mm_mask_expand_epi16(__m128i __S, __mmask8 __U, __m128i __D)
{		{
return (__m128i) __builtin_ia32_expandhi128_mask ((__v8hi) __D,		return (__m128i) __builtin_ia32_expandhi128_mask ((__v8hi) __D,
(__v8hi) __S,		(__v8hi) __S,
__U);		__U);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_expand_epi16(__mmask8 __U, __m128i __D)		_mm_maskz_expand_epi16(__mmask8 __U, __m128i __D)
{		{
return (__m128i) __builtin_ia32_expandhi128_mask ((__v8hi) __D,		return (__m128i) __builtin_ia32_expandhi128_mask ((__v8hi) __D,
(__v8hi) _mm_setzero_si128(),		(__v8hi) _mm_setzero_si128(),
__U);		__U);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_expand_epi8(__m128i __S, __mmask16 __U, __m128i __D)		_mm_mask_expand_epi8(__m128i __S, __mmask16 __U, __m128i __D)
{		{
return (__m128i) __builtin_ia32_expandqi128_mask ((__v16qi) __D,		return (__m128i) __builtin_ia32_expandqi128_mask ((__v16qi) __D,
(__v16qi) __S,		(__v16qi) __S,
__U);		__U);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_expand_epi8(__mmask16 __U, __m128i __D)		_mm_maskz_expand_epi8(__mmask16 __U, __m128i __D)
{		{
return (__m128i) __builtin_ia32_expandqi128_mask ((__v16qi) __D,		return (__m128i) __builtin_ia32_expandqi128_mask ((__v16qi) __D,
(__v16qi) _mm_setzero_si128(),		(__v16qi) _mm_setzero_si128(),
__U);		__U);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_expandloadu_epi16(__m128i __S, __mmask8 __U, void const *__P)		_mm_mask_expandloadu_epi16(__m128i __S, __mmask8 __U, void const *__P)
{		{
return (__m128i) __builtin_ia32_expandloadhi128_mask ((const __v8hi *)__P,		return (__m128i) __builtin_ia32_expandloadhi128_mask ((const __v8hi *)__P,
(__v8hi) __S,		(__v8hi) __S,
__U);		__U);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_expandloadu_epi16(__mmask8 __U, void const *__P)		_mm_maskz_expandloadu_epi16(__mmask8 __U, void const *__P)
{		{
return (__m128i) __builtin_ia32_expandloadhi128_mask ((const __v8hi *)__P,		return (__m128i) __builtin_ia32_expandloadhi128_mask ((const __v8hi *)__P,
(__v8hi) _mm_setzero_si128(),		(__v8hi) _mm_setzero_si128(),
__U);		__U);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_expandloadu_epi8(__m128i __S, __mmask16 __U, void const *__P)		_mm_mask_expandloadu_epi8(__m128i __S, __mmask16 __U, void const *__P)
{		{
return (__m128i) __builtin_ia32_expandloadqi128_mask ((const __v16qi *)__P,		return (__m128i) __builtin_ia32_expandloadqi128_mask ((const __v16qi *)__P,
(__v16qi) __S,		(__v16qi) __S,
__U);		__U);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_expandloadu_epi8(__mmask16 __U, void const *__P)		_mm_maskz_expandloadu_epi8(__mmask16 __U, void const *__P)
{		{
return (__m128i) __builtin_ia32_expandloadqi128_mask ((const __v16qi *)__P,		return (__m128i) __builtin_ia32_expandloadqi128_mask ((const __v16qi *)__P,
(__v16qi) _mm_setzero_si128(),		(__v16qi) _mm_setzero_si128(),
__U);		__U);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_compress_epi16(__m256i __S, __mmask16 __U, __m256i __D)		_mm256_mask_compress_epi16(__m256i __S, __mmask16 __U, __m256i __D)
{		{
return (__m256i) __builtin_ia32_compresshi256_mask ((__v16hi) __D,		return (__m256i) __builtin_ia32_compresshi256_mask ((__v16hi) __D,
(__v16hi) __S,		(__v16hi) __S,
__U);		__U);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_compress_epi16(__mmask16 __U, __m256i __D)		_mm256_maskz_compress_epi16(__mmask16 __U, __m256i __D)
{		{
return (__m256i) __builtin_ia32_compresshi256_mask ((__v16hi) __D,		return (__m256i) __builtin_ia32_compresshi256_mask ((__v16hi) __D,
(__v16hi) _mm256_setzero_si256(),		(__v16hi) _mm256_setzero_si256(),
__U);		__U);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_compress_epi8(__m256i __S, __mmask32 __U, __m256i __D)		_mm256_mask_compress_epi8(__m256i __S, __mmask32 __U, __m256i __D)
{		{
return (__m256i) __builtin_ia32_compressqi256_mask ((__v32qi) __D,		return (__m256i) __builtin_ia32_compressqi256_mask ((__v32qi) __D,
(__v32qi) __S,		(__v32qi) __S,
__U);		__U);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_compress_epi8(__mmask32 __U, __m256i __D)		_mm256_maskz_compress_epi8(__mmask32 __U, __m256i __D)
{		{
return (__m256i) __builtin_ia32_compressqi256_mask ((__v32qi) __D,		return (__m256i) __builtin_ia32_compressqi256_mask ((__v32qi) __D,
(__v32qi) _mm256_setzero_si256(),		(__v32qi) _mm256_setzero_si256(),
__U);		__U);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS256
_mm256_mask_compressstoreu_epi16(void *__P, __mmask16 __U, __m256i __D)		_mm256_mask_compressstoreu_epi16(void *__P, __mmask16 __U, __m256i __D)
{		{
__builtin_ia32_compressstorehi256_mask ((__v16hi *) __P, (__v16hi) __D,		__builtin_ia32_compressstorehi256_mask ((__v16hi *) __P, (__v16hi) __D,
__U);		__U);
}		}

static __inline__ void __DEFAULT_FN_ATTRS		static __inline__ void __DEFAULT_FN_ATTRS256
_mm256_mask_compressstoreu_epi8(void *__P, __mmask32 __U, __m256i __D)		_mm256_mask_compressstoreu_epi8(void *__P, __mmask32 __U, __m256i __D)
{		{
__builtin_ia32_compressstoreqi256_mask ((__v32qi *) __P, (__v32qi) __D,		__builtin_ia32_compressstoreqi256_mask ((__v32qi *) __P, (__v32qi) __D,
__U);		__U);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_expand_epi16(__m256i __S, __mmask16 __U, __m256i __D)		_mm256_mask_expand_epi16(__m256i __S, __mmask16 __U, __m256i __D)
{		{
return (__m256i) __builtin_ia32_expandhi256_mask ((__v16hi) __D,		return (__m256i) __builtin_ia32_expandhi256_mask ((__v16hi) __D,
(__v16hi) __S,		(__v16hi) __S,
__U);		__U);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_expand_epi16(__mmask16 __U, __m256i __D)		_mm256_maskz_expand_epi16(__mmask16 __U, __m256i __D)
{		{
return (__m256i) __builtin_ia32_expandhi256_mask ((__v16hi) __D,		return (__m256i) __builtin_ia32_expandhi256_mask ((__v16hi) __D,
(__v16hi) _mm256_setzero_si256(),		(__v16hi) _mm256_setzero_si256(),
__U);		__U);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_expand_epi8(__m256i __S, __mmask32 __U, __m256i __D)		_mm256_mask_expand_epi8(__m256i __S, __mmask32 __U, __m256i __D)
{		{
return (__m256i) __builtin_ia32_expandqi256_mask ((__v32qi) __D,		return (__m256i) __builtin_ia32_expandqi256_mask ((__v32qi) __D,
(__v32qi) __S,		(__v32qi) __S,
__U);		__U);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_expand_epi8(__mmask32 __U, __m256i __D)		_mm256_maskz_expand_epi8(__mmask32 __U, __m256i __D)
{		{
return (__m256i) __builtin_ia32_expandqi256_mask ((__v32qi) __D,		return (__m256i) __builtin_ia32_expandqi256_mask ((__v32qi) __D,
(__v32qi) _mm256_setzero_si256(),		(__v32qi) _mm256_setzero_si256(),
__U);		__U);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_expandloadu_epi16(__m256i __S, __mmask16 __U, void const *__P)		_mm256_mask_expandloadu_epi16(__m256i __S, __mmask16 __U, void const *__P)
{		{
return (__m256i) __builtin_ia32_expandloadhi256_mask ((const __v16hi *)__P,		return (__m256i) __builtin_ia32_expandloadhi256_mask ((const __v16hi *)__P,
(__v16hi) __S,		(__v16hi) __S,
__U);		__U);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_expandloadu_epi16(__mmask16 __U, void const *__P)		_mm256_maskz_expandloadu_epi16(__mmask16 __U, void const *__P)
{		{
return (__m256i) __builtin_ia32_expandloadhi256_mask ((const __v16hi *)__P,		return (__m256i) __builtin_ia32_expandloadhi256_mask ((const __v16hi *)__P,
(__v16hi) _mm256_setzero_si256(),		(__v16hi) _mm256_setzero_si256(),
__U);		__U);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_expandloadu_epi8(__m256i __S, __mmask32 __U, void const *__P)		_mm256_mask_expandloadu_epi8(__m256i __S, __mmask32 __U, void const *__P)
{		{
return (__m256i) __builtin_ia32_expandloadqi256_mask ((const __v32qi *)__P,		return (__m256i) __builtin_ia32_expandloadqi256_mask ((const __v32qi *)__P,
(__v32qi) __S,		(__v32qi) __S,
__U);		__U);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_expandloadu_epi8(__mmask32 __U, void const *__P)		_mm256_maskz_expandloadu_epi8(__mmask32 __U, void const *__P)
{		{
return (__m256i) __builtin_ia32_expandloadqi256_mask ((const __v32qi *)__P,		return (__m256i) __builtin_ia32_expandloadqi256_mask ((const __v32qi *)__P,
(__v32qi) _mm256_setzero_si256(),		(__v32qi) _mm256_setzero_si256(),
__U);		__U);
}		}

#define _mm256_shldi_epi64(A, B, I) \		#define _mm256_shldi_epi64(A, B, I) \
▲ Show 20 Lines • Show All 159 Lines • ▼ Show 20 Lines	(__m128i)__builtin_ia32_selectw_128((__mmask8)(U), \
(__v8hi)_mm_shrdi_epi16((A), (B), (I)), \		(__v8hi)_mm_shrdi_epi16((A), (B), (I)), \
(__v8hi)(__m128i)(S))		(__v8hi)(__m128i)(S))

#define _mm_maskz_shrdi_epi16(U, A, B, I) \		#define _mm_maskz_shrdi_epi16(U, A, B, I) \
(__m128i)__builtin_ia32_selectw_128((__mmask8)(U), \		(__m128i)__builtin_ia32_selectw_128((__mmask8)(U), \
(__v8hi)_mm_shrdi_epi16((A), (B), (I)), \		(__v8hi)_mm_shrdi_epi16((A), (B), (I)), \
(__v8hi)_mm_setzero_si128())		(__v8hi)_mm_setzero_si128())

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_shldv_epi64(__m256i __S, __mmask8 __U, __m256i __A, __m256i __B)		_mm256_mask_shldv_epi64(__m256i __S, __mmask8 __U, __m256i __A, __m256i __B)
{		{
return (__m256i) __builtin_ia32_vpshldvq256_mask ((__v4di) __S,		return (__m256i) __builtin_ia32_vpshldvq256_mask ((__v4di) __S,
(__v4di) __A,		(__v4di) __A,
(__v4di) __B,		(__v4di) __B,
__U);		__U);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_shldv_epi64(__mmask8 __U, __m256i __S, __m256i __A, __m256i __B)		_mm256_maskz_shldv_epi64(__mmask8 __U, __m256i __S, __m256i __A, __m256i __B)
{		{
return (__m256i) __builtin_ia32_vpshldvq256_maskz ((__v4di) __S,		return (__m256i) __builtin_ia32_vpshldvq256_maskz ((__v4di) __S,
(__v4di) __A,		(__v4di) __A,
(__v4di) __B,		(__v4di) __B,
__U);		__U);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_shldv_epi64(__m256i __S, __m256i __A, __m256i __B)		_mm256_shldv_epi64(__m256i __S, __m256i __A, __m256i __B)
{		{
return (__m256i) __builtin_ia32_vpshldvq256_mask ((__v4di) __S,		return (__m256i) __builtin_ia32_vpshldvq256_mask ((__v4di) __S,
(__v4di) __A,		(__v4di) __A,
(__v4di) __B,		(__v4di) __B,
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_shldv_epi64(__m128i __S, __mmask8 __U, __m128i __A, __m128i __B)		_mm_mask_shldv_epi64(__m128i __S, __mmask8 __U, __m128i __A, __m128i __B)
{		{
return (__m128i) __builtin_ia32_vpshldvq128_mask ((__v2di) __S,		return (__m128i) __builtin_ia32_vpshldvq128_mask ((__v2di) __S,
(__v2di) __A,		(__v2di) __A,
(__v2di) __B,		(__v2di) __B,
__U);		__U);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_shldv_epi64(__mmask8 __U, __m128i __S, __m128i __A, __m128i __B)		_mm_maskz_shldv_epi64(__mmask8 __U, __m128i __S, __m128i __A, __m128i __B)
{		{
return (__m128i) __builtin_ia32_vpshldvq128_maskz ((__v2di) __S,		return (__m128i) __builtin_ia32_vpshldvq128_maskz ((__v2di) __S,
(__v2di) __A,		(__v2di) __A,
(__v2di) __B,		(__v2di) __B,
__U);		__U);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_shldv_epi64(__m128i __S, __m128i __A, __m128i __B)		_mm_shldv_epi64(__m128i __S, __m128i __A, __m128i __B)
{		{
return (__m128i) __builtin_ia32_vpshldvq128_mask ((__v2di) __S,		return (__m128i) __builtin_ia32_vpshldvq128_mask ((__v2di) __S,
(__v2di) __A,		(__v2di) __A,
(__v2di) __B,		(__v2di) __B,
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_shldv_epi32(__m256i __S, __mmask8 __U, __m256i __A, __m256i __B)		_mm256_mask_shldv_epi32(__m256i __S, __mmask8 __U, __m256i __A, __m256i __B)
{		{
return (__m256i) __builtin_ia32_vpshldvd256_mask ((__v8si) __S,		return (__m256i) __builtin_ia32_vpshldvd256_mask ((__v8si) __S,
(__v8si) __A,		(__v8si) __A,
(__v8si) __B,		(__v8si) __B,
__U);		__U);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_shldv_epi32(__mmask8 __U, __m256i __S, __m256i __A, __m256i __B)		_mm256_maskz_shldv_epi32(__mmask8 __U, __m256i __S, __m256i __A, __m256i __B)
{		{
return (__m256i) __builtin_ia32_vpshldvd256_maskz ((__v8si) __S,		return (__m256i) __builtin_ia32_vpshldvd256_maskz ((__v8si) __S,
(__v8si) __A,		(__v8si) __A,
(__v8si) __B,		(__v8si) __B,
__U);		__U);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_shldv_epi32(__m256i __S, __m256i __A, __m256i __B)		_mm256_shldv_epi32(__m256i __S, __m256i __A, __m256i __B)
{		{
return (__m256i) __builtin_ia32_vpshldvd256_mask ((__v8si) __S,		return (__m256i) __builtin_ia32_vpshldvd256_mask ((__v8si) __S,
(__v8si) __A,		(__v8si) __A,
(__v8si) __B,		(__v8si) __B,
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_shldv_epi32(__m128i __S, __mmask8 __U, __m128i __A, __m128i __B)		_mm_mask_shldv_epi32(__m128i __S, __mmask8 __U, __m128i __A, __m128i __B)
{		{
return (__m128i) __builtin_ia32_vpshldvd128_mask ((__v4si) __S,		return (__m128i) __builtin_ia32_vpshldvd128_mask ((__v4si) __S,
(__v4si) __A,		(__v4si) __A,
(__v4si) __B,		(__v4si) __B,
__U);		__U);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_shldv_epi32(__mmask8 __U, __m128i __S, __m128i __A, __m128i __B)		_mm_maskz_shldv_epi32(__mmask8 __U, __m128i __S, __m128i __A, __m128i __B)
{		{
return (__m128i) __builtin_ia32_vpshldvd128_maskz ((__v4si) __S,		return (__m128i) __builtin_ia32_vpshldvd128_maskz ((__v4si) __S,
(__v4si) __A,		(__v4si) __A,
(__v4si) __B,		(__v4si) __B,
__U);		__U);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_shldv_epi32(__m128i __S, __m128i __A, __m128i __B)		_mm_shldv_epi32(__m128i __S, __m128i __A, __m128i __B)
{		{
return (__m128i) __builtin_ia32_vpshldvd128_mask ((__v4si) __S,		return (__m128i) __builtin_ia32_vpshldvd128_mask ((__v4si) __S,
(__v4si) __A,		(__v4si) __A,
(__v4si) __B,		(__v4si) __B,
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_shldv_epi16(__m256i __S, __mmask16 __U, __m256i __A, __m256i __B)		_mm256_mask_shldv_epi16(__m256i __S, __mmask16 __U, __m256i __A, __m256i __B)
{		{
return (__m256i) __builtin_ia32_vpshldvw256_mask ((__v16hi) __S,		return (__m256i) __builtin_ia32_vpshldvw256_mask ((__v16hi) __S,
(__v16hi) __A,		(__v16hi) __A,
(__v16hi) __B,		(__v16hi) __B,
__U);		__U);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_shldv_epi16(__mmask16 __U, __m256i __S, __m256i __A, __m256i __B)		_mm256_maskz_shldv_epi16(__mmask16 __U, __m256i __S, __m256i __A, __m256i __B)
{		{
return (__m256i) __builtin_ia32_vpshldvw256_maskz ((__v16hi) __S,		return (__m256i) __builtin_ia32_vpshldvw256_maskz ((__v16hi) __S,
(__v16hi) __A,		(__v16hi) __A,
(__v16hi) __B,		(__v16hi) __B,
__U);		__U);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_shldv_epi16(__m256i __S, __m256i __A, __m256i __B)		_mm256_shldv_epi16(__m256i __S, __m256i __A, __m256i __B)
{		{
return (__m256i) __builtin_ia32_vpshldvw256_mask ((__v16hi) __S,		return (__m256i) __builtin_ia32_vpshldvw256_mask ((__v16hi) __S,
(__v16hi) __A,		(__v16hi) __A,
(__v16hi) __B,		(__v16hi) __B,
(__mmask16) -1);		(__mmask16) -1);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_shldv_epi16(__m128i __S, __mmask8 __U, __m128i __A, __m128i __B)		_mm_mask_shldv_epi16(__m128i __S, __mmask8 __U, __m128i __A, __m128i __B)
{		{
return (__m128i) __builtin_ia32_vpshldvw128_mask ((__v8hi) __S,		return (__m128i) __builtin_ia32_vpshldvw128_mask ((__v8hi) __S,
(__v8hi) __A,		(__v8hi) __A,
(__v8hi) __B,		(__v8hi) __B,
__U);		__U);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_shldv_epi16(__mmask8 __U, __m128i __S, __m128i __A, __m128i __B)		_mm_maskz_shldv_epi16(__mmask8 __U, __m128i __S, __m128i __A, __m128i __B)
{		{
return (__m128i) __builtin_ia32_vpshldvw128_maskz ((__v8hi) __S,		return (__m128i) __builtin_ia32_vpshldvw128_maskz ((__v8hi) __S,
(__v8hi) __A,		(__v8hi) __A,
(__v8hi) __B,		(__v8hi) __B,
__U);		__U);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_shldv_epi16(__m128i __S, __m128i __A, __m128i __B)		_mm_shldv_epi16(__m128i __S, __m128i __A, __m128i __B)
{		{
return (__m128i) __builtin_ia32_vpshldvw128_mask ((__v8hi) __S,		return (__m128i) __builtin_ia32_vpshldvw128_mask ((__v8hi) __S,
(__v8hi) __A,		(__v8hi) __A,
(__v8hi) __B,		(__v8hi) __B,
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_shrdv_epi64(__m256i __S, __mmask8 __U, __m256i __A, __m256i __B)		_mm256_mask_shrdv_epi64(__m256i __S, __mmask8 __U, __m256i __A, __m256i __B)
{		{
return (__m256i) __builtin_ia32_vpshrdvq256_mask ((__v4di) __S,		return (__m256i) __builtin_ia32_vpshrdvq256_mask ((__v4di) __S,
(__v4di) __A,		(__v4di) __A,
(__v4di) __B,		(__v4di) __B,
__U);		__U);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_shrdv_epi64(__mmask8 __U, __m256i __S, __m256i __A, __m256i __B)		_mm256_maskz_shrdv_epi64(__mmask8 __U, __m256i __S, __m256i __A, __m256i __B)
{		{
return (__m256i) __builtin_ia32_vpshrdvq256_maskz ((__v4di) __S,		return (__m256i) __builtin_ia32_vpshrdvq256_maskz ((__v4di) __S,
(__v4di) __A,		(__v4di) __A,
(__v4di) __B,		(__v4di) __B,
__U);		__U);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_shrdv_epi64(__m256i __S, __m256i __A, __m256i __B)		_mm256_shrdv_epi64(__m256i __S, __m256i __A, __m256i __B)
{		{
return (__m256i) __builtin_ia32_vpshrdvq256_mask ((__v4di) __S,		return (__m256i) __builtin_ia32_vpshrdvq256_mask ((__v4di) __S,
(__v4di) __A,		(__v4di) __A,
(__v4di) __B,		(__v4di) __B,
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_shrdv_epi64(__m128i __S, __mmask8 __U, __m128i __A, __m128i __B)		_mm_mask_shrdv_epi64(__m128i __S, __mmask8 __U, __m128i __A, __m128i __B)
{		{
return (__m128i) __builtin_ia32_vpshrdvq128_mask ((__v2di) __S,		return (__m128i) __builtin_ia32_vpshrdvq128_mask ((__v2di) __S,
(__v2di) __A,		(__v2di) __A,
(__v2di) __B,		(__v2di) __B,
__U);		__U);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_shrdv_epi64(__mmask8 __U, __m128i __S, __m128i __A, __m128i __B)		_mm_maskz_shrdv_epi64(__mmask8 __U, __m128i __S, __m128i __A, __m128i __B)
{		{
return (__m128i) __builtin_ia32_vpshrdvq128_maskz ((__v2di) __S,		return (__m128i) __builtin_ia32_vpshrdvq128_maskz ((__v2di) __S,
(__v2di) __A,		(__v2di) __A,
(__v2di) __B,		(__v2di) __B,
__U);		__U);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_shrdv_epi64(__m128i __S, __m128i __A, __m128i __B)		_mm_shrdv_epi64(__m128i __S, __m128i __A, __m128i __B)
{		{
return (__m128i) __builtin_ia32_vpshrdvq128_mask ((__v2di) __S,		return (__m128i) __builtin_ia32_vpshrdvq128_mask ((__v2di) __S,
(__v2di) __A,		(__v2di) __A,
(__v2di) __B,		(__v2di) __B,
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_shrdv_epi32(__m256i __S, __mmask8 __U, __m256i __A, __m256i __B)		_mm256_mask_shrdv_epi32(__m256i __S, __mmask8 __U, __m256i __A, __m256i __B)
{		{
return (__m256i) __builtin_ia32_vpshrdvd256_mask ((__v8si) __S,		return (__m256i) __builtin_ia32_vpshrdvd256_mask ((__v8si) __S,
(__v8si) __A,		(__v8si) __A,
(__v8si) __B,		(__v8si) __B,
__U);		__U);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_shrdv_epi32(__mmask8 __U, __m256i __S, __m256i __A, __m256i __B)		_mm256_maskz_shrdv_epi32(__mmask8 __U, __m256i __S, __m256i __A, __m256i __B)
{		{
return (__m256i) __builtin_ia32_vpshrdvd256_maskz ((__v8si) __S,		return (__m256i) __builtin_ia32_vpshrdvd256_maskz ((__v8si) __S,
(__v8si) __A,		(__v8si) __A,
(__v8si) __B,		(__v8si) __B,
__U);		__U);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_shrdv_epi32(__m256i __S, __m256i __A, __m256i __B)		_mm256_shrdv_epi32(__m256i __S, __m256i __A, __m256i __B)
{		{
return (__m256i) __builtin_ia32_vpshrdvd256_mask ((__v8si) __S,		return (__m256i) __builtin_ia32_vpshrdvd256_mask ((__v8si) __S,
(__v8si) __A,		(__v8si) __A,
(__v8si) __B,		(__v8si) __B,
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_shrdv_epi32(__m128i __S, __mmask8 __U, __m128i __A, __m128i __B)		_mm_mask_shrdv_epi32(__m128i __S, __mmask8 __U, __m128i __A, __m128i __B)
{		{
return (__m128i) __builtin_ia32_vpshrdvd128_mask ((__v4si) __S,		return (__m128i) __builtin_ia32_vpshrdvd128_mask ((__v4si) __S,
(__v4si) __A,		(__v4si) __A,
(__v4si) __B,		(__v4si) __B,
__U);		__U);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_shrdv_epi32(__mmask8 __U, __m128i __S, __m128i __A, __m128i __B)		_mm_maskz_shrdv_epi32(__mmask8 __U, __m128i __S, __m128i __A, __m128i __B)
{		{
return (__m128i) __builtin_ia32_vpshrdvd128_maskz ((__v4si) __S,		return (__m128i) __builtin_ia32_vpshrdvd128_maskz ((__v4si) __S,
(__v4si) __A,		(__v4si) __A,
(__v4si) __B,		(__v4si) __B,
__U);		__U);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_shrdv_epi32(__m128i __S, __m128i __A, __m128i __B)		_mm_shrdv_epi32(__m128i __S, __m128i __A, __m128i __B)
{		{
return (__m128i) __builtin_ia32_vpshrdvd128_mask ((__v4si) __S,		return (__m128i) __builtin_ia32_vpshrdvd128_mask ((__v4si) __S,
(__v4si) __A,		(__v4si) __A,
(__v4si) __B,		(__v4si) __B,
(__mmask8) -1);		(__mmask8) -1);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_shrdv_epi16(__m256i __S, __mmask16 __U, __m256i __A, __m256i __B)		_mm256_mask_shrdv_epi16(__m256i __S, __mmask16 __U, __m256i __A, __m256i __B)
{		{
return (__m256i) __builtin_ia32_vpshrdvw256_mask ((__v16hi) __S,		return (__m256i) __builtin_ia32_vpshrdvw256_mask ((__v16hi) __S,
(__v16hi) __A,		(__v16hi) __A,
(__v16hi) __B,		(__v16hi) __B,
__U);		__U);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_shrdv_epi16(__mmask16 __U, __m256i __S, __m256i __A, __m256i __B)		_mm256_maskz_shrdv_epi16(__mmask16 __U, __m256i __S, __m256i __A, __m256i __B)
{		{
return (__m256i) __builtin_ia32_vpshrdvw256_maskz ((__v16hi) __S,		return (__m256i) __builtin_ia32_vpshrdvw256_maskz ((__v16hi) __S,
(__v16hi) __A,		(__v16hi) __A,
(__v16hi) __B,		(__v16hi) __B,
__U);		__U);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS		static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_shrdv_epi16(__m256i __S, __m256i __A, __m256i __B)		_mm256_shrdv_epi16(__m256i __S, __m256i __A, __m256i __B)
{		{
return (__m256i) __builtin_ia32_vpshrdvw256_mask ((__v16hi) __S,		return (__m256i) __builtin_ia32_vpshrdvw256_mask ((__v16hi) __S,
(__v16hi) __A,		(__v16hi) __A,
(__v16hi) __B,		(__v16hi) __B,
(__mmask16) -1);		(__mmask16) -1);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_shrdv_epi16(__m128i __S, __mmask8 __U, __m128i __A, __m128i __B)		_mm_mask_shrdv_epi16(__m128i __S, __mmask8 __U, __m128i __A, __m128i __B)
{		{
return (__m128i) __builtin_ia32_vpshrdvw128_mask ((__v8hi) __S,		return (__m128i) __builtin_ia32_vpshrdvw128_mask ((__v8hi) __S,
(__v8hi) __A,		(__v8hi) __A,
(__v8hi) __B,		(__v8hi) __B,
__U);		__U);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_shrdv_epi16(__mmask8 __U, __m128i __S, __m128i __A, __m128i __B)		_mm_maskz_shrdv_epi16(__mmask8 __U, __m128i __S, __m128i __A, __m128i __B)
{		{
return (__m128i) __builtin_ia32_vpshrdvw128_maskz ((__v8hi) __S,		return (__m128i) __builtin_ia32_vpshrdvw128_maskz ((__v8hi) __S,
(__v8hi) __A,		(__v8hi) __A,
(__v8hi) __B,		(__v8hi) __B,
__U);		__U);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_shrdv_epi16(__m128i __S, __m128i __A, __m128i __B)		_mm_shrdv_epi16(__m128i __S, __m128i __A, __m128i __B)
{		{
return (__m128i) __builtin_ia32_vpshrdvw128_mask ((__v8hi) __S,		return (__m128i) __builtin_ia32_vpshrdvw128_mask ((__v8hi) __S,
(__v8hi) __A,		(__v8hi) __A,
(__v8hi) __B,		(__v8hi) __B,
(__mmask8) -1);		(__mmask8) -1);
}		}


#undef __DEFAULT_FN_ATTRS		#undef __DEFAULT_FN_ATTRS128
		#undef __DEFAULT_FN_ATTRS256

#endif		#endif

lib/Headers/avx512vlvnniintrin.h

	Show All 23 Lines
	#ifndef __IMMINTRIN_H			#ifndef __IMMINTRIN_H
	#error "Never use <avx512vlvnniintrin.h> directly; include <immintrin.h> instead."			#error "Never use <avx512vlvnniintrin.h> directly; include <immintrin.h> instead."
	#endif			#endif

	#ifndef __AVX512VLVNNIINTRIN_H			#ifndef __AVX512VLVNNIINTRIN_H
	#define __AVX512VLVNNIINTRIN_H			#define __AVX512VLVNNIINTRIN_H

	/* Define the default attributes for the functions in this file. */			/* Define the default attributes for the functions in this file. */
	#define __DEFAULT_FN_ATTRS __attribute__((__always_inline__, __nodebug__, __target__("avx512vl,avx512vnni")))			#define __DEFAULT_FN_ATTRS128 __attribute__((__always_inline__, __nodebug__, __target__("avx512vl,avx512vnni"), __min_vector_width__(128)))
				#define __DEFAULT_FN_ATTRS256 __attribute__((__always_inline__, __nodebug__, __target__("avx512vl,avx512vnni"), __min_vector_width__(256)))


	static __inline__ __m256i __DEFAULT_FN_ATTRS			static __inline__ __m256i __DEFAULT_FN_ATTRS256
	_mm256_dpbusd_epi32(__m256i __S, __m256i __A, __m256i __B)			_mm256_dpbusd_epi32(__m256i __S, __m256i __A, __m256i __B)
	{			{
	return (__m256i)__builtin_ia32_vpdpbusd256((__v8si)__S, (__v8si)__A,			return (__m256i)__builtin_ia32_vpdpbusd256((__v8si)__S, (__v8si)__A,
	(__v8si)__B);			(__v8si)__B);
	}			}

	static __inline__ __m256i __DEFAULT_FN_ATTRS			static __inline__ __m256i __DEFAULT_FN_ATTRS256
	_mm256_mask_dpbusd_epi32(__m256i __S, __mmask8 __U, __m256i __A, __m256i __B)			_mm256_mask_dpbusd_epi32(__m256i __S, __mmask8 __U, __m256i __A, __m256i __B)
	{			{
	return (__m256i)__builtin_ia32_selectd_256(__U,			return (__m256i)__builtin_ia32_selectd_256(__U,
	(__v8si)_mm256_dpbusd_epi32(__S, __A, __B),			(__v8si)_mm256_dpbusd_epi32(__S, __A, __B),
	(__v8si)__S);			(__v8si)__S);
	}			}

	static __inline__ __m256i __DEFAULT_FN_ATTRS			static __inline__ __m256i __DEFAULT_FN_ATTRS256
	_mm256_maskz_dpbusd_epi32(__mmask8 __U, __m256i __S, __m256i __A, __m256i __B)			_mm256_maskz_dpbusd_epi32(__mmask8 __U, __m256i __S, __m256i __A, __m256i __B)
	{			{
	return (__m256i)__builtin_ia32_selectd_256(__U,			return (__m256i)__builtin_ia32_selectd_256(__U,
	(__v8si)_mm256_dpbusd_epi32(__S, __A, __B),			(__v8si)_mm256_dpbusd_epi32(__S, __A, __B),
	(__v8si)_mm256_setzero_si256());			(__v8si)_mm256_setzero_si256());
	}			}

	static __inline__ __m256i __DEFAULT_FN_ATTRS			static __inline__ __m256i __DEFAULT_FN_ATTRS256
	_mm256_dpbusds_epi32(__m256i __S, __m256i __A, __m256i __B)			_mm256_dpbusds_epi32(__m256i __S, __m256i __A, __m256i __B)
	{			{
	return (__m256i)__builtin_ia32_vpdpbusds256((__v8si)__S, (__v8si)__A,			return (__m256i)__builtin_ia32_vpdpbusds256((__v8si)__S, (__v8si)__A,
	(__v8si)__B);			(__v8si)__B);
	}			}

	static __inline__ __m256i __DEFAULT_FN_ATTRS			static __inline__ __m256i __DEFAULT_FN_ATTRS256
	_mm256_mask_dpbusds_epi32(__m256i __S, __mmask8 __U, __m256i __A, __m256i __B)			_mm256_mask_dpbusds_epi32(__m256i __S, __mmask8 __U, __m256i __A, __m256i __B)
	{			{
	return (__m256i)__builtin_ia32_selectd_256(__U,			return (__m256i)__builtin_ia32_selectd_256(__U,
	(__v8si)_mm256_dpbusds_epi32(__S, __A, __B),			(__v8si)_mm256_dpbusds_epi32(__S, __A, __B),
	(__v8si)__S);			(__v8si)__S);
	}			}

	static __inline__ __m256i __DEFAULT_FN_ATTRS			static __inline__ __m256i __DEFAULT_FN_ATTRS256
	_mm256_maskz_dpbusds_epi32(__mmask8 __U, __m256i __S, __m256i __A, __m256i __B)			_mm256_maskz_dpbusds_epi32(__mmask8 __U, __m256i __S, __m256i __A, __m256i __B)
	{			{
	return (__m256i)__builtin_ia32_selectd_256(__U,			return (__m256i)__builtin_ia32_selectd_256(__U,
	(__v8si)_mm256_dpbusds_epi32(__S, __A, __B),			(__v8si)_mm256_dpbusds_epi32(__S, __A, __B),
	(__v8si)_mm256_setzero_si256());			(__v8si)_mm256_setzero_si256());
	}			}

	static __inline__ __m256i __DEFAULT_FN_ATTRS			static __inline__ __m256i __DEFAULT_FN_ATTRS256
	_mm256_dpwssd_epi32(__m256i __S, __m256i __A, __m256i __B)			_mm256_dpwssd_epi32(__m256i __S, __m256i __A, __m256i __B)
	{			{
	return (__m256i)__builtin_ia32_vpdpwssd256((__v8si)__S, (__v8si)__A,			return (__m256i)__builtin_ia32_vpdpwssd256((__v8si)__S, (__v8si)__A,
	(__v8si)__B);			(__v8si)__B);
	}			}

	static __inline__ __m256i __DEFAULT_FN_ATTRS			static __inline__ __m256i __DEFAULT_FN_ATTRS256
	_mm256_mask_dpwssd_epi32(__m256i __S, __mmask8 __U, __m256i __A, __m256i __B)			_mm256_mask_dpwssd_epi32(__m256i __S, __mmask8 __U, __m256i __A, __m256i __B)
	{			{
	return (__m256i)__builtin_ia32_selectd_256(__U,			return (__m256i)__builtin_ia32_selectd_256(__U,
	(__v8si)_mm256_dpwssd_epi32(__S, __A, __B),			(__v8si)_mm256_dpwssd_epi32(__S, __A, __B),
	(__v8si)__S);			(__v8si)__S);
	}			}

	static __inline__ __m256i __DEFAULT_FN_ATTRS			static __inline__ __m256i __DEFAULT_FN_ATTRS256
	_mm256_maskz_dpwssd_epi32(__mmask8 __U, __m256i __S, __m256i __A, __m256i __B)			_mm256_maskz_dpwssd_epi32(__mmask8 __U, __m256i __S, __m256i __A, __m256i __B)
	{			{
	return (__m256i)__builtin_ia32_selectd_256(__U,			return (__m256i)__builtin_ia32_selectd_256(__U,
	(__v8si)_mm256_dpwssd_epi32(__S, __A, __B),			(__v8si)_mm256_dpwssd_epi32(__S, __A, __B),
	(__v8si)_mm256_setzero_si256());			(__v8si)_mm256_setzero_si256());
	}			}

	static __inline__ __m256i __DEFAULT_FN_ATTRS			static __inline__ __m256i __DEFAULT_FN_ATTRS256
	_mm256_dpwssds_epi32(__m256i __S, __m256i __A, __m256i __B)			_mm256_dpwssds_epi32(__m256i __S, __m256i __A, __m256i __B)
	{			{
	return (__m256i)__builtin_ia32_vpdpwssds256((__v8si)__S, (__v8si)__A,			return (__m256i)__builtin_ia32_vpdpwssds256((__v8si)__S, (__v8si)__A,
	(__v8si)__B);			(__v8si)__B);
	}			}

	static __inline__ __m256i __DEFAULT_FN_ATTRS			static __inline__ __m256i __DEFAULT_FN_ATTRS256
	_mm256_mask_dpwssds_epi32(__m256i __S, __mmask8 __U, __m256i __A, __m256i __B)			_mm256_mask_dpwssds_epi32(__m256i __S, __mmask8 __U, __m256i __A, __m256i __B)
	{			{
	return (__m256i)__builtin_ia32_selectd_256(__U,			return (__m256i)__builtin_ia32_selectd_256(__U,
	(__v8si)_mm256_dpwssds_epi32(__S, __A, __B),			(__v8si)_mm256_dpwssds_epi32(__S, __A, __B),
	(__v8si)__S);			(__v8si)__S);
	}			}

	static __inline__ __m256i __DEFAULT_FN_ATTRS			static __inline__ __m256i __DEFAULT_FN_ATTRS256
	_mm256_maskz_dpwssds_epi32(__mmask8 __U, __m256i __S, __m256i __A, __m256i __B)			_mm256_maskz_dpwssds_epi32(__mmask8 __U, __m256i __S, __m256i __A, __m256i __B)
	{			{
	return (__m256i)__builtin_ia32_selectd_256(__U,			return (__m256i)__builtin_ia32_selectd_256(__U,
	(__v8si)_mm256_dpwssds_epi32(__S, __A, __B),			(__v8si)_mm256_dpwssds_epi32(__S, __A, __B),
	(__v8si)_mm256_setzero_si256());			(__v8si)_mm256_setzero_si256());
	}			}

	static __inline__ __m128i __DEFAULT_FN_ATTRS			static __inline__ __m128i __DEFAULT_FN_ATTRS128
	_mm_dpbusd_epi32(__m128i __S, __m128i __A, __m128i __B)			_mm_dpbusd_epi32(__m128i __S, __m128i __A, __m128i __B)
	{			{
	return (__m128i)__builtin_ia32_vpdpbusd128((__v4si)__S, (__v4si)__A,			return (__m128i)__builtin_ia32_vpdpbusd128((__v4si)__S, (__v4si)__A,
	(__v4si)__B);			(__v4si)__B);
	}			}

	static __inline__ __m128i __DEFAULT_FN_ATTRS			static __inline__ __m128i __DEFAULT_FN_ATTRS128
	_mm_mask_dpbusd_epi32(__m128i __S, __mmask8 __U, __m128i __A, __m128i __B)			_mm_mask_dpbusd_epi32(__m128i __S, __mmask8 __U, __m128i __A, __m128i __B)
	{			{
	return (__m128i)__builtin_ia32_selectd_128(__U,			return (__m128i)__builtin_ia32_selectd_128(__U,
	(__v4si)_mm_dpbusd_epi32(__S, __A, __B),			(__v4si)_mm_dpbusd_epi32(__S, __A, __B),
	(__v4si)__S);			(__v4si)__S);
	}			}

	static __inline__ __m128i __DEFAULT_FN_ATTRS			static __inline__ __m128i __DEFAULT_FN_ATTRS128
	_mm_maskz_dpbusd_epi32(__mmask8 __U, __m128i __S, __m128i __A, __m128i __B)			_mm_maskz_dpbusd_epi32(__mmask8 __U, __m128i __S, __m128i __A, __m128i __B)
	{			{
	return (__m128i)__builtin_ia32_selectd_128(__U,			return (__m128i)__builtin_ia32_selectd_128(__U,
	(__v4si)_mm_dpbusd_epi32(__S, __A, __B),			(__v4si)_mm_dpbusd_epi32(__S, __A, __B),
	(__v4si)_mm_setzero_si128());			(__v4si)_mm_setzero_si128());
	}			}

	static __inline__ __m128i __DEFAULT_FN_ATTRS			static __inline__ __m128i __DEFAULT_FN_ATTRS128
	_mm_dpbusds_epi32(__m128i __S, __m128i __A, __m128i __B)			_mm_dpbusds_epi32(__m128i __S, __m128i __A, __m128i __B)
	{			{
	return (__m128i)__builtin_ia32_vpdpbusds128((__v4si)__S, (__v4si)__A,			return (__m128i)__builtin_ia32_vpdpbusds128((__v4si)__S, (__v4si)__A,
	(__v4si)__B);			(__v4si)__B);
	}			}

	static __inline__ __m128i __DEFAULT_FN_ATTRS			static __inline__ __m128i __DEFAULT_FN_ATTRS128
	_mm_mask_dpbusds_epi32(__m128i __S, __mmask8 __U, __m128i __A, __m128i __B)			_mm_mask_dpbusds_epi32(__m128i __S, __mmask8 __U, __m128i __A, __m128i __B)
	{			{
	return (__m128i)__builtin_ia32_selectd_128(__U,			return (__m128i)__builtin_ia32_selectd_128(__U,
	(__v4si)_mm_dpbusds_epi32(__S, __A, __B),			(__v4si)_mm_dpbusds_epi32(__S, __A, __B),
	(__v4si)__S);			(__v4si)__S);
	}			}

	static __inline__ __m128i __DEFAULT_FN_ATTRS			static __inline__ __m128i __DEFAULT_FN_ATTRS128
	_mm_maskz_dpbusds_epi32(__mmask8 __U, __m128i __S, __m128i __A, __m128i __B)			_mm_maskz_dpbusds_epi32(__mmask8 __U, __m128i __S, __m128i __A, __m128i __B)
	{			{
	return (__m128i)__builtin_ia32_selectd_128(__U,			return (__m128i)__builtin_ia32_selectd_128(__U,
	(__v4si)_mm_dpbusds_epi32(__S, __A, __B),			(__v4si)_mm_dpbusds_epi32(__S, __A, __B),
	(__v4si)_mm_setzero_si128());			(__v4si)_mm_setzero_si128());
	}			}

	static __inline__ __m128i __DEFAULT_FN_ATTRS			static __inline__ __m128i __DEFAULT_FN_ATTRS128
	_mm_dpwssd_epi32(__m128i __S, __m128i __A, __m128i __B)			_mm_dpwssd_epi32(__m128i __S, __m128i __A, __m128i __B)
	{			{
	return (__m128i)__builtin_ia32_vpdpwssd128((__v4si)__S, (__v4si)__A,			return (__m128i)__builtin_ia32_vpdpwssd128((__v4si)__S, (__v4si)__A,
	(__v4si)__B);			(__v4si)__B);
	}			}

	static __inline__ __m128i __DEFAULT_FN_ATTRS			static __inline__ __m128i __DEFAULT_FN_ATTRS128
	_mm_mask_dpwssd_epi32(__m128i __S, __mmask8 __U, __m128i __A, __m128i __B)			_mm_mask_dpwssd_epi32(__m128i __S, __mmask8 __U, __m128i __A, __m128i __B)
	{			{
	return (__m128i)__builtin_ia32_selectd_128(__U,			return (__m128i)__builtin_ia32_selectd_128(__U,
	(__v4si)_mm_dpwssd_epi32(__S, __A, __B),			(__v4si)_mm_dpwssd_epi32(__S, __A, __B),
	(__v4si)__S);			(__v4si)__S);
	}			}

	static __inline__ __m128i __DEFAULT_FN_ATTRS			static __inline__ __m128i __DEFAULT_FN_ATTRS128
	_mm_maskz_dpwssd_epi32(__mmask8 __U, __m128i __S, __m128i __A, __m128i __B)			_mm_maskz_dpwssd_epi32(__mmask8 __U, __m128i __S, __m128i __A, __m128i __B)
	{			{
	return (__m128i)__builtin_ia32_selectd_128(__U,			return (__m128i)__builtin_ia32_selectd_128(__U,
	(__v4si)_mm_dpwssd_epi32(__S, __A, __B),			(__v4si)_mm_dpwssd_epi32(__S, __A, __B),
	(__v4si)_mm_setzero_si128());			(__v4si)_mm_setzero_si128());
	}			}

	static __inline__ __m128i __DEFAULT_FN_ATTRS			static __inline__ __m128i __DEFAULT_FN_ATTRS128
	_mm_dpwssds_epi32(__m128i __S, __m128i __A, __m128i __B)			_mm_dpwssds_epi32(__m128i __S, __m128i __A, __m128i __B)
	{			{
	return (__m128i)__builtin_ia32_vpdpwssds128((__v4si)__S, (__v4si)__A,			return (__m128i)__builtin_ia32_vpdpwssds128((__v4si)__S, (__v4si)__A,
	(__v4si)__B);			(__v4si)__B);
	}			}

	static __inline__ __m128i __DEFAULT_FN_ATTRS			static __inline__ __m128i __DEFAULT_FN_ATTRS128
	_mm_mask_dpwssds_epi32(__m128i __S, __mmask8 __U, __m128i __A, __m128i __B)			_mm_mask_dpwssds_epi32(__m128i __S, __mmask8 __U, __m128i __A, __m128i __B)
	{			{
	return (__m128i)__builtin_ia32_selectd_128(__U,			return (__m128i)__builtin_ia32_selectd_128(__U,
	(__v4si)_mm_dpwssds_epi32(__S, __A, __B),			(__v4si)_mm_dpwssds_epi32(__S, __A, __B),
	(__v4si)__S);			(__v4si)__S);
	}			}

	static __inline__ __m128i __DEFAULT_FN_ATTRS			static __inline__ __m128i __DEFAULT_FN_ATTRS128
	_mm_maskz_dpwssds_epi32(__mmask8 __U, __m128i __S, __m128i __A, __m128i __B)			_mm_maskz_dpwssds_epi32(__mmask8 __U, __m128i __S, __m128i __A, __m128i __B)
	{			{
	return (__m128i)__builtin_ia32_selectd_128(__U,			return (__m128i)__builtin_ia32_selectd_128(__U,
	(__v4si)_mm_dpwssds_epi32(__S, __A, __B),			(__v4si)_mm_dpwssds_epi32(__S, __A, __B),
	(__v4si)_mm_setzero_si128());			(__v4si)_mm_setzero_si128());
	}			}

	#undef __DEFAULT_FN_ATTRS			#undef __DEFAULT_FN_ATTRS128
				#undef __DEFAULT_FN_ATTRS256

	#endif			#endif

lib/Headers/avx512vnniintrin.h

	Show All 23 Lines
	#ifndef __IMMINTRIN_H			#ifndef __IMMINTRIN_H
	#error "Never use <avx512vnniintrin.h> directly; include <immintrin.h> instead."			#error "Never use <avx512vnniintrin.h> directly; include <immintrin.h> instead."
	#endif			#endif

	#ifndef __AVX512VNNIINTRIN_H			#ifndef __AVX512VNNIINTRIN_H
	#define __AVX512VNNIINTRIN_H			#define __AVX512VNNIINTRIN_H

	/* Define the default attributes for the functions in this file. */			/* Define the default attributes for the functions in this file. */
	#define __DEFAULT_FN_ATTRS __attribute__((__always_inline__, __nodebug__, __target__("avx512vnni")))			#define __DEFAULT_FN_ATTRS __attribute__((__always_inline__, __nodebug__, __target__("avx512vnni"), __min_vector_width__(512)))


	static __inline__ __m512i __DEFAULT_FN_ATTRS			static __inline__ __m512i __DEFAULT_FN_ATTRS
	_mm512_dpbusd_epi32(__m512i __S, __m512i __A, __m512i __B)			_mm512_dpbusd_epi32(__m512i __S, __m512i __A, __m512i __B)
	{			{
	return (__m512i)__builtin_ia32_vpdpbusd512((__v16si)__S, (__v16si)__A,			return (__m512i)__builtin_ia32_vpdpbusd512((__v16si)__S, (__v16si)__A,
	(__v16si)__B);			(__v16si)__B);
	}			}
	▲ Show 20 Lines • Show All 89 Lines • Show Last 20 Lines

lib/Headers/avx512vpopcntdqintrin.h

Show All 25 Lines	#error \
"Never use <avx512vpopcntdqintrin.h> directly; include <immintrin.h> instead."		"Never use <avx512vpopcntdqintrin.h> directly; include <immintrin.h> instead."
#endif		#endif

#ifndef __AVX512VPOPCNTDQINTRIN_H		#ifndef __AVX512VPOPCNTDQINTRIN_H
#define __AVX512VPOPCNTDQINTRIN_H		#define __AVX512VPOPCNTDQINTRIN_H

/* Define the default attributes for the functions in this file. */		/* Define the default attributes for the functions in this file. */
#define __DEFAULT_FN_ATTRS \		#define __DEFAULT_FN_ATTRS \
__attribute__((__always_inline__, __nodebug__, __target__("avx512vpopcntd" \		__attribute__((__always_inline__, __nodebug__, __target__("avx512vpopcntdq"), __min_vector_width__(512)))
"q")))

static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_popcnt_epi64(__m512i __A) {		static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_popcnt_epi64(__m512i __A) {
return (__m512i)__builtin_ia32_vpopcntq_512((__v8di)__A);		return (__m512i)__builtin_ia32_vpopcntq_512((__v8di)__A);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS		static __inline__ __m512i __DEFAULT_FN_ATTRS
_mm512_mask_popcnt_epi64(__m512i __W, __mmask8 __U, __m512i __A) {		_mm512_mask_popcnt_epi64(__m512i __W, __mmask8 __U, __m512i __A) {
return (__m512i)__builtin_ia32_selectq_512(		return (__m512i)__builtin_ia32_selectq_512(
Show All 26 Lines

lib/Headers/avx512vpopcntdqvlintrin.h

	Show All 24 Lines
	#error \			#error \
	"Never use <avx512vpopcntdqvlintrin.h> directly; include <immintrin.h> instead."			"Never use <avx512vpopcntdqvlintrin.h> directly; include <immintrin.h> instead."
	#endif			#endif

	#ifndef __AVX512VPOPCNTDQVLINTRIN_H			#ifndef __AVX512VPOPCNTDQVLINTRIN_H
	#define __AVX512VPOPCNTDQVLINTRIN_H			#define __AVX512VPOPCNTDQVLINTRIN_H

	/* Define the default attributes for the functions in this file. */			/* Define the default attributes for the functions in this file. */
	#define __DEFAULT_FN_ATTRS \			#define __DEFAULT_FN_ATTRS128 \
	__attribute__((__always_inline__, __nodebug__, __target__("avx512vpopcntdq,avx512vl")))			__attribute__((__always_inline__, __nodebug__, __target__("avx512vpopcntdq,avx512vl"), __min_vector_width__(128)))
				#define __DEFAULT_FN_ATTRS256 \
				__attribute__((__always_inline__, __nodebug__, __target__("avx512vpopcntdq,avx512vl"), __min_vector_width__(256)))

	static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_popcnt_epi64(__m128i __A) {			static __inline__ __m128i __DEFAULT_FN_ATTRS128
				_mm_popcnt_epi64(__m128i __A) {
	return (__m128i)__builtin_ia32_vpopcntq_128((__v2di)__A);			return (__m128i)__builtin_ia32_vpopcntq_128((__v2di)__A);
	}			}

	static __inline__ __m128i __DEFAULT_FN_ATTRS			static __inline__ __m128i __DEFAULT_FN_ATTRS128
	_mm_mask_popcnt_epi64(__m128i __W, __mmask8 __U, __m128i __A) {			_mm_mask_popcnt_epi64(__m128i __W, __mmask8 __U, __m128i __A) {
	return (__m128i)__builtin_ia32_selectq_128(			return (__m128i)__builtin_ia32_selectq_128(
	(__mmask8)__U, (__v2di)_mm_popcnt_epi64(__A), (__v2di)__W);			(__mmask8)__U, (__v2di)_mm_popcnt_epi64(__A), (__v2di)__W);
	}			}

	static __inline__ __m128i __DEFAULT_FN_ATTRS			static __inline__ __m128i __DEFAULT_FN_ATTRS128
	_mm_maskz_popcnt_epi64(__mmask8 __U, __m128i __A) {			_mm_maskz_popcnt_epi64(__mmask8 __U, __m128i __A) {
	return _mm_mask_popcnt_epi64((__m128i)_mm_setzero_si128(), __U, __A);			return _mm_mask_popcnt_epi64((__m128i)_mm_setzero_si128(), __U, __A);
	}			}

	static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_popcnt_epi32(__m128i __A) {			static __inline__ __m128i __DEFAULT_FN_ATTRS128
				_mm_popcnt_epi32(__m128i __A) {
	return (__m128i)__builtin_ia32_vpopcntd_128((__v4si)__A);			return (__m128i)__builtin_ia32_vpopcntd_128((__v4si)__A);
	}			}

	static __inline__ __m128i __DEFAULT_FN_ATTRS			static __inline__ __m128i __DEFAULT_FN_ATTRS128
	_mm_mask_popcnt_epi32(__m128i __W, __mmask8 __U, __m128i __A) {			_mm_mask_popcnt_epi32(__m128i __W, __mmask8 __U, __m128i __A) {
	return (__m128i)__builtin_ia32_selectd_128(			return (__m128i)__builtin_ia32_selectd_128(
	(__mmask8)__U, (__v4si)_mm_popcnt_epi32(__A), (__v4si)__W);			(__mmask8)__U, (__v4si)_mm_popcnt_epi32(__A), (__v4si)__W);
	}			}

	static __inline__ __m128i __DEFAULT_FN_ATTRS			static __inline__ __m128i __DEFAULT_FN_ATTRS128
	_mm_maskz_popcnt_epi32(__mmask8 __U, __m128i __A) {			_mm_maskz_popcnt_epi32(__mmask8 __U, __m128i __A) {
	return _mm_mask_popcnt_epi32((__m128i)_mm_setzero_si128(), __U, __A);			return _mm_mask_popcnt_epi32((__m128i)_mm_setzero_si128(), __U, __A);
	}			}

	static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_popcnt_epi64(__m256i __A) {			static __inline__ __m256i __DEFAULT_FN_ATTRS256
				_mm256_popcnt_epi64(__m256i __A) {
	return (__m256i)__builtin_ia32_vpopcntq_256((__v4di)__A);			return (__m256i)__builtin_ia32_vpopcntq_256((__v4di)__A);
	}			}

	static __inline__ __m256i __DEFAULT_FN_ATTRS			static __inline__ __m256i __DEFAULT_FN_ATTRS256
	_mm256_mask_popcnt_epi64(__m256i __W, __mmask8 __U, __m256i __A) {			_mm256_mask_popcnt_epi64(__m256i __W, __mmask8 __U, __m256i __A) {
	return (__m256i)__builtin_ia32_selectq_256(			return (__m256i)__builtin_ia32_selectq_256(
	(__mmask8)__U, (__v4di)_mm256_popcnt_epi64(__A), (__v4di)__W);			(__mmask8)__U, (__v4di)_mm256_popcnt_epi64(__A), (__v4di)__W);
	}			}

	static __inline__ __m256i __DEFAULT_FN_ATTRS			static __inline__ __m256i __DEFAULT_FN_ATTRS256
	_mm256_maskz_popcnt_epi64(__mmask8 __U, __m256i __A) {			_mm256_maskz_popcnt_epi64(__mmask8 __U, __m256i __A) {
	return _mm256_mask_popcnt_epi64((__m256i)_mm256_setzero_si256(), __U, __A);			return _mm256_mask_popcnt_epi64((__m256i)_mm256_setzero_si256(), __U, __A);
	}			}

	static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_popcnt_epi32(__m256i __A) {			static __inline__ __m256i __DEFAULT_FN_ATTRS256
				_mm256_popcnt_epi32(__m256i __A) {
	return (__m256i)__builtin_ia32_vpopcntd_256((__v8si)__A);			return (__m256i)__builtin_ia32_vpopcntd_256((__v8si)__A);
	}			}

	static __inline__ __m256i __DEFAULT_FN_ATTRS			static __inline__ __m256i __DEFAULT_FN_ATTRS256
	_mm256_mask_popcnt_epi32(__m256i __W, __mmask8 __U, __m256i __A) {			_mm256_mask_popcnt_epi32(__m256i __W, __mmask8 __U, __m256i __A) {
	return (__m256i)__builtin_ia32_selectd_256(			return (__m256i)__builtin_ia32_selectd_256(
	(__mmask8)__U, (__v8si)_mm256_popcnt_epi32(__A), (__v8si)__W);			(__mmask8)__U, (__v8si)_mm256_popcnt_epi32(__A), (__v8si)__W);
	}			}

	static __inline__ __m256i __DEFAULT_FN_ATTRS			static __inline__ __m256i __DEFAULT_FN_ATTRS256
	_mm256_maskz_popcnt_epi32(__mmask8 __U, __m256i __A) {			_mm256_maskz_popcnt_epi32(__mmask8 __U, __m256i __A) {
	return _mm256_mask_popcnt_epi32((__m256i)_mm256_setzero_si256(), __U, __A);			return _mm256_mask_popcnt_epi32((__m256i)_mm256_setzero_si256(), __U, __A);
	}			}

	#undef __DEFAULT_FN_ATTRS			#undef __DEFAULT_FN_ATTRS128
				#undef __DEFAULT_FN_ATTRS256

	#endif			#endif

lib/Headers/avxintrin.h

	Show First 20 Lines • Show All 44 Lines • ▼ Show 20 Lines
	* appear in the interface though. */			* appear in the interface though. */
	typedef signed char __v32qs __attribute__((__vector_size__(32)));			typedef signed char __v32qs __attribute__((__vector_size__(32)));

	typedef float __m256 __attribute__ ((__vector_size__ (32)));			typedef float __m256 __attribute__ ((__vector_size__ (32)));
	typedef double __m256d __attribute__((__vector_size__(32)));			typedef double __m256d __attribute__((__vector_size__(32)));
	typedef long long __m256i __attribute__((__vector_size__(32)));			typedef long long __m256i __attribute__((__vector_size__(32)));

	/* Define the default attributes for the functions in this file. */			/* Define the default attributes for the functions in this file. */
	#define __DEFAULT_FN_ATTRS __attribute__((__always_inline__, __nodebug__, __target__("avx")))			#define __DEFAULT_FN_ATTRS __attribute__((__always_inline__, __nodebug__, __target__("avx"), __min_vector_width__(256)))
				#define __DEFAULT_FN_ATTRS128 __attribute__((__always_inline__, __nodebug__, __target__("avx"), __min_vector_width__(128)))

	/* Arithmetic */			/* Arithmetic */
	/// Adds two 256-bit vectors of [4 x double].			/// Adds two 256-bit vectors of [4 x double].
	///			///
	/// \headerfile <x86intrin.h>			/// \headerfile <x86intrin.h>
	///			///
	/// This intrinsic corresponds to the <c> VADDPD </c> instruction.			/// This intrinsic corresponds to the <c> VADDPD </c> instruction.
	///			///
	▲ Show 20 Lines • Show All 713 Lines • ▼ Show 20 Lines
	/// 1: Bits [127:64] of the source are copied to bits [63:0] of the			/// 1: Bits [127:64] of the source are copied to bits [63:0] of the
	/// returned vector. \n			/// returned vector. \n
	/// Bit [65]: \n			/// Bit [65]: \n
	/// 0: Bits [63:0] of the source are copied to bits [127:64] of the			/// 0: Bits [63:0] of the source are copied to bits [127:64] of the
	/// returned vector. \n			/// returned vector. \n
	/// 1: Bits [127:64] of the source are copied to bits [127:64] of the			/// 1: Bits [127:64] of the source are copied to bits [127:64] of the
	/// returned vector.			/// returned vector.
	/// \returns A 128-bit vector of [2 x double] containing the copied values.			/// \returns A 128-bit vector of [2 x double] containing the copied values.
	static __inline __m128d __DEFAULT_FN_ATTRS			static __inline __m128d __DEFAULT_FN_ATTRS128
	_mm_permutevar_pd(__m128d __a, __m128i __c)			_mm_permutevar_pd(__m128d __a, __m128i __c)
	{			{
	return (__m128d)__builtin_ia32_vpermilvarpd((__v2df)__a, (__v2di)__c);			return (__m128d)__builtin_ia32_vpermilvarpd((__v2df)__a, (__v2di)__c);
	}			}

	/// Copies the values in a 256-bit vector of [4 x double] as specified			/// Copies the values in a 256-bit vector of [4 x double] as specified
	/// by the 256-bit integer vector operand.			/// by the 256-bit integer vector operand.
	///			///
	▲ Show 20 Lines • Show All 76 Lines • ▼ Show 20 Lines
	/// returned vector. \n			/// returned vector. \n
	/// 01: Bits [63:32] of the source are copied to bits [127:96] of the			/// 01: Bits [63:32] of the source are copied to bits [127:96] of the
	/// returned vector. \n			/// returned vector. \n
	/// 10: Bits [95:64] of the source are copied to bits [127:96] of the			/// 10: Bits [95:64] of the source are copied to bits [127:96] of the
	/// returned vector. \n			/// returned vector. \n
	/// 11: Bits [127:96] of the source are copied to bits [127:96] of the			/// 11: Bits [127:96] of the source are copied to bits [127:96] of the
	/// returned vector.			/// returned vector.
	/// \returns A 128-bit vector of [4 x float] containing the copied values.			/// \returns A 128-bit vector of [4 x float] containing the copied values.
	static __inline __m128 __DEFAULT_FN_ATTRS			static __inline __m128 __DEFAULT_FN_ATTRS128
	_mm_permutevar_ps(__m128 __a, __m128i __c)			_mm_permutevar_ps(__m128 __a, __m128i __c)
	{			{
	return (__m128)__builtin_ia32_vpermilvarps((__v4sf)__a, (__v4si)__c);			return (__m128)__builtin_ia32_vpermilvarps((__v4sf)__a, (__v4si)__c);
	}			}

	/// Copies the values stored in a 256-bit vector of [8 x float] as			/// Copies the values stored in a 256-bit vector of [8 x float] as
	/// specified by the 256-bit integer vector operand.			/// specified by the 256-bit integer vector operand.
	///			///
	▲ Show 20 Lines • Show All 1,607 Lines • ▼ Show 20 Lines
	///			///
	/// This intrinsic corresponds to the <c> VTESTPD </c> instruction.			/// This intrinsic corresponds to the <c> VTESTPD </c> instruction.
	///			///
	/// \param __a			/// \param __a
	/// A 128-bit vector of [2 x double].			/// A 128-bit vector of [2 x double].
	/// \param __b			/// \param __b
	/// A 128-bit vector of [2 x double].			/// A 128-bit vector of [2 x double].
	/// \returns the ZF flag in the EFLAGS register.			/// \returns the ZF flag in the EFLAGS register.
	static __inline int __DEFAULT_FN_ATTRS			static __inline int __DEFAULT_FN_ATTRS128
	_mm_testz_pd(__m128d __a, __m128d __b)			_mm_testz_pd(__m128d __a, __m128d __b)
	{			{
	return __builtin_ia32_vtestzpd((__v2df)__a, (__v2df)__b);			return __builtin_ia32_vtestzpd((__v2df)__a, (__v2df)__b);
	}			}

	/// Given two 128-bit floating-point vectors of [2 x double], perform an			/// Given two 128-bit floating-point vectors of [2 x double], perform an
	/// element-by-element comparison of the double-precision element in the			/// element-by-element comparison of the double-precision element in the
	/// first source vector and the corresponding element in the second source			/// first source vector and the corresponding element in the second source
	Show All 12 Lines
	///			///
	/// This intrinsic corresponds to the <c> VTESTPD </c> instruction.			/// This intrinsic corresponds to the <c> VTESTPD </c> instruction.
	///			///
	/// \param __a			/// \param __a
	/// A 128-bit vector of [2 x double].			/// A 128-bit vector of [2 x double].
	/// \param __b			/// \param __b
	/// A 128-bit vector of [2 x double].			/// A 128-bit vector of [2 x double].
	/// \returns the CF flag in the EFLAGS register.			/// \returns the CF flag in the EFLAGS register.
	static __inline int __DEFAULT_FN_ATTRS			static __inline int __DEFAULT_FN_ATTRS128
	_mm_testc_pd(__m128d __a, __m128d __b)			_mm_testc_pd(__m128d __a, __m128d __b)
	{			{
	return __builtin_ia32_vtestcpd((__v2df)__a, (__v2df)__b);			return __builtin_ia32_vtestcpd((__v2df)__a, (__v2df)__b);
	}			}

	/// Given two 128-bit floating-point vectors of [2 x double], perform an			/// Given two 128-bit floating-point vectors of [2 x double], perform an
	/// element-by-element comparison of the double-precision element in the			/// element-by-element comparison of the double-precision element in the
	/// first source vector and the corresponding element in the second source			/// first source vector and the corresponding element in the second source
	Show All 13 Lines
	///			///
	/// This intrinsic corresponds to the <c> VTESTPD </c> instruction.			/// This intrinsic corresponds to the <c> VTESTPD </c> instruction.
	///			///
	/// \param __a			/// \param __a
	/// A 128-bit vector of [2 x double].			/// A 128-bit vector of [2 x double].
	/// \param __b			/// \param __b
	/// A 128-bit vector of [2 x double].			/// A 128-bit vector of [2 x double].
	/// \returns 1 if both the ZF and CF flags are set to 0, otherwise returns 0.			/// \returns 1 if both the ZF and CF flags are set to 0, otherwise returns 0.
	static __inline int __DEFAULT_FN_ATTRS			static __inline int __DEFAULT_FN_ATTRS128
	_mm_testnzc_pd(__m128d __a, __m128d __b)			_mm_testnzc_pd(__m128d __a, __m128d __b)
	{			{
	return __builtin_ia32_vtestnzcpd((__v2df)__a, (__v2df)__b);			return __builtin_ia32_vtestnzcpd((__v2df)__a, (__v2df)__b);
	}			}

	/// Given two 128-bit floating-point vectors of [4 x float], perform an			/// Given two 128-bit floating-point vectors of [4 x float], perform an
	/// element-by-element comparison of the single-precision element in the			/// element-by-element comparison of the single-precision element in the
	/// first source vector and the corresponding element in the second source			/// first source vector and the corresponding element in the second source
	Show All 12 Lines
	///			///
	/// This intrinsic corresponds to the <c> VTESTPS </c> instruction.			/// This intrinsic corresponds to the <c> VTESTPS </c> instruction.
	///			///
	/// \param __a			/// \param __a
	/// A 128-bit vector of [4 x float].			/// A 128-bit vector of [4 x float].
	/// \param __b			/// \param __b
	/// A 128-bit vector of [4 x float].			/// A 128-bit vector of [4 x float].
	/// \returns the ZF flag.			/// \returns the ZF flag.
	static __inline int __DEFAULT_FN_ATTRS			static __inline int __DEFAULT_FN_ATTRS128
	_mm_testz_ps(__m128 __a, __m128 __b)			_mm_testz_ps(__m128 __a, __m128 __b)
	{			{
	return __builtin_ia32_vtestzps((__v4sf)__a, (__v4sf)__b);			return __builtin_ia32_vtestzps((__v4sf)__a, (__v4sf)__b);
	}			}

	/// Given two 128-bit floating-point vectors of [4 x float], perform an			/// Given two 128-bit floating-point vectors of [4 x float], perform an
	/// element-by-element comparison of the single-precision element in the			/// element-by-element comparison of the single-precision element in the
	/// first source vector and the corresponding element in the second source			/// first source vector and the corresponding element in the second source
	Show All 12 Lines
	///			///
	/// This intrinsic corresponds to the <c> VTESTPS </c> instruction.			/// This intrinsic corresponds to the <c> VTESTPS </c> instruction.
	///			///
	/// \param __a			/// \param __a
	/// A 128-bit vector of [4 x float].			/// A 128-bit vector of [4 x float].
	/// \param __b			/// \param __b
	/// A 128-bit vector of [4 x float].			/// A 128-bit vector of [4 x float].
	/// \returns the CF flag.			/// \returns the CF flag.
	static __inline int __DEFAULT_FN_ATTRS			static __inline int __DEFAULT_FN_ATTRS128
	_mm_testc_ps(__m128 __a, __m128 __b)			_mm_testc_ps(__m128 __a, __m128 __b)
	{			{
	return __builtin_ia32_vtestcps((__v4sf)__a, (__v4sf)__b);			return __builtin_ia32_vtestcps((__v4sf)__a, (__v4sf)__b);
	}			}

	/// Given two 128-bit floating-point vectors of [4 x float], perform an			/// Given two 128-bit floating-point vectors of [4 x float], perform an
	/// element-by-element comparison of the single-precision element in the			/// element-by-element comparison of the single-precision element in the
	/// first source vector and the corresponding element in the second source			/// first source vector and the corresponding element in the second source
	Show All 13 Lines
	///			///
	/// This intrinsic corresponds to the <c> VTESTPS </c> instruction.			/// This intrinsic corresponds to the <c> VTESTPS </c> instruction.
	///			///
	/// \param __a			/// \param __a
	/// A 128-bit vector of [4 x float].			/// A 128-bit vector of [4 x float].
	/// \param __b			/// \param __b
	/// A 128-bit vector of [4 x float].			/// A 128-bit vector of [4 x float].
	/// \returns 1 if both the ZF and CF flags are set to 0, otherwise returns 0.			/// \returns 1 if both the ZF and CF flags are set to 0, otherwise returns 0.
	static __inline int __DEFAULT_FN_ATTRS			static __inline int __DEFAULT_FN_ATTRS128
	_mm_testnzc_ps(__m128 __a, __m128 __b)			_mm_testnzc_ps(__m128 __a, __m128 __b)
	{			{
	return __builtin_ia32_vtestnzcps((__v4sf)__a, (__v4sf)__b);			return __builtin_ia32_vtestnzcps((__v4sf)__a, (__v4sf)__b);
	}			}

	/// Given two 256-bit floating-point vectors of [4 x double], perform an			/// Given two 256-bit floating-point vectors of [4 x double], perform an
	/// element-by-element comparison of the double-precision elements in the			/// element-by-element comparison of the double-precision elements in the
	/// first source vector and the corresponding elements in the second source			/// first source vector and the corresponding elements in the second source
	▲ Show 20 Lines • Show All 287 Lines • ▼ Show 20 Lines
	}			}

	/* Vector __zero */			/* Vector __zero */
	/// Zeroes the contents of all XMM or YMM registers.			/// Zeroes the contents of all XMM or YMM registers.
	///			///
	/// \headerfile <x86intrin.h>			/// \headerfile <x86intrin.h>
	///			///
	/// This intrinsic corresponds to the <c> VZEROALL </c> instruction.			/// This intrinsic corresponds to the <c> VZEROALL </c> instruction.
	static __inline void __DEFAULT_FN_ATTRS			static __inline void __attribute__((__always_inline__, __nodebug__, __target__("avx")))
	_mm256_zeroall(void)			_mm256_zeroall(void)
	{			{
	__builtin_ia32_vzeroall();			__builtin_ia32_vzeroall();
	}			}

	/// Zeroes the upper 128 bits (bits 255:128) of all YMM registers.			/// Zeroes the upper 128 bits (bits 255:128) of all YMM registers.
	///			///
	/// \headerfile <x86intrin.h>			/// \headerfile <x86intrin.h>
	///			///
	/// This intrinsic corresponds to the <c> VZEROUPPER </c> instruction.			/// This intrinsic corresponds to the <c> VZEROUPPER </c> instruction.
	static __inline void __DEFAULT_FN_ATTRS			static __inline void __attribute__((__always_inline__, __nodebug__, __target__("avx")))
	_mm256_zeroupper(void)			_mm256_zeroupper(void)
	{			{
	__builtin_ia32_vzeroupper();			__builtin_ia32_vzeroupper();
	}			}

	/* Vector load with broadcast */			/* Vector load with broadcast */
	/// Loads a scalar single-precision floating point value from the			/// Loads a scalar single-precision floating point value from the
	/// specified address pointed to by \a __a and broadcasts it to the elements			/// specified address pointed to by \a __a and broadcasts it to the elements
	/// of a [4 x float] vector.			/// of a [4 x float] vector.
	///			///
	/// \headerfile <x86intrin.h>			/// \headerfile <x86intrin.h>
	///			///
	/// This intrinsic corresponds to the <c> VBROADCASTSS </c> instruction.			/// This intrinsic corresponds to the <c> VBROADCASTSS </c> instruction.
	///			///
	/// \param __a			/// \param __a
	/// The single-precision floating point value to be broadcast.			/// The single-precision floating point value to be broadcast.
	/// \returns A 128-bit vector of [4 x float] whose 32-bit elements are set			/// \returns A 128-bit vector of [4 x float] whose 32-bit elements are set
	/// equal to the broadcast value.			/// equal to the broadcast value.
	static __inline __m128 __DEFAULT_FN_ATTRS			static __inline __m128 __DEFAULT_FN_ATTRS128
	_mm_broadcast_ss(float const *__a)			_mm_broadcast_ss(float const *__a)
	{			{
	float __f = *__a;			float __f = *__a;
	return __extension__ (__m128)(__v4sf){ __f, __f, __f, __f };			return __extension__ (__m128)(__v4sf){ __f, __f, __f, __f };
	}			}

	/// Loads a scalar double-precision floating point value from the			/// Loads a scalar double-precision floating point value from the
	/// specified address pointed to by \a __a and broadcasts it to the elements			/// specified address pointed to by \a __a and broadcasts it to the elements
	▲ Show 20 Lines • Show All 332 Lines • ▼ Show 20 Lines
	/// A pointer to a memory location that contains the double-precision			/// A pointer to a memory location that contains the double-precision
	/// floating point values.			/// floating point values.
	/// \param __m			/// \param __m
	/// A 128-bit integer vector containing the mask. The most significant bit of			/// A 128-bit integer vector containing the mask. The most significant bit of
	/// each data element represents the mask bits. If a mask bit is zero, the			/// each data element represents the mask bits. If a mask bit is zero, the
	/// corresponding value in the memory location is not loaded and the			/// corresponding value in the memory location is not loaded and the
	/// corresponding field in the return value is set to zero.			/// corresponding field in the return value is set to zero.
	/// \returns A 128-bit vector of [2 x double] containing the loaded values.			/// \returns A 128-bit vector of [2 x double] containing the loaded values.
	static __inline __m128d __DEFAULT_FN_ATTRS			static __inline __m128d __DEFAULT_FN_ATTRS128
	_mm_maskload_pd(double const *__p, __m128i __m)			_mm_maskload_pd(double const *__p, __m128i __m)
	{			{
	return (__m128d)__builtin_ia32_maskloadpd((const __v2df *)__p, (__v2di)__m);			return (__m128d)__builtin_ia32_maskloadpd((const __v2df *)__p, (__v2di)__m);
	}			}

	/// Conditionally loads double-precision floating point elements from a			/// Conditionally loads double-precision floating point elements from a
	/// memory location pointed to by \a __p into a 256-bit vector of			/// memory location pointed to by \a __p into a 256-bit vector of
	/// [4 x double], depending on the mask bits associated with each data			/// [4 x double], depending on the mask bits associated with each data
	Show All 32 Lines
	/// A pointer to a memory location that contains the single-precision			/// A pointer to a memory location that contains the single-precision
	/// floating point values.			/// floating point values.
	/// \param __m			/// \param __m
	/// A 128-bit integer vector containing the mask. The most significant bit of			/// A 128-bit integer vector containing the mask. The most significant bit of
	/// each data element represents the mask bits. If a mask bit is zero, the			/// each data element represents the mask bits. If a mask bit is zero, the
	/// corresponding value in the memory location is not loaded and the			/// corresponding value in the memory location is not loaded and the
	/// corresponding field in the return value is set to zero.			/// corresponding field in the return value is set to zero.
	/// \returns A 128-bit vector of [4 x float] containing the loaded values.			/// \returns A 128-bit vector of [4 x float] containing the loaded values.
	static __inline __m128 __DEFAULT_FN_ATTRS			static __inline __m128 __DEFAULT_FN_ATTRS128
	_mm_maskload_ps(float const *__p, __m128i __m)			_mm_maskload_ps(float const *__p, __m128i __m)
	{			{
	return (__m128)__builtin_ia32_maskloadps((const __v4sf *)__p, (__v4si)__m);			return (__m128)__builtin_ia32_maskloadps((const __v4sf *)__p, (__v4si)__m);
	}			}

	/// Conditionally loads single-precision floating point elements from a			/// Conditionally loads single-precision floating point elements from a
	/// memory location pointed to by \a __p into a 256-bit vector of			/// memory location pointed to by \a __p into a 256-bit vector of
	/// [8 x float], depending on the mask bits associated with each data			/// [8 x float], depending on the mask bits associated with each data
	▲ Show 20 Lines • Show All 56 Lines • ▼ Show 20 Lines
	/// \param __m			/// \param __m
	/// A 128-bit integer vector containing the mask. The most significant bit of			/// A 128-bit integer vector containing the mask. The most significant bit of
	/// each field in the mask vector represents the mask bits. If a mask bit is			/// each field in the mask vector represents the mask bits. If a mask bit is
	/// zero, the corresponding value from vector \a __a is not stored and the			/// zero, the corresponding value from vector \a __a is not stored and the
	/// corresponding field in the memory location pointed to by \a __p is not			/// corresponding field in the memory location pointed to by \a __p is not
	/// changed.			/// changed.
	/// \param __a			/// \param __a
	/// A 128-bit vector of [2 x double] containing the values to be stored.			/// A 128-bit vector of [2 x double] containing the values to be stored.
	static __inline void __DEFAULT_FN_ATTRS			static __inline void __DEFAULT_FN_ATTRS128
	_mm_maskstore_pd(double *__p, __m128i __m, __m128d __a)			_mm_maskstore_pd(double *__p, __m128i __m, __m128d __a)
	{			{
	__builtin_ia32_maskstorepd((__v2df *)__p, (__v2di)__m, (__v2df)__a);			__builtin_ia32_maskstorepd((__v2df *)__p, (__v2di)__m, (__v2df)__a);
	}			}

	/// Moves double-precision values from a 256-bit vector of [4 x double]			/// Moves double-precision values from a 256-bit vector of [4 x double]
	/// to a memory location pointed to by \a __p, according to the specified			/// to a memory location pointed to by \a __p, according to the specified
	/// mask.			/// mask.
	Show All 31 Lines
	/// \param __m			/// \param __m
	/// A 128-bit integer vector containing the mask. The most significant bit of			/// A 128-bit integer vector containing the mask. The most significant bit of
	/// each field in the mask vector represents the mask bits. If a mask bit is			/// each field in the mask vector represents the mask bits. If a mask bit is
	/// zero, the corresponding value from vector __a is not stored and the			/// zero, the corresponding value from vector __a is not stored and the
	/// corresponding field in the memory location pointed to by \a __p is not			/// corresponding field in the memory location pointed to by \a __p is not
	/// changed.			/// changed.
	/// \param __a			/// \param __a
	/// A 128-bit vector of [4 x float] containing the values to be stored.			/// A 128-bit vector of [4 x float] containing the values to be stored.
	static __inline void __DEFAULT_FN_ATTRS			static __inline void __DEFAULT_FN_ATTRS128
	_mm_maskstore_ps(float *__p, __m128i __m, __m128 __a)			_mm_maskstore_ps(float *__p, __m128i __m, __m128 __a)
	{			{
	__builtin_ia32_maskstoreps((__v4sf *)__p, (__v4si)__m, (__v4sf)__a);			__builtin_ia32_maskstoreps((__v4sf *)__p, (__v4si)__m, (__v4sf)__a);
	}			}

	/* Cacheability support ops */			/* Cacheability support ops */
	/// Moves integer data from a 256-bit integer vector to a 32-byte			/// Moves integer data from a 256-bit integer vector to a 32-byte
	/// aligned memory location. To minimize caching, the data is flagged as			/// aligned memory location. To minimize caching, the data is flagged as
	▲ Show 20 Lines • Show All 1,543 Lines • ▼ Show 20 Lines
	/// \returns A 256-bit integer vector containing the concatenated result.			/// \returns A 256-bit integer vector containing the concatenated result.
	static __inline __m256i __DEFAULT_FN_ATTRS			static __inline __m256i __DEFAULT_FN_ATTRS
	_mm256_setr_m128i (__m128i __lo, __m128i __hi)			_mm256_setr_m128i (__m128i __lo, __m128i __hi)
	{			{
	return (__m256i)_mm256_set_m128((__m128)__hi, (__m128)__lo);			return (__m256i)_mm256_set_m128((__m128)__hi, (__m128)__lo);
	}			}

	#undef __DEFAULT_FN_ATTRS			#undef __DEFAULT_FN_ATTRS
				#undef __DEFAULT_FN_ATTRS128

	#endif /* __AVXINTRIN_H */			#endif /* __AVXINTRIN_H */

lib/Headers/emmintrin.h

	Show All 39 Lines
	typedef unsigned short __v8hu __attribute__((__vector_size__(16)));			typedef unsigned short __v8hu __attribute__((__vector_size__(16)));
	typedef unsigned char __v16qu __attribute__((__vector_size__(16)));			typedef unsigned char __v16qu __attribute__((__vector_size__(16)));

	/* We need an explicitly signed variant for char. Note that this shouldn't			/* We need an explicitly signed variant for char. Note that this shouldn't
	* appear in the interface though. */			* appear in the interface though. */
	typedef signed char __v16qs __attribute__((__vector_size__(16)));			typedef signed char __v16qs __attribute__((__vector_size__(16)));

	/* Define the default attributes for the functions in this file. */			/* Define the default attributes for the functions in this file. */
	#define __DEFAULT_FN_ATTRS __attribute__((__always_inline__, __nodebug__, __target__("sse2")))			#define __DEFAULT_FN_ATTRS __attribute__((__always_inline__, __nodebug__, __target__("sse2"), __min_vector_width__(128)))
	#define __DEFAULT_FN_ATTRS_MMX __attribute__((__always_inline__, __nodebug__, __target__("mmx,sse2")))			#define __DEFAULT_FN_ATTRS_MMX __attribute__((__always_inline__, __nodebug__, __target__("mmx,sse2"), __min_vector_width__(64)))

	/// Adds lower double-precision values in both operands and returns the			/// Adds lower double-precision values in both operands and returns the
	/// sum in the lower 64 bits of the result. The upper 64 bits of the result			/// sum in the lower 64 bits of the result. The upper 64 bits of the result
	/// are copied from the upper double-precision value of the first operand.			/// are copied from the upper double-precision value of the first operand.
	///			///
	/// \headerfile <x86intrin.h>			/// \headerfile <x86intrin.h>
	///			///
	/// This intrinsic corresponds to the <c> VADDSD / ADDSD </c> instruction.			/// This intrinsic corresponds to the <c> VADDSD / ADDSD </c> instruction.
	▲ Show 20 Lines • Show All 4,030 Lines • ▼ Show 20 Lines
	/// \headerfile <x86intrin.h>			/// \headerfile <x86intrin.h>
	///			///
	/// This intrinsic corresponds to the <c> MOVNTI </c> instruction.			/// This intrinsic corresponds to the <c> MOVNTI </c> instruction.
	///			///
	/// \param __p			/// \param __p
	/// A pointer to the 32-bit memory location used to store the value.			/// A pointer to the 32-bit memory location used to store the value.
	/// \param __a			/// \param __a
	/// A 32-bit integer containing the value to be stored.			/// A 32-bit integer containing the value to be stored.
	static __inline__ void __DEFAULT_FN_ATTRS			static __inline__ void __attribute__((__always_inline__, __nodebug__, __target__("sse2")))
	_mm_stream_si32(int *__p, int __a)			_mm_stream_si32(int *__p, int __a)
	{			{
	__builtin_ia32_movnti(__p, __a);			__builtin_ia32_movnti(__p, __a);
	}			}

	#ifdef __x86_64__			#ifdef __x86_64__
	/// Stores a 64-bit integer value in the specified memory location.			/// Stores a 64-bit integer value in the specified memory location.
	///			///
	/// To minimize caching, the data is flagged as non-temporal (unlikely to be			/// To minimize caching, the data is flagged as non-temporal (unlikely to be
	/// used again soon).			/// used again soon).
	///			///
	/// \headerfile <x86intrin.h>			/// \headerfile <x86intrin.h>
	///			///
	/// This intrinsic corresponds to the <c> MOVNTIQ </c> instruction.			/// This intrinsic corresponds to the <c> MOVNTIQ </c> instruction.
	///			///
	/// \param __p			/// \param __p
	/// A pointer to the 64-bit memory location used to store the value.			/// A pointer to the 64-bit memory location used to store the value.
	/// \param __a			/// \param __a
	/// A 64-bit integer containing the value to be stored.			/// A 64-bit integer containing the value to be stored.
	static __inline__ void __DEFAULT_FN_ATTRS			static __inline__ void __attribute__((__always_inline__, __nodebug__, __target__("sse2")))
	_mm_stream_si64(long long *__p, long long __a)			_mm_stream_si64(long long *__p, long long __a)
	{			{
	__builtin_ia32_movnti64(__p, __a);			__builtin_ia32_movnti64(__p, __a);
	}			}
	#endif			#endif

	#if defined(__cplusplus)			#if defined(__cplusplus)
	extern "C" {			extern "C" {
	▲ Show 20 Lines • Show All 770 Lines • Show Last 20 Lines

lib/Headers/f16cintrin.h

	Show All 23 Lines
	#if !defined __IMMINTRIN_H			#if !defined __IMMINTRIN_H
	#error "Never use <f16cintrin.h> directly; include <immintrin.h> instead."			#error "Never use <f16cintrin.h> directly; include <immintrin.h> instead."
	#endif			#endif

	#ifndef __F16CINTRIN_H			#ifndef __F16CINTRIN_H
	#define __F16CINTRIN_H			#define __F16CINTRIN_H

	/* Define the default attributes for the functions in this file. */			/* Define the default attributes for the functions in this file. */
	#define __DEFAULT_FN_ATTRS \			#define __DEFAULT_FN_ATTRS128 \
	__attribute__((__always_inline__, __nodebug__, __target__("f16c")))			__attribute__((__always_inline__, __nodebug__, __target__("f16c"), __min_vector_width__(128)))
				#define __DEFAULT_FN_ATTRS256 \
				__attribute__((__always_inline__, __nodebug__, __target__("f16c"), __min_vector_width__(256)))

	/* NOTE: Intel documents the 128-bit versions of these as being in emmintrin.h,			/* NOTE: Intel documents the 128-bit versions of these as being in emmintrin.h,
	* but that's because icc can emulate these without f16c using a library call.			* but that's because icc can emulate these without f16c using a library call.
	* Since we don't do that let's leave these in f16cintrin.h.			* Since we don't do that let's leave these in f16cintrin.h.
	*/			*/

	/// Converts a 16-bit half-precision float value into a 32-bit float			/// Converts a 16-bit half-precision float value into a 32-bit float
	/// value.			/// value.
	///			///
	/// \headerfile <x86intrin.h>			/// \headerfile <x86intrin.h>
	///			///
	/// This intrinsic corresponds to the <c> VCVTPH2PS </c> instruction.			/// This intrinsic corresponds to the <c> VCVTPH2PS </c> instruction.
	///			///
	/// \param __a			/// \param __a
	/// A 16-bit half-precision float value.			/// A 16-bit half-precision float value.
	/// \returns The converted 32-bit float value.			/// \returns The converted 32-bit float value.
	static __inline float __DEFAULT_FN_ATTRS			static __inline float __DEFAULT_FN_ATTRS128
	_cvtsh_ss(unsigned short __a)			_cvtsh_ss(unsigned short __a)
	{			{
	__v8hi v = {(short)__a, 0, 0, 0, 0, 0, 0, 0};			__v8hi v = {(short)__a, 0, 0, 0, 0, 0, 0, 0};
	__v4sf r = __builtin_ia32_vcvtph2ps(v);			__v4sf r = __builtin_ia32_vcvtph2ps(v);
	return r[0];			return r[0];
	}			}

	/// Converts a 32-bit single-precision float value to a 16-bit			/// Converts a 32-bit single-precision float value to a 16-bit
	▲ Show 20 Lines • Show All 54 Lines • ▼ Show 20 Lines
	/// \headerfile <x86intrin.h>			/// \headerfile <x86intrin.h>
	///			///
	/// This intrinsic corresponds to the <c> VCVTPH2PS </c> instruction.			/// This intrinsic corresponds to the <c> VCVTPH2PS </c> instruction.
	///			///
	/// \param __a			/// \param __a
	/// A 128-bit vector containing 16-bit half-precision float values. The lower			/// A 128-bit vector containing 16-bit half-precision float values. The lower
	/// 64 bits are used in the conversion.			/// 64 bits are used in the conversion.
	/// \returns A 128-bit vector of [4 x float] containing converted float values.			/// \returns A 128-bit vector of [4 x float] containing converted float values.
	static __inline __m128 __DEFAULT_FN_ATTRS			static __inline __m128 __DEFAULT_FN_ATTRS128
	_mm_cvtph_ps(__m128i __a)			_mm_cvtph_ps(__m128i __a)
	{			{
	return (__m128)__builtin_ia32_vcvtph2ps((__v8hi)__a);			return (__m128)__builtin_ia32_vcvtph2ps((__v8hi)__a);
	}			}

	/// Converts a 256-bit vector of [8 x float] into a 128-bit vector			/// Converts a 256-bit vector of [8 x float] into a 128-bit vector
	/// containing 16-bit half-precision float values.			/// containing 16-bit half-precision float values.
	///			///
	Show All 27 Lines
	///			///
	/// This intrinsic corresponds to the <c> VCVTPH2PS </c> instruction.			/// This intrinsic corresponds to the <c> VCVTPH2PS </c> instruction.
	///			///
	/// \param __a			/// \param __a
	/// A 128-bit vector containing 16-bit half-precision float values to be			/// A 128-bit vector containing 16-bit half-precision float values to be
	/// converted to 32-bit single-precision float values.			/// converted to 32-bit single-precision float values.
	/// \returns A vector of [8 x float] containing the converted 32-bit			/// \returns A vector of [8 x float] containing the converted 32-bit
	/// single-precision float values.			/// single-precision float values.
	static __inline __m256 __attribute__((__always_inline__, __nodebug__, __target__("f16c")))			static __inline __m256 __DEFAULT_FN_ATTRS256
	_mm256_cvtph_ps(__m128i __a)			_mm256_cvtph_ps(__m128i __a)
	{			{
	return (__m256)__builtin_ia32_vcvtph2ps256((__v8hi)__a);			return (__m256)__builtin_ia32_vcvtph2ps256((__v8hi)__a);
	}			}

	#undef __DEFAULT_FN_ATTRS			#undef __DEFAULT_FN_ATTRS128
				#undef __DEFAULT_FN_ATTRS256

	#endif /* __F16CINTRIN_H */			#endif /* __F16CINTRIN_H */

lib/Headers/fma4intrin.h

	Show All 25 Lines
	#endif			#endif

	#ifndef __FMA4INTRIN_H			#ifndef __FMA4INTRIN_H
	#define __FMA4INTRIN_H			#define __FMA4INTRIN_H

	#include <pmmintrin.h>			#include <pmmintrin.h>

	/* Define the default attributes for the functions in this file. */			/* Define the default attributes for the functions in this file. */
	#define __DEFAULT_FN_ATTRS __attribute__((__always_inline__, __nodebug__, __target__("fma4")))			#define __DEFAULT_FN_ATTRS128 __attribute__((__always_inline__, __nodebug__, __target__("fma4"), __min_vector_width__(128)))
				#define __DEFAULT_FN_ATTRS256 __attribute__((__always_inline__, __nodebug__, __target__("fma4"), __min_vector_width__(256)))

	static __inline__ __m128 __DEFAULT_FN_ATTRS			static __inline__ __m128 __DEFAULT_FN_ATTRS128
	_mm_macc_ps(__m128 __A, __m128 __B, __m128 __C)			_mm_macc_ps(__m128 __A, __m128 __B, __m128 __C)
	{			{
	return (__m128)__builtin_ia32_vfmaddps((__v4sf)__A, (__v4sf)__B, (__v4sf)__C);			return (__m128)__builtin_ia32_vfmaddps((__v4sf)__A, (__v4sf)__B, (__v4sf)__C);
	}			}

	static __inline__ __m128d __DEFAULT_FN_ATTRS			static __inline__ __m128d __DEFAULT_FN_ATTRS128
	_mm_macc_pd(__m128d __A, __m128d __B, __m128d __C)			_mm_macc_pd(__m128d __A, __m128d __B, __m128d __C)
	{			{
	return (__m128d)__builtin_ia32_vfmaddpd((__v2df)__A, (__v2df)__B, (__v2df)__C);			return (__m128d)__builtin_ia32_vfmaddpd((__v2df)__A, (__v2df)__B, (__v2df)__C);
	}			}

	static __inline__ __m128 __DEFAULT_FN_ATTRS			static __inline__ __m128 __DEFAULT_FN_ATTRS128
	_mm_macc_ss(__m128 __A, __m128 __B, __m128 __C)			_mm_macc_ss(__m128 __A, __m128 __B, __m128 __C)
	{			{
	return (__m128)__builtin_ia32_vfmaddss((__v4sf)__A, (__v4sf)__B, (__v4sf)__C);			return (__m128)__builtin_ia32_vfmaddss((__v4sf)__A, (__v4sf)__B, (__v4sf)__C);
	}			}

	static __inline__ __m128d __DEFAULT_FN_ATTRS			static __inline__ __m128d __DEFAULT_FN_ATTRS128
	_mm_macc_sd(__m128d __A, __m128d __B, __m128d __C)			_mm_macc_sd(__m128d __A, __m128d __B, __m128d __C)
	{			{
	return (__m128d)__builtin_ia32_vfmaddsd((__v2df)__A, (__v2df)__B, (__v2df)__C);			return (__m128d)__builtin_ia32_vfmaddsd((__v2df)__A, (__v2df)__B, (__v2df)__C);
	}			}

	static __inline__ __m128 __DEFAULT_FN_ATTRS			static __inline__ __m128 __DEFAULT_FN_ATTRS128
	_mm_msub_ps(__m128 __A, __m128 __B, __m128 __C)			_mm_msub_ps(__m128 __A, __m128 __B, __m128 __C)
	{			{
	return (__m128)__builtin_ia32_vfmaddps((__v4sf)__A, (__v4sf)__B, -(__v4sf)__C);			return (__m128)__builtin_ia32_vfmaddps((__v4sf)__A, (__v4sf)__B, -(__v4sf)__C);
	}			}

	static __inline__ __m128d __DEFAULT_FN_ATTRS			static __inline__ __m128d __DEFAULT_FN_ATTRS128
	_mm_msub_pd(__m128d __A, __m128d __B, __m128d __C)			_mm_msub_pd(__m128d __A, __m128d __B, __m128d __C)
	{			{
	return (__m128d)__builtin_ia32_vfmaddpd((__v2df)__A, (__v2df)__B, -(__v2df)__C);			return (__m128d)__builtin_ia32_vfmaddpd((__v2df)__A, (__v2df)__B, -(__v2df)__C);
	}			}

	static __inline__ __m128 __DEFAULT_FN_ATTRS			static __inline__ __m128 __DEFAULT_FN_ATTRS128
	_mm_msub_ss(__m128 __A, __m128 __B, __m128 __C)			_mm_msub_ss(__m128 __A, __m128 __B, __m128 __C)
	{			{
	return (__m128)__builtin_ia32_vfmaddss((__v4sf)__A, (__v4sf)__B, -(__v4sf)__C);			return (__m128)__builtin_ia32_vfmaddss((__v4sf)__A, (__v4sf)__B, -(__v4sf)__C);
	}			}

	static __inline__ __m128d __DEFAULT_FN_ATTRS			static __inline__ __m128d __DEFAULT_FN_ATTRS128
	_mm_msub_sd(__m128d __A, __m128d __B, __m128d __C)			_mm_msub_sd(__m128d __A, __m128d __B, __m128d __C)
	{			{
	return (__m128d)__builtin_ia32_vfmaddsd((__v2df)__A, (__v2df)__B, -(__v2df)__C);			return (__m128d)__builtin_ia32_vfmaddsd((__v2df)__A, (__v2df)__B, -(__v2df)__C);
	}			}

	static __inline__ __m128 __DEFAULT_FN_ATTRS			static __inline__ __m128 __DEFAULT_FN_ATTRS128
	_mm_nmacc_ps(__m128 __A, __m128 __B, __m128 __C)			_mm_nmacc_ps(__m128 __A, __m128 __B, __m128 __C)
	{			{
	return (__m128)__builtin_ia32_vfmaddps(-(__v4sf)__A, (__v4sf)__B, (__v4sf)__C);			return (__m128)__builtin_ia32_vfmaddps(-(__v4sf)__A, (__v4sf)__B, (__v4sf)__C);
	}			}

	static __inline__ __m128d __DEFAULT_FN_ATTRS			static __inline__ __m128d __DEFAULT_FN_ATTRS128
	_mm_nmacc_pd(__m128d __A, __m128d __B, __m128d __C)			_mm_nmacc_pd(__m128d __A, __m128d __B, __m128d __C)
	{			{
	return (__m128d)__builtin_ia32_vfmaddpd(-(__v2df)__A, (__v2df)__B, (__v2df)__C);			return (__m128d)__builtin_ia32_vfmaddpd(-(__v2df)__A, (__v2df)__B, (__v2df)__C);
	}			}

	static __inline__ __m128 __DEFAULT_FN_ATTRS			static __inline__ __m128 __DEFAULT_FN_ATTRS128
	_mm_nmacc_ss(__m128 __A, __m128 __B, __m128 __C)			_mm_nmacc_ss(__m128 __A, __m128 __B, __m128 __C)
	{			{
	return (__m128)__builtin_ia32_vfmaddss(-(__v4sf)__A, (__v4sf)__B, (__v4sf)__C);			return (__m128)__builtin_ia32_vfmaddss(-(__v4sf)__A, (__v4sf)__B, (__v4sf)__C);
	}			}

	static __inline__ __m128d __DEFAULT_FN_ATTRS			static __inline__ __m128d __DEFAULT_FN_ATTRS128
	_mm_nmacc_sd(__m128d __A, __m128d __B, __m128d __C)			_mm_nmacc_sd(__m128d __A, __m128d __B, __m128d __C)
	{			{
	return (__m128d)__builtin_ia32_vfmaddsd(-(__v2df)__A, (__v2df)__B, (__v2df)__C);			return (__m128d)__builtin_ia32_vfmaddsd(-(__v2df)__A, (__v2df)__B, (__v2df)__C);
	}			}

	static __inline__ __m128 __DEFAULT_FN_ATTRS			static __inline__ __m128 __DEFAULT_FN_ATTRS128
	_mm_nmsub_ps(__m128 __A, __m128 __B, __m128 __C)			_mm_nmsub_ps(__m128 __A, __m128 __B, __m128 __C)
	{			{
	return (__m128)__builtin_ia32_vfmaddps(-(__v4sf)__A, (__v4sf)__B, -(__v4sf)__C);			return (__m128)__builtin_ia32_vfmaddps(-(__v4sf)__A, (__v4sf)__B, -(__v4sf)__C);
	}			}

	static __inline__ __m128d __DEFAULT_FN_ATTRS			static __inline__ __m128d __DEFAULT_FN_ATTRS128
	_mm_nmsub_pd(__m128d __A, __m128d __B, __m128d __C)			_mm_nmsub_pd(__m128d __A, __m128d __B, __m128d __C)
	{			{
	return (__m128d)__builtin_ia32_vfmaddpd(-(__v2df)__A, (__v2df)__B, -(__v2df)__C);			return (__m128d)__builtin_ia32_vfmaddpd(-(__v2df)__A, (__v2df)__B, -(__v2df)__C);
	}			}

	static __inline__ __m128 __DEFAULT_FN_ATTRS			static __inline__ __m128 __DEFAULT_FN_ATTRS128
	_mm_nmsub_ss(__m128 __A, __m128 __B, __m128 __C)			_mm_nmsub_ss(__m128 __A, __m128 __B, __m128 __C)
	{			{
	return (__m128)__builtin_ia32_vfmaddss(-(__v4sf)__A, (__v4sf)__B, -(__v4sf)__C);			return (__m128)__builtin_ia32_vfmaddss(-(__v4sf)__A, (__v4sf)__B, -(__v4sf)__C);
	}			}

	static __inline__ __m128d __DEFAULT_FN_ATTRS			static __inline__ __m128d __DEFAULT_FN_ATTRS128
	_mm_nmsub_sd(__m128d __A, __m128d __B, __m128d __C)			_mm_nmsub_sd(__m128d __A, __m128d __B, __m128d __C)
	{			{
	return (__m128d)__builtin_ia32_vfmaddsd(-(__v2df)__A, (__v2df)__B, -(__v2df)__C);			return (__m128d)__builtin_ia32_vfmaddsd(-(__v2df)__A, (__v2df)__B, -(__v2df)__C);
	}			}

	static __inline__ __m128 __DEFAULT_FN_ATTRS			static __inline__ __m128 __DEFAULT_FN_ATTRS128
	_mm_maddsub_ps(__m128 __A, __m128 __B, __m128 __C)			_mm_maddsub_ps(__m128 __A, __m128 __B, __m128 __C)
	{			{
	return (__m128)__builtin_ia32_vfmaddsubps((__v4sf)__A, (__v4sf)__B, (__v4sf)__C);			return (__m128)__builtin_ia32_vfmaddsubps((__v4sf)__A, (__v4sf)__B, (__v4sf)__C);
	}			}

	static __inline__ __m128d __DEFAULT_FN_ATTRS			static __inline__ __m128d __DEFAULT_FN_ATTRS128
	_mm_maddsub_pd(__m128d __A, __m128d __B, __m128d __C)			_mm_maddsub_pd(__m128d __A, __m128d __B, __m128d __C)
	{			{
	return (__m128d)__builtin_ia32_vfmaddsubpd((__v2df)__A, (__v2df)__B, (__v2df)__C);			return (__m128d)__builtin_ia32_vfmaddsubpd((__v2df)__A, (__v2df)__B, (__v2df)__C);
	}			}

	static __inline__ __m128 __DEFAULT_FN_ATTRS			static __inline__ __m128 __DEFAULT_FN_ATTRS128
	_mm_msubadd_ps(__m128 __A, __m128 __B, __m128 __C)			_mm_msubadd_ps(__m128 __A, __m128 __B, __m128 __C)
	{			{
	return (__m128)__builtin_ia32_vfmaddsubps((__v4sf)__A, (__v4sf)__B, -(__v4sf)__C);			return (__m128)__builtin_ia32_vfmaddsubps((__v4sf)__A, (__v4sf)__B, -(__v4sf)__C);
	}			}

	static __inline__ __m128d __DEFAULT_FN_ATTRS			static __inline__ __m128d __DEFAULT_FN_ATTRS128
	_mm_msubadd_pd(__m128d __A, __m128d __B, __m128d __C)			_mm_msubadd_pd(__m128d __A, __m128d __B, __m128d __C)
	{			{
	return (__m128d)__builtin_ia32_vfmaddsubpd((__v2df)__A, (__v2df)__B, -(__v2df)__C);			return (__m128d)__builtin_ia32_vfmaddsubpd((__v2df)__A, (__v2df)__B, -(__v2df)__C);
	}			}

	static __inline__ __m256 __DEFAULT_FN_ATTRS			static __inline__ __m256 __DEFAULT_FN_ATTRS256
	_mm256_macc_ps(__m256 __A, __m256 __B, __m256 __C)			_mm256_macc_ps(__m256 __A, __m256 __B, __m256 __C)
	{			{
	return (__m256)__builtin_ia32_vfmaddps256((__v8sf)__A, (__v8sf)__B, (__v8sf)__C);			return (__m256)__builtin_ia32_vfmaddps256((__v8sf)__A, (__v8sf)__B, (__v8sf)__C);
	}			}

	static __inline__ __m256d __DEFAULT_FN_ATTRS			static __inline__ __m256d __DEFAULT_FN_ATTRS256
	_mm256_macc_pd(__m256d __A, __m256d __B, __m256d __C)			_mm256_macc_pd(__m256d __A, __m256d __B, __m256d __C)
	{			{
	return (__m256d)__builtin_ia32_vfmaddpd256((__v4df)__A, (__v4df)__B, (__v4df)__C);			return (__m256d)__builtin_ia32_vfmaddpd256((__v4df)__A, (__v4df)__B, (__v4df)__C);
	}			}

	static __inline__ __m256 __DEFAULT_FN_ATTRS			static __inline__ __m256 __DEFAULT_FN_ATTRS256
	_mm256_msub_ps(__m256 __A, __m256 __B, __m256 __C)			_mm256_msub_ps(__m256 __A, __m256 __B, __m256 __C)
	{			{
	return (__m256)__builtin_ia32_vfmaddps256((__v8sf)__A, (__v8sf)__B, -(__v8sf)__C);			return (__m256)__builtin_ia32_vfmaddps256((__v8sf)__A, (__v8sf)__B, -(__v8sf)__C);
	}			}

	static __inline__ __m256d __DEFAULT_FN_ATTRS			static __inline__ __m256d __DEFAULT_FN_ATTRS256
	_mm256_msub_pd(__m256d __A, __m256d __B, __m256d __C)			_mm256_msub_pd(__m256d __A, __m256d __B, __m256d __C)
	{			{
	return (__m256d)__builtin_ia32_vfmaddpd256((__v4df)__A, (__v4df)__B, -(__v4df)__C);			return (__m256d)__builtin_ia32_vfmaddpd256((__v4df)__A, (__v4df)__B, -(__v4df)__C);
	}			}

	static __inline__ __m256 __DEFAULT_FN_ATTRS			static __inline__ __m256 __DEFAULT_FN_ATTRS256
	_mm256_nmacc_ps(__m256 __A, __m256 __B, __m256 __C)			_mm256_nmacc_ps(__m256 __A, __m256 __B, __m256 __C)
	{			{
	return (__m256)__builtin_ia32_vfmaddps256(-(__v8sf)__A, (__v8sf)__B, (__v8sf)__C);			return (__m256)__builtin_ia32_vfmaddps256(-(__v8sf)__A, (__v8sf)__B, (__v8sf)__C);
	}			}

	static __inline__ __m256d __DEFAULT_FN_ATTRS			static __inline__ __m256d __DEFAULT_FN_ATTRS256
	_mm256_nmacc_pd(__m256d __A, __m256d __B, __m256d __C)			_mm256_nmacc_pd(__m256d __A, __m256d __B, __m256d __C)
	{			{
	return (__m256d)__builtin_ia32_vfmaddpd256(-(__v4df)__A, (__v4df)__B, (__v4df)__C);			return (__m256d)__builtin_ia32_vfmaddpd256(-(__v4df)__A, (__v4df)__B, (__v4df)__C);
	}			}

	static __inline__ __m256 __DEFAULT_FN_ATTRS			static __inline__ __m256 __DEFAULT_FN_ATTRS256
	_mm256_nmsub_ps(__m256 __A, __m256 __B, __m256 __C)			_mm256_nmsub_ps(__m256 __A, __m256 __B, __m256 __C)
	{			{
	return (__m256)__builtin_ia32_vfmaddps256(-(__v8sf)__A, (__v8sf)__B, -(__v8sf)__C);			return (__m256)__builtin_ia32_vfmaddps256(-(__v8sf)__A, (__v8sf)__B, -(__v8sf)__C);
	}			}

	static __inline__ __m256d __DEFAULT_FN_ATTRS			static __inline__ __m256d __DEFAULT_FN_ATTRS256
	_mm256_nmsub_pd(__m256d __A, __m256d __B, __m256d __C)			_mm256_nmsub_pd(__m256d __A, __m256d __B, __m256d __C)
	{			{
	return (__m256d)__builtin_ia32_vfmaddpd256(-(__v4df)__A, (__v4df)__B, -(__v4df)__C);			return (__m256d)__builtin_ia32_vfmaddpd256(-(__v4df)__A, (__v4df)__B, -(__v4df)__C);
	}			}

	static __inline__ __m256 __DEFAULT_FN_ATTRS			static __inline__ __m256 __DEFAULT_FN_ATTRS256
	_mm256_maddsub_ps(__m256 __A, __m256 __B, __m256 __C)			_mm256_maddsub_ps(__m256 __A, __m256 __B, __m256 __C)
	{			{
	return (__m256)__builtin_ia32_vfmaddsubps256((__v8sf)__A, (__v8sf)__B, (__v8sf)__C);			return (__m256)__builtin_ia32_vfmaddsubps256((__v8sf)__A, (__v8sf)__B, (__v8sf)__C);
	}			}

	static __inline__ __m256d __DEFAULT_FN_ATTRS			static __inline__ __m256d __DEFAULT_FN_ATTRS256
	_mm256_maddsub_pd(__m256d __A, __m256d __B, __m256d __C)			_mm256_maddsub_pd(__m256d __A, __m256d __B, __m256d __C)
	{			{
	return (__m256d)__builtin_ia32_vfmaddsubpd256((__v4df)__A, (__v4df)__B, (__v4df)__C);			return (__m256d)__builtin_ia32_vfmaddsubpd256((__v4df)__A, (__v4df)__B, (__v4df)__C);
	}			}

	static __inline__ __m256 __DEFAULT_FN_ATTRS			static __inline__ __m256 __DEFAULT_FN_ATTRS256
	_mm256_msubadd_ps(__m256 __A, __m256 __B, __m256 __C)			_mm256_msubadd_ps(__m256 __A, __m256 __B, __m256 __C)
	{			{
	return (__m256)__builtin_ia32_vfmaddsubps256((__v8sf)__A, (__v8sf)__B, -(__v8sf)__C);			return (__m256)__builtin_ia32_vfmaddsubps256((__v8sf)__A, (__v8sf)__B, -(__v8sf)__C);
	}			}

	static __inline__ __m256d __DEFAULT_FN_ATTRS			static __inline__ __m256d __DEFAULT_FN_ATTRS256
	_mm256_msubadd_pd(__m256d __A, __m256d __B, __m256d __C)			_mm256_msubadd_pd(__m256d __A, __m256d __B, __m256d __C)
	{			{
	return (__m256d)__builtin_ia32_vfmaddsubpd256((__v4df)__A, (__v4df)__B, -(__v4df)__C);			return (__m256d)__builtin_ia32_vfmaddsubpd256((__v4df)__A, (__v4df)__B, -(__v4df)__C);
	}			}

	#undef __DEFAULT_FN_ATTRS			#undef __DEFAULT_FN_ATTRS128
				#undef __DEFAULT_FN_ATTRS256

	#endif /* __FMA4INTRIN_H */			#endif /* __FMA4INTRIN_H */

lib/Headers/fmaintrin.h

	Show All 23 Lines
	#ifndef __IMMINTRIN_H			#ifndef __IMMINTRIN_H
	#error "Never use <fmaintrin.h> directly; include <immintrin.h> instead."			#error "Never use <fmaintrin.h> directly; include <immintrin.h> instead."
	#endif			#endif

	#ifndef __FMAINTRIN_H			#ifndef __FMAINTRIN_H
	#define __FMAINTRIN_H			#define __FMAINTRIN_H

	/* Define the default attributes for the functions in this file. */			/* Define the default attributes for the functions in this file. */
	#define __DEFAULT_FN_ATTRS __attribute__((__always_inline__, __nodebug__, __target__("fma")))			#define __DEFAULT_FN_ATTRS128 __attribute__((__always_inline__, __nodebug__, __target__("fma"), __min_vector_width__(128)))
				#define __DEFAULT_FN_ATTRS256 __attribute__((__always_inline__, __nodebug__, __target__("fma"), __min_vector_width__(256)))

	static __inline__ __m128 __DEFAULT_FN_ATTRS			static __inline__ __m128 __DEFAULT_FN_ATTRS128
	_mm_fmadd_ps(__m128 __A, __m128 __B, __m128 __C)			_mm_fmadd_ps(__m128 __A, __m128 __B, __m128 __C)
	{			{
	return (__m128)__builtin_ia32_vfmaddps((__v4sf)__A, (__v4sf)__B, (__v4sf)__C);			return (__m128)__builtin_ia32_vfmaddps((__v4sf)__A, (__v4sf)__B, (__v4sf)__C);
	}			}

	static __inline__ __m128d __DEFAULT_FN_ATTRS			static __inline__ __m128d __DEFAULT_FN_ATTRS128
	_mm_fmadd_pd(__m128d __A, __m128d __B, __m128d __C)			_mm_fmadd_pd(__m128d __A, __m128d __B, __m128d __C)
	{			{
	return (__m128d)__builtin_ia32_vfmaddpd((__v2df)__A, (__v2df)__B, (__v2df)__C);			return (__m128d)__builtin_ia32_vfmaddpd((__v2df)__A, (__v2df)__B, (__v2df)__C);
	}			}

	static __inline__ __m128 __DEFAULT_FN_ATTRS			static __inline__ __m128 __DEFAULT_FN_ATTRS128
	_mm_fmadd_ss(__m128 __A, __m128 __B, __m128 __C)			_mm_fmadd_ss(__m128 __A, __m128 __B, __m128 __C)
	{			{
	return (__m128)__builtin_ia32_vfmaddss3((__v4sf)__A, (__v4sf)__B, (__v4sf)__C);			return (__m128)__builtin_ia32_vfmaddss3((__v4sf)__A, (__v4sf)__B, (__v4sf)__C);
	}			}

	static __inline__ __m128d __DEFAULT_FN_ATTRS			static __inline__ __m128d __DEFAULT_FN_ATTRS128
	_mm_fmadd_sd(__m128d __A, __m128d __B, __m128d __C)			_mm_fmadd_sd(__m128d __A, __m128d __B, __m128d __C)
	{			{
	return (__m128d)__builtin_ia32_vfmaddsd3((__v2df)__A, (__v2df)__B, (__v2df)__C);			return (__m128d)__builtin_ia32_vfmaddsd3((__v2df)__A, (__v2df)__B, (__v2df)__C);
	}			}

	static __inline__ __m128 __DEFAULT_FN_ATTRS			static __inline__ __m128 __DEFAULT_FN_ATTRS128
	_mm_fmsub_ps(__m128 __A, __m128 __B, __m128 __C)			_mm_fmsub_ps(__m128 __A, __m128 __B, __m128 __C)
	{			{
	return (__m128)__builtin_ia32_vfmaddps((__v4sf)__A, (__v4sf)__B, -(__v4sf)__C);			return (__m128)__builtin_ia32_vfmaddps((__v4sf)__A, (__v4sf)__B, -(__v4sf)__C);
	}			}

	static __inline__ __m128d __DEFAULT_FN_ATTRS			static __inline__ __m128d __DEFAULT_FN_ATTRS128
	_mm_fmsub_pd(__m128d __A, __m128d __B, __m128d __C)			_mm_fmsub_pd(__m128d __A, __m128d __B, __m128d __C)
	{			{
	return (__m128d)__builtin_ia32_vfmaddpd((__v2df)__A, (__v2df)__B, -(__v2df)__C);			return (__m128d)__builtin_ia32_vfmaddpd((__v2df)__A, (__v2df)__B, -(__v2df)__C);
	}			}

	static __inline__ __m128 __DEFAULT_FN_ATTRS			static __inline__ __m128 __DEFAULT_FN_ATTRS128
	_mm_fmsub_ss(__m128 __A, __m128 __B, __m128 __C)			_mm_fmsub_ss(__m128 __A, __m128 __B, __m128 __C)
	{			{
	return (__m128)__builtin_ia32_vfmaddss3((__v4sf)__A, (__v4sf)__B, -(__v4sf)__C);			return (__m128)__builtin_ia32_vfmaddss3((__v4sf)__A, (__v4sf)__B, -(__v4sf)__C);
	}			}

	static __inline__ __m128d __DEFAULT_FN_ATTRS			static __inline__ __m128d __DEFAULT_FN_ATTRS128
	_mm_fmsub_sd(__m128d __A, __m128d __B, __m128d __C)			_mm_fmsub_sd(__m128d __A, __m128d __B, __m128d __C)
	{			{
	return (__m128d)__builtin_ia32_vfmaddsd3((__v2df)__A, (__v2df)__B, -(__v2df)__C);			return (__m128d)__builtin_ia32_vfmaddsd3((__v2df)__A, (__v2df)__B, -(__v2df)__C);
	}			}

	static __inline__ __m128 __DEFAULT_FN_ATTRS			static __inline__ __m128 __DEFAULT_FN_ATTRS128
	_mm_fnmadd_ps(__m128 __A, __m128 __B, __m128 __C)			_mm_fnmadd_ps(__m128 __A, __m128 __B, __m128 __C)
	{			{
	return (__m128)__builtin_ia32_vfmaddps(-(__v4sf)__A, (__v4sf)__B, (__v4sf)__C);			return (__m128)__builtin_ia32_vfmaddps(-(__v4sf)__A, (__v4sf)__B, (__v4sf)__C);
	}			}

	static __inline__ __m128d __DEFAULT_FN_ATTRS			static __inline__ __m128d __DEFAULT_FN_ATTRS128
	_mm_fnmadd_pd(__m128d __A, __m128d __B, __m128d __C)			_mm_fnmadd_pd(__m128d __A, __m128d __B, __m128d __C)
	{			{
	return (__m128d)__builtin_ia32_vfmaddpd(-(__v2df)__A, (__v2df)__B, (__v2df)__C);			return (__m128d)__builtin_ia32_vfmaddpd(-(__v2df)__A, (__v2df)__B, (__v2df)__C);
	}			}

	static __inline__ __m128 __DEFAULT_FN_ATTRS			static __inline__ __m128 __DEFAULT_FN_ATTRS128
	_mm_fnmadd_ss(__m128 __A, __m128 __B, __m128 __C)			_mm_fnmadd_ss(__m128 __A, __m128 __B, __m128 __C)
	{			{
	return (__m128)__builtin_ia32_vfmaddss3((__v4sf)__A, -(__v4sf)__B, (__v4sf)__C);			return (__m128)__builtin_ia32_vfmaddss3((__v4sf)__A, -(__v4sf)__B, (__v4sf)__C);
	}			}

	static __inline__ __m128d __DEFAULT_FN_ATTRS			static __inline__ __m128d __DEFAULT_FN_ATTRS128
	_mm_fnmadd_sd(__m128d __A, __m128d __B, __m128d __C)			_mm_fnmadd_sd(__m128d __A, __m128d __B, __m128d __C)
	{			{
	return (__m128d)__builtin_ia32_vfmaddsd3((__v2df)__A, -(__v2df)__B, (__v2df)__C);			return (__m128d)__builtin_ia32_vfmaddsd3((__v2df)__A, -(__v2df)__B, (__v2df)__C);
	}			}

	static __inline__ __m128 __DEFAULT_FN_ATTRS			static __inline__ __m128 __DEFAULT_FN_ATTRS128
	_mm_fnmsub_ps(__m128 __A, __m128 __B, __m128 __C)			_mm_fnmsub_ps(__m128 __A, __m128 __B, __m128 __C)
	{			{
	return (__m128)__builtin_ia32_vfmaddps(-(__v4sf)__A, (__v4sf)__B, -(__v4sf)__C);			return (__m128)__builtin_ia32_vfmaddps(-(__v4sf)__A, (__v4sf)__B, -(__v4sf)__C);
	}			}

	static __inline__ __m128d __DEFAULT_FN_ATTRS			static __inline__ __m128d __DEFAULT_FN_ATTRS128
	_mm_fnmsub_pd(__m128d __A, __m128d __B, __m128d __C)			_mm_fnmsub_pd(__m128d __A, __m128d __B, __m128d __C)
	{			{
	return (__m128d)__builtin_ia32_vfmaddpd(-(__v2df)__A, (__v2df)__B, -(__v2df)__C);			return (__m128d)__builtin_ia32_vfmaddpd(-(__v2df)__A, (__v2df)__B, -(__v2df)__C);
	}			}

	static __inline__ __m128 __DEFAULT_FN_ATTRS			static __inline__ __m128 __DEFAULT_FN_ATTRS128
	_mm_fnmsub_ss(__m128 __A, __m128 __B, __m128 __C)			_mm_fnmsub_ss(__m128 __A, __m128 __B, __m128 __C)
	{			{
	return (__m128)__builtin_ia32_vfmaddss3((__v4sf)__A, -(__v4sf)__B, -(__v4sf)__C);			return (__m128)__builtin_ia32_vfmaddss3((__v4sf)__A, -(__v4sf)__B, -(__v4sf)__C);
	}			}

	static __inline__ __m128d __DEFAULT_FN_ATTRS			static __inline__ __m128d __DEFAULT_FN_ATTRS128
	_mm_fnmsub_sd(__m128d __A, __m128d __B, __m128d __C)			_mm_fnmsub_sd(__m128d __A, __m128d __B, __m128d __C)
	{			{
	return (__m128d)__builtin_ia32_vfmaddsd3((__v2df)__A, -(__v2df)__B, -(__v2df)__C);			return (__m128d)__builtin_ia32_vfmaddsd3((__v2df)__A, -(__v2df)__B, -(__v2df)__C);
	}			}

	static __inline__ __m128 __DEFAULT_FN_ATTRS			static __inline__ __m128 __DEFAULT_FN_ATTRS128
	_mm_fmaddsub_ps(__m128 __A, __m128 __B, __m128 __C)			_mm_fmaddsub_ps(__m128 __A, __m128 __B, __m128 __C)
	{			{
	return (__m128)__builtin_ia32_vfmaddsubps((__v4sf)__A, (__v4sf)__B, (__v4sf)__C);			return (__m128)__builtin_ia32_vfmaddsubps((__v4sf)__A, (__v4sf)__B, (__v4sf)__C);
	}			}

	static __inline__ __m128d __DEFAULT_FN_ATTRS			static __inline__ __m128d __DEFAULT_FN_ATTRS128
	_mm_fmaddsub_pd(__m128d __A, __m128d __B, __m128d __C)			_mm_fmaddsub_pd(__m128d __A, __m128d __B, __m128d __C)
	{			{
	return (__m128d)__builtin_ia32_vfmaddsubpd((__v2df)__A, (__v2df)__B, (__v2df)__C);			return (__m128d)__builtin_ia32_vfmaddsubpd((__v2df)__A, (__v2df)__B, (__v2df)__C);
	}			}

	static __inline__ __m128 __DEFAULT_FN_ATTRS			static __inline__ __m128 __DEFAULT_FN_ATTRS128
	_mm_fmsubadd_ps(__m128 __A, __m128 __B, __m128 __C)			_mm_fmsubadd_ps(__m128 __A, __m128 __B, __m128 __C)
	{			{
	return (__m128)__builtin_ia32_vfmaddsubps((__v4sf)__A, (__v4sf)__B, -(__v4sf)__C);			return (__m128)__builtin_ia32_vfmaddsubps((__v4sf)__A, (__v4sf)__B, -(__v4sf)__C);
	}			}

	static __inline__ __m128d __DEFAULT_FN_ATTRS			static __inline__ __m128d __DEFAULT_FN_ATTRS128
	_mm_fmsubadd_pd(__m128d __A, __m128d __B, __m128d __C)			_mm_fmsubadd_pd(__m128d __A, __m128d __B, __m128d __C)
	{			{
	return (__m128d)__builtin_ia32_vfmaddsubpd((__v2df)__A, (__v2df)__B, -(__v2df)__C);			return (__m128d)__builtin_ia32_vfmaddsubpd((__v2df)__A, (__v2df)__B, -(__v2df)__C);
	}			}

	static __inline__ __m256 __DEFAULT_FN_ATTRS			static __inline__ __m256 __DEFAULT_FN_ATTRS256
	_mm256_fmadd_ps(__m256 __A, __m256 __B, __m256 __C)			_mm256_fmadd_ps(__m256 __A, __m256 __B, __m256 __C)
	{			{
	return (__m256)__builtin_ia32_vfmaddps256((__v8sf)__A, (__v8sf)__B, (__v8sf)__C);			return (__m256)__builtin_ia32_vfmaddps256((__v8sf)__A, (__v8sf)__B, (__v8sf)__C);
	}			}

	static __inline__ __m256d __DEFAULT_FN_ATTRS			static __inline__ __m256d __DEFAULT_FN_ATTRS256
	_mm256_fmadd_pd(__m256d __A, __m256d __B, __m256d __C)			_mm256_fmadd_pd(__m256d __A, __m256d __B, __m256d __C)
	{			{
	return (__m256d)__builtin_ia32_vfmaddpd256((__v4df)__A, (__v4df)__B, (__v4df)__C);			return (__m256d)__builtin_ia32_vfmaddpd256((__v4df)__A, (__v4df)__B, (__v4df)__C);
	}			}

	static __inline__ __m256 __DEFAULT_FN_ATTRS			static __inline__ __m256 __DEFAULT_FN_ATTRS256
	_mm256_fmsub_ps(__m256 __A, __m256 __B, __m256 __C)			_mm256_fmsub_ps(__m256 __A, __m256 __B, __m256 __C)
	{			{
	return (__m256)__builtin_ia32_vfmaddps256((__v8sf)__A, (__v8sf)__B, -(__v8sf)__C);			return (__m256)__builtin_ia32_vfmaddps256((__v8sf)__A, (__v8sf)__B, -(__v8sf)__C);
	}			}

	static __inline__ __m256d __DEFAULT_FN_ATTRS			static __inline__ __m256d __DEFAULT_FN_ATTRS256
	_mm256_fmsub_pd(__m256d __A, __m256d __B, __m256d __C)			_mm256_fmsub_pd(__m256d __A, __m256d __B, __m256d __C)
	{			{
	return (__m256d)__builtin_ia32_vfmaddpd256((__v4df)__A, (__v4df)__B, -(__v4df)__C);			return (__m256d)__builtin_ia32_vfmaddpd256((__v4df)__A, (__v4df)__B, -(__v4df)__C);
	}			}

	static __inline__ __m256 __DEFAULT_FN_ATTRS			static __inline__ __m256 __DEFAULT_FN_ATTRS256
	_mm256_fnmadd_ps(__m256 __A, __m256 __B, __m256 __C)			_mm256_fnmadd_ps(__m256 __A, __m256 __B, __m256 __C)
	{			{
	return (__m256)__builtin_ia32_vfmaddps256(-(__v8sf)__A, (__v8sf)__B, (__v8sf)__C);			return (__m256)__builtin_ia32_vfmaddps256(-(__v8sf)__A, (__v8sf)__B, (__v8sf)__C);
	}			}

	static __inline__ __m256d __DEFAULT_FN_ATTRS			static __inline__ __m256d __DEFAULT_FN_ATTRS256
	_mm256_fnmadd_pd(__m256d __A, __m256d __B, __m256d __C)			_mm256_fnmadd_pd(__m256d __A, __m256d __B, __m256d __C)
	{			{
	return (__m256d)__builtin_ia32_vfmaddpd256(-(__v4df)__A, (__v4df)__B, (__v4df)__C);			return (__m256d)__builtin_ia32_vfmaddpd256(-(__v4df)__A, (__v4df)__B, (__v4df)__C);
	}			}

	static __inline__ __m256 __DEFAULT_FN_ATTRS			static __inline__ __m256 __DEFAULT_FN_ATTRS256
	_mm256_fnmsub_ps(__m256 __A, __m256 __B, __m256 __C)			_mm256_fnmsub_ps(__m256 __A, __m256 __B, __m256 __C)
	{			{
	return (__m256)__builtin_ia32_vfmaddps256(-(__v8sf)__A, (__v8sf)__B, -(__v8sf)__C);			return (__m256)__builtin_ia32_vfmaddps256(-(__v8sf)__A, (__v8sf)__B, -(__v8sf)__C);
	}			}

	static __inline__ __m256d __DEFAULT_FN_ATTRS			static __inline__ __m256d __DEFAULT_FN_ATTRS256
	_mm256_fnmsub_pd(__m256d __A, __m256d __B, __m256d __C)			_mm256_fnmsub_pd(__m256d __A, __m256d __B, __m256d __C)
	{			{
	return (__m256d)__builtin_ia32_vfmaddpd256(-(__v4df)__A, (__v4df)__B, -(__v4df)__C);			return (__m256d)__builtin_ia32_vfmaddpd256(-(__v4df)__A, (__v4df)__B, -(__v4df)__C);
	}			}

	static __inline__ __m256 __DEFAULT_FN_ATTRS			static __inline__ __m256 __DEFAULT_FN_ATTRS256
	_mm256_fmaddsub_ps(__m256 __A, __m256 __B, __m256 __C)			_mm256_fmaddsub_ps(__m256 __A, __m256 __B, __m256 __C)
	{			{
	return (__m256)__builtin_ia32_vfmaddsubps256((__v8sf)__A, (__v8sf)__B, (__v8sf)__C);			return (__m256)__builtin_ia32_vfmaddsubps256((__v8sf)__A, (__v8sf)__B, (__v8sf)__C);
	}			}

	static __inline__ __m256d __DEFAULT_FN_ATTRS			static __inline__ __m256d __DEFAULT_FN_ATTRS256
	_mm256_fmaddsub_pd(__m256d __A, __m256d __B, __m256d __C)			_mm256_fmaddsub_pd(__m256d __A, __m256d __B, __m256d __C)
	{			{
	return (__m256d)__builtin_ia32_vfmaddsubpd256((__v4df)__A, (__v4df)__B, (__v4df)__C);			return (__m256d)__builtin_ia32_vfmaddsubpd256((__v4df)__A, (__v4df)__B, (__v4df)__C);
	}			}

	static __inline__ __m256 __DEFAULT_FN_ATTRS			static __inline__ __m256 __DEFAULT_FN_ATTRS256
	_mm256_fmsubadd_ps(__m256 __A, __m256 __B, __m256 __C)			_mm256_fmsubadd_ps(__m256 __A, __m256 __B, __m256 __C)
	{			{
	return (__m256)__builtin_ia32_vfmaddsubps256((__v8sf)__A, (__v8sf)__B, -(__v8sf)__C);			return (__m256)__builtin_ia32_vfmaddsubps256((__v8sf)__A, (__v8sf)__B, -(__v8sf)__C);
	}			}

	static __inline__ __m256d __DEFAULT_FN_ATTRS			static __inline__ __m256d __DEFAULT_FN_ATTRS256
	_mm256_fmsubadd_pd(__m256d __A, __m256d __B, __m256d __C)			_mm256_fmsubadd_pd(__m256d __A, __m256d __B, __m256d __C)
	{			{
	return (__m256d)__builtin_ia32_vfmaddsubpd256((__v4df)__A, (__v4df)__B, -(__v4df)__C);			return (__m256d)__builtin_ia32_vfmaddsubpd256((__v4df)__A, (__v4df)__B, -(__v4df)__C);
	}			}

	#undef __DEFAULT_FN_ATTRS			#undef __DEFAULT_FN_ATTRS128
				#undef __DEFAULT_FN_ATTRS256

	#endif /* __FMAINTRIN_H */			#endif /* __FMAINTRIN_H */

lib/Headers/gfniintrin.h

Show First 20 Lines • Show All 114 Lines • ▼ Show 20 Lines	(__m512i)__builtin_ia32_selectb_512((__mmask64)(U), \
(__v64qi)_mm512_gf2p8affine_epi64_epi8(A, B, I), \		(__v64qi)_mm512_gf2p8affine_epi64_epi8(A, B, I), \
(__v64qi)(__m512i)(S))		(__v64qi)(__m512i)(S))

#define _mm512_maskz_gf2p8affine_epi64_epi8(U, A, B, I) \		#define _mm512_maskz_gf2p8affine_epi64_epi8(U, A, B, I) \
(__m512i)_mm512_mask_gf2p8affine_epi64_epi8((__m512i)_mm512_setzero_si512(), \		(__m512i)_mm512_mask_gf2p8affine_epi64_epi8((__m512i)_mm512_setzero_si512(), \
U, A, B, I)		U, A, B, I)

/* Default attributes for simple form (no masking). */		/* Default attributes for simple form (no masking). */
#define __DEFAULT_FN_ATTRS __attribute__((__always_inline__, __nodebug__, __target__("gfni")))		#define __DEFAULT_FN_ATTRS __attribute__((__always_inline__, __nodebug__, __target__("gfni"), __min_vector_width__(128)))

/* Default attributes for YMM unmasked form. */		/* Default attributes for YMM unmasked form. */
#define __DEFAULT_FN_ATTRS_Y __attribute__((__always_inline__, __nodebug__, __target__("avx,gfni")))		#define __DEFAULT_FN_ATTRS_Y __attribute__((__always_inline__, __nodebug__, __target__("avx,gfni"), __min_vector_width__(256)))

/* Default attributes for ZMM forms. */		/* Default attributes for ZMM forms. */
#define __DEFAULT_FN_ATTRS_Z __attribute__((__always_inline__, __nodebug__, __target__("avx512bw,gfni")))		#define __DEFAULT_FN_ATTRS_Z __attribute__((__always_inline__, __nodebug__, __target__("avx512bw,gfni"), __min_vector_width__(512)))

/* Default attributes for VLX forms. */		/* Default attributes for VLX forms. */
#define __DEFAULT_FN_ATTRS_VL __attribute__((__always_inline__, __nodebug__, __target__("avx512bw,avx512vl,gfni")))		#define __DEFAULT_FN_ATTRS_VL128 __attribute__((__always_inline__, __nodebug__, __target__("avx512bw,avx512vl,gfni"), __min_vector_width__(128)))
		#define __DEFAULT_FN_ATTRS_VL256 __attribute__((__always_inline__, __nodebug__, __target__("avx512bw,avx512vl,gfni"), __min_vector_width__(256)))

static __inline__ __m128i __DEFAULT_FN_ATTRS		static __inline__ __m128i __DEFAULT_FN_ATTRS
_mm_gf2p8mul_epi8(__m128i __A, __m128i __B)		_mm_gf2p8mul_epi8(__m128i __A, __m128i __B)
{		{
return (__m128i) __builtin_ia32_vgf2p8mulb_v16qi((__v16qi) __A,		return (__m128i) __builtin_ia32_vgf2p8mulb_v16qi((__v16qi) __A,
(__v16qi) __B);		(__v16qi) __B);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS_VL		static __inline__ __m128i __DEFAULT_FN_ATTRS_VL128
_mm_mask_gf2p8mul_epi8(__m128i __S, __mmask16 __U, __m128i __A, __m128i __B)		_mm_mask_gf2p8mul_epi8(__m128i __S, __mmask16 __U, __m128i __A, __m128i __B)
{		{
return (__m128i) __builtin_ia32_selectb_128(__U,		return (__m128i) __builtin_ia32_selectb_128(__U,
(__v16qi) _mm_gf2p8mul_epi8(__A, __B),		(__v16qi) _mm_gf2p8mul_epi8(__A, __B),
(__v16qi) __S);		(__v16qi) __S);
}		}

static __inline__ __m128i __DEFAULT_FN_ATTRS_VL		static __inline__ __m128i __DEFAULT_FN_ATTRS_VL128
_mm_maskz_gf2p8mul_epi8(__mmask16 __U, __m128i __A, __m128i __B)		_mm_maskz_gf2p8mul_epi8(__mmask16 __U, __m128i __A, __m128i __B)
{		{
return _mm_mask_gf2p8mul_epi8((__m128i)_mm_setzero_si128(),		return _mm_mask_gf2p8mul_epi8((__m128i)_mm_setzero_si128(),
__U, __A, __B);		__U, __A, __B);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS_Y		static __inline__ __m256i __DEFAULT_FN_ATTRS_Y
_mm256_gf2p8mul_epi8(__m256i __A, __m256i __B)		_mm256_gf2p8mul_epi8(__m256i __A, __m256i __B)
{		{
return (__m256i) __builtin_ia32_vgf2p8mulb_v32qi((__v32qi) __A,		return (__m256i) __builtin_ia32_vgf2p8mulb_v32qi((__v32qi) __A,
(__v32qi) __B);		(__v32qi) __B);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS_VL		static __inline__ __m256i __DEFAULT_FN_ATTRS_VL256
_mm256_mask_gf2p8mul_epi8(__m256i __S, __mmask32 __U, __m256i __A, __m256i __B)		_mm256_mask_gf2p8mul_epi8(__m256i __S, __mmask32 __U, __m256i __A, __m256i __B)
{		{
return (__m256i) __builtin_ia32_selectb_256(__U,		return (__m256i) __builtin_ia32_selectb_256(__U,
(__v32qi) _mm256_gf2p8mul_epi8(__A, __B),		(__v32qi) _mm256_gf2p8mul_epi8(__A, __B),
(__v32qi) __S);		(__v32qi) __S);
}		}

static __inline__ __m256i __DEFAULT_FN_ATTRS_VL		static __inline__ __m256i __DEFAULT_FN_ATTRS_VL256
_mm256_maskz_gf2p8mul_epi8(__mmask32 __U, __m256i __A, __m256i __B)		_mm256_maskz_gf2p8mul_epi8(__mmask32 __U, __m256i __A, __m256i __B)
{		{
return _mm256_mask_gf2p8mul_epi8((__m256i)_mm256_setzero_si256(),		return _mm256_mask_gf2p8mul_epi8((__m256i)_mm256_setzero_si256(),
__U, __A, __B);		__U, __A, __B);
}		}

static __inline__ __m512i __DEFAULT_FN_ATTRS_Z		static __inline__ __m512i __DEFAULT_FN_ATTRS_Z
_mm512_gf2p8mul_epi8(__m512i __A, __m512i __B)		_mm512_gf2p8mul_epi8(__m512i __A, __m512i __B)
Show All 15 Lines
{		{
return _mm512_mask_gf2p8mul_epi8((__m512i)_mm512_setzero_si512(),		return _mm512_mask_gf2p8mul_epi8((__m512i)_mm512_setzero_si512(),
__U, __A, __B);		__U, __A, __B);
}		}

#undef __DEFAULT_FN_ATTRS		#undef __DEFAULT_FN_ATTRS
#undef __DEFAULT_FN_ATTRS_Y		#undef __DEFAULT_FN_ATTRS_Y
#undef __DEFAULT_FN_ATTRS_Z		#undef __DEFAULT_FN_ATTRS_Z
#undef __DEFAULT_FN_ATTRS_VL		#undef __DEFAULT_FN_ATTRS_VL128
		#undef __DEFAULT_FN_ATTRS_VL256

#endif /* __GFNIINTRIN_H */		#endif /* __GFNIINTRIN_H */

lib/Headers/mm3dnow.h

	Show All 24 Lines
	#define _MM3DNOW_H_INCLUDED			#define _MM3DNOW_H_INCLUDED

	#include <mmintrin.h>			#include <mmintrin.h>
	#include <prfchwintrin.h>			#include <prfchwintrin.h>

	typedef float __v2sf __attribute__((__vector_size__(8)));			typedef float __v2sf __attribute__((__vector_size__(8)));

	/* Define the default attributes for the functions in this file. */			/* Define the default attributes for the functions in this file. */
	#define __DEFAULT_FN_ATTRS __attribute__((__always_inline__, __nodebug__, __target__("3dnow")))			#define __DEFAULT_FN_ATTRS __attribute__((__always_inline__, __nodebug__, __target__("3dnow"), __min_vector_width__(64)))

	static __inline__ void __DEFAULT_FN_ATTRS			static __inline__ void __attribute__((__always_inline__, __nodebug__, __target__("3dnow")))
	_m_femms(void) {			_m_femms(void) {
	__builtin_ia32_femms();			__builtin_ia32_femms();
	}			}

	static __inline__ __m64 __DEFAULT_FN_ATTRS			static __inline__ __m64 __DEFAULT_FN_ATTRS
	_m_pavgusb(__m64 __m1, __m64 __m2) {			_m_pavgusb(__m64 __m1, __m64 __m2) {
	return (__m64)__builtin_ia32_pavgusb((__v8qi)__m1, (__v8qi)__m2);			return (__m64)__builtin_ia32_pavgusb((__v8qi)__m1, (__v8qi)__m2);
	}			}
	▲ Show 20 Lines • Show All 85 Lines • ▼ Show 20 Lines

	static __inline__ __m64 __DEFAULT_FN_ATTRS			static __inline__ __m64 __DEFAULT_FN_ATTRS
	_m_pmulhrw(__m64 __m1, __m64 __m2) {			_m_pmulhrw(__m64 __m1, __m64 __m2) {
	return (__m64)__builtin_ia32_pmulhrw((__v4hi)__m1, (__v4hi)__m2);			return (__m64)__builtin_ia32_pmulhrw((__v4hi)__m1, (__v4hi)__m2);
	}			}

	/* Handle the 3dnowa instructions here. */			/* Handle the 3dnowa instructions here. */
	#undef __DEFAULT_FN_ATTRS			#undef __DEFAULT_FN_ATTRS
	#define __DEFAULT_FN_ATTRS __attribute__((__always_inline__, __nodebug__, __target__("3dnowa")))			#define __DEFAULT_FN_ATTRS __attribute__((__always_inline__, __nodebug__, __target__("3dnowa"), __min_vector_width__(64)))

	static __inline__ __m64 __DEFAULT_FN_ATTRS			static __inline__ __m64 __DEFAULT_FN_ATTRS
	_m_pf2iw(__m64 __m) {			_m_pf2iw(__m64 __m) {
	return (__m64)__builtin_ia32_pf2iw((__v2sf)__m);			return (__m64)__builtin_ia32_pf2iw((__v2sf)__m);
	}			}

	static __inline__ __m64 __DEFAULT_FN_ATTRS			static __inline__ __m64 __DEFAULT_FN_ATTRS
	_m_pfnacc(__m64 __m1, __m64 __m2) {			_m_pfnacc(__m64 __m1, __m64 __m2) {
	Show All 26 Lines

lib/Headers/mmintrin.h

	Show All 26 Lines
	typedef long long __m64 __attribute__((__vector_size__(8)));			typedef long long __m64 __attribute__((__vector_size__(8)));

	typedef long long __v1di __attribute__((__vector_size__(8)));			typedef long long __v1di __attribute__((__vector_size__(8)));
	typedef int __v2si __attribute__((__vector_size__(8)));			typedef int __v2si __attribute__((__vector_size__(8)));
	typedef short __v4hi __attribute__((__vector_size__(8)));			typedef short __v4hi __attribute__((__vector_size__(8)));
	typedef char __v8qi __attribute__((__vector_size__(8)));			typedef char __v8qi __attribute__((__vector_size__(8)));

	/* Define the default attributes for the functions in this file. */			/* Define the default attributes for the functions in this file. */
	#define __DEFAULT_FN_ATTRS __attribute__((__always_inline__, __nodebug__, __target__("mmx")))			#define __DEFAULT_FN_ATTRS __attribute__((__always_inline__, __nodebug__, __target__("mmx"), __min_vector_width__(64)))

	/// Clears the MMX state by setting the state of the x87 stack registers			/// Clears the MMX state by setting the state of the x87 stack registers
	/// to empty.			/// to empty.
	///			///
	/// \headerfile <x86intrin.h>			/// \headerfile <x86intrin.h>
	///			///
	/// This intrinsic corresponds to the <c> EMMS </c> instruction.			/// This intrinsic corresponds to the <c> EMMS </c> instruction.
	///			///
	static __inline__ void __DEFAULT_FN_ATTRS			static __inline__ void __attribute__((__always_inline__, __nodebug__, __target__("mmx")))
	_mm_empty(void)			_mm_empty(void)
	{			{
	__builtin_ia32_emms();			__builtin_ia32_emms();
	}			}

	/// Constructs a 64-bit integer vector, setting the lower 32 bits to the			/// Constructs a 64-bit integer vector, setting the lower 32 bits to the
	/// value of the 32-bit integer parameter and setting the upper 32 bits to 0.			/// value of the 32-bit integer parameter and setting the upper 32 bits to 0.
	///			///
	▲ Show 20 Lines • Show All 1,520 Lines • Show Last 20 Lines

lib/Headers/pmmintrin.h

	Show All 22 Lines

	#ifndef __PMMINTRIN_H			#ifndef __PMMINTRIN_H
	#define __PMMINTRIN_H			#define __PMMINTRIN_H

	#include <emmintrin.h>			#include <emmintrin.h>

	/* Define the default attributes for the functions in this file. */			/* Define the default attributes for the functions in this file. */
	#define __DEFAULT_FN_ATTRS \			#define __DEFAULT_FN_ATTRS \
	__attribute__((__always_inline__, __nodebug__, __target__("sse3")))			__attribute__((__always_inline__, __nodebug__, __target__("sse3"), __min_vector_width__(128)))

	/// Loads data from an unaligned memory location to elements in a 128-bit			/// Loads data from an unaligned memory location to elements in a 128-bit
	/// vector.			/// vector.
	///			///
	/// If the address of the data is not 16-byte aligned, the instruction may			/// If the address of the data is not 16-byte aligned, the instruction may
	/// read two adjacent aligned blocks of memory to retrieve the requested			/// read two adjacent aligned blocks of memory to retrieve the requested
	/// data.			/// data.
	///			///
	▲ Show 20 Lines • Show All 265 Lines • Show Last 20 Lines

lib/Headers/shaintrin.h

	Show All 23 Lines
	#ifndef __IMMINTRIN_H			#ifndef __IMMINTRIN_H
	#error "Never use <shaintrin.h> directly; include <immintrin.h> instead."			#error "Never use <shaintrin.h> directly; include <immintrin.h> instead."
	#endif			#endif

	#ifndef __SHAINTRIN_H			#ifndef __SHAINTRIN_H
	#define __SHAINTRIN_H			#define __SHAINTRIN_H

	/* Define the default attributes for the functions in this file. */			/* Define the default attributes for the functions in this file. */
	#define __DEFAULT_FN_ATTRS __attribute__((__always_inline__, __nodebug__, __target__("sha")))			#define __DEFAULT_FN_ATTRS __attribute__((__always_inline__, __nodebug__, __target__("sha"), __min_vector_width__(128)))

	#define _mm_sha1rnds4_epu32(V1, V2, M) \			#define _mm_sha1rnds4_epu32(V1, V2, M) \
	__builtin_ia32_sha1rnds4((__v4si)(__m128i)(V1), (__v4si)(__m128i)(V2), (M))			__builtin_ia32_sha1rnds4((__v4si)(__m128i)(V1), (__v4si)(__m128i)(V2), (M))

	static __inline__ __m128i __DEFAULT_FN_ATTRS			static __inline__ __m128i __DEFAULT_FN_ATTRS
	_mm_sha1nexte_epu32(__m128i __X, __m128i __Y)			_mm_sha1nexte_epu32(__m128i __X, __m128i __Y)
	{			{
	return (__m128i)__builtin_ia32_sha1nexte((__v4si)__X, (__v4si)__Y);			return (__m128i)__builtin_ia32_sha1nexte((__v4si)__X, (__v4si)__Y);
	Show All 35 Lines

lib/Headers/smmintrin.h

	Show All 21 Lines
	*/			*/

	#ifndef __SMMINTRIN_H			#ifndef __SMMINTRIN_H
	#define __SMMINTRIN_H			#define __SMMINTRIN_H

	#include <tmmintrin.h>			#include <tmmintrin.h>

	/* Define the default attributes for the functions in this file. */			/* Define the default attributes for the functions in this file. */
	#define __DEFAULT_FN_ATTRS __attribute__((__always_inline__, __nodebug__, __target__("sse4.1")))			#define __DEFAULT_FN_ATTRS __attribute__((__always_inline__, __nodebug__, __target__("sse4.1"), __min_vector_width__(128)))

	/* SSE4 Rounding macros. */			/* SSE4 Rounding macros. */
	#define _MM_FROUND_TO_NEAREST_INT 0x00			#define _MM_FROUND_TO_NEAREST_INT 0x00
	#define _MM_FROUND_TO_NEG_INF 0x01			#define _MM_FROUND_TO_NEG_INF 0x01
	#define _MM_FROUND_TO_POS_INF 0x02			#define _MM_FROUND_TO_POS_INF 0x02
	#define _MM_FROUND_TO_ZERO 0x03			#define _MM_FROUND_TO_ZERO 0x03
	#define _MM_FROUND_CUR_DIRECTION 0x04			#define _MM_FROUND_CUR_DIRECTION 0x04

	▲ Show 20 Lines • Show All 2,406 Lines • Show Last 20 Lines

lib/Headers/tmmintrin.h

	Show All 21 Lines
	*/			*/

	#ifndef __TMMINTRIN_H			#ifndef __TMMINTRIN_H
	#define __TMMINTRIN_H			#define __TMMINTRIN_H

	#include <pmmintrin.h>			#include <pmmintrin.h>

	/* Define the default attributes for the functions in this file. */			/* Define the default attributes for the functions in this file. */
	#define __DEFAULT_FN_ATTRS __attribute__((__always_inline__, __nodebug__, __target__("ssse3")))			#define __DEFAULT_FN_ATTRS __attribute__((__always_inline__, __nodebug__, __target__("ssse3"), __min_vector_width__(64)))
	#define __DEFAULT_FN_ATTRS_MMX __attribute__((__always_inline__, __nodebug__, __target__("mmx,ssse3")))			#define __DEFAULT_FN_ATTRS_MMX __attribute__((__always_inline__, __nodebug__, __target__("mmx,ssse3"), __min_vector_width__(64)))

	/// Computes the absolute value of each of the packed 8-bit signed			/// Computes the absolute value of each of the packed 8-bit signed
	/// integers in the source operand and stores the 8-bit unsigned integer			/// integers in the source operand and stores the 8-bit unsigned integer
	/// results in the destination.			/// results in the destination.
	///			///
	/// \headerfile <x86intrin.h>			/// \headerfile <x86intrin.h>
	///			///
	/// This intrinsic corresponds to the \c PABSB instruction.			/// This intrinsic corresponds to the \c PABSB instruction.
	▲ Show 20 Lines • Show All 746 Lines • Show Last 20 Lines

lib/Headers/vaesintrin.h

	Show All 23 Lines
	#ifndef __IMMINTRIN_H			#ifndef __IMMINTRIN_H
	#error "Never use <vaesintrin.h> directly; include <immintrin.h> instead."			#error "Never use <vaesintrin.h> directly; include <immintrin.h> instead."
	#endif			#endif

	#ifndef __VAESINTRIN_H			#ifndef __VAESINTRIN_H
	#define __VAESINTRIN_H			#define __VAESINTRIN_H

	/* Default attributes for YMM forms. */			/* Default attributes for YMM forms. */
	#define __DEFAULT_FN_ATTRS __attribute__((__always_inline__, __nodebug__, __target__("vaes")))			#define __DEFAULT_FN_ATTRS __attribute__((__always_inline__, __nodebug__, __target__("vaes"), __min_vector_width__(256)))

	/* Default attributes for ZMM forms. */			/* Default attributes for ZMM forms. */
	#define __DEFAULT_FN_ATTRS_F __attribute__((__always_inline__, __nodebug__, __target__("avx512f,vaes")))			#define __DEFAULT_FN_ATTRS_F __attribute__((__always_inline__, __nodebug__, __target__("avx512f,vaes"), __min_vector_width__(512)))


	static __inline__ __m256i __DEFAULT_FN_ATTRS			static __inline__ __m256i __DEFAULT_FN_ATTRS
	_mm256_aesenc_epi128(__m256i __A, __m256i __B)			_mm256_aesenc_epi128(__m256i __A, __m256i __B)
	{			{
	return (__m256i) __builtin_ia32_aesenc256((__v4di) __A,			return (__m256i) __builtin_ia32_aesenc256((__v4di) __A,
	(__v4di) __B);			(__v4di) __B);
	}			}
	▲ Show 20 Lines • Show All 55 Lines • Show Last 20 Lines

lib/Headers/xmmintrin.h

	Show All 34 Lines

	/* This header should only be included in a hosted environment as it depends on			/* This header should only be included in a hosted environment as it depends on
	* a standard library to provide allocation routines. */			* a standard library to provide allocation routines. */
	#if __STDC_HOSTED__			#if __STDC_HOSTED__
	#include <mm_malloc.h>			#include <mm_malloc.h>
	#endif			#endif

	/* Define the default attributes for the functions in this file. */			/* Define the default attributes for the functions in this file. */
	#define __DEFAULT_FN_ATTRS __attribute__((__always_inline__, __nodebug__, __target__("sse")))			#define __DEFAULT_FN_ATTRS __attribute__((__always_inline__, __nodebug__, __target__("sse"), __min_vector_width__(128)))
	#define __DEFAULT_FN_ATTRS_MMX __attribute__((__always_inline__, __nodebug__, __target__("mmx,sse")))			#define __DEFAULT_FN_ATTRS_MMX __attribute__((__always_inline__, __nodebug__, __target__("mmx,sse"), __min_vector_width__(64)))

	/// Adds the 32-bit float values in the low-order bits of the operands.			/// Adds the 32-bit float values in the low-order bits of the operands.
	///			///
	/// \headerfile <x86intrin.h>			/// \headerfile <x86intrin.h>
	///			///
	/// This intrinsic corresponds to the <c> VADDSS / ADDSS </c> instructions.			/// This intrinsic corresponds to the <c> VADDSS / ADDSS </c> instructions.
	///			///
	/// \param __a			/// \param __a
	▲ Show 20 Lines • Show All 2,959 Lines • Show Last 20 Lines

lib/Headers/xopintrin.h

	Show All 25 Lines
	#endif			#endif

	#ifndef __XOPINTRIN_H			#ifndef __XOPINTRIN_H
	#define __XOPINTRIN_H			#define __XOPINTRIN_H

	#include <fma4intrin.h>			#include <fma4intrin.h>

	/* Define the default attributes for the functions in this file. */			/* Define the default attributes for the functions in this file. */
	#define __DEFAULT_FN_ATTRS __attribute__((__always_inline__, __nodebug__, __target__("xop")))			#define __DEFAULT_FN_ATTRS __attribute__((__always_inline__, __nodebug__, __target__("xop"), __min_vector_width__(128)))
				#define __DEFAULT_FN_ATTRS256 __attribute__((__always_inline__, __nodebug__, __target__("xop"), __min_vector_width__(256)))

	static __inline__ __m128i __DEFAULT_FN_ATTRS			static __inline__ __m128i __DEFAULT_FN_ATTRS
	_mm_maccs_epi16(__m128i __A, __m128i __B, __m128i __C)			_mm_maccs_epi16(__m128i __A, __m128i __B, __m128i __C)
	{			{
	return (__m128i)__builtin_ia32_vpmacssww((__v8hi)__A, (__v8hi)__B, (__v8hi)__C);			return (__m128i)__builtin_ia32_vpmacssww((__v8hi)__A, (__v8hi)__B, (__v8hi)__C);
	}			}

	static __inline__ __m128i __DEFAULT_FN_ATTRS			static __inline__ __m128i __DEFAULT_FN_ATTRS
	▲ Show 20 Lines • Show All 153 Lines • ▼ Show 20 Lines
	}			}

	static __inline__ __m128i __DEFAULT_FN_ATTRS			static __inline__ __m128i __DEFAULT_FN_ATTRS
	_mm_cmov_si128(__m128i __A, __m128i __B, __m128i __C)			_mm_cmov_si128(__m128i __A, __m128i __B, __m128i __C)
	{			{
	return (__m128i)(((__v2du)__A & (__v2du)__C) \| ((__v2du)__B & ~(__v2du)__C));			return (__m128i)(((__v2du)__A & (__v2du)__C) \| ((__v2du)__B & ~(__v2du)__C));
	}			}

	static __inline__ __m256i __DEFAULT_FN_ATTRS			static __inline__ __m256i __DEFAULT_FN_ATTRS256
	_mm256_cmov_si256(__m256i __A, __m256i __B, __m256i __C)			_mm256_cmov_si256(__m256i __A, __m256i __B, __m256i __C)
	{			{
	return (__m256i)(((__v4du)__A & (__v4du)__C) \| ((__v4du)__B & ~(__v4du)__C));			return (__m256i)(((__v4du)__A & (__v4du)__C) \| ((__v4du)__B & ~(__v4du)__C));
	}			}

	static __inline__ __m128i __DEFAULT_FN_ATTRS			static __inline__ __m128i __DEFAULT_FN_ATTRS
	_mm_perm_epi8(__m128i __A, __m128i __B, __m128i __C)			_mm_perm_epi8(__m128i __A, __m128i __B, __m128i __C)
	{			{
	▲ Show 20 Lines • Show All 547 Lines • ▼ Show 20 Lines
	}			}

	static __inline__ __m128d __DEFAULT_FN_ATTRS			static __inline__ __m128d __DEFAULT_FN_ATTRS
	_mm_frcz_pd(__m128d __A)			_mm_frcz_pd(__m128d __A)
	{			{
	return (__m128d)__builtin_ia32_vfrczpd((__v2df)__A);			return (__m128d)__builtin_ia32_vfrczpd((__v2df)__A);
	}			}

	static __inline__ __m256 __DEFAULT_FN_ATTRS			static __inline__ __m256 __DEFAULT_FN_ATTRS256
	_mm256_frcz_ps(__m256 __A)			_mm256_frcz_ps(__m256 __A)
	{			{
	return (__m256)__builtin_ia32_vfrczps256((__v8sf)__A);			return (__m256)__builtin_ia32_vfrczps256((__v8sf)__A);
	}			}

	static __inline__ __m256d __DEFAULT_FN_ATTRS			static __inline__ __m256d __DEFAULT_FN_ATTRS256
	_mm256_frcz_pd(__m256d __A)			_mm256_frcz_pd(__m256d __A)
	{			{
	return (__m256d)__builtin_ia32_vfrczpd256((__v4df)__A);			return (__m256d)__builtin_ia32_vfrczpd256((__v4df)__A);
	}			}

	#undef __DEFAULT_FN_ATTRS			#undef __DEFAULT_FN_ATTRS
				#undef __DEFAULT_FN_ATTRS256

	#endif /* __XOPINTRIN_H */			#endif /* __XOPINTRIN_H */

lib/Sema/SemaDeclAttr.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 2,936 Lines • ▼ Show 20 Lines	if (!S.checkStringLiteralArgumentAttr(AL, 0, Str, &LiteralLoc) \|\|
return;		return;

unsigned Index = AL.getAttributeSpellingListIndex();		unsigned Index = AL.getAttributeSpellingListIndex();
TargetAttr *NewAttr =		TargetAttr *NewAttr =
::new (S.Context) TargetAttr(AL.getRange(), S.Context, Str, Index);		::new (S.Context) TargetAttr(AL.getRange(), S.Context, Str, Index);
D->addAttr(NewAttr);		D->addAttr(NewAttr);
}		}

		static void handleMinVectorWidthAttr(Sema &S, Decl *D, const AttributeList &AL) {
		Expr *E = AL.getArgAsExpr(0);
		uint32_t VecWidth;
		if (!checkUInt32Argument(S, AL, E, VecWidth)) {
		AL.setInvalid();
		return;
		}

		MinVectorWidthAttr *Existing = D->getAttr<MinVectorWidthAttr>();
		if (Existing && Existing->getVectorWidth() != VecWidth)
		S.Diag(AL.getLoc(), diag::warn_duplicate_attribute) << AL.getName();

		D->addAttr(::new (S.Context)
		MinVectorWidthAttr(AL.getRange(), S.Context, VecWidth,
		AL.getAttributeSpellingListIndex()));
		}

static void handleCleanupAttr(Sema &S, Decl *D, const AttributeList &AL) {		static void handleCleanupAttr(Sema &S, Decl *D, const AttributeList &AL) {
Expr *E = AL.getArgAsExpr(0);		Expr *E = AL.getArgAsExpr(0);
SourceLocation Loc = E->getExprLoc();		SourceLocation Loc = E->getExprLoc();
FunctionDecl *FD = nullptr;		FunctionDecl *FD = nullptr;
DeclarationNameInfo NI;		DeclarationNameInfo NI;

// gcc only allows for simple identifiers. Since we support more than gcc, we		// gcc only allows for simple identifiers. Since we support more than gcc, we
// will warn the user.		// will warn the user.
▲ Show 20 Lines • Show All 3,172 Lines • ▼ Show 20 Lines	case AttributeList::AT_Packed:
handlePackedAttr(S, D, AL);		handlePackedAttr(S, D, AL);
break;		break;
case AttributeList::AT_Section:		case AttributeList::AT_Section:
handleSectionAttr(S, D, AL);		handleSectionAttr(S, D, AL);
break;		break;
case AttributeList::AT_Target:		case AttributeList::AT_Target:
handleTargetAttr(S, D, AL);		handleTargetAttr(S, D, AL);
break;		break;
		case AttributeList::AT_MinVectorWidth:
		handleMinVectorWidthAttr(S, D, AL);
		break;
case AttributeList::AT_Unavailable:		case AttributeList::AT_Unavailable:
handleAttrWithMessage<UnavailableAttr>(S, D, AL);		handleAttrWithMessage<UnavailableAttr>(S, D, AL);
break;		break;
case AttributeList::AT_ArcWeakrefUnavailable:		case AttributeList::AT_ArcWeakrefUnavailable:
handleSimpleAttribute<ArcWeakrefUnavailableAttr>(S, D, AL);		handleSimpleAttribute<ArcWeakrefUnavailableAttr>(S, D, AL);
break;		break;
case AttributeList::AT_ObjCRootClass:		case AttributeList::AT_ObjCRootClass:
handleSimpleAttribute<ObjCRootClassAttr>(S, D, AL);		handleSimpleAttribute<ObjCRootClassAttr>(S, D, AL);
▲ Show 20 Lines • Show All 1,541 Lines • Show Last 20 Lines

test/CodeGen/function-min-vector-width.c

This file was added.

				// This test verifies that we produce min-legal-vector-width attributes

				// RUN: %clang_cc1 -triple x86_64-unknown-unknown -emit-llvm -o - %s \| FileCheck %s

				void __attribute((__min_vector_width__(128))) foo() {}

				// CHECK: "min-legal-vector-width"="128"

test/CodeGen/x86-builtins-vector-width.c

This file was added.

				// RUN: %clang_cc1 -triple i686-linux-gnu -target-cpu i686 -emit-llvm %s -o - \| FileCheck %s

				typedef signed long long V2LLi __attribute__((vector_size(16)));
				typedef signed long long V4LLi __attribute__((vector_size(32)));

				// Make sure builtin forces a min-legal-width attribute
				void foo(void) {
				V2LLi tmp_V2LLi;

				tmp_V2LLi = __builtin_ia32_undef128();
				}

				// Make sure explicit attribute larger than builtin wins.
				void goo(void) __attribute__((__min_vector_width__(256))) {
				V2LLi tmp_V2LLi;

				tmp_V2LLi = __builtin_ia32_undef128();
				}

				// Make sure builtin larger than explicit attribute wins.
				void hoo(void) __attribute__((__min_vector_width__(128))) {
				V4LLi tmp_V4LLi;

				tmp_V4LLi = __builtin_ia32_undef256();
				}

				// CHECK: foo{{.*}} #0
				// CHECK: goo{{.*}} #1
				// CHECK: hoo{{.*}} #1

				// CHECK: #0 = {{.*}}"min-legal-vector-width"="128"
				// CHECK: #1 = {{.*}}"min-legal-vector-width"="256"

test/Sema/attr-min-vector-width.c

This file was added.

				// RUN: %clang_cc1 -triple x86_64-unknown-unknown -fsyntax-only -verify %s

				int i;
				void f(void) __attribute__((__min_vector_width__(i))); /* expected-error {{'__min_vector_width__' attribute requires an integer constant}} */

				void f2(void) __attribute__((__min_vector_width__(128)));

				void f3(void) __attribute__((__min_vector_width__(128), __min_vector_width__(256))); /* expected-warning {{attribute '__min_vector_width__' is already applied with different parameters}} */

This is an archive of the discontinued LLVM Phabricator instance.

[private] Add min_vector_width function attribute. Use it to annotate all of the x86 intrinsic header files. Emit a attribute in IRAbandonedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 152229

include/clang/Basic/Attr.td

include/clang/Basic/Builtins.h

include/clang/Basic/Builtins.def

include/clang/Basic/BuiltinsX86.def

include/clang/Basic/BuiltinsX86_64.def

lib/Basic/Builtins.cpp

lib/CodeGen/CGBuiltin.cpp

lib/CodeGen/CodeGenFunction.h

lib/CodeGen/CodeGenFunction.cpp

lib/Headers/__wmmintrin_aes.h

lib/Headers/ammintrin.h

lib/Headers/avx2intrin.h

lib/Headers/avx512bitalgintrin.h

lib/Headers/avx512bwintrin.h

lib/Headers/avx512cdintrin.h

lib/Headers/avx512dqintrin.h

lib/Headers/avx512fintrin.h

lib/Headers/avx512ifmaintrin.h

lib/Headers/avx512ifmavlintrin.h

lib/Headers/avx512vbmi2intrin.h

lib/Headers/avx512vbmiintrin.h

lib/Headers/avx512vbmivlintrin.h

lib/Headers/avx512vlbitalgintrin.h

lib/Headers/avx512vlbwintrin.h

lib/Headers/avx512vlcdintrin.h

lib/Headers/avx512vldqintrin.h

lib/Headers/avx512vlintrin.h

lib/Headers/avx512vlvbmi2intrin.h

lib/Headers/avx512vlvnniintrin.h

lib/Headers/avx512vnniintrin.h

lib/Headers/avx512vpopcntdqintrin.h

lib/Headers/avx512vpopcntdqvlintrin.h

lib/Headers/avxintrin.h

lib/Headers/emmintrin.h

lib/Headers/f16cintrin.h

lib/Headers/fma4intrin.h

lib/Headers/fmaintrin.h

lib/Headers/gfniintrin.h

lib/Headers/mm3dnow.h

lib/Headers/mmintrin.h

lib/Headers/pmmintrin.h

lib/Headers/shaintrin.h

lib/Headers/smmintrin.h

lib/Headers/tmmintrin.h

lib/Headers/vaesintrin.h

lib/Headers/xmmintrin.h

lib/Headers/xopintrin.h

lib/Sema/SemaDeclAttr.cpp

test/CodeGen/function-min-vector-width.c

test/CodeGen/x86-builtins-vector-width.c

test/Sema/attr-min-vector-width.c

[private] Add min_vector_width function attribute. Use it to annotate all of the x86 intrinsic header files. Emit a attribute in IR
AbandonedPublic