This is an archive of the discontinued LLVM Phabricator instance.

Paths

Table of Contentst

-
llvm/
-
lib/Target/X86/
-
Target/
-
X86/
-
X86ISelLowering.cpp
-
test/CodeGen/X86/
-
CodeGen/
-
X86/
-
avx2-intrinsics-x86.ll
1/1
combine-movmsk.ll
-
combine-mul.ll
-
concat-cast.ll
-
exedepsfix-broadcast.ll
-
extractelement-fp.ll
-
horizontal-reduce-umax.ll
-
horizontal-reduce-umin.ll
-
machine-combiner-int-vec.ll
-
masked_store_trunc_ssat.ll
-
masked_store_trunc_usat.ll
-
midpoint-int-vec-128.ll
-
pmul.ll
-
sadd_sat_vec.ll
-
sat-add.ll
-
ssub_sat_vec.ll
-
uadd_sat_vec.ll
-
urem-seteq-vec-tautological.ll
-
usub_sat_vec.ll
-
vec_cmp_uint-128.ll
-
vec_fp_to_int.ll
-
vec_int_to_fp.ll
-
vec_minmax_uint.ll
-
vec_uaddo.ll
-
vec_usubo.ll
-
vector-bitreverse.ll
-
vector-compare-all_of.ll
-
vector-compare-any_of.ll
-
vector-fshl-128.ll
-
vector-fshl-256.ll
-
vector-fshl-rot-128.ll
-
vector-fshl-rot-256.ll
-
vector-fshr-128.ll
-
vector-fshr-256.ll
-
vector-fshr-rot-128.ll
-
vector-fshr-rot-256.ll
-
vector-mul.ll
-
vector-popcnt-128-ult-ugt.ll
-
vector-reduce-or-cmp.ll
-
vector-reduce-umax.ll
-
vector-reduce-umin.ll
-
vector-rotate-128.ll
-
vector-rotate-256.ll
-
vector-shift-ashr-128.ll
-
vector-shift-ashr-256.ll
-
vector-shift-lshr-128.ll
-
vector-shift-lshr-256.ll
-
vector-shift-shl-128.ll
-
vector-shift-shl-256.ll
-
vector-trunc-packus.ll
-
vector-trunc-ssat.ll
-
vector-trunc-usat.ll
-
vector_splat-const-shift-of-constmasked.ll
-
vselect-minmax.ll

Differential D123234

[X86] `lowerBuildVectorAsBroadcast()`: with AVX2, allow i64->XMM broadcasts from constant pool
AbandonedPublic

Authored by lebedev.ri on Apr 6 2022, 9:42 AM.

Download Raw Diff

Details

Reviewers

RKSimon

Summary

While AVX2 can do that, it results in a number of load folding regressions,
and i'm a little lost as to what to do about them. Any hints?

Diff Detail

Repository: rG LLVM Github Monorepo

Unit TestsFailed

	Time	Test
	60,050 ms	x64 debian > MLIR.Examples/standalone::test.toy

Event Timeline

lebedev.ri created this revision.Apr 6 2022, 9:42 AM

Herald added a project: Restricted Project. · View Herald TranscriptApr 6 2022, 9:42 AM

Herald added a subscriber: pengfei. · View Herald Transcript

lebedev.ri requested review of this revision.Apr 6 2022, 9:42 AM

Herald added a project: Restricted Project. · View Herald TranscriptApr 6 2022, 9:42 AM

Herald added a subscriber: llvm-commits. · View Herald Transcript

please can generate the diff with context?

llvm/test/CodeGen/X86/combine-movmsk.ll
239	looks like you need to tweak the check prefixes

Add more context.

Herald added a subscriber: hiraditya. · View Herald TranscriptApr 6 2022, 9:49 AM

Hm, so we already have cases where we fail to undo broadcast load into a folded load (https://godbolt.org/z/3jzEd91ca), so i'm still unsure if that is a blocker?

Harbormaster completed remote builds in B158284: Diff 420930.Apr 6 2022, 12:58 PM

Fix check prefixes in a (single) problematic test.

Harbormaster completed remote builds in B158323: Diff 420989.Apr 6 2022, 3:16 PM

This is why I don't think we want to perform too much of this in the DAG - we quickly get to cases where the decision between broadcast vs vector load of constants can't be easily determined - value tracking, multiple uses, hoisting, lost folds, spilling etc. all get affected.

A while ago I was investigating the use of VPMOVSX/ZX to reduce the size of the constant pool, and hit many of the same problems. And constant rematerialization would be the same if we ever get to that point.

There's probably some minor further tweaks we can do (more hasOneUse checks?), but really we need to think about performing less in the DAG, and more in later passes.

In D123234#3435368, @RKSimon wrote:

This is why I don't think we want to perform too much of this in the DAG - we quickly get to cases where the decision between broadcast vs vector load of constants can't be easily determined - value tracking, multiple uses, hoisting, lost folds, spilling etc. all get affected.

A while ago I was investigating the use of VPMOVSX/ZX to reduce the size of the constant pool, and hit many of the same problems. And constant rematerialization would be the same if we ever get to that point.

There's probably some minor further tweaks we can do (more hasOneUse checks?), but really we need to think about performing less in the DAG, and more in later passes.

I see.
Please confirm my understanding, you are suggesting that we should generalize *SET0/*SETALLONES pseudo-instructions
into MATERIALIZE pseudo-instruction, with much the same handling of expanding it post-RA (expandPostRAPseudo())?

In D123234#3435927, @lebedev.ri wrote:

I see.
Please confirm my understanding, you are suggesting that we should generalize *SET0/*SETALLONES pseudo-instructions
into MATERIALIZE pseudo-instruction, with much the same handling of expanding it post-RA (expandPostRAPseudo())?

I'm not sure if we'd want to handle them as pseudos, or have a pass that converts vector constant pool loads into broadcasts/materialization etc. in general. Handling AVX512 broadcast folds just makes it more difficult.

All of this needs to be done in conjunction with the foldMemoryOperand stages, and I haven't investigated it much as to how to deal with it all.

lebedev.ri abandoned this revision.Apr 12 2022, 12:38 PM

Revision Contents

Path

Size

llvm/

lib/

Target/

X86/

X86ISelLowering.cpp

5 lines

test/

CodeGen/

X86/

avx2-intrinsics-x86.ll

6 lines

combine-movmsk.ll

39 lines

combine-mul.ll

3 lines

concat-cast.ll

2 lines

exedepsfix-broadcast.ll

4 lines

extractelement-fp.ll

59 lines

horizontal-reduce-umax.ll

2 lines

horizontal-reduce-umin.ll

2 lines

machine-combiner-int-vec.ll

4 lines

masked_store_trunc_ssat.ll

171 lines

masked_store_trunc_usat.ll

173 lines

midpoint-int-vec-128.ll

428 lines

28 lines

7 lines

47 lines

7 lines

2 lines

urem-seteq-vec-tautological.ll

18 lines

2 lines

8 lines

60 lines

211 lines

8 lines

31 lines

31 lines

88 lines

vector-compare-all_of.ll

31 lines

vector-compare-any_of.ll

31 lines

vector-fshl-128.ll

66 lines

vector-fshl-256.ll

4 lines

vector-fshl-rot-128.ll

36 lines

vector-fshl-rot-256.ll

2 lines

vector-fshr-128.ll

66 lines

vector-fshr-256.ll

4 lines

vector-fshr-rot-128.ll

36 lines

vector-fshr-rot-256.ll

2 lines

vector-mul.ll

30 lines

vector-popcnt-128-ult-ugt.ll

305 lines

vector-reduce-or-cmp.ll

6 lines

vector-reduce-umax.ll

31 lines

vector-reduce-umin.ll

31 lines

vector-rotate-128.ll

27 lines

vector-rotate-256.ll

2 lines

vector-shift-ashr-128.ll

101 lines

vector-shift-ashr-256.ll

6 lines

vector-shift-lshr-128.ll

34 lines

vector-shift-lshr-256.ll

6 lines

vector-shift-shl-128.ll

34 lines

vector-shift-shl-256.ll

6 lines

vector-trunc-packus.ll

138 lines

vector-trunc-ssat.ll

146 lines

vector-trunc-usat.ll

158 lines

vector_splat-const-shift-of-constmasked.ll

329 lines

vselect-minmax.ll

16 lines

Diff 420989

llvm/lib/Target/X86/X86ISelLowering.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 9,475 Lines • ▼ Show 20 Lines	static SDValue lowerBuildVectorAsBroadcast(BuildVectorSDNode *BVOp,
// Make sure that all of the users of a non-constant load are from the		// Make sure that all of the users of a non-constant load are from the
// BUILD_VECTOR node.		// BUILD_VECTOR node.
// FIXME: Is the use count needed for non-constant, non-load case?		// FIXME: Is the use count needed for non-constant, non-load case?
if (!ConstSplatVal && !IsLoad && !BVOp->isOnlyUserOf(Ld.getNode()))		if (!ConstSplatVal && !IsLoad && !BVOp->isOnlyUserOf(Ld.getNode()))
return SDValue();		return SDValue();

unsigned ScalarSize = Ld.getValueSizeInBits();		unsigned ScalarSize = Ld.getValueSizeInBits();
bool IsGE256 = (VT.getSizeInBits() >= 256);		bool IsGE256 = (VT.getSizeInBits() >= 256);
		bool IsLE256 = (VT.getSizeInBits() <= 256);

// When optimizing for size, generate up to 5 extra bytes for a broadcast		// When optimizing for size, generate up to 5 extra bytes for a broadcast
// instruction to save 8 or more bytes of constant pool data.		// instruction to save 8 or more bytes of constant pool data.
// TODO: If multiple splats are generated to load the same constant,		// TODO: If multiple splats are generated to load the same constant,
// it may be detrimental to overall size. There needs to be a way to detect		// it may be detrimental to overall size. There needs to be a way to detect
// that condition to know if this is truly a size win.		// that condition to know if this is truly a size win.
bool OptForSize = DAG.shouldOptForSize();		bool OptForSize = DAG.shouldOptForSize();

// Handle broadcasting a single constant scalar from the constant pool		// Handle broadcasting a single constant scalar from the constant pool
// into a vector.		// into a vector.
// On Sandybridge (no AVX2), it is still better to load a constant vector		// On Sandybridge (no AVX2), it is still better to load a constant vector
// from the constant pool and not to broadcast it from a scalar.		// from the constant pool and not to broadcast it from a scalar.
// But override that restriction when optimizing for size.		// But override that restriction when optimizing for size.
// TODO: Check if splatting is recommended for other AVX-capable CPUs.		// TODO: Check if splatting is recommended for other AVX-capable CPUs.
if (ConstSplatVal && (Subtarget.hasAVX2() \|\| OptForSize)) {		if (ConstSplatVal && (Subtarget.hasAVX2() \|\| OptForSize)) {
EVT CVT = Ld.getValueType();		EVT CVT = Ld.getValueType();
assert(!CVT.isVector() && "Must not broadcast a vector type");		assert(!CVT.isVector() && "Must not broadcast a vector type");

// Splat f32, i32, v4f64, v4i64 in all cases with AVX2.		// Splat f32, i32, v4f64, v4i64 in all cases with AVX2.
// For size optimization, also splat v2f64 and v2i64, and for size opt		// For size optimization, also splat v2f64 and v2i64, and for size opt
// with AVX2, also splat i8 and i16.		// with AVX2, also splat i8 and i16.
// With pattern matching, the VBROADCAST node may become a VMOVDDUP.		// With pattern matching, the VBROADCAST node may become a VMOVDDUP.
if (ScalarSize == 32 \|\|		if (ScalarSize == 32 \|\|
(ScalarSize == 64 && (IsGE256 \|\| Subtarget.hasVLX())) \|\|		(ScalarSize == 64 &&
		(IsGE256 \|\| Subtarget.hasVLX() \|\|
		(IsLE256 && Subtarget.hasAVX2() && !Subtarget.hasAVX512()))) \|\|
(ScalarSize == 16 && Subtarget.hasFP16() && CVT.isFloatingPoint()) \|\|		(ScalarSize == 16 && Subtarget.hasFP16() && CVT.isFloatingPoint()) \|\|
(OptForSize && (ScalarSize == 64 \|\| Subtarget.hasAVX2()))) {		(OptForSize && (ScalarSize == 64 \|\| Subtarget.hasAVX2()))) {
const Constant *C = nullptr;		const Constant *C = nullptr;
if (ConstantSDNode *CI = dyn_cast<ConstantSDNode>(Ld))		if (ConstantSDNode *CI = dyn_cast<ConstantSDNode>(Ld))
C = CI->getConstantIntValue();		C = CI->getConstantIntValue();
else if (ConstantFPSDNode *CF = dyn_cast<ConstantFPSDNode>(Ld))		else if (ConstantFPSDNode *CF = dyn_cast<ConstantFPSDNode>(Ld))
C = CF->getConstantFPValue();		C = CF->getConstantFPValue();

▲ Show 20 Lines • Show All 46,257 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/avx2-intrinsics-x86.ll

	Show First 20 Lines • Show All 1,501 Lines • ▼ Show 20 Lines
	; X86-AVX512VL-NEXT: # encoding: [0xc5,0xf9,0x6f,0x05,A,A,A,A]			; X86-AVX512VL-NEXT: # encoding: [0xc5,0xf9,0x6f,0x05,A,A,A,A]
	; X86-AVX512VL-NEXT: # fixup A - offset: 4, value: {{\.?LCPI[0-9]+_[0-9]+}}, kind: FK_Data_4			; X86-AVX512VL-NEXT: # fixup A - offset: 4, value: {{\.?LCPI[0-9]+_[0-9]+}}, kind: FK_Data_4
	; X86-AVX512VL-NEXT: vpsrlvq {{\.?LCPI[0-9]+_[0-9]+}}, %xmm0, %xmm0 # EVEX TO VEX Compression encoding: [0xc4,0xe2,0xf9,0x45,0x05,A,A,A,A]			; X86-AVX512VL-NEXT: vpsrlvq {{\.?LCPI[0-9]+_[0-9]+}}, %xmm0, %xmm0 # EVEX TO VEX Compression encoding: [0xc4,0xe2,0xf9,0x45,0x05,A,A,A,A]
	; X86-AVX512VL-NEXT: # fixup A - offset: 5, value: {{\.?LCPI[0-9]+_[0-9]+}}, kind: FK_Data_4			; X86-AVX512VL-NEXT: # fixup A - offset: 5, value: {{\.?LCPI[0-9]+_[0-9]+}}, kind: FK_Data_4
	; X86-AVX512VL-NEXT: retl # encoding: [0xc3]			; X86-AVX512VL-NEXT: retl # encoding: [0xc3]
	;			;
	; X64-AVX-LABEL: test_x86_avx2_psrlv_q_const:			; X64-AVX-LABEL: test_x86_avx2_psrlv_q_const:
	; X64-AVX: # %bb.0:			; X64-AVX: # %bb.0:
	; X64-AVX-NEXT: vmovdqa {{.*#+}} xmm0 = [4,4]			; X64-AVX-NEXT: vpbroadcastq {{.*#+}} xmm0 = [4,4]
	; X64-AVX-NEXT: # encoding: [0xc5,0xf9,0x6f,0x05,A,A,A,A]			; X64-AVX-NEXT: # encoding: [0xc4,0xe2,0x79,0x59,0x05,A,A,A,A]
	; X64-AVX-NEXT: # fixup A - offset: 4, value: {{\.?LCPI[0-9]+_[0-9]+}}-4, kind: reloc_riprel_4byte			; X64-AVX-NEXT: # fixup A - offset: 5, value: {{\.?LCPI[0-9]+_[0-9]+}}-4, kind: reloc_riprel_4byte
	; X64-AVX-NEXT: vpsrlvq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0 # encoding: [0xc4,0xe2,0xf9,0x45,0x05,A,A,A,A]			; X64-AVX-NEXT: vpsrlvq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0 # encoding: [0xc4,0xe2,0xf9,0x45,0x05,A,A,A,A]
	; X64-AVX-NEXT: # fixup A - offset: 5, value: {{\.?LCPI[0-9]+_[0-9]+}}-4, kind: reloc_riprel_4byte			; X64-AVX-NEXT: # fixup A - offset: 5, value: {{\.?LCPI[0-9]+_[0-9]+}}-4, kind: reloc_riprel_4byte
	; X64-AVX-NEXT: retq # encoding: [0xc3]			; X64-AVX-NEXT: retq # encoding: [0xc3]
	;			;
	; X64-AVX512VL-LABEL: test_x86_avx2_psrlv_q_const:			; X64-AVX512VL-LABEL: test_x86_avx2_psrlv_q_const:
	; X64-AVX512VL: # %bb.0:			; X64-AVX512VL: # %bb.0:
	; X64-AVX512VL-NEXT: vpbroadcastq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0 # EVEX TO VEX Compression xmm0 = [4,4]			; X64-AVX512VL-NEXT: vpbroadcastq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0 # EVEX TO VEX Compression xmm0 = [4,4]
	; X64-AVX512VL-NEXT: # encoding: [0xc4,0xe2,0x79,0x59,0x05,A,A,A,A]			; X64-AVX512VL-NEXT: # encoding: [0xc4,0xe2,0x79,0x59,0x05,A,A,A,A]
	▲ Show 20 Lines • Show All 545 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/combine-movmsk.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+sse2 \| FileCheck %s --check-prefixes=SSE,SSE2			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+sse2 \| FileCheck %s --check-prefixes=SSE,SSE2
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+sse4.2 \| FileCheck %s --check-prefixes=SSE,SSE42			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+sse4.2 \| FileCheck %s --check-prefixes=SSE,SSE42
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx \| FileCheck %s --check-prefix=AVX			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx \| FileCheck %s --check-prefixes=AVX,AVX1
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx2 \| FileCheck %s --check-prefix=AVX			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx2 \| FileCheck %s --check-prefixes=AVX,AVX2

	declare i32 @llvm.x86.sse.movmsk.ps(<4 x float>)			declare i32 @llvm.x86.sse.movmsk.ps(<4 x float>)
	declare i32 @llvm.x86.sse2.movmsk.pd(<2 x double>)			declare i32 @llvm.x86.sse2.movmsk.pd(<2 x double>)
	declare i32 @llvm.x86.sse2.pmovmskb.128(<16 x i8>)			declare i32 @llvm.x86.sse2.pmovmskb.128(<16 x i8>)

	; Use widest possible vector for movmsk comparisons (PR37087)			; Use widest possible vector for movmsk comparisons (PR37087)

	define i1 @movmskps_noneof_bitcast_v2f64(<2 x double> %a0) {			define i1 @movmskps_noneof_bitcast_v2f64(<2 x double> %a0) {
	▲ Show 20 Lines • Show All 217 Lines • ▼ Show 20 Lines
	; SSE2-NEXT: pand %xmm1, %xmm0			; SSE2-NEXT: pand %xmm1, %xmm0
	; SSE2-NEXT: movmskpd %xmm0, %eax			; SSE2-NEXT: movmskpd %xmm0, %eax
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE42-LABEL: movmskpd_pow2_mask:			; SSE42-LABEL: movmskpd_pow2_mask:
	; SSE42: # %bb.0:			; SSE42: # %bb.0:
	; SSE42-NEXT: movmskpd %xmm0, %eax			; SSE42-NEXT: movmskpd %xmm0, %eax
	; SSE42-NEXT: xorl $3, %eax			; SSE42-NEXT: xorl $3, %eax
	; SSE42-NEXT: retq			; SSE42-NEXT: retq
				RKSimonUnsubmitted Done Reply Inline Actions looks like you need to tweak the check prefixes RKSimon: looks like you need to tweak the check prefixes
	;			;
	; AVX-LABEL: movmskpd_pow2_mask:			; AVX1-LABEL: movmskpd_pow2_mask:
	; AVX: # %bb.0:			; AVX1: # %bb.0:
	; AVX-NEXT: vmovmskpd %xmm0, %eax			; AVX1-NEXT: vmovmskpd %xmm0, %eax
	; AVX-NEXT: xorl $3, %eax			; AVX1-NEXT: xorl $3, %eax
	; AVX-NEXT: retq			; AVX1-NEXT: retq
				;
				; AVX2-LABEL: movmskpd_pow2_mask:
				; AVX2: # %bb.0:
				; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [9223372036854775808,9223372036854775808]
				; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
				; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
				; AVX2-NEXT: vpcmpeqq %xmm1, %xmm0, %xmm0
				; AVX2-NEXT: vmovmskpd %xmm0, %eax
				; AVX2-NEXT: retq
	%1 = and <2 x i64> %a0, <i64 -9223372036854775808, i64 -9223372036854775808>			%1 = and <2 x i64> %a0, <i64 -9223372036854775808, i64 -9223372036854775808>
	%2 = icmp eq <2 x i64> %1, zeroinitializer			%2 = icmp eq <2 x i64> %1, zeroinitializer
	%3 = sext <2 x i1> %2 to <2 x i64>			%3 = sext <2 x i1> %2 to <2 x i64>
	%4 = bitcast <2 x i64> %3 to <2 x double>			%4 = bitcast <2 x i64> %3 to <2 x double>
	%5 = tail call i32 @llvm.x86.sse2.movmsk.pd(<2 x double> %4)			%5 = tail call i32 @llvm.x86.sse2.movmsk.pd(<2 x double> %4)
	ret i32 %5			ret i32 %5
	}			}

	define i32 @movmskps_pow2_mask(<4 x i32> %a0) {			define i32 @movmskps_pow2_mask(<4 x i32> %a0) {
	; SSE-LABEL: movmskps_pow2_mask:			; SSE-LABEL: movmskps_pow2_mask:
	; SSE: # %bb.0:			; SSE: # %bb.0:
	; SSE-NEXT: pslld $29, %xmm0			; SSE-NEXT: pslld $29, %xmm0
	; SSE-NEXT: movmskps %xmm0, %eax			; SSE-NEXT: movmskps %xmm0, %eax
	; SSE-NEXT: xorl $15, %eax			; SSE-NEXT: xorl $15, %eax
	; SSE-NEXT: retq			; SSE-NEXT: retq
				;
				; AVX1-LABEL: movmskps_pow2_mask:
				; AVX1: # %bb.0:
				; AVX1-NEXT: vpslld $29, %xmm0, %xmm0
				; AVX1-NEXT: vmovmskps %xmm0, %eax
				; AVX1-NEXT: xorl $15, %eax
				; AVX1-NEXT: retq
				;
				; AVX2-LABEL: movmskps_pow2_mask:
				; AVX2: # %bb.0:
				; AVX2-NEXT: vpbroadcastd {{.*#+}} xmm1 = [4,4,4,4]
				; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
				; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
				; AVX2-NEXT: vpcmpeqd %xmm1, %xmm0, %xmm0
				; AVX2-NEXT: vmovmskps %xmm0, %eax
				; AVX2-NEXT: retq
	%1 = and <4 x i32> %a0, <i32 4, i32 4, i32 4, i32 4>			%1 = and <4 x i32> %a0, <i32 4, i32 4, i32 4, i32 4>
	%2 = icmp eq <4 x i32> %1, zeroinitializer			%2 = icmp eq <4 x i32> %1, zeroinitializer
	%3 = sext <4 x i1> %2 to <4 x i32>			%3 = sext <4 x i1> %2 to <4 x i32>
	%4 = bitcast <4 x i32> %3 to <4 x float>			%4 = bitcast <4 x i32> %3 to <4 x float>
	%5 = tail call i32 @llvm.x86.sse.movmsk.ps(<4 x float> %4)			%5 = tail call i32 @llvm.x86.sse.movmsk.ps(<4 x float> %4)
	ret i32 %5			ret i32 %5
	}			}

	▲ Show 20 Lines • Show All 139 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/combine-mul.ll

	Show First 20 Lines • Show All 339 Lines • ▼ Show 20 Lines
	; SSE-NEXT: pmuludq %xmm1, %xmm0			; SSE-NEXT: pmuludq %xmm1, %xmm0
	; SSE-NEXT: paddq %xmm3, %xmm0			; SSE-NEXT: paddq %xmm3, %xmm0
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX-LABEL: combine_mul_to_abs_v2i64:			; AVX-LABEL: combine_mul_to_abs_v2i64:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm1			; AVX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm1
	; AVX-NEXT: vpor {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1			; AVX-NEXT: vpbroadcastq {{.*#+}} xmm2 = [1,1]
				; AVX-NEXT: vpor %xmm2, %xmm1, %xmm1
	; AVX-NEXT: vpsrlq $32, %xmm0, %xmm2			; AVX-NEXT: vpsrlq $32, %xmm0, %xmm2
	; AVX-NEXT: vpmuludq %xmm1, %xmm2, %xmm2			; AVX-NEXT: vpmuludq %xmm1, %xmm2, %xmm2
	; AVX-NEXT: vpsrlq $32, %xmm1, %xmm3			; AVX-NEXT: vpsrlq $32, %xmm1, %xmm3
	; AVX-NEXT: vpmuludq %xmm3, %xmm0, %xmm3			; AVX-NEXT: vpmuludq %xmm3, %xmm0, %xmm3
	; AVX-NEXT: vpaddq %xmm2, %xmm3, %xmm2			; AVX-NEXT: vpaddq %xmm2, %xmm3, %xmm2
	; AVX-NEXT: vpsllq $32, %xmm2, %xmm2			; AVX-NEXT: vpsllq $32, %xmm2, %xmm2
	; AVX-NEXT: vpmuludq %xmm1, %xmm0, %xmm0			; AVX-NEXT: vpmuludq %xmm1, %xmm0, %xmm0
	; AVX-NEXT: vpaddq %xmm2, %xmm0, %xmm0			; AVX-NEXT: vpaddq %xmm2, %xmm0, %xmm0
	▲ Show 20 Lines • Show All 130 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/concat-cast.ll

	Show First 20 Lines • Show All 367 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: vcvtpd2ps %xmm0, %xmm0			; AVX1-NEXT: vcvtpd2ps %xmm0, %xmm0
	; AVX1-NEXT: vcvtdq2ps %xmm1, %xmm1			; AVX1-NEXT: vcvtdq2ps %xmm1, %xmm1
	; AVX1-NEXT: vunpcklpd {{.*#+}} xmm0 = xmm0[0],xmm1[0]			; AVX1-NEXT: vunpcklpd {{.*#+}} xmm0 = xmm0[0],xmm1[0]
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: mismatch_tofp_v4i32_v4f32:			; AVX2-LABEL: mismatch_tofp_v4i32_v4f32:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpmovzxdq {{.*#+}} xmm0 = xmm0[0],zero,xmm0[1],zero			; AVX2-NEXT: vpmovzxdq {{.*#+}} xmm0 = xmm0[0],zero,xmm0[1],zero
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm2 = [4.503599627370496E+15,4.503599627370496E+15]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm2 = [4.503599627370496E+15,4.503599627370496E+15]
	; AVX2-NEXT: vpor %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpor %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vsubpd %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vsubpd %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vcvtpd2ps %xmm0, %xmm0			; AVX2-NEXT: vcvtpd2ps %xmm0, %xmm0
	; AVX2-NEXT: vcvtdq2ps %xmm1, %xmm1			; AVX2-NEXT: vcvtdq2ps %xmm1, %xmm1
	; AVX2-NEXT: vunpcklpd {{.*#+}} xmm0 = xmm0[0],xmm1[0]			; AVX2-NEXT: vunpcklpd {{.*#+}} xmm0 = xmm0[0],xmm1[0]
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: mismatch_tofp_v4i32_v4f32:			; AVX512F-LABEL: mismatch_tofp_v4i32_v4f32:
	▲ Show 20 Lines • Show All 97 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/exedepsfix-broadcast.ll

Show First 20 Lines • Show All 68 Lines • ▼ Show 20 Lines	; CHECK-NEXT: retq
%max = select <8 x i1> %max_is_x, <8 x float> %floatcast, <8 x float> %arg2		%max = select <8 x i1> %max_is_x, <8 x float> %floatcast, <8 x float> %arg2
ret <8 x float> %max		ret <8 x float> %max
}		}

; In that case the broadcast is directly folded into vandpd.		; In that case the broadcast is directly folded into vandpd.
define <2 x double> @ExeDepsFix_broadcastsd(<2 x double> %arg, <2 x double> %arg2) {		define <2 x double> @ExeDepsFix_broadcastsd(<2 x double> %arg, <2 x double> %arg2) {
; CHECK-LABEL: ExeDepsFix_broadcastsd:		; CHECK-LABEL: ExeDepsFix_broadcastsd:
; CHECK: ## %bb.0:		; CHECK: ## %bb.0:
; CHECK-NEXT: vandpd {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0		; CHECK-NEXT: vmovddup {{.*#+}} xmm2 = [2147483647,2147483647]
		; CHECK-NEXT: ## xmm2 = mem[0,0]
		; CHECK-NEXT: vandpd %xmm2, %xmm0, %xmm0
; CHECK-NEXT: vmaxpd %xmm1, %xmm0, %xmm0		; CHECK-NEXT: vmaxpd %xmm1, %xmm0, %xmm0
; CHECK-NEXT: retq		; CHECK-NEXT: retq
%bitcast = bitcast <2 x double> %arg to <2 x i64>		%bitcast = bitcast <2 x double> %arg to <2 x i64>
%and = and <2 x i64> %bitcast, <i64 2147483647, i64 2147483647>		%and = and <2 x i64> %bitcast, <i64 2147483647, i64 2147483647>
%floatcast = bitcast <2 x i64> %and to <2 x double>		%floatcast = bitcast <2 x i64> %and to <2 x double>
%max_is_x = fcmp oge <2 x double> %floatcast, %arg2		%max_is_x = fcmp oge <2 x double> %floatcast, %arg2
%max = select <2 x i1> %max_is_x, <2 x double> %floatcast, <2 x double> %arg2		%max = select <2 x i1> %max_is_x, <2 x double> %floatcast, <2 x double> %arg2
ret <2 x double> %max		ret <2 x double> %max
▲ Show 20 Lines • Show All 54 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/extractelement-fp.ll

Show First 20 Lines • Show All 311 Lines • ▼ Show 20 Lines	; X86-NEXT: retl
%sext = sext <4 x i1> %cmp to <4 x i32>		%sext = sext <4 x i1> %cmp to <4 x i32>
%e = extractelement <4 x i1> %cmp, i1 0		%e = extractelement <4 x i1> %cmp, i1 0
store i1 %e, i1* undef		store i1 %e, i1* undef
ret void		ret void
}		}

; This used to crash by creating a setcc with an i64 condition on a 32-bit target.		; This used to crash by creating a setcc with an i64 condition on a 32-bit target.
define <3 x double> @extvselectsetcc_crash(<2 x double> %x) {		define <3 x double> @extvselectsetcc_crash(<2 x double> %x) {
; X64-LABEL: extvselectsetcc_crash:		; CHECK-LABEL: extvselectsetcc_crash:
; X64: # %bb.0:		; CHECK: # %bb.0:
; X64-NEXT: vcmpeqpd {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm1		; CHECK-NEXT: vmovddup {{.*#+}} xmm1 = [5.0E+0,5.0E+0]
; X64-NEXT: vmovsd {{.*#+}} xmm2 = mem[0],zero		; CHECK-NEXT: # xmm1 = mem[0,0]
; X64-NEXT: vandpd %xmm2, %xmm1, %xmm1		; CHECK-NEXT: vcmpeqpd %xmm1, %xmm0, %xmm1
; X64-NEXT: vinsertf128 $1, %xmm0, %ymm1, %ymm0		; CHECK-NEXT: vmovsd {{.*#+}} xmm2 = mem[0],zero
; X64-NEXT: vpermpd {{.*#+}} ymm0 = ymm0[0,2,3,3]		; CHECK-NEXT: vandpd %xmm2, %xmm1, %xmm1
; X64-NEXT: retq		; CHECK-NEXT: vinsertf128 $1, %xmm0, %ymm1, %ymm0
;		; CHECK-NEXT: vpermpd {{.*#+}} ymm0 = ymm0[0,2,3,3]
; X86-LABEL: extvselectsetcc_crash:		; CHECK-NEXT: ret{{[l\|q]}}
; X86: # %bb.0:
; X86-NEXT: vcmpeqpd {{\.?LCPI[0-9]+_[0-9]+}}, %xmm0, %xmm1
; X86-NEXT: vmovsd {{.*#+}} xmm2 = mem[0],zero
; X86-NEXT: vandpd %xmm2, %xmm1, %xmm1
; X86-NEXT: vinsertf128 $1, %xmm0, %ymm1, %ymm0
; X86-NEXT: vpermpd {{.*#+}} ymm0 = ymm0[0,2,3,3]
; X86-NEXT: retl
%cmp = fcmp oeq <2 x double> %x, <double 5.0, double 5.0>		%cmp = fcmp oeq <2 x double> %x, <double 5.0, double 5.0>
%s = select <2 x i1> %cmp, <2 x double> <double 1.0, double undef>, <2 x double> <double 0.0, double undef>		%s = select <2 x i1> %cmp, <2 x double> <double 1.0, double undef>, <2 x double> <double 0.0, double undef>
%r = shufflevector <2 x double> %s, <2 x double> %x, <3 x i32> <i32 0, i32 2, i32 3>		%r = shufflevector <2 x double> %s, <2 x double> %x, <3 x i32> <i32 0, i32 2, i32 3>
ret <3 x double> %r		ret <3 x double> %r
}		}

define float @select_fcmp_v4f32(<4 x float> %x, <4 x float> %y, <4 x float> %z, <4 x float> %w) nounwind {		define float @select_fcmp_v4f32(<4 x float> %x, <4 x float> %y, <4 x float> %z, <4 x float> %w) nounwind {
; X64-LABEL: select_fcmp_v4f32:		; X64-LABEL: select_fcmp_v4f32:
▲ Show 20 Lines • Show All 196 Lines • ▼ Show 20 Lines	; X86-NEXT: retl
%v = call <4 x float> @llvm.fabs.v4f32(<4 x float> %x)		%v = call <4 x float> @llvm.fabs.v4f32(<4 x float> %x)
%r = extractelement <4 x float> %v, i32 0		%r = extractelement <4 x float> %v, i32 0
ret float %r		ret float %r
}		}

define double @fabs_v4f64(<4 x double> %x) nounwind {		define double @fabs_v4f64(<4 x double> %x) nounwind {
; X64-LABEL: fabs_v4f64:		; X64-LABEL: fabs_v4f64:
; X64: # %bb.0:		; X64: # %bb.0:
; X64-NEXT: vandps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0		; X64-NEXT: vmovddup {{.*#+}} xmm1 = [NaN,NaN]
		; X64-NEXT: # xmm1 = mem[0,0]
		; X64-NEXT: vandps %xmm1, %xmm0, %xmm0
; X64-NEXT: vzeroupper		; X64-NEXT: vzeroupper
; X64-NEXT: retq		; X64-NEXT: retq
;		;
; X86-LABEL: fabs_v4f64:		; X86-LABEL: fabs_v4f64:
; X86: # %bb.0:		; X86: # %bb.0:
; X86-NEXT: pushl %ebp		; X86-NEXT: pushl %ebp
; X86-NEXT: movl %esp, %ebp		; X86-NEXT: movl %esp, %ebp
; X86-NEXT: andl $-8, %esp		; X86-NEXT: andl $-8, %esp
; X86-NEXT: subl $8, %esp		; X86-NEXT: subl $8, %esp
; X86-NEXT: vandps {{\.?LCPI[0-9]+_[0-9]+}}, %xmm0, %xmm0		; X86-NEXT: vmovddup {{.*#+}} xmm1 = [NaN,NaN]
		; X86-NEXT: # xmm1 = mem[0,0]
		; X86-NEXT: vandps %xmm1, %xmm0, %xmm0
; X86-NEXT: vmovlps %xmm0, (%esp)		; X86-NEXT: vmovlps %xmm0, (%esp)
; X86-NEXT: fldl (%esp)		; X86-NEXT: fldl (%esp)
; X86-NEXT: movl %ebp, %esp		; X86-NEXT: movl %ebp, %esp
; X86-NEXT: popl %ebp		; X86-NEXT: popl %ebp
; X86-NEXT: vzeroupper		; X86-NEXT: vzeroupper
; X86-NEXT: retl		; X86-NEXT: retl
%v = call <4 x double> @llvm.fabs.v4f64(<4 x double> %x)		%v = call <4 x double> @llvm.fabs.v4f64(<4 x double> %x)
%r = extractelement <4 x double> %v, i32 0		%r = extractelement <4 x double> %v, i32 0
▲ Show 20 Lines • Show All 245 Lines • ▼ Show 20 Lines	; X86-NEXT: retl
%v = call <4 x float> @llvm.copysign.v4f32(<4 x float> %x, <4 x float> %y)		%v = call <4 x float> @llvm.copysign.v4f32(<4 x float> %x, <4 x float> %y)
%r = extractelement <4 x float> %v, i32 0		%r = extractelement <4 x float> %v, i32 0
ret float %r		ret float %r
}		}

define double @copysign_v4f64(<4 x double> %x, <4 x double> %y) nounwind {		define double @copysign_v4f64(<4 x double> %x, <4 x double> %y) nounwind {
; X64-LABEL: copysign_v4f64:		; X64-LABEL: copysign_v4f64:
; X64: # %bb.0:		; X64: # %bb.0:
; X64-NEXT: vandps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1		; X64-NEXT: vmovddup {{.*#+}} xmm2 = [-0.0E+0,-0.0E+0]
; X64-NEXT: vandps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0		; X64-NEXT: # xmm2 = mem[0,0]
		; X64-NEXT: vandps %xmm2, %xmm1, %xmm1
		; X64-NEXT: vmovddup {{.*#+}} xmm2 = [NaN,NaN]
		; X64-NEXT: # xmm2 = mem[0,0]
		; X64-NEXT: vandps %xmm2, %xmm0, %xmm0
; X64-NEXT: vorps %xmm1, %xmm0, %xmm0		; X64-NEXT: vorps %xmm1, %xmm0, %xmm0
; X64-NEXT: vzeroupper		; X64-NEXT: vzeroupper
; X64-NEXT: retq		; X64-NEXT: retq
;		;
; X86-LABEL: copysign_v4f64:		; X86-LABEL: copysign_v4f64:
; X86: # %bb.0:		; X86: # %bb.0:
; X86-NEXT: pushl %ebp		; X86-NEXT: pushl %ebp
; X86-NEXT: movl %esp, %ebp		; X86-NEXT: movl %esp, %ebp
; X86-NEXT: andl $-8, %esp		; X86-NEXT: andl $-8, %esp
; X86-NEXT: subl $8, %esp		; X86-NEXT: subl $8, %esp
; X86-NEXT: vandps {{\.?LCPI[0-9]+_[0-9]+}}, %xmm1, %xmm1		; X86-NEXT: vmovddup {{.*#+}} xmm2 = [-0.0E+0,-0.0E+0]
; X86-NEXT: vandps {{\.?LCPI[0-9]+_[0-9]+}}, %xmm0, %xmm0		; X86-NEXT: # xmm2 = mem[0,0]
		; X86-NEXT: vandps %xmm2, %xmm1, %xmm1
		; X86-NEXT: vmovddup {{.*#+}} xmm2 = [NaN,NaN]
		; X86-NEXT: # xmm2 = mem[0,0]
		; X86-NEXT: vandps %xmm2, %xmm0, %xmm0
; X86-NEXT: vorps %xmm1, %xmm0, %xmm0		; X86-NEXT: vorps %xmm1, %xmm0, %xmm0
; X86-NEXT: vmovlps %xmm0, (%esp)		; X86-NEXT: vmovlps %xmm0, (%esp)
; X86-NEXT: fldl (%esp)		; X86-NEXT: fldl (%esp)
; X86-NEXT: movl %ebp, %esp		; X86-NEXT: movl %ebp, %esp
; X86-NEXT: popl %ebp		; X86-NEXT: popl %ebp
; X86-NEXT: vzeroupper		; X86-NEXT: vzeroupper
; X86-NEXT: retl		; X86-NEXT: retl
%v = call <4 x double> @llvm.copysign.v4f64(<4 x double> %x, <4 x double> %y)		%v = call <4 x double> @llvm.copysign.v4f64(<4 x double> %x, <4 x double> %y)
▲ Show 20 Lines • Show All 248 Lines • ▼ Show 20 Lines	; X86-NEXT: retl
%v = call <4 x float> @llvm.round.v4f32(<4 x float> %x)		%v = call <4 x float> @llvm.round.v4f32(<4 x float> %x)
%r = extractelement <4 x float> %v, i32 0		%r = extractelement <4 x float> %v, i32 0
ret float %r		ret float %r
}		}

define double @round_v4f64(<4 x double> %x) nounwind {		define double @round_v4f64(<4 x double> %x) nounwind {
; X64-LABEL: round_v4f64:		; X64-LABEL: round_v4f64:
; X64: # %bb.0:		; X64: # %bb.0:
; X64-NEXT: vandpd {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm1		; X64-NEXT: vmovddup {{.*#+}} xmm1 = [-0.0E+0,-0.0E+0]
		; X64-NEXT: # xmm1 = mem[0,0]
		; X64-NEXT: vandpd %xmm1, %xmm0, %xmm1
; X64-NEXT: vmovddup {{.*#+}} xmm2 = [4.9999999999999994E-1,4.9999999999999994E-1]		; X64-NEXT: vmovddup {{.*#+}} xmm2 = [4.9999999999999994E-1,4.9999999999999994E-1]
; X64-NEXT: # xmm2 = mem[0,0]		; X64-NEXT: # xmm2 = mem[0,0]
; X64-NEXT: vorpd %xmm2, %xmm1, %xmm1		; X64-NEXT: vorpd %xmm2, %xmm1, %xmm1
; X64-NEXT: vaddsd %xmm1, %xmm0, %xmm0		; X64-NEXT: vaddsd %xmm1, %xmm0, %xmm0
; X64-NEXT: vroundsd $11, %xmm0, %xmm0, %xmm0		; X64-NEXT: vroundsd $11, %xmm0, %xmm0, %xmm0
; X64-NEXT: vzeroupper		; X64-NEXT: vzeroupper
; X64-NEXT: retq		; X64-NEXT: retq
;		;
; X86-LABEL: round_v4f64:		; X86-LABEL: round_v4f64:
; X86: # %bb.0:		; X86: # %bb.0:
; X86-NEXT: pushl %ebp		; X86-NEXT: pushl %ebp
; X86-NEXT: movl %esp, %ebp		; X86-NEXT: movl %esp, %ebp
; X86-NEXT: andl $-8, %esp		; X86-NEXT: andl $-8, %esp
; X86-NEXT: subl $8, %esp		; X86-NEXT: subl $8, %esp
; X86-NEXT: vandpd {{\.?LCPI[0-9]+_[0-9]+}}, %xmm0, %xmm1		; X86-NEXT: vmovddup {{.*#+}} xmm1 = [-0.0E+0,-0.0E+0]
		; X86-NEXT: # xmm1 = mem[0,0]
		; X86-NEXT: vandpd %xmm1, %xmm0, %xmm1
; X86-NEXT: vmovddup {{.*#+}} xmm2 = [4.9999999999999994E-1,4.9999999999999994E-1]		; X86-NEXT: vmovddup {{.*#+}} xmm2 = [4.9999999999999994E-1,4.9999999999999994E-1]
; X86-NEXT: # xmm2 = mem[0,0]		; X86-NEXT: # xmm2 = mem[0,0]
; X86-NEXT: vorpd %xmm2, %xmm1, %xmm1		; X86-NEXT: vorpd %xmm2, %xmm1, %xmm1
; X86-NEXT: vaddsd %xmm1, %xmm0, %xmm0		; X86-NEXT: vaddsd %xmm1, %xmm0, %xmm0
; X86-NEXT: vroundsd $11, %xmm0, %xmm0, %xmm0		; X86-NEXT: vroundsd $11, %xmm0, %xmm0, %xmm0
; X86-NEXT: vmovsd %xmm0, (%esp)		; X86-NEXT: vmovsd %xmm0, (%esp)
; X86-NEXT: fldl (%esp)		; X86-NEXT: fldl (%esp)
; X86-NEXT: movl %ebp, %esp		; X86-NEXT: movl %ebp, %esp
▲ Show 20 Lines • Show All 125 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/horizontal-reduce-umax.ll

	Show First 20 Lines • Show All 116 Lines • ▼ Show 20 Lines
	; X64-AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2			; X64-AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2
	; X64-AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0			; X64-AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; X64-AVX1-NEXT: vmovq %xmm0, %rax			; X64-AVX1-NEXT: vmovq %xmm0, %rax
	; X64-AVX1-NEXT: retq			; X64-AVX1-NEXT: retq
	;			;
	; X64-AVX2-LABEL: test_reduce_v2i64:			; X64-AVX2-LABEL: test_reduce_v2i64:
	; X64-AVX2: ## %bb.0:			; X64-AVX2: ## %bb.0:
	; X64-AVX2-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,2,3]			; X64-AVX2-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,2,3]
	; X64-AVX2-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]			; X64-AVX2-NEXT: vpbroadcastq {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
	; X64-AVX2-NEXT: vpxor %xmm2, %xmm0, %xmm3			; X64-AVX2-NEXT: vpxor %xmm2, %xmm0, %xmm3
	; X64-AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm2			; X64-AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm2
	; X64-AVX2-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2			; X64-AVX2-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2
	; X64-AVX2-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0			; X64-AVX2-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; X64-AVX2-NEXT: vmovq %xmm0, %rax			; X64-AVX2-NEXT: vmovq %xmm0, %rax
	; X64-AVX2-NEXT: retq			; X64-AVX2-NEXT: retq
	;			;
	; X64-AVX512-LABEL: test_reduce_v2i64:			; X64-AVX512-LABEL: test_reduce_v2i64:
	▲ Show 20 Lines • Show All 2,040 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/horizontal-reduce-umin.ll

	Show First 20 Lines • Show All 118 Lines • ▼ Show 20 Lines
	; X64-AVX1-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2			; X64-AVX1-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2
	; X64-AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0			; X64-AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; X64-AVX1-NEXT: vmovq %xmm0, %rax			; X64-AVX1-NEXT: vmovq %xmm0, %rax
	; X64-AVX1-NEXT: retq			; X64-AVX1-NEXT: retq
	;			;
	; X64-AVX2-LABEL: test_reduce_v2i64:			; X64-AVX2-LABEL: test_reduce_v2i64:
	; X64-AVX2: ## %bb.0:			; X64-AVX2: ## %bb.0:
	; X64-AVX2-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,2,3]			; X64-AVX2-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,2,3]
	; X64-AVX2-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]			; X64-AVX2-NEXT: vpbroadcastq {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
	; X64-AVX2-NEXT: vpxor %xmm2, %xmm0, %xmm3			; X64-AVX2-NEXT: vpxor %xmm2, %xmm0, %xmm3
	; X64-AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm2			; X64-AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm2
	; X64-AVX2-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2			; X64-AVX2-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2
	; X64-AVX2-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0			; X64-AVX2-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; X64-AVX2-NEXT: vmovq %xmm0, %rax			; X64-AVX2-NEXT: vmovq %xmm0, %rax
	; X64-AVX2-NEXT: retq			; X64-AVX2-NEXT: retq
	;			;
	; X64-AVX512-LABEL: test_reduce_v2i64:			; X64-AVX512-LABEL: test_reduce_v2i64:
	▲ Show 20 Lines • Show All 2,040 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/machine-combiner-int-vec.ll

	Show First 20 Lines • Show All 419 Lines • ▼ Show 20 Lines
	; SSE-NEXT: pand %xmm0, %xmm3			; SSE-NEXT: pand %xmm0, %xmm3
	; SSE-NEXT: pandn %xmm5, %xmm0			; SSE-NEXT: pandn %xmm5, %xmm0
	; SSE-NEXT: por %xmm3, %xmm0			; SSE-NEXT: por %xmm3, %xmm0
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX2-LABEL: reassociate_umax_v2i64:			; AVX2-LABEL: reassociate_umax_v2i64:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpaddq %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpaddq %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm1 = [9223372036854775808,9223372036854775808]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [9223372036854775808,9223372036854775808]
	; AVX2-NEXT: vpxor %xmm1, %xmm2, %xmm4			; AVX2-NEXT: vpxor %xmm1, %xmm2, %xmm4
	; AVX2-NEXT: vpxor %xmm1, %xmm0, %xmm5			; AVX2-NEXT: vpxor %xmm1, %xmm0, %xmm5
	; AVX2-NEXT: vpcmpgtq %xmm5, %xmm4, %xmm4			; AVX2-NEXT: vpcmpgtq %xmm5, %xmm4, %xmm4
	; AVX2-NEXT: vblendvpd %xmm4, %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vblendvpd %xmm4, %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vxorpd %xmm1, %xmm0, %xmm2			; AVX2-NEXT: vxorpd %xmm1, %xmm0, %xmm2
	; AVX2-NEXT: vpxor %xmm1, %xmm3, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm3, %xmm1
	; AVX2-NEXT: vpcmpgtq %xmm2, %xmm1, %xmm1			; AVX2-NEXT: vpcmpgtq %xmm2, %xmm1, %xmm1
	; AVX2-NEXT: vblendvpd %xmm1, %xmm3, %xmm0, %xmm0			; AVX2-NEXT: vblendvpd %xmm1, %xmm3, %xmm0, %xmm0
	▲ Show 20 Lines • Show All 281 Lines • ▼ Show 20 Lines
	; SSE-NEXT: pand %xmm0, %xmm3			; SSE-NEXT: pand %xmm0, %xmm3
	; SSE-NEXT: pandn %xmm5, %xmm0			; SSE-NEXT: pandn %xmm5, %xmm0
	; SSE-NEXT: por %xmm3, %xmm0			; SSE-NEXT: por %xmm3, %xmm0
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX2-LABEL: reassociate_umin_v2i64:			; AVX2-LABEL: reassociate_umin_v2i64:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpaddq %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpaddq %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm1 = [9223372036854775808,9223372036854775808]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [9223372036854775808,9223372036854775808]
	; AVX2-NEXT: vpxor %xmm1, %xmm2, %xmm4			; AVX2-NEXT: vpxor %xmm1, %xmm2, %xmm4
	; AVX2-NEXT: vpxor %xmm1, %xmm0, %xmm5			; AVX2-NEXT: vpxor %xmm1, %xmm0, %xmm5
	; AVX2-NEXT: vpcmpgtq %xmm4, %xmm5, %xmm4			; AVX2-NEXT: vpcmpgtq %xmm4, %xmm5, %xmm4
	; AVX2-NEXT: vblendvpd %xmm4, %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vblendvpd %xmm4, %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vxorpd %xmm1, %xmm0, %xmm2			; AVX2-NEXT: vxorpd %xmm1, %xmm0, %xmm2
	; AVX2-NEXT: vpxor %xmm1, %xmm3, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm3, %xmm1
	; AVX2-NEXT: vpcmpgtq %xmm1, %xmm2, %xmm1			; AVX2-NEXT: vpcmpgtq %xmm1, %xmm2, %xmm1
	; AVX2-NEXT: vblendvpd %xmm1, %xmm3, %xmm0, %xmm0			; AVX2-NEXT: vblendvpd %xmm1, %xmm3, %xmm0, %xmm0
	▲ Show 20 Lines • Show All 2,040 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/masked_store_trunc_ssat.ll

	Show First 20 Lines • Show All 2,040 Lines • ▼ Show 20 Lines
	;			;
	; AVX2-LABEL: truncstore_v2i64_v2i32:			; AVX2-LABEL: truncstore_v2i64_v2i32:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpxor %xmm2, %xmm2, %xmm2			; AVX2-NEXT: vpxor %xmm2, %xmm2, %xmm2
	; AVX2-NEXT: vpcmpeqq %xmm2, %xmm1, %xmm1			; AVX2-NEXT: vpcmpeqq %xmm2, %xmm1, %xmm1
	; AVX2-NEXT: vpcmpeqd %xmm2, %xmm2, %xmm2			; AVX2-NEXT: vpcmpeqd %xmm2, %xmm2, %xmm2
	; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm1
	; AVX2-NEXT: vinsertps {{.*#+}} xmm1 = xmm1[0,2],zero,zero			; AVX2-NEXT: vinsertps {{.*#+}} xmm1 = xmm1[0,2],zero,zero
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm2 = [2147483647,2147483647]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm2 = [2147483647,2147483647]
	; AVX2-NEXT: vpcmpgtq %xmm0, %xmm2, %xmm3			; AVX2-NEXT: vpcmpgtq %xmm0, %xmm2, %xmm3
	; AVX2-NEXT: vblendvpd %xmm3, %xmm0, %xmm2, %xmm0			; AVX2-NEXT: vblendvpd %xmm3, %xmm0, %xmm2, %xmm0
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm2 = [18446744071562067968,18446744071562067968]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm2 = [18446744071562067968,18446744071562067968]
	; AVX2-NEXT: vpcmpgtq %xmm2, %xmm0, %xmm3			; AVX2-NEXT: vpcmpgtq %xmm2, %xmm0, %xmm3
	; AVX2-NEXT: vblendvpd %xmm3, %xmm0, %xmm2, %xmm0			; AVX2-NEXT: vblendvpd %xmm3, %xmm0, %xmm2, %xmm0
	; AVX2-NEXT: vpermilps {{.*#+}} xmm0 = xmm0[0,2,2,3]			; AVX2-NEXT: vpermilps {{.*#+}} xmm0 = xmm0[0,2,2,3]
	; AVX2-NEXT: vpmaskmovd %xmm0, %xmm1, (%rdi)			; AVX2-NEXT: vpmaskmovd %xmm0, %xmm1, (%rdi)
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: truncstore_v2i64_v2i32:			; AVX512F-LABEL: truncstore_v2i64_v2i32:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	▲ Show 20 Lines • Show All 119 Lines • ▼ Show 20 Lines
	; SSE4-NEXT: .LBB7_1: # %cond.store			; SSE4-NEXT: .LBB7_1: # %cond.store
	; SSE4-NEXT: pextrw $0, %xmm0, (%rdi)			; SSE4-NEXT: pextrw $0, %xmm0, (%rdi)
	; SSE4-NEXT: testb $2, %al			; SSE4-NEXT: testb $2, %al
	; SSE4-NEXT: je .LBB7_4			; SSE4-NEXT: je .LBB7_4
	; SSE4-NEXT: .LBB7_3: # %cond.store1			; SSE4-NEXT: .LBB7_3: # %cond.store1
	; SSE4-NEXT: pextrw $1, %xmm0, 2(%rdi)			; SSE4-NEXT: pextrw $1, %xmm0, 2(%rdi)
	; SSE4-NEXT: retq			; SSE4-NEXT: retq
	;			;
	; AVX-LABEL: truncstore_v2i64_v2i16:			; AVX1-LABEL: truncstore_v2i64_v2i16:
	; AVX: # %bb.0:			; AVX1: # %bb.0:
	; AVX-NEXT: vpxor %xmm2, %xmm2, %xmm2			; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2
	; AVX-NEXT: vmovdqa {{.*#+}} xmm3 = [32767,32767]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm3 = [32767,32767]
	; AVX-NEXT: vpcmpgtq %xmm0, %xmm3, %xmm4			; AVX1-NEXT: vpcmpgtq %xmm0, %xmm3, %xmm4
	; AVX-NEXT: vblendvpd %xmm4, %xmm0, %xmm3, %xmm0			; AVX1-NEXT: vblendvpd %xmm4, %xmm0, %xmm3, %xmm0
	; AVX-NEXT: vmovdqa {{.*#+}} xmm3 = [18446744073709518848,18446744073709518848]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm3 = [18446744073709518848,18446744073709518848]
	; AVX-NEXT: vpcmpgtq %xmm3, %xmm0, %xmm4			; AVX1-NEXT: vpcmpgtq %xmm3, %xmm0, %xmm4
	; AVX-NEXT: vblendvpd %xmm4, %xmm0, %xmm3, %xmm0			; AVX1-NEXT: vblendvpd %xmm4, %xmm0, %xmm3, %xmm0
	; AVX-NEXT: vpermilps {{.*#+}} xmm0 = xmm0[0,2,2,3]			; AVX1-NEXT: vpermilps {{.*#+}} xmm0 = xmm0[0,2,2,3]
	; AVX-NEXT: vpshuflw {{.*#+}} xmm0 = xmm0[0,2,2,3,4,5,6,7]			; AVX1-NEXT: vpshuflw {{.*#+}} xmm0 = xmm0[0,2,2,3,4,5,6,7]
	; AVX-NEXT: vpcmpeqq %xmm2, %xmm1, %xmm1			; AVX1-NEXT: vpcmpeqq %xmm2, %xmm1, %xmm1
	; AVX-NEXT: vmovmskpd %xmm1, %eax			; AVX1-NEXT: vmovmskpd %xmm1, %eax
	; AVX-NEXT: xorl $3, %eax			; AVX1-NEXT: xorl $3, %eax
	; AVX-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX-NEXT: jne .LBB7_1			; AVX1-NEXT: jne .LBB7_1
	; AVX-NEXT: # %bb.2: # %else			; AVX1-NEXT: # %bb.2: # %else
	; AVX-NEXT: testb $2, %al			; AVX1-NEXT: testb $2, %al
	; AVX-NEXT: jne .LBB7_3			; AVX1-NEXT: jne .LBB7_3
	; AVX-NEXT: .LBB7_4: # %else2			; AVX1-NEXT: .LBB7_4: # %else2
	; AVX-NEXT: retq			; AVX1-NEXT: retq
	; AVX-NEXT: .LBB7_1: # %cond.store			; AVX1-NEXT: .LBB7_1: # %cond.store
	; AVX-NEXT: vpextrw $0, %xmm0, (%rdi)			; AVX1-NEXT: vpextrw $0, %xmm0, (%rdi)
	; AVX-NEXT: testb $2, %al			; AVX1-NEXT: testb $2, %al
	; AVX-NEXT: je .LBB7_4			; AVX1-NEXT: je .LBB7_4
	; AVX-NEXT: .LBB7_3: # %cond.store1			; AVX1-NEXT: .LBB7_3: # %cond.store1
	; AVX-NEXT: vpextrw $1, %xmm0, 2(%rdi)			; AVX1-NEXT: vpextrw $1, %xmm0, 2(%rdi)
	; AVX-NEXT: retq			; AVX1-NEXT: retq
				;
				; AVX2-LABEL: truncstore_v2i64_v2i16:
				; AVX2: # %bb.0:
				; AVX2-NEXT: vpxor %xmm2, %xmm2, %xmm2
				; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm3 = [32767,32767]
				; AVX2-NEXT: vpcmpgtq %xmm0, %xmm3, %xmm4
				; AVX2-NEXT: vblendvpd %xmm4, %xmm0, %xmm3, %xmm0
				; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm3 = [18446744073709518848,18446744073709518848]
				; AVX2-NEXT: vpcmpgtq %xmm3, %xmm0, %xmm4
				; AVX2-NEXT: vblendvpd %xmm4, %xmm0, %xmm3, %xmm0
				; AVX2-NEXT: vpermilps {{.*#+}} xmm0 = xmm0[0,2,2,3]
				; AVX2-NEXT: vpshuflw {{.*#+}} xmm0 = xmm0[0,2,2,3,4,5,6,7]
				; AVX2-NEXT: vpcmpeqq %xmm2, %xmm1, %xmm1
				; AVX2-NEXT: vmovmskpd %xmm1, %eax
				; AVX2-NEXT: xorl $3, %eax
				; AVX2-NEXT: testb $1, %al
				; AVX2-NEXT: jne .LBB7_1
				; AVX2-NEXT: # %bb.2: # %else
				; AVX2-NEXT: testb $2, %al
				; AVX2-NEXT: jne .LBB7_3
				; AVX2-NEXT: .LBB7_4: # %else2
				; AVX2-NEXT: retq
				; AVX2-NEXT: .LBB7_1: # %cond.store
				; AVX2-NEXT: vpextrw $0, %xmm0, (%rdi)
				; AVX2-NEXT: testb $2, %al
				; AVX2-NEXT: je .LBB7_4
				; AVX2-NEXT: .LBB7_3: # %cond.store1
				; AVX2-NEXT: vpextrw $1, %xmm0, 2(%rdi)
				; AVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: truncstore_v2i64_v2i16:			; AVX512F-LABEL: truncstore_v2i64_v2i16:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	; AVX512F-NEXT: # kill: def $xmm1 killed $xmm1 def $zmm1			; AVX512F-NEXT: # kill: def $xmm1 killed $xmm1 def $zmm1
	; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512F-NEXT: vptestmq %zmm1, %zmm1, %k0			; AVX512F-NEXT: vptestmq %zmm1, %zmm1, %k0
	; AVX512F-NEXT: vpmovsqw %zmm0, %xmm0			; AVX512F-NEXT: vpmovsqw %zmm0, %xmm0
	; AVX512F-NEXT: kmovw %k0, %eax			; AVX512F-NEXT: kmovw %k0, %eax
	▲ Show 20 Lines • Show All 126 Lines • ▼ Show 20 Lines
	; SSE4-NEXT: .LBB8_1: # %cond.store			; SSE4-NEXT: .LBB8_1: # %cond.store
	; SSE4-NEXT: pextrb $0, %xmm2, (%rdi)			; SSE4-NEXT: pextrb $0, %xmm2, (%rdi)
	; SSE4-NEXT: testb $2, %al			; SSE4-NEXT: testb $2, %al
	; SSE4-NEXT: je .LBB8_4			; SSE4-NEXT: je .LBB8_4
	; SSE4-NEXT: .LBB8_3: # %cond.store1			; SSE4-NEXT: .LBB8_3: # %cond.store1
	; SSE4-NEXT: pextrb $1, %xmm2, 1(%rdi)			; SSE4-NEXT: pextrb $1, %xmm2, 1(%rdi)
	; SSE4-NEXT: retq			; SSE4-NEXT: retq
	;			;
	; AVX-LABEL: truncstore_v2i64_v2i8:			; AVX1-LABEL: truncstore_v2i64_v2i8:
	; AVX: # %bb.0:			; AVX1: # %bb.0:
	; AVX-NEXT: vpxor %xmm2, %xmm2, %xmm2			; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2
	; AVX-NEXT: vmovdqa {{.*#+}} xmm3 = [127,127]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm3 = [127,127]
	; AVX-NEXT: vpcmpgtq %xmm0, %xmm3, %xmm4			; AVX1-NEXT: vpcmpgtq %xmm0, %xmm3, %xmm4
	; AVX-NEXT: vblendvpd %xmm4, %xmm0, %xmm3, %xmm0			; AVX1-NEXT: vblendvpd %xmm4, %xmm0, %xmm3, %xmm0
	; AVX-NEXT: vmovdqa {{.*#+}} xmm3 = [18446744073709551488,18446744073709551488]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm3 = [18446744073709551488,18446744073709551488]
	; AVX-NEXT: vpcmpgtq %xmm3, %xmm0, %xmm4			; AVX1-NEXT: vpcmpgtq %xmm3, %xmm0, %xmm4
	; AVX-NEXT: vblendvpd %xmm4, %xmm0, %xmm3, %xmm0			; AVX1-NEXT: vblendvpd %xmm4, %xmm0, %xmm3, %xmm0
	; AVX-NEXT: vpshufb {{.*#+}} xmm0 = xmm0[0,8,u,u,u,u,u,u,u,u,u,u,u,u,u,u]			; AVX1-NEXT: vpshufb {{.*#+}} xmm0 = xmm0[0,8,u,u,u,u,u,u,u,u,u,u,u,u,u,u]
	; AVX-NEXT: vpcmpeqq %xmm2, %xmm1, %xmm1			; AVX1-NEXT: vpcmpeqq %xmm2, %xmm1, %xmm1
	; AVX-NEXT: vmovmskpd %xmm1, %eax			; AVX1-NEXT: vmovmskpd %xmm1, %eax
	; AVX-NEXT: xorl $3, %eax			; AVX1-NEXT: xorl $3, %eax
	; AVX-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX-NEXT: jne .LBB8_1			; AVX1-NEXT: jne .LBB8_1
	; AVX-NEXT: # %bb.2: # %else			; AVX1-NEXT: # %bb.2: # %else
	; AVX-NEXT: testb $2, %al			; AVX1-NEXT: testb $2, %al
	; AVX-NEXT: jne .LBB8_3			; AVX1-NEXT: jne .LBB8_3
	; AVX-NEXT: .LBB8_4: # %else2			; AVX1-NEXT: .LBB8_4: # %else2
	; AVX-NEXT: retq			; AVX1-NEXT: retq
	; AVX-NEXT: .LBB8_1: # %cond.store			; AVX1-NEXT: .LBB8_1: # %cond.store
	; AVX-NEXT: vpextrb $0, %xmm0, (%rdi)			; AVX1-NEXT: vpextrb $0, %xmm0, (%rdi)
	; AVX-NEXT: testb $2, %al			; AVX1-NEXT: testb $2, %al
	; AVX-NEXT: je .LBB8_4			; AVX1-NEXT: je .LBB8_4
	; AVX-NEXT: .LBB8_3: # %cond.store1			; AVX1-NEXT: .LBB8_3: # %cond.store1
	; AVX-NEXT: vpextrb $1, %xmm0, 1(%rdi)			; AVX1-NEXT: vpextrb $1, %xmm0, 1(%rdi)
	; AVX-NEXT: retq			; AVX1-NEXT: retq
				;
				; AVX2-LABEL: truncstore_v2i64_v2i8:
				; AVX2: # %bb.0:
				; AVX2-NEXT: vpxor %xmm2, %xmm2, %xmm2
				; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm3 = [127,127]
				; AVX2-NEXT: vpcmpgtq %xmm0, %xmm3, %xmm4
				; AVX2-NEXT: vblendvpd %xmm4, %xmm0, %xmm3, %xmm0
				; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm3 = [18446744073709551488,18446744073709551488]
				; AVX2-NEXT: vpcmpgtq %xmm3, %xmm0, %xmm4
				; AVX2-NEXT: vblendvpd %xmm4, %xmm0, %xmm3, %xmm0
				; AVX2-NEXT: vpshufb {{.*#+}} xmm0 = xmm0[0,8,u,u,u,u,u,u,u,u,u,u,u,u,u,u]
				; AVX2-NEXT: vpcmpeqq %xmm2, %xmm1, %xmm1
				; AVX2-NEXT: vmovmskpd %xmm1, %eax
				; AVX2-NEXT: xorl $3, %eax
				; AVX2-NEXT: testb $1, %al
				; AVX2-NEXT: jne .LBB8_1
				; AVX2-NEXT: # %bb.2: # %else
				; AVX2-NEXT: testb $2, %al
				; AVX2-NEXT: jne .LBB8_3
				; AVX2-NEXT: .LBB8_4: # %else2
				; AVX2-NEXT: retq
				; AVX2-NEXT: .LBB8_1: # %cond.store
				; AVX2-NEXT: vpextrb $0, %xmm0, (%rdi)
				; AVX2-NEXT: testb $2, %al
				; AVX2-NEXT: je .LBB8_4
				; AVX2-NEXT: .LBB8_3: # %cond.store1
				; AVX2-NEXT: vpextrb $1, %xmm0, 1(%rdi)
				; AVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: truncstore_v2i64_v2i8:			; AVX512F-LABEL: truncstore_v2i64_v2i8:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	; AVX512F-NEXT: # kill: def $xmm1 killed $xmm1 def $zmm1			; AVX512F-NEXT: # kill: def $xmm1 killed $xmm1 def $zmm1
	; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512F-NEXT: vptestmq %zmm1, %zmm1, %k0			; AVX512F-NEXT: vptestmq %zmm1, %zmm1, %k0
	; AVX512F-NEXT: vpmovsqb %zmm0, %xmm0			; AVX512F-NEXT: vpmovsqb %zmm0, %xmm0
	; AVX512F-NEXT: kmovw %k0, %eax			; AVX512F-NEXT: kmovw %k0, %eax
	▲ Show 20 Lines • Show All 2,040 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/masked_store_trunc_usat.ll

	Show First 20 Lines • Show All 2,040 Lines • ▼ Show 20 Lines
	;			;
	; AVX2-LABEL: truncstore_v2i64_v2i32:			; AVX2-LABEL: truncstore_v2i64_v2i32:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpxor %xmm2, %xmm2, %xmm2			; AVX2-NEXT: vpxor %xmm2, %xmm2, %xmm2
	; AVX2-NEXT: vpcmpeqq %xmm2, %xmm1, %xmm1			; AVX2-NEXT: vpcmpeqq %xmm2, %xmm1, %xmm1
	; AVX2-NEXT: vpcmpeqd %xmm2, %xmm2, %xmm2			; AVX2-NEXT: vpcmpeqd %xmm2, %xmm2, %xmm2
	; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm1
	; AVX2-NEXT: vinsertps {{.*#+}} xmm1 = xmm1[0,2],zero,zero			; AVX2-NEXT: vinsertps {{.*#+}} xmm1 = xmm1[0,2],zero,zero
	; AVX2-NEXT: vmovapd {{.*#+}} xmm2 = [4294967295,4294967295]			; AVX2-NEXT: vmovddup {{.*#+}} xmm2 = [4294967295,4294967295]
	; AVX2-NEXT: vpxor {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm3			; AVX2-NEXT: # xmm2 = mem[0,0]
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm4 = [9223372041149743103,9223372041149743103]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm3 = [9223372036854775808,9223372036854775808]
				; AVX2-NEXT: vpxor %xmm3, %xmm0, %xmm3
				; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm4 = [9223372041149743103,9223372041149743103]
	; AVX2-NEXT: vpcmpgtq %xmm3, %xmm4, %xmm3			; AVX2-NEXT: vpcmpgtq %xmm3, %xmm4, %xmm3
	; AVX2-NEXT: vblendvpd %xmm3, %xmm0, %xmm2, %xmm0			; AVX2-NEXT: vblendvpd %xmm3, %xmm0, %xmm2, %xmm0
	; AVX2-NEXT: vpermilps {{.*#+}} xmm0 = xmm0[0,2,2,3]			; AVX2-NEXT: vpermilps {{.*#+}} xmm0 = xmm0[0,2,2,3]
	; AVX2-NEXT: vpmaskmovd %xmm0, %xmm1, (%rdi)			; AVX2-NEXT: vpmaskmovd %xmm0, %xmm1, (%rdi)
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: truncstore_v2i64_v2i32:			; AVX512F-LABEL: truncstore_v2i64_v2i32:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	▲ Show 20 Lines • Show All 100 Lines • ▼ Show 20 Lines
	; SSE4-NEXT: .LBB7_1: # %cond.store			; SSE4-NEXT: .LBB7_1: # %cond.store
	; SSE4-NEXT: pextrw $0, %xmm0, (%rdi)			; SSE4-NEXT: pextrw $0, %xmm0, (%rdi)
	; SSE4-NEXT: testb $2, %al			; SSE4-NEXT: testb $2, %al
	; SSE4-NEXT: je .LBB7_4			; SSE4-NEXT: je .LBB7_4
	; SSE4-NEXT: .LBB7_3: # %cond.store1			; SSE4-NEXT: .LBB7_3: # %cond.store1
	; SSE4-NEXT: pextrw $1, %xmm0, 2(%rdi)			; SSE4-NEXT: pextrw $1, %xmm0, 2(%rdi)
	; SSE4-NEXT: retq			; SSE4-NEXT: retq
	;			;
	; AVX-LABEL: truncstore_v2i64_v2i16:			; AVX1-LABEL: truncstore_v2i64_v2i16:
	; AVX: # %bb.0:			; AVX1: # %bb.0:
	; AVX-NEXT: vpxor %xmm2, %xmm2, %xmm2			; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2
	; AVX-NEXT: vmovapd {{.*#+}} xmm3 = [65535,65535]			; AVX1-NEXT: vmovapd {{.*#+}} xmm3 = [65535,65535]
	; AVX-NEXT: vpxor {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm4			; AVX1-NEXT: vpxor {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm4
	; AVX-NEXT: vmovdqa {{.*#+}} xmm5 = [9223372036854841343,9223372036854841343]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm5 = [9223372036854841343,9223372036854841343]
	; AVX-NEXT: vpcmpgtq %xmm4, %xmm5, %xmm4			; AVX1-NEXT: vpcmpgtq %xmm4, %xmm5, %xmm4
	; AVX-NEXT: vblendvpd %xmm4, %xmm0, %xmm3, %xmm0			; AVX1-NEXT: vblendvpd %xmm4, %xmm0, %xmm3, %xmm0
	; AVX-NEXT: vpermilps {{.*#+}} xmm0 = xmm0[0,2,2,3]			; AVX1-NEXT: vpermilps {{.*#+}} xmm0 = xmm0[0,2,2,3]
	; AVX-NEXT: vpshuflw {{.*#+}} xmm0 = xmm0[0,2,2,3,4,5,6,7]			; AVX1-NEXT: vpshuflw {{.*#+}} xmm0 = xmm0[0,2,2,3,4,5,6,7]
	; AVX-NEXT: vpcmpeqq %xmm2, %xmm1, %xmm1			; AVX1-NEXT: vpcmpeqq %xmm2, %xmm1, %xmm1
	; AVX-NEXT: vmovmskpd %xmm1, %eax			; AVX1-NEXT: vmovmskpd %xmm1, %eax
	; AVX-NEXT: xorl $3, %eax			; AVX1-NEXT: xorl $3, %eax
	; AVX-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX-NEXT: jne .LBB7_1			; AVX1-NEXT: jne .LBB7_1
	; AVX-NEXT: # %bb.2: # %else			; AVX1-NEXT: # %bb.2: # %else
	; AVX-NEXT: testb $2, %al			; AVX1-NEXT: testb $2, %al
	; AVX-NEXT: jne .LBB7_3			; AVX1-NEXT: jne .LBB7_3
	; AVX-NEXT: .LBB7_4: # %else2			; AVX1-NEXT: .LBB7_4: # %else2
	; AVX-NEXT: retq			; AVX1-NEXT: retq
	; AVX-NEXT: .LBB7_1: # %cond.store			; AVX1-NEXT: .LBB7_1: # %cond.store
	; AVX-NEXT: vpextrw $0, %xmm0, (%rdi)			; AVX1-NEXT: vpextrw $0, %xmm0, (%rdi)
	; AVX-NEXT: testb $2, %al			; AVX1-NEXT: testb $2, %al
	; AVX-NEXT: je .LBB7_4			; AVX1-NEXT: je .LBB7_4
	; AVX-NEXT: .LBB7_3: # %cond.store1			; AVX1-NEXT: .LBB7_3: # %cond.store1
	; AVX-NEXT: vpextrw $1, %xmm0, 2(%rdi)			; AVX1-NEXT: vpextrw $1, %xmm0, 2(%rdi)
	; AVX-NEXT: retq			; AVX1-NEXT: retq
				;
				; AVX2-LABEL: truncstore_v2i64_v2i16:
				; AVX2: # %bb.0:
				; AVX2-NEXT: vpxor %xmm2, %xmm2, %xmm2
				; AVX2-NEXT: vmovddup {{.*#+}} xmm3 = [65535,65535]
				; AVX2-NEXT: # xmm3 = mem[0,0]
				; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm4 = [9223372036854775808,9223372036854775808]
				; AVX2-NEXT: vpxor %xmm4, %xmm0, %xmm4
				; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm5 = [9223372036854841343,9223372036854841343]
				; AVX2-NEXT: vpcmpgtq %xmm4, %xmm5, %xmm4
				; AVX2-NEXT: vblendvpd %xmm4, %xmm0, %xmm3, %xmm0
				; AVX2-NEXT: vpermilps {{.*#+}} xmm0 = xmm0[0,2,2,3]
				; AVX2-NEXT: vpshuflw {{.*#+}} xmm0 = xmm0[0,2,2,3,4,5,6,7]
				; AVX2-NEXT: vpcmpeqq %xmm2, %xmm1, %xmm1
				; AVX2-NEXT: vmovmskpd %xmm1, %eax
				; AVX2-NEXT: xorl $3, %eax
				; AVX2-NEXT: testb $1, %al
				; AVX2-NEXT: jne .LBB7_1
				; AVX2-NEXT: # %bb.2: # %else
				; AVX2-NEXT: testb $2, %al
				; AVX2-NEXT: jne .LBB7_3
				; AVX2-NEXT: .LBB7_4: # %else2
				; AVX2-NEXT: retq
				; AVX2-NEXT: .LBB7_1: # %cond.store
				; AVX2-NEXT: vpextrw $0, %xmm0, (%rdi)
				; AVX2-NEXT: testb $2, %al
				; AVX2-NEXT: je .LBB7_4
				; AVX2-NEXT: .LBB7_3: # %cond.store1
				; AVX2-NEXT: vpextrw $1, %xmm0, 2(%rdi)
				; AVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: truncstore_v2i64_v2i16:			; AVX512F-LABEL: truncstore_v2i64_v2i16:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	; AVX512F-NEXT: # kill: def $xmm1 killed $xmm1 def $zmm1			; AVX512F-NEXT: # kill: def $xmm1 killed $xmm1 def $zmm1
	; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512F-NEXT: vptestmq %zmm1, %zmm1, %k0			; AVX512F-NEXT: vptestmq %zmm1, %zmm1, %k0
	; AVX512F-NEXT: vpmovusqw %zmm0, %xmm0			; AVX512F-NEXT: vpmovusqw %zmm0, %xmm0
	; AVX512F-NEXT: kmovw %k0, %eax			; AVX512F-NEXT: kmovw %k0, %eax
	▲ Show 20 Lines • Show All 107 Lines • ▼ Show 20 Lines
	; SSE4-NEXT: .LBB8_1: # %cond.store			; SSE4-NEXT: .LBB8_1: # %cond.store
	; SSE4-NEXT: pextrb $0, %xmm3, (%rdi)			; SSE4-NEXT: pextrb $0, %xmm3, (%rdi)
	; SSE4-NEXT: testb $2, %al			; SSE4-NEXT: testb $2, %al
	; SSE4-NEXT: je .LBB8_4			; SSE4-NEXT: je .LBB8_4
	; SSE4-NEXT: .LBB8_3: # %cond.store1			; SSE4-NEXT: .LBB8_3: # %cond.store1
	; SSE4-NEXT: pextrb $1, %xmm3, 1(%rdi)			; SSE4-NEXT: pextrb $1, %xmm3, 1(%rdi)
	; SSE4-NEXT: retq			; SSE4-NEXT: retq
	;			;
	; AVX-LABEL: truncstore_v2i64_v2i8:			; AVX1-LABEL: truncstore_v2i64_v2i8:
	; AVX: # %bb.0:			; AVX1: # %bb.0:
	; AVX-NEXT: vpxor %xmm2, %xmm2, %xmm2			; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2
	; AVX-NEXT: vmovapd {{.*#+}} xmm3 = [255,255]			; AVX1-NEXT: vmovapd {{.*#+}} xmm3 = [255,255]
	; AVX-NEXT: vpxor {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm4			; AVX1-NEXT: vpxor {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm4
	; AVX-NEXT: vmovdqa {{.*#+}} xmm5 = [9223372036854776063,9223372036854776063]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm5 = [9223372036854776063,9223372036854776063]
	; AVX-NEXT: vpcmpgtq %xmm4, %xmm5, %xmm4			; AVX1-NEXT: vpcmpgtq %xmm4, %xmm5, %xmm4
	; AVX-NEXT: vblendvpd %xmm4, %xmm0, %xmm3, %xmm0			; AVX1-NEXT: vblendvpd %xmm4, %xmm0, %xmm3, %xmm0
	; AVX-NEXT: vpshufb {{.*#+}} xmm0 = xmm0[0,8,u,u,u,u,u,u,u,u,u,u,u,u,u,u]			; AVX1-NEXT: vpshufb {{.*#+}} xmm0 = xmm0[0,8,u,u,u,u,u,u,u,u,u,u,u,u,u,u]
	; AVX-NEXT: vpcmpeqq %xmm2, %xmm1, %xmm1			; AVX1-NEXT: vpcmpeqq %xmm2, %xmm1, %xmm1
	; AVX-NEXT: vmovmskpd %xmm1, %eax			; AVX1-NEXT: vmovmskpd %xmm1, %eax
	; AVX-NEXT: xorl $3, %eax			; AVX1-NEXT: xorl $3, %eax
	; AVX-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX-NEXT: jne .LBB8_1			; AVX1-NEXT: jne .LBB8_1
	; AVX-NEXT: # %bb.2: # %else			; AVX1-NEXT: # %bb.2: # %else
	; AVX-NEXT: testb $2, %al			; AVX1-NEXT: testb $2, %al
	; AVX-NEXT: jne .LBB8_3			; AVX1-NEXT: jne .LBB8_3
	; AVX-NEXT: .LBB8_4: # %else2			; AVX1-NEXT: .LBB8_4: # %else2
	; AVX-NEXT: retq			; AVX1-NEXT: retq
	; AVX-NEXT: .LBB8_1: # %cond.store			; AVX1-NEXT: .LBB8_1: # %cond.store
	; AVX-NEXT: vpextrb $0, %xmm0, (%rdi)			; AVX1-NEXT: vpextrb $0, %xmm0, (%rdi)
	; AVX-NEXT: testb $2, %al			; AVX1-NEXT: testb $2, %al
	; AVX-NEXT: je .LBB8_4			; AVX1-NEXT: je .LBB8_4
	; AVX-NEXT: .LBB8_3: # %cond.store1			; AVX1-NEXT: .LBB8_3: # %cond.store1
	; AVX-NEXT: vpextrb $1, %xmm0, 1(%rdi)			; AVX1-NEXT: vpextrb $1, %xmm0, 1(%rdi)
	; AVX-NEXT: retq			; AVX1-NEXT: retq
				;
				; AVX2-LABEL: truncstore_v2i64_v2i8:
				; AVX2: # %bb.0:
				; AVX2-NEXT: vpxor %xmm2, %xmm2, %xmm2
				; AVX2-NEXT: vmovddup {{.*#+}} xmm3 = [255,255]
				; AVX2-NEXT: # xmm3 = mem[0,0]
				; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm4 = [9223372036854775808,9223372036854775808]
				; AVX2-NEXT: vpxor %xmm4, %xmm0, %xmm4
				; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm5 = [9223372036854776063,9223372036854776063]
				; AVX2-NEXT: vpcmpgtq %xmm4, %xmm5, %xmm4
				; AVX2-NEXT: vblendvpd %xmm4, %xmm0, %xmm3, %xmm0
				; AVX2-NEXT: vpshufb {{.*#+}} xmm0 = xmm0[0,8,u,u,u,u,u,u,u,u,u,u,u,u,u,u]
				; AVX2-NEXT: vpcmpeqq %xmm2, %xmm1, %xmm1
				; AVX2-NEXT: vmovmskpd %xmm1, %eax
				; AVX2-NEXT: xorl $3, %eax
				; AVX2-NEXT: testb $1, %al
				; AVX2-NEXT: jne .LBB8_1
				; AVX2-NEXT: # %bb.2: # %else
				; AVX2-NEXT: testb $2, %al
				; AVX2-NEXT: jne .LBB8_3
				; AVX2-NEXT: .LBB8_4: # %else2
				; AVX2-NEXT: retq
				; AVX2-NEXT: .LBB8_1: # %cond.store
				; AVX2-NEXT: vpextrb $0, %xmm0, (%rdi)
				; AVX2-NEXT: testb $2, %al
				; AVX2-NEXT: je .LBB8_4
				; AVX2-NEXT: .LBB8_3: # %cond.store1
				; AVX2-NEXT: vpextrb $1, %xmm0, 1(%rdi)
				; AVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: truncstore_v2i64_v2i8:			; AVX512F-LABEL: truncstore_v2i64_v2i8:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	; AVX512F-NEXT: # kill: def $xmm1 killed $xmm1 def $zmm1			; AVX512F-NEXT: # kill: def $xmm1 killed $xmm1 def $zmm1
	; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512F-NEXT: vptestmq %zmm1, %zmm1, %k0			; AVX512F-NEXT: vptestmq %zmm1, %zmm1, %k0
	; AVX512F-NEXT: vpmovusqb %zmm0, %xmm0			; AVX512F-NEXT: vpmovusqb %zmm0, %xmm0
	; AVX512F-NEXT: kmovw %k0, %eax			; AVX512F-NEXT: kmovw %k0, %eax
	▲ Show 20 Lines • Show All 2,040 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/midpoint-int-vec-128.ll

	Show First 20 Lines • Show All 969 Lines • ▼ Show 20 Lines
	; AVX1-FALLBACK-NEXT: vpmuludq %xmm3, %xmm2, %xmm2			; AVX1-FALLBACK-NEXT: vpmuludq %xmm3, %xmm2, %xmm2
	; AVX1-FALLBACK-NEXT: vpaddq %xmm0, %xmm1, %xmm0			; AVX1-FALLBACK-NEXT: vpaddq %xmm0, %xmm1, %xmm0
	; AVX1-FALLBACK-NEXT: vpaddq %xmm0, %xmm2, %xmm0			; AVX1-FALLBACK-NEXT: vpaddq %xmm0, %xmm2, %xmm0
	; AVX1-FALLBACK-NEXT: retq			; AVX1-FALLBACK-NEXT: retq
	;			;
	; AVX2-FALLBACK-LABEL: vec128_i64_signed_reg_reg:			; AVX2-FALLBACK-LABEL: vec128_i64_signed_reg_reg:
	; AVX2-FALLBACK: # %bb.0:			; AVX2-FALLBACK: # %bb.0:
	; AVX2-FALLBACK-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm2			; AVX2-FALLBACK-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm2
	; AVX2-FALLBACK-NEXT: vpor {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2, %xmm3			; AVX2-FALLBACK-NEXT: vpbroadcastq {{.*#+}} xmm3 = [1,1]
				; AVX2-FALLBACK-NEXT: vpor %xmm3, %xmm2, %xmm3
	; AVX2-FALLBACK-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm4			; AVX2-FALLBACK-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm4
	; AVX2-FALLBACK-NEXT: vblendvpd %xmm4, %xmm0, %xmm1, %xmm4			; AVX2-FALLBACK-NEXT: vblendvpd %xmm4, %xmm0, %xmm1, %xmm4
	; AVX2-FALLBACK-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm1			; AVX2-FALLBACK-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm1
	; AVX2-FALLBACK-NEXT: vpsubq %xmm4, %xmm1, %xmm1			; AVX2-FALLBACK-NEXT: vpsubq %xmm4, %xmm1, %xmm1
	; AVX2-FALLBACK-NEXT: vpsrlq $1, %xmm1, %xmm2			; AVX2-FALLBACK-NEXT: vpsrlq $1, %xmm1, %xmm2
	; AVX2-FALLBACK-NEXT: vpsrlq $33, %xmm1, %xmm1			; AVX2-FALLBACK-NEXT: vpsrlq $33, %xmm1, %xmm1
	; AVX2-FALLBACK-NEXT: vpmuludq %xmm3, %xmm1, %xmm1			; AVX2-FALLBACK-NEXT: vpmuludq %xmm3, %xmm1, %xmm1
	; AVX2-FALLBACK-NEXT: vpsrlq $32, %xmm3, %xmm4			; AVX2-FALLBACK-NEXT: vpsrlq $32, %xmm3, %xmm4
	; AVX2-FALLBACK-NEXT: vpmuludq %xmm4, %xmm2, %xmm4			; AVX2-FALLBACK-NEXT: vpmuludq %xmm4, %xmm2, %xmm4
	; AVX2-FALLBACK-NEXT: vpaddq %xmm1, %xmm4, %xmm1			; AVX2-FALLBACK-NEXT: vpaddq %xmm1, %xmm4, %xmm1
	; AVX2-FALLBACK-NEXT: vpsllq $32, %xmm1, %xmm1			; AVX2-FALLBACK-NEXT: vpsllq $32, %xmm1, %xmm1
	; AVX2-FALLBACK-NEXT: vpmuludq %xmm3, %xmm2, %xmm2			; AVX2-FALLBACK-NEXT: vpmuludq %xmm3, %xmm2, %xmm2
	; AVX2-FALLBACK-NEXT: vpaddq %xmm0, %xmm1, %xmm0			; AVX2-FALLBACK-NEXT: vpaddq %xmm0, %xmm1, %xmm0
	; AVX2-FALLBACK-NEXT: vpaddq %xmm0, %xmm2, %xmm0			; AVX2-FALLBACK-NEXT: vpaddq %xmm0, %xmm2, %xmm0
	; AVX2-FALLBACK-NEXT: retq			; AVX2-FALLBACK-NEXT: retq
	;			;
	; XOP-LABEL: vec128_i64_signed_reg_reg:			; XOP-FALLBACK-LABEL: vec128_i64_signed_reg_reg:
	; XOP: # %bb.0:			; XOP-FALLBACK: # %bb.0:
	; XOP-NEXT: vpcomgtq %xmm1, %xmm0, %xmm2			; XOP-FALLBACK-NEXT: vpcomgtq %xmm1, %xmm0, %xmm2
	; XOP-NEXT: vpor {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2, %xmm3			; XOP-FALLBACK-NEXT: vpor {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2, %xmm3
	; XOP-NEXT: vpcomltq %xmm1, %xmm0, %xmm4			; XOP-FALLBACK-NEXT: vpcomltq %xmm1, %xmm0, %xmm4
	; XOP-NEXT: vblendvpd %xmm4, %xmm0, %xmm1, %xmm4			; XOP-FALLBACK-NEXT: vblendvpd %xmm4, %xmm0, %xmm1, %xmm4
	; XOP-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm1			; XOP-FALLBACK-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm1
	; XOP-NEXT: vpsubq %xmm4, %xmm1, %xmm1			; XOP-FALLBACK-NEXT: vpsubq %xmm4, %xmm1, %xmm1
	; XOP-NEXT: vpsrlq $1, %xmm1, %xmm2			; XOP-FALLBACK-NEXT: vpsrlq $1, %xmm1, %xmm2
	; XOP-NEXT: vpsrlq $33, %xmm1, %xmm1			; XOP-FALLBACK-NEXT: vpsrlq $33, %xmm1, %xmm1
	; XOP-NEXT: vpmuludq %xmm3, %xmm1, %xmm1			; XOP-FALLBACK-NEXT: vpmuludq %xmm3, %xmm1, %xmm1
	; XOP-NEXT: vpsrlq $32, %xmm3, %xmm4			; XOP-FALLBACK-NEXT: vpsrlq $32, %xmm3, %xmm4
	; XOP-NEXT: vpmuludq %xmm4, %xmm2, %xmm4			; XOP-FALLBACK-NEXT: vpmuludq %xmm4, %xmm2, %xmm4
	; XOP-NEXT: vpaddq %xmm1, %xmm4, %xmm1			; XOP-FALLBACK-NEXT: vpaddq %xmm1, %xmm4, %xmm1
	; XOP-NEXT: vpsllq $32, %xmm1, %xmm1			; XOP-FALLBACK-NEXT: vpsllq $32, %xmm1, %xmm1
	; XOP-NEXT: vpmuludq %xmm3, %xmm2, %xmm2			; XOP-FALLBACK-NEXT: vpmuludq %xmm3, %xmm2, %xmm2
	; XOP-NEXT: vpaddq %xmm0, %xmm1, %xmm0			; XOP-FALLBACK-NEXT: vpaddq %xmm0, %xmm1, %xmm0
	; XOP-NEXT: vpaddq %xmm0, %xmm2, %xmm0			; XOP-FALLBACK-NEXT: vpaddq %xmm0, %xmm2, %xmm0
	; XOP-NEXT: retq			; XOP-FALLBACK-NEXT: retq
				;
				; XOPAVX1-LABEL: vec128_i64_signed_reg_reg:
				; XOPAVX1: # %bb.0:
				; XOPAVX1-NEXT: vpcomgtq %xmm1, %xmm0, %xmm2
				; XOPAVX1-NEXT: vpor {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2, %xmm3
				; XOPAVX1-NEXT: vpcomltq %xmm1, %xmm0, %xmm4
				; XOPAVX1-NEXT: vblendvpd %xmm4, %xmm0, %xmm1, %xmm4
				; XOPAVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm1
				; XOPAVX1-NEXT: vpsubq %xmm4, %xmm1, %xmm1
				; XOPAVX1-NEXT: vpsrlq $1, %xmm1, %xmm2
				; XOPAVX1-NEXT: vpsrlq $33, %xmm1, %xmm1
				; XOPAVX1-NEXT: vpmuludq %xmm3, %xmm1, %xmm1
				; XOPAVX1-NEXT: vpsrlq $32, %xmm3, %xmm4
				; XOPAVX1-NEXT: vpmuludq %xmm4, %xmm2, %xmm4
				; XOPAVX1-NEXT: vpaddq %xmm1, %xmm4, %xmm1
				; XOPAVX1-NEXT: vpsllq $32, %xmm1, %xmm1
				; XOPAVX1-NEXT: vpmuludq %xmm3, %xmm2, %xmm2
				; XOPAVX1-NEXT: vpaddq %xmm0, %xmm1, %xmm0
				; XOPAVX1-NEXT: vpaddq %xmm0, %xmm2, %xmm0
				; XOPAVX1-NEXT: retq
				;
				; XOPAVX2-LABEL: vec128_i64_signed_reg_reg:
				; XOPAVX2: # %bb.0:
				; XOPAVX2-NEXT: vpcomgtq %xmm1, %xmm0, %xmm2
				; XOPAVX2-NEXT: vpbroadcastq {{.*#+}} xmm3 = [1,1]
				; XOPAVX2-NEXT: vpor %xmm3, %xmm2, %xmm3
				; XOPAVX2-NEXT: vpcomltq %xmm1, %xmm0, %xmm4
				; XOPAVX2-NEXT: vblendvpd %xmm4, %xmm0, %xmm1, %xmm4
				; XOPAVX2-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm1
				; XOPAVX2-NEXT: vpsubq %xmm4, %xmm1, %xmm1
				; XOPAVX2-NEXT: vpsrlq $1, %xmm1, %xmm2
				; XOPAVX2-NEXT: vpsrlq $33, %xmm1, %xmm1
				; XOPAVX2-NEXT: vpmuludq %xmm3, %xmm1, %xmm1
				; XOPAVX2-NEXT: vpsrlq $32, %xmm3, %xmm4
				; XOPAVX2-NEXT: vpmuludq %xmm4, %xmm2, %xmm4
				; XOPAVX2-NEXT: vpaddq %xmm1, %xmm4, %xmm1
				; XOPAVX2-NEXT: vpsllq $32, %xmm1, %xmm1
				; XOPAVX2-NEXT: vpmuludq %xmm3, %xmm2, %xmm2
				; XOPAVX2-NEXT: vpaddq %xmm0, %xmm1, %xmm0
				; XOPAVX2-NEXT: vpaddq %xmm0, %xmm2, %xmm0
				; XOPAVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: vec128_i64_signed_reg_reg:			; AVX512F-LABEL: vec128_i64_signed_reg_reg:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	; AVX512F-NEXT: # kill: def $xmm1 killed $xmm1 def $zmm1			; AVX512F-NEXT: # kill: def $xmm1 killed $xmm1 def $zmm1
	; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512F-NEXT: vpcmpgtq %zmm1, %zmm0, %k1			; AVX512F-NEXT: vpcmpgtq %zmm1, %zmm0, %k1
	; AVX512F-NEXT: vpcmpeqd %xmm2, %xmm2, %xmm2			; AVX512F-NEXT: vpcmpeqd %xmm2, %xmm2, %xmm2
	; AVX512F-NEXT: vmovdqa {{.*#+}} xmm3 = [1,1]			; AVX512F-NEXT: vmovdqa {{.*#+}} xmm3 = [1,1]
	▲ Show 20 Lines • Show All 167 Lines • ▼ Show 20 Lines
	; AVX1-FALLBACK-NEXT: vpsllq $32, %xmm1, %xmm1			; AVX1-FALLBACK-NEXT: vpsllq $32, %xmm1, %xmm1
	; AVX1-FALLBACK-NEXT: vpmuludq %xmm5, %xmm2, %xmm2			; AVX1-FALLBACK-NEXT: vpmuludq %xmm5, %xmm2, %xmm2
	; AVX1-FALLBACK-NEXT: vpaddq %xmm0, %xmm1, %xmm0			; AVX1-FALLBACK-NEXT: vpaddq %xmm0, %xmm1, %xmm0
	; AVX1-FALLBACK-NEXT: vpaddq %xmm0, %xmm2, %xmm0			; AVX1-FALLBACK-NEXT: vpaddq %xmm0, %xmm2, %xmm0
	; AVX1-FALLBACK-NEXT: retq			; AVX1-FALLBACK-NEXT: retq
	;			;
	; AVX2-FALLBACK-LABEL: vec128_i64_unsigned_reg_reg:			; AVX2-FALLBACK-LABEL: vec128_i64_unsigned_reg_reg:
	; AVX2-FALLBACK: # %bb.0:			; AVX2-FALLBACK: # %bb.0:
	; AVX2-FALLBACK-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]			; AVX2-FALLBACK-NEXT: vpbroadcastq {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
	; AVX2-FALLBACK-NEXT: vpxor %xmm2, %xmm1, %xmm3			; AVX2-FALLBACK-NEXT: vpxor %xmm2, %xmm1, %xmm3
	; AVX2-FALLBACK-NEXT: vpxor %xmm2, %xmm0, %xmm2			; AVX2-FALLBACK-NEXT: vpxor %xmm2, %xmm0, %xmm2
	; AVX2-FALLBACK-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm4			; AVX2-FALLBACK-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm4
	; AVX2-FALLBACK-NEXT: vpor {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm4, %xmm5			; AVX2-FALLBACK-NEXT: vpbroadcastq {{.*#+}} xmm5 = [1,1]
				; AVX2-FALLBACK-NEXT: vpor %xmm5, %xmm4, %xmm5
	; AVX2-FALLBACK-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2			; AVX2-FALLBACK-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2
	; AVX2-FALLBACK-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm2			; AVX2-FALLBACK-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm2
	; AVX2-FALLBACK-NEXT: vblendvpd %xmm4, %xmm0, %xmm1, %xmm1			; AVX2-FALLBACK-NEXT: vblendvpd %xmm4, %xmm0, %xmm1, %xmm1
	; AVX2-FALLBACK-NEXT: vpsubq %xmm2, %xmm1, %xmm1			; AVX2-FALLBACK-NEXT: vpsubq %xmm2, %xmm1, %xmm1
	; AVX2-FALLBACK-NEXT: vpsrlq $1, %xmm1, %xmm2			; AVX2-FALLBACK-NEXT: vpsrlq $1, %xmm1, %xmm2
	; AVX2-FALLBACK-NEXT: vpsrlq $33, %xmm1, %xmm1			; AVX2-FALLBACK-NEXT: vpsrlq $33, %xmm1, %xmm1
	; AVX2-FALLBACK-NEXT: vpmuludq %xmm5, %xmm1, %xmm1			; AVX2-FALLBACK-NEXT: vpmuludq %xmm5, %xmm1, %xmm1
	; AVX2-FALLBACK-NEXT: vpsrlq $32, %xmm5, %xmm3			; AVX2-FALLBACK-NEXT: vpsrlq $32, %xmm5, %xmm3
	; AVX2-FALLBACK-NEXT: vpmuludq %xmm3, %xmm2, %xmm3			; AVX2-FALLBACK-NEXT: vpmuludq %xmm3, %xmm2, %xmm3
	; AVX2-FALLBACK-NEXT: vpaddq %xmm1, %xmm3, %xmm1			; AVX2-FALLBACK-NEXT: vpaddq %xmm1, %xmm3, %xmm1
	; AVX2-FALLBACK-NEXT: vpsllq $32, %xmm1, %xmm1			; AVX2-FALLBACK-NEXT: vpsllq $32, %xmm1, %xmm1
	; AVX2-FALLBACK-NEXT: vpmuludq %xmm5, %xmm2, %xmm2			; AVX2-FALLBACK-NEXT: vpmuludq %xmm5, %xmm2, %xmm2
	; AVX2-FALLBACK-NEXT: vpaddq %xmm0, %xmm1, %xmm0			; AVX2-FALLBACK-NEXT: vpaddq %xmm0, %xmm1, %xmm0
	; AVX2-FALLBACK-NEXT: vpaddq %xmm0, %xmm2, %xmm0			; AVX2-FALLBACK-NEXT: vpaddq %xmm0, %xmm2, %xmm0
	; AVX2-FALLBACK-NEXT: retq			; AVX2-FALLBACK-NEXT: retq
	;			;
	; XOP-LABEL: vec128_i64_unsigned_reg_reg:			; XOP-FALLBACK-LABEL: vec128_i64_unsigned_reg_reg:
	; XOP: # %bb.0:			; XOP-FALLBACK: # %bb.0:
	; XOP-NEXT: vpcomgtuq %xmm1, %xmm0, %xmm2			; XOP-FALLBACK-NEXT: vpcomgtuq %xmm1, %xmm0, %xmm2
	; XOP-NEXT: vpor {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2, %xmm3			; XOP-FALLBACK-NEXT: vpor {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2, %xmm3
	; XOP-NEXT: vpcomltuq %xmm1, %xmm0, %xmm4			; XOP-FALLBACK-NEXT: vpcomltuq %xmm1, %xmm0, %xmm4
	; XOP-NEXT: vblendvpd %xmm4, %xmm0, %xmm1, %xmm4			; XOP-FALLBACK-NEXT: vblendvpd %xmm4, %xmm0, %xmm1, %xmm4
	; XOP-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm1			; XOP-FALLBACK-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm1
	; XOP-NEXT: vpsubq %xmm4, %xmm1, %xmm1			; XOP-FALLBACK-NEXT: vpsubq %xmm4, %xmm1, %xmm1
	; XOP-NEXT: vpsrlq $1, %xmm1, %xmm2			; XOP-FALLBACK-NEXT: vpsrlq $1, %xmm1, %xmm2
	; XOP-NEXT: vpsrlq $33, %xmm1, %xmm1			; XOP-FALLBACK-NEXT: vpsrlq $33, %xmm1, %xmm1
	; XOP-NEXT: vpmuludq %xmm3, %xmm1, %xmm1			; XOP-FALLBACK-NEXT: vpmuludq %xmm3, %xmm1, %xmm1
	; XOP-NEXT: vpsrlq $32, %xmm3, %xmm4			; XOP-FALLBACK-NEXT: vpsrlq $32, %xmm3, %xmm4
	; XOP-NEXT: vpmuludq %xmm4, %xmm2, %xmm4			; XOP-FALLBACK-NEXT: vpmuludq %xmm4, %xmm2, %xmm4
	; XOP-NEXT: vpaddq %xmm1, %xmm4, %xmm1			; XOP-FALLBACK-NEXT: vpaddq %xmm1, %xmm4, %xmm1
	; XOP-NEXT: vpsllq $32, %xmm1, %xmm1			; XOP-FALLBACK-NEXT: vpsllq $32, %xmm1, %xmm1
	; XOP-NEXT: vpmuludq %xmm3, %xmm2, %xmm2			; XOP-FALLBACK-NEXT: vpmuludq %xmm3, %xmm2, %xmm2
	; XOP-NEXT: vpaddq %xmm0, %xmm1, %xmm0			; XOP-FALLBACK-NEXT: vpaddq %xmm0, %xmm1, %xmm0
	; XOP-NEXT: vpaddq %xmm0, %xmm2, %xmm0			; XOP-FALLBACK-NEXT: vpaddq %xmm0, %xmm2, %xmm0
	; XOP-NEXT: retq			; XOP-FALLBACK-NEXT: retq
				;
				; XOPAVX1-LABEL: vec128_i64_unsigned_reg_reg:
				; XOPAVX1: # %bb.0:
				; XOPAVX1-NEXT: vpcomgtuq %xmm1, %xmm0, %xmm2
				; XOPAVX1-NEXT: vpor {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2, %xmm3
				; XOPAVX1-NEXT: vpcomltuq %xmm1, %xmm0, %xmm4
				; XOPAVX1-NEXT: vblendvpd %xmm4, %xmm0, %xmm1, %xmm4
				; XOPAVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm1
				; XOPAVX1-NEXT: vpsubq %xmm4, %xmm1, %xmm1
				; XOPAVX1-NEXT: vpsrlq $1, %xmm1, %xmm2
				; XOPAVX1-NEXT: vpsrlq $33, %xmm1, %xmm1
				; XOPAVX1-NEXT: vpmuludq %xmm3, %xmm1, %xmm1
				; XOPAVX1-NEXT: vpsrlq $32, %xmm3, %xmm4
				; XOPAVX1-NEXT: vpmuludq %xmm4, %xmm2, %xmm4
				; XOPAVX1-NEXT: vpaddq %xmm1, %xmm4, %xmm1
				; XOPAVX1-NEXT: vpsllq $32, %xmm1, %xmm1
				; XOPAVX1-NEXT: vpmuludq %xmm3, %xmm2, %xmm2
				; XOPAVX1-NEXT: vpaddq %xmm0, %xmm1, %xmm0
				; XOPAVX1-NEXT: vpaddq %xmm0, %xmm2, %xmm0
				; XOPAVX1-NEXT: retq
				;
				; XOPAVX2-LABEL: vec128_i64_unsigned_reg_reg:
				; XOPAVX2: # %bb.0:
				; XOPAVX2-NEXT: vpcomgtuq %xmm1, %xmm0, %xmm2
				; XOPAVX2-NEXT: vpbroadcastq {{.*#+}} xmm3 = [1,1]
				; XOPAVX2-NEXT: vpor %xmm3, %xmm2, %xmm3
				; XOPAVX2-NEXT: vpcomltuq %xmm1, %xmm0, %xmm4
				; XOPAVX2-NEXT: vblendvpd %xmm4, %xmm0, %xmm1, %xmm4
				; XOPAVX2-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm1
				; XOPAVX2-NEXT: vpsubq %xmm4, %xmm1, %xmm1
				; XOPAVX2-NEXT: vpsrlq $1, %xmm1, %xmm2
				; XOPAVX2-NEXT: vpsrlq $33, %xmm1, %xmm1
				; XOPAVX2-NEXT: vpmuludq %xmm3, %xmm1, %xmm1
				; XOPAVX2-NEXT: vpsrlq $32, %xmm3, %xmm4
				; XOPAVX2-NEXT: vpmuludq %xmm4, %xmm2, %xmm4
				; XOPAVX2-NEXT: vpaddq %xmm1, %xmm4, %xmm1
				; XOPAVX2-NEXT: vpsllq $32, %xmm1, %xmm1
				; XOPAVX2-NEXT: vpmuludq %xmm3, %xmm2, %xmm2
				; XOPAVX2-NEXT: vpaddq %xmm0, %xmm1, %xmm0
				; XOPAVX2-NEXT: vpaddq %xmm0, %xmm2, %xmm0
				; XOPAVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: vec128_i64_unsigned_reg_reg:			; AVX512F-LABEL: vec128_i64_unsigned_reg_reg:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	; AVX512F-NEXT: # kill: def $xmm1 killed $xmm1 def $zmm1			; AVX512F-NEXT: # kill: def $xmm1 killed $xmm1 def $zmm1
	; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512F-NEXT: vpcmpnleuq %zmm1, %zmm0, %k1			; AVX512F-NEXT: vpcmpnleuq %zmm1, %zmm0, %k1
	; AVX512F-NEXT: vpcmpeqd %xmm2, %xmm2, %xmm2			; AVX512F-NEXT: vpcmpeqd %xmm2, %xmm2, %xmm2
	; AVX512F-NEXT: vmovdqa {{.*#+}} xmm3 = [1,1]			; AVX512F-NEXT: vmovdqa {{.*#+}} xmm3 = [1,1]
	▲ Show 20 Lines • Show All 171 Lines • ▼ Show 20 Lines
	; AVX1-FALLBACK-NEXT: vpaddq %xmm1, %xmm0, %xmm0			; AVX1-FALLBACK-NEXT: vpaddq %xmm1, %xmm0, %xmm0
	; AVX1-FALLBACK-NEXT: vpaddq %xmm0, %xmm2, %xmm0			; AVX1-FALLBACK-NEXT: vpaddq %xmm0, %xmm2, %xmm0
	; AVX1-FALLBACK-NEXT: retq			; AVX1-FALLBACK-NEXT: retq
	;			;
	; AVX2-FALLBACK-LABEL: vec128_i64_signed_mem_reg:			; AVX2-FALLBACK-LABEL: vec128_i64_signed_mem_reg:
	; AVX2-FALLBACK: # %bb.0:			; AVX2-FALLBACK: # %bb.0:
	; AVX2-FALLBACK-NEXT: vmovdqa (%rdi), %xmm1			; AVX2-FALLBACK-NEXT: vmovdqa (%rdi), %xmm1
	; AVX2-FALLBACK-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2			; AVX2-FALLBACK-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2
	; AVX2-FALLBACK-NEXT: vpor {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2, %xmm3			; AVX2-FALLBACK-NEXT: vpbroadcastq {{.*#+}} xmm3 = [1,1]
				; AVX2-FALLBACK-NEXT: vpor %xmm3, %xmm2, %xmm3
	; AVX2-FALLBACK-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm4			; AVX2-FALLBACK-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm4
	; AVX2-FALLBACK-NEXT: vblendvpd %xmm4, %xmm1, %xmm0, %xmm4			; AVX2-FALLBACK-NEXT: vblendvpd %xmm4, %xmm1, %xmm0, %xmm4
	; AVX2-FALLBACK-NEXT: vblendvpd %xmm2, %xmm1, %xmm0, %xmm0			; AVX2-FALLBACK-NEXT: vblendvpd %xmm2, %xmm1, %xmm0, %xmm0
	; AVX2-FALLBACK-NEXT: vpsubq %xmm4, %xmm0, %xmm0			; AVX2-FALLBACK-NEXT: vpsubq %xmm4, %xmm0, %xmm0
	; AVX2-FALLBACK-NEXT: vpsrlq $1, %xmm0, %xmm2			; AVX2-FALLBACK-NEXT: vpsrlq $1, %xmm0, %xmm2
	; AVX2-FALLBACK-NEXT: vpsrlq $33, %xmm0, %xmm0			; AVX2-FALLBACK-NEXT: vpsrlq $33, %xmm0, %xmm0
	; AVX2-FALLBACK-NEXT: vpmuludq %xmm3, %xmm0, %xmm0			; AVX2-FALLBACK-NEXT: vpmuludq %xmm3, %xmm0, %xmm0
	; AVX2-FALLBACK-NEXT: vpsrlq $32, %xmm3, %xmm4			; AVX2-FALLBACK-NEXT: vpsrlq $32, %xmm3, %xmm4
	; AVX2-FALLBACK-NEXT: vpmuludq %xmm4, %xmm2, %xmm4			; AVX2-FALLBACK-NEXT: vpmuludq %xmm4, %xmm2, %xmm4
	; AVX2-FALLBACK-NEXT: vpaddq %xmm0, %xmm4, %xmm0			; AVX2-FALLBACK-NEXT: vpaddq %xmm0, %xmm4, %xmm0
	; AVX2-FALLBACK-NEXT: vpsllq $32, %xmm0, %xmm0			; AVX2-FALLBACK-NEXT: vpsllq $32, %xmm0, %xmm0
	; AVX2-FALLBACK-NEXT: vpmuludq %xmm3, %xmm2, %xmm2			; AVX2-FALLBACK-NEXT: vpmuludq %xmm3, %xmm2, %xmm2
	; AVX2-FALLBACK-NEXT: vpaddq %xmm1, %xmm0, %xmm0			; AVX2-FALLBACK-NEXT: vpaddq %xmm1, %xmm0, %xmm0
	; AVX2-FALLBACK-NEXT: vpaddq %xmm0, %xmm2, %xmm0			; AVX2-FALLBACK-NEXT: vpaddq %xmm0, %xmm2, %xmm0
	; AVX2-FALLBACK-NEXT: retq			; AVX2-FALLBACK-NEXT: retq
	;			;
	; XOP-LABEL: vec128_i64_signed_mem_reg:			; XOP-FALLBACK-LABEL: vec128_i64_signed_mem_reg:
	; XOP: # %bb.0:			; XOP-FALLBACK: # %bb.0:
	; XOP-NEXT: vmovdqa (%rdi), %xmm1			; XOP-FALLBACK-NEXT: vmovdqa (%rdi), %xmm1
	; XOP-NEXT: vpcomgtq %xmm0, %xmm1, %xmm2			; XOP-FALLBACK-NEXT: vpcomgtq %xmm0, %xmm1, %xmm2
	; XOP-NEXT: vpor {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2, %xmm3			; XOP-FALLBACK-NEXT: vpor {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2, %xmm3
	; XOP-NEXT: vpcomltq %xmm0, %xmm1, %xmm4			; XOP-FALLBACK-NEXT: vpcomltq %xmm0, %xmm1, %xmm4
	; XOP-NEXT: vblendvpd %xmm4, %xmm1, %xmm0, %xmm4			; XOP-FALLBACK-NEXT: vblendvpd %xmm4, %xmm1, %xmm0, %xmm4
	; XOP-NEXT: vblendvpd %xmm2, %xmm1, %xmm0, %xmm0			; XOP-FALLBACK-NEXT: vblendvpd %xmm2, %xmm1, %xmm0, %xmm0
	; XOP-NEXT: vpsubq %xmm4, %xmm0, %xmm0			; XOP-FALLBACK-NEXT: vpsubq %xmm4, %xmm0, %xmm0
	; XOP-NEXT: vpsrlq $1, %xmm0, %xmm2			; XOP-FALLBACK-NEXT: vpsrlq $1, %xmm0, %xmm2
	; XOP-NEXT: vpsrlq $33, %xmm0, %xmm0			; XOP-FALLBACK-NEXT: vpsrlq $33, %xmm0, %xmm0
	; XOP-NEXT: vpmuludq %xmm3, %xmm0, %xmm0			; XOP-FALLBACK-NEXT: vpmuludq %xmm3, %xmm0, %xmm0
	; XOP-NEXT: vpsrlq $32, %xmm3, %xmm4			; XOP-FALLBACK-NEXT: vpsrlq $32, %xmm3, %xmm4
	; XOP-NEXT: vpmuludq %xmm4, %xmm2, %xmm4			; XOP-FALLBACK-NEXT: vpmuludq %xmm4, %xmm2, %xmm4
	; XOP-NEXT: vpaddq %xmm0, %xmm4, %xmm0			; XOP-FALLBACK-NEXT: vpaddq %xmm0, %xmm4, %xmm0
	; XOP-NEXT: vpsllq $32, %xmm0, %xmm0			; XOP-FALLBACK-NEXT: vpsllq $32, %xmm0, %xmm0
	; XOP-NEXT: vpmuludq %xmm3, %xmm2, %xmm2			; XOP-FALLBACK-NEXT: vpmuludq %xmm3, %xmm2, %xmm2
	; XOP-NEXT: vpaddq %xmm1, %xmm0, %xmm0			; XOP-FALLBACK-NEXT: vpaddq %xmm1, %xmm0, %xmm0
	; XOP-NEXT: vpaddq %xmm0, %xmm2, %xmm0			; XOP-FALLBACK-NEXT: vpaddq %xmm0, %xmm2, %xmm0
	; XOP-NEXT: retq			; XOP-FALLBACK-NEXT: retq
				;
				; XOPAVX1-LABEL: vec128_i64_signed_mem_reg:
				; XOPAVX1: # %bb.0:
				; XOPAVX1-NEXT: vmovdqa (%rdi), %xmm1
				; XOPAVX1-NEXT: vpcomgtq %xmm0, %xmm1, %xmm2
				; XOPAVX1-NEXT: vpor {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2, %xmm3
				; XOPAVX1-NEXT: vpcomltq %xmm0, %xmm1, %xmm4
				; XOPAVX1-NEXT: vblendvpd %xmm4, %xmm1, %xmm0, %xmm4
				; XOPAVX1-NEXT: vblendvpd %xmm2, %xmm1, %xmm0, %xmm0
				; XOPAVX1-NEXT: vpsubq %xmm4, %xmm0, %xmm0
				; XOPAVX1-NEXT: vpsrlq $1, %xmm0, %xmm2
				; XOPAVX1-NEXT: vpsrlq $33, %xmm0, %xmm0
				; XOPAVX1-NEXT: vpmuludq %xmm3, %xmm0, %xmm0
				; XOPAVX1-NEXT: vpsrlq $32, %xmm3, %xmm4
				; XOPAVX1-NEXT: vpmuludq %xmm4, %xmm2, %xmm4
				; XOPAVX1-NEXT: vpaddq %xmm0, %xmm4, %xmm0
				; XOPAVX1-NEXT: vpsllq $32, %xmm0, %xmm0
				; XOPAVX1-NEXT: vpmuludq %xmm3, %xmm2, %xmm2
				; XOPAVX1-NEXT: vpaddq %xmm1, %xmm0, %xmm0
				; XOPAVX1-NEXT: vpaddq %xmm0, %xmm2, %xmm0
				; XOPAVX1-NEXT: retq
				;
				; XOPAVX2-LABEL: vec128_i64_signed_mem_reg:
				; XOPAVX2: # %bb.0:
				; XOPAVX2-NEXT: vmovdqa (%rdi), %xmm1
				; XOPAVX2-NEXT: vpcomgtq %xmm0, %xmm1, %xmm2
				; XOPAVX2-NEXT: vpbroadcastq {{.*#+}} xmm3 = [1,1]
				; XOPAVX2-NEXT: vpor %xmm3, %xmm2, %xmm3
				; XOPAVX2-NEXT: vpcomltq %xmm0, %xmm1, %xmm4
				; XOPAVX2-NEXT: vblendvpd %xmm4, %xmm1, %xmm0, %xmm4
				; XOPAVX2-NEXT: vblendvpd %xmm2, %xmm1, %xmm0, %xmm0
				; XOPAVX2-NEXT: vpsubq %xmm4, %xmm0, %xmm0
				; XOPAVX2-NEXT: vpsrlq $1, %xmm0, %xmm2
				; XOPAVX2-NEXT: vpsrlq $33, %xmm0, %xmm0
				; XOPAVX2-NEXT: vpmuludq %xmm3, %xmm0, %xmm0
				; XOPAVX2-NEXT: vpsrlq $32, %xmm3, %xmm4
				; XOPAVX2-NEXT: vpmuludq %xmm4, %xmm2, %xmm4
				; XOPAVX2-NEXT: vpaddq %xmm0, %xmm4, %xmm0
				; XOPAVX2-NEXT: vpsllq $32, %xmm0, %xmm0
				; XOPAVX2-NEXT: vpmuludq %xmm3, %xmm2, %xmm2
				; XOPAVX2-NEXT: vpaddq %xmm1, %xmm0, %xmm0
				; XOPAVX2-NEXT: vpaddq %xmm0, %xmm2, %xmm0
				; XOPAVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: vec128_i64_signed_mem_reg:			; AVX512F-LABEL: vec128_i64_signed_mem_reg:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512F-NEXT: vmovdqa (%rdi), %xmm1			; AVX512F-NEXT: vmovdqa (%rdi), %xmm1
	; AVX512F-NEXT: vpcmpgtq %zmm0, %zmm1, %k1			; AVX512F-NEXT: vpcmpgtq %zmm0, %zmm1, %k1
	; AVX512F-NEXT: vpcmpeqd %xmm2, %xmm2, %xmm2			; AVX512F-NEXT: vpcmpeqd %xmm2, %xmm2, %xmm2
	; AVX512F-NEXT: vmovdqa {{.*#+}} xmm3 = [1,1]			; AVX512F-NEXT: vmovdqa {{.*#+}} xmm3 = [1,1]
	▲ Show 20 Lines • Show All 170 Lines • ▼ Show 20 Lines
	; AVX1-FALLBACK-NEXT: vpaddq %xmm0, %xmm1, %xmm0			; AVX1-FALLBACK-NEXT: vpaddq %xmm0, %xmm1, %xmm0
	; AVX1-FALLBACK-NEXT: vpaddq %xmm0, %xmm2, %xmm0			; AVX1-FALLBACK-NEXT: vpaddq %xmm0, %xmm2, %xmm0
	; AVX1-FALLBACK-NEXT: retq			; AVX1-FALLBACK-NEXT: retq
	;			;
	; AVX2-FALLBACK-LABEL: vec128_i64_signed_reg_mem:			; AVX2-FALLBACK-LABEL: vec128_i64_signed_reg_mem:
	; AVX2-FALLBACK: # %bb.0:			; AVX2-FALLBACK: # %bb.0:
	; AVX2-FALLBACK-NEXT: vmovdqa (%rdi), %xmm1			; AVX2-FALLBACK-NEXT: vmovdqa (%rdi), %xmm1
	; AVX2-FALLBACK-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm2			; AVX2-FALLBACK-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm2
	; AVX2-FALLBACK-NEXT: vpor {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2, %xmm3			; AVX2-FALLBACK-NEXT: vpbroadcastq {{.*#+}} xmm3 = [1,1]
				; AVX2-FALLBACK-NEXT: vpor %xmm3, %xmm2, %xmm3
	; AVX2-FALLBACK-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm4			; AVX2-FALLBACK-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm4
	; AVX2-FALLBACK-NEXT: vblendvpd %xmm4, %xmm0, %xmm1, %xmm4			; AVX2-FALLBACK-NEXT: vblendvpd %xmm4, %xmm0, %xmm1, %xmm4
	; AVX2-FALLBACK-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm1			; AVX2-FALLBACK-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm1
	; AVX2-FALLBACK-NEXT: vpsubq %xmm4, %xmm1, %xmm1			; AVX2-FALLBACK-NEXT: vpsubq %xmm4, %xmm1, %xmm1
	; AVX2-FALLBACK-NEXT: vpsrlq $1, %xmm1, %xmm2			; AVX2-FALLBACK-NEXT: vpsrlq $1, %xmm1, %xmm2
	; AVX2-FALLBACK-NEXT: vpsrlq $33, %xmm1, %xmm1			; AVX2-FALLBACK-NEXT: vpsrlq $33, %xmm1, %xmm1
	; AVX2-FALLBACK-NEXT: vpmuludq %xmm3, %xmm1, %xmm1			; AVX2-FALLBACK-NEXT: vpmuludq %xmm3, %xmm1, %xmm1
	; AVX2-FALLBACK-NEXT: vpsrlq $32, %xmm3, %xmm4			; AVX2-FALLBACK-NEXT: vpsrlq $32, %xmm3, %xmm4
	; AVX2-FALLBACK-NEXT: vpmuludq %xmm4, %xmm2, %xmm4			; AVX2-FALLBACK-NEXT: vpmuludq %xmm4, %xmm2, %xmm4
	; AVX2-FALLBACK-NEXT: vpaddq %xmm1, %xmm4, %xmm1			; AVX2-FALLBACK-NEXT: vpaddq %xmm1, %xmm4, %xmm1
	; AVX2-FALLBACK-NEXT: vpsllq $32, %xmm1, %xmm1			; AVX2-FALLBACK-NEXT: vpsllq $32, %xmm1, %xmm1
	; AVX2-FALLBACK-NEXT: vpmuludq %xmm3, %xmm2, %xmm2			; AVX2-FALLBACK-NEXT: vpmuludq %xmm3, %xmm2, %xmm2
	; AVX2-FALLBACK-NEXT: vpaddq %xmm0, %xmm1, %xmm0			; AVX2-FALLBACK-NEXT: vpaddq %xmm0, %xmm1, %xmm0
	; AVX2-FALLBACK-NEXT: vpaddq %xmm0, %xmm2, %xmm0			; AVX2-FALLBACK-NEXT: vpaddq %xmm0, %xmm2, %xmm0
	; AVX2-FALLBACK-NEXT: retq			; AVX2-FALLBACK-NEXT: retq
	;			;
	; XOP-LABEL: vec128_i64_signed_reg_mem:			; XOP-FALLBACK-LABEL: vec128_i64_signed_reg_mem:
	; XOP: # %bb.0:			; XOP-FALLBACK: # %bb.0:
	; XOP-NEXT: vmovdqa (%rdi), %xmm1			; XOP-FALLBACK-NEXT: vmovdqa (%rdi), %xmm1
	; XOP-NEXT: vpcomgtq %xmm1, %xmm0, %xmm2			; XOP-FALLBACK-NEXT: vpcomgtq %xmm1, %xmm0, %xmm2
	; XOP-NEXT: vpor {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2, %xmm3			; XOP-FALLBACK-NEXT: vpor {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2, %xmm3
	; XOP-NEXT: vpcomltq %xmm1, %xmm0, %xmm4			; XOP-FALLBACK-NEXT: vpcomltq %xmm1, %xmm0, %xmm4
	; XOP-NEXT: vblendvpd %xmm4, %xmm0, %xmm1, %xmm4			; XOP-FALLBACK-NEXT: vblendvpd %xmm4, %xmm0, %xmm1, %xmm4
	; XOP-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm1			; XOP-FALLBACK-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm1
	; XOP-NEXT: vpsubq %xmm4, %xmm1, %xmm1			; XOP-FALLBACK-NEXT: vpsubq %xmm4, %xmm1, %xmm1
	; XOP-NEXT: vpsrlq $1, %xmm1, %xmm2			; XOP-FALLBACK-NEXT: vpsrlq $1, %xmm1, %xmm2
	; XOP-NEXT: vpsrlq $33, %xmm1, %xmm1			; XOP-FALLBACK-NEXT: vpsrlq $33, %xmm1, %xmm1
	; XOP-NEXT: vpmuludq %xmm3, %xmm1, %xmm1			; XOP-FALLBACK-NEXT: vpmuludq %xmm3, %xmm1, %xmm1
	; XOP-NEXT: vpsrlq $32, %xmm3, %xmm4			; XOP-FALLBACK-NEXT: vpsrlq $32, %xmm3, %xmm4
	; XOP-NEXT: vpmuludq %xmm4, %xmm2, %xmm4			; XOP-FALLBACK-NEXT: vpmuludq %xmm4, %xmm2, %xmm4
	; XOP-NEXT: vpaddq %xmm1, %xmm4, %xmm1			; XOP-FALLBACK-NEXT: vpaddq %xmm1, %xmm4, %xmm1
	; XOP-NEXT: vpsllq $32, %xmm1, %xmm1			; XOP-FALLBACK-NEXT: vpsllq $32, %xmm1, %xmm1
	; XOP-NEXT: vpmuludq %xmm3, %xmm2, %xmm2			; XOP-FALLBACK-NEXT: vpmuludq %xmm3, %xmm2, %xmm2
	; XOP-NEXT: vpaddq %xmm0, %xmm1, %xmm0			; XOP-FALLBACK-NEXT: vpaddq %xmm0, %xmm1, %xmm0
	; XOP-NEXT: vpaddq %xmm0, %xmm2, %xmm0			; XOP-FALLBACK-NEXT: vpaddq %xmm0, %xmm2, %xmm0
	; XOP-NEXT: retq			; XOP-FALLBACK-NEXT: retq
				;
				; XOPAVX1-LABEL: vec128_i64_signed_reg_mem:
				; XOPAVX1: # %bb.0:
				; XOPAVX1-NEXT: vmovdqa (%rdi), %xmm1
				; XOPAVX1-NEXT: vpcomgtq %xmm1, %xmm0, %xmm2
				; XOPAVX1-NEXT: vpor {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2, %xmm3
				; XOPAVX1-NEXT: vpcomltq %xmm1, %xmm0, %xmm4
				; XOPAVX1-NEXT: vblendvpd %xmm4, %xmm0, %xmm1, %xmm4
				; XOPAVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm1
				; XOPAVX1-NEXT: vpsubq %xmm4, %xmm1, %xmm1
				; XOPAVX1-NEXT: vpsrlq $1, %xmm1, %xmm2
				; XOPAVX1-NEXT: vpsrlq $33, %xmm1, %xmm1
				; XOPAVX1-NEXT: vpmuludq %xmm3, %xmm1, %xmm1
				; XOPAVX1-NEXT: vpsrlq $32, %xmm3, %xmm4
				; XOPAVX1-NEXT: vpmuludq %xmm4, %xmm2, %xmm4
				; XOPAVX1-NEXT: vpaddq %xmm1, %xmm4, %xmm1
				; XOPAVX1-NEXT: vpsllq $32, %xmm1, %xmm1
				; XOPAVX1-NEXT: vpmuludq %xmm3, %xmm2, %xmm2
				; XOPAVX1-NEXT: vpaddq %xmm0, %xmm1, %xmm0
				; XOPAVX1-NEXT: vpaddq %xmm0, %xmm2, %xmm0
				; XOPAVX1-NEXT: retq
				;
				; XOPAVX2-LABEL: vec128_i64_signed_reg_mem:
				; XOPAVX2: # %bb.0:
				; XOPAVX2-NEXT: vmovdqa (%rdi), %xmm1
				; XOPAVX2-NEXT: vpcomgtq %xmm1, %xmm0, %xmm2
				; XOPAVX2-NEXT: vpbroadcastq {{.*#+}} xmm3 = [1,1]
				; XOPAVX2-NEXT: vpor %xmm3, %xmm2, %xmm3
				; XOPAVX2-NEXT: vpcomltq %xmm1, %xmm0, %xmm4
				; XOPAVX2-NEXT: vblendvpd %xmm4, %xmm0, %xmm1, %xmm4
				; XOPAVX2-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm1
				; XOPAVX2-NEXT: vpsubq %xmm4, %xmm1, %xmm1
				; XOPAVX2-NEXT: vpsrlq $1, %xmm1, %xmm2
				; XOPAVX2-NEXT: vpsrlq $33, %xmm1, %xmm1
				; XOPAVX2-NEXT: vpmuludq %xmm3, %xmm1, %xmm1
				; XOPAVX2-NEXT: vpsrlq $32, %xmm3, %xmm4
				; XOPAVX2-NEXT: vpmuludq %xmm4, %xmm2, %xmm4
				; XOPAVX2-NEXT: vpaddq %xmm1, %xmm4, %xmm1
				; XOPAVX2-NEXT: vpsllq $32, %xmm1, %xmm1
				; XOPAVX2-NEXT: vpmuludq %xmm3, %xmm2, %xmm2
				; XOPAVX2-NEXT: vpaddq %xmm0, %xmm1, %xmm0
				; XOPAVX2-NEXT: vpaddq %xmm0, %xmm2, %xmm0
				; XOPAVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: vec128_i64_signed_reg_mem:			; AVX512F-LABEL: vec128_i64_signed_reg_mem:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512F-NEXT: vmovdqa (%rdi), %xmm1			; AVX512F-NEXT: vmovdqa (%rdi), %xmm1
	; AVX512F-NEXT: vpcmpgtq %zmm1, %zmm0, %k1			; AVX512F-NEXT: vpcmpgtq %zmm1, %zmm0, %k1
	; AVX512F-NEXT: vpcmpeqd %xmm2, %xmm2, %xmm2			; AVX512F-NEXT: vpcmpeqd %xmm2, %xmm2, %xmm2
	; AVX512F-NEXT: vmovdqa {{.*#+}} xmm3 = [1,1]			; AVX512F-NEXT: vmovdqa {{.*#+}} xmm3 = [1,1]
	▲ Show 20 Lines • Show All 174 Lines • ▼ Show 20 Lines
	; AVX1-FALLBACK-NEXT: vpaddq %xmm0, %xmm2, %xmm0			; AVX1-FALLBACK-NEXT: vpaddq %xmm0, %xmm2, %xmm0
	; AVX1-FALLBACK-NEXT: retq			; AVX1-FALLBACK-NEXT: retq
	;			;
	; AVX2-FALLBACK-LABEL: vec128_i64_signed_mem_mem:			; AVX2-FALLBACK-LABEL: vec128_i64_signed_mem_mem:
	; AVX2-FALLBACK: # %bb.0:			; AVX2-FALLBACK: # %bb.0:
	; AVX2-FALLBACK-NEXT: vmovdqa (%rdi), %xmm0			; AVX2-FALLBACK-NEXT: vmovdqa (%rdi), %xmm0
	; AVX2-FALLBACK-NEXT: vmovdqa (%rsi), %xmm1			; AVX2-FALLBACK-NEXT: vmovdqa (%rsi), %xmm1
	; AVX2-FALLBACK-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm2			; AVX2-FALLBACK-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm2
	; AVX2-FALLBACK-NEXT: vpor {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2, %xmm3			; AVX2-FALLBACK-NEXT: vpbroadcastq {{.*#+}} xmm3 = [1,1]
				; AVX2-FALLBACK-NEXT: vpor %xmm3, %xmm2, %xmm3
	; AVX2-FALLBACK-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm4			; AVX2-FALLBACK-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm4
	; AVX2-FALLBACK-NEXT: vblendvpd %xmm4, %xmm0, %xmm1, %xmm4			; AVX2-FALLBACK-NEXT: vblendvpd %xmm4, %xmm0, %xmm1, %xmm4
	; AVX2-FALLBACK-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm1			; AVX2-FALLBACK-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm1
	; AVX2-FALLBACK-NEXT: vpsubq %xmm4, %xmm1, %xmm1			; AVX2-FALLBACK-NEXT: vpsubq %xmm4, %xmm1, %xmm1
	; AVX2-FALLBACK-NEXT: vpsrlq $1, %xmm1, %xmm2			; AVX2-FALLBACK-NEXT: vpsrlq $1, %xmm1, %xmm2
	; AVX2-FALLBACK-NEXT: vpsrlq $33, %xmm1, %xmm1			; AVX2-FALLBACK-NEXT: vpsrlq $33, %xmm1, %xmm1
	; AVX2-FALLBACK-NEXT: vpmuludq %xmm3, %xmm1, %xmm1			; AVX2-FALLBACK-NEXT: vpmuludq %xmm3, %xmm1, %xmm1
	; AVX2-FALLBACK-NEXT: vpsrlq $32, %xmm3, %xmm4			; AVX2-FALLBACK-NEXT: vpsrlq $32, %xmm3, %xmm4
	; AVX2-FALLBACK-NEXT: vpmuludq %xmm4, %xmm2, %xmm4			; AVX2-FALLBACK-NEXT: vpmuludq %xmm4, %xmm2, %xmm4
	; AVX2-FALLBACK-NEXT: vpaddq %xmm1, %xmm4, %xmm1			; AVX2-FALLBACK-NEXT: vpaddq %xmm1, %xmm4, %xmm1
	; AVX2-FALLBACK-NEXT: vpsllq $32, %xmm1, %xmm1			; AVX2-FALLBACK-NEXT: vpsllq $32, %xmm1, %xmm1
	; AVX2-FALLBACK-NEXT: vpmuludq %xmm3, %xmm2, %xmm2			; AVX2-FALLBACK-NEXT: vpmuludq %xmm3, %xmm2, %xmm2
	; AVX2-FALLBACK-NEXT: vpaddq %xmm0, %xmm1, %xmm0			; AVX2-FALLBACK-NEXT: vpaddq %xmm0, %xmm1, %xmm0
	; AVX2-FALLBACK-NEXT: vpaddq %xmm0, %xmm2, %xmm0			; AVX2-FALLBACK-NEXT: vpaddq %xmm0, %xmm2, %xmm0
	; AVX2-FALLBACK-NEXT: retq			; AVX2-FALLBACK-NEXT: retq
	;			;
	; XOP-LABEL: vec128_i64_signed_mem_mem:			; XOP-FALLBACK-LABEL: vec128_i64_signed_mem_mem:
	; XOP: # %bb.0:			; XOP-FALLBACK: # %bb.0:
	; XOP-NEXT: vmovdqa (%rdi), %xmm0			; XOP-FALLBACK-NEXT: vmovdqa (%rdi), %xmm0
	; XOP-NEXT: vmovdqa (%rsi), %xmm1			; XOP-FALLBACK-NEXT: vmovdqa (%rsi), %xmm1
	; XOP-NEXT: vpcomgtq %xmm1, %xmm0, %xmm2			; XOP-FALLBACK-NEXT: vpcomgtq %xmm1, %xmm0, %xmm2
	; XOP-NEXT: vpor {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2, %xmm3			; XOP-FALLBACK-NEXT: vpor {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2, %xmm3
	; XOP-NEXT: vpcomltq %xmm1, %xmm0, %xmm4			; XOP-FALLBACK-NEXT: vpcomltq %xmm1, %xmm0, %xmm4
	; XOP-NEXT: vblendvpd %xmm4, %xmm0, %xmm1, %xmm4			; XOP-FALLBACK-NEXT: vblendvpd %xmm4, %xmm0, %xmm1, %xmm4
	; XOP-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm1			; XOP-FALLBACK-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm1
	; XOP-NEXT: vpsubq %xmm4, %xmm1, %xmm1			; XOP-FALLBACK-NEXT: vpsubq %xmm4, %xmm1, %xmm1
	; XOP-NEXT: vpsrlq $1, %xmm1, %xmm2			; XOP-FALLBACK-NEXT: vpsrlq $1, %xmm1, %xmm2
	; XOP-NEXT: vpsrlq $33, %xmm1, %xmm1			; XOP-FALLBACK-NEXT: vpsrlq $33, %xmm1, %xmm1
	; XOP-NEXT: vpmuludq %xmm3, %xmm1, %xmm1			; XOP-FALLBACK-NEXT: vpmuludq %xmm3, %xmm1, %xmm1
	; XOP-NEXT: vpsrlq $32, %xmm3, %xmm4			; XOP-FALLBACK-NEXT: vpsrlq $32, %xmm3, %xmm4
	; XOP-NEXT: vpmuludq %xmm4, %xmm2, %xmm4			; XOP-FALLBACK-NEXT: vpmuludq %xmm4, %xmm2, %xmm4
	; XOP-NEXT: vpaddq %xmm1, %xmm4, %xmm1			; XOP-FALLBACK-NEXT: vpaddq %xmm1, %xmm4, %xmm1
	; XOP-NEXT: vpsllq $32, %xmm1, %xmm1			; XOP-FALLBACK-NEXT: vpsllq $32, %xmm1, %xmm1
	; XOP-NEXT: vpmuludq %xmm3, %xmm2, %xmm2			; XOP-FALLBACK-NEXT: vpmuludq %xmm3, %xmm2, %xmm2
	; XOP-NEXT: vpaddq %xmm0, %xmm1, %xmm0			; XOP-FALLBACK-NEXT: vpaddq %xmm0, %xmm1, %xmm0
	; XOP-NEXT: vpaddq %xmm0, %xmm2, %xmm0			; XOP-FALLBACK-NEXT: vpaddq %xmm0, %xmm2, %xmm0
	; XOP-NEXT: retq			; XOP-FALLBACK-NEXT: retq
				;
				; XOPAVX1-LABEL: vec128_i64_signed_mem_mem:
				; XOPAVX1: # %bb.0:
				; XOPAVX1-NEXT: vmovdqa (%rdi), %xmm0
				; XOPAVX1-NEXT: vmovdqa (%rsi), %xmm1
				; XOPAVX1-NEXT: vpcomgtq %xmm1, %xmm0, %xmm2
				; XOPAVX1-NEXT: vpor {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2, %xmm3
				; XOPAVX1-NEXT: vpcomltq %xmm1, %xmm0, %xmm4
				; XOPAVX1-NEXT: vblendvpd %xmm4, %xmm0, %xmm1, %xmm4
				; XOPAVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm1
				; XOPAVX1-NEXT: vpsubq %xmm4, %xmm1, %xmm1
				; XOPAVX1-NEXT: vpsrlq $1, %xmm1, %xmm2
				; XOPAVX1-NEXT: vpsrlq $33, %xmm1, %xmm1
				; XOPAVX1-NEXT: vpmuludq %xmm3, %xmm1, %xmm1
				; XOPAVX1-NEXT: vpsrlq $32, %xmm3, %xmm4
				; XOPAVX1-NEXT: vpmuludq %xmm4, %xmm2, %xmm4
				; XOPAVX1-NEXT: vpaddq %xmm1, %xmm4, %xmm1
				; XOPAVX1-NEXT: vpsllq $32, %xmm1, %xmm1
				; XOPAVX1-NEXT: vpmuludq %xmm3, %xmm2, %xmm2
				; XOPAVX1-NEXT: vpaddq %xmm0, %xmm1, %xmm0
				; XOPAVX1-NEXT: vpaddq %xmm0, %xmm2, %xmm0
				; XOPAVX1-NEXT: retq
				;
				; XOPAVX2-LABEL: vec128_i64_signed_mem_mem:
				; XOPAVX2: # %bb.0:
				; XOPAVX2-NEXT: vmovdqa (%rdi), %xmm0
				; XOPAVX2-NEXT: vmovdqa (%rsi), %xmm1
				; XOPAVX2-NEXT: vpcomgtq %xmm1, %xmm0, %xmm2
				; XOPAVX2-NEXT: vpbroadcastq {{.*#+}} xmm3 = [1,1]
				; XOPAVX2-NEXT: vpor %xmm3, %xmm2, %xmm3
				; XOPAVX2-NEXT: vpcomltq %xmm1, %xmm0, %xmm4
				; XOPAVX2-NEXT: vblendvpd %xmm4, %xmm0, %xmm1, %xmm4
				; XOPAVX2-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm1
				; XOPAVX2-NEXT: vpsubq %xmm4, %xmm1, %xmm1
				; XOPAVX2-NEXT: vpsrlq $1, %xmm1, %xmm2
				; XOPAVX2-NEXT: vpsrlq $33, %xmm1, %xmm1
				; XOPAVX2-NEXT: vpmuludq %xmm3, %xmm1, %xmm1
				; XOPAVX2-NEXT: vpsrlq $32, %xmm3, %xmm4
				; XOPAVX2-NEXT: vpmuludq %xmm4, %xmm2, %xmm4
				; XOPAVX2-NEXT: vpaddq %xmm1, %xmm4, %xmm1
				; XOPAVX2-NEXT: vpsllq $32, %xmm1, %xmm1
				; XOPAVX2-NEXT: vpmuludq %xmm3, %xmm2, %xmm2
				; XOPAVX2-NEXT: vpaddq %xmm0, %xmm1, %xmm0
				; XOPAVX2-NEXT: vpaddq %xmm0, %xmm2, %xmm0
				; XOPAVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: vec128_i64_signed_mem_mem:			; AVX512F-LABEL: vec128_i64_signed_mem_mem:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	; AVX512F-NEXT: vmovdqa (%rdi), %xmm0			; AVX512F-NEXT: vmovdqa (%rdi), %xmm0
	; AVX512F-NEXT: vmovdqa (%rsi), %xmm1			; AVX512F-NEXT: vmovdqa (%rsi), %xmm1
	; AVX512F-NEXT: vpcmpgtq %zmm1, %zmm0, %k1			; AVX512F-NEXT: vpcmpgtq %zmm1, %zmm0, %k1
	; AVX512F-NEXT: vpcmpeqd %xmm2, %xmm2, %xmm2			; AVX512F-NEXT: vpcmpeqd %xmm2, %xmm2, %xmm2
	; AVX512F-NEXT: vmovdqa {{.*#+}} xmm3 = [1,1]			; AVX512F-NEXT: vmovdqa {{.*#+}} xmm3 = [1,1]
	▲ Show 20 Lines • Show All 1,915 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/pmul.ll

	Show First 20 Lines • Show All 114 Lines • ▼ Show 20 Lines
	; SSE-NEXT: movdqa %xmm0, %xmm2			; SSE-NEXT: movdqa %xmm0, %xmm2
	; SSE-NEXT: pmuludq %xmm1, %xmm2			; SSE-NEXT: pmuludq %xmm1, %xmm2
	; SSE-NEXT: psrlq $32, %xmm0			; SSE-NEXT: psrlq $32, %xmm0
	; SSE-NEXT: pmuludq %xmm1, %xmm0			; SSE-NEXT: pmuludq %xmm1, %xmm0
	; SSE-NEXT: psllq $32, %xmm0			; SSE-NEXT: psllq $32, %xmm0
	; SSE-NEXT: paddq %xmm2, %xmm0			; SSE-NEXT: paddq %xmm2, %xmm0
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX-LABEL: mul_v2i64c:			; AVX2-LABEL: mul_v2i64c:
	; AVX: # %bb.0: # %entry			; AVX2: # %bb.0: # %entry
	; AVX-NEXT: vmovdqa {{.*#+}} xmm1 = [117,117]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [117,117]
	; AVX-NEXT: vpmuludq %xmm1, %xmm0, %xmm2			; AVX2-NEXT: vpmuludq %xmm1, %xmm0, %xmm2
	; AVX-NEXT: vpsrlq $32, %xmm0, %xmm0			; AVX2-NEXT: vpsrlq $32, %xmm0, %xmm0
	; AVX-NEXT: vpmuludq %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpmuludq %xmm1, %xmm0, %xmm0
	; AVX-NEXT: vpsllq $32, %xmm0, %xmm0			; AVX2-NEXT: vpsllq $32, %xmm0, %xmm0
	; AVX-NEXT: vpaddq %xmm0, %xmm2, %xmm0			; AVX2-NEXT: vpaddq %xmm0, %xmm2, %xmm0
	; AVX-NEXT: retq			; AVX2-NEXT: retq
				;
				; AVX512-LABEL: mul_v2i64c:
				; AVX512: # %bb.0: # %entry
				; AVX512-NEXT: vmovdqa {{.*#+}} xmm1 = [117,117]
				; AVX512-NEXT: vpmuludq %xmm1, %xmm0, %xmm2
				; AVX512-NEXT: vpsrlq $32, %xmm0, %xmm0
				; AVX512-NEXT: vpmuludq %xmm1, %xmm0, %xmm0
				; AVX512-NEXT: vpsllq $32, %xmm0, %xmm0
				; AVX512-NEXT: vpaddq %xmm0, %xmm2, %xmm0
				; AVX512-NEXT: retq
	entry:			entry:
	%A = mul <2 x i64> %i, < i64 117, i64 117 >			%A = mul <2 x i64> %i, < i64 117, i64 117 >
	ret <2 x i64> %A			ret <2 x i64> %A
	}			}

	define <16 x i8> @mul_v16i8(<16 x i8> %i, <16 x i8> %j) nounwind {			define <16 x i8> @mul_v16i8(<16 x i8> %i, <16 x i8> %j) nounwind {
	; SSE2-LABEL: mul_v16i8:			; SSE2-LABEL: mul_v16i8:
	; SSE2: # %bb.0: # %entry			; SSE2: # %bb.0: # %entry
	▲ Show 20 Lines • Show All 1,253 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/sadd_sat_vec.ll

	Show First 20 Lines • Show All 1,201 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: vpcmpgtq %xmm2, %xmm0, %xmm0			; AVX1-NEXT: vpcmpgtq %xmm2, %xmm0, %xmm0
	; AVX1-NEXT: vpxor %xmm0, %xmm1, %xmm0			; AVX1-NEXT: vpxor %xmm0, %xmm1, %xmm0
	; AVX1-NEXT: vblendvpd %xmm0, %xmm3, %xmm2, %xmm0			; AVX1-NEXT: vblendvpd %xmm0, %xmm3, %xmm2, %xmm0
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: v2i64:			; AVX2-LABEL: v2i64:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpaddq %xmm1, %xmm0, %xmm2			; AVX2-NEXT: vpaddq %xmm1, %xmm0, %xmm2
	; AVX2-NEXT: vmovapd {{.*#+}} xmm3 = [9223372036854775808,9223372036854775808]			; AVX2-NEXT: vmovddup {{.*#+}} xmm3 = [9223372036854775807,9223372036854775807]
	; AVX2-NEXT: vblendvpd %xmm2, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm3, %xmm3			; AVX2-NEXT: # xmm3 = mem[0,0]
				; AVX2-NEXT: vmovddup {{.*#+}} xmm4 = [9223372036854775808,9223372036854775808]
				; AVX2-NEXT: # xmm4 = mem[0,0]
				; AVX2-NEXT: vblendvpd %xmm2, %xmm3, %xmm4, %xmm3
	; AVX2-NEXT: vpcmpgtq %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpcmpgtq %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm0, %xmm1, %xmm0			; AVX2-NEXT: vpxor %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: vblendvpd %xmm0, %xmm3, %xmm2, %xmm0			; AVX2-NEXT: vblendvpd %xmm0, %xmm3, %xmm2, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: v2i64:			; AVX512F-LABEL: v2i64:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	; AVX512F-NEXT: vpaddq %xmm1, %xmm0, %xmm2			; AVX512F-NEXT: vpaddq %xmm1, %xmm0, %xmm2
	▲ Show 20 Lines • Show All 639 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/sat-add.ll

	Show First 20 Lines • Show All 651 Lines • ▼ Show 20 Lines
	; SSE42-NEXT: pcmpgtq %xmm3, %xmm0			; SSE42-NEXT: pcmpgtq %xmm3, %xmm0
	; SSE42-NEXT: blendvpd %xmm0, %xmm1, %xmm2			; SSE42-NEXT: blendvpd %xmm0, %xmm1, %xmm2
	; SSE42-NEXT: paddq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2			; SSE42-NEXT: paddq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2
	; SSE42-NEXT: movdqa %xmm2, %xmm0			; SSE42-NEXT: movdqa %xmm2, %xmm0
	; SSE42-NEXT: retq			; SSE42-NEXT: retq
	;			;
	; AVX2-LABEL: unsigned_sat_constant_v2i64_using_min:			; AVX2-LABEL: unsigned_sat_constant_v2i64_using_min:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vmovapd {{.*#+}} xmm1 = [18446744073709551573,18446744073709551573]			; AVX2-NEXT: vmovddup {{.*#+}} xmm1 = [18446744073709551573,18446744073709551573]
	; AVX2-NEXT: vpxor {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm2			; AVX2-NEXT: # xmm1 = mem[0,0]
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [9223372036854775765,9223372036854775765]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
				; AVX2-NEXT: vpxor %xmm2, %xmm0, %xmm2
				; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm3 = [9223372036854775765,9223372036854775765]
	; AVX2-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0			; AVX2-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: vpaddq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [42,42]
				; AVX2-NEXT: vpaddq %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512-LABEL: unsigned_sat_constant_v2i64_using_min:			; AVX512-LABEL: unsigned_sat_constant_v2i64_using_min:
	; AVX512: # %bb.0:			; AVX512: # %bb.0:
	; AVX512-NEXT: vpminuq {{\.?LCPI[0-9]+_[0-9]+}}(%rip){1to2}, %xmm0, %xmm0			; AVX512-NEXT: vpminuq {{\.?LCPI[0-9]+_[0-9]+}}(%rip){1to2}, %xmm0, %xmm0
	; AVX512-NEXT: vpaddq {{\.?LCPI[0-9]+_[0-9]+}}(%rip){1to2}, %xmm0, %xmm0			; AVX512-NEXT: vpaddq {{\.?LCPI[0-9]+_[0-9]+}}(%rip){1to2}, %xmm0, %xmm0
	; AVX512-NEXT: retq			; AVX512-NEXT: retq
	%c = icmp ult <2 x i64> %x, <i64 -43, i64 -43>			%c = icmp ult <2 x i64> %x, <i64 -43, i64 -43>
	▲ Show 20 Lines • Show All 47 Lines • ▼ Show 20 Lines
	; SSE42-NEXT: paddq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0			; SSE42-NEXT: paddq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
	; SSE42-NEXT: pxor %xmm0, %xmm1			; SSE42-NEXT: pxor %xmm0, %xmm1
	; SSE42-NEXT: pcmpgtq %xmm1, %xmm2			; SSE42-NEXT: pcmpgtq %xmm1, %xmm2
	; SSE42-NEXT: por %xmm2, %xmm0			; SSE42-NEXT: por %xmm2, %xmm0
	; SSE42-NEXT: retq			; SSE42-NEXT: retq
	;			;
	; AVX2-LABEL: unsigned_sat_constant_v2i64_using_cmp_sum:			; AVX2-LABEL: unsigned_sat_constant_v2i64_using_cmp_sum:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm1 = [9223372036854775808,9223372036854775808]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [42,42]
	; AVX2-NEXT: vpxor %xmm1, %xmm0, %xmm2			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
	; AVX2-NEXT: vpaddq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX2-NEXT: vpxor %xmm2, %xmm0, %xmm3
	; AVX2-NEXT: vpxor %xmm1, %xmm0, %xmm1			; AVX2-NEXT: vpaddq %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpcmpgtq %xmm1, %xmm2, %xmm1			; AVX2-NEXT: vpxor %xmm2, %xmm0, %xmm1
				; AVX2-NEXT: vpcmpgtq %xmm1, %xmm3, %xmm1
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512-LABEL: unsigned_sat_constant_v2i64_using_cmp_sum:			; AVX512-LABEL: unsigned_sat_constant_v2i64_using_cmp_sum:
	; AVX512: # %bb.0:			; AVX512: # %bb.0:
	; AVX512-NEXT: vpminuq {{\.?LCPI[0-9]+_[0-9]+}}(%rip){1to2}, %xmm0, %xmm0			; AVX512-NEXT: vpminuq {{\.?LCPI[0-9]+_[0-9]+}}(%rip){1to2}, %xmm0, %xmm0
	; AVX512-NEXT: vpaddq {{\.?LCPI[0-9]+_[0-9]+}}(%rip){1to2}, %xmm0, %xmm0			; AVX512-NEXT: vpaddq {{\.?LCPI[0-9]+_[0-9]+}}(%rip){1to2}, %xmm0, %xmm0
	; AVX512-NEXT: retq			; AVX512-NEXT: retq
	▲ Show 20 Lines • Show All 46 Lines • ▼ Show 20 Lines
	; SSE42-NEXT: paddq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0			; SSE42-NEXT: paddq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
	; SSE42-NEXT: pxor %xmm0, %xmm1			; SSE42-NEXT: pxor %xmm0, %xmm1
	; SSE42-NEXT: pcmpgtq %xmm1, %xmm2			; SSE42-NEXT: pcmpgtq %xmm1, %xmm2
	; SSE42-NEXT: por %xmm2, %xmm0			; SSE42-NEXT: por %xmm2, %xmm0
	; SSE42-NEXT: retq			; SSE42-NEXT: retq
	;			;
	; AVX2-LABEL: unsigned_sat_constant_v2i64_using_cmp_notval:			; AVX2-LABEL: unsigned_sat_constant_v2i64_using_cmp_notval:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm1 = [9223372036854775808,9223372036854775808]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [42,42]
	; AVX2-NEXT: vpxor %xmm1, %xmm0, %xmm2			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
	; AVX2-NEXT: vpaddq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX2-NEXT: vpxor %xmm2, %xmm0, %xmm3
	; AVX2-NEXT: vpxor %xmm1, %xmm0, %xmm1			; AVX2-NEXT: vpaddq %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpcmpgtq %xmm1, %xmm2, %xmm1			; AVX2-NEXT: vpxor %xmm2, %xmm0, %xmm1
				; AVX2-NEXT: vpcmpgtq %xmm1, %xmm3, %xmm1
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512-LABEL: unsigned_sat_constant_v2i64_using_cmp_notval:			; AVX512-LABEL: unsigned_sat_constant_v2i64_using_cmp_notval:
	; AVX512: # %bb.0:			; AVX512: # %bb.0:
	; AVX512-NEXT: vpminuq {{\.?LCPI[0-9]+_[0-9]+}}(%rip){1to2}, %xmm0, %xmm0			; AVX512-NEXT: vpminuq {{\.?LCPI[0-9]+_[0-9]+}}(%rip){1to2}, %xmm0, %xmm0
	; AVX512-NEXT: vpaddq {{\.?LCPI[0-9]+_[0-9]+}}(%rip){1to2}, %xmm0, %xmm0			; AVX512-NEXT: vpaddq {{\.?LCPI[0-9]+_[0-9]+}}(%rip){1to2}, %xmm0, %xmm0
	; AVX512-NEXT: retq			; AVX512-NEXT: retq
	▲ Show 20 Lines • Show All 392 Lines • ▼ Show 20 Lines
	; SSE42-NEXT: paddq %xmm1, %xmm3			; SSE42-NEXT: paddq %xmm1, %xmm3
	; SSE42-NEXT: movdqa %xmm3, %xmm0			; SSE42-NEXT: movdqa %xmm3, %xmm0
	; SSE42-NEXT: retq			; SSE42-NEXT: retq
	;			;
	; AVX2-LABEL: unsigned_sat_variable_v2i64_using_min:			; AVX2-LABEL: unsigned_sat_variable_v2i64_using_min:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpcmpeqd %xmm2, %xmm2, %xmm2			; AVX2-NEXT: vpcmpeqd %xmm2, %xmm2, %xmm2
	; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm2			; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm2
	; AVX2-NEXT: vpxor {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm3			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm3 = [9223372036854775808,9223372036854775808]
	; AVX2-NEXT: vpxor {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm4			; AVX2-NEXT: vpxor %xmm3, %xmm0, %xmm3
				; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm4 = [9223372036854775807,9223372036854775807]
				; AVX2-NEXT: vpxor %xmm4, %xmm1, %xmm4
	; AVX2-NEXT: vpcmpgtq %xmm3, %xmm4, %xmm3			; AVX2-NEXT: vpcmpgtq %xmm3, %xmm4, %xmm3
	; AVX2-NEXT: vblendvpd %xmm3, %xmm0, %xmm2, %xmm0			; AVX2-NEXT: vblendvpd %xmm3, %xmm0, %xmm2, %xmm0
	; AVX2-NEXT: vpaddq %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpaddq %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512-LABEL: unsigned_sat_variable_v2i64_using_min:			; AVX512-LABEL: unsigned_sat_variable_v2i64_using_min:
	; AVX512: # %bb.0:			; AVX512: # %bb.0:
	; AVX512-NEXT: vmovdqa %xmm1, %xmm2			; AVX512-NEXT: vmovdqa %xmm1, %xmm2
	▲ Show 20 Lines • Show All 51 Lines • ▼ Show 20 Lines
	; SSE42-NEXT: paddq %xmm1, %xmm0			; SSE42-NEXT: paddq %xmm1, %xmm0
	; SSE42-NEXT: pxor %xmm0, %xmm2			; SSE42-NEXT: pxor %xmm0, %xmm2
	; SSE42-NEXT: pcmpgtq %xmm2, %xmm3			; SSE42-NEXT: pcmpgtq %xmm2, %xmm3
	; SSE42-NEXT: por %xmm3, %xmm0			; SSE42-NEXT: por %xmm3, %xmm0
	; SSE42-NEXT: retq			; SSE42-NEXT: retq
	;			;
	; AVX2-LABEL: unsigned_sat_variable_v2i64_using_cmp_sum:			; AVX2-LABEL: unsigned_sat_variable_v2i64_using_cmp_sum:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
	; AVX2-NEXT: vpxor %xmm2, %xmm0, %xmm3			; AVX2-NEXT: vpxor %xmm2, %xmm0, %xmm3
	; AVX2-NEXT: vpaddq %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpaddq %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm2, %xmm0, %xmm1			; AVX2-NEXT: vpxor %xmm2, %xmm0, %xmm1
	; AVX2-NEXT: vpcmpgtq %xmm1, %xmm3, %xmm1			; AVX2-NEXT: vpcmpgtq %xmm1, %xmm3, %xmm1
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512-LABEL: unsigned_sat_variable_v2i64_using_cmp_sum:			; AVX512-LABEL: unsigned_sat_variable_v2i64_using_cmp_sum:
	▲ Show 20 Lines • Show All 52 Lines • ▼ Show 20 Lines
	; SSE42-NEXT: pxor {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0			; SSE42-NEXT: pxor {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
	; SSE42-NEXT: pcmpgtq %xmm1, %xmm0			; SSE42-NEXT: pcmpgtq %xmm1, %xmm0
	; SSE42-NEXT: por %xmm2, %xmm0			; SSE42-NEXT: por %xmm2, %xmm0
	; SSE42-NEXT: retq			; SSE42-NEXT: retq
	;			;
	; AVX2-LABEL: unsigned_sat_variable_v2i64_using_cmp_notval:			; AVX2-LABEL: unsigned_sat_variable_v2i64_using_cmp_notval:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpaddq %xmm1, %xmm0, %xmm2			; AVX2-NEXT: vpaddq %xmm1, %xmm0, %xmm2
	; AVX2-NEXT: vpxor {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm3 = [9223372036854775807,9223372036854775807]
	; AVX2-NEXT: vpxor {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX2-NEXT: vpxor %xmm3, %xmm1, %xmm1
				; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm3 = [9223372036854775808,9223372036854775808]
				; AVX2-NEXT: vpxor %xmm3, %xmm0, %xmm0
	; AVX2-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpor %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpor %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512-LABEL: unsigned_sat_variable_v2i64_using_cmp_notval:			; AVX512-LABEL: unsigned_sat_variable_v2i64_using_cmp_notval:
	; AVX512: # %bb.0:			; AVX512: # %bb.0:
	; AVX512-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3			; AVX512-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3
	; AVX512-NEXT: vpaddq %xmm1, %xmm0, %xmm2			; AVX512-NEXT: vpaddq %xmm1, %xmm0, %xmm2
	Show All 12 Lines

llvm/test/CodeGen/X86/ssub_sat_vec.ll

	Show First 20 Lines • Show All 1,298 Lines • ▼ Show 20 Lines
	;			;
	; AVX2-LABEL: v2i64:			; AVX2-LABEL: v2i64:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpxor %xmm2, %xmm2, %xmm2			; AVX2-NEXT: vpxor %xmm2, %xmm2, %xmm2
	; AVX2-NEXT: vpcmpgtq %xmm2, %xmm1, %xmm2			; AVX2-NEXT: vpcmpgtq %xmm2, %xmm1, %xmm2
	; AVX2-NEXT: vpsubq %xmm1, %xmm0, %xmm1			; AVX2-NEXT: vpsubq %xmm1, %xmm0, %xmm1
	; AVX2-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm0, %xmm2, %xmm0			; AVX2-NEXT: vpxor %xmm0, %xmm2, %xmm0
	; AVX2-NEXT: vmovapd {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]			; AVX2-NEXT: vmovddup {{.*#+}} xmm2 = [9223372036854775807,9223372036854775807]
	; AVX2-NEXT: vblendvpd %xmm1, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2, %xmm2			; AVX2-NEXT: # xmm2 = mem[0,0]
				; AVX2-NEXT: vmovddup {{.*#+}} xmm3 = [9223372036854775808,9223372036854775808]
				; AVX2-NEXT: # xmm3 = mem[0,0]
				; AVX2-NEXT: vblendvpd %xmm1, %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vblendvpd %xmm0, %xmm2, %xmm1, %xmm0			; AVX2-NEXT: vblendvpd %xmm0, %xmm2, %xmm1, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: v2i64:			; AVX512F-LABEL: v2i64:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	; AVX512F-NEXT: vpxor %xmm2, %xmm2, %xmm2			; AVX512F-NEXT: vpxor %xmm2, %xmm2, %xmm2
	; AVX512F-NEXT: vpcmpgtq %xmm2, %xmm1, %xmm2			; AVX512F-NEXT: vpcmpgtq %xmm2, %xmm1, %xmm2
	; AVX512F-NEXT: vpsubq %xmm1, %xmm0, %xmm1			; AVX512F-NEXT: vpsubq %xmm1, %xmm0, %xmm1
	▲ Show 20 Lines • Show All 773 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/uadd_sat_vec.ll

	Show First 20 Lines • Show All 900 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: vpaddq %xmm1, %xmm0, %xmm0			; AVX1-NEXT: vpaddq %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vpxor %xmm2, %xmm0, %xmm1			; AVX1-NEXT: vpxor %xmm2, %xmm0, %xmm1
	; AVX1-NEXT: vpcmpgtq %xmm1, %xmm3, %xmm1			; AVX1-NEXT: vpcmpgtq %xmm1, %xmm3, %xmm1
	; AVX1-NEXT: vpor %xmm1, %xmm0, %xmm0			; AVX1-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: v2i64:			; AVX2-LABEL: v2i64:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
	; AVX2-NEXT: vpxor %xmm2, %xmm0, %xmm3			; AVX2-NEXT: vpxor %xmm2, %xmm0, %xmm3
	; AVX2-NEXT: vpaddq %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpaddq %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm2, %xmm0, %xmm1			; AVX2-NEXT: vpxor %xmm2, %xmm0, %xmm1
	; AVX2-NEXT: vpcmpgtq %xmm1, %xmm3, %xmm1			; AVX2-NEXT: vpcmpgtq %xmm1, %xmm3, %xmm1
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: v2i64:			; AVX512F-LABEL: v2i64:
	▲ Show 20 Lines • Show All 260 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/urem-seteq-vec-tautological.ll

	Show First 20 Lines • Show All 234 Lines • ▼ Show 20 Lines
	; CHECK-AVX1-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; CHECK-AVX1-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; CHECK-AVX1-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1			; CHECK-AVX1-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1
	; CHECK-AVX1-NEXT: vpxor %xmm1, %xmm0, %xmm0			; CHECK-AVX1-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; CHECK-AVX1-NEXT: vmovq {{.*#+}} xmm0 = xmm0[0],zero			; CHECK-AVX1-NEXT: vmovq {{.*#+}} xmm0 = xmm0[0],zero
	; CHECK-AVX1-NEXT: retq			; CHECK-AVX1-NEXT: retq
	;			;
	; CHECK-AVX2-LABEL: t3_wide:			; CHECK-AVX2-LABEL: t3_wide:
	; CHECK-AVX2: # %bb.0:			; CHECK-AVX2: # %bb.0:
	; CHECK-AVX2-NEXT: vmovdqa {{.*#+}} xmm1 = [12297829382473034411,12297829382473034411]			; CHECK-AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [2863311530,2863311530]
	; CHECK-AVX2-NEXT: vpmuludq %xmm1, %xmm0, %xmm2			; CHECK-AVX2-NEXT: vpmuludq %xmm1, %xmm0, %xmm1
	; CHECK-AVX2-NEXT: vpsrlq $32, %xmm0, %xmm3			; CHECK-AVX2-NEXT: vpsrlq $32, %xmm0, %xmm2
	; CHECK-AVX2-NEXT: vpmuludq %xmm1, %xmm3, %xmm1			; CHECK-AVX2-NEXT: vpbroadcastq {{.*#+}} xmm3 = [12297829382473034411,12297829382473034411]
	; CHECK-AVX2-NEXT: vpmuludq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; CHECK-AVX2-NEXT: vpmuludq %xmm3, %xmm2, %xmm2
				; CHECK-AVX2-NEXT: vpaddq %xmm2, %xmm1, %xmm1
				; CHECK-AVX2-NEXT: vpsllq $32, %xmm1, %xmm1
				; CHECK-AVX2-NEXT: vpmuludq %xmm3, %xmm0, %xmm0
	; CHECK-AVX2-NEXT: vpaddq %xmm1, %xmm0, %xmm0			; CHECK-AVX2-NEXT: vpaddq %xmm1, %xmm0, %xmm0
	; CHECK-AVX2-NEXT: vpsllq $32, %xmm0, %xmm0			; CHECK-AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [9223372036854775808,9223372036854775808]
	; CHECK-AVX2-NEXT: vpaddq %xmm0, %xmm2, %xmm0			; CHECK-AVX2-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; CHECK-AVX2-NEXT: vpxor {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; CHECK-AVX2-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; CHECK-AVX2-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; CHECK-AVX2-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1			; CHECK-AVX2-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1
	; CHECK-AVX2-NEXT: vpxor %xmm1, %xmm0, %xmm0			; CHECK-AVX2-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; CHECK-AVX2-NEXT: vmovq {{.*#+}} xmm0 = xmm0[0],zero			; CHECK-AVX2-NEXT: vmovq {{.*#+}} xmm0 = xmm0[0],zero
	; CHECK-AVX2-NEXT: retq			; CHECK-AVX2-NEXT: retq
	;			;
	; CHECK-AVX512VL-LABEL: t3_wide:			; CHECK-AVX512VL-LABEL: t3_wide:
	; CHECK-AVX512VL: # %bb.0:			; CHECK-AVX512VL: # %bb.0:
	Show All 16 Lines

llvm/test/CodeGen/X86/usub_sat_vec.ll

	Show First 20 Lines • Show All 811 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: vpxor %xmm2, %xmm0, %xmm2			; AVX1-NEXT: vpxor %xmm2, %xmm0, %xmm2
	; AVX1-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2
	; AVX1-NEXT: vpsubq %xmm1, %xmm0, %xmm0			; AVX1-NEXT: vpsubq %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vpand %xmm0, %xmm2, %xmm0			; AVX1-NEXT: vpand %xmm0, %xmm2, %xmm0
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: v2i64:			; AVX2-LABEL: v2i64:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
	; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm3			; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm3
	; AVX2-NEXT: vpxor %xmm2, %xmm0, %xmm2			; AVX2-NEXT: vpxor %xmm2, %xmm0, %xmm2
	; AVX2-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2			; AVX2-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2
	; AVX2-NEXT: vpsubq %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsubq %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm0, %xmm2, %xmm0			; AVX2-NEXT: vpand %xmm0, %xmm2, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: v2i64:			; AVX512F-LABEL: v2i64:
	▲ Show 20 Lines • Show All 320 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vec_cmp_uint-128.ll

	Show First 20 Lines • Show All 336 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm1			; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm1
	; AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; AVX1-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1			; AVX1-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1
	; AVX1-NEXT: vpxor %xmm1, %xmm0, %xmm0			; AVX1-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: ge_v2i64:			; AVX2-LABEL: ge_v2i64:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
	; AVX2-NEXT: vpxor %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpxor %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm1
	; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpxor %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; XOP-LABEL: ge_v2i64:			; XOP-LABEL: ge_v2i64:
	▲ Show 20 Lines • Show All 157 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
	; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm1			; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm1
	; AVX1-NEXT: vpxor %xmm2, %xmm0, %xmm0			; AVX1-NEXT: vpxor %xmm2, %xmm0, %xmm0
	; AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0			; AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: gt_v2i64:			; AVX2-LABEL: gt_v2i64:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
	; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm1
	; AVX2-NEXT: vpxor %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpxor %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; XOP-LABEL: gt_v2i64:			; XOP-LABEL: gt_v2i64:
	; XOP: # %bb.0:			; XOP: # %bb.0:
	; XOP-NEXT: vpcomgtuq %xmm1, %xmm0, %xmm0			; XOP-NEXT: vpcomgtuq %xmm1, %xmm0, %xmm0
	▲ Show 20 Lines • Show All 231 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: vpxor %xmm2, %xmm0, %xmm0			; AVX1-NEXT: vpxor %xmm2, %xmm0, %xmm0
	; AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0			; AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1			; AVX1-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1
	; AVX1-NEXT: vpxor %xmm1, %xmm0, %xmm0			; AVX1-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: le_v2i64:			; AVX2-LABEL: le_v2i64:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
	; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm1
	; AVX2-NEXT: vpxor %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpxor %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpxor %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; XOP-LABEL: le_v2i64:			; XOP-LABEL: le_v2i64:
	▲ Show 20 Lines • Show All 158 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
	; AVX1-NEXT: vpxor %xmm2, %xmm0, %xmm0			; AVX1-NEXT: vpxor %xmm2, %xmm0, %xmm0
	; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm1			; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm1
	; AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: lt_v2i64:			; AVX2-LABEL: lt_v2i64:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
	; AVX2-NEXT: vpxor %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpxor %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm1
	; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; XOP-LABEL: lt_v2i64:			; XOP-LABEL: lt_v2i64:
	; XOP: # %bb.0:			; XOP: # %bb.0:
	; XOP-NEXT: vpcomltuq %xmm1, %xmm0, %xmm0			; XOP-NEXT: vpcomltuq %xmm1, %xmm0, %xmm0
	▲ Show 20 Lines • Show All 179 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vec_fp_to_int.ll

	Show First 20 Lines • Show All 338 Lines • ▼ Show 20 Lines
	; SSE-NEXT: movapd %xmm1, %xmm2			; SSE-NEXT: movapd %xmm1, %xmm2
	; SSE-NEXT: psrad $31, %xmm2			; SSE-NEXT: psrad $31, %xmm2
	; SSE-NEXT: addpd {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0			; SSE-NEXT: addpd {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
	; SSE-NEXT: cvttpd2dq %xmm0, %xmm0			; SSE-NEXT: cvttpd2dq %xmm0, %xmm0
	; SSE-NEXT: andpd %xmm2, %xmm0			; SSE-NEXT: andpd %xmm2, %xmm0
	; SSE-NEXT: orpd %xmm1, %xmm0			; SSE-NEXT: orpd %xmm1, %xmm0
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; VEX-LABEL: fptoui_2f64_to_4i32:			; AVX1-LABEL: fptoui_2f64_to_4i32:
	; VEX: # %bb.0:			; AVX1: # %bb.0:
	; VEX-NEXT: vcvttpd2dq %xmm0, %xmm1			; AVX1-NEXT: vcvttpd2dq %xmm0, %xmm1
	; VEX-NEXT: vpsrad $31, %xmm1, %xmm2			; AVX1-NEXT: vpsrad $31, %xmm1, %xmm2
	; VEX-NEXT: vaddpd {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX1-NEXT: vaddpd {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; VEX-NEXT: vcvttpd2dq %xmm0, %xmm0			; AVX1-NEXT: vcvttpd2dq %xmm0, %xmm0
	; VEX-NEXT: vandpd %xmm2, %xmm0, %xmm0			; AVX1-NEXT: vandpd %xmm2, %xmm0, %xmm0
	; VEX-NEXT: vorpd %xmm0, %xmm1, %xmm0			; AVX1-NEXT: vorpd %xmm0, %xmm1, %xmm0
	; VEX-NEXT: retq			; AVX1-NEXT: retq
				;
				; AVX2-LABEL: fptoui_2f64_to_4i32:
				; AVX2: # %bb.0:
				; AVX2-NEXT: vmovddup {{.*#+}} xmm1 = [-2.147483648E+9,-2.147483648E+9]
				; AVX2-NEXT: # xmm1 = mem[0,0]
				; AVX2-NEXT: vaddpd %xmm1, %xmm0, %xmm1
				; AVX2-NEXT: vcvttpd2dq %xmm1, %xmm1
				; AVX2-NEXT: vcvttpd2dq %xmm0, %xmm0
				; AVX2-NEXT: vpsrad $31, %xmm0, %xmm2
				; AVX2-NEXT: vandpd %xmm2, %xmm1, %xmm1
				; AVX2-NEXT: vorpd %xmm1, %xmm0, %xmm0
				; AVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: fptoui_2f64_to_4i32:			; AVX512F-LABEL: fptoui_2f64_to_4i32:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512F-NEXT: vcvttpd2udq %zmm0, %ymm0			; AVX512F-NEXT: vcvttpd2udq %zmm0, %ymm0
	; AVX512F-NEXT: vmovq {{.*#+}} xmm0 = xmm0[0],zero			; AVX512F-NEXT: vmovq {{.*#+}} xmm0 = xmm0[0],zero
	; AVX512F-NEXT: vzeroupper			; AVX512F-NEXT: vzeroupper
	; AVX512F-NEXT: retq			; AVX512F-NEXT: retq
	Show All 27 Lines
	; SSE-NEXT: movapd %xmm1, %xmm2			; SSE-NEXT: movapd %xmm1, %xmm2
	; SSE-NEXT: psrad $31, %xmm2			; SSE-NEXT: psrad $31, %xmm2
	; SSE-NEXT: addpd {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0			; SSE-NEXT: addpd {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
	; SSE-NEXT: cvttpd2dq %xmm0, %xmm0			; SSE-NEXT: cvttpd2dq %xmm0, %xmm0
	; SSE-NEXT: andpd %xmm2, %xmm0			; SSE-NEXT: andpd %xmm2, %xmm0
	; SSE-NEXT: orpd %xmm1, %xmm0			; SSE-NEXT: orpd %xmm1, %xmm0
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; VEX-LABEL: fptoui_2f64_to_2i32:			; AVX1-LABEL: fptoui_2f64_to_2i32:
	; VEX: # %bb.0:			; AVX1: # %bb.0:
	; VEX-NEXT: vcvttpd2dq %xmm0, %xmm1			; AVX1-NEXT: vcvttpd2dq %xmm0, %xmm1
	; VEX-NEXT: vpsrad $31, %xmm1, %xmm2			; AVX1-NEXT: vpsrad $31, %xmm1, %xmm2
	; VEX-NEXT: vaddpd {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX1-NEXT: vaddpd {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; VEX-NEXT: vcvttpd2dq %xmm0, %xmm0			; AVX1-NEXT: vcvttpd2dq %xmm0, %xmm0
	; VEX-NEXT: vandpd %xmm2, %xmm0, %xmm0			; AVX1-NEXT: vandpd %xmm2, %xmm0, %xmm0
	; VEX-NEXT: vorpd %xmm0, %xmm1, %xmm0			; AVX1-NEXT: vorpd %xmm0, %xmm1, %xmm0
	; VEX-NEXT: retq			; AVX1-NEXT: retq
				;
				; AVX2-LABEL: fptoui_2f64_to_2i32:
				; AVX2: # %bb.0:
				; AVX2-NEXT: vmovddup {{.*#+}} xmm1 = [-2.147483648E+9,-2.147483648E+9]
				; AVX2-NEXT: # xmm1 = mem[0,0]
				; AVX2-NEXT: vaddpd %xmm1, %xmm0, %xmm1
				; AVX2-NEXT: vcvttpd2dq %xmm1, %xmm1
				; AVX2-NEXT: vcvttpd2dq %xmm0, %xmm0
				; AVX2-NEXT: vpsrad $31, %xmm0, %xmm2
				; AVX2-NEXT: vandpd %xmm2, %xmm1, %xmm1
				; AVX2-NEXT: vorpd %xmm1, %xmm0, %xmm0
				; AVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: fptoui_2f64_to_2i32:			; AVX512F-LABEL: fptoui_2f64_to_2i32:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512F-NEXT: vcvttpd2udq %zmm0, %ymm0			; AVX512F-NEXT: vcvttpd2udq %zmm0, %ymm0
	; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 killed $ymm0			; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 killed $ymm0
	; AVX512F-NEXT: vzeroupper			; AVX512F-NEXT: vzeroupper
	; AVX512F-NEXT: retq			; AVX512F-NEXT: retq
	▲ Show 20 Lines • Show All 2,040 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vec_int_to_fp.ll

	Show First 20 Lines • Show All 46 Lines • ▼ Show 20 Lines
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: pmovzxdq {{.*#+}} xmm0 = xmm0[0],zero,xmm0[1],zero			; SSE41-NEXT: pmovzxdq {{.*#+}} xmm0 = xmm0[0],zero,xmm0[1],zero
	; SSE41-NEXT: movdqa {{.*#+}} xmm1 = [4.503599627370496E+15,4.503599627370496E+15]			; SSE41-NEXT: movdqa {{.*#+}} xmm1 = [4.503599627370496E+15,4.503599627370496E+15]
	; SSE41-NEXT: por %xmm1, %xmm0			; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: subpd %xmm1, %xmm0			; SSE41-NEXT: subpd %xmm1, %xmm0
	; SSE41-NEXT: cvtpd2ps %xmm0, %xmm0			; SSE41-NEXT: cvtpd2ps %xmm0, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; VEX-LABEL: uitofp_2i32_to_2f32:			; AVX1-LABEL: uitofp_2i32_to_2f32:
	; VEX: # %bb.0:			; AVX1: # %bb.0:
	; VEX-NEXT: vpmovzxdq {{.*#+}} xmm0 = xmm0[0],zero,xmm0[1],zero			; AVX1-NEXT: vpmovzxdq {{.*#+}} xmm0 = xmm0[0],zero,xmm0[1],zero
	; VEX-NEXT: vmovdqa {{.*#+}} xmm1 = [4.503599627370496E+15,4.503599627370496E+15]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm1 = [4.503599627370496E+15,4.503599627370496E+15]
	; VEX-NEXT: vpor %xmm1, %xmm0, %xmm0			; AVX1-NEXT: vpor %xmm1, %xmm0, %xmm0
	; VEX-NEXT: vsubpd %xmm1, %xmm0, %xmm0			; AVX1-NEXT: vsubpd %xmm1, %xmm0, %xmm0
	; VEX-NEXT: vcvtpd2ps %xmm0, %xmm0			; AVX1-NEXT: vcvtpd2ps %xmm0, %xmm0
	; VEX-NEXT: retq			; AVX1-NEXT: retq
				;
				; AVX2-LABEL: uitofp_2i32_to_2f32:
				; AVX2: # %bb.0:
				; AVX2-NEXT: vpmovzxdq {{.*#+}} xmm0 = xmm0[0],zero,xmm0[1],zero
				; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [4.503599627370496E+15,4.503599627370496E+15]
				; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
				; AVX2-NEXT: vsubpd %xmm1, %xmm0, %xmm0
				; AVX2-NEXT: vcvtpd2ps %xmm0, %xmm0
				; AVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: uitofp_2i32_to_2f32:			; AVX512F-LABEL: uitofp_2i32_to_2f32:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512F-NEXT: vcvtudq2ps %zmm0, %zmm0			; AVX512F-NEXT: vcvtudq2ps %zmm0, %zmm0
	; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 killed $zmm0			; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 killed $zmm0
	; AVX512F-NEXT: vzeroupper			; AVX512F-NEXT: vzeroupper
	; AVX512F-NEXT: retq			; AVX512F-NEXT: retq
	▲ Show 20 Lines • Show All 528 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: vsubpd {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX1-NEXT: vsubpd {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; AVX1-NEXT: vaddpd %xmm0, %xmm1, %xmm0			; AVX1-NEXT: vaddpd %xmm0, %xmm1, %xmm0
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: uitofp_2i64_to_2f64:			; AVX2-LABEL: uitofp_2i64_to_2f64:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpblendd {{.*#+}} xmm1 = xmm0[0],xmm1[1],xmm0[2],xmm1[3]			; AVX2-NEXT: vpblendd {{.*#+}} xmm1 = xmm0[0],xmm1[1],xmm0[2],xmm1[3]
	; AVX2-NEXT: vpor {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm2 = [4841369599423283200,4841369599423283200]
				; AVX2-NEXT: vpor %xmm2, %xmm1, %xmm1
	; AVX2-NEXT: vpsrlq $32, %xmm0, %xmm0			; AVX2-NEXT: vpsrlq $32, %xmm0, %xmm0
	; AVX2-NEXT: vpor {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm2 = [4985484787499139072,4985484787499139072]
	; AVX2-NEXT: vsubpd {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX2-NEXT: vpor %xmm2, %xmm0, %xmm0
				; AVX2-NEXT: vmovddup {{.*#+}} xmm2 = [1.9342813118337666E+25,1.9342813118337666E+25]
				; AVX2-NEXT: # xmm2 = mem[0,0]
				; AVX2-NEXT: vsubpd %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vaddpd %xmm0, %xmm1, %xmm0			; AVX2-NEXT: vaddpd %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: uitofp_2i64_to_2f64:			; AVX512F-LABEL: uitofp_2i64_to_2f64:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	; AVX512F-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX512F-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX512F-NEXT: vpblendd {{.*#+}} xmm1 = xmm0[0],xmm1[1],xmm0[2],xmm1[3]			; AVX512F-NEXT: vpblendd {{.*#+}} xmm1 = xmm0[0],xmm1[1],xmm0[2],xmm1[3]
	; AVX512F-NEXT: vpor {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1			; AVX512F-NEXT: vpor {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1
	▲ Show 20 Lines • Show All 43 Lines • ▼ Show 20 Lines
	; SSE41-LABEL: uitofp_2i32_to_2f64:			; SSE41-LABEL: uitofp_2i32_to_2f64:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: pmovzxdq {{.*#+}} xmm0 = xmm0[0],zero,xmm0[1],zero			; SSE41-NEXT: pmovzxdq {{.*#+}} xmm0 = xmm0[0],zero,xmm0[1],zero
	; SSE41-NEXT: movdqa {{.*#+}} xmm1 = [4.503599627370496E+15,4.503599627370496E+15]			; SSE41-NEXT: movdqa {{.*#+}} xmm1 = [4.503599627370496E+15,4.503599627370496E+15]
	; SSE41-NEXT: por %xmm1, %xmm0			; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: subpd %xmm1, %xmm0			; SSE41-NEXT: subpd %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; VEX-LABEL: uitofp_2i32_to_2f64:			; AVX1-LABEL: uitofp_2i32_to_2f64:
	; VEX: # %bb.0:			; AVX1: # %bb.0:
	; VEX-NEXT: vpmovzxdq {{.*#+}} xmm0 = xmm0[0],zero,xmm0[1],zero			; AVX1-NEXT: vpmovzxdq {{.*#+}} xmm0 = xmm0[0],zero,xmm0[1],zero
	; VEX-NEXT: vmovdqa {{.*#+}} xmm1 = [4.503599627370496E+15,4.503599627370496E+15]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm1 = [4.503599627370496E+15,4.503599627370496E+15]
	; VEX-NEXT: vpor %xmm1, %xmm0, %xmm0			; AVX1-NEXT: vpor %xmm1, %xmm0, %xmm0
	; VEX-NEXT: vsubpd %xmm1, %xmm0, %xmm0			; AVX1-NEXT: vsubpd %xmm1, %xmm0, %xmm0
	; VEX-NEXT: retq			; AVX1-NEXT: retq
				;
				; AVX2-LABEL: uitofp_2i32_to_2f64:
				; AVX2: # %bb.0:
				; AVX2-NEXT: vpmovzxdq {{.*#+}} xmm0 = xmm0[0],zero,xmm0[1],zero
				; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [4.503599627370496E+15,4.503599627370496E+15]
				; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
				; AVX2-NEXT: vsubpd %xmm1, %xmm0, %xmm0
				; AVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: uitofp_2i32_to_2f64:			; AVX512F-LABEL: uitofp_2i32_to_2f64:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 def $ymm0			; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 def $ymm0
	; AVX512F-NEXT: vcvtudq2pd %ymm0, %zmm0			; AVX512F-NEXT: vcvtudq2pd %ymm0, %zmm0
	; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 killed $zmm0			; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 killed $zmm0
	; AVX512F-NEXT: vzeroupper			; AVX512F-NEXT: vzeroupper
	; AVX512F-NEXT: retq			; AVX512F-NEXT: retq
	▲ Show 20 Lines • Show All 1,218 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: insertps {{.*#+}} xmm2 = xmm2[0],xmm3[0],zero,zero			; SSE41-NEXT: insertps {{.*#+}} xmm2 = xmm2[0],xmm3[0],zero,zero
	; SSE41-NEXT: movaps %xmm2, %xmm3			; SSE41-NEXT: movaps %xmm2, %xmm3
	; SSE41-NEXT: addps %xmm2, %xmm3			; SSE41-NEXT: addps %xmm2, %xmm3
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: blendvps %xmm0, %xmm3, %xmm2			; SSE41-NEXT: blendvps %xmm0, %xmm3, %xmm2
	; SSE41-NEXT: movaps %xmm2, %xmm0			; SSE41-NEXT: movaps %xmm2, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; VEX-LABEL: uitofp_2i64_to_4f32:			; AVX1-LABEL: uitofp_2i64_to_4f32:
	; VEX: # %bb.0:			; AVX1: # %bb.0:
	; VEX-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm1			; AVX1-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm1
	; VEX-NEXT: vpsrlq $1, %xmm0, %xmm2			; AVX1-NEXT: vpsrlq $1, %xmm0, %xmm2
	; VEX-NEXT: vpor %xmm1, %xmm2, %xmm1			; AVX1-NEXT: vpor %xmm1, %xmm2, %xmm1
	; VEX-NEXT: vblendvpd %xmm0, %xmm1, %xmm0, %xmm1			; AVX1-NEXT: vblendvpd %xmm0, %xmm1, %xmm0, %xmm1
	; VEX-NEXT: vpextrq $1, %xmm1, %rax			; AVX1-NEXT: vpextrq $1, %xmm1, %rax
	; VEX-NEXT: vcvtsi2ss %rax, %xmm3, %xmm2			; AVX1-NEXT: vcvtsi2ss %rax, %xmm3, %xmm2
	; VEX-NEXT: vmovq %xmm1, %rax			; AVX1-NEXT: vmovq %xmm1, %rax
	; VEX-NEXT: vcvtsi2ss %rax, %xmm3, %xmm1			; AVX1-NEXT: vcvtsi2ss %rax, %xmm3, %xmm1
	; VEX-NEXT: vinsertps {{.*#+}} xmm1 = xmm1[0],xmm2[0],zero,zero			; AVX1-NEXT: vinsertps {{.*#+}} xmm1 = xmm1[0],xmm2[0],zero,zero
	; VEX-NEXT: vaddps %xmm1, %xmm1, %xmm2			; AVX1-NEXT: vaddps %xmm1, %xmm1, %xmm2
	; VEX-NEXT: vpxor %xmm3, %xmm3, %xmm3			; AVX1-NEXT: vpxor %xmm3, %xmm3, %xmm3
	; VEX-NEXT: vpcmpgtq %xmm0, %xmm3, %xmm0			; AVX1-NEXT: vpcmpgtq %xmm0, %xmm3, %xmm0
	; VEX-NEXT: vpshufd {{.*#+}} xmm0 = xmm0[1,3,2,3]			; AVX1-NEXT: vpshufd {{.*#+}} xmm0 = xmm0[1,3,2,3]
	; VEX-NEXT: vblendvps %xmm0, %xmm2, %xmm1, %xmm0			; AVX1-NEXT: vblendvps %xmm0, %xmm2, %xmm1, %xmm0
	; VEX-NEXT: retq			; AVX1-NEXT: retq
				;
				; AVX2-LABEL: uitofp_2i64_to_4f32:
				; AVX2: # %bb.0:
				; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [1,1]
				; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm1
				; AVX2-NEXT: vpsrlq $1, %xmm0, %xmm2
				; AVX2-NEXT: vpor %xmm1, %xmm2, %xmm1
				; AVX2-NEXT: vblendvpd %xmm0, %xmm1, %xmm0, %xmm1
				; AVX2-NEXT: vpextrq $1, %xmm1, %rax
				; AVX2-NEXT: vcvtsi2ss %rax, %xmm3, %xmm2
				; AVX2-NEXT: vmovq %xmm1, %rax
				; AVX2-NEXT: vcvtsi2ss %rax, %xmm3, %xmm1
				; AVX2-NEXT: vinsertps {{.*#+}} xmm1 = xmm1[0],xmm2[0],zero,zero
				; AVX2-NEXT: vaddps %xmm1, %xmm1, %xmm2
				; AVX2-NEXT: vpxor %xmm3, %xmm3, %xmm3
				; AVX2-NEXT: vpcmpgtq %xmm0, %xmm3, %xmm0
				; AVX2-NEXT: vpshufd {{.*#+}} xmm0 = xmm0[1,3,2,3]
				; AVX2-NEXT: vblendvps %xmm0, %xmm2, %xmm1, %xmm0
				; AVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: uitofp_2i64_to_4f32:			; AVX512F-LABEL: uitofp_2i64_to_4f32:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	; AVX512F-NEXT: vpextrq $1, %xmm0, %rax			; AVX512F-NEXT: vpextrq $1, %xmm0, %rax
	; AVX512F-NEXT: vcvtusi2ss %rax, %xmm1, %xmm1			; AVX512F-NEXT: vcvtusi2ss %rax, %xmm1, %xmm1
	; AVX512F-NEXT: vmovq %xmm0, %rax			; AVX512F-NEXT: vmovq %xmm0, %rax
	; AVX512F-NEXT: vcvtusi2ss %rax, %xmm2, %xmm0			; AVX512F-NEXT: vcvtusi2ss %rax, %xmm2, %xmm0
	; AVX512F-NEXT: vinsertps {{.*#+}} xmm0 = xmm0[0],xmm1[0],zero,zero			; AVX512F-NEXT: vinsertps {{.*#+}} xmm0 = xmm0[0],xmm1[0],zero,zero
	▲ Show 20 Lines • Show All 82 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: insertps {{.*#+}} xmm3 = xmm3[0],xmm2[0],zero,zero			; SSE41-NEXT: insertps {{.*#+}} xmm3 = xmm3[0],xmm2[0],zero,zero
	; SSE41-NEXT: movaps %xmm3, %xmm2			; SSE41-NEXT: movaps %xmm3, %xmm2
	; SSE41-NEXT: addps %xmm3, %xmm2			; SSE41-NEXT: addps %xmm3, %xmm2
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: blendvps %xmm0, %xmm2, %xmm3			; SSE41-NEXT: blendvps %xmm0, %xmm2, %xmm3
	; SSE41-NEXT: movq {{.*#+}} xmm0 = xmm3[0],zero			; SSE41-NEXT: movq {{.*#+}} xmm0 = xmm3[0],zero
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; VEX-LABEL: uitofp_2i64_to_2f32:			; AVX1-LABEL: uitofp_2i64_to_2f32:
	; VEX: # %bb.0:			; AVX1: # %bb.0:
	; VEX-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm1			; AVX1-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm1
	; VEX-NEXT: vpsrlq $1, %xmm0, %xmm2			; AVX1-NEXT: vpsrlq $1, %xmm0, %xmm2
	; VEX-NEXT: vpor %xmm1, %xmm2, %xmm1			; AVX1-NEXT: vpor %xmm1, %xmm2, %xmm1
	; VEX-NEXT: vblendvpd %xmm0, %xmm1, %xmm0, %xmm1			; AVX1-NEXT: vblendvpd %xmm0, %xmm1, %xmm0, %xmm1
	; VEX-NEXT: vpextrq $1, %xmm1, %rax			; AVX1-NEXT: vpextrq $1, %xmm1, %rax
	; VEX-NEXT: vcvtsi2ss %rax, %xmm3, %xmm2			; AVX1-NEXT: vcvtsi2ss %rax, %xmm3, %xmm2
	; VEX-NEXT: vmovq %xmm1, %rax			; AVX1-NEXT: vmovq %xmm1, %rax
	; VEX-NEXT: vcvtsi2ss %rax, %xmm3, %xmm1			; AVX1-NEXT: vcvtsi2ss %rax, %xmm3, %xmm1
	; VEX-NEXT: vinsertps {{.*#+}} xmm1 = xmm1[0],xmm2[0],zero,zero			; AVX1-NEXT: vinsertps {{.*#+}} xmm1 = xmm1[0],xmm2[0],zero,zero
	; VEX-NEXT: vaddps %xmm1, %xmm1, %xmm2			; AVX1-NEXT: vaddps %xmm1, %xmm1, %xmm2
	; VEX-NEXT: vpxor %xmm3, %xmm3, %xmm3			; AVX1-NEXT: vpxor %xmm3, %xmm3, %xmm3
	; VEX-NEXT: vpcmpgtq %xmm0, %xmm3, %xmm0			; AVX1-NEXT: vpcmpgtq %xmm0, %xmm3, %xmm0
	; VEX-NEXT: vpshufd {{.*#+}} xmm0 = xmm0[1,3,2,3]			; AVX1-NEXT: vpshufd {{.*#+}} xmm0 = xmm0[1,3,2,3]
	; VEX-NEXT: vblendvps %xmm0, %xmm2, %xmm1, %xmm0			; AVX1-NEXT: vblendvps %xmm0, %xmm2, %xmm1, %xmm0
	; VEX-NEXT: vmovq {{.*#+}} xmm0 = xmm0[0],zero			; AVX1-NEXT: vmovq {{.*#+}} xmm0 = xmm0[0],zero
	; VEX-NEXT: retq			; AVX1-NEXT: retq
				;
				; AVX2-LABEL: uitofp_2i64_to_2f32:
				; AVX2: # %bb.0:
				; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [1,1]
				; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm1
				; AVX2-NEXT: vpsrlq $1, %xmm0, %xmm2
				; AVX2-NEXT: vpor %xmm1, %xmm2, %xmm1
				; AVX2-NEXT: vblendvpd %xmm0, %xmm1, %xmm0, %xmm1
				; AVX2-NEXT: vpextrq $1, %xmm1, %rax
				; AVX2-NEXT: vcvtsi2ss %rax, %xmm3, %xmm2
				; AVX2-NEXT: vmovq %xmm1, %rax
				; AVX2-NEXT: vcvtsi2ss %rax, %xmm3, %xmm1
				; AVX2-NEXT: vinsertps {{.*#+}} xmm1 = xmm1[0],xmm2[0],zero,zero
				; AVX2-NEXT: vaddps %xmm1, %xmm1, %xmm2
				; AVX2-NEXT: vpxor %xmm3, %xmm3, %xmm3
				; AVX2-NEXT: vpcmpgtq %xmm0, %xmm3, %xmm0
				; AVX2-NEXT: vpshufd {{.*#+}} xmm0 = xmm0[1,3,2,3]
				; AVX2-NEXT: vblendvps %xmm0, %xmm2, %xmm1, %xmm0
				; AVX2-NEXT: vmovq {{.*#+}} xmm0 = xmm0[0],zero
				; AVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: uitofp_2i64_to_2f32:			; AVX512F-LABEL: uitofp_2i64_to_2f32:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	; AVX512F-NEXT: vmovq %xmm0, %rax			; AVX512F-NEXT: vmovq %xmm0, %rax
	; AVX512F-NEXT: vcvtusi2ss %rax, %xmm1, %xmm1			; AVX512F-NEXT: vcvtusi2ss %rax, %xmm1, %xmm1
	; AVX512F-NEXT: vpextrq $1, %xmm0, %rax			; AVX512F-NEXT: vpextrq $1, %xmm0, %rax
	; AVX512F-NEXT: vcvtusi2ss %rax, %xmm2, %xmm0			; AVX512F-NEXT: vcvtusi2ss %rax, %xmm2, %xmm0
	; AVX512F-NEXT: vinsertps {{.*#+}} xmm0 = xmm1[0],xmm0[0],zero,zero			; AVX512F-NEXT: vinsertps {{.*#+}} xmm0 = xmm1[0],xmm0[0],zero,zero
	▲ Show 20 Lines • Show All 1,219 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: vaddpd %xmm0, %xmm1, %xmm0			; AVX1-NEXT: vaddpd %xmm0, %xmm1, %xmm0
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: uitofp_load_2i64_to_2f64:			; AVX2-LABEL: uitofp_load_2i64_to_2f64:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vmovdqa (%rdi), %xmm0			; AVX2-NEXT: vmovdqa (%rdi), %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpblendd {{.*#+}} xmm1 = xmm0[0],xmm1[1],xmm0[2],xmm1[3]			; AVX2-NEXT: vpblendd {{.*#+}} xmm1 = xmm0[0],xmm1[1],xmm0[2],xmm1[3]
	; AVX2-NEXT: vpor {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm2 = [4841369599423283200,4841369599423283200]
				; AVX2-NEXT: vpor %xmm2, %xmm1, %xmm1
	; AVX2-NEXT: vpsrlq $32, %xmm0, %xmm0			; AVX2-NEXT: vpsrlq $32, %xmm0, %xmm0
	; AVX2-NEXT: vpor {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm2 = [4985484787499139072,4985484787499139072]
	; AVX2-NEXT: vsubpd {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX2-NEXT: vpor %xmm2, %xmm0, %xmm0
				; AVX2-NEXT: vmovddup {{.*#+}} xmm2 = [1.9342813118337666E+25,1.9342813118337666E+25]
				; AVX2-NEXT: # xmm2 = mem[0,0]
				; AVX2-NEXT: vsubpd %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vaddpd %xmm0, %xmm1, %xmm0			; AVX2-NEXT: vaddpd %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: uitofp_load_2i64_to_2f64:			; AVX512F-LABEL: uitofp_load_2i64_to_2f64:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	; AVX512F-NEXT: vmovdqa (%rdi), %xmm0			; AVX512F-NEXT: vmovdqa (%rdi), %xmm0
	; AVX512F-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX512F-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX512F-NEXT: vpblendd {{.*#+}} xmm1 = xmm0[0],xmm1[1],xmm0[2],xmm1[3]			; AVX512F-NEXT: vpblendd {{.*#+}} xmm1 = xmm0[0],xmm1[1],xmm0[2],xmm1[3]
	▲ Show 20 Lines • Show All 47 Lines • ▼ Show 20 Lines
	; SSE41-LABEL: uitofp_load_2i32_to_2f64:			; SSE41-LABEL: uitofp_load_2i32_to_2f64:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: pmovzxdq {{.*#+}} xmm0 = mem[0],zero,mem[1],zero			; SSE41-NEXT: pmovzxdq {{.*#+}} xmm0 = mem[0],zero,mem[1],zero
	; SSE41-NEXT: movdqa {{.*#+}} xmm1 = [4.503599627370496E+15,4.503599627370496E+15]			; SSE41-NEXT: movdqa {{.*#+}} xmm1 = [4.503599627370496E+15,4.503599627370496E+15]
	; SSE41-NEXT: por %xmm1, %xmm0			; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: subpd %xmm1, %xmm0			; SSE41-NEXT: subpd %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; VEX-LABEL: uitofp_load_2i32_to_2f64:			; AVX1-LABEL: uitofp_load_2i32_to_2f64:
	; VEX: # %bb.0:			; AVX1: # %bb.0:
	; VEX-NEXT: vpmovzxdq {{.*#+}} xmm0 = mem[0],zero,mem[1],zero			; AVX1-NEXT: vpmovzxdq {{.*#+}} xmm0 = mem[0],zero,mem[1],zero
	; VEX-NEXT: vmovdqa {{.*#+}} xmm1 = [4.503599627370496E+15,4.503599627370496E+15]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm1 = [4.503599627370496E+15,4.503599627370496E+15]
	; VEX-NEXT: vpor %xmm1, %xmm0, %xmm0			; AVX1-NEXT: vpor %xmm1, %xmm0, %xmm0
	; VEX-NEXT: vsubpd %xmm1, %xmm0, %xmm0			; AVX1-NEXT: vsubpd %xmm1, %xmm0, %xmm0
	; VEX-NEXT: retq			; AVX1-NEXT: retq
				;
				; AVX2-LABEL: uitofp_load_2i32_to_2f64:
				; AVX2: # %bb.0:
				; AVX2-NEXT: vpmovzxdq {{.*#+}} xmm0 = mem[0],zero,mem[1],zero
				; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [4.503599627370496E+15,4.503599627370496E+15]
				; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
				; AVX2-NEXT: vsubpd %xmm1, %xmm0, %xmm0
				; AVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: uitofp_load_2i32_to_2f64:			; AVX512F-LABEL: uitofp_load_2i32_to_2f64:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	; AVX512F-NEXT: vmovsd {{.*#+}} xmm0 = mem[0],zero			; AVX512F-NEXT: vmovsd {{.*#+}} xmm0 = mem[0],zero
	; AVX512F-NEXT: vcvtudq2pd %ymm0, %zmm0			; AVX512F-NEXT: vcvtudq2pd %ymm0, %zmm0
	; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 killed $zmm0			; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 killed $zmm0
	; AVX512F-NEXT: vzeroupper			; AVX512F-NEXT: vzeroupper
	; AVX512F-NEXT: retq			; AVX512F-NEXT: retq
	▲ Show 20 Lines • Show All 2,292 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: vaddpd %xmm2, %xmm0, %xmm0			; AVX1-NEXT: vaddpd %xmm2, %xmm0, %xmm0
	; AVX1-NEXT: vaddpd %xmm2, %xmm1, %xmm1			; AVX1-NEXT: vaddpd %xmm2, %xmm1, %xmm1
	; AVX1-NEXT: vmovupd %xmm0, (%rdi)			; AVX1-NEXT: vmovupd %xmm0, (%rdi)
	; AVX1-NEXT: vmovupd %xmm1, 16(%rdi)			; AVX1-NEXT: vmovupd %xmm1, 16(%rdi)
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: PR43609:			; AVX2-LABEL: PR43609:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpaddq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm1			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [2,2]
				; AVX2-NEXT: vpaddq %xmm1, %xmm0, %xmm1
	; AVX2-NEXT: vpxor %xmm2, %xmm2, %xmm2			; AVX2-NEXT: vpxor %xmm2, %xmm2, %xmm2
	; AVX2-NEXT: vpblendd {{.*#+}} xmm3 = xmm0[0],xmm2[1],xmm0[2],xmm2[3]			; AVX2-NEXT: vpblendd {{.*#+}} xmm3 = xmm0[0],xmm2[1],xmm0[2],xmm2[3]
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm4 = [4841369599423283200,4841369599423283200]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm4 = [4841369599423283200,4841369599423283200]
	; AVX2-NEXT: vpor %xmm4, %xmm3, %xmm3			; AVX2-NEXT: vpor %xmm4, %xmm3, %xmm3
	; AVX2-NEXT: vpsrlq $32, %xmm0, %xmm0			; AVX2-NEXT: vpsrlq $32, %xmm0, %xmm0
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm5 = [4985484787499139072,4985484787499139072]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm5 = [4985484787499139072,4985484787499139072]
	; AVX2-NEXT: vpor %xmm5, %xmm0, %xmm0			; AVX2-NEXT: vpor %xmm5, %xmm0, %xmm0
	; AVX2-NEXT: vmovapd {{.*#+}} xmm6 = [1.9342813118337666E+25,1.9342813118337666E+25]			; AVX2-NEXT: vmovddup {{.*#+}} xmm6 = [1.9342813118337666E+25,1.9342813118337666E+25]
				; AVX2-NEXT: # xmm6 = mem[0,0]
	; AVX2-NEXT: vsubpd %xmm6, %xmm0, %xmm0			; AVX2-NEXT: vsubpd %xmm6, %xmm0, %xmm0
	; AVX2-NEXT: vaddpd %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vaddpd %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpblendd {{.*#+}} xmm2 = xmm1[0],xmm2[1],xmm1[2],xmm2[3]			; AVX2-NEXT: vpblendd {{.*#+}} xmm2 = xmm1[0],xmm2[1],xmm1[2],xmm2[3]
	; AVX2-NEXT: vpor %xmm4, %xmm2, %xmm2			; AVX2-NEXT: vpor %xmm4, %xmm2, %xmm2
	; AVX2-NEXT: vpsrlq $32, %xmm1, %xmm1			; AVX2-NEXT: vpsrlq $32, %xmm1, %xmm1
	; AVX2-NEXT: vpor %xmm5, %xmm1, %xmm1			; AVX2-NEXT: vpor %xmm5, %xmm1, %xmm1
	; AVX2-NEXT: vsubpd %xmm6, %xmm1, %xmm1			; AVX2-NEXT: vsubpd %xmm6, %xmm1, %xmm1
	; AVX2-NEXT: vaddpd %xmm1, %xmm2, %xmm1			; AVX2-NEXT: vaddpd %xmm1, %xmm2, %xmm1
	; AVX2-NEXT: vmovapd {{.*#+}} xmm2 = [5.0E-1,5.0E-1]			; AVX2-NEXT: vmovddup {{.*#+}} xmm2 = [5.0E-1,5.0E-1]
				; AVX2-NEXT: # xmm2 = mem[0,0]
	; AVX2-NEXT: vaddpd %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vaddpd %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vaddpd %xmm2, %xmm1, %xmm1			; AVX2-NEXT: vaddpd %xmm2, %xmm1, %xmm1
	; AVX2-NEXT: vmovupd %xmm0, (%rdi)			; AVX2-NEXT: vmovupd %xmm0, (%rdi)
	; AVX2-NEXT: vmovupd %xmm1, 16(%rdi)			; AVX2-NEXT: vmovupd %xmm1, 16(%rdi)
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: PR43609:			; AVX512F-LABEL: PR43609:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	▲ Show 20 Lines • Show All 94 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vec_minmax_uint.ll

	Show First 20 Lines • Show All 65 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm3			; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm3
	; AVX1-NEXT: vpxor %xmm2, %xmm0, %xmm2			; AVX1-NEXT: vpxor %xmm2, %xmm0, %xmm2
	; AVX1-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2
	; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0			; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: max_gt_v2i64:			; AVX2-LABEL: max_gt_v2i64:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
	; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm3			; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm3
	; AVX2-NEXT: vpxor %xmm2, %xmm0, %xmm2			; AVX2-NEXT: vpxor %xmm2, %xmm0, %xmm2
	; AVX2-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2			; AVX2-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2
	; AVX2-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0			; AVX2-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512-LABEL: max_gt_v2i64:			; AVX512-LABEL: max_gt_v2i64:
	; AVX512: # %bb.0:			; AVX512: # %bb.0:
	▲ Show 20 Lines • Show All 389 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm3			; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm3
	; AVX1-NEXT: vpxor %xmm2, %xmm0, %xmm2			; AVX1-NEXT: vpxor %xmm2, %xmm0, %xmm2
	; AVX1-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2
	; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0			; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: max_ge_v2i64:			; AVX2-LABEL: max_ge_v2i64:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
	; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm3			; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm3
	; AVX2-NEXT: vpxor %xmm2, %xmm0, %xmm2			; AVX2-NEXT: vpxor %xmm2, %xmm0, %xmm2
	; AVX2-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2			; AVX2-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2
	; AVX2-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0			; AVX2-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512-LABEL: max_ge_v2i64:			; AVX512-LABEL: max_ge_v2i64:
	; AVX512: # %bb.0:			; AVX512: # %bb.0:
	▲ Show 20 Lines • Show All 388 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: vpxor %xmm2, %xmm0, %xmm3			; AVX1-NEXT: vpxor %xmm2, %xmm0, %xmm3
	; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm2			; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm2
	; AVX1-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2
	; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0			; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: min_lt_v2i64:			; AVX2-LABEL: min_lt_v2i64:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
	; AVX2-NEXT: vpxor %xmm2, %xmm0, %xmm3			; AVX2-NEXT: vpxor %xmm2, %xmm0, %xmm3
	; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm2			; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm2
	; AVX2-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2			; AVX2-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2
	; AVX2-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0			; AVX2-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512-LABEL: min_lt_v2i64:			; AVX512-LABEL: min_lt_v2i64:
	; AVX512: # %bb.0:			; AVX512: # %bb.0:
	▲ Show 20 Lines • Show All 391 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: vpxor %xmm2, %xmm0, %xmm3			; AVX1-NEXT: vpxor %xmm2, %xmm0, %xmm3
	; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm2			; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm2
	; AVX1-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2
	; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0			; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: min_le_v2i64:			; AVX2-LABEL: min_le_v2i64:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
	; AVX2-NEXT: vpxor %xmm2, %xmm0, %xmm3			; AVX2-NEXT: vpxor %xmm2, %xmm0, %xmm3
	; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm2			; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm2
	; AVX2-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2			; AVX2-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2
	; AVX2-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0			; AVX2-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512-LABEL: min_le_v2i64:			; AVX512-LABEL: min_le_v2i64:
	; AVX512: # %bb.0:			; AVX512: # %bb.0:
	▲ Show 20 Lines • Show All 827 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vec_uaddo.ll

	Show First 20 Lines • Show All 849 Lines • ▼ Show 20 Lines
	; SSE-NEXT: pshufd {{.*#+}} xmm2 = xmm0[0,2,2,3]			; SSE-NEXT: pshufd {{.*#+}} xmm2 = xmm0[0,2,2,3]
	; SSE-NEXT: pshufd {{.*#+}} xmm3 = xmm3[1,3,3,3]			; SSE-NEXT: pshufd {{.*#+}} xmm3 = xmm3[1,3,3,3]
	; SSE-NEXT: pand %xmm2, %xmm3			; SSE-NEXT: pand %xmm2, %xmm3
	; SSE-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,3,3,3]			; SSE-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,3,3,3]
	; SSE-NEXT: por %xmm3, %xmm0			; SSE-NEXT: por %xmm3, %xmm0
	; SSE-NEXT: movdqa %xmm1, (%rdi)			; SSE-NEXT: movdqa %xmm1, (%rdi)
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX-LABEL: uaddo_v2i64:			; AVX1-LABEL: uaddo_v2i64:
	; AVX: # %bb.0:			; AVX1: # %bb.0:
	; AVX-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
	; AVX-NEXT: vpxor %xmm2, %xmm0, %xmm3			; AVX1-NEXT: vpxor %xmm2, %xmm0, %xmm3
	; AVX-NEXT: vpaddq %xmm1, %xmm0, %xmm1			; AVX1-NEXT: vpaddq %xmm1, %xmm0, %xmm1
	; AVX-NEXT: vpxor %xmm2, %xmm1, %xmm0			; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm0
	; AVX-NEXT: vpcmpgtq %xmm0, %xmm3, %xmm0			; AVX1-NEXT: vpcmpgtq %xmm0, %xmm3, %xmm0
	; AVX-NEXT: vpshufd {{.*#+}} xmm0 = xmm0[0,2,2,3]			; AVX1-NEXT: vpshufd {{.*#+}} xmm0 = xmm0[0,2,2,3]
	; AVX-NEXT: vmovdqa %xmm1, (%rdi)			; AVX1-NEXT: vmovdqa %xmm1, (%rdi)
	; AVX-NEXT: retq			; AVX1-NEXT: retq
				;
				; AVX2-LABEL: uaddo_v2i64:
				; AVX2: # %bb.0:
				; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
				; AVX2-NEXT: vpxor %xmm2, %xmm0, %xmm3
				; AVX2-NEXT: vpaddq %xmm1, %xmm0, %xmm1
				; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm0
				; AVX2-NEXT: vpcmpgtq %xmm0, %xmm3, %xmm0
				; AVX2-NEXT: vpshufd {{.*#+}} xmm0 = xmm0[0,2,2,3]
				; AVX2-NEXT: vmovdqa %xmm1, (%rdi)
				; AVX2-NEXT: retq
	;			;
	; AVX512-LABEL: uaddo_v2i64:			; AVX512-LABEL: uaddo_v2i64:
	; AVX512: # %bb.0:			; AVX512: # %bb.0:
	; AVX512-NEXT: vpaddq %xmm1, %xmm0, %xmm1			; AVX512-NEXT: vpaddq %xmm1, %xmm0, %xmm1
	; AVX512-NEXT: vpcmpltuq %xmm0, %xmm1, %k1			; AVX512-NEXT: vpcmpltuq %xmm0, %xmm1, %k1
	; AVX512-NEXT: vpcmpeqd %xmm0, %xmm0, %xmm0			; AVX512-NEXT: vpcmpeqd %xmm0, %xmm0, %xmm0
	; AVX512-NEXT: vmovdqa32 %xmm0, %xmm0 {%k1} {z}			; AVX512-NEXT: vmovdqa32 %xmm0, %xmm0 {%k1} {z}
	; AVX512-NEXT: vmovdqa %xmm1, (%rdi)			; AVX512-NEXT: vmovdqa %xmm1, (%rdi)
	▲ Show 20 Lines • Show All 370 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vec_usubo.ll

	Show First 20 Lines • Show All 896 Lines • ▼ Show 20 Lines
	; SSE-NEXT: pshufd {{.*#+}} xmm4 = xmm1[1,3,3,3]			; SSE-NEXT: pshufd {{.*#+}} xmm4 = xmm1[1,3,3,3]
	; SSE-NEXT: pand %xmm3, %xmm4			; SSE-NEXT: pand %xmm3, %xmm4
	; SSE-NEXT: pshufd {{.*#+}} xmm1 = xmm2[1,3,3,3]			; SSE-NEXT: pshufd {{.*#+}} xmm1 = xmm2[1,3,3,3]
	; SSE-NEXT: por %xmm4, %xmm1			; SSE-NEXT: por %xmm4, %xmm1
	; SSE-NEXT: movdqa %xmm0, (%rdi)			; SSE-NEXT: movdqa %xmm0, (%rdi)
	; SSE-NEXT: movdqa %xmm1, %xmm0			; SSE-NEXT: movdqa %xmm1, %xmm0
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX-LABEL: usubo_v2i64:			; AVX1-LABEL: usubo_v2i64:
	; AVX: # %bb.0:			; AVX1: # %bb.0:
	; AVX-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
	; AVX-NEXT: vpxor %xmm2, %xmm0, %xmm3			; AVX1-NEXT: vpxor %xmm2, %xmm0, %xmm3
	; AVX-NEXT: vpsubq %xmm1, %xmm0, %xmm1			; AVX1-NEXT: vpsubq %xmm1, %xmm0, %xmm1
	; AVX-NEXT: vpxor %xmm2, %xmm1, %xmm0			; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm0
	; AVX-NEXT: vpcmpgtq %xmm3, %xmm0, %xmm0			; AVX1-NEXT: vpcmpgtq %xmm3, %xmm0, %xmm0
	; AVX-NEXT: vpshufd {{.*#+}} xmm0 = xmm0[0,2,2,3]			; AVX1-NEXT: vpshufd {{.*#+}} xmm0 = xmm0[0,2,2,3]
	; AVX-NEXT: vmovdqa %xmm1, (%rdi)			; AVX1-NEXT: vmovdqa %xmm1, (%rdi)
	; AVX-NEXT: retq			; AVX1-NEXT: retq
				;
				; AVX2-LABEL: usubo_v2i64:
				; AVX2: # %bb.0:
				; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
				; AVX2-NEXT: vpxor %xmm2, %xmm0, %xmm3
				; AVX2-NEXT: vpsubq %xmm1, %xmm0, %xmm1
				; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm0
				; AVX2-NEXT: vpcmpgtq %xmm3, %xmm0, %xmm0
				; AVX2-NEXT: vpshufd {{.*#+}} xmm0 = xmm0[0,2,2,3]
				; AVX2-NEXT: vmovdqa %xmm1, (%rdi)
				; AVX2-NEXT: retq
	;			;
	; AVX512-LABEL: usubo_v2i64:			; AVX512-LABEL: usubo_v2i64:
	; AVX512: # %bb.0:			; AVX512: # %bb.0:
	; AVX512-NEXT: vpsubq %xmm1, %xmm0, %xmm1			; AVX512-NEXT: vpsubq %xmm1, %xmm0, %xmm1
	; AVX512-NEXT: vpcmpnleuq %xmm0, %xmm1, %k1			; AVX512-NEXT: vpcmpnleuq %xmm0, %xmm1, %k1
	; AVX512-NEXT: vpcmpeqd %xmm0, %xmm0, %xmm0			; AVX512-NEXT: vpcmpeqd %xmm0, %xmm0, %xmm0
	; AVX512-NEXT: vmovdqa32 %xmm0, %xmm0 {%k1} {z}			; AVX512-NEXT: vmovdqa32 %xmm0, %xmm0 {%k1} {z}
	; AVX512-NEXT: vmovdqa %xmm1, (%rdi)			; AVX512-NEXT: vmovdqa %xmm1, (%rdi)
	▲ Show 20 Lines • Show All 370 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vector-bitreverse.ll

	Show First 20 Lines • Show All 464 Lines • ▼ Show 20 Lines
	; XOP-NEXT: vpperm {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0, %xmm0			; XOP-NEXT: vpperm {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0, %xmm0
	; XOP-NEXT: retq			; XOP-NEXT: retq
	;			;
	; GFNISSE-LABEL: test_bitreverse_v16i8:			; GFNISSE-LABEL: test_bitreverse_v16i8:
	; GFNISSE: # %bb.0:			; GFNISSE: # %bb.0:
	; GFNISSE-NEXT: gf2p8affineqb $0, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0			; GFNISSE-NEXT: gf2p8affineqb $0, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
	; GFNISSE-NEXT: retq			; GFNISSE-NEXT: retq
	;			;
	; GFNIAVX-LABEL: test_bitreverse_v16i8:			; GFNIAVX1-LABEL: test_bitreverse_v16i8:
	; GFNIAVX: # %bb.0:			; GFNIAVX1: # %bb.0:
	; GFNIAVX-NEXT: vgf2p8affineqb $0, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; GFNIAVX1-NEXT: vgf2p8affineqb $0, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; GFNIAVX-NEXT: retq			; GFNIAVX1-NEXT: retq
				;
				; GFNIAVX2-LABEL: test_bitreverse_v16i8:
				; GFNIAVX2: # %bb.0:
				; GFNIAVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [9241421688590303745,9241421688590303745]
				; GFNIAVX2-NEXT: vgf2p8affineqb $0, %xmm1, %xmm0, %xmm0
				; GFNIAVX2-NEXT: retq
				;
				; GFNIAVX512-LABEL: test_bitreverse_v16i8:
				; GFNIAVX512: # %bb.0:
				; GFNIAVX512-NEXT: vgf2p8affineqb $0, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
				; GFNIAVX512-NEXT: retq
	%b = call <16 x i8> @llvm.bitreverse.v16i8(<16 x i8> %a)			%b = call <16 x i8> @llvm.bitreverse.v16i8(<16 x i8> %a)
	ret <16 x i8> %b			ret <16 x i8> %b
	}			}

	define <8 x i16> @test_bitreverse_v8i16(<8 x i16> %a) nounwind {			define <8 x i16> @test_bitreverse_v8i16(<8 x i16> %a) nounwind {
	; SSE2-LABEL: test_bitreverse_v8i16:			; SSE2-LABEL: test_bitreverse_v8i16:
	; SSE2: # %bb.0:			; SSE2: # %bb.0:
	; SSE2-NEXT: movdqa %xmm0, %xmm1			; SSE2-NEXT: movdqa %xmm0, %xmm1
	▲ Show 20 Lines • Show All 59 Lines • ▼ Show 20 Lines
	; XOP-NEXT: retq			; XOP-NEXT: retq
	;			;
	; GFNISSE-LABEL: test_bitreverse_v8i16:			; GFNISSE-LABEL: test_bitreverse_v8i16:
	; GFNISSE: # %bb.0:			; GFNISSE: # %bb.0:
	; GFNISSE-NEXT: pshufb {{.*#+}} xmm0 = xmm0[1,0,3,2,5,4,7,6,9,8,11,10,13,12,15,14]			; GFNISSE-NEXT: pshufb {{.*#+}} xmm0 = xmm0[1,0,3,2,5,4,7,6,9,8,11,10,13,12,15,14]
	; GFNISSE-NEXT: gf2p8affineqb $0, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0			; GFNISSE-NEXT: gf2p8affineqb $0, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
	; GFNISSE-NEXT: retq			; GFNISSE-NEXT: retq
	;			;
	; GFNIAVX-LABEL: test_bitreverse_v8i16:			; GFNIAVX1-LABEL: test_bitreverse_v8i16:
	; GFNIAVX: # %bb.0:			; GFNIAVX1: # %bb.0:
	; GFNIAVX-NEXT: vpshufb {{.*#+}} xmm0 = xmm0[1,0,3,2,5,4,7,6,9,8,11,10,13,12,15,14]			; GFNIAVX1-NEXT: vpshufb {{.*#+}} xmm0 = xmm0[1,0,3,2,5,4,7,6,9,8,11,10,13,12,15,14]
	; GFNIAVX-NEXT: vgf2p8affineqb $0, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; GFNIAVX1-NEXT: vgf2p8affineqb $0, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; GFNIAVX-NEXT: retq			; GFNIAVX1-NEXT: retq
				;
				; GFNIAVX2-LABEL: test_bitreverse_v8i16:
				; GFNIAVX2: # %bb.0:
				; GFNIAVX2-NEXT: vpshufb {{.*#+}} xmm0 = xmm0[1,0,3,2,5,4,7,6,9,8,11,10,13,12,15,14]
				; GFNIAVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [9241421688590303745,9241421688590303745]
				; GFNIAVX2-NEXT: vgf2p8affineqb $0, %xmm1, %xmm0, %xmm0
				; GFNIAVX2-NEXT: retq
				;
				; GFNIAVX512-LABEL: test_bitreverse_v8i16:
				; GFNIAVX512: # %bb.0:
				; GFNIAVX512-NEXT: vpshufb {{.*#+}} xmm0 = xmm0[1,0,3,2,5,4,7,6,9,8,11,10,13,12,15,14]
				; GFNIAVX512-NEXT: vgf2p8affineqb $0, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
				; GFNIAVX512-NEXT: retq
	%b = call <8 x i16> @llvm.bitreverse.v8i16(<8 x i16> %a)			%b = call <8 x i16> @llvm.bitreverse.v8i16(<8 x i16> %a)
	ret <8 x i16> %b			ret <8 x i16> %b
	}			}

	define <4 x i32> @test_bitreverse_v4i32(<4 x i32> %a) nounwind {			define <4 x i32> @test_bitreverse_v4i32(<4 x i32> %a) nounwind {
	; SSE2-LABEL: test_bitreverse_v4i32:			; SSE2-LABEL: test_bitreverse_v4i32:
	; SSE2: # %bb.0:			; SSE2: # %bb.0:
	; SSE2-NEXT: pxor %xmm1, %xmm1			; SSE2-NEXT: pxor %xmm1, %xmm1
	▲ Show 20 Lines • Show All 64 Lines • ▼ Show 20 Lines
	; XOP-NEXT: retq			; XOP-NEXT: retq
	;			;
	; GFNISSE-LABEL: test_bitreverse_v4i32:			; GFNISSE-LABEL: test_bitreverse_v4i32:
	; GFNISSE: # %bb.0:			; GFNISSE: # %bb.0:
	; GFNISSE-NEXT: pshufb {{.*#+}} xmm0 = xmm0[3,2,1,0,7,6,5,4,11,10,9,8,15,14,13,12]			; GFNISSE-NEXT: pshufb {{.*#+}} xmm0 = xmm0[3,2,1,0,7,6,5,4,11,10,9,8,15,14,13,12]
	; GFNISSE-NEXT: gf2p8affineqb $0, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0			; GFNISSE-NEXT: gf2p8affineqb $0, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
	; GFNISSE-NEXT: retq			; GFNISSE-NEXT: retq
	;			;
	; GFNIAVX-LABEL: test_bitreverse_v4i32:			; GFNIAVX1-LABEL: test_bitreverse_v4i32:
	; GFNIAVX: # %bb.0:			; GFNIAVX1: # %bb.0:
	; GFNIAVX-NEXT: vpshufb {{.*#+}} xmm0 = xmm0[3,2,1,0,7,6,5,4,11,10,9,8,15,14,13,12]			; GFNIAVX1-NEXT: vpshufb {{.*#+}} xmm0 = xmm0[3,2,1,0,7,6,5,4,11,10,9,8,15,14,13,12]
	; GFNIAVX-NEXT: vgf2p8affineqb $0, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; GFNIAVX1-NEXT: vgf2p8affineqb $0, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; GFNIAVX-NEXT: retq			; GFNIAVX1-NEXT: retq
				;
				; GFNIAVX2-LABEL: test_bitreverse_v4i32:
				; GFNIAVX2: # %bb.0:
				; GFNIAVX2-NEXT: vpshufb {{.*#+}} xmm0 = xmm0[3,2,1,0,7,6,5,4,11,10,9,8,15,14,13,12]
				; GFNIAVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [9241421688590303745,9241421688590303745]
				; GFNIAVX2-NEXT: vgf2p8affineqb $0, %xmm1, %xmm0, %xmm0
				; GFNIAVX2-NEXT: retq
				;
				; GFNIAVX512-LABEL: test_bitreverse_v4i32:
				; GFNIAVX512: # %bb.0:
				; GFNIAVX512-NEXT: vpshufb {{.*#+}} xmm0 = xmm0[3,2,1,0,7,6,5,4,11,10,9,8,15,14,13,12]
				; GFNIAVX512-NEXT: vgf2p8affineqb $0, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
				; GFNIAVX512-NEXT: retq
	%b = call <4 x i32> @llvm.bitreverse.v4i32(<4 x i32> %a)			%b = call <4 x i32> @llvm.bitreverse.v4i32(<4 x i32> %a)
	ret <4 x i32> %b			ret <4 x i32> %b
	}			}

	define <2 x i64> @test_bitreverse_v2i64(<2 x i64> %a) nounwind {			define <2 x i64> @test_bitreverse_v2i64(<2 x i64> %a) nounwind {
	; SSE2-LABEL: test_bitreverse_v2i64:			; SSE2-LABEL: test_bitreverse_v2i64:
	; SSE2: # %bb.0:			; SSE2: # %bb.0:
	; SSE2-NEXT: pxor %xmm1, %xmm1			; SSE2-NEXT: pxor %xmm1, %xmm1
	▲ Show 20 Lines • Show All 66 Lines • ▼ Show 20 Lines
	; XOP-NEXT: retq			; XOP-NEXT: retq
	;			;
	; GFNISSE-LABEL: test_bitreverse_v2i64:			; GFNISSE-LABEL: test_bitreverse_v2i64:
	; GFNISSE: # %bb.0:			; GFNISSE: # %bb.0:
	; GFNISSE-NEXT: pshufb {{.*#+}} xmm0 = xmm0[7,6,5,4,3,2,1,0,15,14,13,12,11,10,9,8]			; GFNISSE-NEXT: pshufb {{.*#+}} xmm0 = xmm0[7,6,5,4,3,2,1,0,15,14,13,12,11,10,9,8]
	; GFNISSE-NEXT: gf2p8affineqb $0, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0			; GFNISSE-NEXT: gf2p8affineqb $0, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
	; GFNISSE-NEXT: retq			; GFNISSE-NEXT: retq
	;			;
	; GFNIAVX-LABEL: test_bitreverse_v2i64:			; GFNIAVX1-LABEL: test_bitreverse_v2i64:
	; GFNIAVX: # %bb.0:			; GFNIAVX1: # %bb.0:
	; GFNIAVX-NEXT: vpshufb {{.*#+}} xmm0 = xmm0[7,6,5,4,3,2,1,0,15,14,13,12,11,10,9,8]			; GFNIAVX1-NEXT: vpshufb {{.*#+}} xmm0 = xmm0[7,6,5,4,3,2,1,0,15,14,13,12,11,10,9,8]
	; GFNIAVX-NEXT: vgf2p8affineqb $0, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; GFNIAVX1-NEXT: vgf2p8affineqb $0, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; GFNIAVX-NEXT: retq			; GFNIAVX1-NEXT: retq
				;
				; GFNIAVX2-LABEL: test_bitreverse_v2i64:
				; GFNIAVX2: # %bb.0:
				; GFNIAVX2-NEXT: vpshufb {{.*#+}} xmm0 = xmm0[7,6,5,4,3,2,1,0,15,14,13,12,11,10,9,8]
				; GFNIAVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [9241421688590303745,9241421688590303745]
				; GFNIAVX2-NEXT: vgf2p8affineqb $0, %xmm1, %xmm0, %xmm0
				; GFNIAVX2-NEXT: retq
				;
				; GFNIAVX512-LABEL: test_bitreverse_v2i64:
				; GFNIAVX512: # %bb.0:
				; GFNIAVX512-NEXT: vpshufb {{.*#+}} xmm0 = xmm0[7,6,5,4,3,2,1,0,15,14,13,12,11,10,9,8]
				; GFNIAVX512-NEXT: vgf2p8affineqb $0, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
				; GFNIAVX512-NEXT: retq
	%b = call <2 x i64> @llvm.bitreverse.v2i64(<2 x i64> %a)			%b = call <2 x i64> @llvm.bitreverse.v2i64(<2 x i64> %a)
	ret <2 x i64> %b			ret <2 x i64> %b
	}			}

	define <32 x i8> @test_bitreverse_v32i8(<32 x i8> %a) nounwind {			define <32 x i8> @test_bitreverse_v32i8(<32 x i8> %a) nounwind {
	; SSE2-LABEL: test_bitreverse_v32i8:			; SSE2-LABEL: test_bitreverse_v32i8:
	; SSE2: # %bb.0:			; SSE2: # %bb.0:
	; SSE2-NEXT: movdqa %xmm0, %xmm3			; SSE2-NEXT: movdqa %xmm0, %xmm3
	▲ Show 20 Lines • Show All 2,040 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vector-compare-all_of.ll

	Show First 20 Lines • Show All 1,028 Lines • ▼ Show 20 Lines
	; SSE-NEXT: pxor %xmm2, %xmm1			; SSE-NEXT: pxor %xmm2, %xmm1
	; SSE-NEXT: pxor %xmm2, %xmm0			; SSE-NEXT: pxor %xmm2, %xmm0
	; SSE-NEXT: pcmpgtq %xmm1, %xmm0			; SSE-NEXT: pcmpgtq %xmm1, %xmm0
	; SSE-NEXT: movmskpd %xmm0, %eax			; SSE-NEXT: movmskpd %xmm0, %eax
	; SSE-NEXT: cmpb $3, %al			; SSE-NEXT: cmpb $3, %al
	; SSE-NEXT: sete %al			; SSE-NEXT: sete %al
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX-LABEL: bool_reduction_v2i64:			; AVX1-LABEL: bool_reduction_v2i64:
	; AVX: # %bb.0:			; AVX1: # %bb.0:
	; AVX-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
	; AVX-NEXT: vpxor %xmm2, %xmm1, %xmm1			; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm1
	; AVX-NEXT: vpxor %xmm2, %xmm0, %xmm0			; AVX1-NEXT: vpxor %xmm2, %xmm0, %xmm0
	; AVX-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0			; AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	; AVX-NEXT: vmovmskpd %xmm0, %eax			; AVX1-NEXT: vmovmskpd %xmm0, %eax
	; AVX-NEXT: cmpb $3, %al			; AVX1-NEXT: cmpb $3, %al
	; AVX-NEXT: sete %al			; AVX1-NEXT: sete %al
	; AVX-NEXT: retq			; AVX1-NEXT: retq
				;
				; AVX2-LABEL: bool_reduction_v2i64:
				; AVX2: # %bb.0:
				; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
				; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm1
				; AVX2-NEXT: vpxor %xmm2, %xmm0, %xmm0
				; AVX2-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
				; AVX2-NEXT: vmovmskpd %xmm0, %eax
				; AVX2-NEXT: cmpb $3, %al
				; AVX2-NEXT: sete %al
				; AVX2-NEXT: retq
	;			;
	; AVX512-LABEL: bool_reduction_v2i64:			; AVX512-LABEL: bool_reduction_v2i64:
	; AVX512: # %bb.0:			; AVX512: # %bb.0:
	; AVX512-NEXT: vpcmpnleuq %xmm1, %xmm0, %k0			; AVX512-NEXT: vpcmpnleuq %xmm1, %xmm0, %k0
	; AVX512-NEXT: kmovd %k0, %eax			; AVX512-NEXT: kmovd %k0, %eax
	; AVX512-NEXT: cmpb $3, %al			; AVX512-NEXT: cmpb $3, %al
	; AVX512-NEXT: sete %al			; AVX512-NEXT: sete %al
	; AVX512-NEXT: retq			; AVX512-NEXT: retq
	▲ Show 20 Lines • Show All 322 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vector-compare-any_of.ll

	Show First 20 Lines • Show All 983 Lines • ▼ Show 20 Lines
	; SSE-NEXT: pxor %xmm2, %xmm1			; SSE-NEXT: pxor %xmm2, %xmm1
	; SSE-NEXT: pxor %xmm2, %xmm0			; SSE-NEXT: pxor %xmm2, %xmm0
	; SSE-NEXT: pcmpgtq %xmm1, %xmm0			; SSE-NEXT: pcmpgtq %xmm1, %xmm0
	; SSE-NEXT: movmskpd %xmm0, %eax			; SSE-NEXT: movmskpd %xmm0, %eax
	; SSE-NEXT: testl %eax, %eax			; SSE-NEXT: testl %eax, %eax
	; SSE-NEXT: setne %al			; SSE-NEXT: setne %al
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX-LABEL: bool_reduction_v2i64:			; AVX1-LABEL: bool_reduction_v2i64:
	; AVX: # %bb.0:			; AVX1: # %bb.0:
	; AVX-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
	; AVX-NEXT: vpxor %xmm2, %xmm1, %xmm1			; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm1
	; AVX-NEXT: vpxor %xmm2, %xmm0, %xmm0			; AVX1-NEXT: vpxor %xmm2, %xmm0, %xmm0
	; AVX-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0			; AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	; AVX-NEXT: vmovmskpd %xmm0, %eax			; AVX1-NEXT: vmovmskpd %xmm0, %eax
	; AVX-NEXT: testl %eax, %eax			; AVX1-NEXT: testl %eax, %eax
	; AVX-NEXT: setne %al			; AVX1-NEXT: setne %al
	; AVX-NEXT: retq			; AVX1-NEXT: retq
				;
				; AVX2-LABEL: bool_reduction_v2i64:
				; AVX2: # %bb.0:
				; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
				; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm1
				; AVX2-NEXT: vpxor %xmm2, %xmm0, %xmm0
				; AVX2-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
				; AVX2-NEXT: vmovmskpd %xmm0, %eax
				; AVX2-NEXT: testl %eax, %eax
				; AVX2-NEXT: setne %al
				; AVX2-NEXT: retq
	;			;
	; AVX512-LABEL: bool_reduction_v2i64:			; AVX512-LABEL: bool_reduction_v2i64:
	; AVX512: # %bb.0:			; AVX512: # %bb.0:
	; AVX512-NEXT: vpcmpnleuq %xmm1, %xmm0, %k0			; AVX512-NEXT: vpcmpnleuq %xmm1, %xmm0, %k0
	; AVX512-NEXT: kmovd %k0, %eax			; AVX512-NEXT: kmovd %k0, %eax
	; AVX512-NEXT: testb %al, %al			; AVX512-NEXT: testb %al, %al
	; AVX512-NEXT: setne %al			; AVX512-NEXT: setne %al
	; AVX512-NEXT: retq			; AVX512-NEXT: retq
	▲ Show 20 Lines • Show All 323 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vector-fshl-128.ll

	Show First 20 Lines • Show All 78 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: vpshufd {{.*#+}} xmm2 = xmm2[2,3,2,3]			; AVX1-NEXT: vpshufd {{.*#+}} xmm2 = xmm2[2,3,2,3]
	; AVX1-NEXT: vpsllq %xmm2, %xmm0, %xmm0			; AVX1-NEXT: vpsllq %xmm2, %xmm0, %xmm0
	; AVX1-NEXT: vpblendw {{.*#+}} xmm0 = xmm3[0,1,2,3],xmm0[4,5,6,7]			; AVX1-NEXT: vpblendw {{.*#+}} xmm0 = xmm3[0,1,2,3],xmm0[4,5,6,7]
	; AVX1-NEXT: vpor %xmm1, %xmm0, %xmm0			; AVX1-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: var_funnnel_v2i64:			; AVX2-LABEL: var_funnnel_v2i64:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [63,63]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm3 = [63,63]
	; AVX2-NEXT: vpandn %xmm3, %xmm2, %xmm4			; AVX2-NEXT: vpandn %xmm3, %xmm2, %xmm4
	; AVX2-NEXT: vpsrlq $1, %xmm1, %xmm1			; AVX2-NEXT: vpsrlq $1, %xmm1, %xmm1
	; AVX2-NEXT: vpsrlvq %xmm4, %xmm1, %xmm1			; AVX2-NEXT: vpsrlvq %xmm4, %xmm1, %xmm1
	; AVX2-NEXT: vpand %xmm3, %xmm2, %xmm2			; AVX2-NEXT: vpand %xmm3, %xmm2, %xmm2
	; AVX2-NEXT: vpsllvq %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpsllvq %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	▲ Show 20 Lines • Show All 66 Lines • ▼ Show 20 Lines
	; XOPAVX1-NEXT: vpsubq %xmm2, %xmm3, %xmm2			; XOPAVX1-NEXT: vpsubq %xmm2, %xmm3, %xmm2
	; XOPAVX1-NEXT: vpsrlq $1, %xmm1, %xmm1			; XOPAVX1-NEXT: vpsrlq $1, %xmm1, %xmm1
	; XOPAVX1-NEXT: vpshlq %xmm2, %xmm1, %xmm1			; XOPAVX1-NEXT: vpshlq %xmm2, %xmm1, %xmm1
	; XOPAVX1-NEXT: vpor %xmm1, %xmm0, %xmm0			; XOPAVX1-NEXT: vpor %xmm1, %xmm0, %xmm0
	; XOPAVX1-NEXT: retq			; XOPAVX1-NEXT: retq
	;			;
	; XOPAVX2-LABEL: var_funnnel_v2i64:			; XOPAVX2-LABEL: var_funnnel_v2i64:
	; XOPAVX2: # %bb.0:			; XOPAVX2: # %bb.0:
	; XOPAVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [63,63]			; XOPAVX2-NEXT: vpbroadcastq {{.*#+}} xmm3 = [63,63]
	; XOPAVX2-NEXT: vpandn %xmm3, %xmm2, %xmm4			; XOPAVX2-NEXT: vpandn %xmm3, %xmm2, %xmm4
	; XOPAVX2-NEXT: vpsrlq $1, %xmm1, %xmm1			; XOPAVX2-NEXT: vpsrlq $1, %xmm1, %xmm1
	; XOPAVX2-NEXT: vpsrlvq %xmm4, %xmm1, %xmm1			; XOPAVX2-NEXT: vpsrlvq %xmm4, %xmm1, %xmm1
	; XOPAVX2-NEXT: vpand %xmm3, %xmm2, %xmm2			; XOPAVX2-NEXT: vpand %xmm3, %xmm2, %xmm2
	; XOPAVX2-NEXT: vpsllvq %xmm2, %xmm0, %xmm0			; XOPAVX2-NEXT: vpsllvq %xmm2, %xmm0, %xmm0
	; XOPAVX2-NEXT: vpor %xmm1, %xmm0, %xmm0			; XOPAVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; XOPAVX2-NEXT: retq			; XOPAVX2-NEXT: retq
	;			;
	▲ Show 20 Lines • Show All 768 Lines • ▼ Show 20 Lines
	; SSE-NEXT: pandn %xmm3, %xmm4			; SSE-NEXT: pandn %xmm3, %xmm4
	; SSE-NEXT: psrlq $1, %xmm1			; SSE-NEXT: psrlq $1, %xmm1
	; SSE-NEXT: psrlq %xmm4, %xmm1			; SSE-NEXT: psrlq %xmm4, %xmm1
	; SSE-NEXT: pand %xmm3, %xmm2			; SSE-NEXT: pand %xmm3, %xmm2
	; SSE-NEXT: psllq %xmm2, %xmm0			; SSE-NEXT: psllq %xmm2, %xmm0
	; SSE-NEXT: por %xmm1, %xmm0			; SSE-NEXT: por %xmm1, %xmm0
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX-LABEL: splatvar_funnnel_v2i64:			; AVX1-LABEL: splatvar_funnnel_v2i64:
	; AVX: # %bb.0:			; AVX1: # %bb.0:
	; AVX-NEXT: vmovdqa {{.*#+}} xmm3 = [63,63]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm3 = [63,63]
	; AVX-NEXT: vpandn %xmm3, %xmm2, %xmm4			; AVX1-NEXT: vpandn %xmm3, %xmm2, %xmm4
	; AVX-NEXT: vpsrlq $1, %xmm1, %xmm1			; AVX1-NEXT: vpsrlq $1, %xmm1, %xmm1
	; AVX-NEXT: vpsrlq %xmm4, %xmm1, %xmm1			; AVX1-NEXT: vpsrlq %xmm4, %xmm1, %xmm1
	; AVX-NEXT: vpand %xmm3, %xmm2, %xmm2			; AVX1-NEXT: vpand %xmm3, %xmm2, %xmm2
	; AVX-NEXT: vpsllq %xmm2, %xmm0, %xmm0			; AVX1-NEXT: vpsllq %xmm2, %xmm0, %xmm0
	; AVX-NEXT: vpor %xmm1, %xmm0, %xmm0			; AVX1-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX-NEXT: retq			; AVX1-NEXT: retq
				;
				; AVX2-LABEL: splatvar_funnnel_v2i64:
				; AVX2: # %bb.0:
				; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm3 = [63,63]
				; AVX2-NEXT: vpandn %xmm3, %xmm2, %xmm4
				; AVX2-NEXT: vpsrlq $1, %xmm1, %xmm1
				; AVX2-NEXT: vpsrlq %xmm4, %xmm1, %xmm1
				; AVX2-NEXT: vpand %xmm3, %xmm2, %xmm2
				; AVX2-NEXT: vpsllq %xmm2, %xmm0, %xmm0
				; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
				; AVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: splatvar_funnnel_v2i64:			; AVX512F-LABEL: splatvar_funnnel_v2i64:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	; AVX512F-NEXT: vmovdqa {{.*#+}} xmm3 = [63,63]			; AVX512F-NEXT: vmovdqa {{.*#+}} xmm3 = [63,63]
	; AVX512F-NEXT: vpandn %xmm3, %xmm2, %xmm4			; AVX512F-NEXT: vpandn %xmm3, %xmm2, %xmm4
	; AVX512F-NEXT: vpsrlq $1, %xmm1, %xmm1			; AVX512F-NEXT: vpsrlq $1, %xmm1, %xmm1
	; AVX512F-NEXT: vpsrlq %xmm4, %xmm1, %xmm1			; AVX512F-NEXT: vpsrlq %xmm4, %xmm1, %xmm1
	; AVX512F-NEXT: vpand %xmm3, %xmm2, %xmm2			; AVX512F-NEXT: vpand %xmm3, %xmm2, %xmm2
	▲ Show 20 Lines • Show All 45 Lines • ▼ Show 20 Lines
	; AVX512VLBW-NEXT: retq			; AVX512VLBW-NEXT: retq
	;			;
	; AVX512VLVBMI2-LABEL: splatvar_funnnel_v2i64:			; AVX512VLVBMI2-LABEL: splatvar_funnnel_v2i64:
	; AVX512VLVBMI2: # %bb.0:			; AVX512VLVBMI2: # %bb.0:
	; AVX512VLVBMI2-NEXT: vpbroadcastq %xmm2, %xmm2			; AVX512VLVBMI2-NEXT: vpbroadcastq %xmm2, %xmm2
	; AVX512VLVBMI2-NEXT: vpshldvq %xmm2, %xmm1, %xmm0			; AVX512VLVBMI2-NEXT: vpshldvq %xmm2, %xmm1, %xmm0
	; AVX512VLVBMI2-NEXT: retq			; AVX512VLVBMI2-NEXT: retq
	;			;
	; XOP-LABEL: splatvar_funnnel_v2i64:			; XOPAVX1-LABEL: splatvar_funnnel_v2i64:
	; XOP: # %bb.0:			; XOPAVX1: # %bb.0:
	; XOP-NEXT: vmovdqa {{.*#+}} xmm3 = [63,63]			; XOPAVX1-NEXT: vmovdqa {{.*#+}} xmm3 = [63,63]
	; XOP-NEXT: vpandn %xmm3, %xmm2, %xmm4			; XOPAVX1-NEXT: vpandn %xmm3, %xmm2, %xmm4
	; XOP-NEXT: vpsrlq $1, %xmm1, %xmm1			; XOPAVX1-NEXT: vpsrlq $1, %xmm1, %xmm1
	; XOP-NEXT: vpsrlq %xmm4, %xmm1, %xmm1			; XOPAVX1-NEXT: vpsrlq %xmm4, %xmm1, %xmm1
	; XOP-NEXT: vpand %xmm3, %xmm2, %xmm2			; XOPAVX1-NEXT: vpand %xmm3, %xmm2, %xmm2
	; XOP-NEXT: vpsllq %xmm2, %xmm0, %xmm0			; XOPAVX1-NEXT: vpsllq %xmm2, %xmm0, %xmm0
	; XOP-NEXT: vpor %xmm1, %xmm0, %xmm0			; XOPAVX1-NEXT: vpor %xmm1, %xmm0, %xmm0
	; XOP-NEXT: retq			; XOPAVX1-NEXT: retq
				;
				; XOPAVX2-LABEL: splatvar_funnnel_v2i64:
				; XOPAVX2: # %bb.0:
				; XOPAVX2-NEXT: vpbroadcastq {{.*#+}} xmm3 = [63,63]
				; XOPAVX2-NEXT: vpandn %xmm3, %xmm2, %xmm4
				; XOPAVX2-NEXT: vpsrlq $1, %xmm1, %xmm1
				; XOPAVX2-NEXT: vpsrlq %xmm4, %xmm1, %xmm1
				; XOPAVX2-NEXT: vpand %xmm3, %xmm2, %xmm2
				; XOPAVX2-NEXT: vpsllq %xmm2, %xmm0, %xmm0
				; XOPAVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
				; XOPAVX2-NEXT: retq
	;			;
	; X86-SSE2-LABEL: splatvar_funnnel_v2i64:			; X86-SSE2-LABEL: splatvar_funnnel_v2i64:
	; X86-SSE2: # %bb.0:			; X86-SSE2: # %bb.0:
	; X86-SSE2-NEXT: movdqa {{.*#+}} xmm3 = [63,0,63,0]			; X86-SSE2-NEXT: movdqa {{.*#+}} xmm3 = [63,0,63,0]
	; X86-SSE2-NEXT: movdqa %xmm2, %xmm4			; X86-SSE2-NEXT: movdqa %xmm2, %xmm4
	; X86-SSE2-NEXT: pandn %xmm3, %xmm4			; X86-SSE2-NEXT: pandn %xmm3, %xmm4
	; X86-SSE2-NEXT: psrlq $1, %xmm1			; X86-SSE2-NEXT: psrlq $1, %xmm1
	; X86-SSE2-NEXT: psrlq %xmm4, %xmm1			; X86-SSE2-NEXT: psrlq %xmm4, %xmm1
	▲ Show 20 Lines • Show All 1,377 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vector-fshl-256.ll

	Show First 20 Lines • Show All 755 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: vpsllq %xmm2, %xmm3, %xmm3			; AVX1-NEXT: vpsllq %xmm2, %xmm3, %xmm3
	; AVX1-NEXT: vpsllq %xmm2, %xmm0, %xmm0			; AVX1-NEXT: vpsllq %xmm2, %xmm0, %xmm0
	; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm0, %ymm0			; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm0, %ymm0
	; AVX1-NEXT: vorps %ymm1, %ymm0, %ymm0			; AVX1-NEXT: vorps %ymm1, %ymm0, %ymm0
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: splatvar_funnnel_v4i64:			; AVX2-LABEL: splatvar_funnnel_v4i64:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [63,63]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm3 = [63,63]
	; AVX2-NEXT: vpandn %xmm3, %xmm2, %xmm4			; AVX2-NEXT: vpandn %xmm3, %xmm2, %xmm4
	; AVX2-NEXT: vpsrlq $1, %ymm1, %ymm1			; AVX2-NEXT: vpsrlq $1, %ymm1, %ymm1
	; AVX2-NEXT: vpsrlq %xmm4, %ymm1, %ymm1			; AVX2-NEXT: vpsrlq %xmm4, %ymm1, %ymm1
	; AVX2-NEXT: vpand %xmm3, %xmm2, %xmm2			; AVX2-NEXT: vpand %xmm3, %xmm2, %xmm2
	; AVX2-NEXT: vpsllq %xmm2, %ymm0, %ymm0			; AVX2-NEXT: vpsllq %xmm2, %ymm0, %ymm0
	; AVX2-NEXT: vpor %ymm1, %ymm0, %ymm0			; AVX2-NEXT: vpor %ymm1, %ymm0, %ymm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	▲ Show 20 Lines • Show All 71 Lines • ▼ Show 20 Lines
	; XOPAVX1-NEXT: vpsllq %xmm2, %xmm3, %xmm3			; XOPAVX1-NEXT: vpsllq %xmm2, %xmm3, %xmm3
	; XOPAVX1-NEXT: vpsllq %xmm2, %xmm0, %xmm0			; XOPAVX1-NEXT: vpsllq %xmm2, %xmm0, %xmm0
	; XOPAVX1-NEXT: vinsertf128 $1, %xmm3, %ymm0, %ymm0			; XOPAVX1-NEXT: vinsertf128 $1, %xmm3, %ymm0, %ymm0
	; XOPAVX1-NEXT: vorps %ymm1, %ymm0, %ymm0			; XOPAVX1-NEXT: vorps %ymm1, %ymm0, %ymm0
	; XOPAVX1-NEXT: retq			; XOPAVX1-NEXT: retq
	;			;
	; XOPAVX2-LABEL: splatvar_funnnel_v4i64:			; XOPAVX2-LABEL: splatvar_funnnel_v4i64:
	; XOPAVX2: # %bb.0:			; XOPAVX2: # %bb.0:
	; XOPAVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [63,63]			; XOPAVX2-NEXT: vpbroadcastq {{.*#+}} xmm3 = [63,63]
	; XOPAVX2-NEXT: vpandn %xmm3, %xmm2, %xmm4			; XOPAVX2-NEXT: vpandn %xmm3, %xmm2, %xmm4
	; XOPAVX2-NEXT: vpsrlq $1, %ymm1, %ymm1			; XOPAVX2-NEXT: vpsrlq $1, %ymm1, %ymm1
	; XOPAVX2-NEXT: vpsrlq %xmm4, %ymm1, %ymm1			; XOPAVX2-NEXT: vpsrlq %xmm4, %ymm1, %ymm1
	; XOPAVX2-NEXT: vpand %xmm3, %xmm2, %xmm2			; XOPAVX2-NEXT: vpand %xmm3, %xmm2, %xmm2
	; XOPAVX2-NEXT: vpsllq %xmm2, %ymm0, %ymm0			; XOPAVX2-NEXT: vpsllq %xmm2, %ymm0, %ymm0
	; XOPAVX2-NEXT: vpor %ymm1, %ymm0, %ymm0			; XOPAVX2-NEXT: vpor %ymm1, %ymm0, %ymm0
	; XOPAVX2-NEXT: retq			; XOPAVX2-NEXT: retq
	%splat = shufflevector <4 x i64> %amt, <4 x i64> undef, <4 x i32> zeroinitializer			%splat = shufflevector <4 x i64> %amt, <4 x i64> undef, <4 x i32> zeroinitializer
	▲ Show 20 Lines • Show All 1,482 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vector-fshl-rot-128.ll

	Show First 20 Lines • Show All 81 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: vpshufd {{.*#+}} xmm1 = xmm1[2,3,2,3]			; AVX1-NEXT: vpshufd {{.*#+}} xmm1 = xmm1[2,3,2,3]
	; AVX1-NEXT: vpsrlq %xmm1, %xmm0, %xmm0			; AVX1-NEXT: vpsrlq %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vpblendw {{.*#+}} xmm0 = xmm2[0,1,2,3],xmm0[4,5,6,7]			; AVX1-NEXT: vpblendw {{.*#+}} xmm0 = xmm2[0,1,2,3],xmm0[4,5,6,7]
	; AVX1-NEXT: vpor %xmm0, %xmm3, %xmm0			; AVX1-NEXT: vpor %xmm0, %xmm3, %xmm0
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: var_funnnel_v2i64:			; AVX2-LABEL: var_funnnel_v2i64:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm2 = [63,63]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm2 = [63,63]
	; AVX2-NEXT: vpand %xmm2, %xmm1, %xmm3			; AVX2-NEXT: vpand %xmm2, %xmm1, %xmm3
	; AVX2-NEXT: vpsllvq %xmm3, %xmm0, %xmm3			; AVX2-NEXT: vpsllvq %xmm3, %xmm0, %xmm3
	; AVX2-NEXT: vpxor %xmm4, %xmm4, %xmm4			; AVX2-NEXT: vpxor %xmm4, %xmm4, %xmm4
	; AVX2-NEXT: vpsubq %xmm1, %xmm4, %xmm1			; AVX2-NEXT: vpsubq %xmm1, %xmm4, %xmm1
	; AVX2-NEXT: vpand %xmm2, %xmm1, %xmm1			; AVX2-NEXT: vpand %xmm2, %xmm1, %xmm1
	; AVX2-NEXT: vpsrlvq %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsrlvq %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpor %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpor %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	▲ Show 20 Lines • Show All 627 Lines • ▼ Show 20 Lines
	; SSE-NEXT: pand %xmm2, %xmm1			; SSE-NEXT: pand %xmm2, %xmm1
	; SSE-NEXT: movdqa %xmm0, %xmm4			; SSE-NEXT: movdqa %xmm0, %xmm4
	; SSE-NEXT: psllq %xmm1, %xmm4			; SSE-NEXT: psllq %xmm1, %xmm4
	; SSE-NEXT: pand %xmm2, %xmm3			; SSE-NEXT: pand %xmm2, %xmm3
	; SSE-NEXT: psrlq %xmm3, %xmm0			; SSE-NEXT: psrlq %xmm3, %xmm0
	; SSE-NEXT: por %xmm4, %xmm0			; SSE-NEXT: por %xmm4, %xmm0
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX-LABEL: splatvar_funnnel_v2i64:			; AVX1-LABEL: splatvar_funnnel_v2i64:
	; AVX: # %bb.0:			; AVX1: # %bb.0:
	; AVX-NEXT: vmovdqa {{.*#+}} xmm2 = [63,63]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm2 = [63,63]
	; AVX-NEXT: vpand %xmm2, %xmm1, %xmm3			; AVX1-NEXT: vpand %xmm2, %xmm1, %xmm3
	; AVX-NEXT: vpsllq %xmm3, %xmm0, %xmm3			; AVX1-NEXT: vpsllq %xmm3, %xmm0, %xmm3
	; AVX-NEXT: vpxor %xmm4, %xmm4, %xmm4			; AVX1-NEXT: vpxor %xmm4, %xmm4, %xmm4
	; AVX-NEXT: vpsubq %xmm1, %xmm4, %xmm1			; AVX1-NEXT: vpsubq %xmm1, %xmm4, %xmm1
	; AVX-NEXT: vpand %xmm2, %xmm1, %xmm1			; AVX1-NEXT: vpand %xmm2, %xmm1, %xmm1
	; AVX-NEXT: vpsrlq %xmm1, %xmm0, %xmm0			; AVX1-NEXT: vpsrlq %xmm1, %xmm0, %xmm0
	; AVX-NEXT: vpor %xmm0, %xmm3, %xmm0			; AVX1-NEXT: vpor %xmm0, %xmm3, %xmm0
	; AVX-NEXT: retq			; AVX1-NEXT: retq
				;
				; AVX2-LABEL: splatvar_funnnel_v2i64:
				; AVX2: # %bb.0:
				; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm2 = [63,63]
				; AVX2-NEXT: vpand %xmm2, %xmm1, %xmm3
				; AVX2-NEXT: vpsllq %xmm3, %xmm0, %xmm3
				; AVX2-NEXT: vpxor %xmm4, %xmm4, %xmm4
				; AVX2-NEXT: vpsubq %xmm1, %xmm4, %xmm1
				; AVX2-NEXT: vpand %xmm2, %xmm1, %xmm1
				; AVX2-NEXT: vpsrlq %xmm1, %xmm0, %xmm0
				; AVX2-NEXT: vpor %xmm0, %xmm3, %xmm0
				; AVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: splatvar_funnnel_v2i64:			; AVX512F-LABEL: splatvar_funnnel_v2i64:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512F-NEXT: vpbroadcastq %xmm1, %xmm1			; AVX512F-NEXT: vpbroadcastq %xmm1, %xmm1
	; AVX512F-NEXT: vprolvq %zmm1, %zmm0, %zmm0			; AVX512F-NEXT: vprolvq %zmm1, %zmm0, %zmm0
	; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 killed $zmm0			; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 killed $zmm0
	; AVX512F-NEXT: vzeroupper			; AVX512F-NEXT: vzeroupper
	▲ Show 20 Lines • Show All 1,136 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vector-fshl-rot-256.ll

	Show First 20 Lines • Show All 581 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: vpsllq %xmm1, %xmm4, %xmm3			; AVX1-NEXT: vpsllq %xmm1, %xmm4, %xmm3
	; AVX1-NEXT: vpsllq %xmm1, %xmm0, %xmm0			; AVX1-NEXT: vpsllq %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm0, %ymm0			; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm0, %ymm0
	; AVX1-NEXT: vorps %ymm2, %ymm0, %ymm0			; AVX1-NEXT: vorps %ymm2, %ymm0, %ymm0
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: splatvar_funnnel_v4i64:			; AVX2-LABEL: splatvar_funnnel_v4i64:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm2 = [63,63]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm2 = [63,63]
	; AVX2-NEXT: vpand %xmm2, %xmm1, %xmm3			; AVX2-NEXT: vpand %xmm2, %xmm1, %xmm3
	; AVX2-NEXT: vpsllq %xmm3, %ymm0, %ymm3			; AVX2-NEXT: vpsllq %xmm3, %ymm0, %ymm3
	; AVX2-NEXT: vpxor %xmm4, %xmm4, %xmm4			; AVX2-NEXT: vpxor %xmm4, %xmm4, %xmm4
	; AVX2-NEXT: vpsubq %xmm1, %xmm4, %xmm1			; AVX2-NEXT: vpsubq %xmm1, %xmm4, %xmm1
	; AVX2-NEXT: vpand %xmm2, %xmm1, %xmm1			; AVX2-NEXT: vpand %xmm2, %xmm1, %xmm1
	; AVX2-NEXT: vpsrlq %xmm1, %ymm0, %ymm0			; AVX2-NEXT: vpsrlq %xmm1, %ymm0, %ymm0
	; AVX2-NEXT: vpor %ymm0, %ymm3, %ymm0			; AVX2-NEXT: vpor %ymm0, %ymm3, %ymm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	▲ Show 20 Lines • Show All 1,098 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vector-fshr-128.ll

	Show First 20 Lines • Show All 78 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: vpshufd {{.*#+}} xmm2 = xmm2[2,3,2,3]			; AVX1-NEXT: vpshufd {{.*#+}} xmm2 = xmm2[2,3,2,3]
	; AVX1-NEXT: vpsllq %xmm2, %xmm0, %xmm0			; AVX1-NEXT: vpsllq %xmm2, %xmm0, %xmm0
	; AVX1-NEXT: vpblendw {{.*#+}} xmm0 = xmm3[0,1,2,3],xmm0[4,5,6,7]			; AVX1-NEXT: vpblendw {{.*#+}} xmm0 = xmm3[0,1,2,3],xmm0[4,5,6,7]
	; AVX1-NEXT: vpor %xmm1, %xmm0, %xmm0			; AVX1-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: var_funnnel_v2i64:			; AVX2-LABEL: var_funnnel_v2i64:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [63,63]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm3 = [63,63]
	; AVX2-NEXT: vpand %xmm3, %xmm2, %xmm4			; AVX2-NEXT: vpand %xmm3, %xmm2, %xmm4
	; AVX2-NEXT: vpsrlvq %xmm4, %xmm1, %xmm1			; AVX2-NEXT: vpsrlvq %xmm4, %xmm1, %xmm1
	; AVX2-NEXT: vpandn %xmm3, %xmm2, %xmm2			; AVX2-NEXT: vpandn %xmm3, %xmm2, %xmm2
	; AVX2-NEXT: vpsllq $1, %xmm0, %xmm0			; AVX2-NEXT: vpsllq $1, %xmm0, %xmm0
	; AVX2-NEXT: vpsllvq %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpsllvq %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	▲ Show 20 Lines • Show All 67 Lines • ▼ Show 20 Lines
	; XOPAVX1-NEXT: vpxor %xmm3, %xmm3, %xmm3			; XOPAVX1-NEXT: vpxor %xmm3, %xmm3, %xmm3
	; XOPAVX1-NEXT: vpsubq %xmm2, %xmm3, %xmm2			; XOPAVX1-NEXT: vpsubq %xmm2, %xmm3, %xmm2
	; XOPAVX1-NEXT: vpshlq %xmm2, %xmm1, %xmm1			; XOPAVX1-NEXT: vpshlq %xmm2, %xmm1, %xmm1
	; XOPAVX1-NEXT: vpor %xmm1, %xmm0, %xmm0			; XOPAVX1-NEXT: vpor %xmm1, %xmm0, %xmm0
	; XOPAVX1-NEXT: retq			; XOPAVX1-NEXT: retq
	;			;
	; XOPAVX2-LABEL: var_funnnel_v2i64:			; XOPAVX2-LABEL: var_funnnel_v2i64:
	; XOPAVX2: # %bb.0:			; XOPAVX2: # %bb.0:
	; XOPAVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [63,63]			; XOPAVX2-NEXT: vpbroadcastq {{.*#+}} xmm3 = [63,63]
	; XOPAVX2-NEXT: vpand %xmm3, %xmm2, %xmm4			; XOPAVX2-NEXT: vpand %xmm3, %xmm2, %xmm4
	; XOPAVX2-NEXT: vpsrlvq %xmm4, %xmm1, %xmm1			; XOPAVX2-NEXT: vpsrlvq %xmm4, %xmm1, %xmm1
	; XOPAVX2-NEXT: vpandn %xmm3, %xmm2, %xmm2			; XOPAVX2-NEXT: vpandn %xmm3, %xmm2, %xmm2
	; XOPAVX2-NEXT: vpsllq $1, %xmm0, %xmm0			; XOPAVX2-NEXT: vpsllq $1, %xmm0, %xmm0
	; XOPAVX2-NEXT: vpsllvq %xmm2, %xmm0, %xmm0			; XOPAVX2-NEXT: vpsllvq %xmm2, %xmm0, %xmm0
	; XOPAVX2-NEXT: vpor %xmm1, %xmm0, %xmm0			; XOPAVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; XOPAVX2-NEXT: retq			; XOPAVX2-NEXT: retq
	;			;
	▲ Show 20 Lines • Show All 856 Lines • ▼ Show 20 Lines
	; SSE-NEXT: pand %xmm3, %xmm4			; SSE-NEXT: pand %xmm3, %xmm4
	; SSE-NEXT: psrlq %xmm4, %xmm1			; SSE-NEXT: psrlq %xmm4, %xmm1
	; SSE-NEXT: pandn %xmm3, %xmm2			; SSE-NEXT: pandn %xmm3, %xmm2
	; SSE-NEXT: psllq $1, %xmm0			; SSE-NEXT: psllq $1, %xmm0
	; SSE-NEXT: psllq %xmm2, %xmm0			; SSE-NEXT: psllq %xmm2, %xmm0
	; SSE-NEXT: por %xmm1, %xmm0			; SSE-NEXT: por %xmm1, %xmm0
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX-LABEL: splatvar_funnnel_v2i64:			; AVX1-LABEL: splatvar_funnnel_v2i64:
	; AVX: # %bb.0:			; AVX1: # %bb.0:
	; AVX-NEXT: vmovdqa {{.*#+}} xmm3 = [63,63]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm3 = [63,63]
	; AVX-NEXT: vpand %xmm3, %xmm2, %xmm4			; AVX1-NEXT: vpand %xmm3, %xmm2, %xmm4
	; AVX-NEXT: vpsrlq %xmm4, %xmm1, %xmm1			; AVX1-NEXT: vpsrlq %xmm4, %xmm1, %xmm1
	; AVX-NEXT: vpandn %xmm3, %xmm2, %xmm2			; AVX1-NEXT: vpandn %xmm3, %xmm2, %xmm2
	; AVX-NEXT: vpsllq $1, %xmm0, %xmm0			; AVX1-NEXT: vpsllq $1, %xmm0, %xmm0
	; AVX-NEXT: vpsllq %xmm2, %xmm0, %xmm0			; AVX1-NEXT: vpsllq %xmm2, %xmm0, %xmm0
	; AVX-NEXT: vpor %xmm1, %xmm0, %xmm0			; AVX1-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX-NEXT: retq			; AVX1-NEXT: retq
				;
				; AVX2-LABEL: splatvar_funnnel_v2i64:
				; AVX2: # %bb.0:
				; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm3 = [63,63]
				; AVX2-NEXT: vpand %xmm3, %xmm2, %xmm4
				; AVX2-NEXT: vpsrlq %xmm4, %xmm1, %xmm1
				; AVX2-NEXT: vpandn %xmm3, %xmm2, %xmm2
				; AVX2-NEXT: vpsllq $1, %xmm0, %xmm0
				; AVX2-NEXT: vpsllq %xmm2, %xmm0, %xmm0
				; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
				; AVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: splatvar_funnnel_v2i64:			; AVX512F-LABEL: splatvar_funnnel_v2i64:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	; AVX512F-NEXT: vmovdqa {{.*#+}} xmm3 = [63,63]			; AVX512F-NEXT: vmovdqa {{.*#+}} xmm3 = [63,63]
	; AVX512F-NEXT: vpand %xmm3, %xmm2, %xmm4			; AVX512F-NEXT: vpand %xmm3, %xmm2, %xmm4
	; AVX512F-NEXT: vpsrlq %xmm4, %xmm1, %xmm1			; AVX512F-NEXT: vpsrlq %xmm4, %xmm1, %xmm1
	; AVX512F-NEXT: vpandn %xmm3, %xmm2, %xmm2			; AVX512F-NEXT: vpandn %xmm3, %xmm2, %xmm2
	; AVX512F-NEXT: vpsllq $1, %xmm0, %xmm0			; AVX512F-NEXT: vpsllq $1, %xmm0, %xmm0
	▲ Show 20 Lines • Show All 46 Lines • ▼ Show 20 Lines
	;			;
	; AVX512VLVBMI2-LABEL: splatvar_funnnel_v2i64:			; AVX512VLVBMI2-LABEL: splatvar_funnnel_v2i64:
	; AVX512VLVBMI2: # %bb.0:			; AVX512VLVBMI2: # %bb.0:
	; AVX512VLVBMI2-NEXT: vpbroadcastq %xmm2, %xmm2			; AVX512VLVBMI2-NEXT: vpbroadcastq %xmm2, %xmm2
	; AVX512VLVBMI2-NEXT: vpshrdvq %xmm2, %xmm0, %xmm1			; AVX512VLVBMI2-NEXT: vpshrdvq %xmm2, %xmm0, %xmm1
	; AVX512VLVBMI2-NEXT: vmovdqa %xmm1, %xmm0			; AVX512VLVBMI2-NEXT: vmovdqa %xmm1, %xmm0
	; AVX512VLVBMI2-NEXT: retq			; AVX512VLVBMI2-NEXT: retq
	;			;
	; XOP-LABEL: splatvar_funnnel_v2i64:			; XOPAVX1-LABEL: splatvar_funnnel_v2i64:
	; XOP: # %bb.0:			; XOPAVX1: # %bb.0:
	; XOP-NEXT: vmovdqa {{.*#+}} xmm3 = [63,63]			; XOPAVX1-NEXT: vmovdqa {{.*#+}} xmm3 = [63,63]
	; XOP-NEXT: vpand %xmm3, %xmm2, %xmm4			; XOPAVX1-NEXT: vpand %xmm3, %xmm2, %xmm4
	; XOP-NEXT: vpsrlq %xmm4, %xmm1, %xmm1			; XOPAVX1-NEXT: vpsrlq %xmm4, %xmm1, %xmm1
	; XOP-NEXT: vpandn %xmm3, %xmm2, %xmm2			; XOPAVX1-NEXT: vpandn %xmm3, %xmm2, %xmm2
	; XOP-NEXT: vpsllq $1, %xmm0, %xmm0			; XOPAVX1-NEXT: vpsllq $1, %xmm0, %xmm0
	; XOP-NEXT: vpsllq %xmm2, %xmm0, %xmm0			; XOPAVX1-NEXT: vpsllq %xmm2, %xmm0, %xmm0
	; XOP-NEXT: vpor %xmm1, %xmm0, %xmm0			; XOPAVX1-NEXT: vpor %xmm1, %xmm0, %xmm0
	; XOP-NEXT: retq			; XOPAVX1-NEXT: retq
				;
				; XOPAVX2-LABEL: splatvar_funnnel_v2i64:
				; XOPAVX2: # %bb.0:
				; XOPAVX2-NEXT: vpbroadcastq {{.*#+}} xmm3 = [63,63]
				; XOPAVX2-NEXT: vpand %xmm3, %xmm2, %xmm4
				; XOPAVX2-NEXT: vpsrlq %xmm4, %xmm1, %xmm1
				; XOPAVX2-NEXT: vpandn %xmm3, %xmm2, %xmm2
				; XOPAVX2-NEXT: vpsllq $1, %xmm0, %xmm0
				; XOPAVX2-NEXT: vpsllq %xmm2, %xmm0, %xmm0
				; XOPAVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
				; XOPAVX2-NEXT: retq
	;			;
	; X86-SSE2-LABEL: splatvar_funnnel_v2i64:			; X86-SSE2-LABEL: splatvar_funnnel_v2i64:
	; X86-SSE2: # %bb.0:			; X86-SSE2: # %bb.0:
	; X86-SSE2-NEXT: movdqa {{.*#+}} xmm3 = [63,0,63,0]			; X86-SSE2-NEXT: movdqa {{.*#+}} xmm3 = [63,0,63,0]
	; X86-SSE2-NEXT: movdqa %xmm2, %xmm4			; X86-SSE2-NEXT: movdqa %xmm2, %xmm4
	; X86-SSE2-NEXT: pand %xmm3, %xmm4			; X86-SSE2-NEXT: pand %xmm3, %xmm4
	; X86-SSE2-NEXT: psrlq %xmm4, %xmm1			; X86-SSE2-NEXT: psrlq %xmm4, %xmm1
	; X86-SSE2-NEXT: pandn %xmm3, %xmm2			; X86-SSE2-NEXT: pandn %xmm3, %xmm2
	▲ Show 20 Lines • Show All 1,239 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vector-fshr-256.ll

	Show First 20 Lines • Show All 786 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: vpsllq $1, %xmm0, %xmm0			; AVX1-NEXT: vpsllq $1, %xmm0, %xmm0
	; AVX1-NEXT: vpsllq %xmm2, %xmm0, %xmm0			; AVX1-NEXT: vpsllq %xmm2, %xmm0, %xmm0
	; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm0, %ymm0			; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm0, %ymm0
	; AVX1-NEXT: vorps %ymm1, %ymm0, %ymm0			; AVX1-NEXT: vorps %ymm1, %ymm0, %ymm0
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: splatvar_funnnel_v4i64:			; AVX2-LABEL: splatvar_funnnel_v4i64:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [63,63]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm3 = [63,63]
	; AVX2-NEXT: vpand %xmm3, %xmm2, %xmm4			; AVX2-NEXT: vpand %xmm3, %xmm2, %xmm4
	; AVX2-NEXT: vpsrlq %xmm4, %ymm1, %ymm1			; AVX2-NEXT: vpsrlq %xmm4, %ymm1, %ymm1
	; AVX2-NEXT: vpandn %xmm3, %xmm2, %xmm2			; AVX2-NEXT: vpandn %xmm3, %xmm2, %xmm2
	; AVX2-NEXT: vpsllq $1, %ymm0, %ymm0			; AVX2-NEXT: vpsllq $1, %ymm0, %ymm0
	; AVX2-NEXT: vpsllq %xmm2, %ymm0, %ymm0			; AVX2-NEXT: vpsllq %xmm2, %ymm0, %ymm0
	; AVX2-NEXT: vpor %ymm1, %ymm0, %ymm0			; AVX2-NEXT: vpor %ymm1, %ymm0, %ymm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	▲ Show 20 Lines • Show All 72 Lines • ▼ Show 20 Lines
	; XOPAVX1-NEXT: vpsllq $1, %xmm0, %xmm0			; XOPAVX1-NEXT: vpsllq $1, %xmm0, %xmm0
	; XOPAVX1-NEXT: vpsllq %xmm2, %xmm0, %xmm0			; XOPAVX1-NEXT: vpsllq %xmm2, %xmm0, %xmm0
	; XOPAVX1-NEXT: vinsertf128 $1, %xmm3, %ymm0, %ymm0			; XOPAVX1-NEXT: vinsertf128 $1, %xmm3, %ymm0, %ymm0
	; XOPAVX1-NEXT: vorps %ymm1, %ymm0, %ymm0			; XOPAVX1-NEXT: vorps %ymm1, %ymm0, %ymm0
	; XOPAVX1-NEXT: retq			; XOPAVX1-NEXT: retq
	;			;
	; XOPAVX2-LABEL: splatvar_funnnel_v4i64:			; XOPAVX2-LABEL: splatvar_funnnel_v4i64:
	; XOPAVX2: # %bb.0:			; XOPAVX2: # %bb.0:
	; XOPAVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [63,63]			; XOPAVX2-NEXT: vpbroadcastq {{.*#+}} xmm3 = [63,63]
	; XOPAVX2-NEXT: vpand %xmm3, %xmm2, %xmm4			; XOPAVX2-NEXT: vpand %xmm3, %xmm2, %xmm4
	; XOPAVX2-NEXT: vpsrlq %xmm4, %ymm1, %ymm1			; XOPAVX2-NEXT: vpsrlq %xmm4, %ymm1, %ymm1
	; XOPAVX2-NEXT: vpandn %xmm3, %xmm2, %xmm2			; XOPAVX2-NEXT: vpandn %xmm3, %xmm2, %xmm2
	; XOPAVX2-NEXT: vpsllq $1, %ymm0, %ymm0			; XOPAVX2-NEXT: vpsllq $1, %ymm0, %ymm0
	; XOPAVX2-NEXT: vpsllq %xmm2, %ymm0, %ymm0			; XOPAVX2-NEXT: vpsllq %xmm2, %ymm0, %ymm0
	; XOPAVX2-NEXT: vpor %ymm1, %ymm0, %ymm0			; XOPAVX2-NEXT: vpor %ymm1, %ymm0, %ymm0
	; XOPAVX2-NEXT: retq			; XOPAVX2-NEXT: retq
	%splat = shufflevector <4 x i64> %amt, <4 x i64> undef, <4 x i32> zeroinitializer			%splat = shufflevector <4 x i64> %amt, <4 x i64> undef, <4 x i32> zeroinitializer
	▲ Show 20 Lines • Show All 1,251 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vector-fshr-rot-128.ll

	Show First 20 Lines • Show All 81 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: vpshufd {{.*#+}} xmm1 = xmm1[2,3,2,3]			; AVX1-NEXT: vpshufd {{.*#+}} xmm1 = xmm1[2,3,2,3]
	; AVX1-NEXT: vpsllq %xmm1, %xmm0, %xmm0			; AVX1-NEXT: vpsllq %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vpblendw {{.*#+}} xmm0 = xmm2[0,1,2,3],xmm0[4,5,6,7]			; AVX1-NEXT: vpblendw {{.*#+}} xmm0 = xmm2[0,1,2,3],xmm0[4,5,6,7]
	; AVX1-NEXT: vpor %xmm0, %xmm3, %xmm0			; AVX1-NEXT: vpor %xmm0, %xmm3, %xmm0
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: var_funnnel_v2i64:			; AVX2-LABEL: var_funnnel_v2i64:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm2 = [63,63]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm2 = [63,63]
	; AVX2-NEXT: vpand %xmm2, %xmm1, %xmm3			; AVX2-NEXT: vpand %xmm2, %xmm1, %xmm3
	; AVX2-NEXT: vpsrlvq %xmm3, %xmm0, %xmm3			; AVX2-NEXT: vpsrlvq %xmm3, %xmm0, %xmm3
	; AVX2-NEXT: vpxor %xmm4, %xmm4, %xmm4			; AVX2-NEXT: vpxor %xmm4, %xmm4, %xmm4
	; AVX2-NEXT: vpsubq %xmm1, %xmm4, %xmm1			; AVX2-NEXT: vpsubq %xmm1, %xmm4, %xmm1
	; AVX2-NEXT: vpand %xmm2, %xmm1, %xmm1			; AVX2-NEXT: vpand %xmm2, %xmm1, %xmm1
	; AVX2-NEXT: vpsllvq %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsllvq %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpor %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpor %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	▲ Show 20 Lines • Show All 649 Lines • ▼ Show 20 Lines
	; SSE-NEXT: pand %xmm2, %xmm1			; SSE-NEXT: pand %xmm2, %xmm1
	; SSE-NEXT: movdqa %xmm0, %xmm4			; SSE-NEXT: movdqa %xmm0, %xmm4
	; SSE-NEXT: psrlq %xmm1, %xmm4			; SSE-NEXT: psrlq %xmm1, %xmm4
	; SSE-NEXT: pand %xmm2, %xmm3			; SSE-NEXT: pand %xmm2, %xmm3
	; SSE-NEXT: psllq %xmm3, %xmm0			; SSE-NEXT: psllq %xmm3, %xmm0
	; SSE-NEXT: por %xmm4, %xmm0			; SSE-NEXT: por %xmm4, %xmm0
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX-LABEL: splatvar_funnnel_v2i64:			; AVX1-LABEL: splatvar_funnnel_v2i64:
	; AVX: # %bb.0:			; AVX1: # %bb.0:
	; AVX-NEXT: vmovdqa {{.*#+}} xmm2 = [63,63]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm2 = [63,63]
	; AVX-NEXT: vpand %xmm2, %xmm1, %xmm3			; AVX1-NEXT: vpand %xmm2, %xmm1, %xmm3
	; AVX-NEXT: vpsrlq %xmm3, %xmm0, %xmm3			; AVX1-NEXT: vpsrlq %xmm3, %xmm0, %xmm3
	; AVX-NEXT: vpxor %xmm4, %xmm4, %xmm4			; AVX1-NEXT: vpxor %xmm4, %xmm4, %xmm4
	; AVX-NEXT: vpsubq %xmm1, %xmm4, %xmm1			; AVX1-NEXT: vpsubq %xmm1, %xmm4, %xmm1
	; AVX-NEXT: vpand %xmm2, %xmm1, %xmm1			; AVX1-NEXT: vpand %xmm2, %xmm1, %xmm1
	; AVX-NEXT: vpsllq %xmm1, %xmm0, %xmm0			; AVX1-NEXT: vpsllq %xmm1, %xmm0, %xmm0
	; AVX-NEXT: vpor %xmm0, %xmm3, %xmm0			; AVX1-NEXT: vpor %xmm0, %xmm3, %xmm0
	; AVX-NEXT: retq			; AVX1-NEXT: retq
				;
				; AVX2-LABEL: splatvar_funnnel_v2i64:
				; AVX2: # %bb.0:
				; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm2 = [63,63]
				; AVX2-NEXT: vpand %xmm2, %xmm1, %xmm3
				; AVX2-NEXT: vpsrlq %xmm3, %xmm0, %xmm3
				; AVX2-NEXT: vpxor %xmm4, %xmm4, %xmm4
				; AVX2-NEXT: vpsubq %xmm1, %xmm4, %xmm1
				; AVX2-NEXT: vpand %xmm2, %xmm1, %xmm1
				; AVX2-NEXT: vpsllq %xmm1, %xmm0, %xmm0
				; AVX2-NEXT: vpor %xmm0, %xmm3, %xmm0
				; AVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: splatvar_funnnel_v2i64:			; AVX512F-LABEL: splatvar_funnnel_v2i64:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512F-NEXT: vpbroadcastq %xmm1, %xmm1			; AVX512F-NEXT: vpbroadcastq %xmm1, %xmm1
	; AVX512F-NEXT: vprorvq %zmm1, %zmm0, %zmm0			; AVX512F-NEXT: vprorvq %zmm1, %zmm0, %zmm0
	; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 killed $zmm0			; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 killed $zmm0
	; AVX512F-NEXT: vzeroupper			; AVX512F-NEXT: vzeroupper
	▲ Show 20 Lines • Show All 1,160 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vector-fshr-rot-256.ll

	Show First 20 Lines • Show All 607 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: vpsrlq %xmm1, %xmm4, %xmm3			; AVX1-NEXT: vpsrlq %xmm1, %xmm4, %xmm3
	; AVX1-NEXT: vpsrlq %xmm1, %xmm0, %xmm0			; AVX1-NEXT: vpsrlq %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm0, %ymm0			; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm0, %ymm0
	; AVX1-NEXT: vorps %ymm2, %ymm0, %ymm0			; AVX1-NEXT: vorps %ymm2, %ymm0, %ymm0
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: splatvar_funnnel_v4i64:			; AVX2-LABEL: splatvar_funnnel_v4i64:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm2 = [63,63]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm2 = [63,63]
	; AVX2-NEXT: vpand %xmm2, %xmm1, %xmm3			; AVX2-NEXT: vpand %xmm2, %xmm1, %xmm3
	; AVX2-NEXT: vpsrlq %xmm3, %ymm0, %ymm3			; AVX2-NEXT: vpsrlq %xmm3, %ymm0, %ymm3
	; AVX2-NEXT: vpxor %xmm4, %xmm4, %xmm4			; AVX2-NEXT: vpxor %xmm4, %xmm4, %xmm4
	; AVX2-NEXT: vpsubq %xmm1, %xmm4, %xmm1			; AVX2-NEXT: vpsubq %xmm1, %xmm4, %xmm1
	; AVX2-NEXT: vpand %xmm2, %xmm1, %xmm1			; AVX2-NEXT: vpand %xmm2, %xmm1, %xmm1
	; AVX2-NEXT: vpsllq %xmm1, %ymm0, %ymm0			; AVX2-NEXT: vpsllq %xmm1, %ymm0, %ymm0
	; AVX2-NEXT: vpor %ymm0, %ymm3, %ymm0			; AVX2-NEXT: vpor %ymm0, %ymm3, %ymm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	▲ Show 20 Lines • Show All 1,118 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vector-mul.ll

	Show First 20 Lines • Show All 1,484 Lines • ▼ Show 20 Lines
	; X64-XOP-NEXT: vpmuludq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; X64-XOP-NEXT: vpmuludq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; X64-XOP-NEXT: vpaddq %xmm1, %xmm0, %xmm0			; X64-XOP-NEXT: vpaddq %xmm1, %xmm0, %xmm0
	; X64-XOP-NEXT: vpsllq $32, %xmm0, %xmm0			; X64-XOP-NEXT: vpsllq $32, %xmm0, %xmm0
	; X64-XOP-NEXT: vpaddq %xmm0, %xmm2, %xmm0			; X64-XOP-NEXT: vpaddq %xmm0, %xmm2, %xmm0
	; X64-XOP-NEXT: retq			; X64-XOP-NEXT: retq
	;			;
	; X64-AVX2-LABEL: mul_v2i64_neg_15_63:			; X64-AVX2-LABEL: mul_v2i64_neg_15_63:
	; X64-AVX2: # %bb.0:			; X64-AVX2: # %bb.0:
	; X64-AVX2-NEXT: vmovdqa {{.*#+}} xmm1 = [18446744073709551601,18446744073709551553]			; X64-AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [4294967295,4294967295]
	; X64-AVX2-NEXT: vpmuludq %xmm1, %xmm0, %xmm2			; X64-AVX2-NEXT: vpmuludq %xmm1, %xmm0, %xmm1
	; X64-AVX2-NEXT: vpsrlq $32, %xmm0, %xmm3			; X64-AVX2-NEXT: vpsrlq $32, %xmm0, %xmm2
	; X64-AVX2-NEXT: vpmuludq %xmm1, %xmm3, %xmm1			; X64-AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [18446744073709551601,18446744073709551553]
	; X64-AVX2-NEXT: vpmuludq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; X64-AVX2-NEXT: vpmuludq %xmm3, %xmm2, %xmm2
				; X64-AVX2-NEXT: vpaddq %xmm2, %xmm1, %xmm1
				; X64-AVX2-NEXT: vpsllq $32, %xmm1, %xmm1
				; X64-AVX2-NEXT: vpmuludq %xmm3, %xmm0, %xmm0
	; X64-AVX2-NEXT: vpaddq %xmm1, %xmm0, %xmm0			; X64-AVX2-NEXT: vpaddq %xmm1, %xmm0, %xmm0
	; X64-AVX2-NEXT: vpsllq $32, %xmm0, %xmm0
	; X64-AVX2-NEXT: vpaddq %xmm0, %xmm2, %xmm0
	; X64-AVX2-NEXT: retq			; X64-AVX2-NEXT: retq
	;			;
	; X64-AVX512DQ-LABEL: mul_v2i64_neg_15_63:			; X64-AVX512DQ-LABEL: mul_v2i64_neg_15_63:
	; X64-AVX512DQ: # %bb.0:			; X64-AVX512DQ: # %bb.0:
	; X64-AVX512DQ-NEXT: vpmullq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; X64-AVX512DQ-NEXT: vpmullq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; X64-AVX512DQ-NEXT: retq			; X64-AVX512DQ-NEXT: retq
	%1 = mul <2 x i64> %a0, <i64 -15, i64 -63>			%1 = mul <2 x i64> %a0, <i64 -15, i64 -63>
	ret <2 x i64> %1			ret <2 x i64> %1
	Show All 37 Lines
	; X64-XOP-NEXT: vpmuludq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; X64-XOP-NEXT: vpmuludq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; X64-XOP-NEXT: vpaddq %xmm1, %xmm0, %xmm0			; X64-XOP-NEXT: vpaddq %xmm1, %xmm0, %xmm0
	; X64-XOP-NEXT: vpsllq $32, %xmm0, %xmm0			; X64-XOP-NEXT: vpsllq $32, %xmm0, %xmm0
	; X64-XOP-NEXT: vpaddq %xmm0, %xmm2, %xmm0			; X64-XOP-NEXT: vpaddq %xmm0, %xmm2, %xmm0
	; X64-XOP-NEXT: retq			; X64-XOP-NEXT: retq
	;			;
	; X64-AVX2-LABEL: mul_v2i64_neg_17_65:			; X64-AVX2-LABEL: mul_v2i64_neg_17_65:
	; X64-AVX2: # %bb.0:			; X64-AVX2: # %bb.0:
	; X64-AVX2-NEXT: vmovdqa {{.*#+}} xmm1 = [18446744073709551599,18446744073709551551]			; X64-AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [4294967295,4294967295]
	; X64-AVX2-NEXT: vpmuludq %xmm1, %xmm0, %xmm2			; X64-AVX2-NEXT: vpmuludq %xmm1, %xmm0, %xmm1
	; X64-AVX2-NEXT: vpsrlq $32, %xmm0, %xmm3			; X64-AVX2-NEXT: vpsrlq $32, %xmm0, %xmm2
	; X64-AVX2-NEXT: vpmuludq %xmm1, %xmm3, %xmm1			; X64-AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [18446744073709551599,18446744073709551551]
	; X64-AVX2-NEXT: vpmuludq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; X64-AVX2-NEXT: vpmuludq %xmm3, %xmm2, %xmm2
				; X64-AVX2-NEXT: vpaddq %xmm2, %xmm1, %xmm1
				; X64-AVX2-NEXT: vpsllq $32, %xmm1, %xmm1
				; X64-AVX2-NEXT: vpmuludq %xmm3, %xmm0, %xmm0
	; X64-AVX2-NEXT: vpaddq %xmm1, %xmm0, %xmm0			; X64-AVX2-NEXT: vpaddq %xmm1, %xmm0, %xmm0
	; X64-AVX2-NEXT: vpsllq $32, %xmm0, %xmm0
	; X64-AVX2-NEXT: vpaddq %xmm0, %xmm2, %xmm0
	; X64-AVX2-NEXT: retq			; X64-AVX2-NEXT: retq
	;			;
	; X64-AVX512DQ-LABEL: mul_v2i64_neg_17_65:			; X64-AVX512DQ-LABEL: mul_v2i64_neg_17_65:
	; X64-AVX512DQ: # %bb.0:			; X64-AVX512DQ: # %bb.0:
	; X64-AVX512DQ-NEXT: vpmullq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; X64-AVX512DQ-NEXT: vpmullq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; X64-AVX512DQ-NEXT: retq			; X64-AVX512DQ-NEXT: retq
	%1 = mul <2 x i64> %a0, <i64 -17, i64 -65>			%1 = mul <2 x i64> %a0, <i64 -17, i64 -65>
	ret <2 x i64> %1			ret <2 x i64> %1
	▲ Show 20 Lines • Show All 524 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vector-popcnt-128-ult-ugt.ll

This file is larger than 256 KB, so syntax highlighting is disabled by default.

	Show First 20 Lines • Show All 2,040 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [2,2]
				; AVX2-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ugt_2_v2i64:			; AVX512VPOPCNTDQ-LABEL: ugt_2_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; AVX512VPOPCNTDQ-NEXT: vzeroupper			; AVX512VPOPCNTDQ-NEXT: vzeroupper
	▲ Show 20 Lines • Show All 168 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm1 = [3,3]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [3,3]
	; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ult_3_v2i64:			; AVX512VPOPCNTDQ-LABEL: ult_3_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [3,3]			; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [3,3]
	▲ Show 20 Lines • Show All 170 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [3,3]
				; AVX2-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ugt_3_v2i64:			; AVX512VPOPCNTDQ-LABEL: ugt_3_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; AVX512VPOPCNTDQ-NEXT: vzeroupper			; AVX512VPOPCNTDQ-NEXT: vzeroupper
	▲ Show 20 Lines • Show All 168 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm1 = [4,4]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [4,4]
	; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ult_4_v2i64:			; AVX512VPOPCNTDQ-LABEL: ult_4_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [4,4]			; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [4,4]
	▲ Show 20 Lines • Show All 170 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [4,4]
				; AVX2-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ugt_4_v2i64:			; AVX512VPOPCNTDQ-LABEL: ugt_4_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; AVX512VPOPCNTDQ-NEXT: vzeroupper			; AVX512VPOPCNTDQ-NEXT: vzeroupper
	▲ Show 20 Lines • Show All 168 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm1 = [5,5]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [5,5]
	; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ult_5_v2i64:			; AVX512VPOPCNTDQ-LABEL: ult_5_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [5,5]			; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [5,5]
	▲ Show 20 Lines • Show All 170 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [5,5]
				; AVX2-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ugt_5_v2i64:			; AVX512VPOPCNTDQ-LABEL: ugt_5_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; AVX512VPOPCNTDQ-NEXT: vzeroupper			; AVX512VPOPCNTDQ-NEXT: vzeroupper
	▲ Show 20 Lines • Show All 168 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm1 = [6,6]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [6,6]
	; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ult_6_v2i64:			; AVX512VPOPCNTDQ-LABEL: ult_6_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [6,6]			; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [6,6]
	▲ Show 20 Lines • Show All 170 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [6,6]
				; AVX2-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ugt_6_v2i64:			; AVX512VPOPCNTDQ-LABEL: ugt_6_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; AVX512VPOPCNTDQ-NEXT: vzeroupper			; AVX512VPOPCNTDQ-NEXT: vzeroupper
	▲ Show 20 Lines • Show All 168 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm1 = [7,7]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [7,7]
	; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ult_7_v2i64:			; AVX512VPOPCNTDQ-LABEL: ult_7_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [7,7]			; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [7,7]
	▲ Show 20 Lines • Show All 170 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [7,7]
				; AVX2-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ugt_7_v2i64:			; AVX512VPOPCNTDQ-LABEL: ugt_7_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; AVX512VPOPCNTDQ-NEXT: vzeroupper			; AVX512VPOPCNTDQ-NEXT: vzeroupper
	▲ Show 20 Lines • Show All 168 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm1 = [8,8]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [8,8]
	; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ult_8_v2i64:			; AVX512VPOPCNTDQ-LABEL: ult_8_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [8,8]			; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [8,8]
	▲ Show 20 Lines • Show All 170 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [8,8]
				; AVX2-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ugt_8_v2i64:			; AVX512VPOPCNTDQ-LABEL: ugt_8_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; AVX512VPOPCNTDQ-NEXT: vzeroupper			; AVX512VPOPCNTDQ-NEXT: vzeroupper
	▲ Show 20 Lines • Show All 168 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm1 = [9,9]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [9,9]
	; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ult_9_v2i64:			; AVX512VPOPCNTDQ-LABEL: ult_9_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [9,9]			; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [9,9]
	▲ Show 20 Lines • Show All 170 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [9,9]
				; AVX2-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ugt_9_v2i64:			; AVX512VPOPCNTDQ-LABEL: ugt_9_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; AVX512VPOPCNTDQ-NEXT: vzeroupper			; AVX512VPOPCNTDQ-NEXT: vzeroupper
	▲ Show 20 Lines • Show All 168 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm1 = [10,10]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [10,10]
	; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ult_10_v2i64:			; AVX512VPOPCNTDQ-LABEL: ult_10_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [10,10]			; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [10,10]
	▲ Show 20 Lines • Show All 170 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [10,10]
				; AVX2-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ugt_10_v2i64:			; AVX512VPOPCNTDQ-LABEL: ugt_10_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; AVX512VPOPCNTDQ-NEXT: vzeroupper			; AVX512VPOPCNTDQ-NEXT: vzeroupper
	▲ Show 20 Lines • Show All 168 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm1 = [11,11]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [11,11]
	; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ult_11_v2i64:			; AVX512VPOPCNTDQ-LABEL: ult_11_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [11,11]			; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [11,11]
	▲ Show 20 Lines • Show All 170 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [11,11]
				; AVX2-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ugt_11_v2i64:			; AVX512VPOPCNTDQ-LABEL: ugt_11_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; AVX512VPOPCNTDQ-NEXT: vzeroupper			; AVX512VPOPCNTDQ-NEXT: vzeroupper
	▲ Show 20 Lines • Show All 168 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm1 = [12,12]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [12,12]
	; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ult_12_v2i64:			; AVX512VPOPCNTDQ-LABEL: ult_12_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [12,12]			; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [12,12]
	▲ Show 20 Lines • Show All 170 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [12,12]
				; AVX2-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ugt_12_v2i64:			; AVX512VPOPCNTDQ-LABEL: ugt_12_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; AVX512VPOPCNTDQ-NEXT: vzeroupper			; AVX512VPOPCNTDQ-NEXT: vzeroupper
	▲ Show 20 Lines • Show All 168 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm1 = [13,13]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [13,13]
	; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ult_13_v2i64:			; AVX512VPOPCNTDQ-LABEL: ult_13_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [13,13]			; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [13,13]
	▲ Show 20 Lines • Show All 170 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [13,13]
				; AVX2-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ugt_13_v2i64:			; AVX512VPOPCNTDQ-LABEL: ugt_13_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; AVX512VPOPCNTDQ-NEXT: vzeroupper			; AVX512VPOPCNTDQ-NEXT: vzeroupper
	▲ Show 20 Lines • Show All 168 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm1 = [14,14]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [14,14]
	; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ult_14_v2i64:			; AVX512VPOPCNTDQ-LABEL: ult_14_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [14,14]			; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [14,14]
	▲ Show 20 Lines • Show All 170 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [14,14]
				; AVX2-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ugt_14_v2i64:			; AVX512VPOPCNTDQ-LABEL: ugt_14_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; AVX512VPOPCNTDQ-NEXT: vzeroupper			; AVX512VPOPCNTDQ-NEXT: vzeroupper
	▲ Show 20 Lines • Show All 168 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm1 = [15,15]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [15,15]
	; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ult_15_v2i64:			; AVX512VPOPCNTDQ-LABEL: ult_15_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [15,15]			; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [15,15]
	▲ Show 20 Lines • Show All 170 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [15,15]
				; AVX2-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ugt_15_v2i64:			; AVX512VPOPCNTDQ-LABEL: ugt_15_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; AVX512VPOPCNTDQ-NEXT: vzeroupper			; AVX512VPOPCNTDQ-NEXT: vzeroupper
	▲ Show 20 Lines • Show All 168 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm1 = [16,16]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [16,16]
	; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ult_16_v2i64:			; AVX512VPOPCNTDQ-LABEL: ult_16_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [16,16]			; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [16,16]
	▲ Show 20 Lines • Show All 170 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [16,16]
				; AVX2-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ugt_16_v2i64:			; AVX512VPOPCNTDQ-LABEL: ugt_16_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; AVX512VPOPCNTDQ-NEXT: vzeroupper			; AVX512VPOPCNTDQ-NEXT: vzeroupper
	▲ Show 20 Lines • Show All 168 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm1 = [17,17]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [17,17]
	; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ult_17_v2i64:			; AVX512VPOPCNTDQ-LABEL: ult_17_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [17,17]			; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [17,17]
	▲ Show 20 Lines • Show All 170 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [17,17]
				; AVX2-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ugt_17_v2i64:			; AVX512VPOPCNTDQ-LABEL: ugt_17_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; AVX512VPOPCNTDQ-NEXT: vzeroupper			; AVX512VPOPCNTDQ-NEXT: vzeroupper
	▲ Show 20 Lines • Show All 168 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm1 = [18,18]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [18,18]
	; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ult_18_v2i64:			; AVX512VPOPCNTDQ-LABEL: ult_18_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [18,18]			; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [18,18]
	▲ Show 20 Lines • Show All 170 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [18,18]
				; AVX2-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ugt_18_v2i64:			; AVX512VPOPCNTDQ-LABEL: ugt_18_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; AVX512VPOPCNTDQ-NEXT: vzeroupper			; AVX512VPOPCNTDQ-NEXT: vzeroupper
	▲ Show 20 Lines • Show All 168 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm1 = [19,19]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [19,19]
	; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ult_19_v2i64:			; AVX512VPOPCNTDQ-LABEL: ult_19_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [19,19]			; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [19,19]
	▲ Show 20 Lines • Show All 170 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [19,19]
				; AVX2-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ugt_19_v2i64:			; AVX512VPOPCNTDQ-LABEL: ugt_19_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; AVX512VPOPCNTDQ-NEXT: vzeroupper			; AVX512VPOPCNTDQ-NEXT: vzeroupper
	▲ Show 20 Lines • Show All 168 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm1 = [20,20]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [20,20]
	; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ult_20_v2i64:			; AVX512VPOPCNTDQ-LABEL: ult_20_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [20,20]			; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [20,20]
	▲ Show 20 Lines • Show All 170 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [20,20]
				; AVX2-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ugt_20_v2i64:			; AVX512VPOPCNTDQ-LABEL: ugt_20_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; AVX512VPOPCNTDQ-NEXT: vzeroupper			; AVX512VPOPCNTDQ-NEXT: vzeroupper
	▲ Show 20 Lines • Show All 168 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm1 = [21,21]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [21,21]
	; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ult_21_v2i64:			; AVX512VPOPCNTDQ-LABEL: ult_21_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [21,21]			; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [21,21]
	▲ Show 20 Lines • Show All 170 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [21,21]
				; AVX2-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ugt_21_v2i64:			; AVX512VPOPCNTDQ-LABEL: ugt_21_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; AVX512VPOPCNTDQ-NEXT: vzeroupper			; AVX512VPOPCNTDQ-NEXT: vzeroupper
	▲ Show 20 Lines • Show All 168 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm1 = [22,22]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [22,22]
	; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ult_22_v2i64:			; AVX512VPOPCNTDQ-LABEL: ult_22_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [22,22]			; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [22,22]
	▲ Show 20 Lines • Show All 170 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [22,22]
				; AVX2-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ugt_22_v2i64:			; AVX512VPOPCNTDQ-LABEL: ugt_22_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; AVX512VPOPCNTDQ-NEXT: vzeroupper			; AVX512VPOPCNTDQ-NEXT: vzeroupper
	▲ Show 20 Lines • Show All 168 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm1 = [23,23]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [23,23]
	; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ult_23_v2i64:			; AVX512VPOPCNTDQ-LABEL: ult_23_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [23,23]			; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [23,23]
	▲ Show 20 Lines • Show All 170 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [23,23]
				; AVX2-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ugt_23_v2i64:			; AVX512VPOPCNTDQ-LABEL: ugt_23_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; AVX512VPOPCNTDQ-NEXT: vzeroupper			; AVX512VPOPCNTDQ-NEXT: vzeroupper
	▲ Show 20 Lines • Show All 168 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm1 = [24,24]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [24,24]
	; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ult_24_v2i64:			; AVX512VPOPCNTDQ-LABEL: ult_24_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [24,24]			; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [24,24]
	▲ Show 20 Lines • Show All 170 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [24,24]
				; AVX2-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ugt_24_v2i64:			; AVX512VPOPCNTDQ-LABEL: ugt_24_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; AVX512VPOPCNTDQ-NEXT: vzeroupper			; AVX512VPOPCNTDQ-NEXT: vzeroupper
	▲ Show 20 Lines • Show All 168 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm1 = [25,25]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [25,25]
	; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ult_25_v2i64:			; AVX512VPOPCNTDQ-LABEL: ult_25_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [25,25]			; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [25,25]
	▲ Show 20 Lines • Show All 170 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [25,25]
				; AVX2-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ugt_25_v2i64:			; AVX512VPOPCNTDQ-LABEL: ugt_25_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; AVX512VPOPCNTDQ-NEXT: vzeroupper			; AVX512VPOPCNTDQ-NEXT: vzeroupper
	▲ Show 20 Lines • Show All 168 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm1 = [26,26]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [26,26]
	; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ult_26_v2i64:			; AVX512VPOPCNTDQ-LABEL: ult_26_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [26,26]			; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [26,26]
	▲ Show 20 Lines • Show All 170 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [26,26]
				; AVX2-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ugt_26_v2i64:			; AVX512VPOPCNTDQ-LABEL: ugt_26_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; AVX512VPOPCNTDQ-NEXT: vzeroupper			; AVX512VPOPCNTDQ-NEXT: vzeroupper
	▲ Show 20 Lines • Show All 168 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm1 = [27,27]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [27,27]
	; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ult_27_v2i64:			; AVX512VPOPCNTDQ-LABEL: ult_27_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [27,27]			; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [27,27]
	▲ Show 20 Lines • Show All 170 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [27,27]
				; AVX2-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ugt_27_v2i64:			; AVX512VPOPCNTDQ-LABEL: ugt_27_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; AVX512VPOPCNTDQ-NEXT: vzeroupper			; AVX512VPOPCNTDQ-NEXT: vzeroupper
	▲ Show 20 Lines • Show All 168 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm1 = [28,28]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [28,28]
	; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ult_28_v2i64:			; AVX512VPOPCNTDQ-LABEL: ult_28_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [28,28]			; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [28,28]
	▲ Show 20 Lines • Show All 170 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [28,28]
				; AVX2-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ugt_28_v2i64:			; AVX512VPOPCNTDQ-LABEL: ugt_28_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; AVX512VPOPCNTDQ-NEXT: vzeroupper			; AVX512VPOPCNTDQ-NEXT: vzeroupper
	▲ Show 20 Lines • Show All 168 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm1 = [29,29]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [29,29]
	; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ult_29_v2i64:			; AVX512VPOPCNTDQ-LABEL: ult_29_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [29,29]			; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [29,29]
	▲ Show 20 Lines • Show All 170 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [29,29]
				; AVX2-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ugt_29_v2i64:			; AVX512VPOPCNTDQ-LABEL: ugt_29_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; AVX512VPOPCNTDQ-NEXT: vzeroupper			; AVX512VPOPCNTDQ-NEXT: vzeroupper
	▲ Show 20 Lines • Show All 168 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm1 = [30,30]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [30,30]
	; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ult_30_v2i64:			; AVX512VPOPCNTDQ-LABEL: ult_30_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [30,30]			; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [30,30]
	▲ Show 20 Lines • Show All 170 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [30,30]
				; AVX2-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ugt_30_v2i64:			; AVX512VPOPCNTDQ-LABEL: ugt_30_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; AVX512VPOPCNTDQ-NEXT: vzeroupper			; AVX512VPOPCNTDQ-NEXT: vzeroupper
	▲ Show 20 Lines • Show All 168 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm1 = [31,31]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [31,31]
	; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ult_31_v2i64:			; AVX512VPOPCNTDQ-LABEL: ult_31_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [31,31]			; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [31,31]
	▲ Show 20 Lines • Show All 170 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [31,31]
				; AVX2-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ugt_31_v2i64:			; AVX512VPOPCNTDQ-LABEL: ugt_31_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; AVX512VPOPCNTDQ-NEXT: vzeroupper			; AVX512VPOPCNTDQ-NEXT: vzeroupper
	▲ Show 20 Lines • Show All 168 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm1 = [32,32]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [32,32]
	; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ult_32_v2i64:			; AVX512VPOPCNTDQ-LABEL: ult_32_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [32,32]			; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [32,32]
	▲ Show 20 Lines • Show All 170 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [32,32]
				; AVX2-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ugt_32_v2i64:			; AVX512VPOPCNTDQ-LABEL: ugt_32_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; AVX512VPOPCNTDQ-NEXT: vzeroupper			; AVX512VPOPCNTDQ-NEXT: vzeroupper
	▲ Show 20 Lines • Show All 168 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm1 = [33,33]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [33,33]
	; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ult_33_v2i64:			; AVX512VPOPCNTDQ-LABEL: ult_33_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [33,33]			; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [33,33]
	▲ Show 20 Lines • Show All 170 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [33,33]
				; AVX2-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ugt_33_v2i64:			; AVX512VPOPCNTDQ-LABEL: ugt_33_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; AVX512VPOPCNTDQ-NEXT: vzeroupper			; AVX512VPOPCNTDQ-NEXT: vzeroupper
	▲ Show 20 Lines • Show All 168 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm1 = [34,34]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [34,34]
	; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ult_34_v2i64:			; AVX512VPOPCNTDQ-LABEL: ult_34_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [34,34]			; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [34,34]
	▲ Show 20 Lines • Show All 170 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [34,34]
				; AVX2-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ugt_34_v2i64:			; AVX512VPOPCNTDQ-LABEL: ugt_34_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; AVX512VPOPCNTDQ-NEXT: vzeroupper			; AVX512VPOPCNTDQ-NEXT: vzeroupper
	▲ Show 20 Lines • Show All 168 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm1 = [35,35]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [35,35]
	; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ult_35_v2i64:			; AVX512VPOPCNTDQ-LABEL: ult_35_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [35,35]			; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [35,35]
	▲ Show 20 Lines • Show All 170 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [35,35]
				; AVX2-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ugt_35_v2i64:			; AVX512VPOPCNTDQ-LABEL: ugt_35_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; AVX512VPOPCNTDQ-NEXT: vzeroupper			; AVX512VPOPCNTDQ-NEXT: vzeroupper
	▲ Show 20 Lines • Show All 168 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm1 = [36,36]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [36,36]
	; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ult_36_v2i64:			; AVX512VPOPCNTDQ-LABEL: ult_36_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [36,36]			; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [36,36]
	▲ Show 20 Lines • Show All 170 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [36,36]
				; AVX2-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ugt_36_v2i64:			; AVX512VPOPCNTDQ-LABEL: ugt_36_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; AVX512VPOPCNTDQ-NEXT: vzeroupper			; AVX512VPOPCNTDQ-NEXT: vzeroupper
	▲ Show 20 Lines • Show All 168 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm1 = [37,37]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [37,37]
	; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ult_37_v2i64:			; AVX512VPOPCNTDQ-LABEL: ult_37_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [37,37]			; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [37,37]
	▲ Show 20 Lines • Show All 170 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [37,37]
				; AVX2-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ugt_37_v2i64:			; AVX512VPOPCNTDQ-LABEL: ugt_37_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; AVX512VPOPCNTDQ-NEXT: vzeroupper			; AVX512VPOPCNTDQ-NEXT: vzeroupper
	▲ Show 20 Lines • Show All 168 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm1 = [38,38]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [38,38]
	; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ult_38_v2i64:			; AVX512VPOPCNTDQ-LABEL: ult_38_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [38,38]			; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [38,38]
	▲ Show 20 Lines • Show All 170 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [38,38]
				; AVX2-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ugt_38_v2i64:			; AVX512VPOPCNTDQ-LABEL: ugt_38_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; AVX512VPOPCNTDQ-NEXT: vzeroupper			; AVX512VPOPCNTDQ-NEXT: vzeroupper
	▲ Show 20 Lines • Show All 168 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm1 = [39,39]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [39,39]
	; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ult_39_v2i64:			; AVX512VPOPCNTDQ-LABEL: ult_39_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [39,39]			; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [39,39]
	▲ Show 20 Lines • Show All 170 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [39,39]
				; AVX2-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ugt_39_v2i64:			; AVX512VPOPCNTDQ-LABEL: ugt_39_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; AVX512VPOPCNTDQ-NEXT: vzeroupper			; AVX512VPOPCNTDQ-NEXT: vzeroupper
	▲ Show 20 Lines • Show All 168 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm1 = [40,40]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [40,40]
	; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ult_40_v2i64:			; AVX512VPOPCNTDQ-LABEL: ult_40_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [40,40]			; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [40,40]
	▲ Show 20 Lines • Show All 170 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [40,40]
				; AVX2-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ugt_40_v2i64:			; AVX512VPOPCNTDQ-LABEL: ugt_40_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; AVX512VPOPCNTDQ-NEXT: vzeroupper			; AVX512VPOPCNTDQ-NEXT: vzeroupper
	▲ Show 20 Lines • Show All 168 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm1 = [41,41]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [41,41]
	; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ult_41_v2i64:			; AVX512VPOPCNTDQ-LABEL: ult_41_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [41,41]			; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [41,41]
	▲ Show 20 Lines • Show All 170 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [41,41]
				; AVX2-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ugt_41_v2i64:			; AVX512VPOPCNTDQ-LABEL: ugt_41_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; AVX512VPOPCNTDQ-NEXT: vzeroupper			; AVX512VPOPCNTDQ-NEXT: vzeroupper
	▲ Show 20 Lines • Show All 168 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm1 = [42,42]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [42,42]
	; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ult_42_v2i64:			; AVX512VPOPCNTDQ-LABEL: ult_42_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [42,42]			; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [42,42]
	▲ Show 20 Lines • Show All 170 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [42,42]
				; AVX2-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ugt_42_v2i64:			; AVX512VPOPCNTDQ-LABEL: ugt_42_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; AVX512VPOPCNTDQ-NEXT: vzeroupper			; AVX512VPOPCNTDQ-NEXT: vzeroupper
	▲ Show 20 Lines • Show All 168 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm1 = [43,43]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [43,43]
	; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ult_43_v2i64:			; AVX512VPOPCNTDQ-LABEL: ult_43_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [43,43]			; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [43,43]
	▲ Show 20 Lines • Show All 170 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [43,43]
				; AVX2-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ugt_43_v2i64:			; AVX512VPOPCNTDQ-LABEL: ugt_43_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; AVX512VPOPCNTDQ-NEXT: vzeroupper			; AVX512VPOPCNTDQ-NEXT: vzeroupper
	▲ Show 20 Lines • Show All 168 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm1 = [44,44]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [44,44]
	; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ult_44_v2i64:			; AVX512VPOPCNTDQ-LABEL: ult_44_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [44,44]			; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [44,44]
	▲ Show 20 Lines • Show All 170 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [44,44]
				; AVX2-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ugt_44_v2i64:			; AVX512VPOPCNTDQ-LABEL: ugt_44_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; AVX512VPOPCNTDQ-NEXT: vzeroupper			; AVX512VPOPCNTDQ-NEXT: vzeroupper
	▲ Show 20 Lines • Show All 168 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm1 = [45,45]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [45,45]
	; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ult_45_v2i64:			; AVX512VPOPCNTDQ-LABEL: ult_45_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [45,45]			; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [45,45]
	▲ Show 20 Lines • Show All 170 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [45,45]
				; AVX2-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ugt_45_v2i64:			; AVX512VPOPCNTDQ-LABEL: ugt_45_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; AVX512VPOPCNTDQ-NEXT: vzeroupper			; AVX512VPOPCNTDQ-NEXT: vzeroupper
	▲ Show 20 Lines • Show All 168 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm1 = [46,46]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [46,46]
	; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ult_46_v2i64:			; AVX512VPOPCNTDQ-LABEL: ult_46_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [46,46]			; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [46,46]
	▲ Show 20 Lines • Show All 170 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [46,46]
				; AVX2-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ugt_46_v2i64:			; AVX512VPOPCNTDQ-LABEL: ugt_46_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; AVX512VPOPCNTDQ-NEXT: vzeroupper			; AVX512VPOPCNTDQ-NEXT: vzeroupper
	▲ Show 20 Lines • Show All 168 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm1 = [47,47]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [47,47]
	; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ult_47_v2i64:			; AVX512VPOPCNTDQ-LABEL: ult_47_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [47,47]			; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [47,47]
	▲ Show 20 Lines • Show All 170 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [47,47]
				; AVX2-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ugt_47_v2i64:			; AVX512VPOPCNTDQ-LABEL: ugt_47_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; AVX512VPOPCNTDQ-NEXT: vzeroupper			; AVX512VPOPCNTDQ-NEXT: vzeroupper
	▲ Show 20 Lines • Show All 168 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm1 = [48,48]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [48,48]
	; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ult_48_v2i64:			; AVX512VPOPCNTDQ-LABEL: ult_48_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [48,48]			; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [48,48]
	▲ Show 20 Lines • Show All 170 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [48,48]
				; AVX2-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ugt_48_v2i64:			; AVX512VPOPCNTDQ-LABEL: ugt_48_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; AVX512VPOPCNTDQ-NEXT: vzeroupper			; AVX512VPOPCNTDQ-NEXT: vzeroupper
	▲ Show 20 Lines • Show All 168 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm1 = [49,49]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [49,49]
	; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ult_49_v2i64:			; AVX512VPOPCNTDQ-LABEL: ult_49_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [49,49]			; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [49,49]
	▲ Show 20 Lines • Show All 170 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [49,49]
				; AVX2-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ugt_49_v2i64:			; AVX512VPOPCNTDQ-LABEL: ugt_49_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; AVX512VPOPCNTDQ-NEXT: vzeroupper			; AVX512VPOPCNTDQ-NEXT: vzeroupper
	▲ Show 20 Lines • Show All 168 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm1 = [50,50]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [50,50]
	; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ult_50_v2i64:			; AVX512VPOPCNTDQ-LABEL: ult_50_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [50,50]			; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [50,50]
	▲ Show 20 Lines • Show All 170 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [50,50]
				; AVX2-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ugt_50_v2i64:			; AVX512VPOPCNTDQ-LABEL: ugt_50_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; AVX512VPOPCNTDQ-NEXT: vzeroupper			; AVX512VPOPCNTDQ-NEXT: vzeroupper
	▲ Show 20 Lines • Show All 168 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm1 = [51,51]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [51,51]
	; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ult_51_v2i64:			; AVX512VPOPCNTDQ-LABEL: ult_51_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [51,51]			; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [51,51]
	▲ Show 20 Lines • Show All 170 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [51,51]
				; AVX2-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ugt_51_v2i64:			; AVX512VPOPCNTDQ-LABEL: ugt_51_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; AVX512VPOPCNTDQ-NEXT: vzeroupper			; AVX512VPOPCNTDQ-NEXT: vzeroupper
	▲ Show 20 Lines • Show All 168 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm1 = [52,52]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [52,52]
	; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ult_52_v2i64:			; AVX512VPOPCNTDQ-LABEL: ult_52_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [52,52]			; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [52,52]
	▲ Show 20 Lines • Show All 170 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [52,52]
				; AVX2-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ugt_52_v2i64:			; AVX512VPOPCNTDQ-LABEL: ugt_52_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; AVX512VPOPCNTDQ-NEXT: vzeroupper			; AVX512VPOPCNTDQ-NEXT: vzeroupper
	▲ Show 20 Lines • Show All 168 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm1 = [53,53]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [53,53]
	; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ult_53_v2i64:			; AVX512VPOPCNTDQ-LABEL: ult_53_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [53,53]			; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [53,53]
	▲ Show 20 Lines • Show All 170 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [53,53]
				; AVX2-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ugt_53_v2i64:			; AVX512VPOPCNTDQ-LABEL: ugt_53_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; AVX512VPOPCNTDQ-NEXT: vzeroupper			; AVX512VPOPCNTDQ-NEXT: vzeroupper
	▲ Show 20 Lines • Show All 168 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm1 = [54,54]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [54,54]
	; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ult_54_v2i64:			; AVX512VPOPCNTDQ-LABEL: ult_54_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [54,54]			; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [54,54]
	▲ Show 20 Lines • Show All 170 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [54,54]
				; AVX2-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ugt_54_v2i64:			; AVX512VPOPCNTDQ-LABEL: ugt_54_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; AVX512VPOPCNTDQ-NEXT: vzeroupper			; AVX512VPOPCNTDQ-NEXT: vzeroupper
	▲ Show 20 Lines • Show All 168 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm1 = [55,55]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [55,55]
	; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ult_55_v2i64:			; AVX512VPOPCNTDQ-LABEL: ult_55_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [55,55]			; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [55,55]
	▲ Show 20 Lines • Show All 170 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [55,55]
				; AVX2-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ugt_55_v2i64:			; AVX512VPOPCNTDQ-LABEL: ugt_55_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; AVX512VPOPCNTDQ-NEXT: vzeroupper			; AVX512VPOPCNTDQ-NEXT: vzeroupper
	▲ Show 20 Lines • Show All 168 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm1 = [56,56]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [56,56]
	; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ult_56_v2i64:			; AVX512VPOPCNTDQ-LABEL: ult_56_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [56,56]			; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [56,56]
	▲ Show 20 Lines • Show All 170 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [56,56]
				; AVX2-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ugt_56_v2i64:			; AVX512VPOPCNTDQ-LABEL: ugt_56_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; AVX512VPOPCNTDQ-NEXT: vzeroupper			; AVX512VPOPCNTDQ-NEXT: vzeroupper
	▲ Show 20 Lines • Show All 168 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm1 = [57,57]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [57,57]
	; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ult_57_v2i64:			; AVX512VPOPCNTDQ-LABEL: ult_57_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [57,57]			; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [57,57]
	▲ Show 20 Lines • Show All 170 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [57,57]
				; AVX2-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ugt_57_v2i64:			; AVX512VPOPCNTDQ-LABEL: ugt_57_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; AVX512VPOPCNTDQ-NEXT: vzeroupper			; AVX512VPOPCNTDQ-NEXT: vzeroupper
	▲ Show 20 Lines • Show All 168 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm1 = [58,58]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [58,58]
	; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ult_58_v2i64:			; AVX512VPOPCNTDQ-LABEL: ult_58_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [58,58]			; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [58,58]
	▲ Show 20 Lines • Show All 170 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [58,58]
				; AVX2-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ugt_58_v2i64:			; AVX512VPOPCNTDQ-LABEL: ugt_58_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; AVX512VPOPCNTDQ-NEXT: vzeroupper			; AVX512VPOPCNTDQ-NEXT: vzeroupper
	▲ Show 20 Lines • Show All 168 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm1 = [59,59]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [59,59]
	; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ult_59_v2i64:			; AVX512VPOPCNTDQ-LABEL: ult_59_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [59,59]			; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [59,59]
	▲ Show 20 Lines • Show All 170 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [59,59]
				; AVX2-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ugt_59_v2i64:			; AVX512VPOPCNTDQ-LABEL: ugt_59_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; AVX512VPOPCNTDQ-NEXT: vzeroupper			; AVX512VPOPCNTDQ-NEXT: vzeroupper
	▲ Show 20 Lines • Show All 168 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm1 = [60,60]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [60,60]
	; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ult_60_v2i64:			; AVX512VPOPCNTDQ-LABEL: ult_60_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [60,60]			; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [60,60]
	▲ Show 20 Lines • Show All 170 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [60,60]
				; AVX2-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ugt_60_v2i64:			; AVX512VPOPCNTDQ-LABEL: ugt_60_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; AVX512VPOPCNTDQ-NEXT: vzeroupper			; AVX512VPOPCNTDQ-NEXT: vzeroupper
	▲ Show 20 Lines • Show All 168 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm1 = [61,61]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [61,61]
	; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ult_61_v2i64:			; AVX512VPOPCNTDQ-LABEL: ult_61_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [61,61]			; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [61,61]
	▲ Show 20 Lines • Show All 170 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [61,61]
				; AVX2-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ugt_61_v2i64:			; AVX512VPOPCNTDQ-LABEL: ugt_61_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; AVX512VPOPCNTDQ-NEXT: vzeroupper			; AVX512VPOPCNTDQ-NEXT: vzeroupper
	▲ Show 20 Lines • Show All 168 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm1 = [62,62]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [62,62]
	; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ult_62_v2i64:			; AVX512VPOPCNTDQ-LABEL: ult_62_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [62,62]			; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [62,62]
	▲ Show 20 Lines • Show All 170 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [62,62]
				; AVX2-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ugt_62_v2i64:			; AVX512VPOPCNTDQ-LABEL: ugt_62_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX512VPOPCNTDQ-NEXT: vpcmpgtq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; AVX512VPOPCNTDQ-NEXT: vzeroupper			; AVX512VPOPCNTDQ-NEXT: vzeroupper
	▲ Show 20 Lines • Show All 168 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]			; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
	; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2			; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
	; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vpshufb %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm1 = [63,63]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [63,63]
	; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512VPOPCNTDQ-LABEL: ult_63_v2i64:			; AVX512VPOPCNTDQ-LABEL: ult_63_v2i64:
	; AVX512VPOPCNTDQ: # %bb.0:			; AVX512VPOPCNTDQ: # %bb.0:
	; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512VPOPCNTDQ-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0			; AVX512VPOPCNTDQ-NEXT: vpopcntq %zmm0, %zmm0
	; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [63,63]			; AVX512VPOPCNTDQ-NEXT: vmovdqa {{.*#+}} xmm1 = [63,63]
	▲ Show 20 Lines • Show All 42 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vector-reduce-or-cmp.ll

	Show First 20 Lines • Show All 838 Lines • ▼ Show 20 Lines
	; AVX1-LABEL: trunc_v2i64:			; AVX1-LABEL: trunc_v2i64:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vptest {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0			; AVX1-NEXT: vptest {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
	; AVX1-NEXT: sete %al			; AVX1-NEXT: sete %al
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: trunc_v2i64:			; AVX2-LABEL: trunc_v2i64:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vptest {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [65535,65535]
				; AVX2-NEXT: vptest %xmm1, %xmm0
	; AVX2-NEXT: sete %al			; AVX2-NEXT: sete %al
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512BW-LABEL: trunc_v2i64:			; AVX512BW-LABEL: trunc_v2i64:
	; AVX512BW: # %bb.0:			; AVX512BW: # %bb.0:
	; AVX512BW-NEXT: vptest {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0			; AVX512BW-NEXT: vptest {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
	; AVX512BW-NEXT: sete %al			; AVX512BW-NEXT: sete %al
	; AVX512BW-NEXT: retq			; AVX512BW-NEXT: retq
	▲ Show 20 Lines • Show All 196 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: vmovdqu (%rdi), %xmm0			; AVX1-NEXT: vmovdqu (%rdi), %xmm0
	; AVX1-NEXT: vptest {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0			; AVX1-NEXT: vptest {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
	; AVX1-NEXT: sete %al			; AVX1-NEXT: sete %al
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: PR44781:			; AVX2-LABEL: PR44781:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vmovdqu (%rdi), %xmm0			; AVX2-NEXT: vmovdqu (%rdi), %xmm0
	; AVX2-NEXT: vptest {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [64424509455,64424509455]
				; AVX2-NEXT: vptest %xmm1, %xmm0
	; AVX2-NEXT: sete %al			; AVX2-NEXT: sete %al
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512BW-LABEL: PR44781:			; AVX512BW-LABEL: PR44781:
	; AVX512BW: # %bb.0:			; AVX512BW: # %bb.0:
	; AVX512BW-NEXT: vmovdqu (%rdi), %xmm0			; AVX512BW-NEXT: vmovdqu (%rdi), %xmm0
	; AVX512BW-NEXT: vptest {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0			; AVX512BW-NEXT: vptest {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
	; AVX512BW-NEXT: sete %al			; AVX512BW-NEXT: sete %al
	▲ Show 20 Lines • Show All 169 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vector-reduce-umax.ll

	Show First 20 Lines • Show All 57 Lines • ▼ Show 20 Lines
	; SSE42-NEXT: movdqa {{.*#+}} xmm3 = [9223372036854775808,9223372036854775808]			; SSE42-NEXT: movdqa {{.*#+}} xmm3 = [9223372036854775808,9223372036854775808]
	; SSE42-NEXT: pxor %xmm3, %xmm0			; SSE42-NEXT: pxor %xmm3, %xmm0
	; SSE42-NEXT: pxor %xmm2, %xmm3			; SSE42-NEXT: pxor %xmm2, %xmm3
	; SSE42-NEXT: pcmpgtq %xmm3, %xmm0			; SSE42-NEXT: pcmpgtq %xmm3, %xmm0
	; SSE42-NEXT: blendvpd %xmm0, %xmm1, %xmm2			; SSE42-NEXT: blendvpd %xmm0, %xmm1, %xmm2
	; SSE42-NEXT: movq %xmm2, %rax			; SSE42-NEXT: movq %xmm2, %rax
	; SSE42-NEXT: retq			; SSE42-NEXT: retq
	;			;
	; AVX-LABEL: test_v2i64:			; AVX1-LABEL: test_v2i64:
	; AVX: # %bb.0:			; AVX1: # %bb.0:
	; AVX-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,2,3]			; AVX1-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,2,3]
	; AVX-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
	; AVX-NEXT: vpxor %xmm2, %xmm0, %xmm3			; AVX1-NEXT: vpxor %xmm2, %xmm0, %xmm3
	; AVX-NEXT: vpxor %xmm2, %xmm1, %xmm2			; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm2
	; AVX-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2
	; AVX-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0			; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX-NEXT: vmovq %xmm0, %rax			; AVX1-NEXT: vmovq %xmm0, %rax
	; AVX-NEXT: retq			; AVX1-NEXT: retq
				;
				; AVX2-LABEL: test_v2i64:
				; AVX2: # %bb.0:
				; AVX2-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,2,3]
				; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
				; AVX2-NEXT: vpxor %xmm2, %xmm0, %xmm3
				; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm2
				; AVX2-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2
				; AVX2-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
				; AVX2-NEXT: vmovq %xmm0, %rax
				; AVX2-NEXT: retq
	;			;
	; AVX512BW-LABEL: test_v2i64:			; AVX512BW-LABEL: test_v2i64:
	; AVX512BW: # %bb.0:			; AVX512BW: # %bb.0:
	; AVX512BW-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512BW-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512BW-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,2,3]			; AVX512BW-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,2,3]
	; AVX512BW-NEXT: vpmaxuq %zmm1, %zmm0, %zmm0			; AVX512BW-NEXT: vpmaxuq %zmm1, %zmm0, %zmm0
	; AVX512BW-NEXT: vmovq %xmm0, %rax			; AVX512BW-NEXT: vmovq %xmm0, %rax
	; AVX512BW-NEXT: vzeroupper			; AVX512BW-NEXT: vzeroupper
	▲ Show 20 Lines • Show All 2,040 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vector-reduce-umin.ll

	Show First 20 Lines • Show All 57 Lines • ▼ Show 20 Lines
	; SSE42-NEXT: movdqa %xmm1, %xmm3			; SSE42-NEXT: movdqa %xmm1, %xmm3
	; SSE42-NEXT: pxor %xmm0, %xmm3			; SSE42-NEXT: pxor %xmm0, %xmm3
	; SSE42-NEXT: pxor %xmm2, %xmm0			; SSE42-NEXT: pxor %xmm2, %xmm0
	; SSE42-NEXT: pcmpgtq %xmm3, %xmm0			; SSE42-NEXT: pcmpgtq %xmm3, %xmm0
	; SSE42-NEXT: blendvpd %xmm0, %xmm1, %xmm2			; SSE42-NEXT: blendvpd %xmm0, %xmm1, %xmm2
	; SSE42-NEXT: movq %xmm2, %rax			; SSE42-NEXT: movq %xmm2, %rax
	; SSE42-NEXT: retq			; SSE42-NEXT: retq
	;			;
	; AVX-LABEL: test_v2i64:			; AVX1-LABEL: test_v2i64:
	; AVX: # %bb.0:			; AVX1: # %bb.0:
	; AVX-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,2,3]			; AVX1-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,2,3]
	; AVX-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
	; AVX-NEXT: vpxor %xmm2, %xmm0, %xmm3			; AVX1-NEXT: vpxor %xmm2, %xmm0, %xmm3
	; AVX-NEXT: vpxor %xmm2, %xmm1, %xmm2			; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm2
	; AVX-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2
	; AVX-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0			; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX-NEXT: vmovq %xmm0, %rax			; AVX1-NEXT: vmovq %xmm0, %rax
	; AVX-NEXT: retq			; AVX1-NEXT: retq
				;
				; AVX2-LABEL: test_v2i64:
				; AVX2: # %bb.0:
				; AVX2-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,2,3]
				; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
				; AVX2-NEXT: vpxor %xmm2, %xmm0, %xmm3
				; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm2
				; AVX2-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2
				; AVX2-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
				; AVX2-NEXT: vmovq %xmm0, %rax
				; AVX2-NEXT: retq
	;			;
	; AVX512BW-LABEL: test_v2i64:			; AVX512BW-LABEL: test_v2i64:
	; AVX512BW: # %bb.0:			; AVX512BW: # %bb.0:
	; AVX512BW-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512BW-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512BW-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,2,3]			; AVX512BW-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,2,3]
	; AVX512BW-NEXT: vpminuq %zmm1, %zmm0, %zmm0			; AVX512BW-NEXT: vpminuq %zmm1, %zmm0, %zmm0
	; AVX512BW-NEXT: vmovq %xmm0, %rax			; AVX512BW-NEXT: vmovq %xmm0, %rax
	; AVX512BW-NEXT: vzeroupper			; AVX512BW-NEXT: vzeroupper
	▲ Show 20 Lines • Show All 2,000 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vector-rotate-128.ll

	Show First 20 Lines • Show All 67 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: vpshufd {{.*#+}} xmm2 = xmm2[2,3,2,3]			; AVX1-NEXT: vpshufd {{.*#+}} xmm2 = xmm2[2,3,2,3]
	; AVX1-NEXT: vpsrlq %xmm2, %xmm0, %xmm0			; AVX1-NEXT: vpsrlq %xmm2, %xmm0, %xmm0
	; AVX1-NEXT: vpblendw {{.*#+}} xmm0 = xmm3[0,1,2,3],xmm0[4,5,6,7]			; AVX1-NEXT: vpblendw {{.*#+}} xmm0 = xmm3[0,1,2,3],xmm0[4,5,6,7]
	; AVX1-NEXT: vpor %xmm0, %xmm1, %xmm0			; AVX1-NEXT: vpor %xmm0, %xmm1, %xmm0
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: var_rotate_v2i64:			; AVX2-LABEL: var_rotate_v2i64:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm2 = [64,64]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm2 = [64,64]
	; AVX2-NEXT: vpsubq %xmm1, %xmm2, %xmm2			; AVX2-NEXT: vpsubq %xmm1, %xmm2, %xmm2
	; AVX2-NEXT: vpsllvq %xmm1, %xmm0, %xmm1			; AVX2-NEXT: vpsllvq %xmm1, %xmm0, %xmm1
	; AVX2-NEXT: vpsrlvq %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpsrlvq %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpor %xmm0, %xmm1, %xmm0			; AVX2-NEXT: vpor %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: var_rotate_v2i64:			; AVX512F-LABEL: var_rotate_v2i64:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	▲ Show 20 Lines • Show All 630 Lines • ▼ Show 20 Lines
	; SSE-NEXT: movdqa {{.*#+}} xmm2 = [64,64]			; SSE-NEXT: movdqa {{.*#+}} xmm2 = [64,64]
	; SSE-NEXT: psubq %xmm1, %xmm2			; SSE-NEXT: psubq %xmm1, %xmm2
	; SSE-NEXT: movdqa %xmm0, %xmm3			; SSE-NEXT: movdqa %xmm0, %xmm3
	; SSE-NEXT: psllq %xmm1, %xmm3			; SSE-NEXT: psllq %xmm1, %xmm3
	; SSE-NEXT: psrlq %xmm2, %xmm0			; SSE-NEXT: psrlq %xmm2, %xmm0
	; SSE-NEXT: por %xmm3, %xmm0			; SSE-NEXT: por %xmm3, %xmm0
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX-LABEL: splatvar_rotate_v2i64:			; AVX1-LABEL: splatvar_rotate_v2i64:
	; AVX: # %bb.0:			; AVX1: # %bb.0:
	; AVX-NEXT: vmovdqa {{.*#+}} xmm2 = [64,64]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm2 = [64,64]
	; AVX-NEXT: vpsubq %xmm1, %xmm2, %xmm2			; AVX1-NEXT: vpsubq %xmm1, %xmm2, %xmm2
	; AVX-NEXT: vpsllq %xmm1, %xmm0, %xmm1			; AVX1-NEXT: vpsllq %xmm1, %xmm0, %xmm1
	; AVX-NEXT: vpsrlq %xmm2, %xmm0, %xmm0			; AVX1-NEXT: vpsrlq %xmm2, %xmm0, %xmm0
	; AVX-NEXT: vpor %xmm0, %xmm1, %xmm0			; AVX1-NEXT: vpor %xmm0, %xmm1, %xmm0
	; AVX-NEXT: retq			; AVX1-NEXT: retq
				;
				; AVX2-LABEL: splatvar_rotate_v2i64:
				; AVX2: # %bb.0:
				; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm2 = [64,64]
				; AVX2-NEXT: vpsubq %xmm1, %xmm2, %xmm2
				; AVX2-NEXT: vpsllq %xmm1, %xmm0, %xmm1
				; AVX2-NEXT: vpsrlq %xmm2, %xmm0, %xmm0
				; AVX2-NEXT: vpor %xmm0, %xmm1, %xmm0
				; AVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: splatvar_rotate_v2i64:			; AVX512F-LABEL: splatvar_rotate_v2i64:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512F-NEXT: vpbroadcastq %xmm1, %xmm1			; AVX512F-NEXT: vpbroadcastq %xmm1, %xmm1
	; AVX512F-NEXT: vprolvq %zmm1, %zmm0, %zmm0			; AVX512F-NEXT: vprolvq %zmm1, %zmm0, %zmm0
	; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 killed $zmm0			; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 killed $zmm0
	; AVX512F-NEXT: vzeroupper			; AVX512F-NEXT: vzeroupper
	▲ Show 20 Lines • Show All 1,549 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vector-rotate-256.ll

	Show First 20 Lines • Show All 572 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: vpsrlq %xmm2, %xmm0, %xmm0			; AVX1-NEXT: vpsrlq %xmm2, %xmm0, %xmm0
	; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm0, %ymm0			; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm0, %ymm0
	; AVX1-NEXT: vorps %ymm0, %ymm1, %ymm0			; AVX1-NEXT: vorps %ymm0, %ymm1, %ymm0
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: splatvar_rotate_v4i64:			; AVX2-LABEL: splatvar_rotate_v4i64:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpsllq %xmm1, %ymm0, %ymm2			; AVX2-NEXT: vpsllq %xmm1, %ymm0, %ymm2
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = [64,64]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm3 = [64,64]
	; AVX2-NEXT: vpsubq %xmm1, %xmm3, %xmm1			; AVX2-NEXT: vpsubq %xmm1, %xmm3, %xmm1
	; AVX2-NEXT: vpsrlq %xmm1, %ymm0, %ymm0			; AVX2-NEXT: vpsrlq %xmm1, %ymm0, %ymm0
	; AVX2-NEXT: vpor %ymm0, %ymm2, %ymm0			; AVX2-NEXT: vpor %ymm0, %ymm2, %ymm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: splatvar_rotate_v4i64:			; AVX512F-LABEL: splatvar_rotate_v4i64:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	; AVX512F-NEXT: # kill: def $ymm0 killed $ymm0 def $zmm0			; AVX512F-NEXT: # kill: def $ymm0 killed $ymm0 def $zmm0
	▲ Show 20 Lines • Show All 1,388 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vector-shift-ashr-128.ll

	Show First 20 Lines • Show All 60 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: vpsrlq %xmm4, %xmm0, %xmm0			; AVX1-NEXT: vpsrlq %xmm4, %xmm0, %xmm0
	; AVX1-NEXT: vpblendw {{.*#+}} xmm0 = xmm1[0,1,2,3],xmm0[4,5,6,7]			; AVX1-NEXT: vpblendw {{.*#+}} xmm0 = xmm1[0,1,2,3],xmm0[4,5,6,7]
	; AVX1-NEXT: vpxor %xmm2, %xmm0, %xmm0			; AVX1-NEXT: vpxor %xmm2, %xmm0, %xmm0
	; AVX1-NEXT: vpsubq %xmm2, %xmm0, %xmm0			; AVX1-NEXT: vpsubq %xmm2, %xmm0, %xmm0
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: var_shift_v2i64:			; AVX2-LABEL: var_shift_v2i64:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
	; AVX2-NEXT: vpsrlvq %xmm1, %xmm2, %xmm2			; AVX2-NEXT: vpsrlvq %xmm1, %xmm2, %xmm2
	; AVX2-NEXT: vpsrlvq %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpsrlvq %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpxor %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpsubq %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpsubq %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; XOP-LABEL: var_shift_v2i64:			; XOP-LABEL: var_shift_v2i64:
	; XOP: # %bb.0:			; XOP: # %bb.0:
	▲ Show 20 Lines • Show All 549 Lines • ▼ Show 20 Lines
	; SSE: # %bb.0:			; SSE: # %bb.0:
	; SSE-NEXT: movdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]			; SSE-NEXT: movdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
	; SSE-NEXT: psrlq %xmm1, %xmm2			; SSE-NEXT: psrlq %xmm1, %xmm2
	; SSE-NEXT: psrlq %xmm1, %xmm0			; SSE-NEXT: psrlq %xmm1, %xmm0
	; SSE-NEXT: pxor %xmm2, %xmm0			; SSE-NEXT: pxor %xmm2, %xmm0
	; SSE-NEXT: psubq %xmm2, %xmm0			; SSE-NEXT: psubq %xmm2, %xmm0
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX-LABEL: splatvar_shift_v2i64:			; AVX1-LABEL: splatvar_shift_v2i64:
	; AVX: # %bb.0:			; AVX1: # %bb.0:
	; AVX-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
	; AVX-NEXT: vpsrlq %xmm1, %xmm2, %xmm2			; AVX1-NEXT: vpsrlq %xmm1, %xmm2, %xmm2
	; AVX-NEXT: vpsrlq %xmm1, %xmm0, %xmm0			; AVX1-NEXT: vpsrlq %xmm1, %xmm0, %xmm0
	; AVX-NEXT: vpxor %xmm2, %xmm0, %xmm0			; AVX1-NEXT: vpxor %xmm2, %xmm0, %xmm0
	; AVX-NEXT: vpsubq %xmm2, %xmm0, %xmm0			; AVX1-NEXT: vpsubq %xmm2, %xmm0, %xmm0
	; AVX-NEXT: retq			; AVX1-NEXT: retq
				;
				; AVX2-LABEL: splatvar_shift_v2i64:
				; AVX2: # %bb.0:
				; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
				; AVX2-NEXT: vpsrlq %xmm1, %xmm2, %xmm2
				; AVX2-NEXT: vpsrlq %xmm1, %xmm0, %xmm0
				; AVX2-NEXT: vpxor %xmm2, %xmm0, %xmm0
				; AVX2-NEXT: vpsubq %xmm2, %xmm0, %xmm0
				; AVX2-NEXT: retq
	;			;
	; XOPAVX1-LABEL: splatvar_shift_v2i64:			; XOPAVX1-LABEL: splatvar_shift_v2i64:
	; XOPAVX1: # %bb.0:			; XOPAVX1: # %bb.0:
	; XOPAVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2			; XOPAVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2
	; XOPAVX1-NEXT: vpsubq %xmm1, %xmm2, %xmm1			; XOPAVX1-NEXT: vpsubq %xmm1, %xmm2, %xmm1
	; XOPAVX1-NEXT: vpshufd {{.*#+}} xmm1 = xmm1[0,1,0,1]			; XOPAVX1-NEXT: vpshufd {{.*#+}} xmm1 = xmm1[0,1,0,1]
	; XOPAVX1-NEXT: vpshaq %xmm1, %xmm0, %xmm0			; XOPAVX1-NEXT: vpshaq %xmm1, %xmm0, %xmm0
	; XOPAVX1-NEXT: retq			; XOPAVX1-NEXT: retq
	▲ Show 20 Lines • Show All 277 Lines • ▼ Show 20 Lines
	; SSE-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1			; SSE-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1
	; SSE-NEXT: movdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]			; SSE-NEXT: movdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
	; SSE-NEXT: psrlq %xmm1, %xmm2			; SSE-NEXT: psrlq %xmm1, %xmm2
	; SSE-NEXT: psrlq %xmm1, %xmm0			; SSE-NEXT: psrlq %xmm1, %xmm0
	; SSE-NEXT: pxor %xmm2, %xmm0			; SSE-NEXT: pxor %xmm2, %xmm0
	; SSE-NEXT: psubq %xmm2, %xmm0			; SSE-NEXT: psubq %xmm2, %xmm0
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX-LABEL: splatvar_modulo_shift_v2i64:			; AVX1-LABEL: splatvar_modulo_shift_v2i64:
	; AVX: # %bb.0:			; AVX1: # %bb.0:
	; AVX-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1			; AVX1-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1
	; AVX-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
	; AVX-NEXT: vpsrlq %xmm1, %xmm2, %xmm2			; AVX1-NEXT: vpsrlq %xmm1, %xmm2, %xmm2
	; AVX-NEXT: vpsrlq %xmm1, %xmm0, %xmm0			; AVX1-NEXT: vpsrlq %xmm1, %xmm0, %xmm0
	; AVX-NEXT: vpxor %xmm2, %xmm0, %xmm0			; AVX1-NEXT: vpxor %xmm2, %xmm0, %xmm0
	; AVX-NEXT: vpsubq %xmm2, %xmm0, %xmm0			; AVX1-NEXT: vpsubq %xmm2, %xmm0, %xmm0
	; AVX-NEXT: retq			; AVX1-NEXT: retq
				;
				; AVX2-LABEL: splatvar_modulo_shift_v2i64:
				; AVX2: # %bb.0:
				; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm2 = [63,63]
				; AVX2-NEXT: vpand %xmm2, %xmm1, %xmm1
				; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
				; AVX2-NEXT: vpsrlq %xmm1, %xmm2, %xmm2
				; AVX2-NEXT: vpsrlq %xmm1, %xmm0, %xmm0
				; AVX2-NEXT: vpxor %xmm2, %xmm0, %xmm0
				; AVX2-NEXT: vpsubq %xmm2, %xmm0, %xmm0
				; AVX2-NEXT: retq
	;			;
	; XOPAVX1-LABEL: splatvar_modulo_shift_v2i64:			; XOPAVX1-LABEL: splatvar_modulo_shift_v2i64:
	; XOPAVX1: # %bb.0:			; XOPAVX1: # %bb.0:
	; XOPAVX1-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1			; XOPAVX1-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1
	; XOPAVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2			; XOPAVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2
	; XOPAVX1-NEXT: vpsubq %xmm1, %xmm2, %xmm1			; XOPAVX1-NEXT: vpsubq %xmm1, %xmm2, %xmm1
	; XOPAVX1-NEXT: vpshufd {{.*#+}} xmm1 = xmm1[0,1,0,1]			; XOPAVX1-NEXT: vpshufd {{.*#+}} xmm1 = xmm1[0,1,0,1]
	; XOPAVX1-NEXT: vpshaq %xmm1, %xmm0, %xmm0			; XOPAVX1-NEXT: vpshaq %xmm1, %xmm0, %xmm0
	; XOPAVX1-NEXT: retq			; XOPAVX1-NEXT: retq
	;			;
	; XOPAVX2-LABEL: splatvar_modulo_shift_v2i64:			; XOPAVX2-LABEL: splatvar_modulo_shift_v2i64:
	; XOPAVX2: # %bb.0:			; XOPAVX2: # %bb.0:
	; XOPAVX2-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1			; XOPAVX2-NEXT: vpbroadcastq {{.*#+}} xmm2 = [63,63]
				; XOPAVX2-NEXT: vpand %xmm2, %xmm1, %xmm1
	; XOPAVX2-NEXT: vpbroadcastq %xmm1, %xmm1			; XOPAVX2-NEXT: vpbroadcastq %xmm1, %xmm1
	; XOPAVX2-NEXT: vpxor %xmm2, %xmm2, %xmm2			; XOPAVX2-NEXT: vpxor %xmm2, %xmm2, %xmm2
	; XOPAVX2-NEXT: vpsubq %xmm1, %xmm2, %xmm1			; XOPAVX2-NEXT: vpsubq %xmm1, %xmm2, %xmm1
	; XOPAVX2-NEXT: vpshaq %xmm1, %xmm0, %xmm0			; XOPAVX2-NEXT: vpshaq %xmm1, %xmm0, %xmm0
	; XOPAVX2-NEXT: retq			; XOPAVX2-NEXT: retq
	;			;
	; AVX512-LABEL: splatvar_modulo_shift_v2i64:			; AVX512-LABEL: splatvar_modulo_shift_v2i64:
	; AVX512: # %bb.0:			; AVX512: # %bb.0:
	▲ Show 20 Lines • Show All 630 Lines • ▼ Show 20 Lines
	;			;
	; AVX2-LABEL: splatconstant_shift_v2i64:			; AVX2-LABEL: splatconstant_shift_v2i64:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpsrad $7, %xmm0, %xmm1			; AVX2-NEXT: vpsrad $7, %xmm0, %xmm1
	; AVX2-NEXT: vpsrlq $7, %xmm0, %xmm0			; AVX2-NEXT: vpsrlq $7, %xmm0, %xmm0
	; AVX2-NEXT: vpblendd {{.*#+}} xmm0 = xmm0[0],xmm1[1],xmm0[2],xmm1[3]			; AVX2-NEXT: vpblendd {{.*#+}} xmm0 = xmm0[0],xmm1[1],xmm0[2],xmm1[3]
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; XOP-LABEL: splatconstant_shift_v2i64:			; XOPAVX1-LABEL: splatconstant_shift_v2i64:
	; XOP: # %bb.0:			; XOPAVX1: # %bb.0:
	; XOP-NEXT: vpshaq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; XOPAVX1-NEXT: vpshaq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; XOP-NEXT: retq			; XOPAVX1-NEXT: retq
				;
				; XOPAVX2-LABEL: splatconstant_shift_v2i64:
				; XOPAVX2: # %bb.0:
				; XOPAVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [18446744073709551609,18446744073709551609]
				; XOPAVX2-NEXT: vpshaq %xmm1, %xmm0, %xmm0
				; XOPAVX2-NEXT: retq
	;			;
	; AVX512-LABEL: splatconstant_shift_v2i64:			; AVX512-LABEL: splatconstant_shift_v2i64:
	; AVX512: # %bb.0:			; AVX512: # %bb.0:
	; AVX512-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512-NEXT: vpsraq $7, %zmm0, %zmm0			; AVX512-NEXT: vpsraq $7, %zmm0, %zmm0
	; AVX512-NEXT: # kill: def $xmm0 killed $xmm0 killed $zmm0			; AVX512-NEXT: # kill: def $xmm0 killed $xmm0 killed $zmm0
	; AVX512-NEXT: vzeroupper			; AVX512-NEXT: vzeroupper
	; AVX512-NEXT: retq			; AVX512-NEXT: retq
	▲ Show 20 Lines • Show All 143 Lines • ▼ Show 20 Lines
	; SSE-NEXT: movd %edi, %xmm1			; SSE-NEXT: movd %edi, %xmm1
	; SSE-NEXT: movdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]			; SSE-NEXT: movdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
	; SSE-NEXT: psrlq %xmm1, %xmm2			; SSE-NEXT: psrlq %xmm1, %xmm2
	; SSE-NEXT: psrlq %xmm1, %xmm0			; SSE-NEXT: psrlq %xmm1, %xmm0
	; SSE-NEXT: pxor %xmm2, %xmm0			; SSE-NEXT: pxor %xmm2, %xmm0
	; SSE-NEXT: psubq %xmm2, %xmm0			; SSE-NEXT: psubq %xmm2, %xmm0
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX-LABEL: PR52719:			; AVX1-LABEL: PR52719:
	; AVX: # %bb.0:			; AVX1: # %bb.0:
	; AVX-NEXT: vmovd %edi, %xmm1			; AVX1-NEXT: vmovd %edi, %xmm1
	; AVX-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
	; AVX-NEXT: vpsrlq %xmm1, %xmm2, %xmm2			; AVX1-NEXT: vpsrlq %xmm1, %xmm2, %xmm2
	; AVX-NEXT: vpsrlq %xmm1, %xmm0, %xmm0			; AVX1-NEXT: vpsrlq %xmm1, %xmm0, %xmm0
	; AVX-NEXT: vpxor %xmm2, %xmm0, %xmm0			; AVX1-NEXT: vpxor %xmm2, %xmm0, %xmm0
	; AVX-NEXT: vpsubq %xmm2, %xmm0, %xmm0			; AVX1-NEXT: vpsubq %xmm2, %xmm0, %xmm0
	; AVX-NEXT: retq			; AVX1-NEXT: retq
				;
				; AVX2-LABEL: PR52719:
				; AVX2: # %bb.0:
				; AVX2-NEXT: vmovd %edi, %xmm1
				; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
				; AVX2-NEXT: vpsrlq %xmm1, %xmm2, %xmm2
				; AVX2-NEXT: vpsrlq %xmm1, %xmm0, %xmm0
				; AVX2-NEXT: vpxor %xmm2, %xmm0, %xmm0
				; AVX2-NEXT: vpsubq %xmm2, %xmm0, %xmm0
				; AVX2-NEXT: retq
	;			;
	; XOPAVX1-LABEL: PR52719:			; XOPAVX1-LABEL: PR52719:
	; XOPAVX1: # %bb.0:			; XOPAVX1: # %bb.0:
	; XOPAVX1-NEXT: vmovd %edi, %xmm1			; XOPAVX1-NEXT: vmovd %edi, %xmm1
	; XOPAVX1-NEXT: vpshufd {{.*#+}} xmm1 = xmm1[0,1,0,1]			; XOPAVX1-NEXT: vpshufd {{.*#+}} xmm1 = xmm1[0,1,0,1]
	; XOPAVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2			; XOPAVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2
	; XOPAVX1-NEXT: vpsubq %xmm1, %xmm2, %xmm1			; XOPAVX1-NEXT: vpsubq %xmm1, %xmm2, %xmm1
	; XOPAVX1-NEXT: vpshaq %xmm1, %xmm0, %xmm0			; XOPAVX1-NEXT: vpshaq %xmm1, %xmm0, %xmm0
	▲ Show 20 Lines • Show All 41 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vector-shift-ashr-256.ll

	Show First 20 Lines • Show All 1,016 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: vpsrlq %xmm1, %xmm0, %xmm0			; AVX1-NEXT: vpsrlq %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vpxor %xmm2, %xmm0, %xmm0			; AVX1-NEXT: vpxor %xmm2, %xmm0, %xmm0
	; AVX1-NEXT: vpsubq %xmm2, %xmm0, %xmm0			; AVX1-NEXT: vpsubq %xmm2, %xmm0, %xmm0
	; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm0, %ymm0			; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm0, %ymm0
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: splatvar_modulo_shift_v4i64:			; AVX2-LABEL: splatvar_modulo_shift_v4i64:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm2 = [63,63]
				; AVX2-NEXT: vpand %xmm2, %xmm1, %xmm1
	; AVX2-NEXT: vpbroadcastq {{.*#+}} ymm2 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]			; AVX2-NEXT: vpbroadcastq {{.*#+}} ymm2 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]
	; AVX2-NEXT: vpsrlq %xmm1, %ymm2, %ymm2			; AVX2-NEXT: vpsrlq %xmm1, %ymm2, %ymm2
	; AVX2-NEXT: vpsrlq %xmm1, %ymm0, %ymm0			; AVX2-NEXT: vpsrlq %xmm1, %ymm0, %ymm0
	; AVX2-NEXT: vpxor %ymm2, %ymm0, %ymm0			; AVX2-NEXT: vpxor %ymm2, %ymm0, %ymm0
	; AVX2-NEXT: vpsubq %ymm2, %ymm0, %ymm0			; AVX2-NEXT: vpsubq %ymm2, %ymm0, %ymm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; XOPAVX1-LABEL: splatvar_modulo_shift_v4i64:			; XOPAVX1-LABEL: splatvar_modulo_shift_v4i64:
	; XOPAVX1: # %bb.0:			; XOPAVX1: # %bb.0:
	; XOPAVX1-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1			; XOPAVX1-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1
	; XOPAVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2			; XOPAVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2
	; XOPAVX1-NEXT: vpsubq %xmm1, %xmm2, %xmm1			; XOPAVX1-NEXT: vpsubq %xmm1, %xmm2, %xmm1
	; XOPAVX1-NEXT: vpshufd {{.*#+}} xmm1 = xmm1[0,1,0,1]			; XOPAVX1-NEXT: vpshufd {{.*#+}} xmm1 = xmm1[0,1,0,1]
	; XOPAVX1-NEXT: vextractf128 $1, %ymm0, %xmm2			; XOPAVX1-NEXT: vextractf128 $1, %ymm0, %xmm2
	; XOPAVX1-NEXT: vpshaq %xmm1, %xmm2, %xmm2			; XOPAVX1-NEXT: vpshaq %xmm1, %xmm2, %xmm2
	; XOPAVX1-NEXT: vpshaq %xmm1, %xmm0, %xmm0			; XOPAVX1-NEXT: vpshaq %xmm1, %xmm0, %xmm0
	; XOPAVX1-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0			; XOPAVX1-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0
	; XOPAVX1-NEXT: retq			; XOPAVX1-NEXT: retq
	;			;
	; XOPAVX2-LABEL: splatvar_modulo_shift_v4i64:			; XOPAVX2-LABEL: splatvar_modulo_shift_v4i64:
	; XOPAVX2: # %bb.0:			; XOPAVX2: # %bb.0:
	; XOPAVX2-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1			; XOPAVX2-NEXT: vpbroadcastq {{.*#+}} xmm2 = [63,63]
				; XOPAVX2-NEXT: vpand %xmm2, %xmm1, %xmm1
	; XOPAVX2-NEXT: vpbroadcastq {{.*#+}} ymm2 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]			; XOPAVX2-NEXT: vpbroadcastq {{.*#+}} ymm2 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]
	; XOPAVX2-NEXT: vpsrlq %xmm1, %ymm2, %ymm2			; XOPAVX2-NEXT: vpsrlq %xmm1, %ymm2, %ymm2
	; XOPAVX2-NEXT: vpsrlq %xmm1, %ymm0, %ymm0			; XOPAVX2-NEXT: vpsrlq %xmm1, %ymm0, %ymm0
	; XOPAVX2-NEXT: vpxor %ymm2, %ymm0, %ymm0			; XOPAVX2-NEXT: vpxor %ymm2, %ymm0, %ymm0
	; XOPAVX2-NEXT: vpsubq %ymm2, %ymm0, %ymm0			; XOPAVX2-NEXT: vpsubq %ymm2, %ymm0, %ymm0
	; XOPAVX2-NEXT: retq			; XOPAVX2-NEXT: retq
	;			;
	; AVX512-LABEL: splatvar_modulo_shift_v4i64:			; AVX512-LABEL: splatvar_modulo_shift_v4i64:
	▲ Show 20 Lines • Show All 1,144 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vector-shift-lshr-128.ll

	Show First 20 Lines • Show All 769 Lines • ▼ Show 20 Lines

	define <2 x i64> @splatvar_modulo_shift_v2i64(<2 x i64> %a, <2 x i64> %b) nounwind {			define <2 x i64> @splatvar_modulo_shift_v2i64(<2 x i64> %a, <2 x i64> %b) nounwind {
	; SSE-LABEL: splatvar_modulo_shift_v2i64:			; SSE-LABEL: splatvar_modulo_shift_v2i64:
	; SSE: # %bb.0:			; SSE: # %bb.0:
	; SSE-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1			; SSE-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1
	; SSE-NEXT: psrlq %xmm1, %xmm0			; SSE-NEXT: psrlq %xmm1, %xmm0
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX-LABEL: splatvar_modulo_shift_v2i64:			; AVX1-LABEL: splatvar_modulo_shift_v2i64:
	; AVX: # %bb.0:			; AVX1: # %bb.0:
	; AVX-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1			; AVX1-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1
	; AVX-NEXT: vpsrlq %xmm1, %xmm0, %xmm0			; AVX1-NEXT: vpsrlq %xmm1, %xmm0, %xmm0
	; AVX-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; XOP-LABEL: splatvar_modulo_shift_v2i64:			; AVX2-LABEL: splatvar_modulo_shift_v2i64:
	; XOP: # %bb.0:			; AVX2: # %bb.0:
	; XOP-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm2 = [63,63]
	; XOP-NEXT: vpsrlq %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm2, %xmm1, %xmm1
	; XOP-NEXT: retq			; AVX2-NEXT: vpsrlq %xmm1, %xmm0, %xmm0
				; AVX2-NEXT: retq
				;
				; XOPAVX1-LABEL: splatvar_modulo_shift_v2i64:
				; XOPAVX1: # %bb.0:
				; XOPAVX1-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1
				; XOPAVX1-NEXT: vpsrlq %xmm1, %xmm0, %xmm0
				; XOPAVX1-NEXT: retq
				;
				; XOPAVX2-LABEL: splatvar_modulo_shift_v2i64:
				; XOPAVX2: # %bb.0:
				; XOPAVX2-NEXT: vpbroadcastq {{.*#+}} xmm2 = [63,63]
				; XOPAVX2-NEXT: vpand %xmm2, %xmm1, %xmm1
				; XOPAVX2-NEXT: vpsrlq %xmm1, %xmm0, %xmm0
				; XOPAVX2-NEXT: retq
	;			;
	; AVX512-LABEL: splatvar_modulo_shift_v2i64:			; AVX512-LABEL: splatvar_modulo_shift_v2i64:
	; AVX512: # %bb.0:			; AVX512: # %bb.0:
	; AVX512-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1			; AVX512-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1
	; AVX512-NEXT: vpsrlq %xmm1, %xmm0, %xmm0			; AVX512-NEXT: vpsrlq %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: retq			; AVX512-NEXT: retq
	;			;
	; AVX512VL-LABEL: splatvar_modulo_shift_v2i64:			; AVX512VL-LABEL: splatvar_modulo_shift_v2i64:
	▲ Show 20 Lines • Show All 821 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vector-shift-lshr-256.ll

	Show First 20 Lines • Show All 826 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1			; AVX1-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1
	; AVX1-NEXT: vpsrlq %xmm1, %xmm2, %xmm2			; AVX1-NEXT: vpsrlq %xmm1, %xmm2, %xmm2
	; AVX1-NEXT: vpsrlq %xmm1, %xmm0, %xmm0			; AVX1-NEXT: vpsrlq %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0			; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: splatvar_modulo_shift_v4i64:			; AVX2-LABEL: splatvar_modulo_shift_v4i64:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm2 = [63,63]
				; AVX2-NEXT: vpand %xmm2, %xmm1, %xmm1
	; AVX2-NEXT: vpsrlq %xmm1, %ymm0, %ymm0			; AVX2-NEXT: vpsrlq %xmm1, %ymm0, %ymm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; XOPAVX1-LABEL: splatvar_modulo_shift_v4i64:			; XOPAVX1-LABEL: splatvar_modulo_shift_v4i64:
	; XOPAVX1: # %bb.0:			; XOPAVX1: # %bb.0:
	; XOPAVX1-NEXT: vextractf128 $1, %ymm0, %xmm2			; XOPAVX1-NEXT: vextractf128 $1, %ymm0, %xmm2
	; XOPAVX1-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1			; XOPAVX1-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1
	; XOPAVX1-NEXT: vpsrlq %xmm1, %xmm2, %xmm2			; XOPAVX1-NEXT: vpsrlq %xmm1, %xmm2, %xmm2
	; XOPAVX1-NEXT: vpsrlq %xmm1, %xmm0, %xmm0			; XOPAVX1-NEXT: vpsrlq %xmm1, %xmm0, %xmm0
	; XOPAVX1-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0			; XOPAVX1-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0
	; XOPAVX1-NEXT: retq			; XOPAVX1-NEXT: retq
	;			;
	; XOPAVX2-LABEL: splatvar_modulo_shift_v4i64:			; XOPAVX2-LABEL: splatvar_modulo_shift_v4i64:
	; XOPAVX2: # %bb.0:			; XOPAVX2: # %bb.0:
	; XOPAVX2-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1			; XOPAVX2-NEXT: vpbroadcastq {{.*#+}} xmm2 = [63,63]
				; XOPAVX2-NEXT: vpand %xmm2, %xmm1, %xmm1
	; XOPAVX2-NEXT: vpsrlq %xmm1, %ymm0, %ymm0			; XOPAVX2-NEXT: vpsrlq %xmm1, %ymm0, %ymm0
	; XOPAVX2-NEXT: retq			; XOPAVX2-NEXT: retq
	;			;
	; AVX512-LABEL: splatvar_modulo_shift_v4i64:			; AVX512-LABEL: splatvar_modulo_shift_v4i64:
	; AVX512: # %bb.0:			; AVX512: # %bb.0:
	; AVX512-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1			; AVX512-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1
	; AVX512-NEXT: vpsrlq %xmm1, %ymm0, %ymm0			; AVX512-NEXT: vpsrlq %xmm1, %ymm0, %ymm0
	; AVX512-NEXT: retq			; AVX512-NEXT: retq
	▲ Show 20 Lines • Show All 983 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vector-shift-shl-128.ll

	Show First 20 Lines • Show All 676 Lines • ▼ Show 20 Lines

	define <2 x i64> @splatvar_modulo_shift_v2i64(<2 x i64> %a, <2 x i64> %b) nounwind {			define <2 x i64> @splatvar_modulo_shift_v2i64(<2 x i64> %a, <2 x i64> %b) nounwind {
	; SSE-LABEL: splatvar_modulo_shift_v2i64:			; SSE-LABEL: splatvar_modulo_shift_v2i64:
	; SSE: # %bb.0:			; SSE: # %bb.0:
	; SSE-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1			; SSE-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1
	; SSE-NEXT: psllq %xmm1, %xmm0			; SSE-NEXT: psllq %xmm1, %xmm0
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX-LABEL: splatvar_modulo_shift_v2i64:			; AVX1-LABEL: splatvar_modulo_shift_v2i64:
	; AVX: # %bb.0:			; AVX1: # %bb.0:
	; AVX-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1			; AVX1-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1
	; AVX-NEXT: vpsllq %xmm1, %xmm0, %xmm0			; AVX1-NEXT: vpsllq %xmm1, %xmm0, %xmm0
	; AVX-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; XOP-LABEL: splatvar_modulo_shift_v2i64:			; AVX2-LABEL: splatvar_modulo_shift_v2i64:
	; XOP: # %bb.0:			; AVX2: # %bb.0:
	; XOP-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm2 = [63,63]
	; XOP-NEXT: vpsllq %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpand %xmm2, %xmm1, %xmm1
	; XOP-NEXT: retq			; AVX2-NEXT: vpsllq %xmm1, %xmm0, %xmm0
				; AVX2-NEXT: retq
				;
				; XOPAVX1-LABEL: splatvar_modulo_shift_v2i64:
				; XOPAVX1: # %bb.0:
				; XOPAVX1-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1
				; XOPAVX1-NEXT: vpsllq %xmm1, %xmm0, %xmm0
				; XOPAVX1-NEXT: retq
				;
				; XOPAVX2-LABEL: splatvar_modulo_shift_v2i64:
				; XOPAVX2: # %bb.0:
				; XOPAVX2-NEXT: vpbroadcastq {{.*#+}} xmm2 = [63,63]
				; XOPAVX2-NEXT: vpand %xmm2, %xmm1, %xmm1
				; XOPAVX2-NEXT: vpsllq %xmm1, %xmm0, %xmm0
				; XOPAVX2-NEXT: retq
	;			;
	; AVX512-LABEL: splatvar_modulo_shift_v2i64:			; AVX512-LABEL: splatvar_modulo_shift_v2i64:
	; AVX512: # %bb.0:			; AVX512: # %bb.0:
	; AVX512-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1			; AVX512-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1
	; AVX512-NEXT: vpsllq %xmm1, %xmm0, %xmm0			; AVX512-NEXT: vpsllq %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: retq			; AVX512-NEXT: retq
	;			;
	; AVX512VL-LABEL: splatvar_modulo_shift_v2i64:			; AVX512VL-LABEL: splatvar_modulo_shift_v2i64:
	▲ Show 20 Lines • Show All 637 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vector-shift-shl-256.ll

	Show First 20 Lines • Show All 751 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1			; AVX1-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1
	; AVX1-NEXT: vpsllq %xmm1, %xmm2, %xmm2			; AVX1-NEXT: vpsllq %xmm1, %xmm2, %xmm2
	; AVX1-NEXT: vpsllq %xmm1, %xmm0, %xmm0			; AVX1-NEXT: vpsllq %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0			; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: splatvar_modulo_shift_v4i64:			; AVX2-LABEL: splatvar_modulo_shift_v4i64:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm2 = [63,63]
				; AVX2-NEXT: vpand %xmm2, %xmm1, %xmm1
	; AVX2-NEXT: vpsllq %xmm1, %ymm0, %ymm0			; AVX2-NEXT: vpsllq %xmm1, %ymm0, %ymm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; XOPAVX1-LABEL: splatvar_modulo_shift_v4i64:			; XOPAVX1-LABEL: splatvar_modulo_shift_v4i64:
	; XOPAVX1: # %bb.0:			; XOPAVX1: # %bb.0:
	; XOPAVX1-NEXT: vextractf128 $1, %ymm0, %xmm2			; XOPAVX1-NEXT: vextractf128 $1, %ymm0, %xmm2
	; XOPAVX1-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1			; XOPAVX1-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1
	; XOPAVX1-NEXT: vpsllq %xmm1, %xmm2, %xmm2			; XOPAVX1-NEXT: vpsllq %xmm1, %xmm2, %xmm2
	; XOPAVX1-NEXT: vpsllq %xmm1, %xmm0, %xmm0			; XOPAVX1-NEXT: vpsllq %xmm1, %xmm0, %xmm0
	; XOPAVX1-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0			; XOPAVX1-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0
	; XOPAVX1-NEXT: retq			; XOPAVX1-NEXT: retq
	;			;
	; XOPAVX2-LABEL: splatvar_modulo_shift_v4i64:			; XOPAVX2-LABEL: splatvar_modulo_shift_v4i64:
	; XOPAVX2: # %bb.0:			; XOPAVX2: # %bb.0:
	; XOPAVX2-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1			; XOPAVX2-NEXT: vpbroadcastq {{.*#+}} xmm2 = [63,63]
				; XOPAVX2-NEXT: vpand %xmm2, %xmm1, %xmm1
	; XOPAVX2-NEXT: vpsllq %xmm1, %ymm0, %ymm0			; XOPAVX2-NEXT: vpsllq %xmm1, %ymm0, %ymm0
	; XOPAVX2-NEXT: retq			; XOPAVX2-NEXT: retq
	;			;
	; AVX512-LABEL: splatvar_modulo_shift_v4i64:			; AVX512-LABEL: splatvar_modulo_shift_v4i64:
	; AVX512: # %bb.0:			; AVX512: # %bb.0:
	; AVX512-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1			; AVX512-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1
	; AVX512-NEXT: vpsllq %xmm1, %ymm0, %ymm0			; AVX512-NEXT: vpsllq %xmm1, %ymm0, %ymm0
	; AVX512-NEXT: retq			; AVX512-NEXT: retq
	▲ Show 20 Lines • Show All 863 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vector-trunc-packus.ll

	Show First 20 Lines • Show All 101 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: pcmpgtd %xmm3, %xmm4			; SSE41-NEXT: pcmpgtd %xmm3, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[0,0,2,2]
	; SSE41-NEXT: pand %xmm5, %xmm0			; SSE41-NEXT: pand %xmm5, %xmm0
	; SSE41-NEXT: por %xmm4, %xmm0			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[0,2,2,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[0,2,2,3]
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX-LABEL: trunc_packus_v2i64_v2i32:			; AVX1-LABEL: trunc_packus_v2i64_v2i32:
	; AVX: # %bb.0:			; AVX1: # %bb.0:
	; AVX-NEXT: vmovdqa {{.*#+}} xmm1 = [4294967295,4294967295]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm1 = [4294967295,4294967295]
	; AVX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2
	; AVX-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0			; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX1-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm1			; AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm1
	; AVX-NEXT: vpand %xmm0, %xmm1, %xmm0			; AVX1-NEXT: vpand %xmm0, %xmm1, %xmm0
	; AVX-NEXT: vpshufd {{.*#+}} xmm0 = xmm0[0,2,2,3]			; AVX1-NEXT: vpshufd {{.*#+}} xmm0 = xmm0[0,2,2,3]
	; AVX-NEXT: retq			; AVX1-NEXT: retq
				;
				; AVX2-LABEL: trunc_packus_v2i64_v2i32:
				; AVX2: # %bb.0:
				; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [4294967295,4294967295]
				; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2
				; AVX2-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
				; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
				; AVX2-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm1
				; AVX2-NEXT: vpand %xmm0, %xmm1, %xmm0
				; AVX2-NEXT: vpshufd {{.*#+}} xmm0 = xmm0[0,2,2,3]
				; AVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: trunc_packus_v2i64_v2i32:			; AVX512F-LABEL: trunc_packus_v2i64_v2i32:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512F-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX512F-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX512F-NEXT: vpmaxsq %zmm1, %zmm0, %zmm0			; AVX512F-NEXT: vpmaxsq %zmm1, %zmm0, %zmm0
	; AVX512F-NEXT: vpmovusqd %zmm0, %ymm0			; AVX512F-NEXT: vpmovusqd %zmm0, %ymm0
	; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 killed $ymm0			; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 killed $ymm0
	▲ Show 20 Lines • Show All 124 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[0,0,2,2]
	; SSE41-NEXT: pand %xmm5, %xmm0			; SSE41-NEXT: pand %xmm5, %xmm0
	; SSE41-NEXT: por %xmm4, %xmm0			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[0,2,2,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[0,2,2,3]
	; SSE41-NEXT: movq %xmm0, (%rdi)			; SSE41-NEXT: movq %xmm0, (%rdi)
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX-LABEL: trunc_packus_v2i64_v2i32_store:			; AVX1-LABEL: trunc_packus_v2i64_v2i32_store:
	; AVX: # %bb.0:			; AVX1: # %bb.0:
	; AVX-NEXT: vmovdqa {{.*#+}} xmm1 = [4294967295,4294967295]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm1 = [4294967295,4294967295]
	; AVX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2
	; AVX-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0			; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX1-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm1			; AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm1
	; AVX-NEXT: vpand %xmm0, %xmm1, %xmm0			; AVX1-NEXT: vpand %xmm0, %xmm1, %xmm0
	; AVX-NEXT: vpshufd {{.*#+}} xmm0 = xmm0[0,2,2,3]			; AVX1-NEXT: vpshufd {{.*#+}} xmm0 = xmm0[0,2,2,3]
	; AVX-NEXT: vmovq %xmm0, (%rdi)			; AVX1-NEXT: vmovq %xmm0, (%rdi)
	; AVX-NEXT: retq			; AVX1-NEXT: retq
				;
				; AVX2-LABEL: trunc_packus_v2i64_v2i32_store:
				; AVX2: # %bb.0:
				; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [4294967295,4294967295]
				; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2
				; AVX2-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
				; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
				; AVX2-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm1
				; AVX2-NEXT: vpand %xmm0, %xmm1, %xmm0
				; AVX2-NEXT: vpshufd {{.*#+}} xmm0 = xmm0[0,2,2,3]
				; AVX2-NEXT: vmovq %xmm0, (%rdi)
				; AVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: trunc_packus_v2i64_v2i32_store:			; AVX512F-LABEL: trunc_packus_v2i64_v2i32_store:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512F-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX512F-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX512F-NEXT: vpmaxsq %zmm1, %zmm0, %zmm0			; AVX512F-NEXT: vpmaxsq %zmm1, %zmm0, %zmm0
	; AVX512F-NEXT: vpmovusqd %zmm0, %ymm0			; AVX512F-NEXT: vpmovusqd %zmm0, %ymm0
	; AVX512F-NEXT: vmovq %xmm0, (%rdi)			; AVX512F-NEXT: vmovq %xmm0, (%rdi)
	▲ Show 20 Lines • Show All 831 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm1			; AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm1
	; AVX1-NEXT: vpand %xmm0, %xmm1, %xmm0			; AVX1-NEXT: vpand %xmm0, %xmm1, %xmm0
	; AVX1-NEXT: vpshufd {{.*#+}} xmm0 = xmm0[0,2,2,3]			; AVX1-NEXT: vpshufd {{.*#+}} xmm0 = xmm0[0,2,2,3]
	; AVX1-NEXT: vpshuflw {{.*#+}} xmm0 = xmm0[0,2,2,3,4,5,6,7]			; AVX1-NEXT: vpshuflw {{.*#+}} xmm0 = xmm0[0,2,2,3,4,5,6,7]
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-SLOW-LABEL: trunc_packus_v2i64_v2i16:			; AVX2-SLOW-LABEL: trunc_packus_v2i64_v2i16:
	; AVX2-SLOW: # %bb.0:			; AVX2-SLOW: # %bb.0:
	; AVX2-SLOW-NEXT: vmovdqa {{.*#+}} xmm1 = [65535,65535]			; AVX2-SLOW-NEXT: vpbroadcastq {{.*#+}} xmm1 = [65535,65535]
	; AVX2-SLOW-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2			; AVX2-SLOW-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2
	; AVX2-SLOW-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0			; AVX2-SLOW-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX2-SLOW-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-SLOW-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-SLOW-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm1			; AVX2-SLOW-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm1
	; AVX2-SLOW-NEXT: vpand %xmm0, %xmm1, %xmm0			; AVX2-SLOW-NEXT: vpand %xmm0, %xmm1, %xmm0
	; AVX2-SLOW-NEXT: vpshufd {{.*#+}} xmm0 = xmm0[0,2,2,3]			; AVX2-SLOW-NEXT: vpshufd {{.*#+}} xmm0 = xmm0[0,2,2,3]
	; AVX2-SLOW-NEXT: vpshuflw {{.*#+}} xmm0 = xmm0[0,2,2,3,4,5,6,7]			; AVX2-SLOW-NEXT: vpshuflw {{.*#+}} xmm0 = xmm0[0,2,2,3,4,5,6,7]
	; AVX2-SLOW-NEXT: retq			; AVX2-SLOW-NEXT: retq
	;			;
	; AVX2-FAST-LABEL: trunc_packus_v2i64_v2i16:			; AVX2-FAST-LABEL: trunc_packus_v2i64_v2i16:
	; AVX2-FAST: # %bb.0:			; AVX2-FAST: # %bb.0:
	; AVX2-FAST-NEXT: vmovdqa {{.*#+}} xmm1 = [65535,65535]			; AVX2-FAST-NEXT: vpbroadcastq {{.*#+}} xmm1 = [65535,65535]
	; AVX2-FAST-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2			; AVX2-FAST-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2
	; AVX2-FAST-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0			; AVX2-FAST-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX2-FAST-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-FAST-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-FAST-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm1			; AVX2-FAST-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm1
	; AVX2-FAST-NEXT: vpand %xmm0, %xmm1, %xmm0			; AVX2-FAST-NEXT: vpand %xmm0, %xmm1, %xmm0
	; AVX2-FAST-NEXT: vpshufb {{.*#+}} xmm0 = xmm0[0,1,8,9,8,9,10,11,8,9,10,11,12,13,14,15]			; AVX2-FAST-NEXT: vpshufb {{.*#+}} xmm0 = xmm0[0,1,8,9,8,9,10,11,8,9,10,11,12,13,14,15]
	; AVX2-FAST-NEXT: retq			; AVX2-FAST-NEXT: retq
	;			;
	▲ Show 20 Lines • Show All 149 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: vpand %xmm0, %xmm1, %xmm0			; AVX1-NEXT: vpand %xmm0, %xmm1, %xmm0
	; AVX1-NEXT: vpshufd {{.*#+}} xmm0 = xmm0[0,2,2,3]			; AVX1-NEXT: vpshufd {{.*#+}} xmm0 = xmm0[0,2,2,3]
	; AVX1-NEXT: vpshuflw {{.*#+}} xmm0 = xmm0[0,2,2,3,4,5,6,7]			; AVX1-NEXT: vpshuflw {{.*#+}} xmm0 = xmm0[0,2,2,3,4,5,6,7]
	; AVX1-NEXT: vmovd %xmm0, (%rdi)			; AVX1-NEXT: vmovd %xmm0, (%rdi)
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-SLOW-LABEL: trunc_packus_v2i64_v2i16_store:			; AVX2-SLOW-LABEL: trunc_packus_v2i64_v2i16_store:
	; AVX2-SLOW: # %bb.0:			; AVX2-SLOW: # %bb.0:
	; AVX2-SLOW-NEXT: vmovdqa {{.*#+}} xmm1 = [65535,65535]			; AVX2-SLOW-NEXT: vpbroadcastq {{.*#+}} xmm1 = [65535,65535]
	; AVX2-SLOW-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2			; AVX2-SLOW-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2
	; AVX2-SLOW-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0			; AVX2-SLOW-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX2-SLOW-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-SLOW-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-SLOW-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm1			; AVX2-SLOW-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm1
	; AVX2-SLOW-NEXT: vpand %xmm0, %xmm1, %xmm0			; AVX2-SLOW-NEXT: vpand %xmm0, %xmm1, %xmm0
	; AVX2-SLOW-NEXT: vpshufd {{.*#+}} xmm0 = xmm0[0,2,2,3]			; AVX2-SLOW-NEXT: vpshufd {{.*#+}} xmm0 = xmm0[0,2,2,3]
	; AVX2-SLOW-NEXT: vpshuflw {{.*#+}} xmm0 = xmm0[0,2,2,3,4,5,6,7]			; AVX2-SLOW-NEXT: vpshuflw {{.*#+}} xmm0 = xmm0[0,2,2,3,4,5,6,7]
	; AVX2-SLOW-NEXT: vmovd %xmm0, (%rdi)			; AVX2-SLOW-NEXT: vmovd %xmm0, (%rdi)
	; AVX2-SLOW-NEXT: retq			; AVX2-SLOW-NEXT: retq
	;			;
	; AVX2-FAST-LABEL: trunc_packus_v2i64_v2i16_store:			; AVX2-FAST-LABEL: trunc_packus_v2i64_v2i16_store:
	; AVX2-FAST: # %bb.0:			; AVX2-FAST: # %bb.0:
	; AVX2-FAST-NEXT: vmovdqa {{.*#+}} xmm1 = [65535,65535]			; AVX2-FAST-NEXT: vpbroadcastq {{.*#+}} xmm1 = [65535,65535]
	; AVX2-FAST-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2			; AVX2-FAST-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2
	; AVX2-FAST-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0			; AVX2-FAST-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX2-FAST-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-FAST-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-FAST-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm1			; AVX2-FAST-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm1
	; AVX2-FAST-NEXT: vpand %xmm0, %xmm1, %xmm0			; AVX2-FAST-NEXT: vpand %xmm0, %xmm1, %xmm0
	; AVX2-FAST-NEXT: vpshufb {{.*#+}} xmm0 = xmm0[0,1,8,9,u,u,u,u,u,u,u,u,u,u,u,u]			; AVX2-FAST-NEXT: vpshufb {{.*#+}} xmm0 = xmm0[0,1,8,9,u,u,u,u,u,u,u,u,u,u,u,u]
	; AVX2-FAST-NEXT: vmovd %xmm0, (%rdi)			; AVX2-FAST-NEXT: vmovd %xmm0, (%rdi)
	; AVX2-FAST-NEXT: retq			; AVX2-FAST-NEXT: retq
	▲ Show 20 Lines • Show All 1,478 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[0,0,2,2]
	; SSE41-NEXT: pand %xmm5, %xmm0			; SSE41-NEXT: pand %xmm5, %xmm0
	; SSE41-NEXT: por %xmm4, %xmm0			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm1
	; SSE41-NEXT: pshufb {{.*#+}} xmm1 = xmm1[0,8,u,u,u,u,u,u,u,u,u,u,u,u,u,u]			; SSE41-NEXT: pshufb {{.*#+}} xmm1 = xmm1[0,8,u,u,u,u,u,u,u,u,u,u,u,u,u,u]
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX-LABEL: trunc_packus_v2i64_v2i8:			; AVX1-LABEL: trunc_packus_v2i64_v2i8:
	; AVX: # %bb.0:			; AVX1: # %bb.0:
	; AVX-NEXT: vmovdqa {{.*#+}} xmm1 = [255,255]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm1 = [255,255]
	; AVX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2
	; AVX-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0			; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX1-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm1			; AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm1
	; AVX-NEXT: vpand %xmm0, %xmm1, %xmm0			; AVX1-NEXT: vpand %xmm0, %xmm1, %xmm0
	; AVX-NEXT: vpshufb {{.*#+}} xmm0 = xmm0[0,8,u,u,u,u,u,u,u,u,u,u,u,u,u,u]			; AVX1-NEXT: vpshufb {{.*#+}} xmm0 = xmm0[0,8,u,u,u,u,u,u,u,u,u,u,u,u,u,u]
	; AVX-NEXT: retq			; AVX1-NEXT: retq
				;
				; AVX2-LABEL: trunc_packus_v2i64_v2i8:
				; AVX2: # %bb.0:
				; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [255,255]
				; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2
				; AVX2-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
				; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
				; AVX2-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm1
				; AVX2-NEXT: vpand %xmm0, %xmm1, %xmm0
				; AVX2-NEXT: vpshufb {{.*#+}} xmm0 = xmm0[0,8,u,u,u,u,u,u,u,u,u,u,u,u,u,u]
				; AVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: trunc_packus_v2i64_v2i8:			; AVX512F-LABEL: trunc_packus_v2i64_v2i8:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512F-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX512F-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX512F-NEXT: vpmaxsq %zmm1, %zmm0, %zmm0			; AVX512F-NEXT: vpmaxsq %zmm1, %zmm0, %zmm0
	; AVX512F-NEXT: vpmovusqb %zmm0, %xmm0			; AVX512F-NEXT: vpmovusqb %zmm0, %xmm0
	; AVX512F-NEXT: vzeroupper			; AVX512F-NEXT: vzeroupper
	▲ Show 20 Lines • Show All 128 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[0,0,2,2]
	; SSE41-NEXT: pand %xmm5, %xmm0			; SSE41-NEXT: pand %xmm5, %xmm0
	; SSE41-NEXT: por %xmm4, %xmm0			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm1
	; SSE41-NEXT: pshufb {{.*#+}} xmm1 = xmm1[0,8,u,u,u,u,u,u,u,u,u,u,u,u,u,u]			; SSE41-NEXT: pshufb {{.*#+}} xmm1 = xmm1[0,8,u,u,u,u,u,u,u,u,u,u,u,u,u,u]
	; SSE41-NEXT: pextrw $0, %xmm1, (%rdi)			; SSE41-NEXT: pextrw $0, %xmm1, (%rdi)
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX-LABEL: trunc_packus_v2i64_v2i8_store:			; AVX1-LABEL: trunc_packus_v2i64_v2i8_store:
	; AVX: # %bb.0:			; AVX1: # %bb.0:
	; AVX-NEXT: vmovdqa {{.*#+}} xmm1 = [255,255]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm1 = [255,255]
	; AVX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2
	; AVX-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0			; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX1-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm1			; AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm1
	; AVX-NEXT: vpand %xmm0, %xmm1, %xmm0			; AVX1-NEXT: vpand %xmm0, %xmm1, %xmm0
	; AVX-NEXT: vpshufb {{.*#+}} xmm0 = xmm0[0,8,u,u,u,u,u,u,u,u,u,u,u,u,u,u]			; AVX1-NEXT: vpshufb {{.*#+}} xmm0 = xmm0[0,8,u,u,u,u,u,u,u,u,u,u,u,u,u,u]
	; AVX-NEXT: vpextrw $0, %xmm0, (%rdi)			; AVX1-NEXT: vpextrw $0, %xmm0, (%rdi)
	; AVX-NEXT: retq			; AVX1-NEXT: retq
				;
				; AVX2-LABEL: trunc_packus_v2i64_v2i8_store:
				; AVX2: # %bb.0:
				; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [255,255]
				; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2
				; AVX2-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
				; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
				; AVX2-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm1
				; AVX2-NEXT: vpand %xmm0, %xmm1, %xmm0
				; AVX2-NEXT: vpshufb {{.*#+}} xmm0 = xmm0[0,8,u,u,u,u,u,u,u,u,u,u,u,u,u,u]
				; AVX2-NEXT: vpextrw $0, %xmm0, (%rdi)
				; AVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: trunc_packus_v2i64_v2i8_store:			; AVX512F-LABEL: trunc_packus_v2i64_v2i8_store:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512F-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX512F-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX512F-NEXT: vpmaxsq %zmm1, %zmm0, %zmm0			; AVX512F-NEXT: vpmaxsq %zmm1, %zmm0, %zmm0
	; AVX512F-NEXT: vpmovusqb %zmm0, %xmm0			; AVX512F-NEXT: vpmovusqb %zmm0, %xmm0
	; AVX512F-NEXT: vpextrw $0, %xmm0, (%rdi)			; AVX512F-NEXT: vpextrw $0, %xmm0, (%rdi)
	▲ Show 20 Lines • Show All 2,040 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vector-trunc-ssat.ll

	Show First 20 Lines • Show All 107 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm3			; SSE41-NEXT: pcmpgtd %xmm0, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[0,0,2,2]
	; SSE41-NEXT: pand %xmm4, %xmm0			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: por %xmm3, %xmm0			; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[0,2,2,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[0,2,2,3]
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX-LABEL: trunc_ssat_v2i64_v2i32:			; AVX1-LABEL: trunc_ssat_v2i64_v2i32:
	; AVX: # %bb.0:			; AVX1: # %bb.0:
	; AVX-NEXT: vmovdqa {{.*#+}} xmm1 = [2147483647,2147483647]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm1 = [2147483647,2147483647]
	; AVX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2
	; AVX-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0			; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX-NEXT: vmovdqa {{.*#+}} xmm1 = [18446744071562067968,18446744071562067968]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm1 = [18446744071562067968,18446744071562067968]
	; AVX-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm2
	; AVX-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0			; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX-NEXT: vpermilps {{.*#+}} xmm0 = xmm0[0,2,2,3]			; AVX1-NEXT: vpermilps {{.*#+}} xmm0 = xmm0[0,2,2,3]
	; AVX-NEXT: retq			; AVX1-NEXT: retq
				;
				; AVX2-LABEL: trunc_ssat_v2i64_v2i32:
				; AVX2: # %bb.0:
				; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [2147483647,2147483647]
				; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2
				; AVX2-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
				; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [18446744071562067968,18446744071562067968]
				; AVX2-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm2
				; AVX2-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
				; AVX2-NEXT: vpermilps {{.*#+}} xmm0 = xmm0[0,2,2,3]
				; AVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: trunc_ssat_v2i64_v2i32:			; AVX512F-LABEL: trunc_ssat_v2i64_v2i32:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512F-NEXT: vpmovsqd %zmm0, %ymm0			; AVX512F-NEXT: vpmovsqd %zmm0, %ymm0
	; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 killed $ymm0			; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 killed $ymm0
	; AVX512F-NEXT: vzeroupper			; AVX512F-NEXT: vzeroupper
	; AVX512F-NEXT: retq			; AVX512F-NEXT: retq
	▲ Show 20 Lines • Show All 120 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[0,0,2,2]
	; SSE41-NEXT: pand %xmm4, %xmm0			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: por %xmm3, %xmm0			; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[0,2,2,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[0,2,2,3]
	; SSE41-NEXT: movq %xmm0, (%rdi)			; SSE41-NEXT: movq %xmm0, (%rdi)
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX-LABEL: trunc_ssat_v2i64_v2i32_store:			; AVX1-LABEL: trunc_ssat_v2i64_v2i32_store:
	; AVX: # %bb.0:			; AVX1: # %bb.0:
	; AVX-NEXT: vmovdqa {{.*#+}} xmm1 = [2147483647,2147483647]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm1 = [2147483647,2147483647]
	; AVX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2
	; AVX-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0			; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX-NEXT: vmovdqa {{.*#+}} xmm1 = [18446744071562067968,18446744071562067968]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm1 = [18446744071562067968,18446744071562067968]
	; AVX-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm2
	; AVX-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0			; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX-NEXT: vpermilps {{.*#+}} xmm0 = xmm0[0,2,2,3]			; AVX1-NEXT: vpermilps {{.*#+}} xmm0 = xmm0[0,2,2,3]
	; AVX-NEXT: vmovlpd %xmm0, (%rdi)			; AVX1-NEXT: vmovlpd %xmm0, (%rdi)
	; AVX-NEXT: retq			; AVX1-NEXT: retq
				;
				; AVX2-LABEL: trunc_ssat_v2i64_v2i32_store:
				; AVX2: # %bb.0:
				; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [2147483647,2147483647]
				; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2
				; AVX2-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
				; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [18446744071562067968,18446744071562067968]
				; AVX2-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm2
				; AVX2-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
				; AVX2-NEXT: vpermilps {{.*#+}} xmm0 = xmm0[0,2,2,3]
				; AVX2-NEXT: vmovlpd %xmm0, (%rdi)
				; AVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: trunc_ssat_v2i64_v2i32_store:			; AVX512F-LABEL: trunc_ssat_v2i64_v2i32_store:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512F-NEXT: vpmovsqd %zmm0, %ymm0			; AVX512F-NEXT: vpmovsqd %zmm0, %ymm0
	; AVX512F-NEXT: vmovq %xmm0, (%rdi)			; AVX512F-NEXT: vmovq %xmm0, (%rdi)
	; AVX512F-NEXT: vzeroupper			; AVX512F-NEXT: vzeroupper
	; AVX512F-NEXT: retq			; AVX512F-NEXT: retq
	▲ Show 20 Lines • Show All 853 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm2
	; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0			; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX1-NEXT: vpermilps {{.*#+}} xmm0 = xmm0[0,2,2,3]			; AVX1-NEXT: vpermilps {{.*#+}} xmm0 = xmm0[0,2,2,3]
	; AVX1-NEXT: vpshuflw {{.*#+}} xmm0 = xmm0[0,2,2,3,4,5,6,7]			; AVX1-NEXT: vpshuflw {{.*#+}} xmm0 = xmm0[0,2,2,3,4,5,6,7]
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-SLOW-LABEL: trunc_ssat_v2i64_v2i16:			; AVX2-SLOW-LABEL: trunc_ssat_v2i64_v2i16:
	; AVX2-SLOW: # %bb.0:			; AVX2-SLOW: # %bb.0:
	; AVX2-SLOW-NEXT: vmovdqa {{.*#+}} xmm1 = [32767,32767]			; AVX2-SLOW-NEXT: vpbroadcastq {{.*#+}} xmm1 = [32767,32767]
	; AVX2-SLOW-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2			; AVX2-SLOW-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2
	; AVX2-SLOW-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0			; AVX2-SLOW-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX2-SLOW-NEXT: vmovdqa {{.*#+}} xmm1 = [18446744073709518848,18446744073709518848]			; AVX2-SLOW-NEXT: vpbroadcastq {{.*#+}} xmm1 = [18446744073709518848,18446744073709518848]
	; AVX2-SLOW-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm2			; AVX2-SLOW-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm2
	; AVX2-SLOW-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0			; AVX2-SLOW-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX2-SLOW-NEXT: vpermilps {{.*#+}} xmm0 = xmm0[0,2,2,3]			; AVX2-SLOW-NEXT: vpermilps {{.*#+}} xmm0 = xmm0[0,2,2,3]
	; AVX2-SLOW-NEXT: vpshuflw {{.*#+}} xmm0 = xmm0[0,2,2,3,4,5,6,7]			; AVX2-SLOW-NEXT: vpshuflw {{.*#+}} xmm0 = xmm0[0,2,2,3,4,5,6,7]
	; AVX2-SLOW-NEXT: retq			; AVX2-SLOW-NEXT: retq
	;			;
	; AVX2-FAST-LABEL: trunc_ssat_v2i64_v2i16:			; AVX2-FAST-LABEL: trunc_ssat_v2i64_v2i16:
	; AVX2-FAST: # %bb.0:			; AVX2-FAST: # %bb.0:
	; AVX2-FAST-NEXT: vmovdqa {{.*#+}} xmm1 = [32767,32767]			; AVX2-FAST-NEXT: vpbroadcastq {{.*#+}} xmm1 = [32767,32767]
	; AVX2-FAST-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2			; AVX2-FAST-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2
	; AVX2-FAST-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0			; AVX2-FAST-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX2-FAST-NEXT: vmovdqa {{.*#+}} xmm1 = [18446744073709518848,18446744073709518848]			; AVX2-FAST-NEXT: vpbroadcastq {{.*#+}} xmm1 = [18446744073709518848,18446744073709518848]
	; AVX2-FAST-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm2			; AVX2-FAST-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm2
	; AVX2-FAST-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0			; AVX2-FAST-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX2-FAST-NEXT: vpshufb {{.*#+}} xmm0 = xmm0[0,1,8,9,8,9,10,11,8,9,10,11,12,13,14,15]			; AVX2-FAST-NEXT: vpshufb {{.*#+}} xmm0 = xmm0[0,1,8,9,8,9,10,11,8,9,10,11,12,13,14,15]
	; AVX2-FAST-NEXT: retq			; AVX2-FAST-NEXT: retq
	;			;
	; AVX512F-LABEL: trunc_ssat_v2i64_v2i16:			; AVX512F-LABEL: trunc_ssat_v2i64_v2i16:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	▲ Show 20 Lines • Show All 140 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0			; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX1-NEXT: vpermilps {{.*#+}} xmm0 = xmm0[0,2,2,3]			; AVX1-NEXT: vpermilps {{.*#+}} xmm0 = xmm0[0,2,2,3]
	; AVX1-NEXT: vpshuflw {{.*#+}} xmm0 = xmm0[0,2,2,3,4,5,6,7]			; AVX1-NEXT: vpshuflw {{.*#+}} xmm0 = xmm0[0,2,2,3,4,5,6,7]
	; AVX1-NEXT: vmovd %xmm0, (%rdi)			; AVX1-NEXT: vmovd %xmm0, (%rdi)
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-SLOW-LABEL: trunc_ssat_v2i64_v2i16_store:			; AVX2-SLOW-LABEL: trunc_ssat_v2i64_v2i16_store:
	; AVX2-SLOW: # %bb.0:			; AVX2-SLOW: # %bb.0:
	; AVX2-SLOW-NEXT: vmovdqa {{.*#+}} xmm1 = [32767,32767]			; AVX2-SLOW-NEXT: vpbroadcastq {{.*#+}} xmm1 = [32767,32767]
	; AVX2-SLOW-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2			; AVX2-SLOW-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2
	; AVX2-SLOW-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0			; AVX2-SLOW-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX2-SLOW-NEXT: vmovdqa {{.*#+}} xmm1 = [18446744073709518848,18446744073709518848]			; AVX2-SLOW-NEXT: vpbroadcastq {{.*#+}} xmm1 = [18446744073709518848,18446744073709518848]
	; AVX2-SLOW-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm2			; AVX2-SLOW-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm2
	; AVX2-SLOW-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0			; AVX2-SLOW-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX2-SLOW-NEXT: vpermilps {{.*#+}} xmm0 = xmm0[0,2,2,3]			; AVX2-SLOW-NEXT: vpermilps {{.*#+}} xmm0 = xmm0[0,2,2,3]
	; AVX2-SLOW-NEXT: vpshuflw {{.*#+}} xmm0 = xmm0[0,2,2,3,4,5,6,7]			; AVX2-SLOW-NEXT: vpshuflw {{.*#+}} xmm0 = xmm0[0,2,2,3,4,5,6,7]
	; AVX2-SLOW-NEXT: vmovd %xmm0, (%rdi)			; AVX2-SLOW-NEXT: vmovd %xmm0, (%rdi)
	; AVX2-SLOW-NEXT: retq			; AVX2-SLOW-NEXT: retq
	;			;
	; AVX2-FAST-LABEL: trunc_ssat_v2i64_v2i16_store:			; AVX2-FAST-LABEL: trunc_ssat_v2i64_v2i16_store:
	; AVX2-FAST: # %bb.0:			; AVX2-FAST: # %bb.0:
	; AVX2-FAST-NEXT: vmovdqa {{.*#+}} xmm1 = [32767,32767]			; AVX2-FAST-NEXT: vpbroadcastq {{.*#+}} xmm1 = [32767,32767]
	; AVX2-FAST-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2			; AVX2-FAST-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2
	; AVX2-FAST-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0			; AVX2-FAST-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX2-FAST-NEXT: vmovdqa {{.*#+}} xmm1 = [18446744073709518848,18446744073709518848]			; AVX2-FAST-NEXT: vpbroadcastq {{.*#+}} xmm1 = [18446744073709518848,18446744073709518848]
	; AVX2-FAST-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm2			; AVX2-FAST-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm2
	; AVX2-FAST-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0			; AVX2-FAST-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX2-FAST-NEXT: vpshufb {{.*#+}} xmm0 = xmm0[0,1,8,9,u,u,u,u,u,u,u,u,u,u,u,u]			; AVX2-FAST-NEXT: vpshufb {{.*#+}} xmm0 = xmm0[0,1,8,9,u,u,u,u,u,u,u,u,u,u,u,u]
	; AVX2-FAST-NEXT: vmovd %xmm0, (%rdi)			; AVX2-FAST-NEXT: vmovd %xmm0, (%rdi)
	; AVX2-FAST-NEXT: retq			; AVX2-FAST-NEXT: retq
	;			;
	; AVX512F-LABEL: trunc_ssat_v2i64_v2i16_store:			; AVX512F-LABEL: trunc_ssat_v2i64_v2i16_store:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	▲ Show 20 Lines • Show All 1,222 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[0,0,2,2]
	; SSE41-NEXT: pand %xmm4, %xmm0			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: por %xmm3, %xmm0			; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm1
	; SSE41-NEXT: pshufb {{.*#+}} xmm1 = xmm1[0,8,u,u,u,u,u,u,u,u,u,u,u,u,u,u]			; SSE41-NEXT: pshufb {{.*#+}} xmm1 = xmm1[0,8,u,u,u,u,u,u,u,u,u,u,u,u,u,u]
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX-LABEL: trunc_ssat_v2i64_v2i8:			; AVX1-LABEL: trunc_ssat_v2i64_v2i8:
	; AVX: # %bb.0:			; AVX1: # %bb.0:
	; AVX-NEXT: vmovdqa {{.*#+}} xmm1 = [127,127]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm1 = [127,127]
	; AVX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2
	; AVX-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0			; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX-NEXT: vmovdqa {{.*#+}} xmm1 = [18446744073709551488,18446744073709551488]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm1 = [18446744073709551488,18446744073709551488]
	; AVX-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm2
	; AVX-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0			; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX-NEXT: vpshufb {{.*#+}} xmm0 = xmm0[0,8,u,u,u,u,u,u,u,u,u,u,u,u,u,u]			; AVX1-NEXT: vpshufb {{.*#+}} xmm0 = xmm0[0,8,u,u,u,u,u,u,u,u,u,u,u,u,u,u]
	; AVX-NEXT: retq			; AVX1-NEXT: retq
				;
				; AVX2-LABEL: trunc_ssat_v2i64_v2i8:
				; AVX2: # %bb.0:
				; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [127,127]
				; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2
				; AVX2-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
				; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [18446744073709551488,18446744073709551488]
				; AVX2-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm2
				; AVX2-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
				; AVX2-NEXT: vpshufb {{.*#+}} xmm0 = xmm0[0,8,u,u,u,u,u,u,u,u,u,u,u,u,u,u]
				; AVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: trunc_ssat_v2i64_v2i8:			; AVX512F-LABEL: trunc_ssat_v2i64_v2i8:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512F-NEXT: vpmovsqb %zmm0, %xmm0			; AVX512F-NEXT: vpmovsqb %zmm0, %xmm0
	; AVX512F-NEXT: vzeroupper			; AVX512F-NEXT: vzeroupper
	; AVX512F-NEXT: retq			; AVX512F-NEXT: retq
	;			;
	▲ Show 20 Lines • Show All 123 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[0,0,2,2]
	; SSE41-NEXT: pand %xmm4, %xmm0			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: por %xmm3, %xmm0			; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm1
	; SSE41-NEXT: pshufb {{.*#+}} xmm1 = xmm1[0,8,u,u,u,u,u,u,u,u,u,u,u,u,u,u]			; SSE41-NEXT: pshufb {{.*#+}} xmm1 = xmm1[0,8,u,u,u,u,u,u,u,u,u,u,u,u,u,u]
	; SSE41-NEXT: pextrw $0, %xmm1, (%rdi)			; SSE41-NEXT: pextrw $0, %xmm1, (%rdi)
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX-LABEL: trunc_ssat_v2i64_v2i8_store:			; AVX1-LABEL: trunc_ssat_v2i64_v2i8_store:
	; AVX: # %bb.0:			; AVX1: # %bb.0:
	; AVX-NEXT: vmovdqa {{.*#+}} xmm1 = [127,127]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm1 = [127,127]
	; AVX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2
	; AVX-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0			; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX-NEXT: vmovdqa {{.*#+}} xmm1 = [18446744073709551488,18446744073709551488]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm1 = [18446744073709551488,18446744073709551488]
	; AVX-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm2
	; AVX-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0			; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX-NEXT: vpshufb {{.*#+}} xmm0 = xmm0[0,8,u,u,u,u,u,u,u,u,u,u,u,u,u,u]			; AVX1-NEXT: vpshufb {{.*#+}} xmm0 = xmm0[0,8,u,u,u,u,u,u,u,u,u,u,u,u,u,u]
	; AVX-NEXT: vpextrw $0, %xmm0, (%rdi)			; AVX1-NEXT: vpextrw $0, %xmm0, (%rdi)
	; AVX-NEXT: retq			; AVX1-NEXT: retq
				;
				; AVX2-LABEL: trunc_ssat_v2i64_v2i8_store:
				; AVX2: # %bb.0:
				; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [127,127]
				; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2
				; AVX2-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
				; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [18446744073709551488,18446744073709551488]
				; AVX2-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm2
				; AVX2-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
				; AVX2-NEXT: vpshufb {{.*#+}} xmm0 = xmm0[0,8,u,u,u,u,u,u,u,u,u,u,u,u,u,u]
				; AVX2-NEXT: vpextrw $0, %xmm0, (%rdi)
				; AVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: trunc_ssat_v2i64_v2i8_store:			; AVX512F-LABEL: trunc_ssat_v2i64_v2i8_store:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512F-NEXT: vpmovsqb %zmm0, %xmm0			; AVX512F-NEXT: vpmovsqb %zmm0, %xmm0
	; AVX512F-NEXT: vpextrw $0, %xmm0, (%rdi)			; AVX512F-NEXT: vpextrw $0, %xmm0, (%rdi)
	; AVX512F-NEXT: vzeroupper			; AVX512F-NEXT: vzeroupper
	; AVX512F-NEXT: retq			; AVX512F-NEXT: retq
	▲ Show 20 Lines • Show All 2,040 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vector-trunc-usat.ll

	Show First 20 Lines • Show All 69 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm3			; SSE41-NEXT: pcmpgtd %xmm0, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[0,0,2,2]
	; SSE41-NEXT: pand %xmm4, %xmm0			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: por %xmm3, %xmm0			; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[0,2,2,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[0,2,2,3]
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX-LABEL: trunc_usat_v2i64_v2i32:			; AVX1-LABEL: trunc_usat_v2i64_v2i32:
	; AVX: # %bb.0:			; AVX1: # %bb.0:
	; AVX-NEXT: vmovapd {{.*#+}} xmm1 = [4294967295,4294967295]			; AVX1-NEXT: vmovapd {{.*#+}} xmm1 = [4294967295,4294967295]
	; AVX-NEXT: vpxor {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm2			; AVX1-NEXT: vpxor {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm2
	; AVX-NEXT: vmovdqa {{.*#+}} xmm3 = [9223372041149743103,9223372041149743103]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm3 = [9223372041149743103,9223372041149743103]
	; AVX-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2
	; AVX-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0			; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX-NEXT: vpermilps {{.*#+}} xmm0 = xmm0[0,2,2,3]			; AVX1-NEXT: vpermilps {{.*#+}} xmm0 = xmm0[0,2,2,3]
	; AVX-NEXT: retq			; AVX1-NEXT: retq
				;
				; AVX2-LABEL: trunc_usat_v2i64_v2i32:
				; AVX2: # %bb.0:
				; AVX2-NEXT: vmovddup {{.*#+}} xmm1 = [4294967295,4294967295]
				; AVX2-NEXT: # xmm1 = mem[0,0]
				; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
				; AVX2-NEXT: vpxor %xmm2, %xmm0, %xmm2
				; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm3 = [9223372041149743103,9223372041149743103]
				; AVX2-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2
				; AVX2-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
				; AVX2-NEXT: vpermilps {{.*#+}} xmm0 = xmm0[0,2,2,3]
				; AVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: trunc_usat_v2i64_v2i32:			; AVX512F-LABEL: trunc_usat_v2i64_v2i32:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512F-NEXT: vpmovusqd %zmm0, %ymm0			; AVX512F-NEXT: vpmovusqd %zmm0, %ymm0
	; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 killed $ymm0			; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 killed $ymm0
	; AVX512F-NEXT: vzeroupper			; AVX512F-NEXT: vzeroupper
	; AVX512F-NEXT: retq			; AVX512F-NEXT: retq
	▲ Show 20 Lines • Show All 80 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[0,0,2,2]
	; SSE41-NEXT: pand %xmm4, %xmm0			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: por %xmm3, %xmm0			; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[0,2,2,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[0,2,2,3]
	; SSE41-NEXT: movq %xmm0, (%rdi)			; SSE41-NEXT: movq %xmm0, (%rdi)
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX-LABEL: trunc_usat_v2i64_v2i32_store:			; AVX1-LABEL: trunc_usat_v2i64_v2i32_store:
	; AVX: # %bb.0:			; AVX1: # %bb.0:
	; AVX-NEXT: vmovapd {{.*#+}} xmm1 = [4294967295,4294967295]			; AVX1-NEXT: vmovapd {{.*#+}} xmm1 = [4294967295,4294967295]
	; AVX-NEXT: vpxor {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm2			; AVX1-NEXT: vpxor {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm2
	; AVX-NEXT: vmovdqa {{.*#+}} xmm3 = [9223372041149743103,9223372041149743103]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm3 = [9223372041149743103,9223372041149743103]
	; AVX-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2
	; AVX-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0			; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX-NEXT: vpermilps {{.*#+}} xmm0 = xmm0[0,2,2,3]			; AVX1-NEXT: vpermilps {{.*#+}} xmm0 = xmm0[0,2,2,3]
	; AVX-NEXT: vmovlpd %xmm0, (%rdi)			; AVX1-NEXT: vmovlpd %xmm0, (%rdi)
	; AVX-NEXT: retq			; AVX1-NEXT: retq
				;
				; AVX2-LABEL: trunc_usat_v2i64_v2i32_store:
				; AVX2: # %bb.0:
				; AVX2-NEXT: vmovddup {{.*#+}} xmm1 = [4294967295,4294967295]
				; AVX2-NEXT: # xmm1 = mem[0,0]
				; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
				; AVX2-NEXT: vpxor %xmm2, %xmm0, %xmm2
				; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm3 = [9223372041149743103,9223372041149743103]
				; AVX2-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2
				; AVX2-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
				; AVX2-NEXT: vpermilps {{.*#+}} xmm0 = xmm0[0,2,2,3]
				; AVX2-NEXT: vmovlpd %xmm0, (%rdi)
				; AVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: trunc_usat_v2i64_v2i32_store:			; AVX512F-LABEL: trunc_usat_v2i64_v2i32_store:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512F-NEXT: vpmovusqd %zmm0, %ymm0			; AVX512F-NEXT: vpmovusqd %zmm0, %ymm0
	; AVX512F-NEXT: vmovq %xmm0, (%rdi)			; AVX512F-NEXT: vmovq %xmm0, (%rdi)
	; AVX512F-NEXT: vzeroupper			; AVX512F-NEXT: vzeroupper
	; AVX512F-NEXT: retq			; AVX512F-NEXT: retq
	▲ Show 20 Lines • Show All 587 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2
	; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0			; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX1-NEXT: vpermilps {{.*#+}} xmm0 = xmm0[0,2,2,3]			; AVX1-NEXT: vpermilps {{.*#+}} xmm0 = xmm0[0,2,2,3]
	; AVX1-NEXT: vpshuflw {{.*#+}} xmm0 = xmm0[0,2,2,3,4,5,6,7]			; AVX1-NEXT: vpshuflw {{.*#+}} xmm0 = xmm0[0,2,2,3,4,5,6,7]
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-SLOW-LABEL: trunc_usat_v2i64_v2i16:			; AVX2-SLOW-LABEL: trunc_usat_v2i64_v2i16:
	; AVX2-SLOW: # %bb.0:			; AVX2-SLOW: # %bb.0:
	; AVX2-SLOW-NEXT: vmovapd {{.*#+}} xmm1 = [65535,65535]			; AVX2-SLOW-NEXT: vmovddup {{.*#+}} xmm1 = [65535,65535]
	; AVX2-SLOW-NEXT: vpxor {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm2			; AVX2-SLOW-NEXT: # xmm1 = mem[0,0]
	; AVX2-SLOW-NEXT: vmovdqa {{.*#+}} xmm3 = [9223372036854841343,9223372036854841343]			; AVX2-SLOW-NEXT: vpbroadcastq {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
				; AVX2-SLOW-NEXT: vpxor %xmm2, %xmm0, %xmm2
				; AVX2-SLOW-NEXT: vpbroadcastq {{.*#+}} xmm3 = [9223372036854841343,9223372036854841343]
	; AVX2-SLOW-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2			; AVX2-SLOW-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2
	; AVX2-SLOW-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0			; AVX2-SLOW-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX2-SLOW-NEXT: vpermilps {{.*#+}} xmm0 = xmm0[0,2,2,3]			; AVX2-SLOW-NEXT: vpermilps {{.*#+}} xmm0 = xmm0[0,2,2,3]
	; AVX2-SLOW-NEXT: vpshuflw {{.*#+}} xmm0 = xmm0[0,2,2,3,4,5,6,7]			; AVX2-SLOW-NEXT: vpshuflw {{.*#+}} xmm0 = xmm0[0,2,2,3,4,5,6,7]
	; AVX2-SLOW-NEXT: retq			; AVX2-SLOW-NEXT: retq
	;			;
	; AVX2-FAST-LABEL: trunc_usat_v2i64_v2i16:			; AVX2-FAST-LABEL: trunc_usat_v2i64_v2i16:
	; AVX2-FAST: # %bb.0:			; AVX2-FAST: # %bb.0:
	; AVX2-FAST-NEXT: vmovapd {{.*#+}} xmm1 = [65535,65535]			; AVX2-FAST-NEXT: vmovddup {{.*#+}} xmm1 = [65535,65535]
	; AVX2-FAST-NEXT: vpxor {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm2			; AVX2-FAST-NEXT: # xmm1 = mem[0,0]
	; AVX2-FAST-NEXT: vmovdqa {{.*#+}} xmm3 = [9223372036854841343,9223372036854841343]			; AVX2-FAST-NEXT: vpbroadcastq {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
				; AVX2-FAST-NEXT: vpxor %xmm2, %xmm0, %xmm2
				; AVX2-FAST-NEXT: vpbroadcastq {{.*#+}} xmm3 = [9223372036854841343,9223372036854841343]
	; AVX2-FAST-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2			; AVX2-FAST-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2
	; AVX2-FAST-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0			; AVX2-FAST-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX2-FAST-NEXT: vpshufb {{.*#+}} xmm0 = xmm0[0,1,8,9,8,9,10,11,8,9,10,11,12,13,14,15]			; AVX2-FAST-NEXT: vpshufb {{.*#+}} xmm0 = xmm0[0,1,8,9,8,9,10,11,8,9,10,11,12,13,14,15]
	; AVX2-FAST-NEXT: retq			; AVX2-FAST-NEXT: retq
	;			;
	; AVX512F-LABEL: trunc_usat_v2i64_v2i16:			; AVX512F-LABEL: trunc_usat_v2i64_v2i16:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	▲ Show 20 Lines • Show All 99 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0			; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX1-NEXT: vpermilps {{.*#+}} xmm0 = xmm0[0,2,2,3]			; AVX1-NEXT: vpermilps {{.*#+}} xmm0 = xmm0[0,2,2,3]
	; AVX1-NEXT: vpshuflw {{.*#+}} xmm0 = xmm0[0,2,2,3,4,5,6,7]			; AVX1-NEXT: vpshuflw {{.*#+}} xmm0 = xmm0[0,2,2,3,4,5,6,7]
	; AVX1-NEXT: vmovd %xmm0, (%rdi)			; AVX1-NEXT: vmovd %xmm0, (%rdi)
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-SLOW-LABEL: trunc_usat_v2i64_v2i16_store:			; AVX2-SLOW-LABEL: trunc_usat_v2i64_v2i16_store:
	; AVX2-SLOW: # %bb.0:			; AVX2-SLOW: # %bb.0:
	; AVX2-SLOW-NEXT: vmovapd {{.*#+}} xmm1 = [65535,65535]			; AVX2-SLOW-NEXT: vmovddup {{.*#+}} xmm1 = [65535,65535]
	; AVX2-SLOW-NEXT: vpxor {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm2			; AVX2-SLOW-NEXT: # xmm1 = mem[0,0]
	; AVX2-SLOW-NEXT: vmovdqa {{.*#+}} xmm3 = [9223372036854841343,9223372036854841343]			; AVX2-SLOW-NEXT: vpbroadcastq {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
				; AVX2-SLOW-NEXT: vpxor %xmm2, %xmm0, %xmm2
				; AVX2-SLOW-NEXT: vpbroadcastq {{.*#+}} xmm3 = [9223372036854841343,9223372036854841343]
	; AVX2-SLOW-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2			; AVX2-SLOW-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2
	; AVX2-SLOW-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0			; AVX2-SLOW-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX2-SLOW-NEXT: vpermilps {{.*#+}} xmm0 = xmm0[0,2,2,3]			; AVX2-SLOW-NEXT: vpermilps {{.*#+}} xmm0 = xmm0[0,2,2,3]
	; AVX2-SLOW-NEXT: vpshuflw {{.*#+}} xmm0 = xmm0[0,2,2,3,4,5,6,7]			; AVX2-SLOW-NEXT: vpshuflw {{.*#+}} xmm0 = xmm0[0,2,2,3,4,5,6,7]
	; AVX2-SLOW-NEXT: vmovd %xmm0, (%rdi)			; AVX2-SLOW-NEXT: vmovd %xmm0, (%rdi)
	; AVX2-SLOW-NEXT: retq			; AVX2-SLOW-NEXT: retq
	;			;
	; AVX2-FAST-LABEL: trunc_usat_v2i64_v2i16_store:			; AVX2-FAST-LABEL: trunc_usat_v2i64_v2i16_store:
	; AVX2-FAST: # %bb.0:			; AVX2-FAST: # %bb.0:
	; AVX2-FAST-NEXT: vmovapd {{.*#+}} xmm1 = [65535,65535]			; AVX2-FAST-NEXT: vmovddup {{.*#+}} xmm1 = [65535,65535]
	; AVX2-FAST-NEXT: vpxor {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm2			; AVX2-FAST-NEXT: # xmm1 = mem[0,0]
	; AVX2-FAST-NEXT: vmovdqa {{.*#+}} xmm3 = [9223372036854841343,9223372036854841343]			; AVX2-FAST-NEXT: vpbroadcastq {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
				; AVX2-FAST-NEXT: vpxor %xmm2, %xmm0, %xmm2
				; AVX2-FAST-NEXT: vpbroadcastq {{.*#+}} xmm3 = [9223372036854841343,9223372036854841343]
	; AVX2-FAST-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2			; AVX2-FAST-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2
	; AVX2-FAST-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0			; AVX2-FAST-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX2-FAST-NEXT: vpshufb {{.*#+}} xmm0 = xmm0[0,1,8,9,u,u,u,u,u,u,u,u,u,u,u,u]			; AVX2-FAST-NEXT: vpshufb {{.*#+}} xmm0 = xmm0[0,1,8,9,u,u,u,u,u,u,u,u,u,u,u,u]
	; AVX2-FAST-NEXT: vmovd %xmm0, (%rdi)			; AVX2-FAST-NEXT: vmovd %xmm0, (%rdi)
	; AVX2-FAST-NEXT: retq			; AVX2-FAST-NEXT: retq
	;			;
	; AVX512F-LABEL: trunc_usat_v2i64_v2i16_store:			; AVX512F-LABEL: trunc_usat_v2i64_v2i16_store:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	▲ Show 20 Lines • Show All 1,145 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[0,0,2,2]
	; SSE41-NEXT: pand %xmm4, %xmm0			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: por %xmm3, %xmm0			; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm2
	; SSE41-NEXT: pshufb {{.*#+}} xmm2 = xmm2[0,8,u,u,u,u,u,u,u,u,u,u,u,u,u,u]			; SSE41-NEXT: pshufb {{.*#+}} xmm2 = xmm2[0,8,u,u,u,u,u,u,u,u,u,u,u,u,u,u]
	; SSE41-NEXT: movdqa %xmm2, %xmm0			; SSE41-NEXT: movdqa %xmm2, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX-LABEL: trunc_usat_v2i64_v2i8:			; AVX1-LABEL: trunc_usat_v2i64_v2i8:
	; AVX: # %bb.0:			; AVX1: # %bb.0:
	; AVX-NEXT: vmovapd {{.*#+}} xmm1 = [255,255]			; AVX1-NEXT: vmovapd {{.*#+}} xmm1 = [255,255]
	; AVX-NEXT: vpxor {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm2			; AVX1-NEXT: vpxor {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm2
	; AVX-NEXT: vmovdqa {{.*#+}} xmm3 = [9223372036854776063,9223372036854776063]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm3 = [9223372036854776063,9223372036854776063]
	; AVX-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2
	; AVX-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0			; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX-NEXT: vpshufb {{.*#+}} xmm0 = xmm0[0,8,u,u,u,u,u,u,u,u,u,u,u,u,u,u]			; AVX1-NEXT: vpshufb {{.*#+}} xmm0 = xmm0[0,8,u,u,u,u,u,u,u,u,u,u,u,u,u,u]
	; AVX-NEXT: retq			; AVX1-NEXT: retq
				;
				; AVX2-LABEL: trunc_usat_v2i64_v2i8:
				; AVX2: # %bb.0:
				; AVX2-NEXT: vmovddup {{.*#+}} xmm1 = [255,255]
				; AVX2-NEXT: # xmm1 = mem[0,0]
				; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
				; AVX2-NEXT: vpxor %xmm2, %xmm0, %xmm2
				; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm3 = [9223372036854776063,9223372036854776063]
				; AVX2-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2
				; AVX2-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
				; AVX2-NEXT: vpshufb {{.*#+}} xmm0 = xmm0[0,8,u,u,u,u,u,u,u,u,u,u,u,u,u,u]
				; AVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: trunc_usat_v2i64_v2i8:			; AVX512F-LABEL: trunc_usat_v2i64_v2i8:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512F-NEXT: vpmovusqb %zmm0, %xmm0			; AVX512F-NEXT: vpmovusqb %zmm0, %xmm0
	; AVX512F-NEXT: vzeroupper			; AVX512F-NEXT: vzeroupper
	; AVX512F-NEXT: retq			; AVX512F-NEXT: retq
	;			;
	▲ Show 20 Lines • Show All 83 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[0,0,2,2]
	; SSE41-NEXT: pand %xmm4, %xmm0			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: por %xmm3, %xmm0			; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm2
	; SSE41-NEXT: pshufb {{.*#+}} xmm2 = xmm2[0,8,u,u,u,u,u,u,u,u,u,u,u,u,u,u]			; SSE41-NEXT: pshufb {{.*#+}} xmm2 = xmm2[0,8,u,u,u,u,u,u,u,u,u,u,u,u,u,u]
	; SSE41-NEXT: pextrw $0, %xmm2, (%rdi)			; SSE41-NEXT: pextrw $0, %xmm2, (%rdi)
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX-LABEL: trunc_usat_v2i64_v2i8_store:			; AVX1-LABEL: trunc_usat_v2i64_v2i8_store:
	; AVX: # %bb.0:			; AVX1: # %bb.0:
	; AVX-NEXT: vmovapd {{.*#+}} xmm1 = [255,255]			; AVX1-NEXT: vmovapd {{.*#+}} xmm1 = [255,255]
	; AVX-NEXT: vpxor {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm2			; AVX1-NEXT: vpxor {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm2
	; AVX-NEXT: vmovdqa {{.*#+}} xmm3 = [9223372036854776063,9223372036854776063]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm3 = [9223372036854776063,9223372036854776063]
	; AVX-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2
	; AVX-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0			; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX-NEXT: vpshufb {{.*#+}} xmm0 = xmm0[0,8,u,u,u,u,u,u,u,u,u,u,u,u,u,u]			; AVX1-NEXT: vpshufb {{.*#+}} xmm0 = xmm0[0,8,u,u,u,u,u,u,u,u,u,u,u,u,u,u]
	; AVX-NEXT: vpextrw $0, %xmm0, (%rdi)			; AVX1-NEXT: vpextrw $0, %xmm0, (%rdi)
	; AVX-NEXT: retq			; AVX1-NEXT: retq
				;
				; AVX2-LABEL: trunc_usat_v2i64_v2i8_store:
				; AVX2: # %bb.0:
				; AVX2-NEXT: vmovddup {{.*#+}} xmm1 = [255,255]
				; AVX2-NEXT: # xmm1 = mem[0,0]
				; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
				; AVX2-NEXT: vpxor %xmm2, %xmm0, %xmm2
				; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm3 = [9223372036854776063,9223372036854776063]
				; AVX2-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2
				; AVX2-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
				; AVX2-NEXT: vpshufb {{.*#+}} xmm0 = xmm0[0,8,u,u,u,u,u,u,u,u,u,u,u,u,u,u]
				; AVX2-NEXT: vpextrw $0, %xmm0, (%rdi)
				; AVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: trunc_usat_v2i64_v2i8_store:			; AVX512F-LABEL: trunc_usat_v2i64_v2i8_store:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512F-NEXT: vpmovusqb %zmm0, %xmm0			; AVX512F-NEXT: vpmovusqb %zmm0, %xmm0
	; AVX512F-NEXT: vpextrw $0, %xmm0, (%rdi)			; AVX512F-NEXT: vpextrw $0, %xmm0, (%rdi)
	; AVX512F-NEXT: vzeroupper			; AVX512F-NEXT: vzeroupper
	; AVX512F-NEXT: retq			; AVX512F-NEXT: retq
	▲ Show 20 Lines • Show All 2,040 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vector_splat-const-shift-of-constmasked.ll

	Show First 20 Lines • Show All 2,040 Lines • ▼ Show 20 Lines
	; X86-AVX-NEXT: retl	; X86-AVX-NEXT: retl
	;	;
	; X64-SSE2-LABEL: test_128_i64_x_2_2147483647_mask_lshr_1:	; X64-SSE2-LABEL: test_128_i64_x_2_2147483647_mask_lshr_1:
	; X64-SSE2: # %bb.0:	; X64-SSE2: # %bb.0:
	; X64-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0	; X64-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
	; X64-SSE2-NEXT: psrlq $1, %xmm0	; X64-SSE2-NEXT: psrlq $1, %xmm0
	; X64-SSE2-NEXT: retq	; X64-SSE2-NEXT: retq
	;	;
	; X64-AVX-LABEL: test_128_i64_x_2_2147483647_mask_lshr_1:	; X64-AVX1-LABEL: test_128_i64_x_2_2147483647_mask_lshr_1:
	; X64-AVX: # %bb.0:	; X64-AVX1: # %bb.0:
	; X64-AVX-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0	; X64-AVX1-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; X64-AVX-NEXT: vpsrlq $1, %xmm0, %xmm0	; X64-AVX1-NEXT: vpsrlq $1, %xmm0, %xmm0
	; X64-AVX-NEXT: retq	; X64-AVX1-NEXT: retq
		;
		; X64-AVX2-LABEL: test_128_i64_x_2_2147483647_mask_lshr_1:
		; X64-AVX2: # %bb.0:
		; X64-AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [2147483647,2147483647]
		; X64-AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
		; X64-AVX2-NEXT: vpsrlq $1, %xmm0, %xmm0
		; X64-AVX2-NEXT: retq
	%t0 = and <2 x i64> %a0, <i64 2147483647, i64 2147483647>	%t0 = and <2 x i64> %a0, <i64 2147483647, i64 2147483647>
	%t1 = lshr <2 x i64> %t0, <i64 1, i64 1>	%t1 = lshr <2 x i64> %t0, <i64 1, i64 1>
	ret <2 x i64> %t1	ret <2 x i64> %t1
	}	}

	define <2 x i64> @test_128_i64_x_2_140737488289792_mask_lshr_15(<2 x i64> %a0) {	define <2 x i64> @test_128_i64_x_2_140737488289792_mask_lshr_15(<2 x i64> %a0) {
	; X86-SSE2-LABEL: test_128_i64_x_2_140737488289792_mask_lshr_15:	; X86-SSE2-LABEL: test_128_i64_x_2_140737488289792_mask_lshr_15:
	; X86-SSE2: # %bb.0:	; X86-SSE2: # %bb.0:
	; X86-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}, %xmm0	; X86-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}, %xmm0
	; X86-SSE2-NEXT: psrlq $15, %xmm0	; X86-SSE2-NEXT: psrlq $15, %xmm0
	; X86-SSE2-NEXT: retl	; X86-SSE2-NEXT: retl
	;	;
	; X86-AVX-LABEL: test_128_i64_x_2_140737488289792_mask_lshr_15:	; X86-AVX-LABEL: test_128_i64_x_2_140737488289792_mask_lshr_15:
	; X86-AVX: # %bb.0:	; X86-AVX: # %bb.0:
	; X86-AVX-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}, %xmm0, %xmm0	; X86-AVX-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}, %xmm0, %xmm0
	; X86-AVX-NEXT: vpsrlq $15, %xmm0, %xmm0	; X86-AVX-NEXT: vpsrlq $15, %xmm0, %xmm0
	; X86-AVX-NEXT: retl	; X86-AVX-NEXT: retl
	;	;
	; X64-SSE2-LABEL: test_128_i64_x_2_140737488289792_mask_lshr_15:	; X64-SSE2-LABEL: test_128_i64_x_2_140737488289792_mask_lshr_15:
	; X64-SSE2: # %bb.0:	; X64-SSE2: # %bb.0:
	; X64-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0	; X64-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
	; X64-SSE2-NEXT: psrlq $15, %xmm0	; X64-SSE2-NEXT: psrlq $15, %xmm0
	; X64-SSE2-NEXT: retq	; X64-SSE2-NEXT: retq
	;	;
	; X64-AVX-LABEL: test_128_i64_x_2_140737488289792_mask_lshr_15:	; X64-AVX1-LABEL: test_128_i64_x_2_140737488289792_mask_lshr_15:
	; X64-AVX: # %bb.0:	; X64-AVX1: # %bb.0:
	; X64-AVX-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0	; X64-AVX1-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; X64-AVX-NEXT: vpsrlq $15, %xmm0, %xmm0	; X64-AVX1-NEXT: vpsrlq $15, %xmm0, %xmm0
	; X64-AVX-NEXT: retq	; X64-AVX1-NEXT: retq
		;
		; X64-AVX2-LABEL: test_128_i64_x_2_140737488289792_mask_lshr_15:
		; X64-AVX2: # %bb.0:
		; X64-AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [140737488289792,140737488289792]
		; X64-AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
		; X64-AVX2-NEXT: vpsrlq $15, %xmm0, %xmm0
		; X64-AVX2-NEXT: retq
	%t0 = and <2 x i64> %a0, <i64 140737488289792, i64 140737488289792>	%t0 = and <2 x i64> %a0, <i64 140737488289792, i64 140737488289792>
	%t1 = lshr <2 x i64> %t0, <i64 15, i64 15>	%t1 = lshr <2 x i64> %t0, <i64 15, i64 15>
	ret <2 x i64> %t1	ret <2 x i64> %t1
	}	}
	define <2 x i64> @test_128_i64_x_2_140737488289792_mask_lshr_16(<2 x i64> %a0) {	define <2 x i64> @test_128_i64_x_2_140737488289792_mask_lshr_16(<2 x i64> %a0) {
	; X86-SSE2-LABEL: test_128_i64_x_2_140737488289792_mask_lshr_16:	; X86-SSE2-LABEL: test_128_i64_x_2_140737488289792_mask_lshr_16:
	; X86-SSE2: # %bb.0:	; X86-SSE2: # %bb.0:
	; X86-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}, %xmm0	; X86-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}, %xmm0
	; X86-SSE2-NEXT: psrlq $16, %xmm0	; X86-SSE2-NEXT: psrlq $16, %xmm0
	; X86-SSE2-NEXT: retl	; X86-SSE2-NEXT: retl
	;	;
	; X86-AVX-LABEL: test_128_i64_x_2_140737488289792_mask_lshr_16:	; X86-AVX-LABEL: test_128_i64_x_2_140737488289792_mask_lshr_16:
	; X86-AVX: # %bb.0:	; X86-AVX: # %bb.0:
	; X86-AVX-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}, %xmm0, %xmm0	; X86-AVX-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}, %xmm0, %xmm0
	; X86-AVX-NEXT: vpsrlq $16, %xmm0, %xmm0	; X86-AVX-NEXT: vpsrlq $16, %xmm0, %xmm0
	; X86-AVX-NEXT: retl	; X86-AVX-NEXT: retl
	;	;
	; X64-SSE2-LABEL: test_128_i64_x_2_140737488289792_mask_lshr_16:	; X64-SSE2-LABEL: test_128_i64_x_2_140737488289792_mask_lshr_16:
	; X64-SSE2: # %bb.0:	; X64-SSE2: # %bb.0:
	; X64-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0	; X64-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
	; X64-SSE2-NEXT: psrlq $16, %xmm0	; X64-SSE2-NEXT: psrlq $16, %xmm0
	; X64-SSE2-NEXT: retq	; X64-SSE2-NEXT: retq
	;	;
	; X64-AVX-LABEL: test_128_i64_x_2_140737488289792_mask_lshr_16:	; X64-AVX1-LABEL: test_128_i64_x_2_140737488289792_mask_lshr_16:
	; X64-AVX: # %bb.0:	; X64-AVX1: # %bb.0:
	; X64-AVX-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0	; X64-AVX1-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; X64-AVX-NEXT: vpsrlq $16, %xmm0, %xmm0	; X64-AVX1-NEXT: vpsrlq $16, %xmm0, %xmm0
	; X64-AVX-NEXT: retq	; X64-AVX1-NEXT: retq
		;
		; X64-AVX2-LABEL: test_128_i64_x_2_140737488289792_mask_lshr_16:
		; X64-AVX2: # %bb.0:
		; X64-AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [140737488289792,140737488289792]
		; X64-AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
		; X64-AVX2-NEXT: vpsrlq $16, %xmm0, %xmm0
		; X64-AVX2-NEXT: retq
	%t0 = and <2 x i64> %a0, <i64 140737488289792, i64 140737488289792>	%t0 = and <2 x i64> %a0, <i64 140737488289792, i64 140737488289792>
	%t1 = lshr <2 x i64> %t0, <i64 16, i64 16>	%t1 = lshr <2 x i64> %t0, <i64 16, i64 16>
	ret <2 x i64> %t1	ret <2 x i64> %t1
	}	}
	define <2 x i64> @test_128_i64_x_2_140737488289792_mask_lshr_17(<2 x i64> %a0) {	define <2 x i64> @test_128_i64_x_2_140737488289792_mask_lshr_17(<2 x i64> %a0) {
	; X86-SSE2-LABEL: test_128_i64_x_2_140737488289792_mask_lshr_17:	; X86-SSE2-LABEL: test_128_i64_x_2_140737488289792_mask_lshr_17:
	; X86-SSE2: # %bb.0:	; X86-SSE2: # %bb.0:
	; X86-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}, %xmm0	; X86-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}, %xmm0
	; X86-SSE2-NEXT: psrlq $17, %xmm0	; X86-SSE2-NEXT: psrlq $17, %xmm0
	; X86-SSE2-NEXT: retl	; X86-SSE2-NEXT: retl
	;	;
	; X86-AVX-LABEL: test_128_i64_x_2_140737488289792_mask_lshr_17:	; X86-AVX-LABEL: test_128_i64_x_2_140737488289792_mask_lshr_17:
	; X86-AVX: # %bb.0:	; X86-AVX: # %bb.0:
	; X86-AVX-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}, %xmm0, %xmm0	; X86-AVX-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}, %xmm0, %xmm0
	; X86-AVX-NEXT: vpsrlq $17, %xmm0, %xmm0	; X86-AVX-NEXT: vpsrlq $17, %xmm0, %xmm0
	; X86-AVX-NEXT: retl	; X86-AVX-NEXT: retl
	;	;
	; X64-SSE2-LABEL: test_128_i64_x_2_140737488289792_mask_lshr_17:	; X64-SSE2-LABEL: test_128_i64_x_2_140737488289792_mask_lshr_17:
	; X64-SSE2: # %bb.0:	; X64-SSE2: # %bb.0:
	; X64-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0	; X64-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
	; X64-SSE2-NEXT: psrlq $17, %xmm0	; X64-SSE2-NEXT: psrlq $17, %xmm0
	; X64-SSE2-NEXT: retq	; X64-SSE2-NEXT: retq
	;	;
	; X64-AVX-LABEL: test_128_i64_x_2_140737488289792_mask_lshr_17:	; X64-AVX1-LABEL: test_128_i64_x_2_140737488289792_mask_lshr_17:
	; X64-AVX: # %bb.0:	; X64-AVX1: # %bb.0:
	; X64-AVX-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0	; X64-AVX1-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; X64-AVX-NEXT: vpsrlq $17, %xmm0, %xmm0	; X64-AVX1-NEXT: vpsrlq $17, %xmm0, %xmm0
	; X64-AVX-NEXT: retq	; X64-AVX1-NEXT: retq
		;
		; X64-AVX2-LABEL: test_128_i64_x_2_140737488289792_mask_lshr_17:
		; X64-AVX2: # %bb.0:
		; X64-AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [140737488289792,140737488289792]
		; X64-AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
		; X64-AVX2-NEXT: vpsrlq $17, %xmm0, %xmm0
		; X64-AVX2-NEXT: retq
	%t0 = and <2 x i64> %a0, <i64 140737488289792, i64 140737488289792>	%t0 = and <2 x i64> %a0, <i64 140737488289792, i64 140737488289792>
	%t1 = lshr <2 x i64> %t0, <i64 17, i64 17>	%t1 = lshr <2 x i64> %t0, <i64 17, i64 17>
	ret <2 x i64> %t1	ret <2 x i64> %t1
	}	}
	define <2 x i64> @test_128_i64_x_2_140737488289792_mask_lshr_18(<2 x i64> %a0) {	define <2 x i64> @test_128_i64_x_2_140737488289792_mask_lshr_18(<2 x i64> %a0) {
	; X86-SSE2-LABEL: test_128_i64_x_2_140737488289792_mask_lshr_18:	; X86-SSE2-LABEL: test_128_i64_x_2_140737488289792_mask_lshr_18:
	; X86-SSE2: # %bb.0:	; X86-SSE2: # %bb.0:
	; X86-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}, %xmm0	; X86-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}, %xmm0
	; X86-SSE2-NEXT: psrlq $18, %xmm0	; X86-SSE2-NEXT: psrlq $18, %xmm0
	; X86-SSE2-NEXT: retl	; X86-SSE2-NEXT: retl
	;	;
	; X86-AVX-LABEL: test_128_i64_x_2_140737488289792_mask_lshr_18:	; X86-AVX-LABEL: test_128_i64_x_2_140737488289792_mask_lshr_18:
	; X86-AVX: # %bb.0:	; X86-AVX: # %bb.0:
	; X86-AVX-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}, %xmm0, %xmm0	; X86-AVX-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}, %xmm0, %xmm0
	; X86-AVX-NEXT: vpsrlq $18, %xmm0, %xmm0	; X86-AVX-NEXT: vpsrlq $18, %xmm0, %xmm0
	; X86-AVX-NEXT: retl	; X86-AVX-NEXT: retl
	;	;
	; X64-SSE2-LABEL: test_128_i64_x_2_140737488289792_mask_lshr_18:	; X64-SSE2-LABEL: test_128_i64_x_2_140737488289792_mask_lshr_18:
	; X64-SSE2: # %bb.0:	; X64-SSE2: # %bb.0:
	; X64-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0	; X64-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
	; X64-SSE2-NEXT: psrlq $18, %xmm0	; X64-SSE2-NEXT: psrlq $18, %xmm0
	; X64-SSE2-NEXT: retq	; X64-SSE2-NEXT: retq
	;	;
	; X64-AVX-LABEL: test_128_i64_x_2_140737488289792_mask_lshr_18:	; X64-AVX1-LABEL: test_128_i64_x_2_140737488289792_mask_lshr_18:
	; X64-AVX: # %bb.0:	; X64-AVX1: # %bb.0:
	; X64-AVX-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0	; X64-AVX1-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; X64-AVX-NEXT: vpsrlq $18, %xmm0, %xmm0	; X64-AVX1-NEXT: vpsrlq $18, %xmm0, %xmm0
	; X64-AVX-NEXT: retq	; X64-AVX1-NEXT: retq
		;
		; X64-AVX2-LABEL: test_128_i64_x_2_140737488289792_mask_lshr_18:
		; X64-AVX2: # %bb.0:
		; X64-AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [140737488289792,140737488289792]
		; X64-AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
		; X64-AVX2-NEXT: vpsrlq $18, %xmm0, %xmm0
		; X64-AVX2-NEXT: retq
	%t0 = and <2 x i64> %a0, <i64 140737488289792, i64 140737488289792>	%t0 = and <2 x i64> %a0, <i64 140737488289792, i64 140737488289792>
	%t1 = lshr <2 x i64> %t0, <i64 18, i64 18>	%t1 = lshr <2 x i64> %t0, <i64 18, i64 18>
	ret <2 x i64> %t1	ret <2 x i64> %t1
	}	}

	define <2 x i64> @test_128_i64_x_2_18446744065119617024_mask_lshr_1(<2 x i64> %a0) {	define <2 x i64> @test_128_i64_x_2_18446744065119617024_mask_lshr_1(<2 x i64> %a0) {
	; X86-SSE2-LABEL: test_128_i64_x_2_18446744065119617024_mask_lshr_1:	; X86-SSE2-LABEL: test_128_i64_x_2_18446744065119617024_mask_lshr_1:
	; X86-SSE2: # %bb.0:	; X86-SSE2: # %bb.0:
	; X86-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}, %xmm0	; X86-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}, %xmm0
	; X86-SSE2-NEXT: psrlq $1, %xmm0	; X86-SSE2-NEXT: psrlq $1, %xmm0
	; X86-SSE2-NEXT: retl	; X86-SSE2-NEXT: retl
	;	;
	; X86-AVX-LABEL: test_128_i64_x_2_18446744065119617024_mask_lshr_1:	; X86-AVX-LABEL: test_128_i64_x_2_18446744065119617024_mask_lshr_1:
	; X86-AVX: # %bb.0:	; X86-AVX: # %bb.0:
	; X86-AVX-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}, %xmm0, %xmm0	; X86-AVX-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}, %xmm0, %xmm0
	; X86-AVX-NEXT: vpsrlq $1, %xmm0, %xmm0	; X86-AVX-NEXT: vpsrlq $1, %xmm0, %xmm0
	; X86-AVX-NEXT: retl	; X86-AVX-NEXT: retl
	;	;
	; X64-SSE2-LABEL: test_128_i64_x_2_18446744065119617024_mask_lshr_1:	; X64-SSE2-LABEL: test_128_i64_x_2_18446744065119617024_mask_lshr_1:
	; X64-SSE2: # %bb.0:	; X64-SSE2: # %bb.0:
	; X64-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0	; X64-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
	; X64-SSE2-NEXT: psrlq $1, %xmm0	; X64-SSE2-NEXT: psrlq $1, %xmm0
	; X64-SSE2-NEXT: retq	; X64-SSE2-NEXT: retq
	;	;
	; X64-AVX-LABEL: test_128_i64_x_2_18446744065119617024_mask_lshr_1:	; X64-AVX1-LABEL: test_128_i64_x_2_18446744065119617024_mask_lshr_1:
	; X64-AVX: # %bb.0:	; X64-AVX1: # %bb.0:
	; X64-AVX-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0	; X64-AVX1-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; X64-AVX-NEXT: vpsrlq $1, %xmm0, %xmm0	; X64-AVX1-NEXT: vpsrlq $1, %xmm0, %xmm0
	; X64-AVX-NEXT: retq	; X64-AVX1-NEXT: retq
		;
		; X64-AVX2-LABEL: test_128_i64_x_2_18446744065119617024_mask_lshr_1:
		; X64-AVX2: # %bb.0:
		; X64-AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [18446744065119617024,18446744065119617024]
		; X64-AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
		; X64-AVX2-NEXT: vpsrlq $1, %xmm0, %xmm0
		; X64-AVX2-NEXT: retq
	%t0 = and <2 x i64> %a0, <i64 18446744065119617024, i64 18446744065119617024>	%t0 = and <2 x i64> %a0, <i64 18446744065119617024, i64 18446744065119617024>
	%t1 = lshr <2 x i64> %t0, <i64 1, i64 1>	%t1 = lshr <2 x i64> %t0, <i64 1, i64 1>
	ret <2 x i64> %t1	ret <2 x i64> %t1
	}	}
	define <2 x i64> @test_128_i64_x_2_18446744065119617024_mask_lshr_32(<2 x i64> %a0) {	define <2 x i64> @test_128_i64_x_2_18446744065119617024_mask_lshr_32(<2 x i64> %a0) {
	; X86-SSE2-LABEL: test_128_i64_x_2_18446744065119617024_mask_lshr_32:	; X86-SSE2-LABEL: test_128_i64_x_2_18446744065119617024_mask_lshr_32:
	; X86-SSE2: # %bb.0:	; X86-SSE2: # %bb.0:
	; X86-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}, %xmm0	; X86-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}, %xmm0
	Show All 14 Lines
	; X86-AVX2-NEXT: retl	; X86-AVX2-NEXT: retl
	;	;
	; X64-SSE2-LABEL: test_128_i64_x_2_18446744065119617024_mask_lshr_32:	; X64-SSE2-LABEL: test_128_i64_x_2_18446744065119617024_mask_lshr_32:
	; X64-SSE2: # %bb.0:	; X64-SSE2: # %bb.0:
	; X64-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0	; X64-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
	; X64-SSE2-NEXT: psrlq $32, %xmm0	; X64-SSE2-NEXT: psrlq $32, %xmm0
	; X64-SSE2-NEXT: retq	; X64-SSE2-NEXT: retq
	;	;
	; X64-AVX-LABEL: test_128_i64_x_2_18446744065119617024_mask_lshr_32:	; X64-AVX1-LABEL: test_128_i64_x_2_18446744065119617024_mask_lshr_32:
	; X64-AVX: # %bb.0:	; X64-AVX1: # %bb.0:
	; X64-AVX-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0	; X64-AVX1-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; X64-AVX-NEXT: vpsrlq $32, %xmm0, %xmm0	; X64-AVX1-NEXT: vpsrlq $32, %xmm0, %xmm0
	; X64-AVX-NEXT: retq	; X64-AVX1-NEXT: retq
		;
		; X64-AVX2-LABEL: test_128_i64_x_2_18446744065119617024_mask_lshr_32:
		; X64-AVX2: # %bb.0:
		; X64-AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [18446744065119617024,18446744065119617024]
		; X64-AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
		; X64-AVX2-NEXT: vpsrlq $32, %xmm0, %xmm0
		; X64-AVX2-NEXT: retq
	%t0 = and <2 x i64> %a0, <i64 18446744065119617024, i64 18446744065119617024>	%t0 = and <2 x i64> %a0, <i64 18446744065119617024, i64 18446744065119617024>
	%t1 = lshr <2 x i64> %t0, <i64 32, i64 32>	%t1 = lshr <2 x i64> %t0, <i64 32, i64 32>
	ret <2 x i64> %t1	ret <2 x i64> %t1
	}	}
	define <2 x i64> @test_128_i64_x_2_18446744065119617024_mask_lshr_33(<2 x i64> %a0) {	define <2 x i64> @test_128_i64_x_2_18446744065119617024_mask_lshr_33(<2 x i64> %a0) {
	; X86-SSE2-LABEL: test_128_i64_x_2_18446744065119617024_mask_lshr_33:	; X86-SSE2-LABEL: test_128_i64_x_2_18446744065119617024_mask_lshr_33:
	; X86-SSE2: # %bb.0:	; X86-SSE2: # %bb.0:
	; X86-SSE2-NEXT: psrlq $33, %xmm0	; X86-SSE2-NEXT: psrlq $33, %xmm0
	▲ Show 20 Lines • Show All 58 Lines • ▼ Show 20 Lines
	; X86-AVX-NEXT: retl	; X86-AVX-NEXT: retl
	;	;
	; X64-SSE2-LABEL: test_128_i64_x_2_2147483647_mask_ashr_1:	; X64-SSE2-LABEL: test_128_i64_x_2_2147483647_mask_ashr_1:
	; X64-SSE2: # %bb.0:	; X64-SSE2: # %bb.0:
	; X64-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0	; X64-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
	; X64-SSE2-NEXT: psrlq $1, %xmm0	; X64-SSE2-NEXT: psrlq $1, %xmm0
	; X64-SSE2-NEXT: retq	; X64-SSE2-NEXT: retq
	;	;
	; X64-AVX-LABEL: test_128_i64_x_2_2147483647_mask_ashr_1:	; X64-AVX1-LABEL: test_128_i64_x_2_2147483647_mask_ashr_1:
	; X64-AVX: # %bb.0:	; X64-AVX1: # %bb.0:
	; X64-AVX-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0	; X64-AVX1-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; X64-AVX-NEXT: vpsrlq $1, %xmm0, %xmm0	; X64-AVX1-NEXT: vpsrlq $1, %xmm0, %xmm0
	; X64-AVX-NEXT: retq	; X64-AVX1-NEXT: retq
		;
		; X64-AVX2-LABEL: test_128_i64_x_2_2147483647_mask_ashr_1:
		; X64-AVX2: # %bb.0:
		; X64-AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [2147483647,2147483647]
		; X64-AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
		; X64-AVX2-NEXT: vpsrlq $1, %xmm0, %xmm0
		; X64-AVX2-NEXT: retq
	%t0 = and <2 x i64> %a0, <i64 2147483647, i64 2147483647>	%t0 = and <2 x i64> %a0, <i64 2147483647, i64 2147483647>
	%t1 = ashr <2 x i64> %t0, <i64 1, i64 1>	%t1 = ashr <2 x i64> %t0, <i64 1, i64 1>
	ret <2 x i64> %t1	ret <2 x i64> %t1
	}	}

	define <2 x i64> @test_128_i64_x_2_140737488289792_mask_ashr_15(<2 x i64> %a0) {	define <2 x i64> @test_128_i64_x_2_140737488289792_mask_ashr_15(<2 x i64> %a0) {
	; X86-SSE2-LABEL: test_128_i64_x_2_140737488289792_mask_ashr_15:	; X86-SSE2-LABEL: test_128_i64_x_2_140737488289792_mask_ashr_15:
	; X86-SSE2: # %bb.0:	; X86-SSE2: # %bb.0:
	; X86-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}, %xmm0	; X86-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}, %xmm0
	; X86-SSE2-NEXT: psrlq $15, %xmm0	; X86-SSE2-NEXT: psrlq $15, %xmm0
	; X86-SSE2-NEXT: retl	; X86-SSE2-NEXT: retl
	;	;
	; X86-AVX-LABEL: test_128_i64_x_2_140737488289792_mask_ashr_15:	; X86-AVX-LABEL: test_128_i64_x_2_140737488289792_mask_ashr_15:
	; X86-AVX: # %bb.0:	; X86-AVX: # %bb.0:
	; X86-AVX-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}, %xmm0, %xmm0	; X86-AVX-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}, %xmm0, %xmm0
	; X86-AVX-NEXT: vpsrlq $15, %xmm0, %xmm0	; X86-AVX-NEXT: vpsrlq $15, %xmm0, %xmm0
	; X86-AVX-NEXT: retl	; X86-AVX-NEXT: retl
	;	;
	; X64-SSE2-LABEL: test_128_i64_x_2_140737488289792_mask_ashr_15:	; X64-SSE2-LABEL: test_128_i64_x_2_140737488289792_mask_ashr_15:
	; X64-SSE2: # %bb.0:	; X64-SSE2: # %bb.0:
	; X64-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0	; X64-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
	; X64-SSE2-NEXT: psrlq $15, %xmm0	; X64-SSE2-NEXT: psrlq $15, %xmm0
	; X64-SSE2-NEXT: retq	; X64-SSE2-NEXT: retq
	;	;
	; X64-AVX-LABEL: test_128_i64_x_2_140737488289792_mask_ashr_15:	; X64-AVX1-LABEL: test_128_i64_x_2_140737488289792_mask_ashr_15:
	; X64-AVX: # %bb.0:	; X64-AVX1: # %bb.0:
	; X64-AVX-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0	; X64-AVX1-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; X64-AVX-NEXT: vpsrlq $15, %xmm0, %xmm0	; X64-AVX1-NEXT: vpsrlq $15, %xmm0, %xmm0
	; X64-AVX-NEXT: retq	; X64-AVX1-NEXT: retq
		;
		; X64-AVX2-LABEL: test_128_i64_x_2_140737488289792_mask_ashr_15:
		; X64-AVX2: # %bb.0:
		; X64-AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [140737488289792,140737488289792]
		; X64-AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
		; X64-AVX2-NEXT: vpsrlq $15, %xmm0, %xmm0
		; X64-AVX2-NEXT: retq
	%t0 = and <2 x i64> %a0, <i64 140737488289792, i64 140737488289792>	%t0 = and <2 x i64> %a0, <i64 140737488289792, i64 140737488289792>
	%t1 = ashr <2 x i64> %t0, <i64 15, i64 15>	%t1 = ashr <2 x i64> %t0, <i64 15, i64 15>
	ret <2 x i64> %t1	ret <2 x i64> %t1
	}	}
	define <2 x i64> @test_128_i64_x_2_140737488289792_mask_ashr_16(<2 x i64> %a0) {	define <2 x i64> @test_128_i64_x_2_140737488289792_mask_ashr_16(<2 x i64> %a0) {
	; X86-SSE2-LABEL: test_128_i64_x_2_140737488289792_mask_ashr_16:	; X86-SSE2-LABEL: test_128_i64_x_2_140737488289792_mask_ashr_16:
	; X86-SSE2: # %bb.0:	; X86-SSE2: # %bb.0:
	; X86-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}, %xmm0	; X86-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}, %xmm0
	; X86-SSE2-NEXT: psrlq $16, %xmm0	; X86-SSE2-NEXT: psrlq $16, %xmm0
	; X86-SSE2-NEXT: retl	; X86-SSE2-NEXT: retl
	;	;
	; X86-AVX-LABEL: test_128_i64_x_2_140737488289792_mask_ashr_16:	; X86-AVX-LABEL: test_128_i64_x_2_140737488289792_mask_ashr_16:
	; X86-AVX: # %bb.0:	; X86-AVX: # %bb.0:
	; X86-AVX-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}, %xmm0, %xmm0	; X86-AVX-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}, %xmm0, %xmm0
	; X86-AVX-NEXT: vpsrlq $16, %xmm0, %xmm0	; X86-AVX-NEXT: vpsrlq $16, %xmm0, %xmm0
	; X86-AVX-NEXT: retl	; X86-AVX-NEXT: retl
	;	;
	; X64-SSE2-LABEL: test_128_i64_x_2_140737488289792_mask_ashr_16:	; X64-SSE2-LABEL: test_128_i64_x_2_140737488289792_mask_ashr_16:
	; X64-SSE2: # %bb.0:	; X64-SSE2: # %bb.0:
	; X64-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0	; X64-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
	; X64-SSE2-NEXT: psrlq $16, %xmm0	; X64-SSE2-NEXT: psrlq $16, %xmm0
	; X64-SSE2-NEXT: retq	; X64-SSE2-NEXT: retq
	;	;
	; X64-AVX-LABEL: test_128_i64_x_2_140737488289792_mask_ashr_16:	; X64-AVX1-LABEL: test_128_i64_x_2_140737488289792_mask_ashr_16:
	; X64-AVX: # %bb.0:	; X64-AVX1: # %bb.0:
	; X64-AVX-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0	; X64-AVX1-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; X64-AVX-NEXT: vpsrlq $16, %xmm0, %xmm0	; X64-AVX1-NEXT: vpsrlq $16, %xmm0, %xmm0
	; X64-AVX-NEXT: retq	; X64-AVX1-NEXT: retq
		;
		; X64-AVX2-LABEL: test_128_i64_x_2_140737488289792_mask_ashr_16:
		; X64-AVX2: # %bb.0:
		; X64-AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [140737488289792,140737488289792]
		; X64-AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
		; X64-AVX2-NEXT: vpsrlq $16, %xmm0, %xmm0
		; X64-AVX2-NEXT: retq
	%t0 = and <2 x i64> %a0, <i64 140737488289792, i64 140737488289792>	%t0 = and <2 x i64> %a0, <i64 140737488289792, i64 140737488289792>
	%t1 = ashr <2 x i64> %t0, <i64 16, i64 16>	%t1 = ashr <2 x i64> %t0, <i64 16, i64 16>
	ret <2 x i64> %t1	ret <2 x i64> %t1
	}	}
	define <2 x i64> @test_128_i64_x_2_140737488289792_mask_ashr_17(<2 x i64> %a0) {	define <2 x i64> @test_128_i64_x_2_140737488289792_mask_ashr_17(<2 x i64> %a0) {
	; X86-SSE2-LABEL: test_128_i64_x_2_140737488289792_mask_ashr_17:	; X86-SSE2-LABEL: test_128_i64_x_2_140737488289792_mask_ashr_17:
	; X86-SSE2: # %bb.0:	; X86-SSE2: # %bb.0:
	; X86-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}, %xmm0	; X86-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}, %xmm0
	; X86-SSE2-NEXT: psrlq $17, %xmm0	; X86-SSE2-NEXT: psrlq $17, %xmm0
	; X86-SSE2-NEXT: retl	; X86-SSE2-NEXT: retl
	;	;
	; X86-AVX-LABEL: test_128_i64_x_2_140737488289792_mask_ashr_17:	; X86-AVX-LABEL: test_128_i64_x_2_140737488289792_mask_ashr_17:
	; X86-AVX: # %bb.0:	; X86-AVX: # %bb.0:
	; X86-AVX-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}, %xmm0, %xmm0	; X86-AVX-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}, %xmm0, %xmm0
	; X86-AVX-NEXT: vpsrlq $17, %xmm0, %xmm0	; X86-AVX-NEXT: vpsrlq $17, %xmm0, %xmm0
	; X86-AVX-NEXT: retl	; X86-AVX-NEXT: retl
	;	;
	; X64-SSE2-LABEL: test_128_i64_x_2_140737488289792_mask_ashr_17:	; X64-SSE2-LABEL: test_128_i64_x_2_140737488289792_mask_ashr_17:
	; X64-SSE2: # %bb.0:	; X64-SSE2: # %bb.0:
	; X64-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0	; X64-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
	; X64-SSE2-NEXT: psrlq $17, %xmm0	; X64-SSE2-NEXT: psrlq $17, %xmm0
	; X64-SSE2-NEXT: retq	; X64-SSE2-NEXT: retq
	;	;
	; X64-AVX-LABEL: test_128_i64_x_2_140737488289792_mask_ashr_17:	; X64-AVX1-LABEL: test_128_i64_x_2_140737488289792_mask_ashr_17:
	; X64-AVX: # %bb.0:	; X64-AVX1: # %bb.0:
	; X64-AVX-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0	; X64-AVX1-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; X64-AVX-NEXT: vpsrlq $17, %xmm0, %xmm0	; X64-AVX1-NEXT: vpsrlq $17, %xmm0, %xmm0
	; X64-AVX-NEXT: retq	; X64-AVX1-NEXT: retq
		;
		; X64-AVX2-LABEL: test_128_i64_x_2_140737488289792_mask_ashr_17:
		; X64-AVX2: # %bb.0:
		; X64-AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [140737488289792,140737488289792]
		; X64-AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
		; X64-AVX2-NEXT: vpsrlq $17, %xmm0, %xmm0
		; X64-AVX2-NEXT: retq
	%t0 = and <2 x i64> %a0, <i64 140737488289792, i64 140737488289792>	%t0 = and <2 x i64> %a0, <i64 140737488289792, i64 140737488289792>
	%t1 = ashr <2 x i64> %t0, <i64 17, i64 17>	%t1 = ashr <2 x i64> %t0, <i64 17, i64 17>
	ret <2 x i64> %t1	ret <2 x i64> %t1
	}	}
	define <2 x i64> @test_128_i64_x_2_140737488289792_mask_ashr_18(<2 x i64> %a0) {	define <2 x i64> @test_128_i64_x_2_140737488289792_mask_ashr_18(<2 x i64> %a0) {
	; X86-SSE2-LABEL: test_128_i64_x_2_140737488289792_mask_ashr_18:	; X86-SSE2-LABEL: test_128_i64_x_2_140737488289792_mask_ashr_18:
	; X86-SSE2: # %bb.0:	; X86-SSE2: # %bb.0:
	; X86-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}, %xmm0	; X86-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}, %xmm0
	; X86-SSE2-NEXT: psrlq $18, %xmm0	; X86-SSE2-NEXT: psrlq $18, %xmm0
	; X86-SSE2-NEXT: retl	; X86-SSE2-NEXT: retl
	;	;
	; X86-AVX-LABEL: test_128_i64_x_2_140737488289792_mask_ashr_18:	; X86-AVX-LABEL: test_128_i64_x_2_140737488289792_mask_ashr_18:
	; X86-AVX: # %bb.0:	; X86-AVX: # %bb.0:
	; X86-AVX-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}, %xmm0, %xmm0	; X86-AVX-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}, %xmm0, %xmm0
	; X86-AVX-NEXT: vpsrlq $18, %xmm0, %xmm0	; X86-AVX-NEXT: vpsrlq $18, %xmm0, %xmm0
	; X86-AVX-NEXT: retl	; X86-AVX-NEXT: retl
	;	;
	; X64-SSE2-LABEL: test_128_i64_x_2_140737488289792_mask_ashr_18:	; X64-SSE2-LABEL: test_128_i64_x_2_140737488289792_mask_ashr_18:
	; X64-SSE2: # %bb.0:	; X64-SSE2: # %bb.0:
	; X64-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0	; X64-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
	; X64-SSE2-NEXT: psrlq $18, %xmm0	; X64-SSE2-NEXT: psrlq $18, %xmm0
	; X64-SSE2-NEXT: retq	; X64-SSE2-NEXT: retq
	;	;
	; X64-AVX-LABEL: test_128_i64_x_2_140737488289792_mask_ashr_18:	; X64-AVX1-LABEL: test_128_i64_x_2_140737488289792_mask_ashr_18:
	; X64-AVX: # %bb.0:	; X64-AVX1: # %bb.0:
	; X64-AVX-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0	; X64-AVX1-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; X64-AVX-NEXT: vpsrlq $18, %xmm0, %xmm0	; X64-AVX1-NEXT: vpsrlq $18, %xmm0, %xmm0
	; X64-AVX-NEXT: retq	; X64-AVX1-NEXT: retq
		;
		; X64-AVX2-LABEL: test_128_i64_x_2_140737488289792_mask_ashr_18:
		; X64-AVX2: # %bb.0:
		; X64-AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [140737488289792,140737488289792]
		; X64-AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
		; X64-AVX2-NEXT: vpsrlq $18, %xmm0, %xmm0
		; X64-AVX2-NEXT: retq
	%t0 = and <2 x i64> %a0, <i64 140737488289792, i64 140737488289792>	%t0 = and <2 x i64> %a0, <i64 140737488289792, i64 140737488289792>
	%t1 = ashr <2 x i64> %t0, <i64 18, i64 18>	%t1 = ashr <2 x i64> %t0, <i64 18, i64 18>
	ret <2 x i64> %t1	ret <2 x i64> %t1
	}	}

	define <2 x i64> @test_128_i64_x_2_18446744065119617024_mask_ashr_1(<2 x i64> %a0) {	define <2 x i64> @test_128_i64_x_2_18446744065119617024_mask_ashr_1(<2 x i64> %a0) {
	; X86-SSE2-LABEL: test_128_i64_x_2_18446744065119617024_mask_ashr_1:	; X86-SSE2-LABEL: test_128_i64_x_2_18446744065119617024_mask_ashr_1:
	; X86-SSE2: # %bb.0:	; X86-SSE2: # %bb.0:
	Show All 29 Lines
	; X64-AVX1-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0	; X64-AVX1-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; X64-AVX1-NEXT: vpsrad $1, %xmm0, %xmm0	; X64-AVX1-NEXT: vpsrad $1, %xmm0, %xmm0
	; X64-AVX1-NEXT: vpxor %xmm1, %xmm1, %xmm1	; X64-AVX1-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; X64-AVX1-NEXT: vpblendw {{.*#+}} xmm0 = xmm1[0,1],xmm0[2,3],xmm1[4,5],xmm0[6,7]	; X64-AVX1-NEXT: vpblendw {{.*#+}} xmm0 = xmm1[0,1],xmm0[2,3],xmm1[4,5],xmm0[6,7]
	; X64-AVX1-NEXT: retq	; X64-AVX1-NEXT: retq
	;	;
	; X64-AVX2-LABEL: test_128_i64_x_2_18446744065119617024_mask_ashr_1:	; X64-AVX2-LABEL: test_128_i64_x_2_18446744065119617024_mask_ashr_1:
	; X64-AVX2: # %bb.0:	; X64-AVX2: # %bb.0:
	; X64-AVX2-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0	; X64-AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [18446744065119617024,18446744065119617024]
		; X64-AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; X64-AVX2-NEXT: vpsrad $1, %xmm0, %xmm0	; X64-AVX2-NEXT: vpsrad $1, %xmm0, %xmm0
	; X64-AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1	; X64-AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; X64-AVX2-NEXT: vpblendd {{.*#+}} xmm0 = xmm1[0],xmm0[1],xmm1[2],xmm0[3]	; X64-AVX2-NEXT: vpblendd {{.*#+}} xmm0 = xmm1[0],xmm0[1],xmm1[2],xmm0[3]
	; X64-AVX2-NEXT: retq	; X64-AVX2-NEXT: retq
	%t0 = and <2 x i64> %a0, <i64 18446744065119617024, i64 18446744065119617024>	%t0 = and <2 x i64> %a0, <i64 18446744065119617024, i64 18446744065119617024>
	%t1 = ashr <2 x i64> %t0, <i64 1, i64 1>	%t1 = ashr <2 x i64> %t0, <i64 1, i64 1>
	ret <2 x i64> %t1	ret <2 x i64> %t1
	}	}
	Show All 39 Lines
	; X64-AVX1-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0	; X64-AVX1-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; X64-AVX1-NEXT: vpsrad $31, %xmm0, %xmm1	; X64-AVX1-NEXT: vpsrad $31, %xmm0, %xmm1
	; X64-AVX1-NEXT: vpshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]	; X64-AVX1-NEXT: vpshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; X64-AVX1-NEXT: vpblendw {{.*#+}} xmm0 = xmm0[0,1],xmm1[2,3],xmm0[4,5],xmm1[6,7]	; X64-AVX1-NEXT: vpblendw {{.*#+}} xmm0 = xmm0[0,1],xmm1[2,3],xmm0[4,5],xmm1[6,7]
	; X64-AVX1-NEXT: retq	; X64-AVX1-NEXT: retq
	;	;
	; X64-AVX2-LABEL: test_128_i64_x_2_18446744065119617024_mask_ashr_32:	; X64-AVX2-LABEL: test_128_i64_x_2_18446744065119617024_mask_ashr_32:
	; X64-AVX2: # %bb.0:	; X64-AVX2: # %bb.0:
	; X64-AVX2-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0	; X64-AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [18446744065119617024,18446744065119617024]
		; X64-AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; X64-AVX2-NEXT: vpsrad $31, %xmm0, %xmm1	; X64-AVX2-NEXT: vpsrad $31, %xmm0, %xmm1
	; X64-AVX2-NEXT: vpshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]	; X64-AVX2-NEXT: vpshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; X64-AVX2-NEXT: vpblendd {{.*#+}} xmm0 = xmm0[0],xmm1[1],xmm0[2],xmm1[3]	; X64-AVX2-NEXT: vpblendd {{.*#+}} xmm0 = xmm0[0],xmm1[1],xmm0[2],xmm1[3]
	; X64-AVX2-NEXT: retq	; X64-AVX2-NEXT: retq
	%t0 = and <2 x i64> %a0, <i64 18446744065119617024, i64 18446744065119617024>	%t0 = and <2 x i64> %a0, <i64 18446744065119617024, i64 18446744065119617024>
	%t1 = ashr <2 x i64> %t0, <i64 32, i64 32>	%t1 = ashr <2 x i64> %t0, <i64 32, i64 32>
	ret <2 x i64> %t1	ret <2 x i64> %t1
	}	}
	▲ Show 20 Lines • Show All 126 Lines • ▼ Show 20 Lines
	; X86-AVX-NEXT: retl	; X86-AVX-NEXT: retl
	;	;
	; X64-SSE2-LABEL: test_128_i64_x_2_2147483647_mask_shl_1:	; X64-SSE2-LABEL: test_128_i64_x_2_2147483647_mask_shl_1:
	; X64-SSE2: # %bb.0:	; X64-SSE2: # %bb.0:
	; X64-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0	; X64-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
	; X64-SSE2-NEXT: paddq %xmm0, %xmm0	; X64-SSE2-NEXT: paddq %xmm0, %xmm0
	; X64-SSE2-NEXT: retq	; X64-SSE2-NEXT: retq
	;	;
	; X64-AVX-LABEL: test_128_i64_x_2_2147483647_mask_shl_1:	; X64-AVX1-LABEL: test_128_i64_x_2_2147483647_mask_shl_1:
	; X64-AVX: # %bb.0:	; X64-AVX1: # %bb.0:
	; X64-AVX-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0	; X64-AVX1-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; X64-AVX-NEXT: vpaddq %xmm0, %xmm0, %xmm0	; X64-AVX1-NEXT: vpaddq %xmm0, %xmm0, %xmm0
	; X64-AVX-NEXT: retq	; X64-AVX1-NEXT: retq
		;
		; X64-AVX2-LABEL: test_128_i64_x_2_2147483647_mask_shl_1:
		; X64-AVX2: # %bb.0:
		; X64-AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [2147483647,2147483647]
		; X64-AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
		; X64-AVX2-NEXT: vpaddq %xmm0, %xmm0, %xmm0
		; X64-AVX2-NEXT: retq
	%t0 = and <2 x i64> %a0, <i64 2147483647, i64 2147483647>	%t0 = and <2 x i64> %a0, <i64 2147483647, i64 2147483647>
	%t1 = shl <2 x i64> %t0, <i64 1, i64 1>	%t1 = shl <2 x i64> %t0, <i64 1, i64 1>
	ret <2 x i64> %t1	ret <2 x i64> %t1
	}	}
	define <2 x i64> @test_128_i64_x_2_2147483647_mask_shl_32(<2 x i64> %a0) {	define <2 x i64> @test_128_i64_x_2_2147483647_mask_shl_32(<2 x i64> %a0) {
	; X86-SSE2-LABEL: test_128_i64_x_2_2147483647_mask_shl_32:	; X86-SSE2-LABEL: test_128_i64_x_2_2147483647_mask_shl_32:
	; X86-SSE2: # %bb.0:	; X86-SSE2: # %bb.0:
	; X86-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}, %xmm0	; X86-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}, %xmm0
	Show All 14 Lines
	; X86-AVX2-NEXT: retl	; X86-AVX2-NEXT: retl
	;	;
	; X64-SSE2-LABEL: test_128_i64_x_2_2147483647_mask_shl_32:	; X64-SSE2-LABEL: test_128_i64_x_2_2147483647_mask_shl_32:
	; X64-SSE2: # %bb.0:	; X64-SSE2: # %bb.0:
	; X64-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0	; X64-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
	; X64-SSE2-NEXT: psllq $32, %xmm0	; X64-SSE2-NEXT: psllq $32, %xmm0
	; X64-SSE2-NEXT: retq	; X64-SSE2-NEXT: retq
	;	;
	; X64-AVX-LABEL: test_128_i64_x_2_2147483647_mask_shl_32:	; X64-AVX1-LABEL: test_128_i64_x_2_2147483647_mask_shl_32:
	; X64-AVX: # %bb.0:	; X64-AVX1: # %bb.0:
	; X64-AVX-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0	; X64-AVX1-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; X64-AVX-NEXT: vpsllq $32, %xmm0, %xmm0	; X64-AVX1-NEXT: vpsllq $32, %xmm0, %xmm0
	; X64-AVX-NEXT: retq	; X64-AVX1-NEXT: retq
		;
		; X64-AVX2-LABEL: test_128_i64_x_2_2147483647_mask_shl_32:
		; X64-AVX2: # %bb.0:
		; X64-AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [2147483647,2147483647]
		; X64-AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
		; X64-AVX2-NEXT: vpsllq $32, %xmm0, %xmm0
		; X64-AVX2-NEXT: retq
	%t0 = and <2 x i64> %a0, <i64 2147483647, i64 2147483647>	%t0 = and <2 x i64> %a0, <i64 2147483647, i64 2147483647>
	%t1 = shl <2 x i64> %t0, <i64 32, i64 32>	%t1 = shl <2 x i64> %t0, <i64 32, i64 32>
	ret <2 x i64> %t1	ret <2 x i64> %t1
	}	}
	define <2 x i64> @test_128_i64_x_2_2147483647_mask_shl_33(<2 x i64> %a0) {	define <2 x i64> @test_128_i64_x_2_2147483647_mask_shl_33(<2 x i64> %a0) {
	; X86-SSE2-LABEL: test_128_i64_x_2_2147483647_mask_shl_33:	; X86-SSE2-LABEL: test_128_i64_x_2_2147483647_mask_shl_33:
	; X86-SSE2: # %bb.0:	; X86-SSE2: # %bb.0:
	; X86-SSE2-NEXT: psllq $33, %xmm0	; X86-SSE2-NEXT: psllq $33, %xmm0
	▲ Show 20 Lines • Show All 56 Lines • ▼ Show 20 Lines
	; X86-AVX-NEXT: retl	; X86-AVX-NEXT: retl
	;	;
	; X64-SSE2-LABEL: test_128_i64_x_2_140737488289792_mask_shl_15:	; X64-SSE2-LABEL: test_128_i64_x_2_140737488289792_mask_shl_15:
	; X64-SSE2: # %bb.0:	; X64-SSE2: # %bb.0:
	; X64-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0	; X64-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
	; X64-SSE2-NEXT: psllq $15, %xmm0	; X64-SSE2-NEXT: psllq $15, %xmm0
	; X64-SSE2-NEXT: retq	; X64-SSE2-NEXT: retq
	;	;
	; X64-AVX-LABEL: test_128_i64_x_2_140737488289792_mask_shl_15:	; X64-AVX1-LABEL: test_128_i64_x_2_140737488289792_mask_shl_15:
	; X64-AVX: # %bb.0:	; X64-AVX1: # %bb.0:
	; X64-AVX-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0	; X64-AVX1-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; X64-AVX-NEXT: vpsllq $15, %xmm0, %xmm0	; X64-AVX1-NEXT: vpsllq $15, %xmm0, %xmm0
	; X64-AVX-NEXT: retq	; X64-AVX1-NEXT: retq
		;
		; X64-AVX2-LABEL: test_128_i64_x_2_140737488289792_mask_shl_15:
		; X64-AVX2: # %bb.0:
		; X64-AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [140737488289792,140737488289792]
		; X64-AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
		; X64-AVX2-NEXT: vpsllq $15, %xmm0, %xmm0
		; X64-AVX2-NEXT: retq
	%t0 = and <2 x i64> %a0, <i64 140737488289792, i64 140737488289792>	%t0 = and <2 x i64> %a0, <i64 140737488289792, i64 140737488289792>
	%t1 = shl <2 x i64> %t0, <i64 15, i64 15>	%t1 = shl <2 x i64> %t0, <i64 15, i64 15>
	ret <2 x i64> %t1	ret <2 x i64> %t1
	}	}
	define <2 x i64> @test_128_i64_x_2_140737488289792_mask_shl_16(<2 x i64> %a0) {	define <2 x i64> @test_128_i64_x_2_140737488289792_mask_shl_16(<2 x i64> %a0) {
	; X86-SSE2-LABEL: test_128_i64_x_2_140737488289792_mask_shl_16:	; X86-SSE2-LABEL: test_128_i64_x_2_140737488289792_mask_shl_16:
	; X86-SSE2: # %bb.0:	; X86-SSE2: # %bb.0:
	; X86-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}, %xmm0	; X86-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}, %xmm0
	; X86-SSE2-NEXT: psllq $16, %xmm0	; X86-SSE2-NEXT: psllq $16, %xmm0
	; X86-SSE2-NEXT: retl	; X86-SSE2-NEXT: retl
	;	;
	; X86-AVX-LABEL: test_128_i64_x_2_140737488289792_mask_shl_16:	; X86-AVX-LABEL: test_128_i64_x_2_140737488289792_mask_shl_16:
	; X86-AVX: # %bb.0:	; X86-AVX: # %bb.0:
	; X86-AVX-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}, %xmm0, %xmm0	; X86-AVX-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}, %xmm0, %xmm0
	; X86-AVX-NEXT: vpsllq $16, %xmm0, %xmm0	; X86-AVX-NEXT: vpsllq $16, %xmm0, %xmm0
	; X86-AVX-NEXT: retl	; X86-AVX-NEXT: retl
	;	;
	; X64-SSE2-LABEL: test_128_i64_x_2_140737488289792_mask_shl_16:	; X64-SSE2-LABEL: test_128_i64_x_2_140737488289792_mask_shl_16:
	; X64-SSE2: # %bb.0:	; X64-SSE2: # %bb.0:
	; X64-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0	; X64-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
	; X64-SSE2-NEXT: psllq $16, %xmm0	; X64-SSE2-NEXT: psllq $16, %xmm0
	; X64-SSE2-NEXT: retq	; X64-SSE2-NEXT: retq
	;	;
	; X64-AVX-LABEL: test_128_i64_x_2_140737488289792_mask_shl_16:	; X64-AVX1-LABEL: test_128_i64_x_2_140737488289792_mask_shl_16:
	; X64-AVX: # %bb.0:	; X64-AVX1: # %bb.0:
	; X64-AVX-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0	; X64-AVX1-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; X64-AVX-NEXT: vpsllq $16, %xmm0, %xmm0	; X64-AVX1-NEXT: vpsllq $16, %xmm0, %xmm0
	; X64-AVX-NEXT: retq	; X64-AVX1-NEXT: retq
		;
		; X64-AVX2-LABEL: test_128_i64_x_2_140737488289792_mask_shl_16:
		; X64-AVX2: # %bb.0:
		; X64-AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [140737488289792,140737488289792]
		; X64-AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
		; X64-AVX2-NEXT: vpsllq $16, %xmm0, %xmm0
		; X64-AVX2-NEXT: retq
	%t0 = and <2 x i64> %a0, <i64 140737488289792, i64 140737488289792>	%t0 = and <2 x i64> %a0, <i64 140737488289792, i64 140737488289792>
	%t1 = shl <2 x i64> %t0, <i64 16, i64 16>	%t1 = shl <2 x i64> %t0, <i64 16, i64 16>
	ret <2 x i64> %t1	ret <2 x i64> %t1
	}	}
	define <2 x i64> @test_128_i64_x_2_140737488289792_mask_shl_17(<2 x i64> %a0) {	define <2 x i64> @test_128_i64_x_2_140737488289792_mask_shl_17(<2 x i64> %a0) {
	; X86-SSE2-LABEL: test_128_i64_x_2_140737488289792_mask_shl_17:	; X86-SSE2-LABEL: test_128_i64_x_2_140737488289792_mask_shl_17:
	; X86-SSE2: # %bb.0:	; X86-SSE2: # %bb.0:
	; X86-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}, %xmm0	; X86-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}, %xmm0
	; X86-SSE2-NEXT: psllq $17, %xmm0	; X86-SSE2-NEXT: psllq $17, %xmm0
	; X86-SSE2-NEXT: retl	; X86-SSE2-NEXT: retl
	;	;
	; X86-AVX-LABEL: test_128_i64_x_2_140737488289792_mask_shl_17:	; X86-AVX-LABEL: test_128_i64_x_2_140737488289792_mask_shl_17:
	; X86-AVX: # %bb.0:	; X86-AVX: # %bb.0:
	; X86-AVX-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}, %xmm0, %xmm0	; X86-AVX-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}, %xmm0, %xmm0
	; X86-AVX-NEXT: vpsllq $17, %xmm0, %xmm0	; X86-AVX-NEXT: vpsllq $17, %xmm0, %xmm0
	; X86-AVX-NEXT: retl	; X86-AVX-NEXT: retl
	;	;
	; X64-SSE2-LABEL: test_128_i64_x_2_140737488289792_mask_shl_17:	; X64-SSE2-LABEL: test_128_i64_x_2_140737488289792_mask_shl_17:
	; X64-SSE2: # %bb.0:	; X64-SSE2: # %bb.0:
	; X64-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0	; X64-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
	; X64-SSE2-NEXT: psllq $17, %xmm0	; X64-SSE2-NEXT: psllq $17, %xmm0
	; X64-SSE2-NEXT: retq	; X64-SSE2-NEXT: retq
	;	;
	; X64-AVX-LABEL: test_128_i64_x_2_140737488289792_mask_shl_17:	; X64-AVX1-LABEL: test_128_i64_x_2_140737488289792_mask_shl_17:
	; X64-AVX: # %bb.0:	; X64-AVX1: # %bb.0:
	; X64-AVX-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0	; X64-AVX1-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; X64-AVX-NEXT: vpsllq $17, %xmm0, %xmm0	; X64-AVX1-NEXT: vpsllq $17, %xmm0, %xmm0
	; X64-AVX-NEXT: retq	; X64-AVX1-NEXT: retq
		;
		; X64-AVX2-LABEL: test_128_i64_x_2_140737488289792_mask_shl_17:
		; X64-AVX2: # %bb.0:
		; X64-AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [140737488289792,140737488289792]
		; X64-AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
		; X64-AVX2-NEXT: vpsllq $17, %xmm0, %xmm0
		; X64-AVX2-NEXT: retq
	%t0 = and <2 x i64> %a0, <i64 140737488289792, i64 140737488289792>	%t0 = and <2 x i64> %a0, <i64 140737488289792, i64 140737488289792>
	%t1 = shl <2 x i64> %t0, <i64 17, i64 17>	%t1 = shl <2 x i64> %t0, <i64 17, i64 17>
	ret <2 x i64> %t1	ret <2 x i64> %t1
	}	}
	define <2 x i64> @test_128_i64_x_2_140737488289792_mask_shl_18(<2 x i64> %a0) {	define <2 x i64> @test_128_i64_x_2_140737488289792_mask_shl_18(<2 x i64> %a0) {
	; X86-SSE2-LABEL: test_128_i64_x_2_140737488289792_mask_shl_18:	; X86-SSE2-LABEL: test_128_i64_x_2_140737488289792_mask_shl_18:
	; X86-SSE2: # %bb.0:	; X86-SSE2: # %bb.0:
	; X86-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}, %xmm0	; X86-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}, %xmm0
	; X86-SSE2-NEXT: psllq $18, %xmm0	; X86-SSE2-NEXT: psllq $18, %xmm0
	; X86-SSE2-NEXT: retl	; X86-SSE2-NEXT: retl
	;	;
	; X86-AVX-LABEL: test_128_i64_x_2_140737488289792_mask_shl_18:	; X86-AVX-LABEL: test_128_i64_x_2_140737488289792_mask_shl_18:
	; X86-AVX: # %bb.0:	; X86-AVX: # %bb.0:
	; X86-AVX-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}, %xmm0, %xmm0	; X86-AVX-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}, %xmm0, %xmm0
	; X86-AVX-NEXT: vpsllq $18, %xmm0, %xmm0	; X86-AVX-NEXT: vpsllq $18, %xmm0, %xmm0
	; X86-AVX-NEXT: retl	; X86-AVX-NEXT: retl
	;	;
	; X64-SSE2-LABEL: test_128_i64_x_2_140737488289792_mask_shl_18:	; X64-SSE2-LABEL: test_128_i64_x_2_140737488289792_mask_shl_18:
	; X64-SSE2: # %bb.0:	; X64-SSE2: # %bb.0:
	; X64-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0	; X64-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
	; X64-SSE2-NEXT: psllq $18, %xmm0	; X64-SSE2-NEXT: psllq $18, %xmm0
	; X64-SSE2-NEXT: retq	; X64-SSE2-NEXT: retq
	;	;
	; X64-AVX-LABEL: test_128_i64_x_2_140737488289792_mask_shl_18:	; X64-AVX1-LABEL: test_128_i64_x_2_140737488289792_mask_shl_18:
	; X64-AVX: # %bb.0:	; X64-AVX1: # %bb.0:
	; X64-AVX-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0	; X64-AVX1-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; X64-AVX-NEXT: vpsllq $18, %xmm0, %xmm0	; X64-AVX1-NEXT: vpsllq $18, %xmm0, %xmm0
	; X64-AVX-NEXT: retq	; X64-AVX1-NEXT: retq
		;
		; X64-AVX2-LABEL: test_128_i64_x_2_140737488289792_mask_shl_18:
		; X64-AVX2: # %bb.0:
		; X64-AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [140737488289792,140737488289792]
		; X64-AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
		; X64-AVX2-NEXT: vpsllq $18, %xmm0, %xmm0
		; X64-AVX2-NEXT: retq
	%t0 = and <2 x i64> %a0, <i64 140737488289792, i64 140737488289792>	%t0 = and <2 x i64> %a0, <i64 140737488289792, i64 140737488289792>
	%t1 = shl <2 x i64> %t0, <i64 18, i64 18>	%t1 = shl <2 x i64> %t0, <i64 18, i64 18>
	ret <2 x i64> %t1	ret <2 x i64> %t1
	}	}

	define <2 x i64> @test_128_i64_x_2_18446744065119617024_mask_shl_1(<2 x i64> %a0) {	define <2 x i64> @test_128_i64_x_2_18446744065119617024_mask_shl_1(<2 x i64> %a0) {
	; X86-SSE2-LABEL: test_128_i64_x_2_18446744065119617024_mask_shl_1:	; X86-SSE2-LABEL: test_128_i64_x_2_18446744065119617024_mask_shl_1:
	; X86-SSE2: # %bb.0:	; X86-SSE2: # %bb.0:
	; X86-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}, %xmm0	; X86-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}, %xmm0
	; X86-SSE2-NEXT: paddq %xmm0, %xmm0	; X86-SSE2-NEXT: paddq %xmm0, %xmm0
	; X86-SSE2-NEXT: retl	; X86-SSE2-NEXT: retl
	;	;
	; X86-AVX-LABEL: test_128_i64_x_2_18446744065119617024_mask_shl_1:	; X86-AVX-LABEL: test_128_i64_x_2_18446744065119617024_mask_shl_1:
	; X86-AVX: # %bb.0:	; X86-AVX: # %bb.0:
	; X86-AVX-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}, %xmm0, %xmm0	; X86-AVX-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}, %xmm0, %xmm0
	; X86-AVX-NEXT: vpaddq %xmm0, %xmm0, %xmm0	; X86-AVX-NEXT: vpaddq %xmm0, %xmm0, %xmm0
	; X86-AVX-NEXT: retl	; X86-AVX-NEXT: retl
	;	;
	; X64-SSE2-LABEL: test_128_i64_x_2_18446744065119617024_mask_shl_1:	; X64-SSE2-LABEL: test_128_i64_x_2_18446744065119617024_mask_shl_1:
	; X64-SSE2: # %bb.0:	; X64-SSE2: # %bb.0:
	; X64-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0	; X64-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
	; X64-SSE2-NEXT: paddq %xmm0, %xmm0	; X64-SSE2-NEXT: paddq %xmm0, %xmm0
	; X64-SSE2-NEXT: retq	; X64-SSE2-NEXT: retq
	;	;
	; X64-AVX-LABEL: test_128_i64_x_2_18446744065119617024_mask_shl_1:	; X64-AVX1-LABEL: test_128_i64_x_2_18446744065119617024_mask_shl_1:
	; X64-AVX: # %bb.0:	; X64-AVX1: # %bb.0:
	; X64-AVX-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0	; X64-AVX1-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; X64-AVX-NEXT: vpaddq %xmm0, %xmm0, %xmm0	; X64-AVX1-NEXT: vpaddq %xmm0, %xmm0, %xmm0
	; X64-AVX-NEXT: retq	; X64-AVX1-NEXT: retq
		;
		; X64-AVX2-LABEL: test_128_i64_x_2_18446744065119617024_mask_shl_1:
		; X64-AVX2: # %bb.0:
		; X64-AVX2-NEXT: vpbroadcastq {{.*#+}} xmm1 = [18446744065119617024,18446744065119617024]
		; X64-AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
		; X64-AVX2-NEXT: vpaddq %xmm0, %xmm0, %xmm0
		; X64-AVX2-NEXT: retq
	%t0 = and <2 x i64> %a0, <i64 18446744065119617024, i64 18446744065119617024>	%t0 = and <2 x i64> %a0, <i64 18446744065119617024, i64 18446744065119617024>
	%t1 = shl <2 x i64> %t0, <i64 1, i64 1>	%t1 = shl <2 x i64> %t0, <i64 1, i64 1>
	ret <2 x i64> %t1	ret <2 x i64> %t1
	}	}
Context not available.

llvm/test/CodeGen/X86/vselect-minmax.ll

	Show First 20 Lines • Show All 2,040 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: vpxor %xmm2, %xmm0, %xmm3			; AVX1-NEXT: vpxor %xmm2, %xmm0, %xmm3
	; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm2			; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm2
	; AVX1-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2
	; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0			; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: test181:			; AVX2-LABEL: test181:
	; AVX2: # %bb.0: # %entry			; AVX2: # %bb.0: # %entry
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
	; AVX2-NEXT: vpxor %xmm2, %xmm0, %xmm3			; AVX2-NEXT: vpxor %xmm2, %xmm0, %xmm3
	; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm2			; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm2
	; AVX2-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2			; AVX2-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2
	; AVX2-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0			; AVX2-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: test181:			; AVX512F-LABEL: test181:
	; AVX512F: # %bb.0: # %entry			; AVX512F: # %bb.0: # %entry
	▲ Show 20 Lines • Show All 51 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: vpxor %xmm2, %xmm0, %xmm3			; AVX1-NEXT: vpxor %xmm2, %xmm0, %xmm3
	; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm2			; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm2
	; AVX1-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2
	; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0			; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: test182:			; AVX2-LABEL: test182:
	; AVX2: # %bb.0: # %entry			; AVX2: # %bb.0: # %entry
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
	; AVX2-NEXT: vpxor %xmm2, %xmm0, %xmm3			; AVX2-NEXT: vpxor %xmm2, %xmm0, %xmm3
	; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm2			; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm2
	; AVX2-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2			; AVX2-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2
	; AVX2-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0			; AVX2-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: test182:			; AVX512F-LABEL: test182:
	; AVX512F: # %bb.0: # %entry			; AVX512F: # %bb.0: # %entry
	▲ Show 20 Lines • Show All 51 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm3			; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm3
	; AVX1-NEXT: vpxor %xmm2, %xmm0, %xmm2			; AVX1-NEXT: vpxor %xmm2, %xmm0, %xmm2
	; AVX1-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2
	; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0			; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: test183:			; AVX2-LABEL: test183:
	; AVX2: # %bb.0: # %entry			; AVX2: # %bb.0: # %entry
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
	; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm3			; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm3
	; AVX2-NEXT: vpxor %xmm2, %xmm0, %xmm2			; AVX2-NEXT: vpxor %xmm2, %xmm0, %xmm2
	; AVX2-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2			; AVX2-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2
	; AVX2-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0			; AVX2-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: test183:			; AVX512F-LABEL: test183:
	; AVX512F: # %bb.0: # %entry			; AVX512F: # %bb.0: # %entry
	▲ Show 20 Lines • Show All 51 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm3			; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm3
	; AVX1-NEXT: vpxor %xmm2, %xmm0, %xmm2			; AVX1-NEXT: vpxor %xmm2, %xmm0, %xmm2
	; AVX1-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2
	; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0			; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: test184:			; AVX2-LABEL: test184:
	; AVX2: # %bb.0: # %entry			; AVX2: # %bb.0: # %entry
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
	; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm3			; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm3
	; AVX2-NEXT: vpxor %xmm2, %xmm0, %xmm2			; AVX2-NEXT: vpxor %xmm2, %xmm0, %xmm2
	; AVX2-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2			; AVX2-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2
	; AVX2-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0			; AVX2-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: test184:			; AVX512F-LABEL: test184:
	; AVX512F: # %bb.0: # %entry			; AVX512F: # %bb.0: # %entry
	▲ Show 20 Lines • Show All 285 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm3			; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm3
	; AVX1-NEXT: vpxor %xmm2, %xmm0, %xmm2			; AVX1-NEXT: vpxor %xmm2, %xmm0, %xmm2
	; AVX1-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2
	; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0			; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: test189:			; AVX2-LABEL: test189:
	; AVX2: # %bb.0: # %entry			; AVX2: # %bb.0: # %entry
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
	; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm3			; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm3
	; AVX2-NEXT: vpxor %xmm2, %xmm0, %xmm2			; AVX2-NEXT: vpxor %xmm2, %xmm0, %xmm2
	; AVX2-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2			; AVX2-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2
	; AVX2-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0			; AVX2-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: test189:			; AVX512F-LABEL: test189:
	; AVX512F: # %bb.0: # %entry			; AVX512F: # %bb.0: # %entry
	▲ Show 20 Lines • Show All 51 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm3			; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm3
	; AVX1-NEXT: vpxor %xmm2, %xmm0, %xmm2			; AVX1-NEXT: vpxor %xmm2, %xmm0, %xmm2
	; AVX1-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2
	; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0			; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: test190:			; AVX2-LABEL: test190:
	; AVX2: # %bb.0: # %entry			; AVX2: # %bb.0: # %entry
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
	; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm3			; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm3
	; AVX2-NEXT: vpxor %xmm2, %xmm0, %xmm2			; AVX2-NEXT: vpxor %xmm2, %xmm0, %xmm2
	; AVX2-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2			; AVX2-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2
	; AVX2-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0			; AVX2-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: test190:			; AVX512F-LABEL: test190:
	; AVX512F: # %bb.0: # %entry			; AVX512F: # %bb.0: # %entry
	▲ Show 20 Lines • Show All 51 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: vpxor %xmm2, %xmm0, %xmm3			; AVX1-NEXT: vpxor %xmm2, %xmm0, %xmm3
	; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm2			; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm2
	; AVX1-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2
	; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0			; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: test191:			; AVX2-LABEL: test191:
	; AVX2: # %bb.0: # %entry			; AVX2: # %bb.0: # %entry
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
	; AVX2-NEXT: vpxor %xmm2, %xmm0, %xmm3			; AVX2-NEXT: vpxor %xmm2, %xmm0, %xmm3
	; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm2			; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm2
	; AVX2-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2			; AVX2-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2
	; AVX2-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0			; AVX2-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: test191:			; AVX512F-LABEL: test191:
	; AVX512F: # %bb.0: # %entry			; AVX512F: # %bb.0: # %entry
	▲ Show 20 Lines • Show All 51 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: vpxor %xmm2, %xmm0, %xmm3			; AVX1-NEXT: vpxor %xmm2, %xmm0, %xmm3
	; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm2			; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm2
	; AVX1-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2
	; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0			; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: test192:			; AVX2-LABEL: test192:
	; AVX2: # %bb.0: # %entry			; AVX2: # %bb.0: # %entry
	; AVX2-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]			; AVX2-NEXT: vpbroadcastq {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
	; AVX2-NEXT: vpxor %xmm2, %xmm0, %xmm3			; AVX2-NEXT: vpxor %xmm2, %xmm0, %xmm3
	; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm2			; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm2
	; AVX2-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2			; AVX2-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2
	; AVX2-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0			; AVX2-NEXT: vblendvpd %xmm2, %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: test192:			; AVX512F-LABEL: test192:
	; AVX512F: # %bb.0: # %entry			; AVX512F: # %bb.0: # %entry
	Show All 15 Lines

This is an archive of the discontinued LLVM Phabricator instance.

[X86] `lowerBuildVectorAsBroadcast()`: with AVX2, allow i64->XMM broadcasts from constant poolAbandonedPublic

Details

Diff Detail

Unit TestsFailed

Event Timeline

Revision Contents

Diff 420989

llvm/lib/Target/X86/X86ISelLowering.cpp

llvm/test/CodeGen/X86/avx2-intrinsics-x86.ll

llvm/test/CodeGen/X86/combine-movmsk.ll

llvm/test/CodeGen/X86/combine-mul.ll

llvm/test/CodeGen/X86/concat-cast.ll

llvm/test/CodeGen/X86/exedepsfix-broadcast.ll

llvm/test/CodeGen/X86/extractelement-fp.ll

llvm/test/CodeGen/X86/horizontal-reduce-umax.ll

llvm/test/CodeGen/X86/horizontal-reduce-umin.ll

llvm/test/CodeGen/X86/machine-combiner-int-vec.ll

llvm/test/CodeGen/X86/masked_store_trunc_ssat.ll

llvm/test/CodeGen/X86/masked_store_trunc_usat.ll

llvm/test/CodeGen/X86/midpoint-int-vec-128.ll

llvm/test/CodeGen/X86/pmul.ll

llvm/test/CodeGen/X86/sadd_sat_vec.ll

llvm/test/CodeGen/X86/sat-add.ll

llvm/test/CodeGen/X86/ssub_sat_vec.ll

llvm/test/CodeGen/X86/uadd_sat_vec.ll

llvm/test/CodeGen/X86/urem-seteq-vec-tautological.ll

llvm/test/CodeGen/X86/usub_sat_vec.ll

llvm/test/CodeGen/X86/vec_cmp_uint-128.ll

llvm/test/CodeGen/X86/vec_fp_to_int.ll

llvm/test/CodeGen/X86/vec_int_to_fp.ll

llvm/test/CodeGen/X86/vec_minmax_uint.ll

llvm/test/CodeGen/X86/vec_uaddo.ll

llvm/test/CodeGen/X86/vec_usubo.ll

llvm/test/CodeGen/X86/vector-bitreverse.ll

llvm/test/CodeGen/X86/vector-compare-all_of.ll

llvm/test/CodeGen/X86/vector-compare-any_of.ll

llvm/test/CodeGen/X86/vector-fshl-128.ll

llvm/test/CodeGen/X86/vector-fshl-256.ll

llvm/test/CodeGen/X86/vector-fshl-rot-128.ll

llvm/test/CodeGen/X86/vector-fshl-rot-256.ll

llvm/test/CodeGen/X86/vector-fshr-128.ll

llvm/test/CodeGen/X86/vector-fshr-256.ll

llvm/test/CodeGen/X86/vector-fshr-rot-128.ll

llvm/test/CodeGen/X86/vector-fshr-rot-256.ll

llvm/test/CodeGen/X86/vector-mul.ll

llvm/test/CodeGen/X86/vector-popcnt-128-ult-ugt.ll

llvm/test/CodeGen/X86/vector-reduce-or-cmp.ll

llvm/test/CodeGen/X86/vector-reduce-umax.ll

llvm/test/CodeGen/X86/vector-reduce-umin.ll

llvm/test/CodeGen/X86/vector-rotate-128.ll

llvm/test/CodeGen/X86/vector-rotate-256.ll

llvm/test/CodeGen/X86/vector-shift-ashr-128.ll

llvm/test/CodeGen/X86/vector-shift-ashr-256.ll

llvm/test/CodeGen/X86/vector-shift-lshr-128.ll

llvm/test/CodeGen/X86/vector-shift-lshr-256.ll

llvm/test/CodeGen/X86/vector-shift-shl-128.ll

llvm/test/CodeGen/X86/vector-shift-shl-256.ll

llvm/test/CodeGen/X86/vector-trunc-packus.ll

llvm/test/CodeGen/X86/vector-trunc-ssat.ll

llvm/test/CodeGen/X86/vector-trunc-usat.ll

llvm/test/CodeGen/X86/vector_splat-const-shift-of-constmasked.ll

llvm/test/CodeGen/X86/vselect-minmax.ll

[X86] `lowerBuildVectorAsBroadcast()`: with AVX2, allow i64->XMM broadcasts from constant pool
AbandonedPublic