This is an archive of the discontinued LLVM Phabricator instance.

test/CodeGen/X86/known-bits-vector.ll
173–177 ↗	(On Diff #177851)	We lose the ability to fold this entire computation into a constant. After the AND+OR sequence, element 2 and 3 of %xmm0 are known at compile time (i.e. those are both value `65535`). The vector permute can therefore be folded away. And we can perform the int2fp conversion at compile time. Effectively folding away the entire computation into a load from constant pool. To be fair, we could even shrink the constant pool entry by using a vbroadcastss instead of a vmovaps (on AVX).

RKSimon mentioned this in rL348956: [X86] Added missing constant pool checks. NFCI..Dec 12 2018, 10:56 AM

RKSimon mentioned this in rL348966: [X86] Added missing constant pool checks. NFCI..Dec 12 2018, 11:59 AM

rebase

RKSimon added inline comments.Dec 13 2018, 2:21 AM

test/CodeGen/X86/known-bits-vector.ll
173–177 ↗	(On Diff #177851)	The problem here is that SimplifyDemandedElts runs first and updates the and/or to: %1 = and <4 x i32> %a0, <i32 undef, i32 undef, i32 255, i32 4085> %2 = or <4 x i32> %1, <i32 65535, i32 65535, i32 65535, i32 65535> // broadcasts are preserved Then SimplifyDemandedBits runs, doesn't know about which vector elements are needed, and so can't fold to: uitofp <4 x i32><i32 65535, i32 65535, i32 65535, i32 65535> to <4 x float> for constant folding as it used to do. I may be able to attempt to constant fold more aggressively in SimplifyDemandedElts, but failing that the best option going forward for this kind of regression would be to merge SimplifyDemandedBits and SimplifyDemandedElts into a single pass, matching what ComputeNumBits does with scalar/vectors. Also, the original purpose of this test wasn't to constant fold but to recognise that the uitofp could be simplified to sitofp (so x86 could use cvtdq2ps).

andreadb added inline comments.Dec 13 2018, 5:43 AM

test/CodeGen/X86/known-bits-vector.ll
173–177 ↗	(On Diff #177851)	If fixing this regression is not simple, then can raise a bug for it and work on it later. What do you think?
test/CodeGen/X86/packss.ll
271–275 ↗	(On Diff #177904)	Unrelated to this patch. This may be hard to catch... On AVX2 and AVX, we could probably simplify it to this (didn't verify that the shuffle mask is correct): vpslld $31, %ymm0, %ymm0 vpsrad $31, %ymm0, %ymm0 vpshufd $1, %ymm0, %ymm0 vextractf128 $1, %ymm0, %xmm1 vpackssdw %xmm1, %xmm0, %xmm0 That would require quite a lot of knowledge about both demanded bits and demanded elts. Also, it requires that we sink the bitcast in the shift operands, and then we shuffle elements after. This may be something worthy to investigate in future..

RKSimon marked an inline comment as done.Dec 13 2018, 6:30 AM

RKSimon added inline comments.

test/CodeGen/X86/packss.ll
271–275 ↗	(On Diff #177904)	SimplifyDemandedVectorElts doesn't handle shifts yet - its on the list, but as you can see just OR/XOR support causes a lot a diffs!

andreadb added inline comments.Dec 13 2018, 6:44 AM

test/CodeGen/X86/packss.ll
271–275 ↗	(On Diff #177904)	Yeah I noticed :-). Anwyay, I trust your judgment on this. My understanding is that your plan is to keep working on improving this area. If that's the case, then I am happy if you file a bug to track the progress on fixing that particular regression, so that this change can be committed.

spatel mentioned this in D55655: [DAGCombiner] after simplifying demanded elements of vector operand of extract, revisit the extract.Dec 13 2018, 7:26 AM

rebase

@jonpa Are you OK with the systemz knownbits.ll change please?

test/CodeGen/X86/known-bits-vector.ll
173–177 ↗	(On Diff #177851)	I've raised https://bugs.llvm.org/show_bug.cgi?id=40000 which should cover this kind of issue.
test/CodeGen/X86/packss.ll
271–275 ↗	(On Diff #177904)	Again https://bugs.llvm.org/show_bug.cgi?id=40000 might help here (only demand the signbit from some elements)

I leave the review of the SystemZ test to Uli.

LGTM

This revision is now accepted and ready to land.Dec 14 2018, 3:20 AM

In D55600#1331032, @jonpa wrote:

I leave the review of the SystemZ test to Uli.

Yes, this LGTM as well.

Closed by commit rL349264: [TargetLowering] Add ISD::OR + ISD::XOR handling to SimplifyDemandedVectorElts (authored by RKSimon). · Explain WhyDec 15 2018, 3:40 AM

This revision was automatically updated to reflect the committed changes.

andreadb mentioned this in D55780: [X86] Create PSUBUS from (add (umax X, C), -C).Dec 18 2018, 3:50 AM

andreadb mentioned this in D55822: [SelectionDAG] Optional handling of UNDEF elements in matchBinaryPredicate.Dec 18 2018, 6:51 AM

Revision Contents

Path

Size

llvm/

trunk/

lib/

CodeGen/

SelectionDAG/

TargetLowering.cpp

2 lines

test/

CodeGen/

SystemZ/

knownbits.ll

19 lines

X86/

bitcast-and-setcc-128.ll

106 lines

bitcast-and-setcc-256.ll

20 lines

bitcast-setcc-128.ll

44 lines

bitcast-setcc-256.ll

57 lines

combine-sdiv.ll

323 lines

copysign-constant-magnitude.ll

14 lines

fp128-cast.ll

2 lines

known-bits-vector.ll

10 lines

known-signbits-vector.ll

20 lines

93 lines

47 lines

44 lines

14 lines

104 lines

104 lines

vector-reduce-smax-widen.ll

147 lines

vector-reduce-smax.ll

168 lines

vector-reduce-smin-widen.ll

105 lines

vector-reduce-smin.ll

126 lines

vector-reduce-umax-widen.ll

147 lines

vector-reduce-umax.ll

180 lines

vector-reduce-umin-widen.ll

105 lines

vector-reduce-umin.ll

126 lines

vector-trunc-packus-widen.ll

578 lines

vector-trunc-packus.ll

548 lines

vector-trunc-ssat-widen.ll

516 lines

vector-trunc-ssat.ll

538 lines

vector-trunc-usat-widen.ll

246 lines

vector-trunc-usat.ll

246 lines

Diff 178352

llvm/trunk/lib/CodeGen/SelectionDAG/TargetLowering.cpp

Show First 20 Lines • Show All 1,763 Lines • ▼ Show 20 Lines	case ISD::ZERO_EXTEND_VECTOR_INREG: {
APInt DemandedSrcElts = DemandedElts.zextOrSelf(NumSrcElts);		APInt DemandedSrcElts = DemandedElts.zextOrSelf(NumSrcElts);
if (SimplifyDemandedVectorElts(Src, DemandedSrcElts, SrcUndef,		if (SimplifyDemandedVectorElts(Src, DemandedSrcElts, SrcUndef,
SrcZero, TLO, Depth + 1))		SrcZero, TLO, Depth + 1))
return true;		return true;
KnownZero = SrcZero.zextOrTrunc(NumElts);		KnownZero = SrcZero.zextOrTrunc(NumElts);
KnownUndef = SrcUndef.zextOrTrunc(NumElts);		KnownUndef = SrcUndef.zextOrTrunc(NumElts);
break;		break;
}		}
		case ISD::OR:
		case ISD::XOR:
case ISD::ADD:		case ISD::ADD:
case ISD::SUB:		case ISD::SUB:
case ISD::FADD:		case ISD::FADD:
case ISD::FSUB:		case ISD::FSUB:
case ISD::FMUL:		case ISD::FMUL:
case ISD::FDIV:		case ISD::FDIV:
case ISD::FREM: {		case ISD::FREM: {
APInt SrcUndef, SrcZero;		APInt SrcUndef, SrcZero;
▲ Show 20 Lines • Show All 3,547 Lines • Show Last 20 Lines

llvm/trunk/test/CodeGen/SystemZ/knownbits.ll

	Show All 29 Lines
	; SystemZISD::JOIN_DWORDS (and REPLICATE)			; SystemZISD::JOIN_DWORDS (and REPLICATE)
	; The DAG XOR has JOIN_DWORDS and REPLICATE operands. With KnownBits properly set			; The DAG XOR has JOIN_DWORDS and REPLICATE operands. With KnownBits properly set
	; for both these nodes, ICMP is used instead of TM during lowering because			; for both these nodes, ICMP is used instead of TM during lowering because
	; adjustForRedundantAnd() succeeds.			; adjustForRedundantAnd() succeeds.
	define void @f1() {			define void @f1() {
	; CHECK-LABEL: f1:			; CHECK-LABEL: f1:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: clhhsi 0, 0			; CHECK-NEXT: clhhsi 0, 0
	; CHECK-NEXT: lhi %r1, 0			; CHECK-NEXT: lhi %r0, 0
	; CHECK-NEXT: lochie %r1, 1			; CHECK-NEXT: lochie %r0, 1
	; CHECK-NEXT: lghi %r2, 1			; CHECK-NEXT: lghi %r1, 1
	; CHECK-NEXT: vlvgp %v0, %r1, %r2			; CHECK-NEXT: vlvgp %v0, %r0, %r1
	; CHECK-NEXT: vrepig %v1, 1			; CHECK-NEXT: vrepig %v1, 1
	; CHECK-NEXT: vx %v0, %v0, %v1			; CHECK-NEXT: vx %v0, %v0, %v1
	; CHECK-NEXT: vlgvf %r1, %v0, 1			; CHECK-NEXT: vlgvf %r0, %v0, 1
	; CHECK-NEXT: lhi %r0, 0			; CHECK-NEXT: cijlh %r0, 0, .LBB1_3
	; CHECK-NEXT: cijlh %r1, 0, .LBB1_3
	; CHECK-NEXT: # %bb.1:			; CHECK-NEXT: # %bb.1:
				; CHECK-NEXT: vlgvf %r0, %v0, 3
	; CHECK-NEXT: cijlh %r0, 0, .LBB1_3			; CHECK-NEXT: cijlh %r0, 0, .LBB1_3
	; CHECK-NEXT: # %bb.2:			; CHECK-NEXT: # %bb.2:
	; CHECK-NEXT: .LBB1_3:			; CHECK-NEXT: .LBB1_3:
	%1 = load i16, i16* null, align 2			%1 = load i16, i16* null, align 2
	%2 = icmp eq i16 %1, 0			%2 = icmp eq i16 %1, 0
	%3 = insertelement <2 x i1> undef, i1 %2, i32 0			%3 = insertelement <2 x i1> undef, i1 %2, i32 0
	%4 = insertelement <2 x i1> %3, i1 true, i32 1			%4 = insertelement <2 x i1> %3, i1 true, i32 1
	%5 = xor <2 x i1> %4, <i1 true, i1 true>			%5 = xor <2 x i1> %4, <i1 true, i1 true>
	%6 = extractelement <2 x i1> %5, i32 0			%6 = extractelement <2 x i1> %5, i32 0
	%7 = or i1 %6, undef			%7 = extractelement <2 x i1> %5, i32 1
	br i1 %7, label %9, label %8			%8 = or i1 %6, %7
				br i1 %8, label %10, label %9

	; <label>:8: ; preds = %0			; <label>:8: ; preds = %0
	unreachable			unreachable

	; <label>:9: ; preds = %0			; <label>:9: ; preds = %0
	unreachable			unreachable
	}			}

llvm/trunk/test/CodeGen/X86/bitcast-and-setcc-128.ll

	Show First 20 Lines • Show All 211 Lines • ▼ Show 20 Lines
	; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm4 = xmm4[1,3,2,3]			; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm4 = xmm4[1,3,2,3]
	; SSE2-SSSE3-NEXT: psrad $24, %xmm1			; SSE2-SSSE3-NEXT: psrad $24, %xmm1
	; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,3,2,3]			; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,3,2,3]
	; SSE2-SSSE3-NEXT: punpckldq {{.*#+}} xmm1 = xmm1[0],xmm4[0],xmm1[1],xmm4[1]			; SSE2-SSSE3-NEXT: punpckldq {{.*#+}} xmm1 = xmm1[0],xmm4[0],xmm1[1],xmm4[1]
	; SSE2-SSSE3-NEXT: movdqa {{.*#+}} xmm4 = [2147483648,2147483648]			; SSE2-SSSE3-NEXT: movdqa {{.*#+}} xmm4 = [2147483648,2147483648]
	; SSE2-SSSE3-NEXT: pxor %xmm4, %xmm1			; SSE2-SSSE3-NEXT: pxor %xmm4, %xmm1
	; SSE2-SSSE3-NEXT: pxor %xmm4, %xmm0			; SSE2-SSSE3-NEXT: pxor %xmm4, %xmm0
	; SSE2-SSSE3-NEXT: movdqa %xmm0, %xmm5			; SSE2-SSSE3-NEXT: movdqa %xmm0, %xmm5
	; SSE2-SSSE3-NEXT: pcmpgtd %xmm1, %xmm5			; SSE2-SSSE3-NEXT: pcmpeqd %xmm1, %xmm5
	; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm6 = xmm5[0,0,2,2]			; SSE2-SSSE3-NEXT: pcmpgtd %xmm1, %xmm0
	; SSE2-SSSE3-NEXT: pcmpeqd %xmm1, %xmm0			; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm1 = xmm0[0,0,2,2]
	; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]			; SSE2-SSSE3-NEXT: pand %xmm5, %xmm1
	; SSE2-SSSE3-NEXT: pand %xmm6, %xmm0
	; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm1 = xmm5[1,1,3,3]
	; SSE2-SSSE3-NEXT: por %xmm0, %xmm1			; SSE2-SSSE3-NEXT: por %xmm0, %xmm1
	; SSE2-SSSE3-NEXT: pxor %xmm4, %xmm3			; SSE2-SSSE3-NEXT: pxor %xmm4, %xmm3
	; SSE2-SSSE3-NEXT: pxor %xmm4, %xmm2			; SSE2-SSSE3-NEXT: pxor %xmm4, %xmm2
	; SSE2-SSSE3-NEXT: movdqa %xmm2, %xmm0			; SSE2-SSSE3-NEXT: movdqa %xmm2, %xmm0
	; SSE2-SSSE3-NEXT: pcmpgtd %xmm3, %xmm0			; SSE2-SSSE3-NEXT: pcmpeqd %xmm3, %xmm0
	; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm4 = xmm0[0,0,2,2]			; SSE2-SSSE3-NEXT: pcmpgtd %xmm3, %xmm2
	; SSE2-SSSE3-NEXT: pcmpeqd %xmm3, %xmm2			; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]
	; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm2 = xmm2[1,1,3,3]			; SSE2-SSSE3-NEXT: pand %xmm0, %xmm3
	; SSE2-SSSE3-NEXT: pand %xmm4, %xmm2			; SSE2-SSSE3-NEXT: por %xmm2, %xmm3
	; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]			; SSE2-SSSE3-NEXT: pand %xmm1, %xmm3
	; SSE2-SSSE3-NEXT: por %xmm2, %xmm0			; SSE2-SSSE3-NEXT: movmskpd %xmm3, %eax
	; SSE2-SSSE3-NEXT: pand %xmm1, %xmm0
	; SSE2-SSSE3-NEXT: movmskpd %xmm0, %eax
	; SSE2-SSSE3-NEXT: # kill: def $al killed $al killed $eax			; SSE2-SSSE3-NEXT: # kill: def $al killed $al killed $eax
	; SSE2-SSSE3-NEXT: retq			; SSE2-SSSE3-NEXT: retq
	;			;
	; AVX1-LABEL: v2i8:			; AVX1-LABEL: v2i8:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vpsllq $56, %xmm3, %xmm3			; AVX1-NEXT: vpsllq $56, %xmm3, %xmm3
	; AVX1-NEXT: vpsrad $31, %xmm3, %xmm4			; AVX1-NEXT: vpsrad $31, %xmm3, %xmm4
	; AVX1-NEXT: vpsrad $24, %xmm3, %xmm3			; AVX1-NEXT: vpsrad $24, %xmm3, %xmm3
	▲ Show 20 Lines • Show All 118 Lines • ▼ Show 20 Lines
	; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm4 = xmm4[1,3,2,3]			; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm4 = xmm4[1,3,2,3]
	; SSE2-SSSE3-NEXT: psrad $16, %xmm1			; SSE2-SSSE3-NEXT: psrad $16, %xmm1
	; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,3,2,3]			; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,3,2,3]
	; SSE2-SSSE3-NEXT: punpckldq {{.*#+}} xmm1 = xmm1[0],xmm4[0],xmm1[1],xmm4[1]			; SSE2-SSSE3-NEXT: punpckldq {{.*#+}} xmm1 = xmm1[0],xmm4[0],xmm1[1],xmm4[1]
	; SSE2-SSSE3-NEXT: movdqa {{.*#+}} xmm4 = [2147483648,2147483648]			; SSE2-SSSE3-NEXT: movdqa {{.*#+}} xmm4 = [2147483648,2147483648]
	; SSE2-SSSE3-NEXT: pxor %xmm4, %xmm1			; SSE2-SSSE3-NEXT: pxor %xmm4, %xmm1
	; SSE2-SSSE3-NEXT: pxor %xmm4, %xmm0			; SSE2-SSSE3-NEXT: pxor %xmm4, %xmm0
	; SSE2-SSSE3-NEXT: movdqa %xmm0, %xmm5			; SSE2-SSSE3-NEXT: movdqa %xmm0, %xmm5
	; SSE2-SSSE3-NEXT: pcmpgtd %xmm1, %xmm5			; SSE2-SSSE3-NEXT: pcmpeqd %xmm1, %xmm5
	; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm6 = xmm5[0,0,2,2]			; SSE2-SSSE3-NEXT: pcmpgtd %xmm1, %xmm0
	; SSE2-SSSE3-NEXT: pcmpeqd %xmm1, %xmm0			; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm1 = xmm0[0,0,2,2]
	; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]			; SSE2-SSSE3-NEXT: pand %xmm5, %xmm1
	; SSE2-SSSE3-NEXT: pand %xmm6, %xmm0
	; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm1 = xmm5[1,1,3,3]
	; SSE2-SSSE3-NEXT: por %xmm0, %xmm1			; SSE2-SSSE3-NEXT: por %xmm0, %xmm1
	; SSE2-SSSE3-NEXT: pxor %xmm4, %xmm3			; SSE2-SSSE3-NEXT: pxor %xmm4, %xmm3
	; SSE2-SSSE3-NEXT: pxor %xmm4, %xmm2			; SSE2-SSSE3-NEXT: pxor %xmm4, %xmm2
	; SSE2-SSSE3-NEXT: movdqa %xmm2, %xmm0			; SSE2-SSSE3-NEXT: movdqa %xmm2, %xmm0
	; SSE2-SSSE3-NEXT: pcmpgtd %xmm3, %xmm0			; SSE2-SSSE3-NEXT: pcmpeqd %xmm3, %xmm0
	; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm4 = xmm0[0,0,2,2]			; SSE2-SSSE3-NEXT: pcmpgtd %xmm3, %xmm2
	; SSE2-SSSE3-NEXT: pcmpeqd %xmm3, %xmm2			; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]
	; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm2 = xmm2[1,1,3,3]			; SSE2-SSSE3-NEXT: pand %xmm0, %xmm3
	; SSE2-SSSE3-NEXT: pand %xmm4, %xmm2			; SSE2-SSSE3-NEXT: por %xmm2, %xmm3
	; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]			; SSE2-SSSE3-NEXT: pand %xmm1, %xmm3
	; SSE2-SSSE3-NEXT: por %xmm2, %xmm0			; SSE2-SSSE3-NEXT: movmskpd %xmm3, %eax
	; SSE2-SSSE3-NEXT: pand %xmm1, %xmm0
	; SSE2-SSSE3-NEXT: movmskpd %xmm0, %eax
	; SSE2-SSSE3-NEXT: # kill: def $al killed $al killed $eax			; SSE2-SSSE3-NEXT: # kill: def $al killed $al killed $eax
	; SSE2-SSSE3-NEXT: retq			; SSE2-SSSE3-NEXT: retq
	;			;
	; AVX1-LABEL: v2i16:			; AVX1-LABEL: v2i16:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vpsllq $48, %xmm3, %xmm3			; AVX1-NEXT: vpsllq $48, %xmm3, %xmm3
	; AVX1-NEXT: vpsrad $31, %xmm3, %xmm4			; AVX1-NEXT: vpsrad $31, %xmm3, %xmm4
	; AVX1-NEXT: vpsrad $16, %xmm3, %xmm3			; AVX1-NEXT: vpsrad $16, %xmm3, %xmm3
	▲ Show 20 Lines • Show All 110 Lines • ▼ Show 20 Lines
	; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,3,2,3]			; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,3,2,3]
	; SSE2-SSSE3-NEXT: psrad $31, %xmm1			; SSE2-SSSE3-NEXT: psrad $31, %xmm1
	; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,3,2,3]			; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,3,2,3]
	; SSE2-SSSE3-NEXT: punpckldq {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1]			; SSE2-SSSE3-NEXT: punpckldq {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1]
	; SSE2-SSSE3-NEXT: movdqa {{.*#+}} xmm1 = [2147483648,2147483648]			; SSE2-SSSE3-NEXT: movdqa {{.*#+}} xmm1 = [2147483648,2147483648]
	; SSE2-SSSE3-NEXT: pxor %xmm1, %xmm0			; SSE2-SSSE3-NEXT: pxor %xmm1, %xmm0
	; SSE2-SSSE3-NEXT: pxor %xmm1, %xmm3			; SSE2-SSSE3-NEXT: pxor %xmm1, %xmm3
	; SSE2-SSSE3-NEXT: movdqa %xmm3, %xmm5			; SSE2-SSSE3-NEXT: movdqa %xmm3, %xmm5
	; SSE2-SSSE3-NEXT: pcmpgtd %xmm0, %xmm5			; SSE2-SSSE3-NEXT: pcmpeqd %xmm0, %xmm5
	; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm6 = xmm5[0,0,2,2]			; SSE2-SSSE3-NEXT: pcmpgtd %xmm0, %xmm3
	; SSE2-SSSE3-NEXT: pcmpeqd %xmm0, %xmm3			; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm0 = xmm3[0,0,2,2]
	; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm0 = xmm3[1,1,3,3]			; SSE2-SSSE3-NEXT: pand %xmm5, %xmm0
	; SSE2-SSSE3-NEXT: pand %xmm6, %xmm0			; SSE2-SSSE3-NEXT: por %xmm3, %xmm0
	; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm3 = xmm5[1,1,3,3]
	; SSE2-SSSE3-NEXT: por %xmm0, %xmm3
	; SSE2-SSSE3-NEXT: pxor %xmm1, %xmm2			; SSE2-SSSE3-NEXT: pxor %xmm1, %xmm2
	; SSE2-SSSE3-NEXT: pxor %xmm1, %xmm4			; SSE2-SSSE3-NEXT: pxor %xmm1, %xmm4
	; SSE2-SSSE3-NEXT: movdqa %xmm4, %xmm0			; SSE2-SSSE3-NEXT: movdqa %xmm4, %xmm1
	; SSE2-SSSE3-NEXT: pcmpgtd %xmm2, %xmm0			; SSE2-SSSE3-NEXT: pcmpeqd %xmm2, %xmm1
	; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm1 = xmm0[0,0,2,2]			; SSE2-SSSE3-NEXT: pcmpgtd %xmm2, %xmm4
	; SSE2-SSSE3-NEXT: pcmpeqd %xmm2, %xmm4			; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm2 = xmm4[0,0,2,2]
	; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm2 = xmm4[1,1,3,3]
	; SSE2-SSSE3-NEXT: pand %xmm1, %xmm2			; SSE2-SSSE3-NEXT: pand %xmm1, %xmm2
	; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]			; SSE2-SSSE3-NEXT: por %xmm4, %xmm2
	; SSE2-SSSE3-NEXT: por %xmm2, %xmm0			; SSE2-SSSE3-NEXT: pand %xmm0, %xmm2
	; SSE2-SSSE3-NEXT: pand %xmm3, %xmm0			; SSE2-SSSE3-NEXT: movmskpd %xmm2, %eax
	; SSE2-SSSE3-NEXT: movmskpd %xmm0, %eax
	; SSE2-SSSE3-NEXT: # kill: def $al killed $al killed $eax			; SSE2-SSSE3-NEXT: # kill: def $al killed $al killed $eax
	; SSE2-SSSE3-NEXT: retq			; SSE2-SSSE3-NEXT: retq
	;			;
	; AVX1-LABEL: v2i32:			; AVX1-LABEL: v2i32:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vpsllq $32, %xmm3, %xmm4			; AVX1-NEXT: vpsllq $32, %xmm3, %xmm4
	; AVX1-NEXT: vpsrad $31, %xmm4, %xmm4			; AVX1-NEXT: vpsrad $31, %xmm4, %xmm4
	; AVX1-NEXT: vpblendw {{.*#+}} xmm3 = xmm3[0,1],xmm4[2,3],xmm3[4,5],xmm4[6,7]			; AVX1-NEXT: vpblendw {{.*#+}} xmm3 = xmm3[0,1],xmm4[2,3],xmm3[4,5],xmm4[6,7]
	▲ Show 20 Lines • Show All 74 Lines • ▼ Show 20 Lines

	define i2 @v2i64(<2 x i64> %a, <2 x i64> %b, <2 x i64> %c, <2 x i64> %d) {			define i2 @v2i64(<2 x i64> %a, <2 x i64> %b, <2 x i64> %c, <2 x i64> %d) {
	; SSE2-SSSE3-LABEL: v2i64:			; SSE2-SSSE3-LABEL: v2i64:
	; SSE2-SSSE3: # %bb.0:			; SSE2-SSSE3: # %bb.0:
	; SSE2-SSSE3-NEXT: movdqa {{.*#+}} xmm4 = [2147483648,2147483648]			; SSE2-SSSE3-NEXT: movdqa {{.*#+}} xmm4 = [2147483648,2147483648]
	; SSE2-SSSE3-NEXT: pxor %xmm4, %xmm1			; SSE2-SSSE3-NEXT: pxor %xmm4, %xmm1
	; SSE2-SSSE3-NEXT: pxor %xmm4, %xmm0			; SSE2-SSSE3-NEXT: pxor %xmm4, %xmm0
	; SSE2-SSSE3-NEXT: movdqa %xmm0, %xmm5			; SSE2-SSSE3-NEXT: movdqa %xmm0, %xmm5
	; SSE2-SSSE3-NEXT: pcmpgtd %xmm1, %xmm5			; SSE2-SSSE3-NEXT: pcmpeqd %xmm1, %xmm5
	; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm6 = xmm5[0,0,2,2]			; SSE2-SSSE3-NEXT: pcmpgtd %xmm1, %xmm0
	; SSE2-SSSE3-NEXT: pcmpeqd %xmm1, %xmm0			; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm1 = xmm0[0,0,2,2]
	; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]			; SSE2-SSSE3-NEXT: pand %xmm5, %xmm1
	; SSE2-SSSE3-NEXT: pand %xmm6, %xmm0
	; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm1 = xmm5[1,1,3,3]
	; SSE2-SSSE3-NEXT: por %xmm0, %xmm1			; SSE2-SSSE3-NEXT: por %xmm0, %xmm1
	; SSE2-SSSE3-NEXT: pxor %xmm4, %xmm3			; SSE2-SSSE3-NEXT: pxor %xmm4, %xmm3
	; SSE2-SSSE3-NEXT: pxor %xmm4, %xmm2			; SSE2-SSSE3-NEXT: pxor %xmm4, %xmm2
	; SSE2-SSSE3-NEXT: movdqa %xmm2, %xmm0			; SSE2-SSSE3-NEXT: movdqa %xmm2, %xmm0
	; SSE2-SSSE3-NEXT: pcmpgtd %xmm3, %xmm0			; SSE2-SSSE3-NEXT: pcmpeqd %xmm3, %xmm0
	; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm4 = xmm0[0,0,2,2]			; SSE2-SSSE3-NEXT: pcmpgtd %xmm3, %xmm2
	; SSE2-SSSE3-NEXT: pcmpeqd %xmm3, %xmm2			; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]
	; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm2 = xmm2[1,1,3,3]			; SSE2-SSSE3-NEXT: pand %xmm0, %xmm3
	; SSE2-SSSE3-NEXT: pand %xmm4, %xmm2			; SSE2-SSSE3-NEXT: por %xmm2, %xmm3
	; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]			; SSE2-SSSE3-NEXT: pand %xmm1, %xmm3
	; SSE2-SSSE3-NEXT: por %xmm2, %xmm0			; SSE2-SSSE3-NEXT: movmskpd %xmm3, %eax
	; SSE2-SSSE3-NEXT: pand %xmm1, %xmm0
	; SSE2-SSSE3-NEXT: movmskpd %xmm0, %eax
	; SSE2-SSSE3-NEXT: # kill: def $al killed $al killed $eax			; SSE2-SSSE3-NEXT: # kill: def $al killed $al killed $eax
	; SSE2-SSSE3-NEXT: retq			; SSE2-SSSE3-NEXT: retq
	;			;
	; AVX12-LABEL: v2i64:			; AVX12-LABEL: v2i64:
	; AVX12: # %bb.0:			; AVX12: # %bb.0:
	; AVX12-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0			; AVX12-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	; AVX12-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm1			; AVX12-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm1
	; AVX12-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX12-NEXT: vpand %xmm1, %xmm0, %xmm0
	▲ Show 20 Lines • Show All 292 Lines • Show Last 20 Lines

llvm/trunk/test/CodeGen/X86/bitcast-and-setcc-256.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+SSE2 \| FileCheck %s --check-prefixes=SSE2-SSSE3,SSE2			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+SSE2 \| FileCheck %s --check-prefixes=SSE2-SSSE3,SSE2
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+SSSE3 \| FileCheck %s --check-prefixes=SSE2-SSSE3,SSSE3			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+SSSE3 \| FileCheck %s --check-prefixes=SSE2-SSSE3,SSSE3
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx \| FileCheck %s --check-prefixes=AVX12,AVX1			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx \| FileCheck %s --check-prefixes=AVX12,AVX1
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx2 \| FileCheck %s --check-prefixes=AVX12,AVX2			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx2 \| FileCheck %s --check-prefixes=AVX12,AVX2
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx512f,+avx512vl \| FileCheck %s --check-prefix=AVX512 --check-prefix=AVX512F			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx512f,+avx512vl \| FileCheck %s --check-prefix=AVX512 --check-prefix=AVX512F
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx512f,+avx512vl,+avx512bw \| FileCheck %s --check-prefix=AVX512 --check-prefix=AVX512BW			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx512f,+avx512vl,+avx512bw \| FileCheck %s --check-prefix=AVX512 --check-prefix=AVX512BW

	define i4 @v4i64(<4 x i64> %a, <4 x i64> %b, <4 x i64> %c, <4 x i64> %d) {			define i4 @v4i64(<4 x i64> %a, <4 x i64> %b, <4 x i64> %c, <4 x i64> %d) {
	; SSE2-SSSE3-LABEL: v4i64:			; SSE2-SSSE3-LABEL: v4i64:
	; SSE2-SSSE3: # %bb.0:			; SSE2-SSSE3: # %bb.0:
	; SSE2-SSSE3-NEXT: movdqa {{.*#+}} xmm8 = [2147483648,2147483648]			; SSE2-SSSE3-NEXT: movdqa {{.*#+}} xmm8 = [2147483648,2147483648]
	; SSE2-SSSE3-NEXT: pxor %xmm8, %xmm3			; SSE2-SSSE3-NEXT: pxor %xmm8, %xmm3
	; SSE2-SSSE3-NEXT: pxor %xmm8, %xmm1			; SSE2-SSSE3-NEXT: pxor %xmm8, %xmm1
	; SSE2-SSSE3-NEXT: movdqa %xmm1, %xmm9			; SSE2-SSSE3-NEXT: movdqa %xmm1, %xmm9
	; SSE2-SSSE3-NEXT: pcmpgtd %xmm3, %xmm9			; SSE2-SSSE3-NEXT: pcmpgtd %xmm3, %xmm9
	; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm10 = xmm9[0,0,2,2]
	; SSE2-SSSE3-NEXT: pcmpeqd %xmm3, %xmm1			; SSE2-SSSE3-NEXT: pcmpeqd %xmm3, %xmm1
	; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,1,3,3]			; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,1,3,3]
	; SSE2-SSSE3-NEXT: pand %xmm10, %xmm1			; SSE2-SSSE3-NEXT: pand %xmm9, %xmm1
	; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm3 = xmm9[1,1,3,3]			; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm3 = xmm9[1,1,3,3]
	; SSE2-SSSE3-NEXT: por %xmm1, %xmm3			; SSE2-SSSE3-NEXT: por %xmm1, %xmm3
	; SSE2-SSSE3-NEXT: pxor %xmm8, %xmm2			; SSE2-SSSE3-NEXT: pxor %xmm8, %xmm2
	; SSE2-SSSE3-NEXT: pxor %xmm8, %xmm0			; SSE2-SSSE3-NEXT: pxor %xmm8, %xmm0
	; SSE2-SSSE3-NEXT: movdqa %xmm0, %xmm1			; SSE2-SSSE3-NEXT: movdqa %xmm0, %xmm1
	; SSE2-SSSE3-NEXT: pcmpgtd %xmm2, %xmm1			; SSE2-SSSE3-NEXT: pcmpgtd %xmm2, %xmm1
	; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm9 = xmm1[0,0,2,2]
	; SSE2-SSSE3-NEXT: pcmpeqd %xmm2, %xmm0			; SSE2-SSSE3-NEXT: pcmpeqd %xmm2, %xmm0
	; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm2 = xmm0[1,1,3,3]			; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm2 = xmm0[1,1,3,3]
	; SSE2-SSSE3-NEXT: pand %xmm9, %xmm2			; SSE2-SSSE3-NEXT: pand %xmm1, %xmm2
	; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]			; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]
	; SSE2-SSSE3-NEXT: por %xmm2, %xmm0			; SSE2-SSSE3-NEXT: por %xmm2, %xmm0
	; SSE2-SSSE3-NEXT: shufps {{.*#+}} xmm0 = xmm0[0,2],xmm3[0,2]			; SSE2-SSSE3-NEXT: shufps {{.*#+}} xmm0 = xmm0[0,2],xmm3[0,2]
	; SSE2-SSSE3-NEXT: pxor %xmm8, %xmm7			; SSE2-SSSE3-NEXT: pxor %xmm8, %xmm7
	; SSE2-SSSE3-NEXT: pxor %xmm8, %xmm5			; SSE2-SSSE3-NEXT: pxor %xmm8, %xmm5
	; SSE2-SSSE3-NEXT: movdqa %xmm5, %xmm1			; SSE2-SSSE3-NEXT: movdqa %xmm5, %xmm1
	; SSE2-SSSE3-NEXT: pcmpgtd %xmm7, %xmm1			; SSE2-SSSE3-NEXT: pcmpgtd %xmm7, %xmm1
	; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm2 = xmm1[0,0,2,2]
	; SSE2-SSSE3-NEXT: pcmpeqd %xmm7, %xmm5			; SSE2-SSSE3-NEXT: pcmpeqd %xmm7, %xmm5
	; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm3 = xmm5[1,1,3,3]			; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm2 = xmm5[1,1,3,3]
	; SSE2-SSSE3-NEXT: pand %xmm2, %xmm3			; SSE2-SSSE3-NEXT: pand %xmm1, %xmm2
	; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,1,3,3]			; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,1,3,3]
	; SSE2-SSSE3-NEXT: por %xmm3, %xmm1			; SSE2-SSSE3-NEXT: por %xmm2, %xmm1
	; SSE2-SSSE3-NEXT: pxor %xmm8, %xmm6			; SSE2-SSSE3-NEXT: pxor %xmm8, %xmm6
	; SSE2-SSSE3-NEXT: pxor %xmm8, %xmm4			; SSE2-SSSE3-NEXT: pxor %xmm8, %xmm4
	; SSE2-SSSE3-NEXT: movdqa %xmm4, %xmm2			; SSE2-SSSE3-NEXT: movdqa %xmm4, %xmm2
	; SSE2-SSSE3-NEXT: pcmpgtd %xmm6, %xmm2			; SSE2-SSSE3-NEXT: pcmpgtd %xmm6, %xmm2
	; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]
	; SSE2-SSSE3-NEXT: pcmpeqd %xmm6, %xmm4			; SSE2-SSSE3-NEXT: pcmpeqd %xmm6, %xmm4
	; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm4 = xmm4[1,1,3,3]			; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm3 = xmm4[1,1,3,3]
	; SSE2-SSSE3-NEXT: pand %xmm3, %xmm4			; SSE2-SSSE3-NEXT: pand %xmm2, %xmm3
	; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm2 = xmm2[1,1,3,3]			; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm2 = xmm2[1,1,3,3]
	; SSE2-SSSE3-NEXT: por %xmm4, %xmm2			; SSE2-SSSE3-NEXT: por %xmm3, %xmm2
	; SSE2-SSSE3-NEXT: shufps {{.*#+}} xmm2 = xmm2[0,2],xmm1[0,2]			; SSE2-SSSE3-NEXT: shufps {{.*#+}} xmm2 = xmm2[0,2],xmm1[0,2]
	; SSE2-SSSE3-NEXT: andps %xmm0, %xmm2			; SSE2-SSSE3-NEXT: andps %xmm0, %xmm2
	; SSE2-SSSE3-NEXT: movmskps %xmm2, %eax			; SSE2-SSSE3-NEXT: movmskps %xmm2, %eax
	; SSE2-SSSE3-NEXT: # kill: def $al killed $al killed $eax			; SSE2-SSSE3-NEXT: # kill: def $al killed $al killed $eax
	; SSE2-SSSE3-NEXT: retq			; SSE2-SSSE3-NEXT: retq
	;			;
	; AVX1-LABEL: v4i64:			; AVX1-LABEL: v4i64:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	▲ Show 20 Lines • Show All 384 Lines • Show Last 20 Lines

llvm/trunk/test/CodeGen/X86/bitcast-setcc-128.ll

	Show First 20 Lines • Show All 161 Lines • ▼ Show 20 Lines
	; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm2 = xmm2[1,3,2,3]			; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm2 = xmm2[1,3,2,3]
	; SSE2-SSSE3-NEXT: psrad $24, %xmm1			; SSE2-SSSE3-NEXT: psrad $24, %xmm1
	; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,3,2,3]			; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,3,2,3]
	; SSE2-SSSE3-NEXT: punpckldq {{.*#+}} xmm1 = xmm1[0],xmm2[0],xmm1[1],xmm2[1]			; SSE2-SSSE3-NEXT: punpckldq {{.*#+}} xmm1 = xmm1[0],xmm2[0],xmm1[1],xmm2[1]
	; SSE2-SSSE3-NEXT: movdqa {{.*#+}} xmm2 = [2147483648,2147483648]			; SSE2-SSSE3-NEXT: movdqa {{.*#+}} xmm2 = [2147483648,2147483648]
	; SSE2-SSSE3-NEXT: pxor %xmm2, %xmm1			; SSE2-SSSE3-NEXT: pxor %xmm2, %xmm1
	; SSE2-SSSE3-NEXT: pxor %xmm2, %xmm0			; SSE2-SSSE3-NEXT: pxor %xmm2, %xmm0
	; SSE2-SSSE3-NEXT: movdqa %xmm0, %xmm2			; SSE2-SSSE3-NEXT: movdqa %xmm0, %xmm2
	; SSE2-SSSE3-NEXT: pcmpgtd %xmm1, %xmm2			; SSE2-SSSE3-NEXT: pcmpeqd %xmm1, %xmm2
	; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]			; SSE2-SSSE3-NEXT: pcmpgtd %xmm1, %xmm0
	; SSE2-SSSE3-NEXT: pcmpeqd %xmm1, %xmm0			; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm1 = xmm0[0,0,2,2]
	; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]			; SSE2-SSSE3-NEXT: pand %xmm2, %xmm1
	; SSE2-SSSE3-NEXT: pand %xmm3, %xmm0
	; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm1 = xmm2[1,1,3,3]
	; SSE2-SSSE3-NEXT: por %xmm0, %xmm1			; SSE2-SSSE3-NEXT: por %xmm0, %xmm1
	; SSE2-SSSE3-NEXT: movmskpd %xmm1, %eax			; SSE2-SSSE3-NEXT: movmskpd %xmm1, %eax
	; SSE2-SSSE3-NEXT: # kill: def $al killed $al killed $eax			; SSE2-SSSE3-NEXT: # kill: def $al killed $al killed $eax
	; SSE2-SSSE3-NEXT: retq			; SSE2-SSSE3-NEXT: retq
	;			;
	; AVX1-LABEL: v2i8:			; AVX1-LABEL: v2i8:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vpsllq $56, %xmm1, %xmm1			; AVX1-NEXT: vpsllq $56, %xmm1, %xmm1
	▲ Show 20 Lines • Show All 70 Lines • ▼ Show 20 Lines
	; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm2 = xmm2[1,3,2,3]			; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm2 = xmm2[1,3,2,3]
	; SSE2-SSSE3-NEXT: psrad $16, %xmm1			; SSE2-SSSE3-NEXT: psrad $16, %xmm1
	; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,3,2,3]			; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,3,2,3]
	; SSE2-SSSE3-NEXT: punpckldq {{.*#+}} xmm1 = xmm1[0],xmm2[0],xmm1[1],xmm2[1]			; SSE2-SSSE3-NEXT: punpckldq {{.*#+}} xmm1 = xmm1[0],xmm2[0],xmm1[1],xmm2[1]
	; SSE2-SSSE3-NEXT: movdqa {{.*#+}} xmm2 = [2147483648,2147483648]			; SSE2-SSSE3-NEXT: movdqa {{.*#+}} xmm2 = [2147483648,2147483648]
	; SSE2-SSSE3-NEXT: pxor %xmm2, %xmm1			; SSE2-SSSE3-NEXT: pxor %xmm2, %xmm1
	; SSE2-SSSE3-NEXT: pxor %xmm2, %xmm0			; SSE2-SSSE3-NEXT: pxor %xmm2, %xmm0
	; SSE2-SSSE3-NEXT: movdqa %xmm0, %xmm2			; SSE2-SSSE3-NEXT: movdqa %xmm0, %xmm2
	; SSE2-SSSE3-NEXT: pcmpgtd %xmm1, %xmm2			; SSE2-SSSE3-NEXT: pcmpeqd %xmm1, %xmm2
	; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]			; SSE2-SSSE3-NEXT: pcmpgtd %xmm1, %xmm0
	; SSE2-SSSE3-NEXT: pcmpeqd %xmm1, %xmm0			; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm1 = xmm0[0,0,2,2]
	; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]			; SSE2-SSSE3-NEXT: pand %xmm2, %xmm1
	; SSE2-SSSE3-NEXT: pand %xmm3, %xmm0
	; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm1 = xmm2[1,1,3,3]
	; SSE2-SSSE3-NEXT: por %xmm0, %xmm1			; SSE2-SSSE3-NEXT: por %xmm0, %xmm1
	; SSE2-SSSE3-NEXT: movmskpd %xmm1, %eax			; SSE2-SSSE3-NEXT: movmskpd %xmm1, %eax
	; SSE2-SSSE3-NEXT: # kill: def $al killed $al killed $eax			; SSE2-SSSE3-NEXT: # kill: def $al killed $al killed $eax
	; SSE2-SSSE3-NEXT: retq			; SSE2-SSSE3-NEXT: retq
	;			;
	; AVX1-LABEL: v2i16:			; AVX1-LABEL: v2i16:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vpsllq $48, %xmm1, %xmm1			; AVX1-NEXT: vpsllq $48, %xmm1, %xmm1
	▲ Show 20 Lines • Show All 66 Lines • ▼ Show 20 Lines
	; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,3,2,3]			; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,3,2,3]
	; SSE2-SSSE3-NEXT: psrad $31, %xmm1			; SSE2-SSSE3-NEXT: psrad $31, %xmm1
	; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,3,2,3]			; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,3,2,3]
	; SSE2-SSSE3-NEXT: punpckldq {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1]			; SSE2-SSSE3-NEXT: punpckldq {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1]
	; SSE2-SSSE3-NEXT: movdqa {{.*#+}} xmm1 = [2147483648,2147483648]			; SSE2-SSSE3-NEXT: movdqa {{.*#+}} xmm1 = [2147483648,2147483648]
	; SSE2-SSSE3-NEXT: pxor %xmm1, %xmm0			; SSE2-SSSE3-NEXT: pxor %xmm1, %xmm0
	; SSE2-SSSE3-NEXT: pxor %xmm1, %xmm2			; SSE2-SSSE3-NEXT: pxor %xmm1, %xmm2
	; SSE2-SSSE3-NEXT: movdqa %xmm2, %xmm1			; SSE2-SSSE3-NEXT: movdqa %xmm2, %xmm1
	; SSE2-SSSE3-NEXT: pcmpgtd %xmm0, %xmm1			; SSE2-SSSE3-NEXT: pcmpeqd %xmm0, %xmm1
	; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm3 = xmm1[0,0,2,2]			; SSE2-SSSE3-NEXT: pcmpgtd %xmm0, %xmm2
	; SSE2-SSSE3-NEXT: pcmpeqd %xmm0, %xmm2			; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm0 = xmm2[0,0,2,2]
	; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE2-SSSE3-NEXT: pand %xmm1, %xmm0
	; SSE2-SSSE3-NEXT: pand %xmm3, %xmm0			; SSE2-SSSE3-NEXT: por %xmm2, %xmm0
	; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,1,3,3]			; SSE2-SSSE3-NEXT: movmskpd %xmm0, %eax
	; SSE2-SSSE3-NEXT: por %xmm0, %xmm1
	; SSE2-SSSE3-NEXT: movmskpd %xmm1, %eax
	; SSE2-SSSE3-NEXT: # kill: def $al killed $al killed $eax			; SSE2-SSSE3-NEXT: # kill: def $al killed $al killed $eax
	; SSE2-SSSE3-NEXT: retq			; SSE2-SSSE3-NEXT: retq
	;			;
	; AVX1-LABEL: v2i32:			; AVX1-LABEL: v2i32:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vpsllq $32, %xmm1, %xmm2			; AVX1-NEXT: vpsllq $32, %xmm1, %xmm2
	; AVX1-NEXT: vpsrad $31, %xmm2, %xmm2			; AVX1-NEXT: vpsrad $31, %xmm2, %xmm2
	; AVX1-NEXT: vpblendw {{.*#+}} xmm1 = xmm1[0,1],xmm2[2,3],xmm1[4,5],xmm2[6,7]			; AVX1-NEXT: vpblendw {{.*#+}} xmm1 = xmm1[0,1],xmm2[2,3],xmm1[4,5],xmm2[6,7]
	▲ Show 20 Lines • Show All 46 Lines • ▼ Show 20 Lines

	define i2 @v2i64(<2 x i64> %a, <2 x i64> %b) {			define i2 @v2i64(<2 x i64> %a, <2 x i64> %b) {
	; SSE2-SSSE3-LABEL: v2i64:			; SSE2-SSSE3-LABEL: v2i64:
	; SSE2-SSSE3: # %bb.0:			; SSE2-SSSE3: # %bb.0:
	; SSE2-SSSE3-NEXT: movdqa {{.*#+}} xmm2 = [2147483648,2147483648]			; SSE2-SSSE3-NEXT: movdqa {{.*#+}} xmm2 = [2147483648,2147483648]
	; SSE2-SSSE3-NEXT: pxor %xmm2, %xmm1			; SSE2-SSSE3-NEXT: pxor %xmm2, %xmm1
	; SSE2-SSSE3-NEXT: pxor %xmm2, %xmm0			; SSE2-SSSE3-NEXT: pxor %xmm2, %xmm0
	; SSE2-SSSE3-NEXT: movdqa %xmm0, %xmm2			; SSE2-SSSE3-NEXT: movdqa %xmm0, %xmm2
	; SSE2-SSSE3-NEXT: pcmpgtd %xmm1, %xmm2			; SSE2-SSSE3-NEXT: pcmpeqd %xmm1, %xmm2
	; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]			; SSE2-SSSE3-NEXT: pcmpgtd %xmm1, %xmm0
	; SSE2-SSSE3-NEXT: pcmpeqd %xmm1, %xmm0			; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm1 = xmm0[0,0,2,2]
	; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]			; SSE2-SSSE3-NEXT: pand %xmm2, %xmm1
	; SSE2-SSSE3-NEXT: pand %xmm3, %xmm0
	; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm1 = xmm2[1,1,3,3]
	; SSE2-SSSE3-NEXT: por %xmm0, %xmm1			; SSE2-SSSE3-NEXT: por %xmm0, %xmm1
	; SSE2-SSSE3-NEXT: movmskpd %xmm1, %eax			; SSE2-SSSE3-NEXT: movmskpd %xmm1, %eax
	; SSE2-SSSE3-NEXT: # kill: def $al killed $al killed $eax			; SSE2-SSSE3-NEXT: # kill: def $al killed $al killed $eax
	; SSE2-SSSE3-NEXT: retq			; SSE2-SSSE3-NEXT: retq
	;			;
	; AVX12-LABEL: v2i64:			; AVX12-LABEL: v2i64:
	; AVX12: # %bb.0:			; AVX12: # %bb.0:
	; AVX12-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0			; AVX12-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	▲ Show 20 Lines • Show All 454 Lines • Show Last 20 Lines

llvm/trunk/test/CodeGen/X86/bitcast-setcc-256.ll

	Show First 20 Lines • Show All 208 Lines • ▼ Show 20 Lines

	define i4 @v4i64(<4 x i64> %a, <4 x i64> %b) {			define i4 @v4i64(<4 x i64> %a, <4 x i64> %b) {
	; SSE2-SSSE3-LABEL: v4i64:			; SSE2-SSSE3-LABEL: v4i64:
	; SSE2-SSSE3: # %bb.0:			; SSE2-SSSE3: # %bb.0:
	; SSE2-SSSE3-NEXT: movdqa {{.*#+}} xmm4 = [2147483648,2147483648]			; SSE2-SSSE3-NEXT: movdqa {{.*#+}} xmm4 = [2147483648,2147483648]
	; SSE2-SSSE3-NEXT: pxor %xmm4, %xmm3			; SSE2-SSSE3-NEXT: pxor %xmm4, %xmm3
	; SSE2-SSSE3-NEXT: pxor %xmm4, %xmm1			; SSE2-SSSE3-NEXT: pxor %xmm4, %xmm1
	; SSE2-SSSE3-NEXT: movdqa %xmm1, %xmm5			; SSE2-SSSE3-NEXT: movdqa %xmm1, %xmm5
	; SSE2-SSSE3-NEXT: pcmpgtd %xmm3, %xmm5			; SSE2-SSSE3-NEXT: pcmpeqd %xmm3, %xmm5
	; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm6 = xmm5[0,0,2,2]			; SSE2-SSSE3-NEXT: pcmpgtd %xmm3, %xmm1
	; SSE2-SSSE3-NEXT: pcmpeqd %xmm3, %xmm1			; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm3 = xmm1[0,0,2,2]
	; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,1,3,3]			; SSE2-SSSE3-NEXT: pand %xmm5, %xmm3
	; SSE2-SSSE3-NEXT: pand %xmm6, %xmm1
	; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm3 = xmm5[1,1,3,3]
	; SSE2-SSSE3-NEXT: por %xmm1, %xmm3			; SSE2-SSSE3-NEXT: por %xmm1, %xmm3
	; SSE2-SSSE3-NEXT: pxor %xmm4, %xmm2			; SSE2-SSSE3-NEXT: pxor %xmm4, %xmm2
	; SSE2-SSSE3-NEXT: pxor %xmm4, %xmm0			; SSE2-SSSE3-NEXT: pxor %xmm4, %xmm0
	; SSE2-SSSE3-NEXT: movdqa %xmm0, %xmm1			; SSE2-SSSE3-NEXT: movdqa %xmm0, %xmm1
	; SSE2-SSSE3-NEXT: pcmpgtd %xmm2, %xmm1			; SSE2-SSSE3-NEXT: pcmpeqd %xmm2, %xmm1
	; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm4 = xmm1[0,0,2,2]			; SSE2-SSSE3-NEXT: pcmpgtd %xmm2, %xmm0
	; SSE2-SSSE3-NEXT: pcmpeqd %xmm2, %xmm0			; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm2 = xmm0[0,0,2,2]
	; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]			; SSE2-SSSE3-NEXT: pand %xmm1, %xmm2
	; SSE2-SSSE3-NEXT: pand %xmm4, %xmm0			; SSE2-SSSE3-NEXT: por %xmm0, %xmm2
	; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,1,3,3]			; SSE2-SSSE3-NEXT: packssdw %xmm3, %xmm2
	; SSE2-SSSE3-NEXT: por %xmm0, %xmm1			; SSE2-SSSE3-NEXT: movmskps %xmm2, %eax
	; SSE2-SSSE3-NEXT: packssdw %xmm3, %xmm1
	; SSE2-SSSE3-NEXT: movmskps %xmm1, %eax
	; SSE2-SSSE3-NEXT: # kill: def $al killed $al killed $eax			; SSE2-SSSE3-NEXT: # kill: def $al killed $al killed $eax
	; SSE2-SSSE3-NEXT: retq			; SSE2-SSSE3-NEXT: retq
	;			;
	; AVX1-LABEL: v4i64:			; AVX1-LABEL: v4i64:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2			; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
	; AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2
	▲ Show 20 Lines • Show All 228 Lines • ▼ Show 20 Lines
	}			}

	define void @bitcast_4i64_store(i4* %p, <4 x i64> %a0) {			define void @bitcast_4i64_store(i4* %p, <4 x i64> %a0) {
	; SSE2-SSSE3-LABEL: bitcast_4i64_store:			; SSE2-SSSE3-LABEL: bitcast_4i64_store:
	; SSE2-SSSE3: # %bb.0:			; SSE2-SSSE3: # %bb.0:
	; SSE2-SSSE3-NEXT: movdqa {{.*#+}} xmm2 = [2147483648,2147483648]			; SSE2-SSSE3-NEXT: movdqa {{.*#+}} xmm2 = [2147483648,2147483648]
	; SSE2-SSSE3-NEXT: pxor %xmm2, %xmm1			; SSE2-SSSE3-NEXT: pxor %xmm2, %xmm1
	; SSE2-SSSE3-NEXT: movdqa %xmm2, %xmm3			; SSE2-SSSE3-NEXT: movdqa %xmm2, %xmm3
	; SSE2-SSSE3-NEXT: pcmpgtd %xmm1, %xmm3			; SSE2-SSSE3-NEXT: pcmpeqd %xmm1, %xmm3
	; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm4 = xmm3[0,0,2,2]			; SSE2-SSSE3-NEXT: movdqa %xmm2, %xmm4
	; SSE2-SSSE3-NEXT: pcmpeqd %xmm2, %xmm1			; SSE2-SSSE3-NEXT: pcmpgtd %xmm1, %xmm4
	; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,1,3,3]			; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm1 = xmm4[0,0,2,2]
	; SSE2-SSSE3-NEXT: pand %xmm4, %xmm1			; SSE2-SSSE3-NEXT: pand %xmm3, %xmm1
	; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm3 = xmm3[1,1,3,3]			; SSE2-SSSE3-NEXT: por %xmm4, %xmm1
	; SSE2-SSSE3-NEXT: por %xmm1, %xmm3
	; SSE2-SSSE3-NEXT: pxor %xmm2, %xmm0			; SSE2-SSSE3-NEXT: pxor %xmm2, %xmm0
	; SSE2-SSSE3-NEXT: movdqa %xmm2, %xmm1			; SSE2-SSSE3-NEXT: movdqa %xmm2, %xmm3
	; SSE2-SSSE3-NEXT: pcmpgtd %xmm0, %xmm1			; SSE2-SSSE3-NEXT: pcmpeqd %xmm0, %xmm3
	; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm4 = xmm1[0,0,2,2]			; SSE2-SSSE3-NEXT: pcmpgtd %xmm0, %xmm2
	; SSE2-SSSE3-NEXT: pcmpeqd %xmm2, %xmm0			; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm0 = xmm2[0,0,2,2]
	; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]			; SSE2-SSSE3-NEXT: pand %xmm3, %xmm0
	; SSE2-SSSE3-NEXT: pand %xmm4, %xmm0			; SSE2-SSSE3-NEXT: por %xmm2, %xmm0
	; SSE2-SSSE3-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,1,3,3]			; SSE2-SSSE3-NEXT: packssdw %xmm1, %xmm0
	; SSE2-SSSE3-NEXT: por %xmm0, %xmm1			; SSE2-SSSE3-NEXT: movmskps %xmm0, %eax
	; SSE2-SSSE3-NEXT: packssdw %xmm3, %xmm1
	; SSE2-SSSE3-NEXT: movmskps %xmm1, %eax
	; SSE2-SSSE3-NEXT: movb %al, (%rdi)			; SSE2-SSSE3-NEXT: movb %al, (%rdi)
	; SSE2-SSSE3-NEXT: retq			; SSE2-SSSE3-NEXT: retq
	;			;
	; AVX12-LABEL: bitcast_4i64_store:			; AVX12-LABEL: bitcast_4i64_store:
	; AVX12: # %bb.0:			; AVX12: # %bb.0:
	; AVX12-NEXT: vmovmskpd %ymm0, %eax			; AVX12-NEXT: vmovmskpd %ymm0, %eax
	; AVX12-NEXT: movb %al, (%rdi)			; AVX12-NEXT: movb %al, (%rdi)
	; AVX12-NEXT: vzeroupper			; AVX12-NEXT: vzeroupper
	Show All 24 Lines

llvm/trunk/test/CodeGen/X86/combine-sdiv.ll

	Show First 20 Lines • Show All 1,525 Lines • ▼ Show 20 Lines
	; XOP-NEXT: retq			; XOP-NEXT: retq
	%1 = sdiv <16 x i32> %x, <i32 1, i32 4, i32 8, i32 16, i32 1, i32 4, i32 8, i32 16, i32 1, i32 4, i32 8, i32 16, i32 1, i32 4, i32 8, i32 16>			%1 = sdiv <16 x i32> %x, <i32 1, i32 4, i32 8, i32 16, i32 1, i32 4, i32 8, i32 16, i32 1, i32 4, i32 8, i32 16, i32 1, i32 4, i32 8, i32 16>
	ret <16 x i32> %1			ret <16 x i32> %1
	}			}

	define <2 x i64> @combine_vec_sdiv_by_pow2b_v2i64(<2 x i64> %x) {			define <2 x i64> @combine_vec_sdiv_by_pow2b_v2i64(<2 x i64> %x) {
	; SSE2-LABEL: combine_vec_sdiv_by_pow2b_v2i64:			; SSE2-LABEL: combine_vec_sdiv_by_pow2b_v2i64:
	; SSE2: # %bb.0:			; SSE2: # %bb.0:
	; SSE2-NEXT: movdqa %xmm0, %xmm2			; SSE2-NEXT: movdqa %xmm0, %xmm1
	; SSE2-NEXT: psrad $31, %xmm2			; SSE2-NEXT: psrad $31, %xmm1
	; SSE2-NEXT: psrlq $62, %xmm2			; SSE2-NEXT: psrlq $62, %xmm1
	; SSE2-NEXT: paddq %xmm0, %xmm2			; SSE2-NEXT: paddq %xmm0, %xmm1
	; SSE2-NEXT: movdqa %xmm2, %xmm1
	; SSE2-NEXT: psrlq $2, %xmm1			; SSE2-NEXT: psrlq $2, %xmm1
	; SSE2-NEXT: movsd {{.*#+}} xmm1 = xmm2[0],xmm1[1]			; SSE2-NEXT: movdqa {{.*#+}} xmm2 = [9223372036854775808,2305843009213693952]
	; SSE2-NEXT: movapd {{.*#+}} xmm2 = [9223372036854775808,2305843009213693952]			; SSE2-NEXT: pxor %xmm2, %xmm1
	; SSE2-NEXT: xorpd %xmm2, %xmm1
	; SSE2-NEXT: psubq %xmm2, %xmm1			; SSE2-NEXT: psubq %xmm2, %xmm1
	; SSE2-NEXT: movsd {{.*#+}} xmm1 = xmm0[0],xmm1[1]			; SSE2-NEXT: movsd {{.*#+}} xmm1 = xmm0[0],xmm1[1]
	; SSE2-NEXT: movapd %xmm1, %xmm0			; SSE2-NEXT: movapd %xmm1, %xmm0
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: combine_vec_sdiv_by_pow2b_v2i64:			; SSE41-LABEL: combine_vec_sdiv_by_pow2b_v2i64:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movdqa %xmm0, %xmm2			; SSE41-NEXT: movdqa %xmm0, %xmm1
	; SSE41-NEXT: psrad $31, %xmm2			; SSE41-NEXT: psrad $31, %xmm1
	; SSE41-NEXT: psrlq $62, %xmm2			; SSE41-NEXT: psrlq $62, %xmm1
	; SSE41-NEXT: paddq %xmm0, %xmm2			; SSE41-NEXT: paddq %xmm0, %xmm1
	; SSE41-NEXT: movdqa %xmm2, %xmm1
	; SSE41-NEXT: psrlq $2, %xmm1			; SSE41-NEXT: psrlq $2, %xmm1
	; SSE41-NEXT: pblendw {{.*#+}} xmm1 = xmm2[0,1,2,3],xmm1[4,5,6,7]
	; SSE41-NEXT: movdqa {{.*#+}} xmm2 = [9223372036854775808,2305843009213693952]			; SSE41-NEXT: movdqa {{.*#+}} xmm2 = [9223372036854775808,2305843009213693952]
	; SSE41-NEXT: pxor %xmm2, %xmm1			; SSE41-NEXT: pxor %xmm2, %xmm1
	; SSE41-NEXT: psubq %xmm2, %xmm1			; SSE41-NEXT: psubq %xmm2, %xmm1
	; SSE41-NEXT: pblendw {{.*#+}} xmm1 = xmm0[0,1,2,3],xmm1[4,5,6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm1 = xmm0[0,1,2,3],xmm1[4,5,6,7]
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: combine_vec_sdiv_by_pow2b_v2i64:			; AVX1-LABEL: combine_vec_sdiv_by_pow2b_v2i64:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX1-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm1			; AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm1
	; AVX1-NEXT: vpsrlq $62, %xmm1, %xmm1			; AVX1-NEXT: vpsrlq $62, %xmm1, %xmm1
	; AVX1-NEXT: vpaddq %xmm1, %xmm0, %xmm1			; AVX1-NEXT: vpaddq %xmm1, %xmm0, %xmm1
	; AVX1-NEXT: vpsrlq $2, %xmm1, %xmm2			; AVX1-NEXT: vpsrlq $2, %xmm1, %xmm1
	; AVX1-NEXT: vpblendw {{.*#+}} xmm1 = xmm1[0,1,2,3],xmm2[4,5,6,7]
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,2305843009213693952]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,2305843009213693952]
	; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm1			; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm1
	; AVX1-NEXT: vpsubq %xmm2, %xmm1, %xmm1			; AVX1-NEXT: vpsubq %xmm2, %xmm1, %xmm1
	; AVX1-NEXT: vpblendw {{.*#+}} xmm0 = xmm0[0,1,2,3],xmm1[4,5,6,7]			; AVX1-NEXT: vpblendw {{.*#+}} xmm0 = xmm0[0,1,2,3],xmm1[4,5,6,7]
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: combine_vec_sdiv_by_pow2b_v2i64:			; AVX2-LABEL: combine_vec_sdiv_by_pow2b_v2i64:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	▲ Show 20 Lines • Show All 50 Lines • ▼ Show 20 Lines
	; XOP-NEXT: retq			; XOP-NEXT: retq
	%1 = sdiv <2 x i64> %x, <i64 1, i64 4>			%1 = sdiv <2 x i64> %x, <i64 1, i64 4>
	ret <2 x i64> %1			ret <2 x i64> %1
	}			}

	define <4 x i64> @combine_vec_sdiv_by_pow2b_v4i64(<4 x i64> %x) {			define <4 x i64> @combine_vec_sdiv_by_pow2b_v4i64(<4 x i64> %x) {
	; SSE2-LABEL: combine_vec_sdiv_by_pow2b_v4i64:			; SSE2-LABEL: combine_vec_sdiv_by_pow2b_v4i64:
	; SSE2: # %bb.0:			; SSE2: # %bb.0:
	; SSE2-NEXT: movdqa %xmm0, %xmm2
	; SSE2-NEXT: movdqa %xmm0, %xmm3
	; SSE2-NEXT: psrad $31, %xmm3
	; SSE2-NEXT: psrlq $62, %xmm3
	; SSE2-NEXT: paddq %xmm0, %xmm3
	; SSE2-NEXT: movdqa %xmm3, %xmm0
	; SSE2-NEXT: psrlq $2, %xmm0
	; SSE2-NEXT: movsd {{.*#+}} xmm0 = xmm3[0],xmm0[1]
	; SSE2-NEXT: movapd {{.*#+}} xmm3 = [9223372036854775808,2305843009213693952]
	; SSE2-NEXT: xorpd %xmm3, %xmm0
	; SSE2-NEXT: psubq %xmm3, %xmm0
	; SSE2-NEXT: movsd {{.*#+}} xmm0 = xmm2[0],xmm0[1]
	; SSE2-NEXT: movdqa %xmm1, %xmm2			; SSE2-NEXT: movdqa %xmm1, %xmm2
	; SSE2-NEXT: psrad $31, %xmm2			; SSE2-NEXT: psrad $31, %xmm1
	; SSE2-NEXT: pshufd {{.*#+}} xmm2 = xmm2[1,1,3,3]			; SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,1,3,3]
	; SSE2-NEXT: movdqa %xmm2, %xmm3			; SSE2-NEXT: movdqa %xmm1, %xmm3
	; SSE2-NEXT: psrlq $61, %xmm3			; SSE2-NEXT: psrlq $61, %xmm3
	; SSE2-NEXT: psrlq $60, %xmm2			; SSE2-NEXT: psrlq $60, %xmm1
	; SSE2-NEXT: movsd {{.*#+}} xmm2 = xmm3[0],xmm2[1]			; SSE2-NEXT: movsd {{.*#+}} xmm1 = xmm3[0],xmm1[1]
	; SSE2-NEXT: paddq %xmm1, %xmm2			; SSE2-NEXT: paddq %xmm2, %xmm1
	; SSE2-NEXT: movdqa %xmm2, %xmm1			; SSE2-NEXT: movdqa %xmm1, %xmm2
	; SSE2-NEXT: psrlq $3, %xmm1			; SSE2-NEXT: psrlq $3, %xmm2
	; SSE2-NEXT: psrlq $4, %xmm2			; SSE2-NEXT: psrlq $4, %xmm1
	; SSE2-NEXT: movsd {{.*#+}} xmm2 = xmm1[0],xmm2[1]			; SSE2-NEXT: movsd {{.*#+}} xmm1 = xmm2[0],xmm1[1]
	; SSE2-NEXT: movapd {{.*#+}} xmm1 = [1152921504606846976,576460752303423488]			; SSE2-NEXT: movapd {{.*#+}} xmm2 = [1152921504606846976,576460752303423488]
	; SSE2-NEXT: xorpd %xmm1, %xmm2			; SSE2-NEXT: xorpd %xmm2, %xmm1
	; SSE2-NEXT: psubq %xmm1, %xmm2			; SSE2-NEXT: psubq %xmm2, %xmm1
	; SSE2-NEXT: movdqa %xmm2, %xmm1			; SSE2-NEXT: movdqa %xmm0, %xmm2
				; SSE2-NEXT: psrad $31, %xmm2
				; SSE2-NEXT: psrlq $62, %xmm2
				; SSE2-NEXT: paddq %xmm0, %xmm2
				; SSE2-NEXT: psrlq $2, %xmm2
				; SSE2-NEXT: movdqa {{.*#+}} xmm3 = [9223372036854775808,2305843009213693952]
				; SSE2-NEXT: pxor %xmm3, %xmm2
				; SSE2-NEXT: psubq %xmm3, %xmm2
				; SSE2-NEXT: movsd {{.*#+}} xmm2 = xmm0[0],xmm2[1]
				; SSE2-NEXT: movapd %xmm2, %xmm0
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: combine_vec_sdiv_by_pow2b_v4i64:			; SSE41-LABEL: combine_vec_sdiv_by_pow2b_v4i64:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movdqa %xmm0, %xmm2
	; SSE41-NEXT: movdqa %xmm0, %xmm3
	; SSE41-NEXT: psrad $31, %xmm3
	; SSE41-NEXT: psrlq $62, %xmm3
	; SSE41-NEXT: paddq %xmm0, %xmm3
	; SSE41-NEXT: movdqa %xmm3, %xmm0
	; SSE41-NEXT: psrlq $2, %xmm0
	; SSE41-NEXT: pblendw {{.*#+}} xmm0 = xmm3[0,1,2,3],xmm0[4,5,6,7]
	; SSE41-NEXT: movdqa {{.*#+}} xmm3 = [9223372036854775808,2305843009213693952]
	; SSE41-NEXT: pxor %xmm3, %xmm0
	; SSE41-NEXT: psubq %xmm3, %xmm0
	; SSE41-NEXT: pblendw {{.*#+}} xmm0 = xmm2[0,1,2,3],xmm0[4,5,6,7]
	; SSE41-NEXT: movdqa %xmm1, %xmm2			; SSE41-NEXT: movdqa %xmm1, %xmm2
	; SSE41-NEXT: psrad $31, %xmm2			; SSE41-NEXT: psrad $31, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm2[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,1,3,3]
	; SSE41-NEXT: movdqa %xmm2, %xmm3			; SSE41-NEXT: movdqa %xmm1, %xmm3
	; SSE41-NEXT: psrlq $60, %xmm3			; SSE41-NEXT: psrlq $60, %xmm3
	; SSE41-NEXT: psrlq $61, %xmm2			; SSE41-NEXT: psrlq $61, %xmm1
	; SSE41-NEXT: pblendw {{.*#+}} xmm2 = xmm2[0,1,2,3],xmm3[4,5,6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm1 = xmm1[0,1,2,3],xmm3[4,5,6,7]
	; SSE41-NEXT: paddq %xmm1, %xmm2			; SSE41-NEXT: paddq %xmm2, %xmm1
	; SSE41-NEXT: movdqa %xmm2, %xmm1			; SSE41-NEXT: movdqa %xmm1, %xmm2
	; SSE41-NEXT: psrlq $4, %xmm1			; SSE41-NEXT: psrlq $4, %xmm2
	; SSE41-NEXT: psrlq $3, %xmm2			; SSE41-NEXT: psrlq $3, %xmm1
	; SSE41-NEXT: pblendw {{.*#+}} xmm2 = xmm2[0,1,2,3],xmm1[4,5,6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm1 = xmm1[0,1,2,3],xmm2[4,5,6,7]
	; SSE41-NEXT: movdqa {{.*#+}} xmm1 = [1152921504606846976,576460752303423488]			; SSE41-NEXT: movdqa {{.*#+}} xmm2 = [1152921504606846976,576460752303423488]
	; SSE41-NEXT: pxor %xmm1, %xmm2			; SSE41-NEXT: pxor %xmm2, %xmm1
	; SSE41-NEXT: psubq %xmm1, %xmm2			; SSE41-NEXT: psubq %xmm2, %xmm1
	; SSE41-NEXT: movdqa %xmm2, %xmm1			; SSE41-NEXT: movdqa %xmm0, %xmm2
				; SSE41-NEXT: psrad $31, %xmm2
				; SSE41-NEXT: psrlq $62, %xmm2
				; SSE41-NEXT: paddq %xmm0, %xmm2
				; SSE41-NEXT: psrlq $2, %xmm2
				; SSE41-NEXT: movdqa {{.*#+}} xmm3 = [9223372036854775808,2305843009213693952]
				; SSE41-NEXT: pxor %xmm3, %xmm2
				; SSE41-NEXT: psubq %xmm3, %xmm2
				; SSE41-NEXT: pblendw {{.*#+}} xmm2 = xmm0[0,1,2,3],xmm2[4,5,6,7]
				; SSE41-NEXT: movdqa %xmm2, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: combine_vec_sdiv_by_pow2b_v4i64:			; AVX1-LABEL: combine_vec_sdiv_by_pow2b_v4i64:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1
	; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2			; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2
	; AVX1-NEXT: vpcmpgtq %xmm1, %xmm2, %xmm3			; AVX1-NEXT: vpcmpgtq %xmm1, %xmm2, %xmm3
	; AVX1-NEXT: vpsrlq $60, %xmm3, %xmm4			; AVX1-NEXT: vpsrlq $60, %xmm3, %xmm4
	▲ Show 20 Lines • Show All 71 Lines • ▼ Show 20 Lines
	; XOP-NEXT: retq			; XOP-NEXT: retq
	%1 = sdiv <4 x i64> %x, <i64 1, i64 4, i64 8, i64 16>			%1 = sdiv <4 x i64> %x, <i64 1, i64 4, i64 8, i64 16>
	ret <4 x i64> %1			ret <4 x i64> %1
	}			}

	define <8 x i64> @combine_vec_sdiv_by_pow2b_v8i64(<8 x i64> %x) {			define <8 x i64> @combine_vec_sdiv_by_pow2b_v8i64(<8 x i64> %x) {
	; SSE2-LABEL: combine_vec_sdiv_by_pow2b_v8i64:			; SSE2-LABEL: combine_vec_sdiv_by_pow2b_v8i64:
	; SSE2: # %bb.0:			; SSE2: # %bb.0:
	; SSE2-NEXT: movdqa %xmm2, %xmm4			; SSE2-NEXT: movdqa %xmm3, %xmm4
	; SSE2-NEXT: movdqa %xmm0, %xmm2			; SSE2-NEXT: movdqa %xmm1, %xmm3
	; SSE2-NEXT: movdqa %xmm0, %xmm5			; SSE2-NEXT: psrad $31, %xmm1
	; SSE2-NEXT: psrad $31, %xmm5			; SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,1,3,3]
	; SSE2-NEXT: psrlq $62, %xmm5			; SSE2-NEXT: movdqa %xmm1, %xmm5
	; SSE2-NEXT: paddq %xmm0, %xmm5
	; SSE2-NEXT: movdqa %xmm5, %xmm0
	; SSE2-NEXT: psrlq $2, %xmm0
	; SSE2-NEXT: movsd {{.*#+}} xmm0 = xmm5[0],xmm0[1]
	; SSE2-NEXT: movapd {{.*#+}} xmm5 = [9223372036854775808,2305843009213693952]
	; SSE2-NEXT: xorpd %xmm5, %xmm0
	; SSE2-NEXT: psubq %xmm5, %xmm0
	; SSE2-NEXT: movsd {{.*#+}} xmm0 = xmm2[0],xmm0[1]
	; SSE2-NEXT: movdqa %xmm4, %xmm6
	; SSE2-NEXT: psrad $31, %xmm6
	; SSE2-NEXT: psrlq $62, %xmm6
	; SSE2-NEXT: paddq %xmm4, %xmm6
	; SSE2-NEXT: movdqa %xmm6, %xmm2
	; SSE2-NEXT: psrlq $2, %xmm2
	; SSE2-NEXT: movsd {{.*#+}} xmm2 = xmm6[0],xmm2[1]
	; SSE2-NEXT: xorpd %xmm5, %xmm2
	; SSE2-NEXT: psubq %xmm5, %xmm2
	; SSE2-NEXT: movsd {{.*#+}} xmm2 = xmm4[0],xmm2[1]
	; SSE2-NEXT: movdqa %xmm1, %xmm4
	; SSE2-NEXT: psrad $31, %xmm4
	; SSE2-NEXT: pshufd {{.*#+}} xmm4 = xmm4[1,1,3,3]
	; SSE2-NEXT: movdqa %xmm4, %xmm5
	; SSE2-NEXT: psrlq $61, %xmm5			; SSE2-NEXT: psrlq $61, %xmm5
	; SSE2-NEXT: psrlq $60, %xmm4			; SSE2-NEXT: psrlq $60, %xmm1
	; SSE2-NEXT: movsd {{.*#+}} xmm4 = xmm5[0],xmm4[1]			; SSE2-NEXT: movsd {{.*#+}} xmm1 = xmm5[0],xmm1[1]
	; SSE2-NEXT: paddq %xmm1, %xmm4			; SSE2-NEXT: paddq %xmm3, %xmm1
	; SSE2-NEXT: movdqa %xmm4, %xmm1			; SSE2-NEXT: movdqa %xmm1, %xmm3
	; SSE2-NEXT: psrlq $3, %xmm1
	; SSE2-NEXT: psrlq $4, %xmm4
	; SSE2-NEXT: movsd {{.*#+}} xmm4 = xmm1[0],xmm4[1]
	; SSE2-NEXT: movapd {{.*#+}} xmm1 = [1152921504606846976,576460752303423488]
	; SSE2-NEXT: xorpd %xmm1, %xmm4
	; SSE2-NEXT: psubq %xmm1, %xmm4
	; SSE2-NEXT: movdqa %xmm3, %xmm5
	; SSE2-NEXT: psrad $31, %xmm5
	; SSE2-NEXT: pshufd {{.*#+}} xmm5 = xmm5[1,1,3,3]
	; SSE2-NEXT: movdqa %xmm5, %xmm6
	; SSE2-NEXT: psrlq $61, %xmm6
	; SSE2-NEXT: psrlq $60, %xmm5
	; SSE2-NEXT: movsd {{.*#+}} xmm5 = xmm6[0],xmm5[1]
	; SSE2-NEXT: paddq %xmm3, %xmm5
	; SSE2-NEXT: movdqa %xmm5, %xmm3
	; SSE2-NEXT: psrlq $3, %xmm3			; SSE2-NEXT: psrlq $3, %xmm3
	; SSE2-NEXT: psrlq $4, %xmm5			; SSE2-NEXT: psrlq $4, %xmm1
	; SSE2-NEXT: movsd {{.*#+}} xmm5 = xmm3[0],xmm5[1]			; SSE2-NEXT: movsd {{.*#+}} xmm1 = xmm3[0],xmm1[1]
	; SSE2-NEXT: xorpd %xmm1, %xmm5			; SSE2-NEXT: movapd {{.*#+}} xmm5 = [1152921504606846976,576460752303423488]
	; SSE2-NEXT: psubq %xmm1, %xmm5			; SSE2-NEXT: xorpd %xmm5, %xmm1
	; SSE2-NEXT: movdqa %xmm4, %xmm1			; SSE2-NEXT: psubq %xmm5, %xmm1
	; SSE2-NEXT: movdqa %xmm5, %xmm3			; SSE2-NEXT: movdqa %xmm4, %xmm3
				; SSE2-NEXT: psrad $31, %xmm3
				; SSE2-NEXT: pshufd {{.*#+}} xmm3 = xmm3[1,1,3,3]
				; SSE2-NEXT: movdqa %xmm3, %xmm6
				; SSE2-NEXT: psrlq $61, %xmm6
				; SSE2-NEXT: psrlq $60, %xmm3
				; SSE2-NEXT: movsd {{.*#+}} xmm3 = xmm6[0],xmm3[1]
				; SSE2-NEXT: paddq %xmm4, %xmm3
				; SSE2-NEXT: movdqa %xmm3, %xmm4
				; SSE2-NEXT: psrlq $3, %xmm4
				; SSE2-NEXT: psrlq $4, %xmm3
				; SSE2-NEXT: movsd {{.*#+}} xmm3 = xmm4[0],xmm3[1]
				; SSE2-NEXT: xorpd %xmm5, %xmm3
				; SSE2-NEXT: psubq %xmm5, %xmm3
				; SSE2-NEXT: movdqa %xmm0, %xmm4
				; SSE2-NEXT: psrad $31, %xmm4
				; SSE2-NEXT: psrlq $62, %xmm4
				; SSE2-NEXT: paddq %xmm0, %xmm4
				; SSE2-NEXT: psrlq $2, %xmm4
				; SSE2-NEXT: movdqa {{.*#+}} xmm6 = [9223372036854775808,2305843009213693952]
				; SSE2-NEXT: pxor %xmm6, %xmm4
				; SSE2-NEXT: psubq %xmm6, %xmm4
				; SSE2-NEXT: movsd {{.*#+}} xmm4 = xmm0[0],xmm4[1]
				; SSE2-NEXT: movdqa %xmm2, %xmm5
				; SSE2-NEXT: psrad $31, %xmm5
				; SSE2-NEXT: psrlq $62, %xmm5
				; SSE2-NEXT: paddq %xmm2, %xmm5
				; SSE2-NEXT: psrlq $2, %xmm5
				; SSE2-NEXT: pxor %xmm6, %xmm5
				; SSE2-NEXT: psubq %xmm6, %xmm5
				; SSE2-NEXT: movsd {{.*#+}} xmm5 = xmm2[0],xmm5[1]
				; SSE2-NEXT: movapd %xmm4, %xmm0
				; SSE2-NEXT: movapd %xmm5, %xmm2
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: combine_vec_sdiv_by_pow2b_v8i64:			; SSE41-LABEL: combine_vec_sdiv_by_pow2b_v8i64:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movdqa %xmm2, %xmm4			; SSE41-NEXT: movdqa %xmm3, %xmm4
	; SSE41-NEXT: movdqa %xmm0, %xmm2			; SSE41-NEXT: movdqa %xmm1, %xmm3
	; SSE41-NEXT: movdqa %xmm0, %xmm5			; SSE41-NEXT: psrad $31, %xmm1
	; SSE41-NEXT: psrad $31, %xmm5			; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,1,3,3]
	; SSE41-NEXT: psrlq $62, %xmm5			; SSE41-NEXT: movdqa %xmm1, %xmm5
	; SSE41-NEXT: paddq %xmm0, %xmm5
	; SSE41-NEXT: movdqa %xmm5, %xmm0
	; SSE41-NEXT: psrlq $2, %xmm0
	; SSE41-NEXT: pblendw {{.*#+}} xmm0 = xmm5[0,1,2,3],xmm0[4,5,6,7]
	; SSE41-NEXT: movdqa {{.*#+}} xmm5 = [9223372036854775808,2305843009213693952]
	; SSE41-NEXT: pxor %xmm5, %xmm0
	; SSE41-NEXT: psubq %xmm5, %xmm0
	; SSE41-NEXT: pblendw {{.*#+}} xmm0 = xmm2[0,1,2,3],xmm0[4,5,6,7]
	; SSE41-NEXT: movdqa %xmm4, %xmm6
	; SSE41-NEXT: psrad $31, %xmm6
	; SSE41-NEXT: psrlq $62, %xmm6
	; SSE41-NEXT: paddq %xmm4, %xmm6
	; SSE41-NEXT: movdqa %xmm6, %xmm2
	; SSE41-NEXT: psrlq $2, %xmm2
	; SSE41-NEXT: pblendw {{.*#+}} xmm2 = xmm6[0,1,2,3],xmm2[4,5,6,7]
	; SSE41-NEXT: pxor %xmm5, %xmm2
	; SSE41-NEXT: psubq %xmm5, %xmm2
	; SSE41-NEXT: pblendw {{.*#+}} xmm2 = xmm4[0,1,2,3],xmm2[4,5,6,7]
	; SSE41-NEXT: movdqa %xmm1, %xmm4
	; SSE41-NEXT: psrad $31, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm4[1,1,3,3]
	; SSE41-NEXT: movdqa %xmm4, %xmm5
	; SSE41-NEXT: psrlq $60, %xmm5			; SSE41-NEXT: psrlq $60, %xmm5
	; SSE41-NEXT: psrlq $61, %xmm4			; SSE41-NEXT: psrlq $61, %xmm1
	; SSE41-NEXT: pblendw {{.*#+}} xmm4 = xmm4[0,1,2,3],xmm5[4,5,6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm1 = xmm1[0,1,2,3],xmm5[4,5,6,7]
	; SSE41-NEXT: paddq %xmm1, %xmm4			; SSE41-NEXT: paddq %xmm3, %xmm1
	; SSE41-NEXT: movdqa %xmm4, %xmm1			; SSE41-NEXT: movdqa %xmm1, %xmm3
	; SSE41-NEXT: psrlq $4, %xmm1
	; SSE41-NEXT: psrlq $3, %xmm4
	; SSE41-NEXT: pblendw {{.*#+}} xmm4 = xmm4[0,1,2,3],xmm1[4,5,6,7]
	; SSE41-NEXT: movdqa {{.*#+}} xmm1 = [1152921504606846976,576460752303423488]
	; SSE41-NEXT: pxor %xmm1, %xmm4
	; SSE41-NEXT: psubq %xmm1, %xmm4
	; SSE41-NEXT: movdqa %xmm3, %xmm5
	; SSE41-NEXT: psrad $31, %xmm5
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm5[1,1,3,3]
	; SSE41-NEXT: movdqa %xmm5, %xmm6
	; SSE41-NEXT: psrlq $60, %xmm6
	; SSE41-NEXT: psrlq $61, %xmm5
	; SSE41-NEXT: pblendw {{.*#+}} xmm5 = xmm5[0,1,2,3],xmm6[4,5,6,7]
	; SSE41-NEXT: paddq %xmm3, %xmm5
	; SSE41-NEXT: movdqa %xmm5, %xmm3
	; SSE41-NEXT: psrlq $4, %xmm3			; SSE41-NEXT: psrlq $4, %xmm3
	; SSE41-NEXT: psrlq $3, %xmm5			; SSE41-NEXT: psrlq $3, %xmm1
	; SSE41-NEXT: pblendw {{.*#+}} xmm5 = xmm5[0,1,2,3],xmm3[4,5,6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm1 = xmm1[0,1,2,3],xmm3[4,5,6,7]
	; SSE41-NEXT: pxor %xmm1, %xmm5			; SSE41-NEXT: movdqa {{.*#+}} xmm5 = [1152921504606846976,576460752303423488]
	; SSE41-NEXT: psubq %xmm1, %xmm5			; SSE41-NEXT: pxor %xmm5, %xmm1
	; SSE41-NEXT: movdqa %xmm4, %xmm1			; SSE41-NEXT: psubq %xmm5, %xmm1
	; SSE41-NEXT: movdqa %xmm5, %xmm3			; SSE41-NEXT: movdqa %xmm4, %xmm3
				; SSE41-NEXT: psrad $31, %xmm3
				; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm3[1,1,3,3]
				; SSE41-NEXT: movdqa %xmm3, %xmm6
				; SSE41-NEXT: psrlq $60, %xmm6
				; SSE41-NEXT: psrlq $61, %xmm3
				; SSE41-NEXT: pblendw {{.*#+}} xmm3 = xmm3[0,1,2,3],xmm6[4,5,6,7]
				; SSE41-NEXT: paddq %xmm4, %xmm3
				; SSE41-NEXT: movdqa %xmm3, %xmm4
				; SSE41-NEXT: psrlq $4, %xmm4
				; SSE41-NEXT: psrlq $3, %xmm3
				; SSE41-NEXT: pblendw {{.*#+}} xmm3 = xmm3[0,1,2,3],xmm4[4,5,6,7]
				; SSE41-NEXT: pxor %xmm5, %xmm3
				; SSE41-NEXT: psubq %xmm5, %xmm3
				; SSE41-NEXT: movdqa %xmm0, %xmm4
				; SSE41-NEXT: psrad $31, %xmm4
				; SSE41-NEXT: psrlq $62, %xmm4
				; SSE41-NEXT: paddq %xmm0, %xmm4
				; SSE41-NEXT: psrlq $2, %xmm4
				; SSE41-NEXT: movdqa {{.*#+}} xmm6 = [9223372036854775808,2305843009213693952]
				; SSE41-NEXT: pxor %xmm6, %xmm4
				; SSE41-NEXT: psubq %xmm6, %xmm4
				; SSE41-NEXT: pblendw {{.*#+}} xmm4 = xmm0[0,1,2,3],xmm4[4,5,6,7]
				; SSE41-NEXT: movdqa %xmm2, %xmm5
				; SSE41-NEXT: psrad $31, %xmm5
				; SSE41-NEXT: psrlq $62, %xmm5
				; SSE41-NEXT: paddq %xmm2, %xmm5
				; SSE41-NEXT: psrlq $2, %xmm5
				; SSE41-NEXT: pxor %xmm6, %xmm5
				; SSE41-NEXT: psubq %xmm6, %xmm5
				; SSE41-NEXT: pblendw {{.*#+}} xmm5 = xmm2[0,1,2,3],xmm5[4,5,6,7]
				; SSE41-NEXT: movdqa %xmm4, %xmm0
				; SSE41-NEXT: movdqa %xmm5, %xmm2
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: combine_vec_sdiv_by_pow2b_v8i64:			; AVX1-LABEL: combine_vec_sdiv_by_pow2b_v8i64:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
	; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2			; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2
	; AVX1-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm4			; AVX1-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm4
	; AVX1-NEXT: vpsrlq $60, %xmm4, %xmm5			; AVX1-NEXT: vpsrlq $60, %xmm4, %xmm5
	▲ Show 20 Lines • Show All 1,271 Lines • Show Last 20 Lines

llvm/trunk/test/CodeGen/X86/copysign-constant-magnitude.ll

	Show All 27 Lines
	; CHECK-NEXT: movsd [[SIGNMASK2]](%rip), %xmm1			; CHECK-NEXT: movsd [[SIGNMASK2]](%rip), %xmm1
	; CHECK-NEXT: andps %xmm1, %xmm0			; CHECK-NEXT: andps %xmm1, %xmm0
	; CHECK-NEXT: retq			; CHECK-NEXT: retq
	;			;
	%y = call double @copysign(double -0.0, double %x)			%y = call double @copysign(double -0.0, double %x)
	ret double %y			ret double %y
	}			}

				; CHECK: [[ONE3:L.+]]:
				; CHECK-NEXT: .quad 4607182418800017408 ## double 1
	; CHECK: [[SIGNMASK3:L.+]]:			; CHECK: [[SIGNMASK3:L.+]]:
	; CHECK-NEXT: .quad -9223372036854775808 ## double -0			; CHECK-NEXT: .quad -9223372036854775808 ## double -0
	; CHECK-NEXT: .quad -9223372036854775808 ## double -0			; CHECK-NEXT: .quad -9223372036854775808 ## double -0
	; CHECK: [[ONE3:L.+]]:
	; CHECK-NEXT: .quad 4607182418800017408 ## double 1

	define double @mag_pos1_double(double %x) nounwind {			define double @mag_pos1_double(double %x) nounwind {
	; CHECK-LABEL: mag_pos1_double:			; CHECK-LABEL: mag_pos1_double:
	; CHECK: ## %bb.0:			; CHECK: ## %bb.0:
	; CHECK-NEXT: andps [[SIGNMASK3]](%rip), %xmm0
	; CHECK-NEXT: movsd [[ONE3]](%rip), %xmm1			; CHECK-NEXT: movsd [[ONE3]](%rip), %xmm1
	; CHECK-NEXT: movlhps {{.*#+}} xmm1 = xmm1[0,0]			; CHECK-NEXT: andps [[SIGNMASK3]](%rip), %xmm0
	; CHECK-NEXT: orps %xmm1, %xmm0			; CHECK-NEXT: orps %xmm1, %xmm0
	; CHECK-NEXT: retq			; CHECK-NEXT: retq
	;			;
	%y = call double @copysign(double 1.0, double %x)			%y = call double @copysign(double 1.0, double %x)
	ret double %y			ret double %y
	}			}

	; CHECK: [[SIGNMASK4:L.+]]:			; CHECK: [[SIGNMASK4:L.+]]:
	Show All 39 Lines
	; CHECK-NEXT: movss [[SIGNMASK6]](%rip), %xmm1			; CHECK-NEXT: movss [[SIGNMASK6]](%rip), %xmm1
	; CHECK-NEXT: andps %xmm1, %xmm0			; CHECK-NEXT: andps %xmm1, %xmm0
	; CHECK-NEXT: retq			; CHECK-NEXT: retq
	;			;
	%y = call float @copysignf(float -0.0, float %x)			%y = call float @copysignf(float -0.0, float %x)
	ret float %y			ret float %y
	}			}

				; CHECK: [[ONE7:L.+]]:
				; CHECK-NEXT: .long 1065353216 ## float 1
	; CHECK: [[SIGNMASK7:L.+]]:			; CHECK: [[SIGNMASK7:L.+]]:
	; CHECK-NEXT: .long 2147483648 ## float -0			; CHECK-NEXT: .long 2147483648 ## float -0
	; CHECK-NEXT: .long 2147483648 ## float -0			; CHECK-NEXT: .long 2147483648 ## float -0
	; CHECK-NEXT: .long 2147483648 ## float -0			; CHECK-NEXT: .long 2147483648 ## float -0
	; CHECK-NEXT: .long 2147483648 ## float -0			; CHECK-NEXT: .long 2147483648 ## float -0
	; CHECK: [[ONE7:L.+]]:
	; CHECK-NEXT: .long 1065353216 ## float 1

	define float @mag_pos1_float(float %x) nounwind {			define float @mag_pos1_float(float %x) nounwind {
	; CHECK-LABEL: mag_pos1_float:			; CHECK-LABEL: mag_pos1_float:
	; CHECK: ## %bb.0:			; CHECK: ## %bb.0:
	; CHECK-NEXT: andps [[SIGNMASK7]](%rip), %xmm0
	; CHECK-NEXT: movss [[ONE7]](%rip), %xmm1			; CHECK-NEXT: movss [[ONE7]](%rip), %xmm1
	; CHECK-NEXT: shufps {{.*#+}} xmm1 = xmm1[0,0,0,0]			; CHECK-NEXT: andps [[SIGNMASK7]](%rip), %xmm0
	; CHECK-NEXT: orps %xmm1, %xmm0			; CHECK-NEXT: orps %xmm1, %xmm0
	; CHECK-NEXT: retq			; CHECK-NEXT: retq
	;			;
	%y = call float @copysignf(float 1.0, float %x)			%y = call float @copysignf(float 1.0, float %x)
	ret float %y			ret float %y
	}			}

	; CHECK: [[SIGNMASK8:L.+]]:			; CHECK: [[SIGNMASK8:L.+]]:
	Show All 24 Lines

llvm/trunk/test/CodeGen/X86/fp128-cast.ll

	Show First 20 Lines • Show All 839 Lines • ▼ Show 20 Lines
	; X64-LABEL: TestTruncCopysign:			; X64-LABEL: TestTruncCopysign:
	; X64: # %bb.0: # %entry			; X64: # %bb.0: # %entry
	; X64-NEXT: cmpl $50001, %edi # imm = 0xC351			; X64-NEXT: cmpl $50001, %edi # imm = 0xC351
	; X64-NEXT: jl .LBB17_2			; X64-NEXT: jl .LBB17_2
	; X64-NEXT: # %bb.1: # %if.then			; X64-NEXT: # %bb.1: # %if.then
	; X64-NEXT: pushq %rax			; X64-NEXT: pushq %rax
	; X64-NEXT: callq __trunctfdf2			; X64-NEXT: callq __trunctfdf2
	; X64-NEXT: movsd {{.*#+}} xmm1 = mem[0],zero			; X64-NEXT: movsd {{.*#+}} xmm1 = mem[0],zero
	; X64-NEXT: movlhps {{.*#+}} xmm1 = xmm1[0,0]
	; X64-NEXT: andps {{.*}}(%rip), %xmm0			; X64-NEXT: andps {{.*}}(%rip), %xmm0
	; X64-NEXT: orps %xmm1, %xmm0			; X64-NEXT: orps %xmm1, %xmm0
	; X64-NEXT: callq __extenddftf2			; X64-NEXT: callq __extenddftf2
	; X64-NEXT: addq $8, %rsp			; X64-NEXT: addq $8, %rsp
	; X64-NEXT: .LBB17_2: # %cleanup			; X64-NEXT: .LBB17_2: # %cleanup
	; X64-NEXT: retq			; X64-NEXT: retq
	;			;
	; X64_NO_MMX-LABEL: TestTruncCopysign:			; X64_NO_MMX-LABEL: TestTruncCopysign:
	; X64_NO_MMX: # %bb.0: # %entry			; X64_NO_MMX: # %bb.0: # %entry
	; X64_NO_MMX-NEXT: movl %edx, %ecx			; X64_NO_MMX-NEXT: movl %edx, %ecx
	; X64_NO_MMX-NEXT: movq %rsi, %rdx			; X64_NO_MMX-NEXT: movq %rsi, %rdx
	; X64_NO_MMX-NEXT: movq %rdi, %rax			; X64_NO_MMX-NEXT: movq %rdi, %rax
	; X64_NO_MMX-NEXT: cmpl $50001, %ecx # imm = 0xC351			; X64_NO_MMX-NEXT: cmpl $50001, %ecx # imm = 0xC351
	; X64_NO_MMX-NEXT: jl .LBB17_2			; X64_NO_MMX-NEXT: jl .LBB17_2
	; X64_NO_MMX-NEXT: # %bb.1: # %if.then			; X64_NO_MMX-NEXT: # %bb.1: # %if.then
	; X64_NO_MMX-NEXT: pushq %rax			; X64_NO_MMX-NEXT: pushq %rax
	; X64_NO_MMX-NEXT: movq %rax, %rdi			; X64_NO_MMX-NEXT: movq %rax, %rdi
	; X64_NO_MMX-NEXT: movq %rdx, %rsi			; X64_NO_MMX-NEXT: movq %rdx, %rsi
	; X64_NO_MMX-NEXT: callq __trunctfdf2			; X64_NO_MMX-NEXT: callq __trunctfdf2
	; X64_NO_MMX-NEXT: andps {{.*}}(%rip), %xmm0			; X64_NO_MMX-NEXT: andps {{.*}}(%rip), %xmm0
	; X64_NO_MMX-NEXT: movsd {{.*#+}} xmm1 = mem[0],zero			; X64_NO_MMX-NEXT: movsd {{.*#+}} xmm1 = mem[0],zero
	; X64_NO_MMX-NEXT: movlhps {{.*#+}} xmm1 = xmm1[0,0]
	; X64_NO_MMX-NEXT: orps %xmm1, %xmm0			; X64_NO_MMX-NEXT: orps %xmm1, %xmm0
	; X64_NO_MMX-NEXT: callq __extenddftf2			; X64_NO_MMX-NEXT: callq __extenddftf2
	; X64_NO_MMX-NEXT: addq $8, %rsp			; X64_NO_MMX-NEXT: addq $8, %rsp
	; X64_NO_MMX-NEXT: .LBB17_2: # %cleanup			; X64_NO_MMX-NEXT: .LBB17_2: # %cleanup
	; X64_NO_MMX-NEXT: retq			; X64_NO_MMX-NEXT: retq
	;			;
	; X32-LABEL: TestTruncCopysign:			; X32-LABEL: TestTruncCopysign:
	; X32: # %bb.0: # %entry			; X32: # %bb.0: # %entry
	▲ Show 20 Lines • Show All 128 Lines • Show Last 20 Lines

llvm/trunk/test/CodeGen/X86/known-bits-vector.ll

Show First 20 Lines • Show All 156 Lines • ▼ Show 20 Lines	; X64-NEXT: retq
%2 = shufflevector <4 x i32> %1, <4 x i32> undef, <4 x i32> <i32 2, i32 2, i32 3, i32 3>		%2 = shufflevector <4 x i32> %1, <4 x i32> undef, <4 x i32> <i32 2, i32 2, i32 3, i32 3>
%3 = uitofp <4 x i32> %2 to <4 x float>		%3 = uitofp <4 x i32> %2 to <4 x float>
ret <4 x float> %3		ret <4 x float> %3
}		}

define <4 x float> @knownbits_mask_or_shuffle_uitofp(<4 x i32> %a0) nounwind {		define <4 x float> @knownbits_mask_or_shuffle_uitofp(<4 x i32> %a0) nounwind {
; X32-LABEL: knownbits_mask_or_shuffle_uitofp:		; X32-LABEL: knownbits_mask_or_shuffle_uitofp:
; X32: # %bb.0:		; X32: # %bb.0:
; X32-NEXT: vmovaps {{.*#+}} xmm0 = [6.5535E+4,6.5535E+4,6.5535E+4,6.5535E+4]		; X32-NEXT: vandps {{\.LCPI.*}}, %xmm0, %xmm0
		; X32-NEXT: vorps {{\.LCPI.*}}, %xmm0, %xmm0
		; X32-NEXT: vpermilps {{.*#+}} xmm0 = xmm0[2,2,3,3]
		; X32-NEXT: vcvtdq2ps %xmm0, %xmm0
; X32-NEXT: retl		; X32-NEXT: retl
;		;
; X64-LABEL: knownbits_mask_or_shuffle_uitofp:		; X64-LABEL: knownbits_mask_or_shuffle_uitofp:
; X64: # %bb.0:		; X64: # %bb.0:
; X64-NEXT: vmovaps {{.*#+}} xmm0 = [6.5535E+4,6.5535E+4,6.5535E+4,6.5535E+4]		; X64-NEXT: vandps {{.*}}(%rip), %xmm0, %xmm0
		; X64-NEXT: vorps {{.*}}(%rip), %xmm0, %xmm0
		; X64-NEXT: vpermilps {{.*#+}} xmm0 = xmm0[2,2,3,3]
		; X64-NEXT: vcvtdq2ps %xmm0, %xmm0
; X64-NEXT: retq		; X64-NEXT: retq
%1 = and <4 x i32> %a0, <i32 -1, i32 -1, i32 255, i32 4085>		%1 = and <4 x i32> %a0, <i32 -1, i32 -1, i32 255, i32 4085>
%2 = or <4 x i32> %1, <i32 65535, i32 65535, i32 65535, i32 65535>		%2 = or <4 x i32> %1, <i32 65535, i32 65535, i32 65535, i32 65535>
%3 = shufflevector <4 x i32> %2, <4 x i32> undef, <4 x i32> <i32 2, i32 2, i32 3, i32 3>		%3 = shufflevector <4 x i32> %2, <4 x i32> undef, <4 x i32> <i32 2, i32 2, i32 3, i32 3>
%4 = uitofp <4 x i32> %3 to <4 x float>		%4 = uitofp <4 x i32> %3 to <4 x float>
ret <4 x float> %4		ret <4 x float> %4
}		}

▲ Show 20 Lines • Show All 496 Lines • Show Last 20 Lines

llvm/trunk/test/CodeGen/X86/known-signbits-vector.ll

Show First 20 Lines • Show All 82 Lines • ▼ Show 20 Lines	; X64-NEXT: retq
%3 = sitofp i64 %2 to float		%3 = sitofp i64 %2 to float
ret float %3		ret float %3
}		}

define float @signbits_ashr_extract_sitofp_1(<2 x i64> %a0) nounwind {		define float @signbits_ashr_extract_sitofp_1(<2 x i64> %a0) nounwind {
; X32-LABEL: signbits_ashr_extract_sitofp_1:		; X32-LABEL: signbits_ashr_extract_sitofp_1:
; X32: # %bb.0:		; X32: # %bb.0:
; X32-NEXT: pushl %eax		; X32-NEXT: pushl %eax
; X32-NEXT: vpsrlq $63, %xmm0, %xmm1
; X32-NEXT: vpsrlq $32, %xmm0, %xmm0		; X32-NEXT: vpsrlq $32, %xmm0, %xmm0
; X32-NEXT: vpblendw {{.*#+}} xmm0 = xmm0[0,1,2,3],xmm1[4,5,6,7]
; X32-NEXT: vmovdqa {{.*#+}} xmm1 = [0,32768,0,0,1,0,0,0]		; X32-NEXT: vmovdqa {{.*#+}} xmm1 = [0,32768,0,0,1,0,0,0]
; X32-NEXT: vpxor %xmm1, %xmm0, %xmm0		; X32-NEXT: vpxor %xmm1, %xmm0, %xmm0
; X32-NEXT: vpsubq %xmm1, %xmm0, %xmm0		; X32-NEXT: vpsubq %xmm1, %xmm0, %xmm0
; X32-NEXT: vmovd %xmm0, %eax		; X32-NEXT: vmovd %xmm0, %eax
; X32-NEXT: vcvtsi2ssl %eax, %xmm2, %xmm0		; X32-NEXT: vcvtsi2ssl %eax, %xmm2, %xmm0
; X32-NEXT: vmovss %xmm0, (%esp)		; X32-NEXT: vmovss %xmm0, (%esp)
; X32-NEXT: flds (%esp)		; X32-NEXT: flds (%esp)
; X32-NEXT: popl %eax		; X32-NEXT: popl %eax
; X32-NEXT: retl		; X32-NEXT: retl
;		;
; X64-LABEL: signbits_ashr_extract_sitofp_1:		; X64-LABEL: signbits_ashr_extract_sitofp_1:
; X64: # %bb.0:		; X64: # %bb.0:
; X64-NEXT: vpsrlq $63, %xmm0, %xmm1
; X64-NEXT: vpsrlq $32, %xmm0, %xmm0		; X64-NEXT: vpsrlq $32, %xmm0, %xmm0
; X64-NEXT: vpblendw {{.*#+}} xmm0 = xmm0[0,1,2,3],xmm1[4,5,6,7]
; X64-NEXT: vmovdqa {{.*#+}} xmm1 = [2147483648,1]		; X64-NEXT: vmovdqa {{.*#+}} xmm1 = [2147483648,1]
; X64-NEXT: vpxor %xmm1, %xmm0, %xmm0		; X64-NEXT: vpxor %xmm1, %xmm0, %xmm0
; X64-NEXT: vpsubq %xmm1, %xmm0, %xmm0		; X64-NEXT: vpsubq %xmm1, %xmm0, %xmm0
; X64-NEXT: vmovq %xmm0, %rax		; X64-NEXT: vmovq %xmm0, %rax
; X64-NEXT: vcvtsi2ssl %eax, %xmm2, %xmm0		; X64-NEXT: vcvtsi2ssl %eax, %xmm2, %xmm0
; X64-NEXT: retq		; X64-NEXT: retq
%1 = ashr <2 x i64> %a0, <i64 32, i64 63>		%1 = ashr <2 x i64> %a0, <i64 32, i64 63>
%2 = extractelement <2 x i64> %1, i32 0		%2 = extractelement <2 x i64> %1, i32 0
%3 = sitofp i64 %2 to float		%3 = sitofp i64 %2 to float
ret float %3		ret float %3
}		}

define float @signbits_ashr_shl_extract_sitofp(<2 x i64> %a0) nounwind {		define float @signbits_ashr_shl_extract_sitofp(<2 x i64> %a0) nounwind {
; X32-LABEL: signbits_ashr_shl_extract_sitofp:		; X32-LABEL: signbits_ashr_shl_extract_sitofp:
; X32: # %bb.0:		; X32: # %bb.0:
; X32-NEXT: pushl %eax		; X32-NEXT: pushl %eax
; X32-NEXT: vpsrlq $60, %xmm0, %xmm1
; X32-NEXT: vpsrlq $61, %xmm0, %xmm0		; X32-NEXT: vpsrlq $61, %xmm0, %xmm0
; X32-NEXT: vpblendw {{.*#+}} xmm0 = xmm0[0,1,2,3],xmm1[4,5,6,7]
; X32-NEXT: vmovdqa {{.*#+}} xmm1 = [4,0,0,0,8,0,0,0]		; X32-NEXT: vmovdqa {{.*#+}} xmm1 = [4,0,0,0,8,0,0,0]
; X32-NEXT: vpxor %xmm1, %xmm0, %xmm0		; X32-NEXT: vpxor %xmm1, %xmm0, %xmm0
; X32-NEXT: vpsubq %xmm1, %xmm0, %xmm0		; X32-NEXT: vpsubq %xmm1, %xmm0, %xmm0
; X32-NEXT: vpsllq $20, %xmm0, %xmm0		; X32-NEXT: vpsllq $20, %xmm0, %xmm0
; X32-NEXT: vmovd %xmm0, %eax		; X32-NEXT: vmovd %xmm0, %eax
; X32-NEXT: vcvtsi2ssl %eax, %xmm2, %xmm0		; X32-NEXT: vcvtsi2ssl %eax, %xmm2, %xmm0
; X32-NEXT: vmovss %xmm0, (%esp)		; X32-NEXT: vmovss %xmm0, (%esp)
; X32-NEXT: flds (%esp)		; X32-NEXT: flds (%esp)
; X32-NEXT: popl %eax		; X32-NEXT: popl %eax
; X32-NEXT: retl		; X32-NEXT: retl
;		;
; X64-LABEL: signbits_ashr_shl_extract_sitofp:		; X64-LABEL: signbits_ashr_shl_extract_sitofp:
; X64: # %bb.0:		; X64: # %bb.0:
; X64-NEXT: vpsrlq $60, %xmm0, %xmm1
; X64-NEXT: vpsrlq $61, %xmm0, %xmm0		; X64-NEXT: vpsrlq $61, %xmm0, %xmm0
; X64-NEXT: vpblendw {{.*#+}} xmm0 = xmm0[0,1,2,3],xmm1[4,5,6,7]
; X64-NEXT: vmovdqa {{.*#+}} xmm1 = [4,8]		; X64-NEXT: vmovdqa {{.*#+}} xmm1 = [4,8]
; X64-NEXT: vpxor %xmm1, %xmm0, %xmm0		; X64-NEXT: vpxor %xmm1, %xmm0, %xmm0
; X64-NEXT: vpsubq %xmm1, %xmm0, %xmm0		; X64-NEXT: vpsubq %xmm1, %xmm0, %xmm0
; X64-NEXT: vpsllq $20, %xmm0, %xmm0		; X64-NEXT: vpsllq $20, %xmm0, %xmm0
; X64-NEXT: vmovq %xmm0, %rax		; X64-NEXT: vmovq %xmm0, %rax
; X64-NEXT: vcvtsi2ssl %eax, %xmm2, %xmm0		; X64-NEXT: vcvtsi2ssl %eax, %xmm2, %xmm0
; X64-NEXT: retq		; X64-NEXT: retq
%1 = ashr <2 x i64> %a0, <i64 61, i64 60>		%1 = ashr <2 x i64> %a0, <i64 61, i64 60>
▲ Show 20 Lines • Show All 92 Lines • ▼ Show 20 Lines	; X64-NEXT: retq
%6 = sitofp <2 x i64> %5 to <2 x double>		%6 = sitofp <2 x i64> %5 to <2 x double>
ret <2 x double> %6		ret <2 x double> %6
}		}

define float @signbits_ashr_sext_sextinreg_and_extract_sitofp(<2 x i64> %a0, <2 x i64> %a1, i32 %a2) nounwind {		define float @signbits_ashr_sext_sextinreg_and_extract_sitofp(<2 x i64> %a0, <2 x i64> %a1, i32 %a2) nounwind {
; X32-LABEL: signbits_ashr_sext_sextinreg_and_extract_sitofp:		; X32-LABEL: signbits_ashr_sext_sextinreg_and_extract_sitofp:
; X32: # %bb.0:		; X32: # %bb.0:
; X32-NEXT: pushl %eax		; X32-NEXT: pushl %eax
; X32-NEXT: vpsrlq $60, %xmm0, %xmm1
; X32-NEXT: vpsrlq $61, %xmm0, %xmm0		; X32-NEXT: vpsrlq $61, %xmm0, %xmm0
; X32-NEXT: vpblendw {{.*#+}} xmm0 = xmm0[0,1,2,3],xmm1[4,5,6,7]
; X32-NEXT: vmovdqa {{.*#+}} xmm1 = [4,0,0,0,8,0,0,0]		; X32-NEXT: vmovdqa {{.*#+}} xmm1 = [4,0,0,0,8,0,0,0]
; X32-NEXT: vpxor %xmm1, %xmm0, %xmm0		; X32-NEXT: vpxor %xmm1, %xmm0, %xmm0
; X32-NEXT: vpsubq %xmm1, %xmm0, %xmm0		; X32-NEXT: vpsubq %xmm1, %xmm0, %xmm0
; X32-NEXT: vmovd {{.*#+}} xmm1 = mem[0],zero,zero,zero		; X32-NEXT: vmovd {{.*#+}} xmm1 = mem[0],zero,zero,zero
; X32-NEXT: vpand %xmm1, %xmm0, %xmm0		; X32-NEXT: vpand %xmm1, %xmm0, %xmm0
; X32-NEXT: vmovd %xmm0, %eax		; X32-NEXT: vmovd %xmm0, %eax
; X32-NEXT: vcvtsi2ssl %eax, %xmm2, %xmm0		; X32-NEXT: vcvtsi2ssl %eax, %xmm2, %xmm0
; X32-NEXT: vmovss %xmm0, (%esp)		; X32-NEXT: vmovss %xmm0, (%esp)
; X32-NEXT: flds (%esp)		; X32-NEXT: flds (%esp)
; X32-NEXT: popl %eax		; X32-NEXT: popl %eax
; X32-NEXT: retl		; X32-NEXT: retl
;		;
; X64-LABEL: signbits_ashr_sext_sextinreg_and_extract_sitofp:		; X64-LABEL: signbits_ashr_sext_sextinreg_and_extract_sitofp:
; X64: # %bb.0:		; X64: # %bb.0:
; X64-NEXT: vpsrlq $60, %xmm0, %xmm1
; X64-NEXT: vpsrlq $61, %xmm0, %xmm0		; X64-NEXT: vpsrlq $61, %xmm0, %xmm0
; X64-NEXT: vpblendw {{.*#+}} xmm0 = xmm0[0,1,2,3],xmm1[4,5,6,7]
; X64-NEXT: vmovdqa {{.*#+}} xmm1 = [4,8]		; X64-NEXT: vmovdqa {{.*#+}} xmm1 = [4,8]
; X64-NEXT: vpxor %xmm1, %xmm0, %xmm0		; X64-NEXT: vpxor %xmm1, %xmm0, %xmm0
; X64-NEXT: vpsubq %xmm1, %xmm0, %xmm0		; X64-NEXT: vpsubq %xmm1, %xmm0, %xmm0
; X64-NEXT: movslq %edi, %rax		; X64-NEXT: movslq %edi, %rax
; X64-NEXT: vmovq %rax, %xmm1		; X64-NEXT: vmovq %rax, %xmm1
; X64-NEXT: vpand %xmm1, %xmm0, %xmm0		; X64-NEXT: vpand %xmm1, %xmm0, %xmm0
; X64-NEXT: vmovq %xmm0, %rax		; X64-NEXT: vmovq %xmm0, %rax
; X64-NEXT: vcvtsi2ssl %eax, %xmm2, %xmm0		; X64-NEXT: vcvtsi2ssl %eax, %xmm2, %xmm0
▲ Show 20 Lines • Show All 61 Lines • ▼ Show 20 Lines
; X32: # %bb.0:		; X32: # %bb.0:
; X32-NEXT: pushl %ebp		; X32-NEXT: pushl %ebp
; X32-NEXT: movl %esp, %ebp		; X32-NEXT: movl %esp, %ebp
; X32-NEXT: andl $-16, %esp		; X32-NEXT: andl $-16, %esp
; X32-NEXT: subl $16, %esp		; X32-NEXT: subl $16, %esp
; X32-NEXT: vpmovsxdq 16(%ebp), %xmm3		; X32-NEXT: vpmovsxdq 16(%ebp), %xmm3
; X32-NEXT: vpmovsxdq 8(%ebp), %xmm4		; X32-NEXT: vpmovsxdq 8(%ebp), %xmm4
; X32-NEXT: vextractf128 $1, %ymm2, %xmm5		; X32-NEXT: vextractf128 $1, %ymm2, %xmm5
; X32-NEXT: vpsrlq $63, %xmm5, %xmm6
; X32-NEXT: vpsrlq $33, %xmm5, %xmm5		; X32-NEXT: vpsrlq $33, %xmm5, %xmm5
; X32-NEXT: vpblendw {{.*#+}} xmm5 = xmm5[0,1,2,3],xmm6[4,5,6,7]
; X32-NEXT: vmovdqa {{.*#+}} xmm6 = [0,16384,0,0,1,0,0,0]		; X32-NEXT: vmovdqa {{.*#+}} xmm6 = [0,16384,0,0,1,0,0,0]
; X32-NEXT: vpxor %xmm6, %xmm5, %xmm5		; X32-NEXT: vpxor %xmm6, %xmm5, %xmm5
; X32-NEXT: vpsubq %xmm6, %xmm5, %xmm5		; X32-NEXT: vpsubq %xmm6, %xmm5, %xmm5
; X32-NEXT: vpsrlq $63, %xmm2, %xmm7
; X32-NEXT: vpsrlq $33, %xmm2, %xmm2		; X32-NEXT: vpsrlq $33, %xmm2, %xmm2
; X32-NEXT: vpblendw {{.*#+}} xmm2 = xmm2[0,1,2,3],xmm7[4,5,6,7]
; X32-NEXT: vpxor %xmm6, %xmm2, %xmm2		; X32-NEXT: vpxor %xmm6, %xmm2, %xmm2
; X32-NEXT: vpsubq %xmm6, %xmm2, %xmm2		; X32-NEXT: vpsubq %xmm6, %xmm2, %xmm2
; X32-NEXT: vinsertf128 $1, %xmm5, %ymm2, %ymm2		; X32-NEXT: vinsertf128 $1, %xmm5, %ymm2, %ymm2
; X32-NEXT: vinsertf128 $1, %xmm3, %ymm4, %ymm3		; X32-NEXT: vinsertf128 $1, %xmm3, %ymm4, %ymm3
; X32-NEXT: vextractf128 $1, %ymm1, %xmm4		; X32-NEXT: vextractf128 $1, %ymm1, %xmm4
; X32-NEXT: vextractf128 $1, %ymm0, %xmm5		; X32-NEXT: vextractf128 $1, %ymm0, %xmm5
; X32-NEXT: vpcmpeqq %xmm4, %xmm5, %xmm4		; X32-NEXT: vpcmpeqq %xmm4, %xmm5, %xmm4
; X32-NEXT: vpcmpeqq %xmm1, %xmm0, %xmm0		; X32-NEXT: vpcmpeqq %xmm1, %xmm0, %xmm0
; X32-NEXT: vinsertf128 $1, %xmm4, %ymm0, %ymm0		; X32-NEXT: vinsertf128 $1, %xmm4, %ymm0, %ymm0
; X32-NEXT: vblendvpd %ymm0, %ymm2, %ymm3, %ymm0		; X32-NEXT: vblendvpd %ymm0, %ymm2, %ymm3, %ymm0
; X32-NEXT: vmovddup {{.*#+}} ymm0 = ymm0[0,0,2,2]		; X32-NEXT: vmovddup {{.*#+}} ymm0 = ymm0[0,0,2,2]
; X32-NEXT: vextractf128 $1, %ymm0, %xmm1		; X32-NEXT: vextractf128 $1, %ymm0, %xmm1
; X32-NEXT: vshufps {{.*#+}} xmm0 = xmm0[0,2],xmm1[0,2]		; X32-NEXT: vshufps {{.*#+}} xmm0 = xmm0[0,2],xmm1[0,2]
; X32-NEXT: vcvtdq2ps %xmm0, %xmm0		; X32-NEXT: vcvtdq2ps %xmm0, %xmm0
; X32-NEXT: movl %ebp, %esp		; X32-NEXT: movl %ebp, %esp
; X32-NEXT: popl %ebp		; X32-NEXT: popl %ebp
; X32-NEXT: vzeroupper		; X32-NEXT: vzeroupper
; X32-NEXT: retl		; X32-NEXT: retl
;		;
; X64-LABEL: signbits_ashr_sext_select_shuffle_sitofp:		; X64-LABEL: signbits_ashr_sext_select_shuffle_sitofp:
; X64: # %bb.0:		; X64: # %bb.0:
; X64-NEXT: vextractf128 $1, %ymm2, %xmm4		; X64-NEXT: vextractf128 $1, %ymm2, %xmm4
; X64-NEXT: vpsrlq $63, %xmm4, %xmm5
; X64-NEXT: vpsrlq $33, %xmm4, %xmm4		; X64-NEXT: vpsrlq $33, %xmm4, %xmm4
; X64-NEXT: vpblendw {{.*#+}} xmm4 = xmm4[0,1,2,3],xmm5[4,5,6,7]
; X64-NEXT: vmovdqa {{.*#+}} xmm5 = [1073741824,1]		; X64-NEXT: vmovdqa {{.*#+}} xmm5 = [1073741824,1]
; X64-NEXT: vpxor %xmm5, %xmm4, %xmm4		; X64-NEXT: vpxor %xmm5, %xmm4, %xmm4
; X64-NEXT: vpsubq %xmm5, %xmm4, %xmm4		; X64-NEXT: vpsubq %xmm5, %xmm4, %xmm4
; X64-NEXT: vpsrlq $63, %xmm2, %xmm6
; X64-NEXT: vpsrlq $33, %xmm2, %xmm2		; X64-NEXT: vpsrlq $33, %xmm2, %xmm2
; X64-NEXT: vpblendw {{.*#+}} xmm2 = xmm2[0,1,2,3],xmm6[4,5,6,7]
; X64-NEXT: vpxor %xmm5, %xmm2, %xmm2		; X64-NEXT: vpxor %xmm5, %xmm2, %xmm2
; X64-NEXT: vpsubq %xmm5, %xmm2, %xmm2		; X64-NEXT: vpsubq %xmm5, %xmm2, %xmm2
; X64-NEXT: vinsertf128 $1, %xmm4, %ymm2, %ymm2		; X64-NEXT: vinsertf128 $1, %xmm4, %ymm2, %ymm2
; X64-NEXT: vpmovsxdq %xmm3, %xmm4		; X64-NEXT: vpmovsxdq %xmm3, %xmm4
; X64-NEXT: vpshufd {{.*#+}} xmm3 = xmm3[2,3,0,1]		; X64-NEXT: vpshufd {{.*#+}} xmm3 = xmm3[2,3,0,1]
; X64-NEXT: vpmovsxdq %xmm3, %xmm3		; X64-NEXT: vpmovsxdq %xmm3, %xmm3
; X64-NEXT: vinsertf128 $1, %xmm3, %ymm4, %ymm3		; X64-NEXT: vinsertf128 $1, %xmm3, %ymm4, %ymm3
; X64-NEXT: vextractf128 $1, %ymm1, %xmm4		; X64-NEXT: vextractf128 $1, %ymm1, %xmm4
Show All 19 Lines

llvm/trunk/test/CodeGen/X86/movmsk-cmp.ll

	Show First 20 Lines • Show All 1,095 Lines • ▼ Show 20 Lines
	}			}

	define i1 @allones_v4i64_sign(<4 x i64> %arg) {			define i1 @allones_v4i64_sign(<4 x i64> %arg) {
	; SSE2-LABEL: allones_v4i64_sign:			; SSE2-LABEL: allones_v4i64_sign:
	; SSE2: # %bb.0:			; SSE2: # %bb.0:
	; SSE2-NEXT: movdqa {{.*#+}} xmm2 = [2147483648,2147483648]			; SSE2-NEXT: movdqa {{.*#+}} xmm2 = [2147483648,2147483648]
	; SSE2-NEXT: pxor %xmm2, %xmm1			; SSE2-NEXT: pxor %xmm2, %xmm1
	; SSE2-NEXT: movdqa %xmm2, %xmm3			; SSE2-NEXT: movdqa %xmm2, %xmm3
	; SSE2-NEXT: pcmpgtd %xmm1, %xmm3			; SSE2-NEXT: pcmpeqd %xmm1, %xmm3
	; SSE2-NEXT: pshufd {{.*#+}} xmm4 = xmm3[0,0,2,2]			; SSE2-NEXT: movdqa %xmm2, %xmm4
	; SSE2-NEXT: pcmpeqd %xmm2, %xmm1			; SSE2-NEXT: pcmpgtd %xmm1, %xmm4
	; SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,1,3,3]			; SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm4[0,0,2,2]
	; SSE2-NEXT: pand %xmm4, %xmm1			; SSE2-NEXT: pand %xmm3, %xmm1
	; SSE2-NEXT: pshufd {{.*#+}} xmm3 = xmm3[1,1,3,3]			; SSE2-NEXT: por %xmm4, %xmm1
	; SSE2-NEXT: por %xmm1, %xmm3
	; SSE2-NEXT: pxor %xmm2, %xmm0			; SSE2-NEXT: pxor %xmm2, %xmm0
	; SSE2-NEXT: movdqa %xmm2, %xmm1			; SSE2-NEXT: movdqa %xmm2, %xmm3
	; SSE2-NEXT: pcmpgtd %xmm0, %xmm1			; SSE2-NEXT: pcmpeqd %xmm0, %xmm3
	; SSE2-NEXT: pshufd {{.*#+}} xmm4 = xmm1[0,0,2,2]			; SSE2-NEXT: pcmpgtd %xmm0, %xmm2
	; SSE2-NEXT: pcmpeqd %xmm2, %xmm0			; SSE2-NEXT: pshufd {{.*#+}} xmm0 = xmm2[0,0,2,2]
	; SSE2-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]			; SSE2-NEXT: pand %xmm3, %xmm0
	; SSE2-NEXT: pand %xmm4, %xmm0			; SSE2-NEXT: por %xmm2, %xmm0
	; SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,1,3,3]			; SSE2-NEXT: packssdw %xmm1, %xmm0
	; SSE2-NEXT: por %xmm0, %xmm1			; SSE2-NEXT: movmskps %xmm0, %eax
	; SSE2-NEXT: packssdw %xmm3, %xmm1
	; SSE2-NEXT: movmskps %xmm1, %eax
	; SSE2-NEXT: cmpb $15, %al			; SSE2-NEXT: cmpb $15, %al
	; SSE2-NEXT: sete %al			; SSE2-NEXT: sete %al
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; AVX-LABEL: allones_v4i64_sign:			; AVX-LABEL: allones_v4i64_sign:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vmovmskpd %ymm0, %eax			; AVX-NEXT: vmovmskpd %ymm0, %eax
	; AVX-NEXT: cmpb $15, %al			; AVX-NEXT: cmpb $15, %al
	Show All 29 Lines
	}			}

	define i1 @allzeros_v4i64_sign(<4 x i64> %arg) {			define i1 @allzeros_v4i64_sign(<4 x i64> %arg) {
	; SSE2-LABEL: allzeros_v4i64_sign:			; SSE2-LABEL: allzeros_v4i64_sign:
	; SSE2: # %bb.0:			; SSE2: # %bb.0:
	; SSE2-NEXT: movdqa {{.*#+}} xmm2 = [2147483648,2147483648]			; SSE2-NEXT: movdqa {{.*#+}} xmm2 = [2147483648,2147483648]
	; SSE2-NEXT: pxor %xmm2, %xmm1			; SSE2-NEXT: pxor %xmm2, %xmm1
	; SSE2-NEXT: movdqa %xmm2, %xmm3			; SSE2-NEXT: movdqa %xmm2, %xmm3
	; SSE2-NEXT: pcmpgtd %xmm1, %xmm3			; SSE2-NEXT: pcmpeqd %xmm1, %xmm3
	; SSE2-NEXT: pshufd {{.*#+}} xmm4 = xmm3[0,0,2,2]			; SSE2-NEXT: movdqa %xmm2, %xmm4
	; SSE2-NEXT: pcmpeqd %xmm2, %xmm1			; SSE2-NEXT: pcmpgtd %xmm1, %xmm4
	; SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,1,3,3]			; SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm4[0,0,2,2]
	; SSE2-NEXT: pand %xmm4, %xmm1			; SSE2-NEXT: pand %xmm3, %xmm1
	; SSE2-NEXT: pshufd {{.*#+}} xmm3 = xmm3[1,1,3,3]			; SSE2-NEXT: por %xmm4, %xmm1
	; SSE2-NEXT: por %xmm1, %xmm3
	; SSE2-NEXT: pxor %xmm2, %xmm0			; SSE2-NEXT: pxor %xmm2, %xmm0
	; SSE2-NEXT: movdqa %xmm2, %xmm1			; SSE2-NEXT: movdqa %xmm2, %xmm3
	; SSE2-NEXT: pcmpgtd %xmm0, %xmm1			; SSE2-NEXT: pcmpeqd %xmm0, %xmm3
	; SSE2-NEXT: pshufd {{.*#+}} xmm4 = xmm1[0,0,2,2]			; SSE2-NEXT: pcmpgtd %xmm0, %xmm2
	; SSE2-NEXT: pcmpeqd %xmm2, %xmm0			; SSE2-NEXT: pshufd {{.*#+}} xmm0 = xmm2[0,0,2,2]
	; SSE2-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]			; SSE2-NEXT: pand %xmm3, %xmm0
	; SSE2-NEXT: pand %xmm4, %xmm0			; SSE2-NEXT: por %xmm2, %xmm0
	; SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,1,3,3]			; SSE2-NEXT: packssdw %xmm1, %xmm0
	; SSE2-NEXT: por %xmm0, %xmm1			; SSE2-NEXT: movmskps %xmm0, %eax
	; SSE2-NEXT: packssdw %xmm3, %xmm1
	; SSE2-NEXT: movmskps %xmm1, %eax
	; SSE2-NEXT: testb %al, %al			; SSE2-NEXT: testb %al, %al
	; SSE2-NEXT: sete %al			; SSE2-NEXT: sete %al
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; AVX-LABEL: allzeros_v4i64_sign:			; AVX-LABEL: allzeros_v4i64_sign:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vmovmskpd %ymm0, %eax			; AVX-NEXT: vmovmskpd %ymm0, %eax
	; AVX-NEXT: testb %al, %al			; AVX-NEXT: testb %al, %al
	▲ Show 20 Lines • Show All 3,632 Lines • ▼ Show 20 Lines
	}			}

	define i32 @movmskpd256(<4 x double> %x) {			define i32 @movmskpd256(<4 x double> %x) {
	; SSE2-LABEL: movmskpd256:			; SSE2-LABEL: movmskpd256:
	; SSE2: # %bb.0:			; SSE2: # %bb.0:
	; SSE2-NEXT: movdqa {{.*#+}} xmm2 = [2147483648,2147483648]			; SSE2-NEXT: movdqa {{.*#+}} xmm2 = [2147483648,2147483648]
	; SSE2-NEXT: pxor %xmm2, %xmm1			; SSE2-NEXT: pxor %xmm2, %xmm1
	; SSE2-NEXT: movdqa %xmm2, %xmm3			; SSE2-NEXT: movdqa %xmm2, %xmm3
	; SSE2-NEXT: pcmpgtd %xmm1, %xmm3			; SSE2-NEXT: pcmpeqd %xmm1, %xmm3
	; SSE2-NEXT: pshufd {{.*#+}} xmm4 = xmm3[0,0,2,2]			; SSE2-NEXT: movdqa %xmm2, %xmm4
	; SSE2-NEXT: pcmpeqd %xmm2, %xmm1			; SSE2-NEXT: pcmpgtd %xmm1, %xmm4
	; SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,1,3,3]			; SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm4[0,0,2,2]
	; SSE2-NEXT: pand %xmm4, %xmm1			; SSE2-NEXT: pand %xmm3, %xmm1
	; SSE2-NEXT: pshufd {{.*#+}} xmm3 = xmm3[1,1,3,3]			; SSE2-NEXT: por %xmm4, %xmm1
	; SSE2-NEXT: por %xmm1, %xmm3
	; SSE2-NEXT: pxor %xmm2, %xmm0			; SSE2-NEXT: pxor %xmm2, %xmm0
	; SSE2-NEXT: movdqa %xmm2, %xmm1			; SSE2-NEXT: movdqa %xmm2, %xmm3
	; SSE2-NEXT: pcmpgtd %xmm0, %xmm1			; SSE2-NEXT: pcmpeqd %xmm0, %xmm3
	; SSE2-NEXT: pshufd {{.*#+}} xmm4 = xmm1[0,0,2,2]			; SSE2-NEXT: pcmpgtd %xmm0, %xmm2
	; SSE2-NEXT: pcmpeqd %xmm2, %xmm0			; SSE2-NEXT: pshufd {{.*#+}} xmm0 = xmm2[0,0,2,2]
	; SSE2-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]			; SSE2-NEXT: pand %xmm3, %xmm0
	; SSE2-NEXT: pand %xmm4, %xmm0			; SSE2-NEXT: por %xmm2, %xmm0
	; SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,1,3,3]			; SSE2-NEXT: packssdw %xmm1, %xmm0
	; SSE2-NEXT: por %xmm0, %xmm1			; SSE2-NEXT: movmskps %xmm0, %eax
	; SSE2-NEXT: packssdw %xmm3, %xmm1
	; SSE2-NEXT: movmskps %xmm1, %eax
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; AVX-LABEL: movmskpd256:			; AVX-LABEL: movmskpd256:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vmovmskpd %ymm0, %eax			; AVX-NEXT: vmovmskpd %ymm0, %eax
	; AVX-NEXT: vzeroupper			; AVX-NEXT: vzeroupper
	; AVX-NEXT: retq			; AVX-NEXT: retq
	;			;
	▲ Show 20 Lines • Show All 152 Lines • Show Last 20 Lines

llvm/trunk/test/CodeGen/X86/packss.ll

Show First 20 Lines • Show All 150 Lines • ▼ Show 20 Lines	; X64-AVX-NEXT: retq
%4 = shufflevector <4 x i32> %1, <4 x i32> %3, <8 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7>		%4 = shufflevector <4 x i32> %1, <4 x i32> %3, <8 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7>
%5 = trunc <8 x i32> %4 to <8 x i16>		%5 = trunc <8 x i32> %4 to <8 x i16>
ret <8 x i16> %5		ret <8 x i16> %5
}		}

define <8 x i16> @trunc_ashr_v4i64_demandedelts(<4 x i64> %a0) {		define <8 x i16> @trunc_ashr_v4i64_demandedelts(<4 x i64> %a0) {
; X86-SSE-LABEL: trunc_ashr_v4i64_demandedelts:		; X86-SSE-LABEL: trunc_ashr_v4i64_demandedelts:
; X86-SSE: # %bb.0:		; X86-SSE: # %bb.0:
; X86-SSE-NEXT: movdqa %xmm1, %xmm2		; X86-SSE-NEXT: psllq $63, %xmm1
; X86-SSE-NEXT: psllq $63, %xmm2		; X86-SSE-NEXT: psllq $63, %xmm0
; X86-SSE-NEXT: movdqa %xmm0, %xmm3		; X86-SSE-NEXT: psrlq $63, %xmm0
; X86-SSE-NEXT: psllq $63, %xmm3		; X86-SSE-NEXT: movdqa {{.*#+}} xmm2 = [4.9406564584124654E-324,-0.0E+0]
; X86-SSE-NEXT: psrlq $63, %xmm3		; X86-SSE-NEXT: pxor %xmm2, %xmm0
; X86-SSE-NEXT: movsd {{.*#+}} xmm0 = xmm3[0],xmm0[1]		; X86-SSE-NEXT: psubq %xmm2, %xmm0
; X86-SSE-NEXT: movapd {{.*#+}} xmm3 = [4.9406564584124654E-324,-0.0E+0]		; X86-SSE-NEXT: psrlq $63, %xmm1
; X86-SSE-NEXT: xorpd %xmm3, %xmm0		; X86-SSE-NEXT: pxor %xmm2, %xmm1
; X86-SSE-NEXT: psubq %xmm3, %xmm0		; X86-SSE-NEXT: psubq %xmm2, %xmm1
; X86-SSE-NEXT: psrlq $63, %xmm2
; X86-SSE-NEXT: movsd {{.*#+}} xmm1 = xmm2[0],xmm1[1]
; X86-SSE-NEXT: xorpd %xmm3, %xmm1
; X86-SSE-NEXT: psubq %xmm3, %xmm1
; X86-SSE-NEXT: pshufd {{.*#+}} xmm1 = xmm1[0,0,0,0]		; X86-SSE-NEXT: pshufd {{.*#+}} xmm1 = xmm1[0,0,0,0]
; X86-SSE-NEXT: pshufd {{.*#+}} xmm0 = xmm0[0,0,0,0]		; X86-SSE-NEXT: pshufd {{.*#+}} xmm0 = xmm0[0,0,0,0]
; X86-SSE-NEXT: packssdw %xmm1, %xmm0		; X86-SSE-NEXT: packssdw %xmm1, %xmm0
; X86-SSE-NEXT: retl		; X86-SSE-NEXT: retl
;		;
; X86-AVX1-LABEL: trunc_ashr_v4i64_demandedelts:		; X86-AVX1-LABEL: trunc_ashr_v4i64_demandedelts:
; X86-AVX1: # %bb.0:		; X86-AVX1: # %bb.0:
; X86-AVX1-NEXT: vpsllq $63, %xmm0, %xmm1		; X86-AVX1-NEXT: vpsllq $63, %xmm0, %xmm1
Show All 27 Lines
; X86-AVX2-NEXT: vpshufd {{.*#+}} ymm0 = ymm0[0,0,0,0,4,4,4,4]		; X86-AVX2-NEXT: vpshufd {{.*#+}} ymm0 = ymm0[0,0,0,0,4,4,4,4]
; X86-AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1		; X86-AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1
; X86-AVX2-NEXT: vpackssdw %xmm1, %xmm0, %xmm0		; X86-AVX2-NEXT: vpackssdw %xmm1, %xmm0, %xmm0
; X86-AVX2-NEXT: vzeroupper		; X86-AVX2-NEXT: vzeroupper
; X86-AVX2-NEXT: retl		; X86-AVX2-NEXT: retl
;		;
; X64-SSE-LABEL: trunc_ashr_v4i64_demandedelts:		; X64-SSE-LABEL: trunc_ashr_v4i64_demandedelts:
; X64-SSE: # %bb.0:		; X64-SSE: # %bb.0:
; X64-SSE-NEXT: movdqa %xmm1, %xmm2		; X64-SSE-NEXT: psllq $63, %xmm1
; X64-SSE-NEXT: psllq $63, %xmm2		; X64-SSE-NEXT: psllq $63, %xmm0
; X64-SSE-NEXT: movdqa %xmm0, %xmm3		; X64-SSE-NEXT: psrlq $63, %xmm0
; X64-SSE-NEXT: psllq $63, %xmm3		; X64-SSE-NEXT: movdqa {{.*#+}} xmm2 = [1,9223372036854775808]
; X64-SSE-NEXT: psrlq $63, %xmm3		; X64-SSE-NEXT: pxor %xmm2, %xmm0
; X64-SSE-NEXT: movsd {{.*#+}} xmm0 = xmm3[0],xmm0[1]		; X64-SSE-NEXT: psubq %xmm2, %xmm0
; X64-SSE-NEXT: movapd {{.*#+}} xmm3 = [1,9223372036854775808]		; X64-SSE-NEXT: psrlq $63, %xmm1
; X64-SSE-NEXT: xorpd %xmm3, %xmm0		; X64-SSE-NEXT: pxor %xmm2, %xmm1
; X64-SSE-NEXT: psubq %xmm3, %xmm0		; X64-SSE-NEXT: psubq %xmm2, %xmm1
; X64-SSE-NEXT: psrlq $63, %xmm2
; X64-SSE-NEXT: movsd {{.*#+}} xmm1 = xmm2[0],xmm1[1]
; X64-SSE-NEXT: xorpd %xmm3, %xmm1
; X64-SSE-NEXT: psubq %xmm3, %xmm1
; X64-SSE-NEXT: pshufd {{.*#+}} xmm1 = xmm1[0,0,0,0]		; X64-SSE-NEXT: pshufd {{.*#+}} xmm1 = xmm1[0,0,0,0]
; X64-SSE-NEXT: pshufd {{.*#+}} xmm0 = xmm0[0,0,0,0]		; X64-SSE-NEXT: pshufd {{.*#+}} xmm0 = xmm0[0,0,0,0]
; X64-SSE-NEXT: packssdw %xmm1, %xmm0		; X64-SSE-NEXT: packssdw %xmm1, %xmm0
; X64-SSE-NEXT: retq		; X64-SSE-NEXT: retq
;		;
; X64-AVX1-LABEL: trunc_ashr_v4i64_demandedelts:		; X64-AVX1-LABEL: trunc_ashr_v4i64_demandedelts:
; X64-AVX1: # %bb.0:		; X64-AVX1: # %bb.0:
; X64-AVX1-NEXT: vpsllq $63, %xmm0, %xmm1		; X64-AVX1-NEXT: vpsllq $63, %xmm0, %xmm1
Show All 12 Lines
; X64-AVX1-NEXT: vpermilps {{.*#+}} ymm0 = ymm0[0,0,0,0,4,4,4,4]		; X64-AVX1-NEXT: vpermilps {{.*#+}} ymm0 = ymm0[0,0,0,0,4,4,4,4]
; X64-AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1		; X64-AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1
; X64-AVX1-NEXT: vpackssdw %xmm1, %xmm0, %xmm0		; X64-AVX1-NEXT: vpackssdw %xmm1, %xmm0, %xmm0
; X64-AVX1-NEXT: vzeroupper		; X64-AVX1-NEXT: vzeroupper
; X64-AVX1-NEXT: retq		; X64-AVX1-NEXT: retq
;		;
; X64-AVX2-LABEL: trunc_ashr_v4i64_demandedelts:		; X64-AVX2-LABEL: trunc_ashr_v4i64_demandedelts:
; X64-AVX2: # %bb.0:		; X64-AVX2: # %bb.0:
; X64-AVX2-NEXT: vpand {{.*}}(%rip), %ymm0, %ymm0		; X64-AVX2-NEXT: vpbroadcastq {{.*#+}} ymm1 = [1,1,1,1]
		; X64-AVX2-NEXT: vpand %ymm1, %ymm0, %ymm0
; X64-AVX2-NEXT: vbroadcasti128 {{.*#+}} ymm1 = [1,9223372036854775808,1,9223372036854775808]		; X64-AVX2-NEXT: vbroadcasti128 {{.*#+}} ymm1 = [1,9223372036854775808,1,9223372036854775808]
; X64-AVX2-NEXT: # ymm1 = mem[0,1,0,1]		; X64-AVX2-NEXT: # ymm1 = mem[0,1,0,1]
; X64-AVX2-NEXT: vpxor %ymm1, %ymm0, %ymm0		; X64-AVX2-NEXT: vpxor %ymm1, %ymm0, %ymm0
; X64-AVX2-NEXT: vpsubq %ymm1, %ymm0, %ymm0		; X64-AVX2-NEXT: vpsubq %ymm1, %ymm0, %ymm0
; X64-AVX2-NEXT: vpshufd {{.*#+}} ymm0 = ymm0[0,0,0,0,4,4,4,4]		; X64-AVX2-NEXT: vpshufd {{.*#+}} ymm0 = ymm0[0,0,0,0,4,4,4,4]
; X64-AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1		; X64-AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1
; X64-AVX2-NEXT: vpackssdw %xmm1, %xmm0, %xmm0		; X64-AVX2-NEXT: vpackssdw %xmm1, %xmm0, %xmm0
; X64-AVX2-NEXT: vzeroupper		; X64-AVX2-NEXT: vzeroupper
; X64-AVX2-NEXT: retq		; X64-AVX2-NEXT: retq
%1 = shl <4 x i64> %a0, <i64 63, i64 0, i64 63, i64 0>		%1 = shl <4 x i64> %a0, <i64 63, i64 0, i64 63, i64 0>
%2 = ashr <4 x i64> %1, <i64 63, i64 0, i64 63, i64 0>		%2 = ashr <4 x i64> %1, <i64 63, i64 0, i64 63, i64 0>
%3 = bitcast <4 x i64> %2 to <8 x i32>		%3 = bitcast <4 x i64> %2 to <8 x i32>
%4 = shufflevector <8 x i32> %3, <8 x i32> undef, <8 x i32> <i32 0, i32 0, i32 0, i32 0, i32 4, i32 4, i32 4, i32 4>		%4 = shufflevector <8 x i32> %3, <8 x i32> undef, <8 x i32> <i32 0, i32 0, i32 0, i32 0, i32 4, i32 4, i32 4, i32 4>
%5 = trunc <8 x i32> %4 to <8 x i16>		%5 = trunc <8 x i32> %4 to <8 x i16>
ret <8 x i16> %5		ret <8 x i16> %5
}		}

llvm/trunk/test/CodeGen/X86/psubus.ll

	Show First 20 Lines • Show All 1,682 Lines • ▼ Show 20 Lines
	; SSE41: # %bb.0: # %vector.ph			; SSE41: # %bb.0: # %vector.ph
	; SSE41-NEXT: movdqa %xmm0, %xmm8			; SSE41-NEXT: movdqa %xmm0, %xmm8
	; SSE41-NEXT: movdqa {{.*#+}} xmm6 = [9223372039002259456,9223372039002259456]			; SSE41-NEXT: movdqa {{.*#+}} xmm6 = [9223372039002259456,9223372039002259456]
	; SSE41-NEXT: movdqa %xmm4, %xmm0			; SSE41-NEXT: movdqa %xmm4, %xmm0
	; SSE41-NEXT: pxor %xmm6, %xmm0			; SSE41-NEXT: pxor %xmm6, %xmm0
	; SSE41-NEXT: movdqa {{.*#+}} xmm9 = [9223372039002324991,9223372039002324991]			; SSE41-NEXT: movdqa {{.*#+}} xmm9 = [9223372039002324991,9223372039002324991]
	; SSE41-NEXT: movdqa %xmm9, %xmm7			; SSE41-NEXT: movdqa %xmm9, %xmm7
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm7			; SSE41-NEXT: pcmpgtd %xmm0, %xmm7
	; SSE41-NEXT: pshufd {{.*#+}} xmm10 = xmm7[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm7[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm9, %xmm0			; SSE41-NEXT: pcmpeqd %xmm9, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm10, %xmm5			; SSE41-NEXT: pand %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm7[1,1,3,3]			; SSE41-NEXT: por %xmm7, %xmm0
	; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: movapd {{.*#+}} xmm7 = [65535,65535]			; SSE41-NEXT: movapd {{.*#+}} xmm7 = [65535,65535]
	; SSE41-NEXT: movapd %xmm7, %xmm11			; SSE41-NEXT: movapd %xmm7, %xmm5
	; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm11			; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm5
	; SSE41-NEXT: movdqa %xmm3, %xmm0			; SSE41-NEXT: movdqa %xmm3, %xmm0
	; SSE41-NEXT: pxor %xmm6, %xmm0			; SSE41-NEXT: pxor %xmm6, %xmm0
	; SSE41-NEXT: movdqa %xmm9, %xmm4			; SSE41-NEXT: movdqa %xmm9, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm4			; SSE41-NEXT: pcmpgtd %xmm0, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm10 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm10 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm9, %xmm0			; SSE41-NEXT: pcmpeqd %xmm9, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm10, %xmm5			; SSE41-NEXT: pand %xmm10, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: movapd %xmm7, %xmm4			; SSE41-NEXT: movapd %xmm7, %xmm4
	; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm4			; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm4
	; SSE41-NEXT: packusdw %xmm11, %xmm4			; SSE41-NEXT: packusdw %xmm5, %xmm4
	; SSE41-NEXT: movdqa %xmm2, %xmm0			; SSE41-NEXT: movdqa %xmm2, %xmm0
	; SSE41-NEXT: pxor %xmm6, %xmm0			; SSE41-NEXT: pxor %xmm6, %xmm0
	; SSE41-NEXT: movdqa %xmm9, %xmm3			; SSE41-NEXT: movdqa %xmm9, %xmm3
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm3			; SSE41-NEXT: pcmpgtd %xmm0, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm10 = xmm3[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm3[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm9, %xmm0			; SSE41-NEXT: pcmpeqd %xmm9, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm10, %xmm5			; SSE41-NEXT: pand %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[1,1,3,3]			; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: movapd %xmm7, %xmm3			; SSE41-NEXT: movapd %xmm7, %xmm3
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm3			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm3
	; SSE41-NEXT: pxor %xmm1, %xmm6			; SSE41-NEXT: pxor %xmm1, %xmm6
	; SSE41-NEXT: movdqa %xmm9, %xmm0			; SSE41-NEXT: movdqa %xmm9, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm6, %xmm0			; SSE41-NEXT: pcmpgtd %xmm6, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm0[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm9, %xmm6			; SSE41-NEXT: pcmpeqd %xmm9, %xmm6
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm6[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm6[1,1,3,3]
	; SSE41-NEXT: pand %xmm2, %xmm5			; SSE41-NEXT: pand %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm7			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm7
	; SSE41-NEXT: packusdw %xmm3, %xmm7			; SSE41-NEXT: packusdw %xmm3, %xmm7
	; SSE41-NEXT: packusdw %xmm4, %xmm7			; SSE41-NEXT: packusdw %xmm4, %xmm7
	; SSE41-NEXT: psubusw %xmm7, %xmm8			; SSE41-NEXT: psubusw %xmm7, %xmm8
	; SSE41-NEXT: movdqa %xmm8, %xmm0			; SSE41-NEXT: movdqa %xmm8, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: psubus_8i64_max:			; AVX1-LABEL: psubus_8i64_max:
	▲ Show 20 Lines • Show All 688 Lines • Show Last 20 Lines

llvm/trunk/test/CodeGen/X86/sat-add.ll

	Show First 20 Lines • Show All 564 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: movapd {{.*#+}} xmm2 = [18446744073709551573,18446744073709551573]			; SSE41-NEXT: movapd {{.*#+}} xmm2 = [18446744073709551573,18446744073709551573]
	; SSE41-NEXT: movdqa {{.*#+}} xmm0 = [9223372039002259456,9223372039002259456]			; SSE41-NEXT: movdqa {{.*#+}} xmm0 = [9223372039002259456,9223372039002259456]
	; SSE41-NEXT: pxor %xmm1, %xmm0			; SSE41-NEXT: pxor %xmm1, %xmm0
	; SSE41-NEXT: movdqa {{.*#+}} xmm3 = [9223372034707292117,9223372034707292117]			; SSE41-NEXT: movdqa {{.*#+}} xmm3 = [9223372034707292117,9223372034707292117]
	; SSE41-NEXT: movdqa %xmm3, %xmm4			; SSE41-NEXT: movdqa %xmm3, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm4			; SSE41-NEXT: pcmpgtd %xmm0, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm3, %xmm0			; SSE41-NEXT: pcmpeqd %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm5, %xmm3			; SSE41-NEXT: pand %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm2
	; SSE41-NEXT: paddq {{.*}}(%rip), %xmm2			; SSE41-NEXT: paddq {{.*}}(%rip), %xmm2
	; SSE41-NEXT: movdqa %xmm2, %xmm0			; SSE41-NEXT: movdqa %xmm2, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	%c = icmp ult <2 x i64> %x, <i64 -43, i64 -43>			%c = icmp ult <2 x i64> %x, <i64 -43, i64 -43>
	%s = select <2 x i1> %c, <2 x i64> %x, <2 x i64> <i64 -43, i64 -43>			%s = select <2 x i1> %c, <2 x i64> %x, <2 x i64> <i64 -43, i64 -43>
	%r = add <2 x i64> %s, <i64 42, i64 42>			%r = add <2 x i64> %s, <i64 42, i64 42>
	ret <2 x i64> %r			ret <2 x i64> %r
	▲ Show 20 Lines • Show All 277 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: movdqa {{.*#+}} xmm0 = [9223372039002259456,9223372039002259456]			; SSE41-NEXT: movdqa {{.*#+}} xmm0 = [9223372039002259456,9223372039002259456]
	; SSE41-NEXT: pxor %xmm2, %xmm0			; SSE41-NEXT: pxor %xmm2, %xmm0
	; SSE41-NEXT: movdqa {{.*#+}} xmm4 = [9223372034707292159,9223372034707292159]			; SSE41-NEXT: movdqa {{.*#+}} xmm4 = [9223372034707292159,9223372034707292159]
	; SSE41-NEXT: pxor %xmm1, %xmm4			; SSE41-NEXT: pxor %xmm1, %xmm4
	; SSE41-NEXT: movdqa %xmm4, %xmm5			; SSE41-NEXT: movdqa %xmm4, %xmm5
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm5			; SSE41-NEXT: pcmpgtd %xmm0, %xmm5
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm5[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm5[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm4			; SSE41-NEXT: pcmpeqd %xmm0, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm4[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]
	; SSE41-NEXT: pand %xmm6, %xmm4			; SSE41-NEXT: pand %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm5[1,1,3,3]			; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm3			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm3
	; SSE41-NEXT: paddq %xmm1, %xmm3			; SSE41-NEXT: paddq %xmm1, %xmm3
	; SSE41-NEXT: movdqa %xmm3, %xmm0			; SSE41-NEXT: movdqa %xmm3, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	%noty = xor <2 x i64> %y, <i64 -1, i64 -1>			%noty = xor <2 x i64> %y, <i64 -1, i64 -1>
	%c = icmp ult <2 x i64> %x, %noty			%c = icmp ult <2 x i64> %x, %noty
	%s = select <2 x i1> %c, <2 x i64> %x, <2 x i64> %noty			%s = select <2 x i1> %c, <2 x i64> %x, <2 x i64> %noty
	%r = add <2 x i64> %s, %y			%r = add <2 x i64> %s, %y
	▲ Show 20 Lines • Show All 50 Lines • Show Last 20 Lines

llvm/trunk/test/CodeGen/X86/vec_minmax_sint.ll

	Show All 36 Lines
	; SSE41-NEXT: movdqa {{.*#+}} xmm0 = [2147483648,2147483648]			; SSE41-NEXT: movdqa {{.*#+}} xmm0 = [2147483648,2147483648]
	; SSE41-NEXT: movdqa %xmm1, %xmm3			; SSE41-NEXT: movdqa %xmm1, %xmm3
	; SSE41-NEXT: pxor %xmm0, %xmm3			; SSE41-NEXT: pxor %xmm0, %xmm3
	; SSE41-NEXT: pxor %xmm2, %xmm0			; SSE41-NEXT: pxor %xmm2, %xmm0
	; SSE41-NEXT: movdqa %xmm0, %xmm4			; SSE41-NEXT: movdqa %xmm0, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm3, %xmm4			; SSE41-NEXT: pcmpgtd %xmm3, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm3, %xmm0			; SSE41-NEXT: pcmpeqd %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm5, %xmm3			; SSE41-NEXT: pand %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm1
	; SSE41-NEXT: movapd %xmm1, %xmm0			; SSE41-NEXT: movapd %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; SSE42-LABEL: max_gt_v2i64:			; SSE42-LABEL: max_gt_v2i64:
	; SSE42: # %bb.0:			; SSE42: # %bb.0:
	; SSE42-NEXT: movdqa %xmm0, %xmm2			; SSE42-NEXT: movdqa %xmm0, %xmm2
	; SSE42-NEXT: pcmpgtq %xmm1, %xmm0			; SSE42-NEXT: pcmpgtq %xmm1, %xmm0
	▲ Show 20 Lines • Show All 60 Lines • ▼ Show 20 Lines
	; SSE2-NEXT: pandn %xmm3, %xmm4			; SSE2-NEXT: pandn %xmm3, %xmm4
	; SSE2-NEXT: por %xmm4, %xmm1			; SSE2-NEXT: por %xmm4, %xmm1
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: max_gt_v4i64:			; SSE41-LABEL: max_gt_v4i64:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movdqa %xmm0, %xmm4			; SSE41-NEXT: movdqa %xmm0, %xmm4
	; SSE41-NEXT: movdqa {{.*#+}} xmm5 = [2147483648,2147483648]			; SSE41-NEXT: movdqa {{.*#+}} xmm5 = [2147483648,2147483648]
	; SSE41-NEXT: movdqa %xmm2, %xmm0			; SSE41-NEXT: movdqa %xmm2, %xmm6
	; SSE41-NEXT: pxor %xmm5, %xmm0
	; SSE41-NEXT: movdqa %xmm4, %xmm6
	; SSE41-NEXT: pxor %xmm5, %xmm6			; SSE41-NEXT: pxor %xmm5, %xmm6
	; SSE41-NEXT: movdqa %xmm6, %xmm7			; SSE41-NEXT: movdqa %xmm0, %xmm7
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm7			; SSE41-NEXT: pxor %xmm5, %xmm7
	; SSE41-NEXT: pshufd {{.*#+}} xmm8 = xmm7[0,0,2,2]			; SSE41-NEXT: movdqa %xmm7, %xmm0
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm6			; SSE41-NEXT: pcmpgtd %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm6[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm8 = xmm0[0,0,2,2]
				; SSE41-NEXT: pcmpeqd %xmm6, %xmm7
				; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm7[1,1,3,3]
	; SSE41-NEXT: pand %xmm8, %xmm6			; SSE41-NEXT: pand %xmm8, %xmm6
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm7[1,1,3,3]
	; SSE41-NEXT: por %xmm6, %xmm0			; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm2
	; SSE41-NEXT: movdqa %xmm3, %xmm0			; SSE41-NEXT: movdqa %xmm3, %xmm0
	; SSE41-NEXT: pxor %xmm5, %xmm0			; SSE41-NEXT: pxor %xmm5, %xmm0
	; SSE41-NEXT: pxor %xmm1, %xmm5			; SSE41-NEXT: pxor %xmm1, %xmm5
	; SSE41-NEXT: movdqa %xmm5, %xmm4			; SSE41-NEXT: movdqa %xmm5, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm4			; SSE41-NEXT: pcmpgtd %xmm0, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm5			; SSE41-NEXT: pcmpeqd %xmm0, %xmm5
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm5[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm5[1,1,3,3]
	; SSE41-NEXT: pand %xmm6, %xmm5			; SSE41-NEXT: pand %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm3			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm3
	; SSE41-NEXT: movapd %xmm2, %xmm0			; SSE41-NEXT: movapd %xmm2, %xmm0
	; SSE41-NEXT: movapd %xmm3, %xmm1			; SSE41-NEXT: movapd %xmm3, %xmm1
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; SSE42-LABEL: max_gt_v4i64:			; SSE42-LABEL: max_gt_v4i64:
	; SSE42: # %bb.0:			; SSE42: # %bb.0:
	; SSE42-NEXT: movdqa %xmm0, %xmm4			; SSE42-NEXT: movdqa %xmm0, %xmm4
	▲ Show 20 Lines • Show All 273 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: movdqa {{.*#+}} xmm0 = [2147483648,2147483648]			; SSE41-NEXT: movdqa {{.*#+}} xmm0 = [2147483648,2147483648]
	; SSE41-NEXT: movdqa %xmm1, %xmm3			; SSE41-NEXT: movdqa %xmm1, %xmm3
	; SSE41-NEXT: pxor %xmm0, %xmm3			; SSE41-NEXT: pxor %xmm0, %xmm3
	; SSE41-NEXT: pxor %xmm2, %xmm0			; SSE41-NEXT: pxor %xmm2, %xmm0
	; SSE41-NEXT: movdqa %xmm0, %xmm4			; SSE41-NEXT: movdqa %xmm0, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm3, %xmm4			; SSE41-NEXT: pcmpgtd %xmm3, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm3, %xmm0			; SSE41-NEXT: pcmpeqd %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm5, %xmm3			; SSE41-NEXT: pand %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm1
	; SSE41-NEXT: movapd %xmm1, %xmm0			; SSE41-NEXT: movapd %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; SSE42-LABEL: max_ge_v2i64:			; SSE42-LABEL: max_ge_v2i64:
	; SSE42: # %bb.0:			; SSE42: # %bb.0:
	; SSE42-NEXT: movdqa %xmm0, %xmm2			; SSE42-NEXT: movdqa %xmm0, %xmm2
	; SSE42-NEXT: pcmpgtq %xmm1, %xmm0			; SSE42-NEXT: pcmpgtq %xmm1, %xmm0
	▲ Show 20 Lines • Show All 60 Lines • ▼ Show 20 Lines
	; SSE2-NEXT: pandn %xmm3, %xmm4			; SSE2-NEXT: pandn %xmm3, %xmm4
	; SSE2-NEXT: por %xmm4, %xmm1			; SSE2-NEXT: por %xmm4, %xmm1
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: max_ge_v4i64:			; SSE41-LABEL: max_ge_v4i64:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movdqa %xmm0, %xmm4			; SSE41-NEXT: movdqa %xmm0, %xmm4
	; SSE41-NEXT: movdqa {{.*#+}} xmm5 = [2147483648,2147483648]			; SSE41-NEXT: movdqa {{.*#+}} xmm5 = [2147483648,2147483648]
	; SSE41-NEXT: movdqa %xmm2, %xmm0			; SSE41-NEXT: movdqa %xmm2, %xmm6
	; SSE41-NEXT: pxor %xmm5, %xmm0
	; SSE41-NEXT: movdqa %xmm4, %xmm6
	; SSE41-NEXT: pxor %xmm5, %xmm6			; SSE41-NEXT: pxor %xmm5, %xmm6
	; SSE41-NEXT: movdqa %xmm6, %xmm7			; SSE41-NEXT: movdqa %xmm0, %xmm7
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm7			; SSE41-NEXT: pxor %xmm5, %xmm7
	; SSE41-NEXT: pshufd {{.*#+}} xmm8 = xmm7[0,0,2,2]			; SSE41-NEXT: movdqa %xmm7, %xmm0
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm6			; SSE41-NEXT: pcmpgtd %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm6[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm8 = xmm0[0,0,2,2]
				; SSE41-NEXT: pcmpeqd %xmm6, %xmm7
				; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm7[1,1,3,3]
	; SSE41-NEXT: pand %xmm8, %xmm6			; SSE41-NEXT: pand %xmm8, %xmm6
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm7[1,1,3,3]
	; SSE41-NEXT: por %xmm6, %xmm0			; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm2
	; SSE41-NEXT: movdqa %xmm3, %xmm0			; SSE41-NEXT: movdqa %xmm3, %xmm0
	; SSE41-NEXT: pxor %xmm5, %xmm0			; SSE41-NEXT: pxor %xmm5, %xmm0
	; SSE41-NEXT: pxor %xmm1, %xmm5			; SSE41-NEXT: pxor %xmm1, %xmm5
	; SSE41-NEXT: movdqa %xmm5, %xmm4			; SSE41-NEXT: movdqa %xmm5, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm4			; SSE41-NEXT: pcmpgtd %xmm0, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm5			; SSE41-NEXT: pcmpeqd %xmm0, %xmm5
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm5[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm5[1,1,3,3]
	; SSE41-NEXT: pand %xmm6, %xmm5			; SSE41-NEXT: pand %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm3			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm3
	; SSE41-NEXT: movapd %xmm2, %xmm0			; SSE41-NEXT: movapd %xmm2, %xmm0
	; SSE41-NEXT: movapd %xmm3, %xmm1			; SSE41-NEXT: movapd %xmm3, %xmm1
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; SSE42-LABEL: max_ge_v4i64:			; SSE42-LABEL: max_ge_v4i64:
	; SSE42: # %bb.0:			; SSE42: # %bb.0:
	; SSE42-NEXT: movdqa %xmm0, %xmm4			; SSE42-NEXT: movdqa %xmm0, %xmm4
	▲ Show 20 Lines • Show All 273 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: movdqa {{.*#+}} xmm0 = [2147483648,2147483648]			; SSE41-NEXT: movdqa {{.*#+}} xmm0 = [2147483648,2147483648]
	; SSE41-NEXT: movdqa %xmm2, %xmm3			; SSE41-NEXT: movdqa %xmm2, %xmm3
	; SSE41-NEXT: pxor %xmm0, %xmm3			; SSE41-NEXT: pxor %xmm0, %xmm3
	; SSE41-NEXT: pxor %xmm1, %xmm0			; SSE41-NEXT: pxor %xmm1, %xmm0
	; SSE41-NEXT: movdqa %xmm0, %xmm4			; SSE41-NEXT: movdqa %xmm0, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm3, %xmm4			; SSE41-NEXT: pcmpgtd %xmm3, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm3, %xmm0			; SSE41-NEXT: pcmpeqd %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm5, %xmm3			; SSE41-NEXT: pand %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm1
	; SSE41-NEXT: movapd %xmm1, %xmm0			; SSE41-NEXT: movapd %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; SSE42-LABEL: min_lt_v2i64:			; SSE42-LABEL: min_lt_v2i64:
	; SSE42: # %bb.0:			; SSE42: # %bb.0:
	; SSE42-NEXT: movdqa %xmm0, %xmm2			; SSE42-NEXT: movdqa %xmm0, %xmm2
	; SSE42-NEXT: movdqa %xmm1, %xmm0			; SSE42-NEXT: movdqa %xmm1, %xmm0
	▲ Show 20 Lines • Show All 68 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: movdqa {{.*#+}} xmm5 = [2147483648,2147483648]			; SSE41-NEXT: movdqa {{.*#+}} xmm5 = [2147483648,2147483648]
	; SSE41-NEXT: pxor %xmm5, %xmm0			; SSE41-NEXT: pxor %xmm5, %xmm0
	; SSE41-NEXT: movdqa %xmm2, %xmm6			; SSE41-NEXT: movdqa %xmm2, %xmm6
	; SSE41-NEXT: pxor %xmm5, %xmm6			; SSE41-NEXT: pxor %xmm5, %xmm6
	; SSE41-NEXT: movdqa %xmm6, %xmm7			; SSE41-NEXT: movdqa %xmm6, %xmm7
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm7			; SSE41-NEXT: pcmpgtd %xmm0, %xmm7
	; SSE41-NEXT: pshufd {{.*#+}} xmm8 = xmm7[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm8 = xmm7[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm6			; SSE41-NEXT: pcmpeqd %xmm0, %xmm6
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm6[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm6[1,1,3,3]
	; SSE41-NEXT: pand %xmm8, %xmm6			; SSE41-NEXT: pand %xmm8, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm7[1,1,3,3]			; SSE41-NEXT: por %xmm7, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm2
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: pxor %xmm5, %xmm0			; SSE41-NEXT: pxor %xmm5, %xmm0
	; SSE41-NEXT: pxor %xmm3, %xmm5			; SSE41-NEXT: pxor %xmm3, %xmm5
	; SSE41-NEXT: movdqa %xmm5, %xmm4			; SSE41-NEXT: movdqa %xmm5, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm4			; SSE41-NEXT: pcmpgtd %xmm0, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm5			; SSE41-NEXT: pcmpeqd %xmm0, %xmm5
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm5[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm5[1,1,3,3]
	; SSE41-NEXT: pand %xmm6, %xmm5			; SSE41-NEXT: pand %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm3			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm3
	; SSE41-NEXT: movapd %xmm2, %xmm0			; SSE41-NEXT: movapd %xmm2, %xmm0
	; SSE41-NEXT: movapd %xmm3, %xmm1			; SSE41-NEXT: movapd %xmm3, %xmm1
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; SSE42-LABEL: min_lt_v4i64:			; SSE42-LABEL: min_lt_v4i64:
	; SSE42: # %bb.0:			; SSE42: # %bb.0:
	; SSE42-NEXT: movdqa %xmm0, %xmm4			; SSE42-NEXT: movdqa %xmm0, %xmm4
	▲ Show 20 Lines • Show All 268 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: movdqa {{.*#+}} xmm0 = [2147483648,2147483648]			; SSE41-NEXT: movdqa {{.*#+}} xmm0 = [2147483648,2147483648]
	; SSE41-NEXT: movdqa %xmm2, %xmm3			; SSE41-NEXT: movdqa %xmm2, %xmm3
	; SSE41-NEXT: pxor %xmm0, %xmm3			; SSE41-NEXT: pxor %xmm0, %xmm3
	; SSE41-NEXT: pxor %xmm1, %xmm0			; SSE41-NEXT: pxor %xmm1, %xmm0
	; SSE41-NEXT: movdqa %xmm0, %xmm4			; SSE41-NEXT: movdqa %xmm0, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm3, %xmm4			; SSE41-NEXT: pcmpgtd %xmm3, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm3, %xmm0			; SSE41-NEXT: pcmpeqd %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm5, %xmm3			; SSE41-NEXT: pand %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm1
	; SSE41-NEXT: movapd %xmm1, %xmm0			; SSE41-NEXT: movapd %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; SSE42-LABEL: min_le_v2i64:			; SSE42-LABEL: min_le_v2i64:
	; SSE42: # %bb.0:			; SSE42: # %bb.0:
	; SSE42-NEXT: movdqa %xmm0, %xmm2			; SSE42-NEXT: movdqa %xmm0, %xmm2
	; SSE42-NEXT: movdqa %xmm1, %xmm0			; SSE42-NEXT: movdqa %xmm1, %xmm0
	▲ Show 20 Lines • Show All 68 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: movdqa {{.*#+}} xmm5 = [2147483648,2147483648]			; SSE41-NEXT: movdqa {{.*#+}} xmm5 = [2147483648,2147483648]
	; SSE41-NEXT: pxor %xmm5, %xmm0			; SSE41-NEXT: pxor %xmm5, %xmm0
	; SSE41-NEXT: movdqa %xmm2, %xmm6			; SSE41-NEXT: movdqa %xmm2, %xmm6
	; SSE41-NEXT: pxor %xmm5, %xmm6			; SSE41-NEXT: pxor %xmm5, %xmm6
	; SSE41-NEXT: movdqa %xmm6, %xmm7			; SSE41-NEXT: movdqa %xmm6, %xmm7
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm7			; SSE41-NEXT: pcmpgtd %xmm0, %xmm7
	; SSE41-NEXT: pshufd {{.*#+}} xmm8 = xmm7[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm8 = xmm7[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm6			; SSE41-NEXT: pcmpeqd %xmm0, %xmm6
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm6[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm6[1,1,3,3]
	; SSE41-NEXT: pand %xmm8, %xmm6			; SSE41-NEXT: pand %xmm8, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm7[1,1,3,3]			; SSE41-NEXT: por %xmm7, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm2
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: pxor %xmm5, %xmm0			; SSE41-NEXT: pxor %xmm5, %xmm0
	; SSE41-NEXT: pxor %xmm3, %xmm5			; SSE41-NEXT: pxor %xmm3, %xmm5
	; SSE41-NEXT: movdqa %xmm5, %xmm4			; SSE41-NEXT: movdqa %xmm5, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm4			; SSE41-NEXT: pcmpgtd %xmm0, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm5			; SSE41-NEXT: pcmpeqd %xmm0, %xmm5
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm5[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm5[1,1,3,3]
	; SSE41-NEXT: pand %xmm6, %xmm5			; SSE41-NEXT: pand %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm3			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm3
	; SSE41-NEXT: movapd %xmm2, %xmm0			; SSE41-NEXT: movapd %xmm2, %xmm0
	; SSE41-NEXT: movapd %xmm3, %xmm1			; SSE41-NEXT: movapd %xmm3, %xmm1
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; SSE42-LABEL: min_le_v4i64:			; SSE42-LABEL: min_le_v4i64:
	; SSE42: # %bb.0:			; SSE42: # %bb.0:
	; SSE42-NEXT: movdqa %xmm0, %xmm4			; SSE42-NEXT: movdqa %xmm0, %xmm4
	▲ Show 20 Lines • Show All 732 Lines • Show Last 20 Lines

llvm/trunk/test/CodeGen/X86/vec_minmax_uint.ll

	Show All 36 Lines
	; SSE41-NEXT: movdqa {{.*#+}} xmm0 = [9223372039002259456,9223372039002259456]			; SSE41-NEXT: movdqa {{.*#+}} xmm0 = [9223372039002259456,9223372039002259456]
	; SSE41-NEXT: movdqa %xmm1, %xmm3			; SSE41-NEXT: movdqa %xmm1, %xmm3
	; SSE41-NEXT: pxor %xmm0, %xmm3			; SSE41-NEXT: pxor %xmm0, %xmm3
	; SSE41-NEXT: pxor %xmm2, %xmm0			; SSE41-NEXT: pxor %xmm2, %xmm0
	; SSE41-NEXT: movdqa %xmm0, %xmm4			; SSE41-NEXT: movdqa %xmm0, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm3, %xmm4			; SSE41-NEXT: pcmpgtd %xmm3, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm3, %xmm0			; SSE41-NEXT: pcmpeqd %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm5, %xmm3			; SSE41-NEXT: pand %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm1
	; SSE41-NEXT: movapd %xmm1, %xmm0			; SSE41-NEXT: movapd %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; SSE42-LABEL: max_gt_v2i64:			; SSE42-LABEL: max_gt_v2i64:
	; SSE42: # %bb.0:			; SSE42: # %bb.0:
	; SSE42-NEXT: movdqa %xmm0, %xmm2			; SSE42-NEXT: movdqa %xmm0, %xmm2
	; SSE42-NEXT: movdqa {{.*#+}} xmm0 = [9223372036854775808,9223372036854775808]			; SSE42-NEXT: movdqa {{.*#+}} xmm0 = [9223372036854775808,9223372036854775808]
	▲ Show 20 Lines • Show All 70 Lines • ▼ Show 20 Lines
	; SSE2-NEXT: pandn %xmm3, %xmm4			; SSE2-NEXT: pandn %xmm3, %xmm4
	; SSE2-NEXT: por %xmm4, %xmm1			; SSE2-NEXT: por %xmm4, %xmm1
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: max_gt_v4i64:			; SSE41-LABEL: max_gt_v4i64:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movdqa %xmm0, %xmm4			; SSE41-NEXT: movdqa %xmm0, %xmm4
	; SSE41-NEXT: movdqa {{.*#+}} xmm5 = [9223372039002259456,9223372039002259456]			; SSE41-NEXT: movdqa {{.*#+}} xmm5 = [9223372039002259456,9223372039002259456]
	; SSE41-NEXT: movdqa %xmm2, %xmm0			; SSE41-NEXT: movdqa %xmm2, %xmm6
	; SSE41-NEXT: pxor %xmm5, %xmm0
	; SSE41-NEXT: movdqa %xmm4, %xmm6
	; SSE41-NEXT: pxor %xmm5, %xmm6			; SSE41-NEXT: pxor %xmm5, %xmm6
	; SSE41-NEXT: movdqa %xmm6, %xmm7			; SSE41-NEXT: movdqa %xmm0, %xmm7
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm7			; SSE41-NEXT: pxor %xmm5, %xmm7
	; SSE41-NEXT: pshufd {{.*#+}} xmm8 = xmm7[0,0,2,2]			; SSE41-NEXT: movdqa %xmm7, %xmm0
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm6			; SSE41-NEXT: pcmpgtd %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm6[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm8 = xmm0[0,0,2,2]
				; SSE41-NEXT: pcmpeqd %xmm6, %xmm7
				; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm7[1,1,3,3]
	; SSE41-NEXT: pand %xmm8, %xmm6			; SSE41-NEXT: pand %xmm8, %xmm6
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm7[1,1,3,3]
	; SSE41-NEXT: por %xmm6, %xmm0			; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm2
	; SSE41-NEXT: movdqa %xmm3, %xmm0			; SSE41-NEXT: movdqa %xmm3, %xmm0
	; SSE41-NEXT: pxor %xmm5, %xmm0			; SSE41-NEXT: pxor %xmm5, %xmm0
	; SSE41-NEXT: pxor %xmm1, %xmm5			; SSE41-NEXT: pxor %xmm1, %xmm5
	; SSE41-NEXT: movdqa %xmm5, %xmm4			; SSE41-NEXT: movdqa %xmm5, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm4			; SSE41-NEXT: pcmpgtd %xmm0, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm5			; SSE41-NEXT: pcmpeqd %xmm0, %xmm5
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm5[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm5[1,1,3,3]
	; SSE41-NEXT: pand %xmm6, %xmm5			; SSE41-NEXT: pand %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm3			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm3
	; SSE41-NEXT: movapd %xmm2, %xmm0			; SSE41-NEXT: movapd %xmm2, %xmm0
	; SSE41-NEXT: movapd %xmm3, %xmm1			; SSE41-NEXT: movapd %xmm3, %xmm1
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; SSE42-LABEL: max_gt_v4i64:			; SSE42-LABEL: max_gt_v4i64:
	; SSE42: # %bb.0:			; SSE42: # %bb.0:
	; SSE42-NEXT: movdqa %xmm0, %xmm4			; SSE42-NEXT: movdqa %xmm0, %xmm4
	▲ Show 20 Lines • Show All 291 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: movdqa {{.*#+}} xmm0 = [9223372039002259456,9223372039002259456]			; SSE41-NEXT: movdqa {{.*#+}} xmm0 = [9223372039002259456,9223372039002259456]
	; SSE41-NEXT: movdqa %xmm1, %xmm3			; SSE41-NEXT: movdqa %xmm1, %xmm3
	; SSE41-NEXT: pxor %xmm0, %xmm3			; SSE41-NEXT: pxor %xmm0, %xmm3
	; SSE41-NEXT: pxor %xmm2, %xmm0			; SSE41-NEXT: pxor %xmm2, %xmm0
	; SSE41-NEXT: movdqa %xmm0, %xmm4			; SSE41-NEXT: movdqa %xmm0, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm3, %xmm4			; SSE41-NEXT: pcmpgtd %xmm3, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm3, %xmm0			; SSE41-NEXT: pcmpeqd %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm5, %xmm3			; SSE41-NEXT: pand %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm1
	; SSE41-NEXT: movapd %xmm1, %xmm0			; SSE41-NEXT: movapd %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; SSE42-LABEL: max_ge_v2i64:			; SSE42-LABEL: max_ge_v2i64:
	; SSE42: # %bb.0:			; SSE42: # %bb.0:
	; SSE42-NEXT: movdqa %xmm0, %xmm2			; SSE42-NEXT: movdqa %xmm0, %xmm2
	; SSE42-NEXT: movdqa {{.*#+}} xmm0 = [9223372036854775808,9223372036854775808]			; SSE42-NEXT: movdqa {{.*#+}} xmm0 = [9223372036854775808,9223372036854775808]
	▲ Show 20 Lines • Show All 70 Lines • ▼ Show 20 Lines
	; SSE2-NEXT: pandn %xmm3, %xmm4			; SSE2-NEXT: pandn %xmm3, %xmm4
	; SSE2-NEXT: por %xmm4, %xmm1			; SSE2-NEXT: por %xmm4, %xmm1
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: max_ge_v4i64:			; SSE41-LABEL: max_ge_v4i64:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movdqa %xmm0, %xmm4			; SSE41-NEXT: movdqa %xmm0, %xmm4
	; SSE41-NEXT: movdqa {{.*#+}} xmm5 = [9223372039002259456,9223372039002259456]			; SSE41-NEXT: movdqa {{.*#+}} xmm5 = [9223372039002259456,9223372039002259456]
	; SSE41-NEXT: movdqa %xmm2, %xmm0			; SSE41-NEXT: movdqa %xmm2, %xmm6
	; SSE41-NEXT: pxor %xmm5, %xmm0
	; SSE41-NEXT: movdqa %xmm4, %xmm6
	; SSE41-NEXT: pxor %xmm5, %xmm6			; SSE41-NEXT: pxor %xmm5, %xmm6
	; SSE41-NEXT: movdqa %xmm6, %xmm7			; SSE41-NEXT: movdqa %xmm0, %xmm7
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm7			; SSE41-NEXT: pxor %xmm5, %xmm7
	; SSE41-NEXT: pshufd {{.*#+}} xmm8 = xmm7[0,0,2,2]			; SSE41-NEXT: movdqa %xmm7, %xmm0
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm6			; SSE41-NEXT: pcmpgtd %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm6[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm8 = xmm0[0,0,2,2]
				; SSE41-NEXT: pcmpeqd %xmm6, %xmm7
				; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm7[1,1,3,3]
	; SSE41-NEXT: pand %xmm8, %xmm6			; SSE41-NEXT: pand %xmm8, %xmm6
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm7[1,1,3,3]
	; SSE41-NEXT: por %xmm6, %xmm0			; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm2
	; SSE41-NEXT: movdqa %xmm3, %xmm0			; SSE41-NEXT: movdqa %xmm3, %xmm0
	; SSE41-NEXT: pxor %xmm5, %xmm0			; SSE41-NEXT: pxor %xmm5, %xmm0
	; SSE41-NEXT: pxor %xmm1, %xmm5			; SSE41-NEXT: pxor %xmm1, %xmm5
	; SSE41-NEXT: movdqa %xmm5, %xmm4			; SSE41-NEXT: movdqa %xmm5, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm4			; SSE41-NEXT: pcmpgtd %xmm0, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm5			; SSE41-NEXT: pcmpeqd %xmm0, %xmm5
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm5[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm5[1,1,3,3]
	; SSE41-NEXT: pand %xmm6, %xmm5			; SSE41-NEXT: pand %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm3			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm3
	; SSE41-NEXT: movapd %xmm2, %xmm0			; SSE41-NEXT: movapd %xmm2, %xmm0
	; SSE41-NEXT: movapd %xmm3, %xmm1			; SSE41-NEXT: movapd %xmm3, %xmm1
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; SSE42-LABEL: max_ge_v4i64:			; SSE42-LABEL: max_ge_v4i64:
	; SSE42: # %bb.0:			; SSE42: # %bb.0:
	; SSE42-NEXT: movdqa %xmm0, %xmm4			; SSE42-NEXT: movdqa %xmm0, %xmm4
	▲ Show 20 Lines • Show All 291 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: movdqa {{.*#+}} xmm0 = [9223372039002259456,9223372039002259456]			; SSE41-NEXT: movdqa {{.*#+}} xmm0 = [9223372039002259456,9223372039002259456]
	; SSE41-NEXT: movdqa %xmm2, %xmm3			; SSE41-NEXT: movdqa %xmm2, %xmm3
	; SSE41-NEXT: pxor %xmm0, %xmm3			; SSE41-NEXT: pxor %xmm0, %xmm3
	; SSE41-NEXT: pxor %xmm1, %xmm0			; SSE41-NEXT: pxor %xmm1, %xmm0
	; SSE41-NEXT: movdqa %xmm0, %xmm4			; SSE41-NEXT: movdqa %xmm0, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm3, %xmm4			; SSE41-NEXT: pcmpgtd %xmm3, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm3, %xmm0			; SSE41-NEXT: pcmpeqd %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm5, %xmm3			; SSE41-NEXT: pand %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm1
	; SSE41-NEXT: movapd %xmm1, %xmm0			; SSE41-NEXT: movapd %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; SSE42-LABEL: min_lt_v2i64:			; SSE42-LABEL: min_lt_v2i64:
	; SSE42: # %bb.0:			; SSE42: # %bb.0:
	; SSE42-NEXT: movdqa %xmm0, %xmm2			; SSE42-NEXT: movdqa %xmm0, %xmm2
	; SSE42-NEXT: movdqa {{.*#+}} xmm0 = [9223372036854775808,9223372036854775808]			; SSE42-NEXT: movdqa {{.*#+}} xmm0 = [9223372036854775808,9223372036854775808]
	▲ Show 20 Lines • Show All 77 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: movdqa {{.*#+}} xmm5 = [9223372039002259456,9223372039002259456]			; SSE41-NEXT: movdqa {{.*#+}} xmm5 = [9223372039002259456,9223372039002259456]
	; SSE41-NEXT: pxor %xmm5, %xmm0			; SSE41-NEXT: pxor %xmm5, %xmm0
	; SSE41-NEXT: movdqa %xmm2, %xmm6			; SSE41-NEXT: movdqa %xmm2, %xmm6
	; SSE41-NEXT: pxor %xmm5, %xmm6			; SSE41-NEXT: pxor %xmm5, %xmm6
	; SSE41-NEXT: movdqa %xmm6, %xmm7			; SSE41-NEXT: movdqa %xmm6, %xmm7
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm7			; SSE41-NEXT: pcmpgtd %xmm0, %xmm7
	; SSE41-NEXT: pshufd {{.*#+}} xmm8 = xmm7[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm8 = xmm7[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm6			; SSE41-NEXT: pcmpeqd %xmm0, %xmm6
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm6[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm6[1,1,3,3]
	; SSE41-NEXT: pand %xmm8, %xmm6			; SSE41-NEXT: pand %xmm8, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm7[1,1,3,3]			; SSE41-NEXT: por %xmm7, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm2
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: pxor %xmm5, %xmm0			; SSE41-NEXT: pxor %xmm5, %xmm0
	; SSE41-NEXT: pxor %xmm3, %xmm5			; SSE41-NEXT: pxor %xmm3, %xmm5
	; SSE41-NEXT: movdqa %xmm5, %xmm4			; SSE41-NEXT: movdqa %xmm5, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm4			; SSE41-NEXT: pcmpgtd %xmm0, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm5			; SSE41-NEXT: pcmpeqd %xmm0, %xmm5
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm5[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm5[1,1,3,3]
	; SSE41-NEXT: pand %xmm6, %xmm5			; SSE41-NEXT: pand %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm3			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm3
	; SSE41-NEXT: movapd %xmm2, %xmm0			; SSE41-NEXT: movapd %xmm2, %xmm0
	; SSE41-NEXT: movapd %xmm3, %xmm1			; SSE41-NEXT: movapd %xmm3, %xmm1
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; SSE42-LABEL: min_lt_v4i64:			; SSE42-LABEL: min_lt_v4i64:
	; SSE42: # %bb.0:			; SSE42: # %bb.0:
	; SSE42-NEXT: movdqa %xmm0, %xmm4			; SSE42-NEXT: movdqa %xmm0, %xmm4
	▲ Show 20 Lines • Show All 291 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: movdqa {{.*#+}} xmm0 = [9223372039002259456,9223372039002259456]			; SSE41-NEXT: movdqa {{.*#+}} xmm0 = [9223372039002259456,9223372039002259456]
	; SSE41-NEXT: movdqa %xmm2, %xmm3			; SSE41-NEXT: movdqa %xmm2, %xmm3
	; SSE41-NEXT: pxor %xmm0, %xmm3			; SSE41-NEXT: pxor %xmm0, %xmm3
	; SSE41-NEXT: pxor %xmm1, %xmm0			; SSE41-NEXT: pxor %xmm1, %xmm0
	; SSE41-NEXT: movdqa %xmm0, %xmm4			; SSE41-NEXT: movdqa %xmm0, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm3, %xmm4			; SSE41-NEXT: pcmpgtd %xmm3, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm3, %xmm0			; SSE41-NEXT: pcmpeqd %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm5, %xmm3			; SSE41-NEXT: pand %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm1
	; SSE41-NEXT: movapd %xmm1, %xmm0			; SSE41-NEXT: movapd %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; SSE42-LABEL: min_le_v2i64:			; SSE42-LABEL: min_le_v2i64:
	; SSE42: # %bb.0:			; SSE42: # %bb.0:
	; SSE42-NEXT: movdqa %xmm0, %xmm2			; SSE42-NEXT: movdqa %xmm0, %xmm2
	; SSE42-NEXT: movdqa {{.*#+}} xmm0 = [9223372036854775808,9223372036854775808]			; SSE42-NEXT: movdqa {{.*#+}} xmm0 = [9223372036854775808,9223372036854775808]
	▲ Show 20 Lines • Show All 77 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: movdqa {{.*#+}} xmm5 = [9223372039002259456,9223372039002259456]			; SSE41-NEXT: movdqa {{.*#+}} xmm5 = [9223372039002259456,9223372039002259456]
	; SSE41-NEXT: pxor %xmm5, %xmm0			; SSE41-NEXT: pxor %xmm5, %xmm0
	; SSE41-NEXT: movdqa %xmm2, %xmm6			; SSE41-NEXT: movdqa %xmm2, %xmm6
	; SSE41-NEXT: pxor %xmm5, %xmm6			; SSE41-NEXT: pxor %xmm5, %xmm6
	; SSE41-NEXT: movdqa %xmm6, %xmm7			; SSE41-NEXT: movdqa %xmm6, %xmm7
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm7			; SSE41-NEXT: pcmpgtd %xmm0, %xmm7
	; SSE41-NEXT: pshufd {{.*#+}} xmm8 = xmm7[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm8 = xmm7[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm6			; SSE41-NEXT: pcmpeqd %xmm0, %xmm6
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm6[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm6[1,1,3,3]
	; SSE41-NEXT: pand %xmm8, %xmm6			; SSE41-NEXT: pand %xmm8, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm7[1,1,3,3]			; SSE41-NEXT: por %xmm7, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm2
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: pxor %xmm5, %xmm0			; SSE41-NEXT: pxor %xmm5, %xmm0
	; SSE41-NEXT: pxor %xmm3, %xmm5			; SSE41-NEXT: pxor %xmm3, %xmm5
	; SSE41-NEXT: movdqa %xmm5, %xmm4			; SSE41-NEXT: movdqa %xmm5, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm4			; SSE41-NEXT: pcmpgtd %xmm0, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm5			; SSE41-NEXT: pcmpeqd %xmm0, %xmm5
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm5[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm5[1,1,3,3]
	; SSE41-NEXT: pand %xmm6, %xmm5			; SSE41-NEXT: pand %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm3			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm3
	; SSE41-NEXT: movapd %xmm2, %xmm0			; SSE41-NEXT: movapd %xmm2, %xmm0
	; SSE41-NEXT: movapd %xmm3, %xmm1			; SSE41-NEXT: movapd %xmm3, %xmm1
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; SSE42-LABEL: min_le_v4i64:			; SSE42-LABEL: min_le_v4i64:
	; SSE42: # %bb.0:			; SSE42: # %bb.0:
	; SSE42-NEXT: movdqa %xmm0, %xmm4			; SSE42-NEXT: movdqa %xmm0, %xmm4
	▲ Show 20 Lines • Show All 755 Lines • Show Last 20 Lines

llvm/trunk/test/CodeGen/X86/vector-reduce-smax-widen.ll

	Show All 30 Lines
	; SSE2-NEXT: por %xmm0, %xmm3			; SSE2-NEXT: por %xmm0, %xmm3
	; SSE2-NEXT: movq %xmm3, %rax			; SSE2-NEXT: movq %xmm3, %rax
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: test_v2i64:			; SSE41-LABEL: test_v2i64:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movdqa %xmm0, %xmm1			; SSE41-NEXT: movdqa %xmm0, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm0[2,3,0,1]			; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm0[2,3,0,1]
	; SSE41-NEXT: movdqa {{.*#+}} xmm0 = [2147483648,2147483648]			; SSE41-NEXT: movdqa {{.*#+}} xmm3 = [2147483648,2147483648]
	; SSE41-NEXT: movdqa %xmm1, %xmm3			; SSE41-NEXT: movdqa %xmm0, %xmm4
	; SSE41-NEXT: pxor %xmm0, %xmm3			; SSE41-NEXT: pxor %xmm3, %xmm4
	; SSE41-NEXT: pxor %xmm2, %xmm0			; SSE41-NEXT: pxor %xmm2, %xmm3
	; SSE41-NEXT: movdqa %xmm3, %xmm4			; SSE41-NEXT: movdqa %xmm4, %xmm0
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm4			; SSE41-NEXT: pcmpgtd %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm0[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm3, %xmm0			; SSE41-NEXT: pcmpeqd %xmm4, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm3[1,1,3,3]
	; SSE41-NEXT: pand %xmm5, %xmm3			; SSE41-NEXT: pand %xmm5, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]
	; SSE41-NEXT: por %xmm3, %xmm0			; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm2
	; SSE41-NEXT: movq %xmm2, %rax			; SSE41-NEXT: movq %xmm2, %rax
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX-LABEL: test_v2i64:			; AVX-LABEL: test_v2i64:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]			; AVX-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]
	▲ Show 20 Lines • Show All 57 Lines • ▼ Show 20 Lines
	; SSE2-NEXT: por %xmm4, %xmm2			; SSE2-NEXT: por %xmm4, %xmm2
	; SSE2-NEXT: movq %xmm2, %rax			; SSE2-NEXT: movq %xmm2, %rax
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: test_v4i64:			; SSE41-LABEL: test_v4i64:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movdqa %xmm0, %xmm2			; SSE41-NEXT: movdqa %xmm0, %xmm2
	; SSE41-NEXT: movdqa {{.*#+}} xmm3 = [2147483648,2147483648]			; SSE41-NEXT: movdqa {{.*#+}} xmm3 = [2147483648,2147483648]
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm4
	; SSE41-NEXT: pxor %xmm3, %xmm0
	; SSE41-NEXT: movdqa %xmm2, %xmm4
	; SSE41-NEXT: pxor %xmm3, %xmm4			; SSE41-NEXT: pxor %xmm3, %xmm4
	; SSE41-NEXT: movdqa %xmm4, %xmm5			; SSE41-NEXT: movdqa %xmm0, %xmm5
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm5			; SSE41-NEXT: pxor %xmm3, %xmm5
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm5[0,0,2,2]			; SSE41-NEXT: movdqa %xmm5, %xmm0
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm4			; SSE41-NEXT: pcmpgtd %xmm4, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm4[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm0[0,0,2,2]
				; SSE41-NEXT: pcmpeqd %xmm4, %xmm5
				; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm5[1,1,3,3]
	; SSE41-NEXT: pand %xmm6, %xmm4			; SSE41-NEXT: pand %xmm6, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm5[1,1,3,3]
	; SSE41-NEXT: por %xmm4, %xmm0			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm1[2,3,0,1]			; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm1[2,3,0,1]
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: pxor %xmm3, %xmm0			; SSE41-NEXT: pxor %xmm3, %xmm0
	; SSE41-NEXT: pxor %xmm2, %xmm3			; SSE41-NEXT: pxor %xmm2, %xmm3
	; SSE41-NEXT: movdqa %xmm0, %xmm4			; SSE41-NEXT: movdqa %xmm0, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm3, %xmm4			; SSE41-NEXT: pcmpgtd %xmm3, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm3			; SSE41-NEXT: pcmpeqd %xmm0, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm3[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[1,1,3,3]
	; SSE41-NEXT: pand %xmm5, %xmm3			; SSE41-NEXT: pand %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm2
	; SSE41-NEXT: movq %xmm2, %rax			; SSE41-NEXT: movq %xmm2, %rax
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: test_v4i64:			; AVX1-LABEL: test_v4i64:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1
	; AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2
	▲ Show 20 Lines • Show All 109 Lines • ▼ Show 20 Lines
	; SSE2-NEXT: por %xmm1, %xmm3			; SSE2-NEXT: por %xmm1, %xmm3
	; SSE2-NEXT: movq %xmm3, %rax			; SSE2-NEXT: movq %xmm3, %rax
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: test_v8i64:			; SSE41-LABEL: test_v8i64:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movdqa %xmm0, %xmm4			; SSE41-NEXT: movdqa %xmm0, %xmm4
	; SSE41-NEXT: movdqa {{.*#+}} xmm5 = [2147483648,2147483648]			; SSE41-NEXT: movdqa {{.*#+}} xmm5 = [2147483648,2147483648]
	; SSE41-NEXT: movdqa %xmm2, %xmm0			; SSE41-NEXT: movdqa %xmm2, %xmm6
	; SSE41-NEXT: pxor %xmm5, %xmm0
	; SSE41-NEXT: movdqa %xmm4, %xmm6
	; SSE41-NEXT: pxor %xmm5, %xmm6			; SSE41-NEXT: pxor %xmm5, %xmm6
	; SSE41-NEXT: movdqa %xmm6, %xmm7			; SSE41-NEXT: movdqa %xmm0, %xmm7
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm7			; SSE41-NEXT: pxor %xmm5, %xmm7
	; SSE41-NEXT: pshufd {{.*#+}} xmm8 = xmm7[0,0,2,2]			; SSE41-NEXT: movdqa %xmm7, %xmm0
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm6			; SSE41-NEXT: pcmpgtd %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm6[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm8 = xmm0[0,0,2,2]
				; SSE41-NEXT: pcmpeqd %xmm6, %xmm7
				; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm7[1,1,3,3]
	; SSE41-NEXT: pand %xmm8, %xmm6			; SSE41-NEXT: pand %xmm8, %xmm6
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm7[1,1,3,3]
	; SSE41-NEXT: por %xmm6, %xmm0			; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm2
	; SSE41-NEXT: movdqa %xmm3, %xmm0			; SSE41-NEXT: movdqa %xmm3, %xmm0
	; SSE41-NEXT: pxor %xmm5, %xmm0			; SSE41-NEXT: pxor %xmm5, %xmm0
	; SSE41-NEXT: movdqa %xmm1, %xmm4			; SSE41-NEXT: movdqa %xmm1, %xmm4
	; SSE41-NEXT: pxor %xmm5, %xmm4			; SSE41-NEXT: pxor %xmm5, %xmm4
	; SSE41-NEXT: movdqa %xmm4, %xmm6			; SSE41-NEXT: movdqa %xmm4, %xmm6
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm6			; SSE41-NEXT: pcmpgtd %xmm0, %xmm6
	; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm6[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm6[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm4			; SSE41-NEXT: pcmpeqd %xmm0, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm4[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]
	; SSE41-NEXT: pand %xmm7, %xmm4			; SSE41-NEXT: pand %xmm7, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm6[1,1,3,3]			; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm3			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm3
	; SSE41-NEXT: movapd %xmm3, %xmm0			; SSE41-NEXT: movapd %xmm3, %xmm0
	; SSE41-NEXT: xorpd %xmm5, %xmm0			; SSE41-NEXT: xorpd %xmm5, %xmm0
	; SSE41-NEXT: movapd %xmm2, %xmm1			; SSE41-NEXT: movapd %xmm2, %xmm1
	; SSE41-NEXT: xorpd %xmm5, %xmm1			; SSE41-NEXT: xorpd %xmm5, %xmm1
	; SSE41-NEXT: movapd %xmm1, %xmm4			; SSE41-NEXT: movapd %xmm1, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm4			; SSE41-NEXT: pcmpgtd %xmm0, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm1			; SSE41-NEXT: pcmpeqd %xmm0, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]
	; SSE41-NEXT: pand %xmm6, %xmm1			; SSE41-NEXT: pand %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm3			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm3[2,3,0,1]			; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm3[2,3,0,1]
	; SSE41-NEXT: movdqa %xmm3, %xmm0			; SSE41-NEXT: movdqa %xmm3, %xmm0
	; SSE41-NEXT: pxor %xmm5, %xmm0			; SSE41-NEXT: pxor %xmm5, %xmm0
	; SSE41-NEXT: pxor %xmm1, %xmm5			; SSE41-NEXT: pxor %xmm1, %xmm5
	; SSE41-NEXT: movdqa %xmm0, %xmm2			; SSE41-NEXT: movdqa %xmm0, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm5, %xmm2			; SSE41-NEXT: pcmpgtd %xmm5, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm5			; SSE41-NEXT: pcmpeqd %xmm0, %xmm5
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm5[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm5[1,1,3,3]
	; SSE41-NEXT: pand %xmm4, %xmm5			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm1
	; SSE41-NEXT: movq %xmm1, %rax			; SSE41-NEXT: movq %xmm1, %rax
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: test_v8i64:			; AVX1-LABEL: test_v8i64:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2			; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
	▲ Show 20 Lines • Show All 176 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: movdqa %xmm5, %xmm10			; SSE41-NEXT: movdqa %xmm5, %xmm10
	; SSE41-NEXT: pxor %xmm9, %xmm10			; SSE41-NEXT: pxor %xmm9, %xmm10
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: pxor %xmm9, %xmm0			; SSE41-NEXT: pxor %xmm9, %xmm0
	; SSE41-NEXT: movdqa %xmm0, %xmm11			; SSE41-NEXT: movdqa %xmm0, %xmm11
	; SSE41-NEXT: pcmpgtd %xmm10, %xmm11			; SSE41-NEXT: pcmpgtd %xmm10, %xmm11
	; SSE41-NEXT: pshufd {{.*#+}} xmm12 = xmm11[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm12 = xmm11[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm10, %xmm0			; SSE41-NEXT: pcmpeqd %xmm10, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm10 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm12, %xmm10			; SSE41-NEXT: pand %xmm12, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm11[1,1,3,3]			; SSE41-NEXT: por %xmm11, %xmm0
	; SSE41-NEXT: por %xmm10, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm5			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm5
	; SSE41-NEXT: movdqa %xmm7, %xmm0			; SSE41-NEXT: movdqa %xmm7, %xmm0
	; SSE41-NEXT: pxor %xmm9, %xmm0			; SSE41-NEXT: pxor %xmm9, %xmm0
	; SSE41-NEXT: movdqa %xmm3, %xmm1			; SSE41-NEXT: movdqa %xmm3, %xmm1
	; SSE41-NEXT: pxor %xmm9, %xmm1			; SSE41-NEXT: pxor %xmm9, %xmm1
	; SSE41-NEXT: movdqa %xmm1, %xmm10			; SSE41-NEXT: movdqa %xmm1, %xmm10
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm10			; SSE41-NEXT: pcmpgtd %xmm0, %xmm10
	; SSE41-NEXT: pshufd {{.*#+}} xmm11 = xmm10[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm11 = xmm10[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm1			; SSE41-NEXT: pcmpeqd %xmm0, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]
	; SSE41-NEXT: pand %xmm11, %xmm1			; SSE41-NEXT: pand %xmm11, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm10[1,1,3,3]			; SSE41-NEXT: por %xmm10, %xmm0
	; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm7			; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm7
	; SSE41-NEXT: movdqa %xmm4, %xmm0			; SSE41-NEXT: movdqa %xmm4, %xmm1
	; SSE41-NEXT: pxor %xmm9, %xmm0
	; SSE41-NEXT: movdqa %xmm8, %xmm1
	; SSE41-NEXT: pxor %xmm9, %xmm1			; SSE41-NEXT: pxor %xmm9, %xmm1
	; SSE41-NEXT: movdqa %xmm1, %xmm3			; SSE41-NEXT: movdqa %xmm8, %xmm3
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm3			; SSE41-NEXT: pxor %xmm9, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm10 = xmm3[0,0,2,2]			; SSE41-NEXT: movdqa %xmm3, %xmm0
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm1			; SSE41-NEXT: pcmpgtd %xmm1, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm10 = xmm0[0,0,2,2]
				; SSE41-NEXT: pcmpeqd %xmm1, %xmm3
				; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm3[1,1,3,3]
	; SSE41-NEXT: pand %xmm10, %xmm1			; SSE41-NEXT: pand %xmm10, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[1,1,3,3]
	; SSE41-NEXT: por %xmm1, %xmm0			; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm4			; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm4
	; SSE41-NEXT: movdqa %xmm6, %xmm0			; SSE41-NEXT: movdqa %xmm6, %xmm0
	; SSE41-NEXT: pxor %xmm9, %xmm0			; SSE41-NEXT: pxor %xmm9, %xmm0
	; SSE41-NEXT: movdqa %xmm2, %xmm1			; SSE41-NEXT: movdqa %xmm2, %xmm1
	; SSE41-NEXT: pxor %xmm9, %xmm1			; SSE41-NEXT: pxor %xmm9, %xmm1
	; SSE41-NEXT: movdqa %xmm1, %xmm3			; SSE41-NEXT: movdqa %xmm1, %xmm3
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm3			; SSE41-NEXT: pcmpgtd %xmm0, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm8 = xmm3[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm8 = xmm3[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm1			; SSE41-NEXT: pcmpeqd %xmm0, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]
	; SSE41-NEXT: pand %xmm8, %xmm1			; SSE41-NEXT: pand %xmm8, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[1,1,3,3]			; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm6			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm6
	; SSE41-NEXT: movapd %xmm6, %xmm0			; SSE41-NEXT: movapd %xmm6, %xmm0
	; SSE41-NEXT: xorpd %xmm9, %xmm0			; SSE41-NEXT: xorpd %xmm9, %xmm0
	; SSE41-NEXT: movapd %xmm4, %xmm1			; SSE41-NEXT: movapd %xmm4, %xmm1
	; SSE41-NEXT: xorpd %xmm9, %xmm1			; SSE41-NEXT: xorpd %xmm9, %xmm1
	; SSE41-NEXT: movapd %xmm1, %xmm2			; SSE41-NEXT: movapd %xmm1, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm2			; SSE41-NEXT: pcmpgtd %xmm0, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm1			; SSE41-NEXT: pcmpeqd %xmm0, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]
	; SSE41-NEXT: pand %xmm3, %xmm1			; SSE41-NEXT: pand %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm6			; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm6
	; SSE41-NEXT: movapd %xmm7, %xmm0			; SSE41-NEXT: movapd %xmm7, %xmm0
	; SSE41-NEXT: xorpd %xmm9, %xmm0			; SSE41-NEXT: xorpd %xmm9, %xmm0
	; SSE41-NEXT: movapd %xmm5, %xmm1			; SSE41-NEXT: movapd %xmm5, %xmm1
	; SSE41-NEXT: xorpd %xmm9, %xmm1			; SSE41-NEXT: xorpd %xmm9, %xmm1
	; SSE41-NEXT: movapd %xmm1, %xmm2			; SSE41-NEXT: movapd %xmm1, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm2			; SSE41-NEXT: pcmpgtd %xmm0, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm1			; SSE41-NEXT: pcmpeqd %xmm0, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]
	; SSE41-NEXT: pand %xmm3, %xmm1			; SSE41-NEXT: pand %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm5, %xmm7			; SSE41-NEXT: blendvpd %xmm0, %xmm5, %xmm7
	; SSE41-NEXT: movapd %xmm7, %xmm0			; SSE41-NEXT: movapd %xmm7, %xmm0
	; SSE41-NEXT: xorpd %xmm9, %xmm0			; SSE41-NEXT: xorpd %xmm9, %xmm0
	; SSE41-NEXT: movapd %xmm6, %xmm1			; SSE41-NEXT: movapd %xmm6, %xmm1
	; SSE41-NEXT: xorpd %xmm9, %xmm1			; SSE41-NEXT: xorpd %xmm9, %xmm1
	; SSE41-NEXT: movapd %xmm1, %xmm2			; SSE41-NEXT: movapd %xmm1, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm2			; SSE41-NEXT: pcmpgtd %xmm0, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm1			; SSE41-NEXT: pcmpeqd %xmm0, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]
	; SSE41-NEXT: pand %xmm3, %xmm1			; SSE41-NEXT: pand %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm6, %xmm7			; SSE41-NEXT: blendvpd %xmm0, %xmm6, %xmm7
	; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm7[2,3,0,1]			; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm7[2,3,0,1]
	; SSE41-NEXT: movdqa %xmm7, %xmm0			; SSE41-NEXT: movdqa %xmm7, %xmm0
	; SSE41-NEXT: pxor %xmm9, %xmm0			; SSE41-NEXT: pxor %xmm9, %xmm0
	; SSE41-NEXT: pxor %xmm1, %xmm9			; SSE41-NEXT: pxor %xmm1, %xmm9
	; SSE41-NEXT: movdqa %xmm0, %xmm2			; SSE41-NEXT: movdqa %xmm0, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm9, %xmm2			; SSE41-NEXT: pcmpgtd %xmm9, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm9			; SSE41-NEXT: pcmpeqd %xmm0, %xmm9
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm9[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm9[1,1,3,3]
	; SSE41-NEXT: pand %xmm3, %xmm4			; SSE41-NEXT: pand %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm7, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm7, %xmm1
	; SSE41-NEXT: movq %xmm1, %rax			; SSE41-NEXT: movq %xmm1, %rax
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: test_v16i64:			; AVX1-LABEL: test_v16i64:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm2, %xmm4			; AVX1-NEXT: vextractf128 $1, %ymm2, %xmm4
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5
	▲ Show 20 Lines • Show All 1,428 Lines • Show Last 20 Lines

llvm/trunk/test/CodeGen/X86/vector-reduce-smax.ll

	Show All 30 Lines
	; SSE2-NEXT: por %xmm0, %xmm3			; SSE2-NEXT: por %xmm0, %xmm3
	; SSE2-NEXT: movq %xmm3, %rax			; SSE2-NEXT: movq %xmm3, %rax
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: test_v2i64:			; SSE41-LABEL: test_v2i64:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movdqa %xmm0, %xmm1			; SSE41-NEXT: movdqa %xmm0, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm0[2,3,0,1]			; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm0[2,3,0,1]
	; SSE41-NEXT: movdqa {{.*#+}} xmm0 = [2147483648,2147483648]			; SSE41-NEXT: movdqa {{.*#+}} xmm3 = [2147483648,2147483648]
	; SSE41-NEXT: movdqa %xmm1, %xmm3			; SSE41-NEXT: movdqa %xmm0, %xmm4
	; SSE41-NEXT: pxor %xmm0, %xmm3			; SSE41-NEXT: pxor %xmm3, %xmm4
	; SSE41-NEXT: pxor %xmm2, %xmm0			; SSE41-NEXT: pxor %xmm2, %xmm3
	; SSE41-NEXT: movdqa %xmm3, %xmm4			; SSE41-NEXT: movdqa %xmm4, %xmm0
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm4			; SSE41-NEXT: pcmpgtd %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm0[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm3, %xmm0			; SSE41-NEXT: pcmpeqd %xmm4, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm3[1,1,3,3]
	; SSE41-NEXT: pand %xmm5, %xmm3			; SSE41-NEXT: pand %xmm5, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]
	; SSE41-NEXT: por %xmm3, %xmm0			; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm2
	; SSE41-NEXT: movq %xmm2, %rax			; SSE41-NEXT: movq %xmm2, %rax
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX-LABEL: test_v2i64:			; AVX-LABEL: test_v2i64:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]			; AVX-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]
	▲ Show 20 Lines • Show All 57 Lines • ▼ Show 20 Lines
	; SSE2-NEXT: por %xmm4, %xmm2			; SSE2-NEXT: por %xmm4, %xmm2
	; SSE2-NEXT: movq %xmm2, %rax			; SSE2-NEXT: movq %xmm2, %rax
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: test_v4i64:			; SSE41-LABEL: test_v4i64:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movdqa %xmm0, %xmm2			; SSE41-NEXT: movdqa %xmm0, %xmm2
	; SSE41-NEXT: movdqa {{.*#+}} xmm3 = [2147483648,2147483648]			; SSE41-NEXT: movdqa {{.*#+}} xmm3 = [2147483648,2147483648]
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm4
	; SSE41-NEXT: pxor %xmm3, %xmm0
	; SSE41-NEXT: movdqa %xmm2, %xmm4
	; SSE41-NEXT: pxor %xmm3, %xmm4			; SSE41-NEXT: pxor %xmm3, %xmm4
	; SSE41-NEXT: movdqa %xmm4, %xmm5			; SSE41-NEXT: movdqa %xmm0, %xmm5
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm5			; SSE41-NEXT: pxor %xmm3, %xmm5
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm5[0,0,2,2]			; SSE41-NEXT: movdqa %xmm5, %xmm0
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm4			; SSE41-NEXT: pcmpgtd %xmm4, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm4[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm0[0,0,2,2]
				; SSE41-NEXT: pcmpeqd %xmm4, %xmm5
				; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm5[1,1,3,3]
	; SSE41-NEXT: pand %xmm6, %xmm4			; SSE41-NEXT: pand %xmm6, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm5[1,1,3,3]
	; SSE41-NEXT: por %xmm4, %xmm0			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm1[2,3,0,1]			; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm1[2,3,0,1]
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: pxor %xmm3, %xmm0			; SSE41-NEXT: pxor %xmm3, %xmm0
	; SSE41-NEXT: pxor %xmm2, %xmm3			; SSE41-NEXT: pxor %xmm2, %xmm3
	; SSE41-NEXT: movdqa %xmm0, %xmm4			; SSE41-NEXT: movdqa %xmm0, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm3, %xmm4			; SSE41-NEXT: pcmpgtd %xmm3, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm3			; SSE41-NEXT: pcmpeqd %xmm0, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm3[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[1,1,3,3]
	; SSE41-NEXT: pand %xmm5, %xmm3			; SSE41-NEXT: pand %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm2
	; SSE41-NEXT: movq %xmm2, %rax			; SSE41-NEXT: movq %xmm2, %rax
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: test_v4i64:			; AVX1-LABEL: test_v4i64:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1
	; AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2
	▲ Show 20 Lines • Show All 109 Lines • ▼ Show 20 Lines
	; SSE2-NEXT: por %xmm1, %xmm3			; SSE2-NEXT: por %xmm1, %xmm3
	; SSE2-NEXT: movq %xmm3, %rax			; SSE2-NEXT: movq %xmm3, %rax
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: test_v8i64:			; SSE41-LABEL: test_v8i64:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movdqa %xmm0, %xmm4			; SSE41-NEXT: movdqa %xmm0, %xmm4
	; SSE41-NEXT: movdqa {{.*#+}} xmm5 = [2147483648,2147483648]			; SSE41-NEXT: movdqa {{.*#+}} xmm5 = [2147483648,2147483648]
	; SSE41-NEXT: movdqa %xmm2, %xmm0			; SSE41-NEXT: movdqa %xmm2, %xmm6
	; SSE41-NEXT: pxor %xmm5, %xmm0
	; SSE41-NEXT: movdqa %xmm4, %xmm6
	; SSE41-NEXT: pxor %xmm5, %xmm6			; SSE41-NEXT: pxor %xmm5, %xmm6
	; SSE41-NEXT: movdqa %xmm6, %xmm7			; SSE41-NEXT: movdqa %xmm0, %xmm7
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm7			; SSE41-NEXT: pxor %xmm5, %xmm7
	; SSE41-NEXT: pshufd {{.*#+}} xmm8 = xmm7[0,0,2,2]			; SSE41-NEXT: movdqa %xmm7, %xmm0
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm6			; SSE41-NEXT: pcmpgtd %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm6[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm8 = xmm0[0,0,2,2]
				; SSE41-NEXT: pcmpeqd %xmm6, %xmm7
				; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm7[1,1,3,3]
	; SSE41-NEXT: pand %xmm8, %xmm6			; SSE41-NEXT: pand %xmm8, %xmm6
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm7[1,1,3,3]
	; SSE41-NEXT: por %xmm6, %xmm0			; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm2
	; SSE41-NEXT: movdqa %xmm3, %xmm0			; SSE41-NEXT: movdqa %xmm3, %xmm0
	; SSE41-NEXT: pxor %xmm5, %xmm0			; SSE41-NEXT: pxor %xmm5, %xmm0
	; SSE41-NEXT: movdqa %xmm1, %xmm4			; SSE41-NEXT: movdqa %xmm1, %xmm4
	; SSE41-NEXT: pxor %xmm5, %xmm4			; SSE41-NEXT: pxor %xmm5, %xmm4
	; SSE41-NEXT: movdqa %xmm4, %xmm6			; SSE41-NEXT: movdqa %xmm4, %xmm6
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm6			; SSE41-NEXT: pcmpgtd %xmm0, %xmm6
	; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm6[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm6[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm4			; SSE41-NEXT: pcmpeqd %xmm0, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm4[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]
	; SSE41-NEXT: pand %xmm7, %xmm4			; SSE41-NEXT: pand %xmm7, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm6[1,1,3,3]			; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm3			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm3
	; SSE41-NEXT: movapd %xmm3, %xmm0			; SSE41-NEXT: movapd %xmm3, %xmm0
	; SSE41-NEXT: xorpd %xmm5, %xmm0			; SSE41-NEXT: xorpd %xmm5, %xmm0
	; SSE41-NEXT: movapd %xmm2, %xmm1			; SSE41-NEXT: movapd %xmm2, %xmm1
	; SSE41-NEXT: xorpd %xmm5, %xmm1			; SSE41-NEXT: xorpd %xmm5, %xmm1
	; SSE41-NEXT: movapd %xmm1, %xmm4			; SSE41-NEXT: movapd %xmm1, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm4			; SSE41-NEXT: pcmpgtd %xmm0, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm1			; SSE41-NEXT: pcmpeqd %xmm0, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]
	; SSE41-NEXT: pand %xmm6, %xmm1			; SSE41-NEXT: pand %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm3			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm3[2,3,0,1]			; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm3[2,3,0,1]
	; SSE41-NEXT: movdqa %xmm3, %xmm0			; SSE41-NEXT: movdqa %xmm3, %xmm0
	; SSE41-NEXT: pxor %xmm5, %xmm0			; SSE41-NEXT: pxor %xmm5, %xmm0
	; SSE41-NEXT: pxor %xmm1, %xmm5			; SSE41-NEXT: pxor %xmm1, %xmm5
	; SSE41-NEXT: movdqa %xmm0, %xmm2			; SSE41-NEXT: movdqa %xmm0, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm5, %xmm2			; SSE41-NEXT: pcmpgtd %xmm5, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm5			; SSE41-NEXT: pcmpeqd %xmm0, %xmm5
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm5[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm5[1,1,3,3]
	; SSE41-NEXT: pand %xmm4, %xmm5			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm1
	; SSE41-NEXT: movq %xmm1, %rax			; SSE41-NEXT: movq %xmm1, %rax
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: test_v8i64:			; AVX1-LABEL: test_v8i64:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2			; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
	▲ Show 20 Lines • Show All 176 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: movdqa %xmm5, %xmm10			; SSE41-NEXT: movdqa %xmm5, %xmm10
	; SSE41-NEXT: pxor %xmm9, %xmm10			; SSE41-NEXT: pxor %xmm9, %xmm10
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: pxor %xmm9, %xmm0			; SSE41-NEXT: pxor %xmm9, %xmm0
	; SSE41-NEXT: movdqa %xmm0, %xmm11			; SSE41-NEXT: movdqa %xmm0, %xmm11
	; SSE41-NEXT: pcmpgtd %xmm10, %xmm11			; SSE41-NEXT: pcmpgtd %xmm10, %xmm11
	; SSE41-NEXT: pshufd {{.*#+}} xmm12 = xmm11[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm12 = xmm11[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm10, %xmm0			; SSE41-NEXT: pcmpeqd %xmm10, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm10 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm12, %xmm10			; SSE41-NEXT: pand %xmm12, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm11[1,1,3,3]			; SSE41-NEXT: por %xmm11, %xmm0
	; SSE41-NEXT: por %xmm10, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm5			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm5
	; SSE41-NEXT: movdqa %xmm7, %xmm0			; SSE41-NEXT: movdqa %xmm7, %xmm0
	; SSE41-NEXT: pxor %xmm9, %xmm0			; SSE41-NEXT: pxor %xmm9, %xmm0
	; SSE41-NEXT: movdqa %xmm3, %xmm1			; SSE41-NEXT: movdqa %xmm3, %xmm1
	; SSE41-NEXT: pxor %xmm9, %xmm1			; SSE41-NEXT: pxor %xmm9, %xmm1
	; SSE41-NEXT: movdqa %xmm1, %xmm10			; SSE41-NEXT: movdqa %xmm1, %xmm10
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm10			; SSE41-NEXT: pcmpgtd %xmm0, %xmm10
	; SSE41-NEXT: pshufd {{.*#+}} xmm11 = xmm10[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm11 = xmm10[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm1			; SSE41-NEXT: pcmpeqd %xmm0, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]
	; SSE41-NEXT: pand %xmm11, %xmm1			; SSE41-NEXT: pand %xmm11, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm10[1,1,3,3]			; SSE41-NEXT: por %xmm10, %xmm0
	; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm7			; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm7
	; SSE41-NEXT: movdqa %xmm4, %xmm0			; SSE41-NEXT: movdqa %xmm4, %xmm1
	; SSE41-NEXT: pxor %xmm9, %xmm0
	; SSE41-NEXT: movdqa %xmm8, %xmm1
	; SSE41-NEXT: pxor %xmm9, %xmm1			; SSE41-NEXT: pxor %xmm9, %xmm1
	; SSE41-NEXT: movdqa %xmm1, %xmm3			; SSE41-NEXT: movdqa %xmm8, %xmm3
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm3			; SSE41-NEXT: pxor %xmm9, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm10 = xmm3[0,0,2,2]			; SSE41-NEXT: movdqa %xmm3, %xmm0
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm1			; SSE41-NEXT: pcmpgtd %xmm1, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm10 = xmm0[0,0,2,2]
				; SSE41-NEXT: pcmpeqd %xmm1, %xmm3
				; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm3[1,1,3,3]
	; SSE41-NEXT: pand %xmm10, %xmm1			; SSE41-NEXT: pand %xmm10, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[1,1,3,3]
	; SSE41-NEXT: por %xmm1, %xmm0			; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm4			; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm4
	; SSE41-NEXT: movdqa %xmm6, %xmm0			; SSE41-NEXT: movdqa %xmm6, %xmm0
	; SSE41-NEXT: pxor %xmm9, %xmm0			; SSE41-NEXT: pxor %xmm9, %xmm0
	; SSE41-NEXT: movdqa %xmm2, %xmm1			; SSE41-NEXT: movdqa %xmm2, %xmm1
	; SSE41-NEXT: pxor %xmm9, %xmm1			; SSE41-NEXT: pxor %xmm9, %xmm1
	; SSE41-NEXT: movdqa %xmm1, %xmm3			; SSE41-NEXT: movdqa %xmm1, %xmm3
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm3			; SSE41-NEXT: pcmpgtd %xmm0, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm8 = xmm3[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm8 = xmm3[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm1			; SSE41-NEXT: pcmpeqd %xmm0, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]
	; SSE41-NEXT: pand %xmm8, %xmm1			; SSE41-NEXT: pand %xmm8, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[1,1,3,3]			; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm6			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm6
	; SSE41-NEXT: movapd %xmm6, %xmm0			; SSE41-NEXT: movapd %xmm6, %xmm0
	; SSE41-NEXT: xorpd %xmm9, %xmm0			; SSE41-NEXT: xorpd %xmm9, %xmm0
	; SSE41-NEXT: movapd %xmm4, %xmm1			; SSE41-NEXT: movapd %xmm4, %xmm1
	; SSE41-NEXT: xorpd %xmm9, %xmm1			; SSE41-NEXT: xorpd %xmm9, %xmm1
	; SSE41-NEXT: movapd %xmm1, %xmm2			; SSE41-NEXT: movapd %xmm1, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm2			; SSE41-NEXT: pcmpgtd %xmm0, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm1			; SSE41-NEXT: pcmpeqd %xmm0, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]
	; SSE41-NEXT: pand %xmm3, %xmm1			; SSE41-NEXT: pand %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm6			; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm6
	; SSE41-NEXT: movapd %xmm7, %xmm0			; SSE41-NEXT: movapd %xmm7, %xmm0
	; SSE41-NEXT: xorpd %xmm9, %xmm0			; SSE41-NEXT: xorpd %xmm9, %xmm0
	; SSE41-NEXT: movapd %xmm5, %xmm1			; SSE41-NEXT: movapd %xmm5, %xmm1
	; SSE41-NEXT: xorpd %xmm9, %xmm1			; SSE41-NEXT: xorpd %xmm9, %xmm1
	; SSE41-NEXT: movapd %xmm1, %xmm2			; SSE41-NEXT: movapd %xmm1, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm2			; SSE41-NEXT: pcmpgtd %xmm0, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm1			; SSE41-NEXT: pcmpeqd %xmm0, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]
	; SSE41-NEXT: pand %xmm3, %xmm1			; SSE41-NEXT: pand %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm5, %xmm7			; SSE41-NEXT: blendvpd %xmm0, %xmm5, %xmm7
	; SSE41-NEXT: movapd %xmm7, %xmm0			; SSE41-NEXT: movapd %xmm7, %xmm0
	; SSE41-NEXT: xorpd %xmm9, %xmm0			; SSE41-NEXT: xorpd %xmm9, %xmm0
	; SSE41-NEXT: movapd %xmm6, %xmm1			; SSE41-NEXT: movapd %xmm6, %xmm1
	; SSE41-NEXT: xorpd %xmm9, %xmm1			; SSE41-NEXT: xorpd %xmm9, %xmm1
	; SSE41-NEXT: movapd %xmm1, %xmm2			; SSE41-NEXT: movapd %xmm1, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm2			; SSE41-NEXT: pcmpgtd %xmm0, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm1			; SSE41-NEXT: pcmpeqd %xmm0, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]
	; SSE41-NEXT: pand %xmm3, %xmm1			; SSE41-NEXT: pand %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm6, %xmm7			; SSE41-NEXT: blendvpd %xmm0, %xmm6, %xmm7
	; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm7[2,3,0,1]			; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm7[2,3,0,1]
	; SSE41-NEXT: movdqa %xmm7, %xmm0			; SSE41-NEXT: movdqa %xmm7, %xmm0
	; SSE41-NEXT: pxor %xmm9, %xmm0			; SSE41-NEXT: pxor %xmm9, %xmm0
	; SSE41-NEXT: pxor %xmm1, %xmm9			; SSE41-NEXT: pxor %xmm1, %xmm9
	; SSE41-NEXT: movdqa %xmm0, %xmm2			; SSE41-NEXT: movdqa %xmm0, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm9, %xmm2			; SSE41-NEXT: pcmpgtd %xmm9, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm9			; SSE41-NEXT: pcmpeqd %xmm0, %xmm9
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm9[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm9[1,1,3,3]
	; SSE41-NEXT: pand %xmm3, %xmm4			; SSE41-NEXT: pand %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm7, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm7, %xmm1
	; SSE41-NEXT: movq %xmm1, %rax			; SSE41-NEXT: movq %xmm1, %rax
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: test_v16i64:			; AVX1-LABEL: test_v16i64:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm2, %xmm4			; AVX1-NEXT: vextractf128 $1, %ymm2, %xmm4
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5
	▲ Show 20 Lines • Show All 108 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: movdqa {{.*#+}} xmm0 = [2147483648,2147483648]			; SSE41-NEXT: movdqa {{.*#+}} xmm0 = [2147483648,2147483648]
	; SSE41-NEXT: movdqa %xmm3, %xmm2			; SSE41-NEXT: movdqa %xmm3, %xmm2
	; SSE41-NEXT: pxor %xmm0, %xmm2			; SSE41-NEXT: pxor %xmm0, %xmm2
	; SSE41-NEXT: pxor %xmm1, %xmm0			; SSE41-NEXT: pxor %xmm1, %xmm0
	; SSE41-NEXT: movdqa %xmm0, %xmm4			; SSE41-NEXT: movdqa %xmm0, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm2, %xmm4			; SSE41-NEXT: pcmpgtd %xmm2, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm2, %xmm0			; SSE41-NEXT: pcmpeqd %xmm2, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm5, %xmm2			; SSE41-NEXT: pand %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm3			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm3
	; SSE41-NEXT: movd %xmm3, %eax			; SSE41-NEXT: movd %xmm3, %eax
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: test_v2i32:			; AVX1-LABEL: test_v2i32:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vpsllq $32, %xmm0, %xmm1			; AVX1-NEXT: vpsllq $32, %xmm0, %xmm1
	; AVX1-NEXT: vpsrad $31, %xmm1, %xmm1			; AVX1-NEXT: vpsrad $31, %xmm1, %xmm1
	▲ Show 20 Lines • Show All 438 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: movdqa {{.*#+}} xmm0 = [2147483648,2147483648]			; SSE41-NEXT: movdqa {{.*#+}} xmm0 = [2147483648,2147483648]
	; SSE41-NEXT: movdqa %xmm3, %xmm2			; SSE41-NEXT: movdqa %xmm3, %xmm2
	; SSE41-NEXT: pxor %xmm0, %xmm2			; SSE41-NEXT: pxor %xmm0, %xmm2
	; SSE41-NEXT: pxor %xmm1, %xmm0			; SSE41-NEXT: pxor %xmm1, %xmm0
	; SSE41-NEXT: movdqa %xmm2, %xmm4			; SSE41-NEXT: movdqa %xmm2, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm4			; SSE41-NEXT: pcmpgtd %xmm0, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm2, %xmm0			; SSE41-NEXT: pcmpeqd %xmm2, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm5, %xmm2			; SSE41-NEXT: pand %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm1
	; SSE41-NEXT: movd %xmm1, %eax			; SSE41-NEXT: movd %xmm1, %eax
	; SSE41-NEXT: # kill: def $ax killed $ax killed $eax			; SSE41-NEXT: # kill: def $ax killed $ax killed $eax
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: test_v2i16:			; AVX1-LABEL: test_v2i16:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vpsllq $48, %xmm0, %xmm1			; AVX1-NEXT: vpsllq $48, %xmm0, %xmm1
	▲ Show 20 Lines • Show All 483 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: movdqa {{.*#+}} xmm0 = [2147483648,2147483648]			; SSE41-NEXT: movdqa {{.*#+}} xmm0 = [2147483648,2147483648]
	; SSE41-NEXT: movdqa %xmm3, %xmm2			; SSE41-NEXT: movdqa %xmm3, %xmm2
	; SSE41-NEXT: pxor %xmm0, %xmm2			; SSE41-NEXT: pxor %xmm0, %xmm2
	; SSE41-NEXT: pxor %xmm1, %xmm0			; SSE41-NEXT: pxor %xmm1, %xmm0
	; SSE41-NEXT: movdqa %xmm2, %xmm4			; SSE41-NEXT: movdqa %xmm2, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm4			; SSE41-NEXT: pcmpgtd %xmm0, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm2, %xmm0			; SSE41-NEXT: pcmpeqd %xmm2, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm5, %xmm2			; SSE41-NEXT: pand %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm1
	; SSE41-NEXT: pextrb $0, %xmm1, %eax			; SSE41-NEXT: pextrb $0, %xmm1, %eax
	; SSE41-NEXT: # kill: def $al killed $al killed $eax			; SSE41-NEXT: # kill: def $al killed $al killed $eax
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: test_v2i8:			; AVX1-LABEL: test_v2i8:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vpsllq $56, %xmm0, %xmm1			; AVX1-NEXT: vpsllq $56, %xmm0, %xmm1
	▲ Show 20 Lines • Show All 692 Lines • Show Last 20 Lines

llvm/trunk/test/CodeGen/X86/vector-reduce-smin-widen.ll

	Show All 38 Lines
	; SSE41-NEXT: movdqa {{.*#+}} xmm0 = [2147483648,2147483648]			; SSE41-NEXT: movdqa {{.*#+}} xmm0 = [2147483648,2147483648]
	; SSE41-NEXT: movdqa %xmm1, %xmm3			; SSE41-NEXT: movdqa %xmm1, %xmm3
	; SSE41-NEXT: pxor %xmm0, %xmm3			; SSE41-NEXT: pxor %xmm0, %xmm3
	; SSE41-NEXT: pxor %xmm2, %xmm0			; SSE41-NEXT: pxor %xmm2, %xmm0
	; SSE41-NEXT: movdqa %xmm0, %xmm4			; SSE41-NEXT: movdqa %xmm0, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm3, %xmm4			; SSE41-NEXT: pcmpgtd %xmm3, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm3, %xmm0			; SSE41-NEXT: pcmpeqd %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm5, %xmm3			; SSE41-NEXT: pand %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm2
	; SSE41-NEXT: movq %xmm2, %rax			; SSE41-NEXT: movq %xmm2, %rax
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX-LABEL: test_v2i64:			; AVX-LABEL: test_v2i64:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]			; AVX-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2			; AVX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2
	▲ Show 20 Lines • Show All 63 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: movdqa {{.*#+}} xmm3 = [2147483648,2147483648]			; SSE41-NEXT: movdqa {{.*#+}} xmm3 = [2147483648,2147483648]
	; SSE41-NEXT: pxor %xmm3, %xmm0			; SSE41-NEXT: pxor %xmm3, %xmm0
	; SSE41-NEXT: movdqa %xmm1, %xmm4			; SSE41-NEXT: movdqa %xmm1, %xmm4
	; SSE41-NEXT: pxor %xmm3, %xmm4			; SSE41-NEXT: pxor %xmm3, %xmm4
	; SSE41-NEXT: movdqa %xmm4, %xmm5			; SSE41-NEXT: movdqa %xmm4, %xmm5
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm5			; SSE41-NEXT: pcmpgtd %xmm0, %xmm5
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm5[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm5[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm4			; SSE41-NEXT: pcmpeqd %xmm0, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm4[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]
	; SSE41-NEXT: pand %xmm6, %xmm4			; SSE41-NEXT: pand %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm5[1,1,3,3]			; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm1[2,3,0,1]			; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm1[2,3,0,1]
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: pxor %xmm3, %xmm0			; SSE41-NEXT: pxor %xmm3, %xmm0
	; SSE41-NEXT: pxor %xmm2, %xmm3			; SSE41-NEXT: pxor %xmm2, %xmm3
	; SSE41-NEXT: movdqa %xmm3, %xmm4			; SSE41-NEXT: movdqa %xmm3, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm4			; SSE41-NEXT: pcmpgtd %xmm0, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm3			; SSE41-NEXT: pcmpeqd %xmm0, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm3[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[1,1,3,3]
	; SSE41-NEXT: pand %xmm5, %xmm3			; SSE41-NEXT: pand %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm2
	; SSE41-NEXT: movq %xmm2, %rax			; SSE41-NEXT: movq %xmm2, %rax
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: test_v4i64:			; AVX1-LABEL: test_v4i64:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1
	; AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm2
	▲ Show 20 Lines • Show All 117 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: pxor %xmm5, %xmm0			; SSE41-NEXT: pxor %xmm5, %xmm0
	; SSE41-NEXT: movdqa %xmm3, %xmm6			; SSE41-NEXT: movdqa %xmm3, %xmm6
	; SSE41-NEXT: pxor %xmm5, %xmm6			; SSE41-NEXT: pxor %xmm5, %xmm6
	; SSE41-NEXT: movdqa %xmm6, %xmm7			; SSE41-NEXT: movdqa %xmm6, %xmm7
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm7			; SSE41-NEXT: pcmpgtd %xmm0, %xmm7
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm7[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm7[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm6			; SSE41-NEXT: pcmpeqd %xmm0, %xmm6
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm6[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm6[1,1,3,3]
	; SSE41-NEXT: pand %xmm4, %xmm6			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm7[1,1,3,3]			; SSE41-NEXT: por %xmm7, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm3			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm3
	; SSE41-NEXT: movdqa %xmm8, %xmm0			; SSE41-NEXT: movdqa %xmm8, %xmm0
	; SSE41-NEXT: pxor %xmm5, %xmm0			; SSE41-NEXT: pxor %xmm5, %xmm0
	; SSE41-NEXT: movdqa %xmm2, %xmm1			; SSE41-NEXT: movdqa %xmm2, %xmm1
	; SSE41-NEXT: pxor %xmm5, %xmm1			; SSE41-NEXT: pxor %xmm5, %xmm1
	; SSE41-NEXT: movdqa %xmm1, %xmm4			; SSE41-NEXT: movdqa %xmm1, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm4			; SSE41-NEXT: pcmpgtd %xmm0, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm1			; SSE41-NEXT: pcmpeqd %xmm0, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]
	; SSE41-NEXT: pand %xmm6, %xmm1			; SSE41-NEXT: pand %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm2
	; SSE41-NEXT: movapd %xmm2, %xmm0			; SSE41-NEXT: movapd %xmm2, %xmm0
	; SSE41-NEXT: xorpd %xmm5, %xmm0			; SSE41-NEXT: xorpd %xmm5, %xmm0
	; SSE41-NEXT: movapd %xmm3, %xmm1			; SSE41-NEXT: movapd %xmm3, %xmm1
	; SSE41-NEXT: xorpd %xmm5, %xmm1			; SSE41-NEXT: xorpd %xmm5, %xmm1
	; SSE41-NEXT: movapd %xmm1, %xmm4			; SSE41-NEXT: movapd %xmm1, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm4			; SSE41-NEXT: pcmpgtd %xmm0, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm1			; SSE41-NEXT: pcmpeqd %xmm0, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]
	; SSE41-NEXT: pand %xmm6, %xmm1			; SSE41-NEXT: pand %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm3			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm3[2,3,0,1]			; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm3[2,3,0,1]
	; SSE41-NEXT: movdqa %xmm3, %xmm0			; SSE41-NEXT: movdqa %xmm3, %xmm0
	; SSE41-NEXT: pxor %xmm5, %xmm0			; SSE41-NEXT: pxor %xmm5, %xmm0
	; SSE41-NEXT: pxor %xmm1, %xmm5			; SSE41-NEXT: pxor %xmm1, %xmm5
	; SSE41-NEXT: movdqa %xmm5, %xmm2			; SSE41-NEXT: movdqa %xmm5, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm2			; SSE41-NEXT: pcmpgtd %xmm0, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm5			; SSE41-NEXT: pcmpeqd %xmm0, %xmm5
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm5[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm5[1,1,3,3]
	; SSE41-NEXT: pand %xmm4, %xmm5			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm1
	; SSE41-NEXT: movq %xmm1, %rax			; SSE41-NEXT: movq %xmm1, %rax
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: test_v8i64:			; AVX1-LABEL: test_v8i64:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3			; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3
	▲ Show 20 Lines • Show All 176 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: movdqa %xmm2, %xmm10			; SSE41-NEXT: movdqa %xmm2, %xmm10
	; SSE41-NEXT: pxor %xmm9, %xmm10			; SSE41-NEXT: pxor %xmm9, %xmm10
	; SSE41-NEXT: movdqa %xmm6, %xmm0			; SSE41-NEXT: movdqa %xmm6, %xmm0
	; SSE41-NEXT: pxor %xmm9, %xmm0			; SSE41-NEXT: pxor %xmm9, %xmm0
	; SSE41-NEXT: movdqa %xmm0, %xmm11			; SSE41-NEXT: movdqa %xmm0, %xmm11
	; SSE41-NEXT: pcmpgtd %xmm10, %xmm11			; SSE41-NEXT: pcmpgtd %xmm10, %xmm11
	; SSE41-NEXT: pshufd {{.*#+}} xmm12 = xmm11[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm12 = xmm11[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm10, %xmm0			; SSE41-NEXT: pcmpeqd %xmm10, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm10 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm12, %xmm10			; SSE41-NEXT: pand %xmm12, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm11[1,1,3,3]			; SSE41-NEXT: por %xmm11, %xmm0
	; SSE41-NEXT: por %xmm10, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm6			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm6
	; SSE41-NEXT: movdqa %xmm8, %xmm0			; SSE41-NEXT: movdqa %xmm8, %xmm0
	; SSE41-NEXT: pxor %xmm9, %xmm0			; SSE41-NEXT: pxor %xmm9, %xmm0
	; SSE41-NEXT: movdqa %xmm4, %xmm2			; SSE41-NEXT: movdqa %xmm4, %xmm2
	; SSE41-NEXT: pxor %xmm9, %xmm2			; SSE41-NEXT: pxor %xmm9, %xmm2
	; SSE41-NEXT: movdqa %xmm2, %xmm10			; SSE41-NEXT: movdqa %xmm2, %xmm10
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm10			; SSE41-NEXT: pcmpgtd %xmm0, %xmm10
	; SSE41-NEXT: pshufd {{.*#+}} xmm11 = xmm10[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm11 = xmm10[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm2			; SSE41-NEXT: pcmpeqd %xmm0, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm2[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]
	; SSE41-NEXT: pand %xmm11, %xmm2			; SSE41-NEXT: pand %xmm11, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm10[1,1,3,3]			; SSE41-NEXT: por %xmm10, %xmm0
	; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm4			; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm4
	; SSE41-NEXT: movdqa %xmm3, %xmm0			; SSE41-NEXT: movdqa %xmm3, %xmm0
	; SSE41-NEXT: pxor %xmm9, %xmm0			; SSE41-NEXT: pxor %xmm9, %xmm0
	; SSE41-NEXT: movdqa %xmm7, %xmm2			; SSE41-NEXT: movdqa %xmm7, %xmm2
	; SSE41-NEXT: pxor %xmm9, %xmm2			; SSE41-NEXT: pxor %xmm9, %xmm2
	; SSE41-NEXT: movdqa %xmm2, %xmm8			; SSE41-NEXT: movdqa %xmm2, %xmm8
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm8			; SSE41-NEXT: pcmpgtd %xmm0, %xmm8
	; SSE41-NEXT: pshufd {{.*#+}} xmm10 = xmm8[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm10 = xmm8[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm2			; SSE41-NEXT: pcmpeqd %xmm0, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm2[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]
	; SSE41-NEXT: pand %xmm10, %xmm2			; SSE41-NEXT: pand %xmm10, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm8[1,1,3,3]			; SSE41-NEXT: por %xmm8, %xmm0
	; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm7			; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm7
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: pxor %xmm9, %xmm0			; SSE41-NEXT: pxor %xmm9, %xmm0
	; SSE41-NEXT: movdqa %xmm5, %xmm2			; SSE41-NEXT: movdqa %xmm5, %xmm2
	; SSE41-NEXT: pxor %xmm9, %xmm2			; SSE41-NEXT: pxor %xmm9, %xmm2
	; SSE41-NEXT: movdqa %xmm2, %xmm3			; SSE41-NEXT: movdqa %xmm2, %xmm3
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm3			; SSE41-NEXT: pcmpgtd %xmm0, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm8 = xmm3[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm8 = xmm3[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm2			; SSE41-NEXT: pcmpeqd %xmm0, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm2[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]
	; SSE41-NEXT: pand %xmm8, %xmm2			; SSE41-NEXT: pand %xmm8, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[1,1,3,3]			; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm5			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm5
	; SSE41-NEXT: movapd %xmm5, %xmm0			; SSE41-NEXT: movapd %xmm5, %xmm0
	; SSE41-NEXT: xorpd %xmm9, %xmm0			; SSE41-NEXT: xorpd %xmm9, %xmm0
	; SSE41-NEXT: movapd %xmm7, %xmm1			; SSE41-NEXT: movapd %xmm7, %xmm1
	; SSE41-NEXT: xorpd %xmm9, %xmm1			; SSE41-NEXT: xorpd %xmm9, %xmm1
	; SSE41-NEXT: movapd %xmm1, %xmm2			; SSE41-NEXT: movapd %xmm1, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm2			; SSE41-NEXT: pcmpgtd %xmm0, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm1			; SSE41-NEXT: pcmpeqd %xmm0, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]
	; SSE41-NEXT: pand %xmm3, %xmm1			; SSE41-NEXT: pand %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm5, %xmm7			; SSE41-NEXT: blendvpd %xmm0, %xmm5, %xmm7
	; SSE41-NEXT: movapd %xmm4, %xmm0			; SSE41-NEXT: movapd %xmm4, %xmm0
	; SSE41-NEXT: xorpd %xmm9, %xmm0			; SSE41-NEXT: xorpd %xmm9, %xmm0
	; SSE41-NEXT: movapd %xmm6, %xmm1			; SSE41-NEXT: movapd %xmm6, %xmm1
	; SSE41-NEXT: xorpd %xmm9, %xmm1			; SSE41-NEXT: xorpd %xmm9, %xmm1
	; SSE41-NEXT: movapd %xmm1, %xmm2			; SSE41-NEXT: movapd %xmm1, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm2			; SSE41-NEXT: pcmpgtd %xmm0, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm1			; SSE41-NEXT: pcmpeqd %xmm0, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]
	; SSE41-NEXT: pand %xmm3, %xmm1			; SSE41-NEXT: pand %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm6			; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm6
	; SSE41-NEXT: movapd %xmm6, %xmm0			; SSE41-NEXT: movapd %xmm6, %xmm0
	; SSE41-NEXT: xorpd %xmm9, %xmm0			; SSE41-NEXT: xorpd %xmm9, %xmm0
	; SSE41-NEXT: movapd %xmm7, %xmm1			; SSE41-NEXT: movapd %xmm7, %xmm1
	; SSE41-NEXT: xorpd %xmm9, %xmm1			; SSE41-NEXT: xorpd %xmm9, %xmm1
	; SSE41-NEXT: movapd %xmm1, %xmm2			; SSE41-NEXT: movapd %xmm1, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm2			; SSE41-NEXT: pcmpgtd %xmm0, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm1			; SSE41-NEXT: pcmpeqd %xmm0, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]
	; SSE41-NEXT: pand %xmm3, %xmm1			; SSE41-NEXT: pand %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm6, %xmm7			; SSE41-NEXT: blendvpd %xmm0, %xmm6, %xmm7
	; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm7[2,3,0,1]			; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm7[2,3,0,1]
	; SSE41-NEXT: movdqa %xmm7, %xmm0			; SSE41-NEXT: movdqa %xmm7, %xmm0
	; SSE41-NEXT: pxor %xmm9, %xmm0			; SSE41-NEXT: pxor %xmm9, %xmm0
	; SSE41-NEXT: pxor %xmm1, %xmm9			; SSE41-NEXT: pxor %xmm1, %xmm9
	; SSE41-NEXT: movdqa %xmm9, %xmm2			; SSE41-NEXT: movdqa %xmm9, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm2			; SSE41-NEXT: pcmpgtd %xmm0, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm9			; SSE41-NEXT: pcmpeqd %xmm0, %xmm9
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm9[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm9[1,1,3,3]
	; SSE41-NEXT: pand %xmm3, %xmm4			; SSE41-NEXT: pand %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm7, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm7, %xmm1
	; SSE41-NEXT: movq %xmm1, %rax			; SSE41-NEXT: movq %xmm1, %rax
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: test_v16i64:			; AVX1-LABEL: test_v16i64:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm4			; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm4
	; AVX1-NEXT: vextractf128 $1, %ymm3, %xmm5			; AVX1-NEXT: vextractf128 $1, %ymm3, %xmm5
	▲ Show 20 Lines • Show All 1,428 Lines • Show Last 20 Lines

llvm/trunk/test/CodeGen/X86/vector-reduce-smin.ll

	Show All 38 Lines
	; SSE41-NEXT: movdqa {{.*#+}} xmm0 = [2147483648,2147483648]			; SSE41-NEXT: movdqa {{.*#+}} xmm0 = [2147483648,2147483648]
	; SSE41-NEXT: movdqa %xmm1, %xmm3			; SSE41-NEXT: movdqa %xmm1, %xmm3
	; SSE41-NEXT: pxor %xmm0, %xmm3			; SSE41-NEXT: pxor %xmm0, %xmm3
	; SSE41-NEXT: pxor %xmm2, %xmm0			; SSE41-NEXT: pxor %xmm2, %xmm0
	; SSE41-NEXT: movdqa %xmm0, %xmm4			; SSE41-NEXT: movdqa %xmm0, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm3, %xmm4			; SSE41-NEXT: pcmpgtd %xmm3, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm3, %xmm0			; SSE41-NEXT: pcmpeqd %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm5, %xmm3			; SSE41-NEXT: pand %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm2
	; SSE41-NEXT: movq %xmm2, %rax			; SSE41-NEXT: movq %xmm2, %rax
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX-LABEL: test_v2i64:			; AVX-LABEL: test_v2i64:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]			; AVX-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2			; AVX-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2
	▲ Show 20 Lines • Show All 63 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: movdqa {{.*#+}} xmm3 = [2147483648,2147483648]			; SSE41-NEXT: movdqa {{.*#+}} xmm3 = [2147483648,2147483648]
	; SSE41-NEXT: pxor %xmm3, %xmm0			; SSE41-NEXT: pxor %xmm3, %xmm0
	; SSE41-NEXT: movdqa %xmm1, %xmm4			; SSE41-NEXT: movdqa %xmm1, %xmm4
	; SSE41-NEXT: pxor %xmm3, %xmm4			; SSE41-NEXT: pxor %xmm3, %xmm4
	; SSE41-NEXT: movdqa %xmm4, %xmm5			; SSE41-NEXT: movdqa %xmm4, %xmm5
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm5			; SSE41-NEXT: pcmpgtd %xmm0, %xmm5
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm5[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm5[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm4			; SSE41-NEXT: pcmpeqd %xmm0, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm4[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]
	; SSE41-NEXT: pand %xmm6, %xmm4			; SSE41-NEXT: pand %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm5[1,1,3,3]			; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm1[2,3,0,1]			; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm1[2,3,0,1]
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: pxor %xmm3, %xmm0			; SSE41-NEXT: pxor %xmm3, %xmm0
	; SSE41-NEXT: pxor %xmm2, %xmm3			; SSE41-NEXT: pxor %xmm2, %xmm3
	; SSE41-NEXT: movdqa %xmm3, %xmm4			; SSE41-NEXT: movdqa %xmm3, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm4			; SSE41-NEXT: pcmpgtd %xmm0, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm3			; SSE41-NEXT: pcmpeqd %xmm0, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm3[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[1,1,3,3]
	; SSE41-NEXT: pand %xmm5, %xmm3			; SSE41-NEXT: pand %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm2
	; SSE41-NEXT: movq %xmm2, %rax			; SSE41-NEXT: movq %xmm2, %rax
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: test_v4i64:			; AVX1-LABEL: test_v4i64:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1
	; AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm2
	▲ Show 20 Lines • Show All 117 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: pxor %xmm5, %xmm0			; SSE41-NEXT: pxor %xmm5, %xmm0
	; SSE41-NEXT: movdqa %xmm3, %xmm6			; SSE41-NEXT: movdqa %xmm3, %xmm6
	; SSE41-NEXT: pxor %xmm5, %xmm6			; SSE41-NEXT: pxor %xmm5, %xmm6
	; SSE41-NEXT: movdqa %xmm6, %xmm7			; SSE41-NEXT: movdqa %xmm6, %xmm7
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm7			; SSE41-NEXT: pcmpgtd %xmm0, %xmm7
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm7[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm7[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm6			; SSE41-NEXT: pcmpeqd %xmm0, %xmm6
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm6[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm6[1,1,3,3]
	; SSE41-NEXT: pand %xmm4, %xmm6			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm7[1,1,3,3]			; SSE41-NEXT: por %xmm7, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm3			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm3
	; SSE41-NEXT: movdqa %xmm8, %xmm0			; SSE41-NEXT: movdqa %xmm8, %xmm0
	; SSE41-NEXT: pxor %xmm5, %xmm0			; SSE41-NEXT: pxor %xmm5, %xmm0
	; SSE41-NEXT: movdqa %xmm2, %xmm1			; SSE41-NEXT: movdqa %xmm2, %xmm1
	; SSE41-NEXT: pxor %xmm5, %xmm1			; SSE41-NEXT: pxor %xmm5, %xmm1
	; SSE41-NEXT: movdqa %xmm1, %xmm4			; SSE41-NEXT: movdqa %xmm1, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm4			; SSE41-NEXT: pcmpgtd %xmm0, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm1			; SSE41-NEXT: pcmpeqd %xmm0, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]
	; SSE41-NEXT: pand %xmm6, %xmm1			; SSE41-NEXT: pand %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm2
	; SSE41-NEXT: movapd %xmm2, %xmm0			; SSE41-NEXT: movapd %xmm2, %xmm0
	; SSE41-NEXT: xorpd %xmm5, %xmm0			; SSE41-NEXT: xorpd %xmm5, %xmm0
	; SSE41-NEXT: movapd %xmm3, %xmm1			; SSE41-NEXT: movapd %xmm3, %xmm1
	; SSE41-NEXT: xorpd %xmm5, %xmm1			; SSE41-NEXT: xorpd %xmm5, %xmm1
	; SSE41-NEXT: movapd %xmm1, %xmm4			; SSE41-NEXT: movapd %xmm1, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm4			; SSE41-NEXT: pcmpgtd %xmm0, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm1			; SSE41-NEXT: pcmpeqd %xmm0, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]
	; SSE41-NEXT: pand %xmm6, %xmm1			; SSE41-NEXT: pand %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm3			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm3[2,3,0,1]			; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm3[2,3,0,1]
	; SSE41-NEXT: movdqa %xmm3, %xmm0			; SSE41-NEXT: movdqa %xmm3, %xmm0
	; SSE41-NEXT: pxor %xmm5, %xmm0			; SSE41-NEXT: pxor %xmm5, %xmm0
	; SSE41-NEXT: pxor %xmm1, %xmm5			; SSE41-NEXT: pxor %xmm1, %xmm5
	; SSE41-NEXT: movdqa %xmm5, %xmm2			; SSE41-NEXT: movdqa %xmm5, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm2			; SSE41-NEXT: pcmpgtd %xmm0, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm5			; SSE41-NEXT: pcmpeqd %xmm0, %xmm5
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm5[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm5[1,1,3,3]
	; SSE41-NEXT: pand %xmm4, %xmm5			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm1
	; SSE41-NEXT: movq %xmm1, %rax			; SSE41-NEXT: movq %xmm1, %rax
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: test_v8i64:			; AVX1-LABEL: test_v8i64:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3			; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3
	▲ Show 20 Lines • Show All 176 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: movdqa %xmm2, %xmm10			; SSE41-NEXT: movdqa %xmm2, %xmm10
	; SSE41-NEXT: pxor %xmm9, %xmm10			; SSE41-NEXT: pxor %xmm9, %xmm10
	; SSE41-NEXT: movdqa %xmm6, %xmm0			; SSE41-NEXT: movdqa %xmm6, %xmm0
	; SSE41-NEXT: pxor %xmm9, %xmm0			; SSE41-NEXT: pxor %xmm9, %xmm0
	; SSE41-NEXT: movdqa %xmm0, %xmm11			; SSE41-NEXT: movdqa %xmm0, %xmm11
	; SSE41-NEXT: pcmpgtd %xmm10, %xmm11			; SSE41-NEXT: pcmpgtd %xmm10, %xmm11
	; SSE41-NEXT: pshufd {{.*#+}} xmm12 = xmm11[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm12 = xmm11[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm10, %xmm0			; SSE41-NEXT: pcmpeqd %xmm10, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm10 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm12, %xmm10			; SSE41-NEXT: pand %xmm12, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm11[1,1,3,3]			; SSE41-NEXT: por %xmm11, %xmm0
	; SSE41-NEXT: por %xmm10, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm6			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm6
	; SSE41-NEXT: movdqa %xmm8, %xmm0			; SSE41-NEXT: movdqa %xmm8, %xmm0
	; SSE41-NEXT: pxor %xmm9, %xmm0			; SSE41-NEXT: pxor %xmm9, %xmm0
	; SSE41-NEXT: movdqa %xmm4, %xmm2			; SSE41-NEXT: movdqa %xmm4, %xmm2
	; SSE41-NEXT: pxor %xmm9, %xmm2			; SSE41-NEXT: pxor %xmm9, %xmm2
	; SSE41-NEXT: movdqa %xmm2, %xmm10			; SSE41-NEXT: movdqa %xmm2, %xmm10
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm10			; SSE41-NEXT: pcmpgtd %xmm0, %xmm10
	; SSE41-NEXT: pshufd {{.*#+}} xmm11 = xmm10[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm11 = xmm10[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm2			; SSE41-NEXT: pcmpeqd %xmm0, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm2[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]
	; SSE41-NEXT: pand %xmm11, %xmm2			; SSE41-NEXT: pand %xmm11, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm10[1,1,3,3]			; SSE41-NEXT: por %xmm10, %xmm0
	; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm4			; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm4
	; SSE41-NEXT: movdqa %xmm3, %xmm0			; SSE41-NEXT: movdqa %xmm3, %xmm0
	; SSE41-NEXT: pxor %xmm9, %xmm0			; SSE41-NEXT: pxor %xmm9, %xmm0
	; SSE41-NEXT: movdqa %xmm7, %xmm2			; SSE41-NEXT: movdqa %xmm7, %xmm2
	; SSE41-NEXT: pxor %xmm9, %xmm2			; SSE41-NEXT: pxor %xmm9, %xmm2
	; SSE41-NEXT: movdqa %xmm2, %xmm8			; SSE41-NEXT: movdqa %xmm2, %xmm8
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm8			; SSE41-NEXT: pcmpgtd %xmm0, %xmm8
	; SSE41-NEXT: pshufd {{.*#+}} xmm10 = xmm8[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm10 = xmm8[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm2			; SSE41-NEXT: pcmpeqd %xmm0, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm2[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]
	; SSE41-NEXT: pand %xmm10, %xmm2			; SSE41-NEXT: pand %xmm10, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm8[1,1,3,3]			; SSE41-NEXT: por %xmm8, %xmm0
	; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm7			; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm7
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: pxor %xmm9, %xmm0			; SSE41-NEXT: pxor %xmm9, %xmm0
	; SSE41-NEXT: movdqa %xmm5, %xmm2			; SSE41-NEXT: movdqa %xmm5, %xmm2
	; SSE41-NEXT: pxor %xmm9, %xmm2			; SSE41-NEXT: pxor %xmm9, %xmm2
	; SSE41-NEXT: movdqa %xmm2, %xmm3			; SSE41-NEXT: movdqa %xmm2, %xmm3
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm3			; SSE41-NEXT: pcmpgtd %xmm0, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm8 = xmm3[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm8 = xmm3[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm2			; SSE41-NEXT: pcmpeqd %xmm0, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm2[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]
	; SSE41-NEXT: pand %xmm8, %xmm2			; SSE41-NEXT: pand %xmm8, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[1,1,3,3]			; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm5			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm5
	; SSE41-NEXT: movapd %xmm5, %xmm0			; SSE41-NEXT: movapd %xmm5, %xmm0
	; SSE41-NEXT: xorpd %xmm9, %xmm0			; SSE41-NEXT: xorpd %xmm9, %xmm0
	; SSE41-NEXT: movapd %xmm7, %xmm1			; SSE41-NEXT: movapd %xmm7, %xmm1
	; SSE41-NEXT: xorpd %xmm9, %xmm1			; SSE41-NEXT: xorpd %xmm9, %xmm1
	; SSE41-NEXT: movapd %xmm1, %xmm2			; SSE41-NEXT: movapd %xmm1, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm2			; SSE41-NEXT: pcmpgtd %xmm0, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm1			; SSE41-NEXT: pcmpeqd %xmm0, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]
	; SSE41-NEXT: pand %xmm3, %xmm1			; SSE41-NEXT: pand %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm5, %xmm7			; SSE41-NEXT: blendvpd %xmm0, %xmm5, %xmm7
	; SSE41-NEXT: movapd %xmm4, %xmm0			; SSE41-NEXT: movapd %xmm4, %xmm0
	; SSE41-NEXT: xorpd %xmm9, %xmm0			; SSE41-NEXT: xorpd %xmm9, %xmm0
	; SSE41-NEXT: movapd %xmm6, %xmm1			; SSE41-NEXT: movapd %xmm6, %xmm1
	; SSE41-NEXT: xorpd %xmm9, %xmm1			; SSE41-NEXT: xorpd %xmm9, %xmm1
	; SSE41-NEXT: movapd %xmm1, %xmm2			; SSE41-NEXT: movapd %xmm1, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm2			; SSE41-NEXT: pcmpgtd %xmm0, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm1			; SSE41-NEXT: pcmpeqd %xmm0, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]
	; SSE41-NEXT: pand %xmm3, %xmm1			; SSE41-NEXT: pand %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm6			; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm6
	; SSE41-NEXT: movapd %xmm6, %xmm0			; SSE41-NEXT: movapd %xmm6, %xmm0
	; SSE41-NEXT: xorpd %xmm9, %xmm0			; SSE41-NEXT: xorpd %xmm9, %xmm0
	; SSE41-NEXT: movapd %xmm7, %xmm1			; SSE41-NEXT: movapd %xmm7, %xmm1
	; SSE41-NEXT: xorpd %xmm9, %xmm1			; SSE41-NEXT: xorpd %xmm9, %xmm1
	; SSE41-NEXT: movapd %xmm1, %xmm2			; SSE41-NEXT: movapd %xmm1, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm2			; SSE41-NEXT: pcmpgtd %xmm0, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm1			; SSE41-NEXT: pcmpeqd %xmm0, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]
	; SSE41-NEXT: pand %xmm3, %xmm1			; SSE41-NEXT: pand %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm6, %xmm7			; SSE41-NEXT: blendvpd %xmm0, %xmm6, %xmm7
	; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm7[2,3,0,1]			; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm7[2,3,0,1]
	; SSE41-NEXT: movdqa %xmm7, %xmm0			; SSE41-NEXT: movdqa %xmm7, %xmm0
	; SSE41-NEXT: pxor %xmm9, %xmm0			; SSE41-NEXT: pxor %xmm9, %xmm0
	; SSE41-NEXT: pxor %xmm1, %xmm9			; SSE41-NEXT: pxor %xmm1, %xmm9
	; SSE41-NEXT: movdqa %xmm9, %xmm2			; SSE41-NEXT: movdqa %xmm9, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm2			; SSE41-NEXT: pcmpgtd %xmm0, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm9			; SSE41-NEXT: pcmpeqd %xmm0, %xmm9
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm9[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm9[1,1,3,3]
	; SSE41-NEXT: pand %xmm3, %xmm4			; SSE41-NEXT: pand %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm7, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm7, %xmm1
	; SSE41-NEXT: movq %xmm1, %rax			; SSE41-NEXT: movq %xmm1, %rax
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: test_v16i64:			; AVX1-LABEL: test_v16i64:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm4			; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm4
	; AVX1-NEXT: vextractf128 $1, %ymm3, %xmm5			; AVX1-NEXT: vextractf128 $1, %ymm3, %xmm5
	▲ Show 20 Lines • Show All 108 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: movdqa {{.*#+}} xmm0 = [2147483648,2147483648]			; SSE41-NEXT: movdqa {{.*#+}} xmm0 = [2147483648,2147483648]
	; SSE41-NEXT: movdqa %xmm1, %xmm2			; SSE41-NEXT: movdqa %xmm1, %xmm2
	; SSE41-NEXT: pxor %xmm0, %xmm2			; SSE41-NEXT: pxor %xmm0, %xmm2
	; SSE41-NEXT: pxor %xmm3, %xmm0			; SSE41-NEXT: pxor %xmm3, %xmm0
	; SSE41-NEXT: movdqa %xmm0, %xmm4			; SSE41-NEXT: movdqa %xmm0, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm2, %xmm4			; SSE41-NEXT: pcmpgtd %xmm2, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm2, %xmm0			; SSE41-NEXT: pcmpeqd %xmm2, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm5, %xmm2			; SSE41-NEXT: pand %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm3			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm3
	; SSE41-NEXT: movd %xmm3, %eax			; SSE41-NEXT: movd %xmm3, %eax
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: test_v2i32:			; AVX1-LABEL: test_v2i32:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vpsllq $32, %xmm0, %xmm1			; AVX1-NEXT: vpsllq $32, %xmm0, %xmm1
	; AVX1-NEXT: vpsrad $31, %xmm1, %xmm1			; AVX1-NEXT: vpsrad $31, %xmm1, %xmm1
	▲ Show 20 Lines • Show All 438 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: movdqa {{.*#+}} xmm0 = [2147483648,2147483648]			; SSE41-NEXT: movdqa {{.*#+}} xmm0 = [2147483648,2147483648]
	; SSE41-NEXT: movdqa %xmm3, %xmm2			; SSE41-NEXT: movdqa %xmm3, %xmm2
	; SSE41-NEXT: pxor %xmm0, %xmm2			; SSE41-NEXT: pxor %xmm0, %xmm2
	; SSE41-NEXT: pxor %xmm1, %xmm0			; SSE41-NEXT: pxor %xmm1, %xmm0
	; SSE41-NEXT: movdqa %xmm0, %xmm4			; SSE41-NEXT: movdqa %xmm0, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm2, %xmm4			; SSE41-NEXT: pcmpgtd %xmm2, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm2, %xmm0			; SSE41-NEXT: pcmpeqd %xmm2, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm5, %xmm2			; SSE41-NEXT: pand %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm1
	; SSE41-NEXT: movd %xmm1, %eax			; SSE41-NEXT: movd %xmm1, %eax
	; SSE41-NEXT: # kill: def $ax killed $ax killed $eax			; SSE41-NEXT: # kill: def $ax killed $ax killed $eax
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: test_v2i16:			; AVX1-LABEL: test_v2i16:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vpsllq $48, %xmm0, %xmm1			; AVX1-NEXT: vpsllq $48, %xmm0, %xmm1
	▲ Show 20 Lines • Show All 483 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: movdqa {{.*#+}} xmm0 = [2147483648,2147483648]			; SSE41-NEXT: movdqa {{.*#+}} xmm0 = [2147483648,2147483648]
	; SSE41-NEXT: movdqa %xmm3, %xmm2			; SSE41-NEXT: movdqa %xmm3, %xmm2
	; SSE41-NEXT: pxor %xmm0, %xmm2			; SSE41-NEXT: pxor %xmm0, %xmm2
	; SSE41-NEXT: pxor %xmm1, %xmm0			; SSE41-NEXT: pxor %xmm1, %xmm0
	; SSE41-NEXT: movdqa %xmm0, %xmm4			; SSE41-NEXT: movdqa %xmm0, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm2, %xmm4			; SSE41-NEXT: pcmpgtd %xmm2, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm2, %xmm0			; SSE41-NEXT: pcmpeqd %xmm2, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm5, %xmm2			; SSE41-NEXT: pand %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm1
	; SSE41-NEXT: pextrb $0, %xmm1, %eax			; SSE41-NEXT: pextrb $0, %xmm1, %eax
	; SSE41-NEXT: # kill: def $al killed $al killed $eax			; SSE41-NEXT: # kill: def $al killed $al killed $eax
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: test_v2i8:			; AVX1-LABEL: test_v2i8:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vpsllq $56, %xmm0, %xmm1			; AVX1-NEXT: vpsllq $56, %xmm0, %xmm1
	▲ Show 20 Lines • Show All 692 Lines • Show Last 20 Lines

llvm/trunk/test/CodeGen/X86/vector-reduce-umax-widen.ll

	Show All 30 Lines
	; SSE2-NEXT: por %xmm0, %xmm3			; SSE2-NEXT: por %xmm0, %xmm3
	; SSE2-NEXT: movq %xmm3, %rax			; SSE2-NEXT: movq %xmm3, %rax
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: test_v2i64:			; SSE41-LABEL: test_v2i64:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movdqa %xmm0, %xmm1			; SSE41-NEXT: movdqa %xmm0, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm0[2,3,0,1]			; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm0[2,3,0,1]
	; SSE41-NEXT: movdqa {{.*#+}} xmm0 = [9223372039002259456,9223372039002259456]			; SSE41-NEXT: movdqa {{.*#+}} xmm3 = [9223372039002259456,9223372039002259456]
	; SSE41-NEXT: movdqa %xmm1, %xmm3			; SSE41-NEXT: movdqa %xmm0, %xmm4
	; SSE41-NEXT: pxor %xmm0, %xmm3			; SSE41-NEXT: pxor %xmm3, %xmm4
	; SSE41-NEXT: pxor %xmm2, %xmm0			; SSE41-NEXT: pxor %xmm2, %xmm3
	; SSE41-NEXT: movdqa %xmm3, %xmm4			; SSE41-NEXT: movdqa %xmm4, %xmm0
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm4			; SSE41-NEXT: pcmpgtd %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm0[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm3, %xmm0			; SSE41-NEXT: pcmpeqd %xmm4, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm3[1,1,3,3]
	; SSE41-NEXT: pand %xmm5, %xmm3			; SSE41-NEXT: pand %xmm5, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]
	; SSE41-NEXT: por %xmm3, %xmm0			; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm2
	; SSE41-NEXT: movq %xmm2, %rax			; SSE41-NEXT: movq %xmm2, %rax
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX-LABEL: test_v2i64:			; AVX-LABEL: test_v2i64:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]			; AVX-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]
	▲ Show 20 Lines • Show All 60 Lines • ▼ Show 20 Lines
	; SSE2-NEXT: por %xmm4, %xmm2			; SSE2-NEXT: por %xmm4, %xmm2
	; SSE2-NEXT: movq %xmm2, %rax			; SSE2-NEXT: movq %xmm2, %rax
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: test_v4i64:			; SSE41-LABEL: test_v4i64:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movdqa %xmm0, %xmm2			; SSE41-NEXT: movdqa %xmm0, %xmm2
	; SSE41-NEXT: movdqa {{.*#+}} xmm3 = [9223372039002259456,9223372039002259456]			; SSE41-NEXT: movdqa {{.*#+}} xmm3 = [9223372039002259456,9223372039002259456]
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm4
	; SSE41-NEXT: pxor %xmm3, %xmm0
	; SSE41-NEXT: movdqa %xmm2, %xmm4
	; SSE41-NEXT: pxor %xmm3, %xmm4			; SSE41-NEXT: pxor %xmm3, %xmm4
	; SSE41-NEXT: movdqa %xmm4, %xmm5			; SSE41-NEXT: movdqa %xmm0, %xmm5
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm5			; SSE41-NEXT: pxor %xmm3, %xmm5
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm5[0,0,2,2]			; SSE41-NEXT: movdqa %xmm5, %xmm0
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm4			; SSE41-NEXT: pcmpgtd %xmm4, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm4[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm0[0,0,2,2]
				; SSE41-NEXT: pcmpeqd %xmm4, %xmm5
				; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm5[1,1,3,3]
	; SSE41-NEXT: pand %xmm6, %xmm4			; SSE41-NEXT: pand %xmm6, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm5[1,1,3,3]
	; SSE41-NEXT: por %xmm4, %xmm0			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm1[2,3,0,1]			; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm1[2,3,0,1]
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: pxor %xmm3, %xmm0			; SSE41-NEXT: pxor %xmm3, %xmm0
	; SSE41-NEXT: pxor %xmm2, %xmm3			; SSE41-NEXT: pxor %xmm2, %xmm3
	; SSE41-NEXT: movdqa %xmm0, %xmm4			; SSE41-NEXT: movdqa %xmm0, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm3, %xmm4			; SSE41-NEXT: pcmpgtd %xmm3, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm3			; SSE41-NEXT: pcmpeqd %xmm0, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm3[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[1,1,3,3]
	; SSE41-NEXT: pand %xmm5, %xmm3			; SSE41-NEXT: pand %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm2
	; SSE41-NEXT: movq %xmm2, %rax			; SSE41-NEXT: movq %xmm2, %rax
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: test_v4i64:			; AVX1-LABEL: test_v4i64:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
	▲ Show 20 Lines • Show All 119 Lines • ▼ Show 20 Lines
	; SSE2-NEXT: por %xmm1, %xmm3			; SSE2-NEXT: por %xmm1, %xmm3
	; SSE2-NEXT: movq %xmm3, %rax			; SSE2-NEXT: movq %xmm3, %rax
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: test_v8i64:			; SSE41-LABEL: test_v8i64:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movdqa %xmm0, %xmm4			; SSE41-NEXT: movdqa %xmm0, %xmm4
	; SSE41-NEXT: movdqa {{.*#+}} xmm5 = [9223372039002259456,9223372039002259456]			; SSE41-NEXT: movdqa {{.*#+}} xmm5 = [9223372039002259456,9223372039002259456]
	; SSE41-NEXT: movdqa %xmm2, %xmm0			; SSE41-NEXT: movdqa %xmm2, %xmm6
	; SSE41-NEXT: pxor %xmm5, %xmm0
	; SSE41-NEXT: movdqa %xmm4, %xmm6
	; SSE41-NEXT: pxor %xmm5, %xmm6			; SSE41-NEXT: pxor %xmm5, %xmm6
	; SSE41-NEXT: movdqa %xmm6, %xmm7			; SSE41-NEXT: movdqa %xmm0, %xmm7
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm7			; SSE41-NEXT: pxor %xmm5, %xmm7
	; SSE41-NEXT: pshufd {{.*#+}} xmm8 = xmm7[0,0,2,2]			; SSE41-NEXT: movdqa %xmm7, %xmm0
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm6			; SSE41-NEXT: pcmpgtd %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm6[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm8 = xmm0[0,0,2,2]
				; SSE41-NEXT: pcmpeqd %xmm6, %xmm7
				; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm7[1,1,3,3]
	; SSE41-NEXT: pand %xmm8, %xmm6			; SSE41-NEXT: pand %xmm8, %xmm6
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm7[1,1,3,3]
	; SSE41-NEXT: por %xmm6, %xmm0			; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm2
	; SSE41-NEXT: movdqa %xmm3, %xmm0			; SSE41-NEXT: movdqa %xmm3, %xmm0
	; SSE41-NEXT: pxor %xmm5, %xmm0			; SSE41-NEXT: pxor %xmm5, %xmm0
	; SSE41-NEXT: movdqa %xmm1, %xmm4			; SSE41-NEXT: movdqa %xmm1, %xmm4
	; SSE41-NEXT: pxor %xmm5, %xmm4			; SSE41-NEXT: pxor %xmm5, %xmm4
	; SSE41-NEXT: movdqa %xmm4, %xmm6			; SSE41-NEXT: movdqa %xmm4, %xmm6
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm6			; SSE41-NEXT: pcmpgtd %xmm0, %xmm6
	; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm6[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm6[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm4			; SSE41-NEXT: pcmpeqd %xmm0, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm4[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]
	; SSE41-NEXT: pand %xmm7, %xmm4			; SSE41-NEXT: pand %xmm7, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm6[1,1,3,3]			; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm3			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm3
	; SSE41-NEXT: movapd %xmm3, %xmm0			; SSE41-NEXT: movapd %xmm3, %xmm0
	; SSE41-NEXT: xorpd %xmm5, %xmm0			; SSE41-NEXT: xorpd %xmm5, %xmm0
	; SSE41-NEXT: movapd %xmm2, %xmm1			; SSE41-NEXT: movapd %xmm2, %xmm1
	; SSE41-NEXT: xorpd %xmm5, %xmm1			; SSE41-NEXT: xorpd %xmm5, %xmm1
	; SSE41-NEXT: movapd %xmm1, %xmm4			; SSE41-NEXT: movapd %xmm1, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm4			; SSE41-NEXT: pcmpgtd %xmm0, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm1			; SSE41-NEXT: pcmpeqd %xmm0, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]
	; SSE41-NEXT: pand %xmm6, %xmm1			; SSE41-NEXT: pand %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm3			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm3[2,3,0,1]			; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm3[2,3,0,1]
	; SSE41-NEXT: movdqa %xmm3, %xmm0			; SSE41-NEXT: movdqa %xmm3, %xmm0
	; SSE41-NEXT: pxor %xmm5, %xmm0			; SSE41-NEXT: pxor %xmm5, %xmm0
	; SSE41-NEXT: pxor %xmm1, %xmm5			; SSE41-NEXT: pxor %xmm1, %xmm5
	; SSE41-NEXT: movdqa %xmm0, %xmm2			; SSE41-NEXT: movdqa %xmm0, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm5, %xmm2			; SSE41-NEXT: pcmpgtd %xmm5, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm5			; SSE41-NEXT: pcmpeqd %xmm0, %xmm5
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm5[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm5[1,1,3,3]
	; SSE41-NEXT: pand %xmm4, %xmm5			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm1
	; SSE41-NEXT: movq %xmm1, %rax			; SSE41-NEXT: movq %xmm1, %rax
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: test_v8i64:			; AVX1-LABEL: test_v8i64:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2			; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm3 = [9223372036854775808,9223372036854775808]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm3 = [9223372036854775808,9223372036854775808]
	▲ Show 20 Lines • Show All 192 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: movdqa %xmm5, %xmm10			; SSE41-NEXT: movdqa %xmm5, %xmm10
	; SSE41-NEXT: pxor %xmm9, %xmm10			; SSE41-NEXT: pxor %xmm9, %xmm10
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: pxor %xmm9, %xmm0			; SSE41-NEXT: pxor %xmm9, %xmm0
	; SSE41-NEXT: movdqa %xmm0, %xmm11			; SSE41-NEXT: movdqa %xmm0, %xmm11
	; SSE41-NEXT: pcmpgtd %xmm10, %xmm11			; SSE41-NEXT: pcmpgtd %xmm10, %xmm11
	; SSE41-NEXT: pshufd {{.*#+}} xmm12 = xmm11[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm12 = xmm11[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm10, %xmm0			; SSE41-NEXT: pcmpeqd %xmm10, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm10 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm12, %xmm10			; SSE41-NEXT: pand %xmm12, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm11[1,1,3,3]			; SSE41-NEXT: por %xmm11, %xmm0
	; SSE41-NEXT: por %xmm10, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm5			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm5
	; SSE41-NEXT: movdqa %xmm7, %xmm0			; SSE41-NEXT: movdqa %xmm7, %xmm0
	; SSE41-NEXT: pxor %xmm9, %xmm0			; SSE41-NEXT: pxor %xmm9, %xmm0
	; SSE41-NEXT: movdqa %xmm3, %xmm1			; SSE41-NEXT: movdqa %xmm3, %xmm1
	; SSE41-NEXT: pxor %xmm9, %xmm1			; SSE41-NEXT: pxor %xmm9, %xmm1
	; SSE41-NEXT: movdqa %xmm1, %xmm10			; SSE41-NEXT: movdqa %xmm1, %xmm10
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm10			; SSE41-NEXT: pcmpgtd %xmm0, %xmm10
	; SSE41-NEXT: pshufd {{.*#+}} xmm11 = xmm10[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm11 = xmm10[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm1			; SSE41-NEXT: pcmpeqd %xmm0, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]
	; SSE41-NEXT: pand %xmm11, %xmm1			; SSE41-NEXT: pand %xmm11, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm10[1,1,3,3]			; SSE41-NEXT: por %xmm10, %xmm0
	; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm7			; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm7
	; SSE41-NEXT: movdqa %xmm4, %xmm0			; SSE41-NEXT: movdqa %xmm4, %xmm1
	; SSE41-NEXT: pxor %xmm9, %xmm0
	; SSE41-NEXT: movdqa %xmm8, %xmm1
	; SSE41-NEXT: pxor %xmm9, %xmm1			; SSE41-NEXT: pxor %xmm9, %xmm1
	; SSE41-NEXT: movdqa %xmm1, %xmm3			; SSE41-NEXT: movdqa %xmm8, %xmm3
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm3			; SSE41-NEXT: pxor %xmm9, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm10 = xmm3[0,0,2,2]			; SSE41-NEXT: movdqa %xmm3, %xmm0
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm1			; SSE41-NEXT: pcmpgtd %xmm1, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm10 = xmm0[0,0,2,2]
				; SSE41-NEXT: pcmpeqd %xmm1, %xmm3
				; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm3[1,1,3,3]
	; SSE41-NEXT: pand %xmm10, %xmm1			; SSE41-NEXT: pand %xmm10, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[1,1,3,3]
	; SSE41-NEXT: por %xmm1, %xmm0			; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm4			; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm4
	; SSE41-NEXT: movdqa %xmm6, %xmm0			; SSE41-NEXT: movdqa %xmm6, %xmm0
	; SSE41-NEXT: pxor %xmm9, %xmm0			; SSE41-NEXT: pxor %xmm9, %xmm0
	; SSE41-NEXT: movdqa %xmm2, %xmm1			; SSE41-NEXT: movdqa %xmm2, %xmm1
	; SSE41-NEXT: pxor %xmm9, %xmm1			; SSE41-NEXT: pxor %xmm9, %xmm1
	; SSE41-NEXT: movdqa %xmm1, %xmm3			; SSE41-NEXT: movdqa %xmm1, %xmm3
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm3			; SSE41-NEXT: pcmpgtd %xmm0, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm8 = xmm3[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm8 = xmm3[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm1			; SSE41-NEXT: pcmpeqd %xmm0, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]
	; SSE41-NEXT: pand %xmm8, %xmm1			; SSE41-NEXT: pand %xmm8, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[1,1,3,3]			; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm6			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm6
	; SSE41-NEXT: movapd %xmm6, %xmm0			; SSE41-NEXT: movapd %xmm6, %xmm0
	; SSE41-NEXT: xorpd %xmm9, %xmm0			; SSE41-NEXT: xorpd %xmm9, %xmm0
	; SSE41-NEXT: movapd %xmm4, %xmm1			; SSE41-NEXT: movapd %xmm4, %xmm1
	; SSE41-NEXT: xorpd %xmm9, %xmm1			; SSE41-NEXT: xorpd %xmm9, %xmm1
	; SSE41-NEXT: movapd %xmm1, %xmm2			; SSE41-NEXT: movapd %xmm1, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm2			; SSE41-NEXT: pcmpgtd %xmm0, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm1			; SSE41-NEXT: pcmpeqd %xmm0, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]
	; SSE41-NEXT: pand %xmm3, %xmm1			; SSE41-NEXT: pand %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm6			; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm6
	; SSE41-NEXT: movapd %xmm7, %xmm0			; SSE41-NEXT: movapd %xmm7, %xmm0
	; SSE41-NEXT: xorpd %xmm9, %xmm0			; SSE41-NEXT: xorpd %xmm9, %xmm0
	; SSE41-NEXT: movapd %xmm5, %xmm1			; SSE41-NEXT: movapd %xmm5, %xmm1
	; SSE41-NEXT: xorpd %xmm9, %xmm1			; SSE41-NEXT: xorpd %xmm9, %xmm1
	; SSE41-NEXT: movapd %xmm1, %xmm2			; SSE41-NEXT: movapd %xmm1, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm2			; SSE41-NEXT: pcmpgtd %xmm0, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm1			; SSE41-NEXT: pcmpeqd %xmm0, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]
	; SSE41-NEXT: pand %xmm3, %xmm1			; SSE41-NEXT: pand %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm5, %xmm7			; SSE41-NEXT: blendvpd %xmm0, %xmm5, %xmm7
	; SSE41-NEXT: movapd %xmm7, %xmm0			; SSE41-NEXT: movapd %xmm7, %xmm0
	; SSE41-NEXT: xorpd %xmm9, %xmm0			; SSE41-NEXT: xorpd %xmm9, %xmm0
	; SSE41-NEXT: movapd %xmm6, %xmm1			; SSE41-NEXT: movapd %xmm6, %xmm1
	; SSE41-NEXT: xorpd %xmm9, %xmm1			; SSE41-NEXT: xorpd %xmm9, %xmm1
	; SSE41-NEXT: movapd %xmm1, %xmm2			; SSE41-NEXT: movapd %xmm1, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm2			; SSE41-NEXT: pcmpgtd %xmm0, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm1			; SSE41-NEXT: pcmpeqd %xmm0, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]
	; SSE41-NEXT: pand %xmm3, %xmm1			; SSE41-NEXT: pand %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm6, %xmm7			; SSE41-NEXT: blendvpd %xmm0, %xmm6, %xmm7
	; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm7[2,3,0,1]			; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm7[2,3,0,1]
	; SSE41-NEXT: movdqa %xmm7, %xmm0			; SSE41-NEXT: movdqa %xmm7, %xmm0
	; SSE41-NEXT: pxor %xmm9, %xmm0			; SSE41-NEXT: pxor %xmm9, %xmm0
	; SSE41-NEXT: pxor %xmm1, %xmm9			; SSE41-NEXT: pxor %xmm1, %xmm9
	; SSE41-NEXT: movdqa %xmm0, %xmm2			; SSE41-NEXT: movdqa %xmm0, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm9, %xmm2			; SSE41-NEXT: pcmpgtd %xmm9, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm9			; SSE41-NEXT: pcmpeqd %xmm0, %xmm9
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm9[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm9[1,1,3,3]
	; SSE41-NEXT: pand %xmm3, %xmm4			; SSE41-NEXT: pand %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm7, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm7, %xmm1
	; SSE41-NEXT: movq %xmm1, %rax			; SSE41-NEXT: movq %xmm1, %rax
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: test_v16i64:			; AVX1-LABEL: test_v16i64:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm2, %xmm5			; AVX1-NEXT: vextractf128 $1, %ymm2, %xmm5
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [9223372036854775808,9223372036854775808]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [9223372036854775808,9223372036854775808]
	▲ Show 20 Lines • Show All 1,571 Lines • Show Last 20 Lines

llvm/trunk/test/CodeGen/X86/vector-reduce-umax.ll

	Show All 30 Lines
	; SSE2-NEXT: por %xmm0, %xmm3			; SSE2-NEXT: por %xmm0, %xmm3
	; SSE2-NEXT: movq %xmm3, %rax			; SSE2-NEXT: movq %xmm3, %rax
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: test_v2i64:			; SSE41-LABEL: test_v2i64:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movdqa %xmm0, %xmm1			; SSE41-NEXT: movdqa %xmm0, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm0[2,3,0,1]			; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm0[2,3,0,1]
	; SSE41-NEXT: movdqa {{.*#+}} xmm0 = [9223372039002259456,9223372039002259456]			; SSE41-NEXT: movdqa {{.*#+}} xmm3 = [9223372039002259456,9223372039002259456]
	; SSE41-NEXT: movdqa %xmm1, %xmm3			; SSE41-NEXT: movdqa %xmm0, %xmm4
	; SSE41-NEXT: pxor %xmm0, %xmm3			; SSE41-NEXT: pxor %xmm3, %xmm4
	; SSE41-NEXT: pxor %xmm2, %xmm0			; SSE41-NEXT: pxor %xmm2, %xmm3
	; SSE41-NEXT: movdqa %xmm3, %xmm4			; SSE41-NEXT: movdqa %xmm4, %xmm0
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm4			; SSE41-NEXT: pcmpgtd %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm0[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm3, %xmm0			; SSE41-NEXT: pcmpeqd %xmm4, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm3[1,1,3,3]
	; SSE41-NEXT: pand %xmm5, %xmm3			; SSE41-NEXT: pand %xmm5, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]
	; SSE41-NEXT: por %xmm3, %xmm0			; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm2
	; SSE41-NEXT: movq %xmm2, %rax			; SSE41-NEXT: movq %xmm2, %rax
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX-LABEL: test_v2i64:			; AVX-LABEL: test_v2i64:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]			; AVX-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]
	▲ Show 20 Lines • Show All 60 Lines • ▼ Show 20 Lines
	; SSE2-NEXT: por %xmm4, %xmm2			; SSE2-NEXT: por %xmm4, %xmm2
	; SSE2-NEXT: movq %xmm2, %rax			; SSE2-NEXT: movq %xmm2, %rax
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: test_v4i64:			; SSE41-LABEL: test_v4i64:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movdqa %xmm0, %xmm2			; SSE41-NEXT: movdqa %xmm0, %xmm2
	; SSE41-NEXT: movdqa {{.*#+}} xmm3 = [9223372039002259456,9223372039002259456]			; SSE41-NEXT: movdqa {{.*#+}} xmm3 = [9223372039002259456,9223372039002259456]
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm4
	; SSE41-NEXT: pxor %xmm3, %xmm0
	; SSE41-NEXT: movdqa %xmm2, %xmm4
	; SSE41-NEXT: pxor %xmm3, %xmm4			; SSE41-NEXT: pxor %xmm3, %xmm4
	; SSE41-NEXT: movdqa %xmm4, %xmm5			; SSE41-NEXT: movdqa %xmm0, %xmm5
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm5			; SSE41-NEXT: pxor %xmm3, %xmm5
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm5[0,0,2,2]			; SSE41-NEXT: movdqa %xmm5, %xmm0
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm4			; SSE41-NEXT: pcmpgtd %xmm4, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm4[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm0[0,0,2,2]
				; SSE41-NEXT: pcmpeqd %xmm4, %xmm5
				; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm5[1,1,3,3]
	; SSE41-NEXT: pand %xmm6, %xmm4			; SSE41-NEXT: pand %xmm6, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm5[1,1,3,3]
	; SSE41-NEXT: por %xmm4, %xmm0			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm1[2,3,0,1]			; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm1[2,3,0,1]
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: pxor %xmm3, %xmm0			; SSE41-NEXT: pxor %xmm3, %xmm0
	; SSE41-NEXT: pxor %xmm2, %xmm3			; SSE41-NEXT: pxor %xmm2, %xmm3
	; SSE41-NEXT: movdqa %xmm0, %xmm4			; SSE41-NEXT: movdqa %xmm0, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm3, %xmm4			; SSE41-NEXT: pcmpgtd %xmm3, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm3			; SSE41-NEXT: pcmpeqd %xmm0, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm3[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[1,1,3,3]
	; SSE41-NEXT: pand %xmm5, %xmm3			; SSE41-NEXT: pand %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm2
	; SSE41-NEXT: movq %xmm2, %rax			; SSE41-NEXT: movq %xmm2, %rax
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: test_v4i64:			; AVX1-LABEL: test_v4i64:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
	▲ Show 20 Lines • Show All 119 Lines • ▼ Show 20 Lines
	; SSE2-NEXT: por %xmm1, %xmm3			; SSE2-NEXT: por %xmm1, %xmm3
	; SSE2-NEXT: movq %xmm3, %rax			; SSE2-NEXT: movq %xmm3, %rax
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: test_v8i64:			; SSE41-LABEL: test_v8i64:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movdqa %xmm0, %xmm4			; SSE41-NEXT: movdqa %xmm0, %xmm4
	; SSE41-NEXT: movdqa {{.*#+}} xmm5 = [9223372039002259456,9223372039002259456]			; SSE41-NEXT: movdqa {{.*#+}} xmm5 = [9223372039002259456,9223372039002259456]
	; SSE41-NEXT: movdqa %xmm2, %xmm0			; SSE41-NEXT: movdqa %xmm2, %xmm6
	; SSE41-NEXT: pxor %xmm5, %xmm0
	; SSE41-NEXT: movdqa %xmm4, %xmm6
	; SSE41-NEXT: pxor %xmm5, %xmm6			; SSE41-NEXT: pxor %xmm5, %xmm6
	; SSE41-NEXT: movdqa %xmm6, %xmm7			; SSE41-NEXT: movdqa %xmm0, %xmm7
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm7			; SSE41-NEXT: pxor %xmm5, %xmm7
	; SSE41-NEXT: pshufd {{.*#+}} xmm8 = xmm7[0,0,2,2]			; SSE41-NEXT: movdqa %xmm7, %xmm0
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm6			; SSE41-NEXT: pcmpgtd %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm6[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm8 = xmm0[0,0,2,2]
				; SSE41-NEXT: pcmpeqd %xmm6, %xmm7
				; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm7[1,1,3,3]
	; SSE41-NEXT: pand %xmm8, %xmm6			; SSE41-NEXT: pand %xmm8, %xmm6
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm7[1,1,3,3]
	; SSE41-NEXT: por %xmm6, %xmm0			; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm2
	; SSE41-NEXT: movdqa %xmm3, %xmm0			; SSE41-NEXT: movdqa %xmm3, %xmm0
	; SSE41-NEXT: pxor %xmm5, %xmm0			; SSE41-NEXT: pxor %xmm5, %xmm0
	; SSE41-NEXT: movdqa %xmm1, %xmm4			; SSE41-NEXT: movdqa %xmm1, %xmm4
	; SSE41-NEXT: pxor %xmm5, %xmm4			; SSE41-NEXT: pxor %xmm5, %xmm4
	; SSE41-NEXT: movdqa %xmm4, %xmm6			; SSE41-NEXT: movdqa %xmm4, %xmm6
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm6			; SSE41-NEXT: pcmpgtd %xmm0, %xmm6
	; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm6[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm6[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm4			; SSE41-NEXT: pcmpeqd %xmm0, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm4[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]
	; SSE41-NEXT: pand %xmm7, %xmm4			; SSE41-NEXT: pand %xmm7, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm6[1,1,3,3]			; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm3			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm3
	; SSE41-NEXT: movapd %xmm3, %xmm0			; SSE41-NEXT: movapd %xmm3, %xmm0
	; SSE41-NEXT: xorpd %xmm5, %xmm0			; SSE41-NEXT: xorpd %xmm5, %xmm0
	; SSE41-NEXT: movapd %xmm2, %xmm1			; SSE41-NEXT: movapd %xmm2, %xmm1
	; SSE41-NEXT: xorpd %xmm5, %xmm1			; SSE41-NEXT: xorpd %xmm5, %xmm1
	; SSE41-NEXT: movapd %xmm1, %xmm4			; SSE41-NEXT: movapd %xmm1, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm4			; SSE41-NEXT: pcmpgtd %xmm0, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm1			; SSE41-NEXT: pcmpeqd %xmm0, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]
	; SSE41-NEXT: pand %xmm6, %xmm1			; SSE41-NEXT: pand %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm3			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm3[2,3,0,1]			; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm3[2,3,0,1]
	; SSE41-NEXT: movdqa %xmm3, %xmm0			; SSE41-NEXT: movdqa %xmm3, %xmm0
	; SSE41-NEXT: pxor %xmm5, %xmm0			; SSE41-NEXT: pxor %xmm5, %xmm0
	; SSE41-NEXT: pxor %xmm1, %xmm5			; SSE41-NEXT: pxor %xmm1, %xmm5
	; SSE41-NEXT: movdqa %xmm0, %xmm2			; SSE41-NEXT: movdqa %xmm0, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm5, %xmm2			; SSE41-NEXT: pcmpgtd %xmm5, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm5			; SSE41-NEXT: pcmpeqd %xmm0, %xmm5
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm5[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm5[1,1,3,3]
	; SSE41-NEXT: pand %xmm4, %xmm5			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm1
	; SSE41-NEXT: movq %xmm1, %rax			; SSE41-NEXT: movq %xmm1, %rax
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: test_v8i64:			; AVX1-LABEL: test_v8i64:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2			; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm3 = [9223372036854775808,9223372036854775808]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm3 = [9223372036854775808,9223372036854775808]
	▲ Show 20 Lines • Show All 192 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: movdqa %xmm5, %xmm10			; SSE41-NEXT: movdqa %xmm5, %xmm10
	; SSE41-NEXT: pxor %xmm9, %xmm10			; SSE41-NEXT: pxor %xmm9, %xmm10
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: pxor %xmm9, %xmm0			; SSE41-NEXT: pxor %xmm9, %xmm0
	; SSE41-NEXT: movdqa %xmm0, %xmm11			; SSE41-NEXT: movdqa %xmm0, %xmm11
	; SSE41-NEXT: pcmpgtd %xmm10, %xmm11			; SSE41-NEXT: pcmpgtd %xmm10, %xmm11
	; SSE41-NEXT: pshufd {{.*#+}} xmm12 = xmm11[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm12 = xmm11[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm10, %xmm0			; SSE41-NEXT: pcmpeqd %xmm10, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm10 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm12, %xmm10			; SSE41-NEXT: pand %xmm12, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm11[1,1,3,3]			; SSE41-NEXT: por %xmm11, %xmm0
	; SSE41-NEXT: por %xmm10, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm5			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm5
	; SSE41-NEXT: movdqa %xmm7, %xmm0			; SSE41-NEXT: movdqa %xmm7, %xmm0
	; SSE41-NEXT: pxor %xmm9, %xmm0			; SSE41-NEXT: pxor %xmm9, %xmm0
	; SSE41-NEXT: movdqa %xmm3, %xmm1			; SSE41-NEXT: movdqa %xmm3, %xmm1
	; SSE41-NEXT: pxor %xmm9, %xmm1			; SSE41-NEXT: pxor %xmm9, %xmm1
	; SSE41-NEXT: movdqa %xmm1, %xmm10			; SSE41-NEXT: movdqa %xmm1, %xmm10
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm10			; SSE41-NEXT: pcmpgtd %xmm0, %xmm10
	; SSE41-NEXT: pshufd {{.*#+}} xmm11 = xmm10[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm11 = xmm10[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm1			; SSE41-NEXT: pcmpeqd %xmm0, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]
	; SSE41-NEXT: pand %xmm11, %xmm1			; SSE41-NEXT: pand %xmm11, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm10[1,1,3,3]			; SSE41-NEXT: por %xmm10, %xmm0
	; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm7			; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm7
	; SSE41-NEXT: movdqa %xmm4, %xmm0			; SSE41-NEXT: movdqa %xmm4, %xmm1
	; SSE41-NEXT: pxor %xmm9, %xmm0
	; SSE41-NEXT: movdqa %xmm8, %xmm1
	; SSE41-NEXT: pxor %xmm9, %xmm1			; SSE41-NEXT: pxor %xmm9, %xmm1
	; SSE41-NEXT: movdqa %xmm1, %xmm3			; SSE41-NEXT: movdqa %xmm8, %xmm3
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm3			; SSE41-NEXT: pxor %xmm9, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm10 = xmm3[0,0,2,2]			; SSE41-NEXT: movdqa %xmm3, %xmm0
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm1			; SSE41-NEXT: pcmpgtd %xmm1, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm10 = xmm0[0,0,2,2]
				; SSE41-NEXT: pcmpeqd %xmm1, %xmm3
				; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm3[1,1,3,3]
	; SSE41-NEXT: pand %xmm10, %xmm1			; SSE41-NEXT: pand %xmm10, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[1,1,3,3]
	; SSE41-NEXT: por %xmm1, %xmm0			; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm4			; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm4
	; SSE41-NEXT: movdqa %xmm6, %xmm0			; SSE41-NEXT: movdqa %xmm6, %xmm0
	; SSE41-NEXT: pxor %xmm9, %xmm0			; SSE41-NEXT: pxor %xmm9, %xmm0
	; SSE41-NEXT: movdqa %xmm2, %xmm1			; SSE41-NEXT: movdqa %xmm2, %xmm1
	; SSE41-NEXT: pxor %xmm9, %xmm1			; SSE41-NEXT: pxor %xmm9, %xmm1
	; SSE41-NEXT: movdqa %xmm1, %xmm3			; SSE41-NEXT: movdqa %xmm1, %xmm3
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm3			; SSE41-NEXT: pcmpgtd %xmm0, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm8 = xmm3[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm8 = xmm3[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm1			; SSE41-NEXT: pcmpeqd %xmm0, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]
	; SSE41-NEXT: pand %xmm8, %xmm1			; SSE41-NEXT: pand %xmm8, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[1,1,3,3]			; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm6			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm6
	; SSE41-NEXT: movapd %xmm6, %xmm0			; SSE41-NEXT: movapd %xmm6, %xmm0
	; SSE41-NEXT: xorpd %xmm9, %xmm0			; SSE41-NEXT: xorpd %xmm9, %xmm0
	; SSE41-NEXT: movapd %xmm4, %xmm1			; SSE41-NEXT: movapd %xmm4, %xmm1
	; SSE41-NEXT: xorpd %xmm9, %xmm1			; SSE41-NEXT: xorpd %xmm9, %xmm1
	; SSE41-NEXT: movapd %xmm1, %xmm2			; SSE41-NEXT: movapd %xmm1, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm2			; SSE41-NEXT: pcmpgtd %xmm0, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm1			; SSE41-NEXT: pcmpeqd %xmm0, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]
	; SSE41-NEXT: pand %xmm3, %xmm1			; SSE41-NEXT: pand %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm6			; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm6
	; SSE41-NEXT: movapd %xmm7, %xmm0			; SSE41-NEXT: movapd %xmm7, %xmm0
	; SSE41-NEXT: xorpd %xmm9, %xmm0			; SSE41-NEXT: xorpd %xmm9, %xmm0
	; SSE41-NEXT: movapd %xmm5, %xmm1			; SSE41-NEXT: movapd %xmm5, %xmm1
	; SSE41-NEXT: xorpd %xmm9, %xmm1			; SSE41-NEXT: xorpd %xmm9, %xmm1
	; SSE41-NEXT: movapd %xmm1, %xmm2			; SSE41-NEXT: movapd %xmm1, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm2			; SSE41-NEXT: pcmpgtd %xmm0, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm1			; SSE41-NEXT: pcmpeqd %xmm0, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]
	; SSE41-NEXT: pand %xmm3, %xmm1			; SSE41-NEXT: pand %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm5, %xmm7			; SSE41-NEXT: blendvpd %xmm0, %xmm5, %xmm7
	; SSE41-NEXT: movapd %xmm7, %xmm0			; SSE41-NEXT: movapd %xmm7, %xmm0
	; SSE41-NEXT: xorpd %xmm9, %xmm0			; SSE41-NEXT: xorpd %xmm9, %xmm0
	; SSE41-NEXT: movapd %xmm6, %xmm1			; SSE41-NEXT: movapd %xmm6, %xmm1
	; SSE41-NEXT: xorpd %xmm9, %xmm1			; SSE41-NEXT: xorpd %xmm9, %xmm1
	; SSE41-NEXT: movapd %xmm1, %xmm2			; SSE41-NEXT: movapd %xmm1, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm2			; SSE41-NEXT: pcmpgtd %xmm0, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm1			; SSE41-NEXT: pcmpeqd %xmm0, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]
	; SSE41-NEXT: pand %xmm3, %xmm1			; SSE41-NEXT: pand %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm6, %xmm7			; SSE41-NEXT: blendvpd %xmm0, %xmm6, %xmm7
	; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm7[2,3,0,1]			; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm7[2,3,0,1]
	; SSE41-NEXT: movdqa %xmm7, %xmm0			; SSE41-NEXT: movdqa %xmm7, %xmm0
	; SSE41-NEXT: pxor %xmm9, %xmm0			; SSE41-NEXT: pxor %xmm9, %xmm0
	; SSE41-NEXT: pxor %xmm1, %xmm9			; SSE41-NEXT: pxor %xmm1, %xmm9
	; SSE41-NEXT: movdqa %xmm0, %xmm2			; SSE41-NEXT: movdqa %xmm0, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm9, %xmm2			; SSE41-NEXT: pcmpgtd %xmm9, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm9			; SSE41-NEXT: pcmpeqd %xmm0, %xmm9
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm9[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm9[1,1,3,3]
	; SSE41-NEXT: pand %xmm3, %xmm4			; SSE41-NEXT: pand %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm7, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm7, %xmm1
	; SSE41-NEXT: movq %xmm1, %rax			; SSE41-NEXT: movq %xmm1, %rax
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: test_v16i64:			; AVX1-LABEL: test_v16i64:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm2, %xmm5			; AVX1-NEXT: vextractf128 $1, %ymm2, %xmm5
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [9223372036854775808,9223372036854775808]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [9223372036854775808,9223372036854775808]
	▲ Show 20 Lines • Show All 125 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: movdqa {{.*#+}} xmm0 = [2147483648,2147483648]			; SSE41-NEXT: movdqa {{.*#+}} xmm0 = [2147483648,2147483648]
	; SSE41-NEXT: movdqa %xmm1, %xmm3			; SSE41-NEXT: movdqa %xmm1, %xmm3
	; SSE41-NEXT: pxor %xmm0, %xmm3			; SSE41-NEXT: pxor %xmm0, %xmm3
	; SSE41-NEXT: pxor %xmm2, %xmm0			; SSE41-NEXT: pxor %xmm2, %xmm0
	; SSE41-NEXT: movdqa %xmm3, %xmm4			; SSE41-NEXT: movdqa %xmm3, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm4			; SSE41-NEXT: pcmpgtd %xmm0, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm3, %xmm0			; SSE41-NEXT: pcmpeqd %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm5, %xmm3			; SSE41-NEXT: pand %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm2
	; SSE41-NEXT: movd %xmm2, %eax			; SSE41-NEXT: movd %xmm2, %eax
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: test_v2i32:			; AVX1-LABEL: test_v2i32:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX1-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX1-NEXT: vpblendw {{.*#+}} xmm1 = xmm0[0,1],xmm1[2,3],xmm0[4,5],xmm1[6,7]			; AVX1-NEXT: vpblendw {{.*#+}} xmm1 = xmm0[0,1],xmm1[2,3],xmm0[4,5],xmm1[6,7]
	▲ Show 20 Lines • Show All 469 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: movdqa {{.*#+}} xmm0 = [2147483648,2147483648]			; SSE41-NEXT: movdqa {{.*#+}} xmm0 = [2147483648,2147483648]
	; SSE41-NEXT: movdqa %xmm1, %xmm3			; SSE41-NEXT: movdqa %xmm1, %xmm3
	; SSE41-NEXT: por %xmm0, %xmm3			; SSE41-NEXT: por %xmm0, %xmm3
	; SSE41-NEXT: por %xmm2, %xmm0			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: movdqa %xmm3, %xmm4			; SSE41-NEXT: movdqa %xmm3, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm4			; SSE41-NEXT: pcmpgtd %xmm0, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm3, %xmm0			; SSE41-NEXT: pcmpeqd %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm5, %xmm3			; SSE41-NEXT: pand %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm2
	; SSE41-NEXT: movd %xmm2, %eax			; SSE41-NEXT: movd %xmm2, %eax
	; SSE41-NEXT: # kill: def $ax killed $ax killed $eax			; SSE41-NEXT: # kill: def $ax killed $ax killed $eax
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX-LABEL: test_v2i16:			; AVX-LABEL: test_v2i16:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX-NEXT: vpxor %xmm1, %xmm1, %xmm1
	▲ Show 20 Lines • Show All 528 Lines • ▼ Show 20 Lines
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: test_v2i8:			; SSE41-LABEL: test_v2i8:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movdqa %xmm0, %xmm1			; SSE41-NEXT: movdqa %xmm0, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[2,3,0,1]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[2,3,0,1]
	; SSE41-NEXT: pand {{.*}}(%rip), %xmm1			; SSE41-NEXT: pand {{.*}}(%rip), %xmm1
	; SSE41-NEXT: pmovzxbq {{.*#+}} xmm2 = xmm0[0],zero,zero,zero,zero,zero,zero,zero,xmm0[1],zero,zero,zero,zero,zero,zero,zero			; SSE41-NEXT: pmovzxbq {{.*#+}} xmm2 = xmm0[0],zero,zero,zero,zero,zero,zero,zero,xmm0[1],zero,zero,zero,zero,zero,zero,zero
	; SSE41-NEXT: movdqa {{.*#+}} xmm0 = [2147483648,2147483648]			; SSE41-NEXT: movdqa {{.*#+}} xmm3 = [2147483648,2147483648]
	; SSE41-NEXT: movdqa %xmm1, %xmm3			; SSE41-NEXT: movdqa %xmm1, %xmm4
	; SSE41-NEXT: por %xmm0, %xmm3			; SSE41-NEXT: por %xmm3, %xmm4
	; SSE41-NEXT: por %xmm2, %xmm0			; SSE41-NEXT: por %xmm2, %xmm3
	; SSE41-NEXT: movdqa %xmm3, %xmm4			; SSE41-NEXT: movdqa %xmm4, %xmm0
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm4			; SSE41-NEXT: pcmpgtd %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm0[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm3, %xmm0			; SSE41-NEXT: pcmpeqd %xmm4, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm3[1,1,3,3]
	; SSE41-NEXT: pand %xmm5, %xmm3			; SSE41-NEXT: pand %xmm5, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]
	; SSE41-NEXT: por %xmm3, %xmm0			; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm2
	; SSE41-NEXT: pextrb $0, %xmm2, %eax			; SSE41-NEXT: pextrb $0, %xmm2, %eax
	; SSE41-NEXT: # kill: def $al killed $al killed $eax			; SSE41-NEXT: # kill: def $al killed $al killed $eax
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX-LABEL: test_v2i8:			; AVX-LABEL: test_v2i8:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	▲ Show 20 Lines • Show All 631 Lines • Show Last 20 Lines

llvm/trunk/test/CodeGen/X86/vector-reduce-umin-widen.ll

	Show All 38 Lines
	; SSE41-NEXT: movdqa {{.*#+}} xmm0 = [9223372039002259456,9223372039002259456]			; SSE41-NEXT: movdqa {{.*#+}} xmm0 = [9223372039002259456,9223372039002259456]
	; SSE41-NEXT: movdqa %xmm1, %xmm3			; SSE41-NEXT: movdqa %xmm1, %xmm3
	; SSE41-NEXT: pxor %xmm0, %xmm3			; SSE41-NEXT: pxor %xmm0, %xmm3
	; SSE41-NEXT: pxor %xmm2, %xmm0			; SSE41-NEXT: pxor %xmm2, %xmm0
	; SSE41-NEXT: movdqa %xmm0, %xmm4			; SSE41-NEXT: movdqa %xmm0, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm3, %xmm4			; SSE41-NEXT: pcmpgtd %xmm3, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm3, %xmm0			; SSE41-NEXT: pcmpeqd %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm5, %xmm3			; SSE41-NEXT: pand %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm2
	; SSE41-NEXT: movq %xmm2, %rax			; SSE41-NEXT: movq %xmm2, %rax
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX-LABEL: test_v2i64:			; AVX-LABEL: test_v2i64:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]			; AVX-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]			; AVX-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
	▲ Show 20 Lines • Show All 66 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: movdqa {{.*#+}} xmm3 = [9223372039002259456,9223372039002259456]			; SSE41-NEXT: movdqa {{.*#+}} xmm3 = [9223372039002259456,9223372039002259456]
	; SSE41-NEXT: pxor %xmm3, %xmm0			; SSE41-NEXT: pxor %xmm3, %xmm0
	; SSE41-NEXT: movdqa %xmm1, %xmm4			; SSE41-NEXT: movdqa %xmm1, %xmm4
	; SSE41-NEXT: pxor %xmm3, %xmm4			; SSE41-NEXT: pxor %xmm3, %xmm4
	; SSE41-NEXT: movdqa %xmm4, %xmm5			; SSE41-NEXT: movdqa %xmm4, %xmm5
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm5			; SSE41-NEXT: pcmpgtd %xmm0, %xmm5
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm5[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm5[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm4			; SSE41-NEXT: pcmpeqd %xmm0, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm4[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]
	; SSE41-NEXT: pand %xmm6, %xmm4			; SSE41-NEXT: pand %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm5[1,1,3,3]			; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm1[2,3,0,1]			; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm1[2,3,0,1]
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: pxor %xmm3, %xmm0			; SSE41-NEXT: pxor %xmm3, %xmm0
	; SSE41-NEXT: pxor %xmm2, %xmm3			; SSE41-NEXT: pxor %xmm2, %xmm3
	; SSE41-NEXT: movdqa %xmm3, %xmm4			; SSE41-NEXT: movdqa %xmm3, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm4			; SSE41-NEXT: pcmpgtd %xmm0, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm3			; SSE41-NEXT: pcmpeqd %xmm0, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm3[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[1,1,3,3]
	; SSE41-NEXT: pand %xmm5, %xmm3			; SSE41-NEXT: pand %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm2
	; SSE41-NEXT: movq %xmm2, %rax			; SSE41-NEXT: movq %xmm2, %rax
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: test_v4i64:			; AVX1-LABEL: test_v4i64:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
	▲ Show 20 Lines • Show All 127 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: pxor %xmm5, %xmm0			; SSE41-NEXT: pxor %xmm5, %xmm0
	; SSE41-NEXT: movdqa %xmm3, %xmm6			; SSE41-NEXT: movdqa %xmm3, %xmm6
	; SSE41-NEXT: pxor %xmm5, %xmm6			; SSE41-NEXT: pxor %xmm5, %xmm6
	; SSE41-NEXT: movdqa %xmm6, %xmm7			; SSE41-NEXT: movdqa %xmm6, %xmm7
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm7			; SSE41-NEXT: pcmpgtd %xmm0, %xmm7
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm7[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm7[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm6			; SSE41-NEXT: pcmpeqd %xmm0, %xmm6
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm6[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm6[1,1,3,3]
	; SSE41-NEXT: pand %xmm4, %xmm6			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm7[1,1,3,3]			; SSE41-NEXT: por %xmm7, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm3			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm3
	; SSE41-NEXT: movdqa %xmm8, %xmm0			; SSE41-NEXT: movdqa %xmm8, %xmm0
	; SSE41-NEXT: pxor %xmm5, %xmm0			; SSE41-NEXT: pxor %xmm5, %xmm0
	; SSE41-NEXT: movdqa %xmm2, %xmm1			; SSE41-NEXT: movdqa %xmm2, %xmm1
	; SSE41-NEXT: pxor %xmm5, %xmm1			; SSE41-NEXT: pxor %xmm5, %xmm1
	; SSE41-NEXT: movdqa %xmm1, %xmm4			; SSE41-NEXT: movdqa %xmm1, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm4			; SSE41-NEXT: pcmpgtd %xmm0, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm1			; SSE41-NEXT: pcmpeqd %xmm0, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]
	; SSE41-NEXT: pand %xmm6, %xmm1			; SSE41-NEXT: pand %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm2
	; SSE41-NEXT: movapd %xmm2, %xmm0			; SSE41-NEXT: movapd %xmm2, %xmm0
	; SSE41-NEXT: xorpd %xmm5, %xmm0			; SSE41-NEXT: xorpd %xmm5, %xmm0
	; SSE41-NEXT: movapd %xmm3, %xmm1			; SSE41-NEXT: movapd %xmm3, %xmm1
	; SSE41-NEXT: xorpd %xmm5, %xmm1			; SSE41-NEXT: xorpd %xmm5, %xmm1
	; SSE41-NEXT: movapd %xmm1, %xmm4			; SSE41-NEXT: movapd %xmm1, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm4			; SSE41-NEXT: pcmpgtd %xmm0, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm1			; SSE41-NEXT: pcmpeqd %xmm0, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]
	; SSE41-NEXT: pand %xmm6, %xmm1			; SSE41-NEXT: pand %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm3			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm3[2,3,0,1]			; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm3[2,3,0,1]
	; SSE41-NEXT: movdqa %xmm3, %xmm0			; SSE41-NEXT: movdqa %xmm3, %xmm0
	; SSE41-NEXT: pxor %xmm5, %xmm0			; SSE41-NEXT: pxor %xmm5, %xmm0
	; SSE41-NEXT: pxor %xmm1, %xmm5			; SSE41-NEXT: pxor %xmm1, %xmm5
	; SSE41-NEXT: movdqa %xmm5, %xmm2			; SSE41-NEXT: movdqa %xmm5, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm2			; SSE41-NEXT: pcmpgtd %xmm0, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm5			; SSE41-NEXT: pcmpeqd %xmm0, %xmm5
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm5[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm5[1,1,3,3]
	; SSE41-NEXT: pand %xmm4, %xmm5			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm1
	; SSE41-NEXT: movq %xmm1, %rax			; SSE41-NEXT: movq %xmm1, %rax
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: test_v8i64:			; AVX1-LABEL: test_v8i64:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm3 = [9223372036854775808,9223372036854775808]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm3 = [9223372036854775808,9223372036854775808]
	▲ Show 20 Lines • Show All 192 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: movdqa %xmm2, %xmm10			; SSE41-NEXT: movdqa %xmm2, %xmm10
	; SSE41-NEXT: pxor %xmm9, %xmm10			; SSE41-NEXT: pxor %xmm9, %xmm10
	; SSE41-NEXT: movdqa %xmm6, %xmm0			; SSE41-NEXT: movdqa %xmm6, %xmm0
	; SSE41-NEXT: pxor %xmm9, %xmm0			; SSE41-NEXT: pxor %xmm9, %xmm0
	; SSE41-NEXT: movdqa %xmm0, %xmm11			; SSE41-NEXT: movdqa %xmm0, %xmm11
	; SSE41-NEXT: pcmpgtd %xmm10, %xmm11			; SSE41-NEXT: pcmpgtd %xmm10, %xmm11
	; SSE41-NEXT: pshufd {{.*#+}} xmm12 = xmm11[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm12 = xmm11[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm10, %xmm0			; SSE41-NEXT: pcmpeqd %xmm10, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm10 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm12, %xmm10			; SSE41-NEXT: pand %xmm12, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm11[1,1,3,3]			; SSE41-NEXT: por %xmm11, %xmm0
	; SSE41-NEXT: por %xmm10, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm6			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm6
	; SSE41-NEXT: movdqa %xmm8, %xmm0			; SSE41-NEXT: movdqa %xmm8, %xmm0
	; SSE41-NEXT: pxor %xmm9, %xmm0			; SSE41-NEXT: pxor %xmm9, %xmm0
	; SSE41-NEXT: movdqa %xmm4, %xmm2			; SSE41-NEXT: movdqa %xmm4, %xmm2
	; SSE41-NEXT: pxor %xmm9, %xmm2			; SSE41-NEXT: pxor %xmm9, %xmm2
	; SSE41-NEXT: movdqa %xmm2, %xmm10			; SSE41-NEXT: movdqa %xmm2, %xmm10
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm10			; SSE41-NEXT: pcmpgtd %xmm0, %xmm10
	; SSE41-NEXT: pshufd {{.*#+}} xmm11 = xmm10[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm11 = xmm10[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm2			; SSE41-NEXT: pcmpeqd %xmm0, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm2[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]
	; SSE41-NEXT: pand %xmm11, %xmm2			; SSE41-NEXT: pand %xmm11, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm10[1,1,3,3]			; SSE41-NEXT: por %xmm10, %xmm0
	; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm4			; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm4
	; SSE41-NEXT: movdqa %xmm3, %xmm0			; SSE41-NEXT: movdqa %xmm3, %xmm0
	; SSE41-NEXT: pxor %xmm9, %xmm0			; SSE41-NEXT: pxor %xmm9, %xmm0
	; SSE41-NEXT: movdqa %xmm7, %xmm2			; SSE41-NEXT: movdqa %xmm7, %xmm2
	; SSE41-NEXT: pxor %xmm9, %xmm2			; SSE41-NEXT: pxor %xmm9, %xmm2
	; SSE41-NEXT: movdqa %xmm2, %xmm8			; SSE41-NEXT: movdqa %xmm2, %xmm8
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm8			; SSE41-NEXT: pcmpgtd %xmm0, %xmm8
	; SSE41-NEXT: pshufd {{.*#+}} xmm10 = xmm8[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm10 = xmm8[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm2			; SSE41-NEXT: pcmpeqd %xmm0, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm2[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]
	; SSE41-NEXT: pand %xmm10, %xmm2			; SSE41-NEXT: pand %xmm10, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm8[1,1,3,3]			; SSE41-NEXT: por %xmm8, %xmm0
	; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm7			; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm7
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: pxor %xmm9, %xmm0			; SSE41-NEXT: pxor %xmm9, %xmm0
	; SSE41-NEXT: movdqa %xmm5, %xmm2			; SSE41-NEXT: movdqa %xmm5, %xmm2
	; SSE41-NEXT: pxor %xmm9, %xmm2			; SSE41-NEXT: pxor %xmm9, %xmm2
	; SSE41-NEXT: movdqa %xmm2, %xmm3			; SSE41-NEXT: movdqa %xmm2, %xmm3
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm3			; SSE41-NEXT: pcmpgtd %xmm0, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm8 = xmm3[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm8 = xmm3[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm2			; SSE41-NEXT: pcmpeqd %xmm0, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm2[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]
	; SSE41-NEXT: pand %xmm8, %xmm2			; SSE41-NEXT: pand %xmm8, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[1,1,3,3]			; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm5			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm5
	; SSE41-NEXT: movapd %xmm5, %xmm0			; SSE41-NEXT: movapd %xmm5, %xmm0
	; SSE41-NEXT: xorpd %xmm9, %xmm0			; SSE41-NEXT: xorpd %xmm9, %xmm0
	; SSE41-NEXT: movapd %xmm7, %xmm1			; SSE41-NEXT: movapd %xmm7, %xmm1
	; SSE41-NEXT: xorpd %xmm9, %xmm1			; SSE41-NEXT: xorpd %xmm9, %xmm1
	; SSE41-NEXT: movapd %xmm1, %xmm2			; SSE41-NEXT: movapd %xmm1, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm2			; SSE41-NEXT: pcmpgtd %xmm0, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm1			; SSE41-NEXT: pcmpeqd %xmm0, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]
	; SSE41-NEXT: pand %xmm3, %xmm1			; SSE41-NEXT: pand %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm5, %xmm7			; SSE41-NEXT: blendvpd %xmm0, %xmm5, %xmm7
	; SSE41-NEXT: movapd %xmm4, %xmm0			; SSE41-NEXT: movapd %xmm4, %xmm0
	; SSE41-NEXT: xorpd %xmm9, %xmm0			; SSE41-NEXT: xorpd %xmm9, %xmm0
	; SSE41-NEXT: movapd %xmm6, %xmm1			; SSE41-NEXT: movapd %xmm6, %xmm1
	; SSE41-NEXT: xorpd %xmm9, %xmm1			; SSE41-NEXT: xorpd %xmm9, %xmm1
	; SSE41-NEXT: movapd %xmm1, %xmm2			; SSE41-NEXT: movapd %xmm1, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm2			; SSE41-NEXT: pcmpgtd %xmm0, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm1			; SSE41-NEXT: pcmpeqd %xmm0, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]
	; SSE41-NEXT: pand %xmm3, %xmm1			; SSE41-NEXT: pand %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm6			; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm6
	; SSE41-NEXT: movapd %xmm6, %xmm0			; SSE41-NEXT: movapd %xmm6, %xmm0
	; SSE41-NEXT: xorpd %xmm9, %xmm0			; SSE41-NEXT: xorpd %xmm9, %xmm0
	; SSE41-NEXT: movapd %xmm7, %xmm1			; SSE41-NEXT: movapd %xmm7, %xmm1
	; SSE41-NEXT: xorpd %xmm9, %xmm1			; SSE41-NEXT: xorpd %xmm9, %xmm1
	; SSE41-NEXT: movapd %xmm1, %xmm2			; SSE41-NEXT: movapd %xmm1, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm2			; SSE41-NEXT: pcmpgtd %xmm0, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm1			; SSE41-NEXT: pcmpeqd %xmm0, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]
	; SSE41-NEXT: pand %xmm3, %xmm1			; SSE41-NEXT: pand %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm6, %xmm7			; SSE41-NEXT: blendvpd %xmm0, %xmm6, %xmm7
	; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm7[2,3,0,1]			; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm7[2,3,0,1]
	; SSE41-NEXT: movdqa %xmm7, %xmm0			; SSE41-NEXT: movdqa %xmm7, %xmm0
	; SSE41-NEXT: pxor %xmm9, %xmm0			; SSE41-NEXT: pxor %xmm9, %xmm0
	; SSE41-NEXT: pxor %xmm1, %xmm9			; SSE41-NEXT: pxor %xmm1, %xmm9
	; SSE41-NEXT: movdqa %xmm9, %xmm2			; SSE41-NEXT: movdqa %xmm9, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm2			; SSE41-NEXT: pcmpgtd %xmm0, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm9			; SSE41-NEXT: pcmpeqd %xmm0, %xmm9
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm9[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm9[1,1,3,3]
	; SSE41-NEXT: pand %xmm3, %xmm4			; SSE41-NEXT: pand %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm7, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm7, %xmm1
	; SSE41-NEXT: movq %xmm1, %rax			; SSE41-NEXT: movq %xmm1, %rax
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: test_v16i64:			; AVX1-LABEL: test_v16i64:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm5			; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm5
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [9223372036854775808,9223372036854775808]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [9223372036854775808,9223372036854775808]
	▲ Show 20 Lines • Show All 1,377 Lines • Show Last 20 Lines

llvm/trunk/test/CodeGen/X86/vector-reduce-umin.ll

	Show All 38 Lines
	; SSE41-NEXT: movdqa {{.*#+}} xmm0 = [9223372039002259456,9223372039002259456]			; SSE41-NEXT: movdqa {{.*#+}} xmm0 = [9223372039002259456,9223372039002259456]
	; SSE41-NEXT: movdqa %xmm1, %xmm3			; SSE41-NEXT: movdqa %xmm1, %xmm3
	; SSE41-NEXT: pxor %xmm0, %xmm3			; SSE41-NEXT: pxor %xmm0, %xmm3
	; SSE41-NEXT: pxor %xmm2, %xmm0			; SSE41-NEXT: pxor %xmm2, %xmm0
	; SSE41-NEXT: movdqa %xmm0, %xmm4			; SSE41-NEXT: movdqa %xmm0, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm3, %xmm4			; SSE41-NEXT: pcmpgtd %xmm3, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm3, %xmm0			; SSE41-NEXT: pcmpeqd %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm5, %xmm3			; SSE41-NEXT: pand %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm2
	; SSE41-NEXT: movq %xmm2, %rax			; SSE41-NEXT: movq %xmm2, %rax
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX-LABEL: test_v2i64:			; AVX-LABEL: test_v2i64:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]			; AVX-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]			; AVX-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
	▲ Show 20 Lines • Show All 66 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: movdqa {{.*#+}} xmm3 = [9223372039002259456,9223372039002259456]			; SSE41-NEXT: movdqa {{.*#+}} xmm3 = [9223372039002259456,9223372039002259456]
	; SSE41-NEXT: pxor %xmm3, %xmm0			; SSE41-NEXT: pxor %xmm3, %xmm0
	; SSE41-NEXT: movdqa %xmm1, %xmm4			; SSE41-NEXT: movdqa %xmm1, %xmm4
	; SSE41-NEXT: pxor %xmm3, %xmm4			; SSE41-NEXT: pxor %xmm3, %xmm4
	; SSE41-NEXT: movdqa %xmm4, %xmm5			; SSE41-NEXT: movdqa %xmm4, %xmm5
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm5			; SSE41-NEXT: pcmpgtd %xmm0, %xmm5
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm5[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm5[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm4			; SSE41-NEXT: pcmpeqd %xmm0, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm4[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]
	; SSE41-NEXT: pand %xmm6, %xmm4			; SSE41-NEXT: pand %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm5[1,1,3,3]			; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm1[2,3,0,1]			; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm1[2,3,0,1]
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: pxor %xmm3, %xmm0			; SSE41-NEXT: pxor %xmm3, %xmm0
	; SSE41-NEXT: pxor %xmm2, %xmm3			; SSE41-NEXT: pxor %xmm2, %xmm3
	; SSE41-NEXT: movdqa %xmm3, %xmm4			; SSE41-NEXT: movdqa %xmm3, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm4			; SSE41-NEXT: pcmpgtd %xmm0, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm3			; SSE41-NEXT: pcmpeqd %xmm0, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm3[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[1,1,3,3]
	; SSE41-NEXT: pand %xmm5, %xmm3			; SSE41-NEXT: pand %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm2
	; SSE41-NEXT: movq %xmm2, %rax			; SSE41-NEXT: movq %xmm2, %rax
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: test_v4i64:			; AVX1-LABEL: test_v4i64:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
	▲ Show 20 Lines • Show All 127 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: pxor %xmm5, %xmm0			; SSE41-NEXT: pxor %xmm5, %xmm0
	; SSE41-NEXT: movdqa %xmm3, %xmm6			; SSE41-NEXT: movdqa %xmm3, %xmm6
	; SSE41-NEXT: pxor %xmm5, %xmm6			; SSE41-NEXT: pxor %xmm5, %xmm6
	; SSE41-NEXT: movdqa %xmm6, %xmm7			; SSE41-NEXT: movdqa %xmm6, %xmm7
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm7			; SSE41-NEXT: pcmpgtd %xmm0, %xmm7
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm7[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm7[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm6			; SSE41-NEXT: pcmpeqd %xmm0, %xmm6
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm6[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm6[1,1,3,3]
	; SSE41-NEXT: pand %xmm4, %xmm6			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm7[1,1,3,3]			; SSE41-NEXT: por %xmm7, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm3			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm3
	; SSE41-NEXT: movdqa %xmm8, %xmm0			; SSE41-NEXT: movdqa %xmm8, %xmm0
	; SSE41-NEXT: pxor %xmm5, %xmm0			; SSE41-NEXT: pxor %xmm5, %xmm0
	; SSE41-NEXT: movdqa %xmm2, %xmm1			; SSE41-NEXT: movdqa %xmm2, %xmm1
	; SSE41-NEXT: pxor %xmm5, %xmm1			; SSE41-NEXT: pxor %xmm5, %xmm1
	; SSE41-NEXT: movdqa %xmm1, %xmm4			; SSE41-NEXT: movdqa %xmm1, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm4			; SSE41-NEXT: pcmpgtd %xmm0, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm1			; SSE41-NEXT: pcmpeqd %xmm0, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]
	; SSE41-NEXT: pand %xmm6, %xmm1			; SSE41-NEXT: pand %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm2
	; SSE41-NEXT: movapd %xmm2, %xmm0			; SSE41-NEXT: movapd %xmm2, %xmm0
	; SSE41-NEXT: xorpd %xmm5, %xmm0			; SSE41-NEXT: xorpd %xmm5, %xmm0
	; SSE41-NEXT: movapd %xmm3, %xmm1			; SSE41-NEXT: movapd %xmm3, %xmm1
	; SSE41-NEXT: xorpd %xmm5, %xmm1			; SSE41-NEXT: xorpd %xmm5, %xmm1
	; SSE41-NEXT: movapd %xmm1, %xmm4			; SSE41-NEXT: movapd %xmm1, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm4			; SSE41-NEXT: pcmpgtd %xmm0, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm1			; SSE41-NEXT: pcmpeqd %xmm0, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]
	; SSE41-NEXT: pand %xmm6, %xmm1			; SSE41-NEXT: pand %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm3			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm3[2,3,0,1]			; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm3[2,3,0,1]
	; SSE41-NEXT: movdqa %xmm3, %xmm0			; SSE41-NEXT: movdqa %xmm3, %xmm0
	; SSE41-NEXT: pxor %xmm5, %xmm0			; SSE41-NEXT: pxor %xmm5, %xmm0
	; SSE41-NEXT: pxor %xmm1, %xmm5			; SSE41-NEXT: pxor %xmm1, %xmm5
	; SSE41-NEXT: movdqa %xmm5, %xmm2			; SSE41-NEXT: movdqa %xmm5, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm2			; SSE41-NEXT: pcmpgtd %xmm0, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm5			; SSE41-NEXT: pcmpeqd %xmm0, %xmm5
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm5[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm5[1,1,3,3]
	; SSE41-NEXT: pand %xmm4, %xmm5			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm1
	; SSE41-NEXT: movq %xmm1, %rax			; SSE41-NEXT: movq %xmm1, %rax
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: test_v8i64:			; AVX1-LABEL: test_v8i64:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm3 = [9223372036854775808,9223372036854775808]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm3 = [9223372036854775808,9223372036854775808]
	▲ Show 20 Lines • Show All 192 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: movdqa %xmm2, %xmm10			; SSE41-NEXT: movdqa %xmm2, %xmm10
	; SSE41-NEXT: pxor %xmm9, %xmm10			; SSE41-NEXT: pxor %xmm9, %xmm10
	; SSE41-NEXT: movdqa %xmm6, %xmm0			; SSE41-NEXT: movdqa %xmm6, %xmm0
	; SSE41-NEXT: pxor %xmm9, %xmm0			; SSE41-NEXT: pxor %xmm9, %xmm0
	; SSE41-NEXT: movdqa %xmm0, %xmm11			; SSE41-NEXT: movdqa %xmm0, %xmm11
	; SSE41-NEXT: pcmpgtd %xmm10, %xmm11			; SSE41-NEXT: pcmpgtd %xmm10, %xmm11
	; SSE41-NEXT: pshufd {{.*#+}} xmm12 = xmm11[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm12 = xmm11[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm10, %xmm0			; SSE41-NEXT: pcmpeqd %xmm10, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm10 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm12, %xmm10			; SSE41-NEXT: pand %xmm12, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm11[1,1,3,3]			; SSE41-NEXT: por %xmm11, %xmm0
	; SSE41-NEXT: por %xmm10, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm6			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm6
	; SSE41-NEXT: movdqa %xmm8, %xmm0			; SSE41-NEXT: movdqa %xmm8, %xmm0
	; SSE41-NEXT: pxor %xmm9, %xmm0			; SSE41-NEXT: pxor %xmm9, %xmm0
	; SSE41-NEXT: movdqa %xmm4, %xmm2			; SSE41-NEXT: movdqa %xmm4, %xmm2
	; SSE41-NEXT: pxor %xmm9, %xmm2			; SSE41-NEXT: pxor %xmm9, %xmm2
	; SSE41-NEXT: movdqa %xmm2, %xmm10			; SSE41-NEXT: movdqa %xmm2, %xmm10
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm10			; SSE41-NEXT: pcmpgtd %xmm0, %xmm10
	; SSE41-NEXT: pshufd {{.*#+}} xmm11 = xmm10[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm11 = xmm10[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm2			; SSE41-NEXT: pcmpeqd %xmm0, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm2[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]
	; SSE41-NEXT: pand %xmm11, %xmm2			; SSE41-NEXT: pand %xmm11, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm10[1,1,3,3]			; SSE41-NEXT: por %xmm10, %xmm0
	; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm4			; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm4
	; SSE41-NEXT: movdqa %xmm3, %xmm0			; SSE41-NEXT: movdqa %xmm3, %xmm0
	; SSE41-NEXT: pxor %xmm9, %xmm0			; SSE41-NEXT: pxor %xmm9, %xmm0
	; SSE41-NEXT: movdqa %xmm7, %xmm2			; SSE41-NEXT: movdqa %xmm7, %xmm2
	; SSE41-NEXT: pxor %xmm9, %xmm2			; SSE41-NEXT: pxor %xmm9, %xmm2
	; SSE41-NEXT: movdqa %xmm2, %xmm8			; SSE41-NEXT: movdqa %xmm2, %xmm8
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm8			; SSE41-NEXT: pcmpgtd %xmm0, %xmm8
	; SSE41-NEXT: pshufd {{.*#+}} xmm10 = xmm8[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm10 = xmm8[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm2			; SSE41-NEXT: pcmpeqd %xmm0, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm2[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]
	; SSE41-NEXT: pand %xmm10, %xmm2			; SSE41-NEXT: pand %xmm10, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm8[1,1,3,3]			; SSE41-NEXT: por %xmm8, %xmm0
	; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm7			; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm7
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: pxor %xmm9, %xmm0			; SSE41-NEXT: pxor %xmm9, %xmm0
	; SSE41-NEXT: movdqa %xmm5, %xmm2			; SSE41-NEXT: movdqa %xmm5, %xmm2
	; SSE41-NEXT: pxor %xmm9, %xmm2			; SSE41-NEXT: pxor %xmm9, %xmm2
	; SSE41-NEXT: movdqa %xmm2, %xmm3			; SSE41-NEXT: movdqa %xmm2, %xmm3
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm3			; SSE41-NEXT: pcmpgtd %xmm0, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm8 = xmm3[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm8 = xmm3[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm2			; SSE41-NEXT: pcmpeqd %xmm0, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm2[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]
	; SSE41-NEXT: pand %xmm8, %xmm2			; SSE41-NEXT: pand %xmm8, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[1,1,3,3]			; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm5			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm5
	; SSE41-NEXT: movapd %xmm5, %xmm0			; SSE41-NEXT: movapd %xmm5, %xmm0
	; SSE41-NEXT: xorpd %xmm9, %xmm0			; SSE41-NEXT: xorpd %xmm9, %xmm0
	; SSE41-NEXT: movapd %xmm7, %xmm1			; SSE41-NEXT: movapd %xmm7, %xmm1
	; SSE41-NEXT: xorpd %xmm9, %xmm1			; SSE41-NEXT: xorpd %xmm9, %xmm1
	; SSE41-NEXT: movapd %xmm1, %xmm2			; SSE41-NEXT: movapd %xmm1, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm2			; SSE41-NEXT: pcmpgtd %xmm0, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm1			; SSE41-NEXT: pcmpeqd %xmm0, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]
	; SSE41-NEXT: pand %xmm3, %xmm1			; SSE41-NEXT: pand %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm5, %xmm7			; SSE41-NEXT: blendvpd %xmm0, %xmm5, %xmm7
	; SSE41-NEXT: movapd %xmm4, %xmm0			; SSE41-NEXT: movapd %xmm4, %xmm0
	; SSE41-NEXT: xorpd %xmm9, %xmm0			; SSE41-NEXT: xorpd %xmm9, %xmm0
	; SSE41-NEXT: movapd %xmm6, %xmm1			; SSE41-NEXT: movapd %xmm6, %xmm1
	; SSE41-NEXT: xorpd %xmm9, %xmm1			; SSE41-NEXT: xorpd %xmm9, %xmm1
	; SSE41-NEXT: movapd %xmm1, %xmm2			; SSE41-NEXT: movapd %xmm1, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm2			; SSE41-NEXT: pcmpgtd %xmm0, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm1			; SSE41-NEXT: pcmpeqd %xmm0, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]
	; SSE41-NEXT: pand %xmm3, %xmm1			; SSE41-NEXT: pand %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm6			; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm6
	; SSE41-NEXT: movapd %xmm6, %xmm0			; SSE41-NEXT: movapd %xmm6, %xmm0
	; SSE41-NEXT: xorpd %xmm9, %xmm0			; SSE41-NEXT: xorpd %xmm9, %xmm0
	; SSE41-NEXT: movapd %xmm7, %xmm1			; SSE41-NEXT: movapd %xmm7, %xmm1
	; SSE41-NEXT: xorpd %xmm9, %xmm1			; SSE41-NEXT: xorpd %xmm9, %xmm1
	; SSE41-NEXT: movapd %xmm1, %xmm2			; SSE41-NEXT: movapd %xmm1, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm2			; SSE41-NEXT: pcmpgtd %xmm0, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm1			; SSE41-NEXT: pcmpeqd %xmm0, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]
	; SSE41-NEXT: pand %xmm3, %xmm1			; SSE41-NEXT: pand %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm6, %xmm7			; SSE41-NEXT: blendvpd %xmm0, %xmm6, %xmm7
	; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm7[2,3,0,1]			; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm7[2,3,0,1]
	; SSE41-NEXT: movdqa %xmm7, %xmm0			; SSE41-NEXT: movdqa %xmm7, %xmm0
	; SSE41-NEXT: pxor %xmm9, %xmm0			; SSE41-NEXT: pxor %xmm9, %xmm0
	; SSE41-NEXT: pxor %xmm1, %xmm9			; SSE41-NEXT: pxor %xmm1, %xmm9
	; SSE41-NEXT: movdqa %xmm9, %xmm2			; SSE41-NEXT: movdqa %xmm9, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm2			; SSE41-NEXT: pcmpgtd %xmm0, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm9			; SSE41-NEXT: pcmpeqd %xmm0, %xmm9
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm9[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm9[1,1,3,3]
	; SSE41-NEXT: pand %xmm3, %xmm4			; SSE41-NEXT: pand %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm7, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm7, %xmm1
	; SSE41-NEXT: movq %xmm1, %rax			; SSE41-NEXT: movq %xmm1, %rax
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: test_v16i64:			; AVX1-LABEL: test_v16i64:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm5			; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm5
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [9223372036854775808,9223372036854775808]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [9223372036854775808,9223372036854775808]
	▲ Show 20 Lines • Show All 125 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: movdqa {{.*#+}} xmm0 = [2147483648,2147483648]			; SSE41-NEXT: movdqa {{.*#+}} xmm0 = [2147483648,2147483648]
	; SSE41-NEXT: movdqa %xmm1, %xmm3			; SSE41-NEXT: movdqa %xmm1, %xmm3
	; SSE41-NEXT: pxor %xmm0, %xmm3			; SSE41-NEXT: pxor %xmm0, %xmm3
	; SSE41-NEXT: pxor %xmm2, %xmm0			; SSE41-NEXT: pxor %xmm2, %xmm0
	; SSE41-NEXT: movdqa %xmm0, %xmm4			; SSE41-NEXT: movdqa %xmm0, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm3, %xmm4			; SSE41-NEXT: pcmpgtd %xmm3, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm3, %xmm0			; SSE41-NEXT: pcmpeqd %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm5, %xmm3			; SSE41-NEXT: pand %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm2
	; SSE41-NEXT: movd %xmm2, %eax			; SSE41-NEXT: movd %xmm2, %eax
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: test_v2i32:			; AVX1-LABEL: test_v2i32:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX1-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX1-NEXT: vpblendw {{.*#+}} xmm1 = xmm0[0,1],xmm1[2,3],xmm0[4,5],xmm1[6,7]			; AVX1-NEXT: vpblendw {{.*#+}} xmm1 = xmm0[0,1],xmm1[2,3],xmm0[4,5],xmm1[6,7]
	▲ Show 20 Lines • Show All 469 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: movdqa {{.*#+}} xmm0 = [2147483648,2147483648]			; SSE41-NEXT: movdqa {{.*#+}} xmm0 = [2147483648,2147483648]
	; SSE41-NEXT: movdqa %xmm1, %xmm3			; SSE41-NEXT: movdqa %xmm1, %xmm3
	; SSE41-NEXT: por %xmm0, %xmm3			; SSE41-NEXT: por %xmm0, %xmm3
	; SSE41-NEXT: por %xmm2, %xmm0			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: movdqa %xmm0, %xmm4			; SSE41-NEXT: movdqa %xmm0, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm3, %xmm4			; SSE41-NEXT: pcmpgtd %xmm3, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm3, %xmm0			; SSE41-NEXT: pcmpeqd %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm5, %xmm3			; SSE41-NEXT: pand %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm2
	; SSE41-NEXT: movd %xmm2, %eax			; SSE41-NEXT: movd %xmm2, %eax
	; SSE41-NEXT: # kill: def $ax killed $ax killed $eax			; SSE41-NEXT: # kill: def $ax killed $ax killed $eax
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX-LABEL: test_v2i16:			; AVX-LABEL: test_v2i16:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX-NEXT: vpxor %xmm1, %xmm1, %xmm1
	▲ Show 20 Lines • Show All 443 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: movdqa {{.*#+}} xmm0 = [2147483648,2147483648]			; SSE41-NEXT: movdqa {{.*#+}} xmm0 = [2147483648,2147483648]
	; SSE41-NEXT: movdqa %xmm1, %xmm3			; SSE41-NEXT: movdqa %xmm1, %xmm3
	; SSE41-NEXT: por %xmm0, %xmm3			; SSE41-NEXT: por %xmm0, %xmm3
	; SSE41-NEXT: por %xmm2, %xmm0			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: movdqa %xmm0, %xmm4			; SSE41-NEXT: movdqa %xmm0, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm3, %xmm4			; SSE41-NEXT: pcmpgtd %xmm3, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm3, %xmm0			; SSE41-NEXT: pcmpeqd %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm5, %xmm3			; SSE41-NEXT: pand %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm2
	; SSE41-NEXT: pextrb $0, %xmm2, %eax			; SSE41-NEXT: pextrb $0, %xmm2, %eax
	; SSE41-NEXT: # kill: def $al killed $al killed $eax			; SSE41-NEXT: # kill: def $al killed $al killed $eax
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX-LABEL: test_v2i8:			; AVX-LABEL: test_v2i8:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vpand {{.*}}(%rip), %xmm0, %xmm1			; AVX-NEXT: vpand {{.*}}(%rip), %xmm0, %xmm1
	▲ Show 20 Lines • Show All 529 Lines • Show Last 20 Lines

llvm/trunk/test/CodeGen/X86/vector-trunc-packus-widen.ll

	Show First 20 Lines • Show All 125 Lines • ▼ Show 20 Lines
	; SSSE3-NEXT: pand %xmm3, %xmm0			; SSSE3-NEXT: pand %xmm3, %xmm0
	; SSSE3-NEXT: shufps {{.*#+}} xmm0 = xmm0[0,2],xmm1[0,2]			; SSSE3-NEXT: shufps {{.*#+}} xmm0 = xmm0[0,2],xmm1[0,2]
	; SSSE3-NEXT: retq			; SSSE3-NEXT: retq
	;			;
	; SSE41-LABEL: trunc_packus_v4i64_v4i32:			; SSE41-LABEL: trunc_packus_v4i64_v4i32:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movdqa %xmm0, %xmm2			; SSE41-NEXT: movdqa %xmm0, %xmm2
	; SSE41-NEXT: movapd {{.*#+}} xmm4 = [4294967295,4294967295]			; SSE41-NEXT: movapd {{.*#+}} xmm4 = [4294967295,4294967295]
	; SSE41-NEXT: movdqa {{.*#+}} xmm8 = [2147483648,2147483648]			; SSE41-NEXT: movdqa {{.*#+}} xmm3 = [2147483648,2147483648]
	; SSE41-NEXT: pxor %xmm8, %xmm0			; SSE41-NEXT: pxor %xmm3, %xmm0
	; SSE41-NEXT: movdqa {{.*#+}} xmm6 = [2147483647,2147483647]			; SSE41-NEXT: movdqa {{.*#+}} xmm6 = [2147483647,2147483647]
	; SSE41-NEXT: movdqa %xmm6, %xmm5			; SSE41-NEXT: movdqa %xmm6, %xmm5
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm5			; SSE41-NEXT: pcmpgtd %xmm0, %xmm5
	; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm5[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm5[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm6, %xmm0			; SSE41-NEXT: pcmpeqd %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm7, %xmm3			; SSE41-NEXT: pand %xmm7, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm5[1,1,3,3]			; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: movapd %xmm4, %xmm5			; SSE41-NEXT: movapd %xmm4, %xmm5
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm5			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm5
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: pxor %xmm8, %xmm0			; SSE41-NEXT: pxor %xmm3, %xmm0
	; SSE41-NEXT: movdqa %xmm6, %xmm2			; SSE41-NEXT: movdqa %xmm6, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm2			; SSE41-NEXT: pcmpgtd %xmm0, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm6, %xmm0			; SSE41-NEXT: pcmpeqd %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm3, %xmm6			; SSE41-NEXT: pand %xmm7, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm4			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm4
	; SSE41-NEXT: xorpd %xmm1, %xmm1			; SSE41-NEXT: xorpd %xmm1, %xmm1
	; SSE41-NEXT: movapd %xmm4, %xmm0			; SSE41-NEXT: movapd %xmm4, %xmm0
	; SSE41-NEXT: xorpd %xmm8, %xmm0			; SSE41-NEXT: xorpd %xmm3, %xmm0
	; SSE41-NEXT: movapd %xmm0, %xmm2			; SSE41-NEXT: movapd %xmm0, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm8, %xmm2			; SSE41-NEXT: pcmpgtd %xmm3, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm8, %xmm0			; SSE41-NEXT: pcmpeqd %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm3, %xmm6			; SSE41-NEXT: pand %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: pxor %xmm2, %xmm2			; SSE41-NEXT: pxor %xmm2, %xmm2
	; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm2
	; SSE41-NEXT: movapd %xmm5, %xmm0			; SSE41-NEXT: movapd %xmm5, %xmm0
	; SSE41-NEXT: xorpd %xmm8, %xmm0			; SSE41-NEXT: xorpd %xmm3, %xmm0
	; SSE41-NEXT: movapd %xmm0, %xmm3			; SSE41-NEXT: movapd %xmm0, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm8, %xmm3			; SSE41-NEXT: pcmpgtd %xmm3, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm3[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm8, %xmm0			; SSE41-NEXT: pcmpeqd %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm4, %xmm6			; SSE41-NEXT: pand %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm5, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm5, %xmm1
	; SSE41-NEXT: shufps {{.*#+}} xmm1 = xmm1[0,2],xmm2[0,2]			; SSE41-NEXT: shufps {{.*#+}} xmm1 = xmm1[0,2],xmm2[0,2]
	; SSE41-NEXT: movaps %xmm1, %xmm0			; SSE41-NEXT: movaps %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: trunc_packus_v4i64_v4i32:			; AVX1-LABEL: trunc_packus_v4i64_v4i32:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vmovapd {{.*#+}} ymm1 = [4294967295,4294967295,4294967295,4294967295]			; AVX1-NEXT: vmovapd {{.*#+}} ymm1 = [4294967295,4294967295,4294967295,4294967295]
	▲ Show 20 Lines • Show All 304 Lines • ▼ Show 20 Lines
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movdqa %xmm0, %xmm4			; SSE41-NEXT: movdqa %xmm0, %xmm4
	; SSE41-NEXT: movapd {{.*#+}} xmm7 = [4294967295,4294967295]			; SSE41-NEXT: movapd {{.*#+}} xmm7 = [4294967295,4294967295]
	; SSE41-NEXT: movdqa {{.*#+}} xmm10 = [2147483648,2147483648]			; SSE41-NEXT: movdqa {{.*#+}} xmm10 = [2147483648,2147483648]
	; SSE41-NEXT: pxor %xmm10, %xmm0			; SSE41-NEXT: pxor %xmm10, %xmm0
	; SSE41-NEXT: movdqa {{.*#+}} xmm11 = [2147483647,2147483647]			; SSE41-NEXT: movdqa {{.*#+}} xmm11 = [2147483647,2147483647]
	; SSE41-NEXT: movdqa %xmm11, %xmm6			; SSE41-NEXT: movdqa %xmm11, %xmm6
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm6			; SSE41-NEXT: pcmpgtd %xmm0, %xmm6
	; SSE41-NEXT: pshufd {{.*#+}} xmm8 = xmm6[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm6[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm11, %xmm0			; SSE41-NEXT: pcmpeqd %xmm11, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm8, %xmm5			; SSE41-NEXT: pand %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm6[1,1,3,3]			; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: movapd %xmm7, %xmm8			; SSE41-NEXT: movapd %xmm7, %xmm8
	; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm8			; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm8
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: pxor %xmm10, %xmm0			; SSE41-NEXT: pxor %xmm10, %xmm0
	; SSE41-NEXT: movdqa %xmm11, %xmm4			; SSE41-NEXT: movdqa %xmm11, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm4			; SSE41-NEXT: pcmpgtd %xmm0, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm11, %xmm0			; SSE41-NEXT: pcmpeqd %xmm11, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm5, %xmm6			; SSE41-NEXT: pand %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: movapd %xmm7, %xmm9			; SSE41-NEXT: movapd %xmm7, %xmm9
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm9			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm9
	; SSE41-NEXT: movdqa %xmm2, %xmm0			; SSE41-NEXT: movdqa %xmm2, %xmm0
	; SSE41-NEXT: pxor %xmm10, %xmm0			; SSE41-NEXT: pxor %xmm10, %xmm0
	; SSE41-NEXT: movdqa %xmm11, %xmm1			; SSE41-NEXT: movdqa %xmm11, %xmm1
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm1			; SSE41-NEXT: pcmpgtd %xmm0, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm1[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm1[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm11, %xmm0			; SSE41-NEXT: pcmpeqd %xmm11, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm4, %xmm5			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]			; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: movapd %xmm7, %xmm4			; SSE41-NEXT: movapd %xmm7, %xmm4
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm4			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm4
	; SSE41-NEXT: movdqa %xmm3, %xmm0			; SSE41-NEXT: movdqa %xmm3, %xmm0
	; SSE41-NEXT: pxor %xmm10, %xmm0			; SSE41-NEXT: pxor %xmm10, %xmm0
	; SSE41-NEXT: movdqa %xmm11, %xmm1			; SSE41-NEXT: movdqa %xmm11, %xmm1
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm1			; SSE41-NEXT: pcmpgtd %xmm0, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm1[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm1[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm11, %xmm0			; SSE41-NEXT: pcmpeqd %xmm11, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm2, %xmm5			; SSE41-NEXT: pand %xmm2, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]			; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm7			; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm7
	; SSE41-NEXT: pxor %xmm2, %xmm2			; SSE41-NEXT: pxor %xmm2, %xmm2
	; SSE41-NEXT: movapd %xmm7, %xmm0			; SSE41-NEXT: movapd %xmm7, %xmm0
	; SSE41-NEXT: xorpd %xmm10, %xmm0			; SSE41-NEXT: xorpd %xmm10, %xmm0
	; SSE41-NEXT: movapd %xmm0, %xmm1			; SSE41-NEXT: movapd %xmm0, %xmm1
	; SSE41-NEXT: pcmpgtd %xmm10, %xmm1			; SSE41-NEXT: pcmpgtd %xmm10, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm1[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm1[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm10, %xmm0			; SSE41-NEXT: pcmpeqd %xmm10, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm3, %xmm5			; SSE41-NEXT: pand %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]			; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: pxor %xmm3, %xmm3			; SSE41-NEXT: pxor %xmm3, %xmm3
	; SSE41-NEXT: blendvpd %xmm0, %xmm7, %xmm3			; SSE41-NEXT: blendvpd %xmm0, %xmm7, %xmm3
	; SSE41-NEXT: movapd %xmm4, %xmm0			; SSE41-NEXT: movapd %xmm4, %xmm0
	; SSE41-NEXT: xorpd %xmm10, %xmm0			; SSE41-NEXT: xorpd %xmm10, %xmm0
	; SSE41-NEXT: movapd %xmm0, %xmm1			; SSE41-NEXT: movapd %xmm0, %xmm1
	; SSE41-NEXT: pcmpgtd %xmm10, %xmm1			; SSE41-NEXT: pcmpgtd %xmm10, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm1[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm1[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm10, %xmm0			; SSE41-NEXT: pcmpeqd %xmm10, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm5, %xmm6			; SSE41-NEXT: pand %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]			; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: pxor %xmm1, %xmm1			; SSE41-NEXT: pxor %xmm1, %xmm1
	; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm1
	; SSE41-NEXT: shufps {{.*#+}} xmm1 = xmm1[0,2],xmm3[0,2]			; SSE41-NEXT: shufps {{.*#+}} xmm1 = xmm1[0,2],xmm3[0,2]
	; SSE41-NEXT: movapd %xmm9, %xmm0			; SSE41-NEXT: movapd %xmm9, %xmm0
	; SSE41-NEXT: xorpd %xmm10, %xmm0			; SSE41-NEXT: xorpd %xmm10, %xmm0
	; SSE41-NEXT: movapd %xmm0, %xmm3			; SSE41-NEXT: movapd %xmm0, %xmm3
	; SSE41-NEXT: pcmpgtd %xmm10, %xmm3			; SSE41-NEXT: pcmpgtd %xmm10, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm3[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm3[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm10, %xmm0			; SSE41-NEXT: pcmpeqd %xmm10, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm4, %xmm5			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[1,1,3,3]			; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: pxor %xmm3, %xmm3			; SSE41-NEXT: pxor %xmm3, %xmm3
	; SSE41-NEXT: blendvpd %xmm0, %xmm9, %xmm3			; SSE41-NEXT: blendvpd %xmm0, %xmm9, %xmm3
	; SSE41-NEXT: movapd %xmm8, %xmm0			; SSE41-NEXT: movapd %xmm8, %xmm0
	; SSE41-NEXT: xorpd %xmm10, %xmm0			; SSE41-NEXT: xorpd %xmm10, %xmm0
	; SSE41-NEXT: movapd %xmm0, %xmm4			; SSE41-NEXT: movapd %xmm0, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm10, %xmm4			; SSE41-NEXT: pcmpgtd %xmm10, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm10, %xmm0			; SSE41-NEXT: pcmpeqd %xmm10, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm5, %xmm6			; SSE41-NEXT: pand %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm2
	; SSE41-NEXT: shufps {{.*#+}} xmm2 = xmm2[0,2],xmm3[0,2]			; SSE41-NEXT: shufps {{.*#+}} xmm2 = xmm2[0,2],xmm3[0,2]
	; SSE41-NEXT: movaps %xmm2, %xmm0			; SSE41-NEXT: movaps %xmm2, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: trunc_packus_v8i64_v8i32:			; AVX1-LABEL: trunc_packus_v8i64_v8i32:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vmovapd {{.*#+}} ymm2 = [4294967295,4294967295,4294967295,4294967295]			; AVX1-NEXT: vmovapd {{.*#+}} ymm2 = [4294967295,4294967295,4294967295,4294967295]
	▲ Show 20 Lines • Show All 310 Lines • ▼ Show 20 Lines
	;			;
	; SSE41-LABEL: trunc_packus_v8i64_v8i16:			; SSE41-LABEL: trunc_packus_v8i64_v8i16:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movdqa %xmm0, %xmm9			; SSE41-NEXT: movdqa %xmm0, %xmm9
	; SSE41-NEXT: movapd {{.*#+}} xmm7 = [65535,65535]			; SSE41-NEXT: movapd {{.*#+}} xmm7 = [65535,65535]
	; SSE41-NEXT: movdqa {{.*#+}} xmm10 = [2147483648,2147483648]			; SSE41-NEXT: movdqa {{.*#+}} xmm10 = [2147483648,2147483648]
	; SSE41-NEXT: movdqa %xmm2, %xmm0			; SSE41-NEXT: movdqa %xmm2, %xmm0
	; SSE41-NEXT: pxor %xmm10, %xmm0			; SSE41-NEXT: pxor %xmm10, %xmm0
	; SSE41-NEXT: movdqa {{.*#+}} xmm11 = [2147549183,2147549183]			; SSE41-NEXT: movdqa {{.*#+}} xmm6 = [2147549183,2147549183]
	; SSE41-NEXT: movdqa %xmm11, %xmm4			; SSE41-NEXT: movdqa %xmm6, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm4			; SSE41-NEXT: pcmpgtd %xmm0, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm11, %xmm0			; SSE41-NEXT: pcmpeqd %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm5, %xmm6			; SSE41-NEXT: pand %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: movapd %xmm7, %xmm8			; SSE41-NEXT: movapd %xmm7, %xmm8
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm8			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm8
	; SSE41-NEXT: movdqa %xmm3, %xmm0			; SSE41-NEXT: movdqa %xmm3, %xmm0
	; SSE41-NEXT: pxor %xmm10, %xmm0			; SSE41-NEXT: pxor %xmm10, %xmm0
	; SSE41-NEXT: movdqa %xmm11, %xmm2			; SSE41-NEXT: movdqa %xmm6, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm2			; SSE41-NEXT: pcmpgtd %xmm0, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm11, %xmm0			; SSE41-NEXT: pcmpeqd %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm4, %xmm5			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: movapd %xmm7, %xmm2			; SSE41-NEXT: movapd %xmm7, %xmm2
	; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm2
	; SSE41-NEXT: movdqa %xmm9, %xmm0			; SSE41-NEXT: movdqa %xmm9, %xmm0
	; SSE41-NEXT: pxor %xmm10, %xmm0			; SSE41-NEXT: pxor %xmm10, %xmm0
	; SSE41-NEXT: movdqa %xmm11, %xmm3			; SSE41-NEXT: movdqa %xmm6, %xmm3
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm3			; SSE41-NEXT: pcmpgtd %xmm0, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm3[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm3[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm11, %xmm0			; SSE41-NEXT: pcmpeqd %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm4, %xmm5			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[1,1,3,3]			; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: movapd %xmm7, %xmm4			; SSE41-NEXT: movapd %xmm7, %xmm4
	; SSE41-NEXT: blendvpd %xmm0, %xmm9, %xmm4			; SSE41-NEXT: blendvpd %xmm0, %xmm9, %xmm4
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: pxor %xmm10, %xmm0			; SSE41-NEXT: pxor %xmm10, %xmm0
	; SSE41-NEXT: movdqa %xmm11, %xmm3			; SSE41-NEXT: movdqa %xmm6, %xmm3
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm3			; SSE41-NEXT: pcmpgtd %xmm0, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm3[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm3[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm11, %xmm0			; SSE41-NEXT: pcmpeqd %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm5, %xmm6			; SSE41-NEXT: pand %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[1,1,3,3]			; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm7			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm7
	; SSE41-NEXT: pxor %xmm3, %xmm3			; SSE41-NEXT: pxor %xmm3, %xmm3
	; SSE41-NEXT: movapd %xmm7, %xmm0			; SSE41-NEXT: movapd %xmm7, %xmm0
	; SSE41-NEXT: xorpd %xmm10, %xmm0			; SSE41-NEXT: xorpd %xmm10, %xmm0
	; SSE41-NEXT: movapd %xmm0, %xmm1			; SSE41-NEXT: movapd %xmm0, %xmm1
	; SSE41-NEXT: pcmpgtd %xmm10, %xmm1			; SSE41-NEXT: pcmpgtd %xmm10, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm1[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm1[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm10, %xmm0			; SSE41-NEXT: pcmpeqd %xmm10, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm5, %xmm6			; SSE41-NEXT: pand %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]			; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: pxor %xmm5, %xmm5			; SSE41-NEXT: pxor %xmm5, %xmm5
	; SSE41-NEXT: blendvpd %xmm0, %xmm7, %xmm5			; SSE41-NEXT: blendvpd %xmm0, %xmm7, %xmm5
	; SSE41-NEXT: movapd %xmm4, %xmm0			; SSE41-NEXT: movapd %xmm4, %xmm0
	; SSE41-NEXT: xorpd %xmm10, %xmm0			; SSE41-NEXT: xorpd %xmm10, %xmm0
	; SSE41-NEXT: movapd %xmm0, %xmm1			; SSE41-NEXT: movapd %xmm0, %xmm1
	; SSE41-NEXT: pcmpgtd %xmm10, %xmm1			; SSE41-NEXT: pcmpgtd %xmm10, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm1[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm1[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm10, %xmm0			; SSE41-NEXT: pcmpeqd %xmm10, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm6, %xmm7			; SSE41-NEXT: pand %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]			; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: por %xmm7, %xmm0
	; SSE41-NEXT: pxor %xmm1, %xmm1			; SSE41-NEXT: pxor %xmm1, %xmm1
	; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm1
	; SSE41-NEXT: packusdw %xmm5, %xmm1			; SSE41-NEXT: packusdw %xmm5, %xmm1
	; SSE41-NEXT: movapd %xmm2, %xmm0			; SSE41-NEXT: movapd %xmm2, %xmm0
	; SSE41-NEXT: xorpd %xmm10, %xmm0			; SSE41-NEXT: xorpd %xmm10, %xmm0
	; SSE41-NEXT: movapd %xmm0, %xmm4			; SSE41-NEXT: movapd %xmm0, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm10, %xmm4			; SSE41-NEXT: pcmpgtd %xmm10, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm10, %xmm0			; SSE41-NEXT: pcmpeqd %xmm10, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm5, %xmm6			; SSE41-NEXT: pand %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: pxor %xmm4, %xmm4			; SSE41-NEXT: pxor %xmm4, %xmm4
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm4			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm4
	; SSE41-NEXT: movapd %xmm8, %xmm0			; SSE41-NEXT: movapd %xmm8, %xmm0
	; SSE41-NEXT: xorpd %xmm10, %xmm0			; SSE41-NEXT: xorpd %xmm10, %xmm0
	; SSE41-NEXT: movapd %xmm0, %xmm2			; SSE41-NEXT: movapd %xmm0, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm10, %xmm2			; SSE41-NEXT: pcmpgtd %xmm10, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm10, %xmm0			; SSE41-NEXT: pcmpeqd %xmm10, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm5, %xmm6			; SSE41-NEXT: pand %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm3			; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm3
	; SSE41-NEXT: packusdw %xmm4, %xmm3			; SSE41-NEXT: packusdw %xmm4, %xmm3
	; SSE41-NEXT: packusdw %xmm3, %xmm1			; SSE41-NEXT: packusdw %xmm3, %xmm1
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: trunc_packus_v8i64_v8i16:			; AVX1-LABEL: trunc_packus_v8i64_v8i16:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	▲ Show 20 Lines • Show All 537 Lines • ▼ Show 20 Lines
	; SSSE3-NEXT: packuswb %xmm4, %xmm0			; SSSE3-NEXT: packuswb %xmm4, %xmm0
	; SSSE3-NEXT: packuswb %xmm0, %xmm0			; SSSE3-NEXT: packuswb %xmm0, %xmm0
	; SSSE3-NEXT: retq			; SSSE3-NEXT: retq
	;			;
	; SSE41-LABEL: trunc_packus_v8i64_v8i8:			; SSE41-LABEL: trunc_packus_v8i64_v8i8:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movdqa %xmm0, %xmm9			; SSE41-NEXT: movdqa %xmm0, %xmm9
	; SSE41-NEXT: movapd {{.*#+}} xmm8 = [255,255]			; SSE41-NEXT: movapd {{.*#+}} xmm8 = [255,255]
	; SSE41-NEXT: movdqa {{.*#+}} xmm10 = [2147483648,2147483648]			; SSE41-NEXT: movdqa {{.*#+}} xmm6 = [2147483648,2147483648]
	; SSE41-NEXT: movdqa %xmm3, %xmm0			; SSE41-NEXT: movdqa %xmm3, %xmm0
	; SSE41-NEXT: pxor %xmm10, %xmm0			; SSE41-NEXT: pxor %xmm6, %xmm0
	; SSE41-NEXT: movdqa {{.*#+}} xmm5 = [2147483903,2147483903]			; SSE41-NEXT: movdqa {{.*#+}} xmm5 = [2147483903,2147483903]
	; SSE41-NEXT: movdqa %xmm5, %xmm4			; SSE41-NEXT: movdqa %xmm5, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm4			; SSE41-NEXT: pcmpgtd %xmm0, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm5, %xmm0			; SSE41-NEXT: pcmpeqd %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm7, %xmm6			; SSE41-NEXT: pand %xmm7, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0			; SSE41-NEXT: movapd %xmm8, %xmm10
	; SSE41-NEXT: movapd %xmm8, %xmm11			; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm10
	; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm11
	; SSE41-NEXT: movdqa %xmm2, %xmm0			; SSE41-NEXT: movdqa %xmm2, %xmm0
	; SSE41-NEXT: pxor %xmm10, %xmm0			; SSE41-NEXT: pxor %xmm6, %xmm0
	; SSE41-NEXT: movdqa %xmm5, %xmm3			; SSE41-NEXT: movdqa %xmm5, %xmm3
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm3			; SSE41-NEXT: pcmpgtd %xmm0, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm3[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm3[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm5, %xmm0			; SSE41-NEXT: pcmpeqd %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm4, %xmm6			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[1,1,3,3]			; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: movapd %xmm8, %xmm3			; SSE41-NEXT: movapd %xmm8, %xmm3
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm3			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm3
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: pxor %xmm10, %xmm0			; SSE41-NEXT: pxor %xmm6, %xmm0
	; SSE41-NEXT: movdqa %xmm5, %xmm2			; SSE41-NEXT: movdqa %xmm5, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm2			; SSE41-NEXT: pcmpgtd %xmm0, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm5, %xmm0			; SSE41-NEXT: pcmpeqd %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm4, %xmm6			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: movapd %xmm8, %xmm4			; SSE41-NEXT: movapd %xmm8, %xmm4
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm4			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm4
	; SSE41-NEXT: movdqa %xmm9, %xmm0			; SSE41-NEXT: movdqa %xmm9, %xmm0
	; SSE41-NEXT: pxor %xmm10, %xmm0			; SSE41-NEXT: pxor %xmm6, %xmm0
	; SSE41-NEXT: movdqa %xmm5, %xmm1			; SSE41-NEXT: movdqa %xmm5, %xmm1
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm1			; SSE41-NEXT: pcmpgtd %xmm0, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm1[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm1[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm5, %xmm0			; SSE41-NEXT: pcmpeqd %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm2, %xmm5			; SSE41-NEXT: pand %xmm2, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]			; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: movapd %xmm8, %xmm5			; SSE41-NEXT: movapd %xmm8, %xmm5
	; SSE41-NEXT: blendvpd %xmm0, %xmm9, %xmm5			; SSE41-NEXT: blendvpd %xmm0, %xmm9, %xmm5
	; SSE41-NEXT: movapd %xmm5, %xmm0			; SSE41-NEXT: movapd %xmm5, %xmm0
	; SSE41-NEXT: xorpd %xmm10, %xmm0			; SSE41-NEXT: xorpd %xmm6, %xmm0
	; SSE41-NEXT: movapd %xmm0, %xmm1			; SSE41-NEXT: movapd %xmm0, %xmm1
	; SSE41-NEXT: pcmpgtd %xmm10, %xmm1			; SSE41-NEXT: pcmpgtd %xmm6, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm1[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm1[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm10, %xmm0			; SSE41-NEXT: pcmpeqd %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm2, %xmm6			; SSE41-NEXT: pand %xmm2, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]			; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: pxor %xmm2, %xmm2			; SSE41-NEXT: pxor %xmm2, %xmm2
	; SSE41-NEXT: pxor %xmm1, %xmm1			; SSE41-NEXT: pxor %xmm1, %xmm1
	; SSE41-NEXT: blendvpd %xmm0, %xmm5, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm5, %xmm1
	; SSE41-NEXT: movapd %xmm4, %xmm0			; SSE41-NEXT: movapd %xmm4, %xmm0
	; SSE41-NEXT: xorpd %xmm10, %xmm0			; SSE41-NEXT: xorpd %xmm6, %xmm0
	; SSE41-NEXT: movapd %xmm0, %xmm5			; SSE41-NEXT: movapd %xmm0, %xmm5
	; SSE41-NEXT: pcmpgtd %xmm10, %xmm5			; SSE41-NEXT: pcmpgtd %xmm6, %xmm5
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm5[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm5[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm10, %xmm0			; SSE41-NEXT: pcmpeqd %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm6, %xmm7			; SSE41-NEXT: pand %xmm7, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm5[1,1,3,3]			; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: por %xmm7, %xmm0
	; SSE41-NEXT: pxor %xmm5, %xmm5			; SSE41-NEXT: pxor %xmm5, %xmm5
	; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm5			; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm5
	; SSE41-NEXT: movapd %xmm3, %xmm0			; SSE41-NEXT: movapd %xmm3, %xmm0
	; SSE41-NEXT: xorpd %xmm10, %xmm0			; SSE41-NEXT: xorpd %xmm6, %xmm0
	; SSE41-NEXT: movapd %xmm0, %xmm4			; SSE41-NEXT: movapd %xmm0, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm10, %xmm4			; SSE41-NEXT: pcmpgtd %xmm6, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm10, %xmm0			; SSE41-NEXT: pcmpeqd %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm6, %xmm7			; SSE41-NEXT: pand %xmm7, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm7, %xmm0
	; SSE41-NEXT: pxor %xmm4, %xmm4			; SSE41-NEXT: pxor %xmm4, %xmm4
	; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm4			; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm4
	; SSE41-NEXT: movapd %xmm11, %xmm0			; SSE41-NEXT: movapd %xmm10, %xmm0
	; SSE41-NEXT: xorpd %xmm10, %xmm0			; SSE41-NEXT: xorpd %xmm6, %xmm0
	; SSE41-NEXT: movapd %xmm0, %xmm3			; SSE41-NEXT: movapd %xmm0, %xmm3
	; SSE41-NEXT: pcmpgtd %xmm10, %xmm3			; SSE41-NEXT: pcmpgtd %xmm6, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm3[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm3[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm10, %xmm0			; SSE41-NEXT: pcmpeqd %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm6, %xmm7			; SSE41-NEXT: pand %xmm7, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[1,1,3,3]			; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: por %xmm7, %xmm0			; SSE41-NEXT: blendvpd %xmm0, %xmm10, %xmm2
	; SSE41-NEXT: blendvpd %xmm0, %xmm11, %xmm2
	; SSE41-NEXT: andpd %xmm8, %xmm2			; SSE41-NEXT: andpd %xmm8, %xmm2
	; SSE41-NEXT: andpd %xmm8, %xmm4			; SSE41-NEXT: andpd %xmm8, %xmm4
	; SSE41-NEXT: packusdw %xmm2, %xmm4			; SSE41-NEXT: packusdw %xmm2, %xmm4
	; SSE41-NEXT: andpd %xmm8, %xmm5			; SSE41-NEXT: andpd %xmm8, %xmm5
	; SSE41-NEXT: andpd %xmm8, %xmm1			; SSE41-NEXT: andpd %xmm8, %xmm1
	; SSE41-NEXT: packusdw %xmm5, %xmm1			; SSE41-NEXT: packusdw %xmm5, %xmm1
	; SSE41-NEXT: packusdw %xmm4, %xmm1			; SSE41-NEXT: packusdw %xmm4, %xmm1
	; SSE41-NEXT: packuswb %xmm1, %xmm1			; SSE41-NEXT: packuswb %xmm1, %xmm1
	▲ Show 20 Lines • Show All 304 Lines • ▼ Show 20 Lines
	; SSSE3-NEXT: packuswb %xmm0, %xmm0			; SSSE3-NEXT: packuswb %xmm0, %xmm0
	; SSSE3-NEXT: movq %xmm0, (%rdi)			; SSSE3-NEXT: movq %xmm0, (%rdi)
	; SSSE3-NEXT: retq			; SSSE3-NEXT: retq
	;			;
	; SSE41-LABEL: trunc_packus_v8i64_v8i8_store:			; SSE41-LABEL: trunc_packus_v8i64_v8i8_store:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movdqa %xmm0, %xmm9			; SSE41-NEXT: movdqa %xmm0, %xmm9
	; SSE41-NEXT: movapd {{.*#+}} xmm8 = [255,255]			; SSE41-NEXT: movapd {{.*#+}} xmm8 = [255,255]
	; SSE41-NEXT: movdqa {{.*#+}} xmm10 = [2147483648,2147483648]			; SSE41-NEXT: movdqa {{.*#+}} xmm6 = [2147483648,2147483648]
	; SSE41-NEXT: movdqa %xmm3, %xmm0			; SSE41-NEXT: movdqa %xmm3, %xmm0
	; SSE41-NEXT: pxor %xmm10, %xmm0			; SSE41-NEXT: pxor %xmm6, %xmm0
	; SSE41-NEXT: movdqa {{.*#+}} xmm5 = [2147483903,2147483903]			; SSE41-NEXT: movdqa {{.*#+}} xmm5 = [2147483903,2147483903]
	; SSE41-NEXT: movdqa %xmm5, %xmm4			; SSE41-NEXT: movdqa %xmm5, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm4			; SSE41-NEXT: pcmpgtd %xmm0, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm5, %xmm0			; SSE41-NEXT: pcmpeqd %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm7, %xmm6			; SSE41-NEXT: pand %xmm7, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0			; SSE41-NEXT: movapd %xmm8, %xmm10
	; SSE41-NEXT: movapd %xmm8, %xmm11			; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm10
	; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm11
	; SSE41-NEXT: movdqa %xmm2, %xmm0			; SSE41-NEXT: movdqa %xmm2, %xmm0
	; SSE41-NEXT: pxor %xmm10, %xmm0			; SSE41-NEXT: pxor %xmm6, %xmm0
	; SSE41-NEXT: movdqa %xmm5, %xmm3			; SSE41-NEXT: movdqa %xmm5, %xmm3
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm3			; SSE41-NEXT: pcmpgtd %xmm0, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm3[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm3[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm5, %xmm0			; SSE41-NEXT: pcmpeqd %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm4, %xmm6			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[1,1,3,3]			; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: movapd %xmm8, %xmm3			; SSE41-NEXT: movapd %xmm8, %xmm3
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm3			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm3
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: pxor %xmm10, %xmm0			; SSE41-NEXT: pxor %xmm6, %xmm0
	; SSE41-NEXT: movdqa %xmm5, %xmm2			; SSE41-NEXT: movdqa %xmm5, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm2			; SSE41-NEXT: pcmpgtd %xmm0, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm5, %xmm0			; SSE41-NEXT: pcmpeqd %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm4, %xmm6			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: movapd %xmm8, %xmm4			; SSE41-NEXT: movapd %xmm8, %xmm4
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm4			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm4
	; SSE41-NEXT: movdqa %xmm9, %xmm0			; SSE41-NEXT: movdqa %xmm9, %xmm0
	; SSE41-NEXT: pxor %xmm10, %xmm0			; SSE41-NEXT: pxor %xmm6, %xmm0
	; SSE41-NEXT: movdqa %xmm5, %xmm1			; SSE41-NEXT: movdqa %xmm5, %xmm1
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm1			; SSE41-NEXT: pcmpgtd %xmm0, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm1[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm1[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm5, %xmm0			; SSE41-NEXT: pcmpeqd %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm2, %xmm5			; SSE41-NEXT: pand %xmm2, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]			; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: movapd %xmm8, %xmm5			; SSE41-NEXT: movapd %xmm8, %xmm5
	; SSE41-NEXT: blendvpd %xmm0, %xmm9, %xmm5			; SSE41-NEXT: blendvpd %xmm0, %xmm9, %xmm5
	; SSE41-NEXT: movapd %xmm5, %xmm0			; SSE41-NEXT: movapd %xmm5, %xmm0
	; SSE41-NEXT: xorpd %xmm10, %xmm0			; SSE41-NEXT: xorpd %xmm6, %xmm0
	; SSE41-NEXT: movapd %xmm0, %xmm1			; SSE41-NEXT: movapd %xmm0, %xmm1
	; SSE41-NEXT: pcmpgtd %xmm10, %xmm1			; SSE41-NEXT: pcmpgtd %xmm6, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm1[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm1[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm10, %xmm0			; SSE41-NEXT: pcmpeqd %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm2, %xmm6			; SSE41-NEXT: pand %xmm2, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]			; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: pxor %xmm2, %xmm2			; SSE41-NEXT: pxor %xmm2, %xmm2
	; SSE41-NEXT: pxor %xmm1, %xmm1			; SSE41-NEXT: pxor %xmm1, %xmm1
	; SSE41-NEXT: blendvpd %xmm0, %xmm5, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm5, %xmm1
	; SSE41-NEXT: movapd %xmm4, %xmm0			; SSE41-NEXT: movapd %xmm4, %xmm0
	; SSE41-NEXT: xorpd %xmm10, %xmm0			; SSE41-NEXT: xorpd %xmm6, %xmm0
	; SSE41-NEXT: movapd %xmm0, %xmm5			; SSE41-NEXT: movapd %xmm0, %xmm5
	; SSE41-NEXT: pcmpgtd %xmm10, %xmm5			; SSE41-NEXT: pcmpgtd %xmm6, %xmm5
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm5[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm5[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm10, %xmm0			; SSE41-NEXT: pcmpeqd %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm6, %xmm7			; SSE41-NEXT: pand %xmm7, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm5[1,1,3,3]			; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: por %xmm7, %xmm0
	; SSE41-NEXT: pxor %xmm5, %xmm5			; SSE41-NEXT: pxor %xmm5, %xmm5
	; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm5			; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm5
	; SSE41-NEXT: movapd %xmm3, %xmm0			; SSE41-NEXT: movapd %xmm3, %xmm0
	; SSE41-NEXT: xorpd %xmm10, %xmm0			; SSE41-NEXT: xorpd %xmm6, %xmm0
	; SSE41-NEXT: movapd %xmm0, %xmm4			; SSE41-NEXT: movapd %xmm0, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm10, %xmm4			; SSE41-NEXT: pcmpgtd %xmm6, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm10, %xmm0			; SSE41-NEXT: pcmpeqd %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm6, %xmm7			; SSE41-NEXT: pand %xmm7, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm7, %xmm0
	; SSE41-NEXT: pxor %xmm4, %xmm4			; SSE41-NEXT: pxor %xmm4, %xmm4
	; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm4			; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm4
	; SSE41-NEXT: movapd %xmm11, %xmm0			; SSE41-NEXT: movapd %xmm10, %xmm0
	; SSE41-NEXT: xorpd %xmm10, %xmm0			; SSE41-NEXT: xorpd %xmm6, %xmm0
	; SSE41-NEXT: movapd %xmm0, %xmm3			; SSE41-NEXT: movapd %xmm0, %xmm3
	; SSE41-NEXT: pcmpgtd %xmm10, %xmm3			; SSE41-NEXT: pcmpgtd %xmm6, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm3[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm3[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm10, %xmm0			; SSE41-NEXT: pcmpeqd %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm6, %xmm7			; SSE41-NEXT: pand %xmm7, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[1,1,3,3]			; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: por %xmm7, %xmm0			; SSE41-NEXT: blendvpd %xmm0, %xmm10, %xmm2
	; SSE41-NEXT: blendvpd %xmm0, %xmm11, %xmm2
	; SSE41-NEXT: andpd %xmm8, %xmm2			; SSE41-NEXT: andpd %xmm8, %xmm2
	; SSE41-NEXT: andpd %xmm8, %xmm4			; SSE41-NEXT: andpd %xmm8, %xmm4
	; SSE41-NEXT: packusdw %xmm2, %xmm4			; SSE41-NEXT: packusdw %xmm2, %xmm4
	; SSE41-NEXT: andpd %xmm8, %xmm5			; SSE41-NEXT: andpd %xmm8, %xmm5
	; SSE41-NEXT: andpd %xmm8, %xmm1			; SSE41-NEXT: andpd %xmm8, %xmm1
	; SSE41-NEXT: packusdw %xmm5, %xmm1			; SSE41-NEXT: packusdw %xmm5, %xmm1
	; SSE41-NEXT: packusdw %xmm4, %xmm1			; SSE41-NEXT: packusdw %xmm4, %xmm1
	; SSE41-NEXT: packuswb %xmm1, %xmm1			; SSE41-NEXT: packuswb %xmm1, %xmm1
	▲ Show 20 Lines • Show All 502 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: movdqa {{.*#+}} xmm9 = [2147483648,2147483648]			; SSE41-NEXT: movdqa {{.*#+}} xmm9 = [2147483648,2147483648]
	; SSE41-NEXT: movdqa %xmm6, %xmm0			; SSE41-NEXT: movdqa %xmm6, %xmm0
	; SSE41-NEXT: pxor %xmm9, %xmm0			; SSE41-NEXT: pxor %xmm9, %xmm0
	; SSE41-NEXT: movdqa {{.*#+}} xmm12 = [2147483903,2147483903]			; SSE41-NEXT: movdqa {{.*#+}} xmm12 = [2147483903,2147483903]
	; SSE41-NEXT: movdqa %xmm12, %xmm10			; SSE41-NEXT: movdqa %xmm12, %xmm10
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm10			; SSE41-NEXT: pcmpgtd %xmm0, %xmm10
	; SSE41-NEXT: pshufd {{.*#+}} xmm13 = xmm10[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm13 = xmm10[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm12, %xmm0			; SSE41-NEXT: pcmpeqd %xmm12, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm14 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm13, %xmm14			; SSE41-NEXT: pand %xmm13, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm10[1,1,3,3]			; SSE41-NEXT: por %xmm10, %xmm0
	; SSE41-NEXT: por %xmm14, %xmm0
	; SSE41-NEXT: movapd %xmm11, %xmm10			; SSE41-NEXT: movapd %xmm11, %xmm10
	; SSE41-NEXT: blendvpd %xmm0, %xmm6, %xmm10			; SSE41-NEXT: blendvpd %xmm0, %xmm6, %xmm10
	; SSE41-NEXT: movdqa %xmm7, %xmm0			; SSE41-NEXT: movdqa %xmm7, %xmm0
	; SSE41-NEXT: pxor %xmm9, %xmm0			; SSE41-NEXT: pxor %xmm9, %xmm0
	; SSE41-NEXT: movdqa %xmm12, %xmm6			; SSE41-NEXT: movdqa %xmm12, %xmm6
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm6			; SSE41-NEXT: pcmpgtd %xmm0, %xmm6
	; SSE41-NEXT: pshufd {{.*#+}} xmm13 = xmm6[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm13 = xmm6[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm12, %xmm0			; SSE41-NEXT: pcmpeqd %xmm12, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm14 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm13, %xmm14			; SSE41-NEXT: pand %xmm13, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm6[1,1,3,3]			; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: por %xmm14, %xmm0
	; SSE41-NEXT: movapd %xmm11, %xmm13			; SSE41-NEXT: movapd %xmm11, %xmm13
	; SSE41-NEXT: blendvpd %xmm0, %xmm7, %xmm13			; SSE41-NEXT: blendvpd %xmm0, %xmm7, %xmm13
	; SSE41-NEXT: movdqa %xmm4, %xmm0			; SSE41-NEXT: movdqa %xmm4, %xmm0
	; SSE41-NEXT: pxor %xmm9, %xmm0			; SSE41-NEXT: pxor %xmm9, %xmm0
	; SSE41-NEXT: movdqa %xmm12, %xmm6			; SSE41-NEXT: movdqa %xmm12, %xmm6
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm6			; SSE41-NEXT: pcmpgtd %xmm0, %xmm6
	; SSE41-NEXT: pshufd {{.*#+}} xmm14 = xmm6[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm6[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm12, %xmm0			; SSE41-NEXT: pcmpeqd %xmm12, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm14, %xmm7			; SSE41-NEXT: pand %xmm7, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm6[1,1,3,3]			; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: por %xmm7, %xmm0
	; SSE41-NEXT: movapd %xmm11, %xmm14			; SSE41-NEXT: movapd %xmm11, %xmm14
	; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm14			; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm14
	; SSE41-NEXT: movdqa %xmm5, %xmm0			; SSE41-NEXT: movdqa %xmm5, %xmm0
	; SSE41-NEXT: pxor %xmm9, %xmm0			; SSE41-NEXT: pxor %xmm9, %xmm0
	; SSE41-NEXT: movdqa %xmm12, %xmm4			; SSE41-NEXT: movdqa %xmm12, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm4			; SSE41-NEXT: pcmpgtd %xmm0, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm12, %xmm0			; SSE41-NEXT: pcmpeqd %xmm12, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm6, %xmm7			; SSE41-NEXT: pand %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm7, %xmm0
	; SSE41-NEXT: movapd %xmm11, %xmm15			; SSE41-NEXT: movapd %xmm11, %xmm15
	; SSE41-NEXT: blendvpd %xmm0, %xmm5, %xmm15			; SSE41-NEXT: blendvpd %xmm0, %xmm5, %xmm15
	; SSE41-NEXT: movdqa %xmm2, %xmm0			; SSE41-NEXT: movdqa %xmm2, %xmm0
	; SSE41-NEXT: pxor %xmm9, %xmm0			; SSE41-NEXT: pxor %xmm9, %xmm0
	; SSE41-NEXT: movdqa %xmm12, %xmm5			; SSE41-NEXT: movdqa %xmm12, %xmm5
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm5			; SSE41-NEXT: pcmpgtd %xmm0, %xmm5
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm5[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm5[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm12, %xmm0			; SSE41-NEXT: pcmpeqd %xmm12, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm6, %xmm7			; SSE41-NEXT: pand %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm5[1,1,3,3]			; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: por %xmm7, %xmm0
	; SSE41-NEXT: movapd %xmm11, %xmm5			; SSE41-NEXT: movapd %xmm11, %xmm5
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm5			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm5
	; SSE41-NEXT: movdqa %xmm3, %xmm0			; SSE41-NEXT: movdqa %xmm3, %xmm0
	; SSE41-NEXT: pxor %xmm9, %xmm0			; SSE41-NEXT: pxor %xmm9, %xmm0
	; SSE41-NEXT: movdqa %xmm12, %xmm2			; SSE41-NEXT: movdqa %xmm12, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm2			; SSE41-NEXT: pcmpgtd %xmm0, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm12, %xmm0			; SSE41-NEXT: pcmpeqd %xmm12, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm6, %xmm7			; SSE41-NEXT: pand %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm7, %xmm0
	; SSE41-NEXT: movapd %xmm11, %xmm6			; SSE41-NEXT: movapd %xmm11, %xmm6
	; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm6			; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm6
	; SSE41-NEXT: movdqa %xmm8, %xmm0			; SSE41-NEXT: movdqa %xmm8, %xmm0
	; SSE41-NEXT: pxor %xmm9, %xmm0			; SSE41-NEXT: pxor %xmm9, %xmm0
	; SSE41-NEXT: movdqa %xmm12, %xmm2			; SSE41-NEXT: movdqa %xmm12, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm2			; SSE41-NEXT: pcmpgtd %xmm0, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm12, %xmm0			; SSE41-NEXT: pcmpeqd %xmm12, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm3, %xmm7			; SSE41-NEXT: pand %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm7, %xmm0
	; SSE41-NEXT: movapd %xmm11, %xmm3			; SSE41-NEXT: movapd %xmm11, %xmm3
	; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm3			; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm3
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: pxor %xmm9, %xmm0			; SSE41-NEXT: pxor %xmm9, %xmm0
	; SSE41-NEXT: movdqa %xmm12, %xmm2			; SSE41-NEXT: movdqa %xmm12, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm2			; SSE41-NEXT: pcmpgtd %xmm0, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm12, %xmm0			; SSE41-NEXT: pcmpeqd %xmm12, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm7, %xmm4			; SSE41-NEXT: pand %xmm7, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm11			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm11
	; SSE41-NEXT: xorpd %xmm8, %xmm8			; SSE41-NEXT: pxor %xmm2, %xmm2
	; SSE41-NEXT: movapd %xmm11, %xmm0			; SSE41-NEXT: movapd %xmm11, %xmm0
	; SSE41-NEXT: xorpd %xmm9, %xmm0			; SSE41-NEXT: xorpd %xmm9, %xmm0
	; SSE41-NEXT: movapd %xmm0, %xmm1			; SSE41-NEXT: movapd %xmm0, %xmm1
	; SSE41-NEXT: pcmpgtd %xmm9, %xmm1			; SSE41-NEXT: pcmpgtd %xmm9, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm1[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm1[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm9, %xmm0			; SSE41-NEXT: pcmpeqd %xmm9, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm4, %xmm7			; SSE41-NEXT: pand %xmm7, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]			; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: por %xmm7, %xmm0			; SSE41-NEXT: pxor %xmm7, %xmm7
	; SSE41-NEXT: pxor %xmm4, %xmm4			; SSE41-NEXT: blendvpd %xmm0, %xmm11, %xmm7
	; SSE41-NEXT: blendvpd %xmm0, %xmm11, %xmm4
	; SSE41-NEXT: movapd %xmm3, %xmm0			; SSE41-NEXT: movapd %xmm3, %xmm0
	; SSE41-NEXT: xorpd %xmm9, %xmm0			; SSE41-NEXT: xorpd %xmm9, %xmm0
	; SSE41-NEXT: movapd %xmm0, %xmm1			; SSE41-NEXT: movapd %xmm0, %xmm1
	; SSE41-NEXT: pcmpgtd %xmm9, %xmm1			; SSE41-NEXT: pcmpgtd %xmm9, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm1[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm1[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm9, %xmm0			; SSE41-NEXT: pcmpeqd %xmm9, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm7, %xmm2			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]			; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: pxor %xmm1, %xmm1			; SSE41-NEXT: pxor %xmm1, %xmm1
	; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm1
	; SSE41-NEXT: packusdw %xmm4, %xmm1			; SSE41-NEXT: packusdw %xmm7, %xmm1
	; SSE41-NEXT: movapd %xmm6, %xmm0			; SSE41-NEXT: movapd %xmm6, %xmm0
	; SSE41-NEXT: xorpd %xmm9, %xmm0			; SSE41-NEXT: xorpd %xmm9, %xmm0
	; SSE41-NEXT: movapd %xmm0, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm9, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm9, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm3, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]
	; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: pxor %xmm2, %xmm2
	; SSE41-NEXT: blendvpd %xmm0, %xmm6, %xmm2
	; SSE41-NEXT: movapd %xmm5, %xmm0
	; SSE41-NEXT: xorpd %xmm9, %xmm0
	; SSE41-NEXT: movapd %xmm0, %xmm3			; SSE41-NEXT: movapd %xmm0, %xmm3
	; SSE41-NEXT: pcmpgtd %xmm9, %xmm3			; SSE41-NEXT: pcmpgtd %xmm9, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm3[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm3[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm9, %xmm0			; SSE41-NEXT: pcmpeqd %xmm9, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm4, %xmm6			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[1,1,3,3]			; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: pxor %xmm3, %xmm3			; SSE41-NEXT: pxor %xmm3, %xmm3
	; SSE41-NEXT: blendvpd %xmm0, %xmm5, %xmm3			; SSE41-NEXT: blendvpd %xmm0, %xmm6, %xmm3
	; SSE41-NEXT: packusdw %xmm2, %xmm3			; SSE41-NEXT: movapd %xmm5, %xmm0
	; SSE41-NEXT: packusdw %xmm3, %xmm1
	; SSE41-NEXT: movapd %xmm15, %xmm0
	; SSE41-NEXT: xorpd %xmm9, %xmm0			; SSE41-NEXT: xorpd %xmm9, %xmm0
	; SSE41-NEXT: movapd %xmm0, %xmm2			; SSE41-NEXT: movapd %xmm0, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm9, %xmm2			; SSE41-NEXT: pcmpgtd %xmm9, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm9, %xmm0			; SSE41-NEXT: pcmpeqd %xmm9, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm3, %xmm4			; SSE41-NEXT: pand %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]
	; SSE41-NEXT: por %xmm4, %xmm0			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: pxor %xmm2, %xmm2			; SSE41-NEXT: pxor %xmm4, %xmm4
	; SSE41-NEXT: blendvpd %xmm0, %xmm15, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm5, %xmm4
	; SSE41-NEXT: movapd %xmm14, %xmm0			; SSE41-NEXT: packusdw %xmm3, %xmm4
				; SSE41-NEXT: packusdw %xmm4, %xmm1
				; SSE41-NEXT: movapd %xmm15, %xmm0
	; SSE41-NEXT: xorpd %xmm9, %xmm0			; SSE41-NEXT: xorpd %xmm9, %xmm0
	; SSE41-NEXT: movapd %xmm0, %xmm3			; SSE41-NEXT: movapd %xmm0, %xmm3
	; SSE41-NEXT: pcmpgtd %xmm9, %xmm3			; SSE41-NEXT: pcmpgtd %xmm9, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm3[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm3[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm9, %xmm0			; SSE41-NEXT: pcmpeqd %xmm9, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm4, %xmm5			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[1,1,3,3]			; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: por %xmm5, %xmm0			; SSE41-NEXT: pxor %xmm4, %xmm4
				; SSE41-NEXT: blendvpd %xmm0, %xmm15, %xmm4
				; SSE41-NEXT: movapd %xmm14, %xmm0
				; SSE41-NEXT: xorpd %xmm9, %xmm0
				; SSE41-NEXT: movapd %xmm0, %xmm3
				; SSE41-NEXT: pcmpgtd %xmm9, %xmm3
				; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm3[0,0,2,2]
				; SSE41-NEXT: pcmpeqd %xmm9, %xmm0
				; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
				; SSE41-NEXT: pand %xmm5, %xmm0
				; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: pxor %xmm3, %xmm3			; SSE41-NEXT: pxor %xmm3, %xmm3
	; SSE41-NEXT: blendvpd %xmm0, %xmm14, %xmm3			; SSE41-NEXT: blendvpd %xmm0, %xmm14, %xmm3
	; SSE41-NEXT: packusdw %xmm2, %xmm3			; SSE41-NEXT: packusdw %xmm4, %xmm3
	; SSE41-NEXT: movapd %xmm13, %xmm0			; SSE41-NEXT: movapd %xmm13, %xmm0
	; SSE41-NEXT: xorpd %xmm9, %xmm0			; SSE41-NEXT: xorpd %xmm9, %xmm0
	; SSE41-NEXT: movapd %xmm0, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm9, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm9, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm4, %xmm5
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]
	; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: pxor %xmm2, %xmm2
	; SSE41-NEXT: blendvpd %xmm0, %xmm13, %xmm2
	; SSE41-NEXT: movapd %xmm10, %xmm0
	; SSE41-NEXT: xorpd %xmm9, %xmm0
	; SSE41-NEXT: movapd %xmm0, %xmm4			; SSE41-NEXT: movapd %xmm0, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm9, %xmm4			; SSE41-NEXT: pcmpgtd %xmm9, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm9, %xmm0			; SSE41-NEXT: pcmpeqd %xmm9, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm5, %xmm6			; SSE41-NEXT: pand %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0			; SSE41-NEXT: pxor %xmm4, %xmm4
	; SSE41-NEXT: blendvpd %xmm0, %xmm10, %xmm8			; SSE41-NEXT: blendvpd %xmm0, %xmm13, %xmm4
	; SSE41-NEXT: packusdw %xmm2, %xmm8			; SSE41-NEXT: movapd %xmm10, %xmm0
	; SSE41-NEXT: packusdw %xmm8, %xmm3			; SSE41-NEXT: xorpd %xmm9, %xmm0
				; SSE41-NEXT: movapd %xmm0, %xmm5
				; SSE41-NEXT: pcmpgtd %xmm9, %xmm5
				; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm5[0,0,2,2]
				; SSE41-NEXT: pcmpeqd %xmm9, %xmm0
				; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
				; SSE41-NEXT: pand %xmm6, %xmm0
				; SSE41-NEXT: por %xmm5, %xmm0
				; SSE41-NEXT: blendvpd %xmm0, %xmm10, %xmm2
				; SSE41-NEXT: packusdw %xmm4, %xmm2
				; SSE41-NEXT: packusdw %xmm2, %xmm3
	; SSE41-NEXT: packuswb %xmm3, %xmm1			; SSE41-NEXT: packuswb %xmm3, %xmm1
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: trunc_packus_v16i64_v16i8:			; AVX1-LABEL: trunc_packus_v16i64_v16i8:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vmovapd {{.*#+}} ymm4 = [255,255,255,255]			; AVX1-NEXT: vmovapd {{.*#+}} ymm4 = [255,255,255,255]
	; AVX1-NEXT: vextractf128 $1, %ymm3, %xmm5			; AVX1-NEXT: vextractf128 $1, %ymm3, %xmm5
	▲ Show 20 Lines • Show All 424 Lines • Show Last 20 Lines

llvm/trunk/test/CodeGen/X86/vector-trunc-packus.ll

	Show First 20 Lines • Show All 125 Lines • ▼ Show 20 Lines
	; SSSE3-NEXT: pand %xmm3, %xmm0			; SSSE3-NEXT: pand %xmm3, %xmm0
	; SSSE3-NEXT: shufps {{.*#+}} xmm0 = xmm0[0,2],xmm1[0,2]			; SSSE3-NEXT: shufps {{.*#+}} xmm0 = xmm0[0,2],xmm1[0,2]
	; SSSE3-NEXT: retq			; SSSE3-NEXT: retq
	;			;
	; SSE41-LABEL: trunc_packus_v4i64_v4i32:			; SSE41-LABEL: trunc_packus_v4i64_v4i32:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movdqa %xmm0, %xmm2			; SSE41-NEXT: movdqa %xmm0, %xmm2
	; SSE41-NEXT: movapd {{.*#+}} xmm4 = [4294967295,4294967295]			; SSE41-NEXT: movapd {{.*#+}} xmm4 = [4294967295,4294967295]
	; SSE41-NEXT: movdqa {{.*#+}} xmm8 = [2147483648,2147483648]			; SSE41-NEXT: movdqa {{.*#+}} xmm3 = [2147483648,2147483648]
	; SSE41-NEXT: pxor %xmm8, %xmm0			; SSE41-NEXT: pxor %xmm3, %xmm0
	; SSE41-NEXT: movdqa {{.*#+}} xmm6 = [2147483647,2147483647]			; SSE41-NEXT: movdqa {{.*#+}} xmm6 = [2147483647,2147483647]
	; SSE41-NEXT: movdqa %xmm6, %xmm5			; SSE41-NEXT: movdqa %xmm6, %xmm5
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm5			; SSE41-NEXT: pcmpgtd %xmm0, %xmm5
	; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm5[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm5[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm6, %xmm0			; SSE41-NEXT: pcmpeqd %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm7, %xmm3			; SSE41-NEXT: pand %xmm7, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm5[1,1,3,3]			; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: movapd %xmm4, %xmm5			; SSE41-NEXT: movapd %xmm4, %xmm5
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm5			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm5
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: pxor %xmm8, %xmm0			; SSE41-NEXT: pxor %xmm3, %xmm0
	; SSE41-NEXT: movdqa %xmm6, %xmm2			; SSE41-NEXT: movdqa %xmm6, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm2			; SSE41-NEXT: pcmpgtd %xmm0, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm6, %xmm0			; SSE41-NEXT: pcmpeqd %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm3, %xmm6			; SSE41-NEXT: pand %xmm7, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm4			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm4
	; SSE41-NEXT: xorpd %xmm1, %xmm1			; SSE41-NEXT: xorpd %xmm1, %xmm1
	; SSE41-NEXT: movapd %xmm4, %xmm0			; SSE41-NEXT: movapd %xmm4, %xmm0
	; SSE41-NEXT: xorpd %xmm8, %xmm0			; SSE41-NEXT: xorpd %xmm3, %xmm0
	; SSE41-NEXT: movapd %xmm0, %xmm2			; SSE41-NEXT: movapd %xmm0, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm8, %xmm2			; SSE41-NEXT: pcmpgtd %xmm3, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm8, %xmm0			; SSE41-NEXT: pcmpeqd %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm3, %xmm6			; SSE41-NEXT: pand %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: pxor %xmm2, %xmm2			; SSE41-NEXT: pxor %xmm2, %xmm2
	; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm2
	; SSE41-NEXT: movapd %xmm5, %xmm0			; SSE41-NEXT: movapd %xmm5, %xmm0
	; SSE41-NEXT: xorpd %xmm8, %xmm0			; SSE41-NEXT: xorpd %xmm3, %xmm0
	; SSE41-NEXT: movapd %xmm0, %xmm3			; SSE41-NEXT: movapd %xmm0, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm8, %xmm3			; SSE41-NEXT: pcmpgtd %xmm3, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm3[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm8, %xmm0			; SSE41-NEXT: pcmpeqd %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm4, %xmm6			; SSE41-NEXT: pand %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm5, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm5, %xmm1
	; SSE41-NEXT: shufps {{.*#+}} xmm1 = xmm1[0,2],xmm2[0,2]			; SSE41-NEXT: shufps {{.*#+}} xmm1 = xmm1[0,2],xmm2[0,2]
	; SSE41-NEXT: movaps %xmm1, %xmm0			; SSE41-NEXT: movaps %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: trunc_packus_v4i64_v4i32:			; AVX1-LABEL: trunc_packus_v4i64_v4i32:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vmovapd {{.*#+}} ymm1 = [4294967295,4294967295,4294967295,4294967295]			; AVX1-NEXT: vmovapd {{.*#+}} ymm1 = [4294967295,4294967295,4294967295,4294967295]
	▲ Show 20 Lines • Show All 304 Lines • ▼ Show 20 Lines
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movdqa %xmm0, %xmm4			; SSE41-NEXT: movdqa %xmm0, %xmm4
	; SSE41-NEXT: movapd {{.*#+}} xmm7 = [4294967295,4294967295]			; SSE41-NEXT: movapd {{.*#+}} xmm7 = [4294967295,4294967295]
	; SSE41-NEXT: movdqa {{.*#+}} xmm10 = [2147483648,2147483648]			; SSE41-NEXT: movdqa {{.*#+}} xmm10 = [2147483648,2147483648]
	; SSE41-NEXT: pxor %xmm10, %xmm0			; SSE41-NEXT: pxor %xmm10, %xmm0
	; SSE41-NEXT: movdqa {{.*#+}} xmm11 = [2147483647,2147483647]			; SSE41-NEXT: movdqa {{.*#+}} xmm11 = [2147483647,2147483647]
	; SSE41-NEXT: movdqa %xmm11, %xmm6			; SSE41-NEXT: movdqa %xmm11, %xmm6
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm6			; SSE41-NEXT: pcmpgtd %xmm0, %xmm6
	; SSE41-NEXT: pshufd {{.*#+}} xmm8 = xmm6[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm6[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm11, %xmm0			; SSE41-NEXT: pcmpeqd %xmm11, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm8, %xmm5			; SSE41-NEXT: pand %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm6[1,1,3,3]			; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: movapd %xmm7, %xmm8			; SSE41-NEXT: movapd %xmm7, %xmm8
	; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm8			; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm8
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: pxor %xmm10, %xmm0			; SSE41-NEXT: pxor %xmm10, %xmm0
	; SSE41-NEXT: movdqa %xmm11, %xmm4			; SSE41-NEXT: movdqa %xmm11, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm4			; SSE41-NEXT: pcmpgtd %xmm0, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm11, %xmm0			; SSE41-NEXT: pcmpeqd %xmm11, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm5, %xmm6			; SSE41-NEXT: pand %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: movapd %xmm7, %xmm9			; SSE41-NEXT: movapd %xmm7, %xmm9
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm9			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm9
	; SSE41-NEXT: movdqa %xmm2, %xmm0			; SSE41-NEXT: movdqa %xmm2, %xmm0
	; SSE41-NEXT: pxor %xmm10, %xmm0			; SSE41-NEXT: pxor %xmm10, %xmm0
	; SSE41-NEXT: movdqa %xmm11, %xmm1			; SSE41-NEXT: movdqa %xmm11, %xmm1
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm1			; SSE41-NEXT: pcmpgtd %xmm0, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm1[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm1[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm11, %xmm0			; SSE41-NEXT: pcmpeqd %xmm11, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm4, %xmm5			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]			; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: movapd %xmm7, %xmm4			; SSE41-NEXT: movapd %xmm7, %xmm4
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm4			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm4
	; SSE41-NEXT: movdqa %xmm3, %xmm0			; SSE41-NEXT: movdqa %xmm3, %xmm0
	; SSE41-NEXT: pxor %xmm10, %xmm0			; SSE41-NEXT: pxor %xmm10, %xmm0
	; SSE41-NEXT: movdqa %xmm11, %xmm1			; SSE41-NEXT: movdqa %xmm11, %xmm1
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm1			; SSE41-NEXT: pcmpgtd %xmm0, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm1[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm1[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm11, %xmm0			; SSE41-NEXT: pcmpeqd %xmm11, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm2, %xmm5			; SSE41-NEXT: pand %xmm2, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]			; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm7			; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm7
	; SSE41-NEXT: pxor %xmm2, %xmm2			; SSE41-NEXT: pxor %xmm2, %xmm2
	; SSE41-NEXT: movapd %xmm7, %xmm0			; SSE41-NEXT: movapd %xmm7, %xmm0
	; SSE41-NEXT: xorpd %xmm10, %xmm0			; SSE41-NEXT: xorpd %xmm10, %xmm0
	; SSE41-NEXT: movapd %xmm0, %xmm1			; SSE41-NEXT: movapd %xmm0, %xmm1
	; SSE41-NEXT: pcmpgtd %xmm10, %xmm1			; SSE41-NEXT: pcmpgtd %xmm10, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm1[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm1[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm10, %xmm0			; SSE41-NEXT: pcmpeqd %xmm10, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm3, %xmm5			; SSE41-NEXT: pand %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]			; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: pxor %xmm3, %xmm3			; SSE41-NEXT: pxor %xmm3, %xmm3
	; SSE41-NEXT: blendvpd %xmm0, %xmm7, %xmm3			; SSE41-NEXT: blendvpd %xmm0, %xmm7, %xmm3
	; SSE41-NEXT: movapd %xmm4, %xmm0			; SSE41-NEXT: movapd %xmm4, %xmm0
	; SSE41-NEXT: xorpd %xmm10, %xmm0			; SSE41-NEXT: xorpd %xmm10, %xmm0
	; SSE41-NEXT: movapd %xmm0, %xmm1			; SSE41-NEXT: movapd %xmm0, %xmm1
	; SSE41-NEXT: pcmpgtd %xmm10, %xmm1			; SSE41-NEXT: pcmpgtd %xmm10, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm1[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm1[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm10, %xmm0			; SSE41-NEXT: pcmpeqd %xmm10, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm5, %xmm6			; SSE41-NEXT: pand %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]			; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: pxor %xmm1, %xmm1			; SSE41-NEXT: pxor %xmm1, %xmm1
	; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm1
	; SSE41-NEXT: shufps {{.*#+}} xmm1 = xmm1[0,2],xmm3[0,2]			; SSE41-NEXT: shufps {{.*#+}} xmm1 = xmm1[0,2],xmm3[0,2]
	; SSE41-NEXT: movapd %xmm9, %xmm0			; SSE41-NEXT: movapd %xmm9, %xmm0
	; SSE41-NEXT: xorpd %xmm10, %xmm0			; SSE41-NEXT: xorpd %xmm10, %xmm0
	; SSE41-NEXT: movapd %xmm0, %xmm3			; SSE41-NEXT: movapd %xmm0, %xmm3
	; SSE41-NEXT: pcmpgtd %xmm10, %xmm3			; SSE41-NEXT: pcmpgtd %xmm10, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm3[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm3[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm10, %xmm0			; SSE41-NEXT: pcmpeqd %xmm10, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm4, %xmm5			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[1,1,3,3]			; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: pxor %xmm3, %xmm3			; SSE41-NEXT: pxor %xmm3, %xmm3
	; SSE41-NEXT: blendvpd %xmm0, %xmm9, %xmm3			; SSE41-NEXT: blendvpd %xmm0, %xmm9, %xmm3
	; SSE41-NEXT: movapd %xmm8, %xmm0			; SSE41-NEXT: movapd %xmm8, %xmm0
	; SSE41-NEXT: xorpd %xmm10, %xmm0			; SSE41-NEXT: xorpd %xmm10, %xmm0
	; SSE41-NEXT: movapd %xmm0, %xmm4			; SSE41-NEXT: movapd %xmm0, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm10, %xmm4			; SSE41-NEXT: pcmpgtd %xmm10, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm10, %xmm0			; SSE41-NEXT: pcmpeqd %xmm10, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm5, %xmm6			; SSE41-NEXT: pand %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm2
	; SSE41-NEXT: shufps {{.*#+}} xmm2 = xmm2[0,2],xmm3[0,2]			; SSE41-NEXT: shufps {{.*#+}} xmm2 = xmm2[0,2],xmm3[0,2]
	; SSE41-NEXT: movaps %xmm2, %xmm0			; SSE41-NEXT: movaps %xmm2, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: trunc_packus_v8i64_v8i32:			; AVX1-LABEL: trunc_packus_v8i64_v8i32:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vmovapd {{.*#+}} ymm2 = [4294967295,4294967295,4294967295,4294967295]			; AVX1-NEXT: vmovapd {{.*#+}} ymm2 = [4294967295,4294967295,4294967295,4294967295]
	▲ Show 20 Lines • Show All 310 Lines • ▼ Show 20 Lines
	;			;
	; SSE41-LABEL: trunc_packus_v8i64_v8i16:			; SSE41-LABEL: trunc_packus_v8i64_v8i16:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movdqa %xmm0, %xmm9			; SSE41-NEXT: movdqa %xmm0, %xmm9
	; SSE41-NEXT: movapd {{.*#+}} xmm7 = [65535,65535]			; SSE41-NEXT: movapd {{.*#+}} xmm7 = [65535,65535]
	; SSE41-NEXT: movdqa {{.*#+}} xmm10 = [2147483648,2147483648]			; SSE41-NEXT: movdqa {{.*#+}} xmm10 = [2147483648,2147483648]
	; SSE41-NEXT: movdqa %xmm2, %xmm0			; SSE41-NEXT: movdqa %xmm2, %xmm0
	; SSE41-NEXT: pxor %xmm10, %xmm0			; SSE41-NEXT: pxor %xmm10, %xmm0
	; SSE41-NEXT: movdqa {{.*#+}} xmm11 = [2147549183,2147549183]			; SSE41-NEXT: movdqa {{.*#+}} xmm6 = [2147549183,2147549183]
	; SSE41-NEXT: movdqa %xmm11, %xmm4			; SSE41-NEXT: movdqa %xmm6, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm4			; SSE41-NEXT: pcmpgtd %xmm0, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm11, %xmm0			; SSE41-NEXT: pcmpeqd %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm5, %xmm6			; SSE41-NEXT: pand %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: movapd %xmm7, %xmm8			; SSE41-NEXT: movapd %xmm7, %xmm8
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm8			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm8
	; SSE41-NEXT: movdqa %xmm3, %xmm0			; SSE41-NEXT: movdqa %xmm3, %xmm0
	; SSE41-NEXT: pxor %xmm10, %xmm0			; SSE41-NEXT: pxor %xmm10, %xmm0
	; SSE41-NEXT: movdqa %xmm11, %xmm2			; SSE41-NEXT: movdqa %xmm6, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm2			; SSE41-NEXT: pcmpgtd %xmm0, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm11, %xmm0			; SSE41-NEXT: pcmpeqd %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm4, %xmm5			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: movapd %xmm7, %xmm2			; SSE41-NEXT: movapd %xmm7, %xmm2
	; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm2
	; SSE41-NEXT: movdqa %xmm9, %xmm0			; SSE41-NEXT: movdqa %xmm9, %xmm0
	; SSE41-NEXT: pxor %xmm10, %xmm0			; SSE41-NEXT: pxor %xmm10, %xmm0
	; SSE41-NEXT: movdqa %xmm11, %xmm3			; SSE41-NEXT: movdqa %xmm6, %xmm3
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm3			; SSE41-NEXT: pcmpgtd %xmm0, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm3[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm3[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm11, %xmm0			; SSE41-NEXT: pcmpeqd %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm4, %xmm5			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[1,1,3,3]			; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: movapd %xmm7, %xmm4			; SSE41-NEXT: movapd %xmm7, %xmm4
	; SSE41-NEXT: blendvpd %xmm0, %xmm9, %xmm4			; SSE41-NEXT: blendvpd %xmm0, %xmm9, %xmm4
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: pxor %xmm10, %xmm0			; SSE41-NEXT: pxor %xmm10, %xmm0
	; SSE41-NEXT: movdqa %xmm11, %xmm3			; SSE41-NEXT: movdqa %xmm6, %xmm3
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm3			; SSE41-NEXT: pcmpgtd %xmm0, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm3[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm3[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm11, %xmm0			; SSE41-NEXT: pcmpeqd %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm5, %xmm6			; SSE41-NEXT: pand %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[1,1,3,3]			; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm7			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm7
	; SSE41-NEXT: pxor %xmm3, %xmm3			; SSE41-NEXT: pxor %xmm3, %xmm3
	; SSE41-NEXT: movapd %xmm7, %xmm0			; SSE41-NEXT: movapd %xmm7, %xmm0
	; SSE41-NEXT: xorpd %xmm10, %xmm0			; SSE41-NEXT: xorpd %xmm10, %xmm0
	; SSE41-NEXT: movapd %xmm0, %xmm1			; SSE41-NEXT: movapd %xmm0, %xmm1
	; SSE41-NEXT: pcmpgtd %xmm10, %xmm1			; SSE41-NEXT: pcmpgtd %xmm10, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm1[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm1[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm10, %xmm0			; SSE41-NEXT: pcmpeqd %xmm10, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm5, %xmm6			; SSE41-NEXT: pand %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]			; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: pxor %xmm5, %xmm5			; SSE41-NEXT: pxor %xmm5, %xmm5
	; SSE41-NEXT: blendvpd %xmm0, %xmm7, %xmm5			; SSE41-NEXT: blendvpd %xmm0, %xmm7, %xmm5
	; SSE41-NEXT: movapd %xmm4, %xmm0			; SSE41-NEXT: movapd %xmm4, %xmm0
	; SSE41-NEXT: xorpd %xmm10, %xmm0			; SSE41-NEXT: xorpd %xmm10, %xmm0
	; SSE41-NEXT: movapd %xmm0, %xmm1			; SSE41-NEXT: movapd %xmm0, %xmm1
	; SSE41-NEXT: pcmpgtd %xmm10, %xmm1			; SSE41-NEXT: pcmpgtd %xmm10, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm1[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm1[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm10, %xmm0			; SSE41-NEXT: pcmpeqd %xmm10, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm6, %xmm7			; SSE41-NEXT: pand %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]			; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: por %xmm7, %xmm0
	; SSE41-NEXT: pxor %xmm1, %xmm1			; SSE41-NEXT: pxor %xmm1, %xmm1
	; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm1
	; SSE41-NEXT: packusdw %xmm5, %xmm1			; SSE41-NEXT: packusdw %xmm5, %xmm1
	; SSE41-NEXT: movapd %xmm2, %xmm0			; SSE41-NEXT: movapd %xmm2, %xmm0
	; SSE41-NEXT: xorpd %xmm10, %xmm0			; SSE41-NEXT: xorpd %xmm10, %xmm0
	; SSE41-NEXT: movapd %xmm0, %xmm4			; SSE41-NEXT: movapd %xmm0, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm10, %xmm4			; SSE41-NEXT: pcmpgtd %xmm10, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm10, %xmm0			; SSE41-NEXT: pcmpeqd %xmm10, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm5, %xmm6			; SSE41-NEXT: pand %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: pxor %xmm4, %xmm4			; SSE41-NEXT: pxor %xmm4, %xmm4
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm4			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm4
	; SSE41-NEXT: movapd %xmm8, %xmm0			; SSE41-NEXT: movapd %xmm8, %xmm0
	; SSE41-NEXT: xorpd %xmm10, %xmm0			; SSE41-NEXT: xorpd %xmm10, %xmm0
	; SSE41-NEXT: movapd %xmm0, %xmm2			; SSE41-NEXT: movapd %xmm0, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm10, %xmm2			; SSE41-NEXT: pcmpgtd %xmm10, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm10, %xmm0			; SSE41-NEXT: pcmpeqd %xmm10, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm5, %xmm6			; SSE41-NEXT: pand %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm3			; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm3
	; SSE41-NEXT: packusdw %xmm4, %xmm3			; SSE41-NEXT: packusdw %xmm4, %xmm3
	; SSE41-NEXT: packusdw %xmm3, %xmm1			; SSE41-NEXT: packusdw %xmm3, %xmm1
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: trunc_packus_v8i64_v8i16:			; AVX1-LABEL: trunc_packus_v8i64_v8i16:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	▲ Show 20 Lines • Show All 530 Lines • ▼ Show 20 Lines
	;			;
	; SSE41-LABEL: trunc_packus_v8i64_v8i8:			; SSE41-LABEL: trunc_packus_v8i64_v8i8:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movdqa %xmm0, %xmm9			; SSE41-NEXT: movdqa %xmm0, %xmm9
	; SSE41-NEXT: movapd {{.*#+}} xmm7 = [255,255]			; SSE41-NEXT: movapd {{.*#+}} xmm7 = [255,255]
	; SSE41-NEXT: movdqa {{.*#+}} xmm10 = [2147483648,2147483648]			; SSE41-NEXT: movdqa {{.*#+}} xmm10 = [2147483648,2147483648]
	; SSE41-NEXT: movdqa %xmm2, %xmm0			; SSE41-NEXT: movdqa %xmm2, %xmm0
	; SSE41-NEXT: pxor %xmm10, %xmm0			; SSE41-NEXT: pxor %xmm10, %xmm0
	; SSE41-NEXT: movdqa {{.*#+}} xmm11 = [2147483903,2147483903]			; SSE41-NEXT: movdqa {{.*#+}} xmm6 = [2147483903,2147483903]
	; SSE41-NEXT: movdqa %xmm11, %xmm4			; SSE41-NEXT: movdqa %xmm6, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm4			; SSE41-NEXT: pcmpgtd %xmm0, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm11, %xmm0			; SSE41-NEXT: pcmpeqd %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm5, %xmm6			; SSE41-NEXT: pand %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: movapd %xmm7, %xmm8			; SSE41-NEXT: movapd %xmm7, %xmm8
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm8			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm8
	; SSE41-NEXT: movdqa %xmm3, %xmm0			; SSE41-NEXT: movdqa %xmm3, %xmm0
	; SSE41-NEXT: pxor %xmm10, %xmm0			; SSE41-NEXT: pxor %xmm10, %xmm0
	; SSE41-NEXT: movdqa %xmm11, %xmm2			; SSE41-NEXT: movdqa %xmm6, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm2			; SSE41-NEXT: pcmpgtd %xmm0, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm11, %xmm0			; SSE41-NEXT: pcmpeqd %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm4, %xmm5			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: movapd %xmm7, %xmm2			; SSE41-NEXT: movapd %xmm7, %xmm2
	; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm2
	; SSE41-NEXT: movdqa %xmm9, %xmm0			; SSE41-NEXT: movdqa %xmm9, %xmm0
	; SSE41-NEXT: pxor %xmm10, %xmm0			; SSE41-NEXT: pxor %xmm10, %xmm0
	; SSE41-NEXT: movdqa %xmm11, %xmm3			; SSE41-NEXT: movdqa %xmm6, %xmm3
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm3			; SSE41-NEXT: pcmpgtd %xmm0, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm3[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm3[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm11, %xmm0			; SSE41-NEXT: pcmpeqd %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm4, %xmm5			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[1,1,3,3]			; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: movapd %xmm7, %xmm4			; SSE41-NEXT: movapd %xmm7, %xmm4
	; SSE41-NEXT: blendvpd %xmm0, %xmm9, %xmm4			; SSE41-NEXT: blendvpd %xmm0, %xmm9, %xmm4
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: pxor %xmm10, %xmm0			; SSE41-NEXT: pxor %xmm10, %xmm0
	; SSE41-NEXT: movdqa %xmm11, %xmm3			; SSE41-NEXT: movdqa %xmm6, %xmm3
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm3			; SSE41-NEXT: pcmpgtd %xmm0, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm3[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm3[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm11, %xmm0			; SSE41-NEXT: pcmpeqd %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm5, %xmm6			; SSE41-NEXT: pand %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[1,1,3,3]			; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm7			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm7
	; SSE41-NEXT: pxor %xmm3, %xmm3			; SSE41-NEXT: pxor %xmm3, %xmm3
	; SSE41-NEXT: movapd %xmm7, %xmm0			; SSE41-NEXT: movapd %xmm7, %xmm0
	; SSE41-NEXT: xorpd %xmm10, %xmm0			; SSE41-NEXT: xorpd %xmm10, %xmm0
	; SSE41-NEXT: movapd %xmm0, %xmm1			; SSE41-NEXT: movapd %xmm0, %xmm1
	; SSE41-NEXT: pcmpgtd %xmm10, %xmm1			; SSE41-NEXT: pcmpgtd %xmm10, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm1[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm1[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm10, %xmm0			; SSE41-NEXT: pcmpeqd %xmm10, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm5, %xmm6			; SSE41-NEXT: pand %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]			; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: pxor %xmm5, %xmm5			; SSE41-NEXT: pxor %xmm5, %xmm5
	; SSE41-NEXT: blendvpd %xmm0, %xmm7, %xmm5			; SSE41-NEXT: blendvpd %xmm0, %xmm7, %xmm5
	; SSE41-NEXT: movapd %xmm4, %xmm0			; SSE41-NEXT: movapd %xmm4, %xmm0
	; SSE41-NEXT: xorpd %xmm10, %xmm0			; SSE41-NEXT: xorpd %xmm10, %xmm0
	; SSE41-NEXT: movapd %xmm0, %xmm1			; SSE41-NEXT: movapd %xmm0, %xmm1
	; SSE41-NEXT: pcmpgtd %xmm10, %xmm1			; SSE41-NEXT: pcmpgtd %xmm10, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm1[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm1[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm10, %xmm0			; SSE41-NEXT: pcmpeqd %xmm10, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm6, %xmm7			; SSE41-NEXT: pand %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]			; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: por %xmm7, %xmm0
	; SSE41-NEXT: pxor %xmm1, %xmm1			; SSE41-NEXT: pxor %xmm1, %xmm1
	; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm1
	; SSE41-NEXT: packusdw %xmm5, %xmm1			; SSE41-NEXT: packusdw %xmm5, %xmm1
	; SSE41-NEXT: movapd %xmm2, %xmm0			; SSE41-NEXT: movapd %xmm2, %xmm0
	; SSE41-NEXT: xorpd %xmm10, %xmm0			; SSE41-NEXT: xorpd %xmm10, %xmm0
	; SSE41-NEXT: movapd %xmm0, %xmm4			; SSE41-NEXT: movapd %xmm0, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm10, %xmm4			; SSE41-NEXT: pcmpgtd %xmm10, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm10, %xmm0			; SSE41-NEXT: pcmpeqd %xmm10, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm5, %xmm6			; SSE41-NEXT: pand %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: pxor %xmm4, %xmm4			; SSE41-NEXT: pxor %xmm4, %xmm4
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm4			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm4
	; SSE41-NEXT: movapd %xmm8, %xmm0			; SSE41-NEXT: movapd %xmm8, %xmm0
	; SSE41-NEXT: xorpd %xmm10, %xmm0			; SSE41-NEXT: xorpd %xmm10, %xmm0
	; SSE41-NEXT: movapd %xmm0, %xmm2			; SSE41-NEXT: movapd %xmm0, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm10, %xmm2			; SSE41-NEXT: pcmpgtd %xmm10, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm10, %xmm0			; SSE41-NEXT: pcmpeqd %xmm10, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm5, %xmm6			; SSE41-NEXT: pand %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm3			; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm3
	; SSE41-NEXT: packusdw %xmm4, %xmm3			; SSE41-NEXT: packusdw %xmm4, %xmm3
	; SSE41-NEXT: packusdw %xmm3, %xmm1			; SSE41-NEXT: packusdw %xmm3, %xmm1
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: trunc_packus_v8i64_v8i8:			; AVX1-LABEL: trunc_packus_v8i64_v8i8:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	▲ Show 20 Lines • Show All 285 Lines • ▼ Show 20 Lines
	; SSSE3-NEXT: packuswb %xmm0, %xmm0			; SSSE3-NEXT: packuswb %xmm0, %xmm0
	; SSSE3-NEXT: movq %xmm0, (%rdi)			; SSSE3-NEXT: movq %xmm0, (%rdi)
	; SSSE3-NEXT: retq			; SSSE3-NEXT: retq
	;			;
	; SSE41-LABEL: trunc_packus_v8i64_v8i8_store:			; SSE41-LABEL: trunc_packus_v8i64_v8i8_store:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movdqa %xmm0, %xmm9			; SSE41-NEXT: movdqa %xmm0, %xmm9
	; SSE41-NEXT: movapd {{.*#+}} xmm8 = [255,255]			; SSE41-NEXT: movapd {{.*#+}} xmm8 = [255,255]
	; SSE41-NEXT: movdqa {{.*#+}} xmm10 = [2147483648,2147483648]			; SSE41-NEXT: movdqa {{.*#+}} xmm6 = [2147483648,2147483648]
	; SSE41-NEXT: movdqa %xmm3, %xmm0			; SSE41-NEXT: movdqa %xmm3, %xmm0
	; SSE41-NEXT: pxor %xmm10, %xmm0			; SSE41-NEXT: pxor %xmm6, %xmm0
	; SSE41-NEXT: movdqa {{.*#+}} xmm5 = [2147483903,2147483903]			; SSE41-NEXT: movdqa {{.*#+}} xmm5 = [2147483903,2147483903]
	; SSE41-NEXT: movdqa %xmm5, %xmm4			; SSE41-NEXT: movdqa %xmm5, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm4			; SSE41-NEXT: pcmpgtd %xmm0, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm5, %xmm0			; SSE41-NEXT: pcmpeqd %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm7, %xmm6			; SSE41-NEXT: pand %xmm7, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0			; SSE41-NEXT: movapd %xmm8, %xmm10
	; SSE41-NEXT: movapd %xmm8, %xmm11			; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm10
	; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm11
	; SSE41-NEXT: movdqa %xmm2, %xmm0			; SSE41-NEXT: movdqa %xmm2, %xmm0
	; SSE41-NEXT: pxor %xmm10, %xmm0			; SSE41-NEXT: pxor %xmm6, %xmm0
	; SSE41-NEXT: movdqa %xmm5, %xmm3			; SSE41-NEXT: movdqa %xmm5, %xmm3
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm3			; SSE41-NEXT: pcmpgtd %xmm0, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm3[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm3[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm5, %xmm0			; SSE41-NEXT: pcmpeqd %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm4, %xmm6			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[1,1,3,3]			; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: movapd %xmm8, %xmm3			; SSE41-NEXT: movapd %xmm8, %xmm3
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm3			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm3
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: pxor %xmm10, %xmm0			; SSE41-NEXT: pxor %xmm6, %xmm0
	; SSE41-NEXT: movdqa %xmm5, %xmm2			; SSE41-NEXT: movdqa %xmm5, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm2			; SSE41-NEXT: pcmpgtd %xmm0, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm5, %xmm0			; SSE41-NEXT: pcmpeqd %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm4, %xmm6			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: movapd %xmm8, %xmm4			; SSE41-NEXT: movapd %xmm8, %xmm4
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm4			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm4
	; SSE41-NEXT: movdqa %xmm9, %xmm0			; SSE41-NEXT: movdqa %xmm9, %xmm0
	; SSE41-NEXT: pxor %xmm10, %xmm0			; SSE41-NEXT: pxor %xmm6, %xmm0
	; SSE41-NEXT: movdqa %xmm5, %xmm1			; SSE41-NEXT: movdqa %xmm5, %xmm1
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm1			; SSE41-NEXT: pcmpgtd %xmm0, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm1[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm1[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm5, %xmm0			; SSE41-NEXT: pcmpeqd %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm2, %xmm5			; SSE41-NEXT: pand %xmm2, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]			; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: movapd %xmm8, %xmm5			; SSE41-NEXT: movapd %xmm8, %xmm5
	; SSE41-NEXT: blendvpd %xmm0, %xmm9, %xmm5			; SSE41-NEXT: blendvpd %xmm0, %xmm9, %xmm5
	; SSE41-NEXT: movapd %xmm5, %xmm0			; SSE41-NEXT: movapd %xmm5, %xmm0
	; SSE41-NEXT: xorpd %xmm10, %xmm0			; SSE41-NEXT: xorpd %xmm6, %xmm0
	; SSE41-NEXT: movapd %xmm0, %xmm1			; SSE41-NEXT: movapd %xmm0, %xmm1
	; SSE41-NEXT: pcmpgtd %xmm10, %xmm1			; SSE41-NEXT: pcmpgtd %xmm6, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm1[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm1[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm10, %xmm0			; SSE41-NEXT: pcmpeqd %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm2, %xmm6			; SSE41-NEXT: pand %xmm2, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]			; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: pxor %xmm2, %xmm2			; SSE41-NEXT: pxor %xmm2, %xmm2
	; SSE41-NEXT: pxor %xmm1, %xmm1			; SSE41-NEXT: pxor %xmm1, %xmm1
	; SSE41-NEXT: blendvpd %xmm0, %xmm5, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm5, %xmm1
	; SSE41-NEXT: movapd %xmm4, %xmm0			; SSE41-NEXT: movapd %xmm4, %xmm0
	; SSE41-NEXT: xorpd %xmm10, %xmm0			; SSE41-NEXT: xorpd %xmm6, %xmm0
	; SSE41-NEXT: movapd %xmm0, %xmm5			; SSE41-NEXT: movapd %xmm0, %xmm5
	; SSE41-NEXT: pcmpgtd %xmm10, %xmm5			; SSE41-NEXT: pcmpgtd %xmm6, %xmm5
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm5[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm5[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm10, %xmm0			; SSE41-NEXT: pcmpeqd %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm6, %xmm7			; SSE41-NEXT: pand %xmm7, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm5[1,1,3,3]			; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: por %xmm7, %xmm0
	; SSE41-NEXT: pxor %xmm5, %xmm5			; SSE41-NEXT: pxor %xmm5, %xmm5
	; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm5			; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm5
	; SSE41-NEXT: movapd %xmm3, %xmm0			; SSE41-NEXT: movapd %xmm3, %xmm0
	; SSE41-NEXT: xorpd %xmm10, %xmm0			; SSE41-NEXT: xorpd %xmm6, %xmm0
	; SSE41-NEXT: movapd %xmm0, %xmm4			; SSE41-NEXT: movapd %xmm0, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm10, %xmm4			; SSE41-NEXT: pcmpgtd %xmm6, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm10, %xmm0			; SSE41-NEXT: pcmpeqd %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm6, %xmm7			; SSE41-NEXT: pand %xmm7, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm7, %xmm0
	; SSE41-NEXT: pxor %xmm4, %xmm4			; SSE41-NEXT: pxor %xmm4, %xmm4
	; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm4			; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm4
	; SSE41-NEXT: movapd %xmm11, %xmm0			; SSE41-NEXT: movapd %xmm10, %xmm0
	; SSE41-NEXT: xorpd %xmm10, %xmm0			; SSE41-NEXT: xorpd %xmm6, %xmm0
	; SSE41-NEXT: movapd %xmm0, %xmm3			; SSE41-NEXT: movapd %xmm0, %xmm3
	; SSE41-NEXT: pcmpgtd %xmm10, %xmm3			; SSE41-NEXT: pcmpgtd %xmm6, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm3[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm3[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm10, %xmm0			; SSE41-NEXT: pcmpeqd %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm6, %xmm7			; SSE41-NEXT: pand %xmm7, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[1,1,3,3]			; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: por %xmm7, %xmm0			; SSE41-NEXT: blendvpd %xmm0, %xmm10, %xmm2
	; SSE41-NEXT: blendvpd %xmm0, %xmm11, %xmm2
	; SSE41-NEXT: andpd %xmm8, %xmm2			; SSE41-NEXT: andpd %xmm8, %xmm2
	; SSE41-NEXT: andpd %xmm8, %xmm4			; SSE41-NEXT: andpd %xmm8, %xmm4
	; SSE41-NEXT: packusdw %xmm2, %xmm4			; SSE41-NEXT: packusdw %xmm2, %xmm4
	; SSE41-NEXT: andpd %xmm8, %xmm5			; SSE41-NEXT: andpd %xmm8, %xmm5
	; SSE41-NEXT: andpd %xmm8, %xmm1			; SSE41-NEXT: andpd %xmm8, %xmm1
	; SSE41-NEXT: packusdw %xmm5, %xmm1			; SSE41-NEXT: packusdw %xmm5, %xmm1
	; SSE41-NEXT: packusdw %xmm4, %xmm1			; SSE41-NEXT: packusdw %xmm4, %xmm1
	; SSE41-NEXT: packuswb %xmm1, %xmm1			; SSE41-NEXT: packuswb %xmm1, %xmm1
	▲ Show 20 Lines • Show All 500 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: movdqa {{.*#+}} xmm9 = [2147483648,2147483648]			; SSE41-NEXT: movdqa {{.*#+}} xmm9 = [2147483648,2147483648]
	; SSE41-NEXT: movdqa %xmm6, %xmm0			; SSE41-NEXT: movdqa %xmm6, %xmm0
	; SSE41-NEXT: pxor %xmm9, %xmm0			; SSE41-NEXT: pxor %xmm9, %xmm0
	; SSE41-NEXT: movdqa {{.*#+}} xmm12 = [2147483903,2147483903]			; SSE41-NEXT: movdqa {{.*#+}} xmm12 = [2147483903,2147483903]
	; SSE41-NEXT: movdqa %xmm12, %xmm10			; SSE41-NEXT: movdqa %xmm12, %xmm10
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm10			; SSE41-NEXT: pcmpgtd %xmm0, %xmm10
	; SSE41-NEXT: pshufd {{.*#+}} xmm13 = xmm10[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm13 = xmm10[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm12, %xmm0			; SSE41-NEXT: pcmpeqd %xmm12, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm14 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm13, %xmm14			; SSE41-NEXT: pand %xmm13, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm10[1,1,3,3]			; SSE41-NEXT: por %xmm10, %xmm0
	; SSE41-NEXT: por %xmm14, %xmm0
	; SSE41-NEXT: movapd %xmm11, %xmm10			; SSE41-NEXT: movapd %xmm11, %xmm10
	; SSE41-NEXT: blendvpd %xmm0, %xmm6, %xmm10			; SSE41-NEXT: blendvpd %xmm0, %xmm6, %xmm10
	; SSE41-NEXT: movdqa %xmm7, %xmm0			; SSE41-NEXT: movdqa %xmm7, %xmm0
	; SSE41-NEXT: pxor %xmm9, %xmm0			; SSE41-NEXT: pxor %xmm9, %xmm0
	; SSE41-NEXT: movdqa %xmm12, %xmm6			; SSE41-NEXT: movdqa %xmm12, %xmm6
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm6			; SSE41-NEXT: pcmpgtd %xmm0, %xmm6
	; SSE41-NEXT: pshufd {{.*#+}} xmm13 = xmm6[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm13 = xmm6[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm12, %xmm0			; SSE41-NEXT: pcmpeqd %xmm12, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm14 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm13, %xmm14			; SSE41-NEXT: pand %xmm13, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm6[1,1,3,3]			; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: por %xmm14, %xmm0
	; SSE41-NEXT: movapd %xmm11, %xmm13			; SSE41-NEXT: movapd %xmm11, %xmm13
	; SSE41-NEXT: blendvpd %xmm0, %xmm7, %xmm13			; SSE41-NEXT: blendvpd %xmm0, %xmm7, %xmm13
	; SSE41-NEXT: movdqa %xmm4, %xmm0			; SSE41-NEXT: movdqa %xmm4, %xmm0
	; SSE41-NEXT: pxor %xmm9, %xmm0			; SSE41-NEXT: pxor %xmm9, %xmm0
	; SSE41-NEXT: movdqa %xmm12, %xmm6			; SSE41-NEXT: movdqa %xmm12, %xmm6
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm6			; SSE41-NEXT: pcmpgtd %xmm0, %xmm6
	; SSE41-NEXT: pshufd {{.*#+}} xmm14 = xmm6[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm6[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm12, %xmm0			; SSE41-NEXT: pcmpeqd %xmm12, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm14, %xmm7			; SSE41-NEXT: pand %xmm7, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm6[1,1,3,3]			; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: por %xmm7, %xmm0
	; SSE41-NEXT: movapd %xmm11, %xmm14			; SSE41-NEXT: movapd %xmm11, %xmm14
	; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm14			; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm14
	; SSE41-NEXT: movdqa %xmm5, %xmm0			; SSE41-NEXT: movdqa %xmm5, %xmm0
	; SSE41-NEXT: pxor %xmm9, %xmm0			; SSE41-NEXT: pxor %xmm9, %xmm0
	; SSE41-NEXT: movdqa %xmm12, %xmm4			; SSE41-NEXT: movdqa %xmm12, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm4			; SSE41-NEXT: pcmpgtd %xmm0, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm12, %xmm0			; SSE41-NEXT: pcmpeqd %xmm12, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm6, %xmm7			; SSE41-NEXT: pand %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm7, %xmm0
	; SSE41-NEXT: movapd %xmm11, %xmm15			; SSE41-NEXT: movapd %xmm11, %xmm15
	; SSE41-NEXT: blendvpd %xmm0, %xmm5, %xmm15			; SSE41-NEXT: blendvpd %xmm0, %xmm5, %xmm15
	; SSE41-NEXT: movdqa %xmm2, %xmm0			; SSE41-NEXT: movdqa %xmm2, %xmm0
	; SSE41-NEXT: pxor %xmm9, %xmm0			; SSE41-NEXT: pxor %xmm9, %xmm0
	; SSE41-NEXT: movdqa %xmm12, %xmm5			; SSE41-NEXT: movdqa %xmm12, %xmm5
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm5			; SSE41-NEXT: pcmpgtd %xmm0, %xmm5
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm5[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm5[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm12, %xmm0			; SSE41-NEXT: pcmpeqd %xmm12, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm6, %xmm7			; SSE41-NEXT: pand %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm5[1,1,3,3]			; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: por %xmm7, %xmm0
	; SSE41-NEXT: movapd %xmm11, %xmm5			; SSE41-NEXT: movapd %xmm11, %xmm5
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm5			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm5
	; SSE41-NEXT: movdqa %xmm3, %xmm0			; SSE41-NEXT: movdqa %xmm3, %xmm0
	; SSE41-NEXT: pxor %xmm9, %xmm0			; SSE41-NEXT: pxor %xmm9, %xmm0
	; SSE41-NEXT: movdqa %xmm12, %xmm2			; SSE41-NEXT: movdqa %xmm12, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm2			; SSE41-NEXT: pcmpgtd %xmm0, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm12, %xmm0			; SSE41-NEXT: pcmpeqd %xmm12, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm6, %xmm7			; SSE41-NEXT: pand %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm7, %xmm0
	; SSE41-NEXT: movapd %xmm11, %xmm6			; SSE41-NEXT: movapd %xmm11, %xmm6
	; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm6			; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm6
	; SSE41-NEXT: movdqa %xmm8, %xmm0			; SSE41-NEXT: movdqa %xmm8, %xmm0
	; SSE41-NEXT: pxor %xmm9, %xmm0			; SSE41-NEXT: pxor %xmm9, %xmm0
	; SSE41-NEXT: movdqa %xmm12, %xmm2			; SSE41-NEXT: movdqa %xmm12, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm2			; SSE41-NEXT: pcmpgtd %xmm0, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm12, %xmm0			; SSE41-NEXT: pcmpeqd %xmm12, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm3, %xmm7			; SSE41-NEXT: pand %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm7, %xmm0
	; SSE41-NEXT: movapd %xmm11, %xmm3			; SSE41-NEXT: movapd %xmm11, %xmm3
	; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm3			; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm3
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: pxor %xmm9, %xmm0			; SSE41-NEXT: pxor %xmm9, %xmm0
	; SSE41-NEXT: movdqa %xmm12, %xmm2			; SSE41-NEXT: movdqa %xmm12, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm2			; SSE41-NEXT: pcmpgtd %xmm0, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm12, %xmm0			; SSE41-NEXT: pcmpeqd %xmm12, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm7, %xmm4			; SSE41-NEXT: pand %xmm7, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm11			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm11
	; SSE41-NEXT: xorpd %xmm8, %xmm8			; SSE41-NEXT: pxor %xmm2, %xmm2
	; SSE41-NEXT: movapd %xmm11, %xmm0			; SSE41-NEXT: movapd %xmm11, %xmm0
	; SSE41-NEXT: xorpd %xmm9, %xmm0			; SSE41-NEXT: xorpd %xmm9, %xmm0
	; SSE41-NEXT: movapd %xmm0, %xmm1			; SSE41-NEXT: movapd %xmm0, %xmm1
	; SSE41-NEXT: pcmpgtd %xmm9, %xmm1			; SSE41-NEXT: pcmpgtd %xmm9, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm1[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm1[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm9, %xmm0			; SSE41-NEXT: pcmpeqd %xmm9, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm4, %xmm7			; SSE41-NEXT: pand %xmm7, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]			; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: por %xmm7, %xmm0			; SSE41-NEXT: pxor %xmm7, %xmm7
	; SSE41-NEXT: pxor %xmm4, %xmm4			; SSE41-NEXT: blendvpd %xmm0, %xmm11, %xmm7
	; SSE41-NEXT: blendvpd %xmm0, %xmm11, %xmm4
	; SSE41-NEXT: movapd %xmm3, %xmm0			; SSE41-NEXT: movapd %xmm3, %xmm0
	; SSE41-NEXT: xorpd %xmm9, %xmm0			; SSE41-NEXT: xorpd %xmm9, %xmm0
	; SSE41-NEXT: movapd %xmm0, %xmm1			; SSE41-NEXT: movapd %xmm0, %xmm1
	; SSE41-NEXT: pcmpgtd %xmm9, %xmm1			; SSE41-NEXT: pcmpgtd %xmm9, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm1[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm1[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm9, %xmm0			; SSE41-NEXT: pcmpeqd %xmm9, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm7, %xmm2			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]			; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: pxor %xmm1, %xmm1			; SSE41-NEXT: pxor %xmm1, %xmm1
	; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm1
	; SSE41-NEXT: packusdw %xmm4, %xmm1			; SSE41-NEXT: packusdw %xmm7, %xmm1
	; SSE41-NEXT: movapd %xmm6, %xmm0			; SSE41-NEXT: movapd %xmm6, %xmm0
	; SSE41-NEXT: xorpd %xmm9, %xmm0			; SSE41-NEXT: xorpd %xmm9, %xmm0
	; SSE41-NEXT: movapd %xmm0, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm9, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm9, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm3, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]
	; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: pxor %xmm2, %xmm2
	; SSE41-NEXT: blendvpd %xmm0, %xmm6, %xmm2
	; SSE41-NEXT: movapd %xmm5, %xmm0
	; SSE41-NEXT: xorpd %xmm9, %xmm0
	; SSE41-NEXT: movapd %xmm0, %xmm3			; SSE41-NEXT: movapd %xmm0, %xmm3
	; SSE41-NEXT: pcmpgtd %xmm9, %xmm3			; SSE41-NEXT: pcmpgtd %xmm9, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm3[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm3[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm9, %xmm0			; SSE41-NEXT: pcmpeqd %xmm9, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm4, %xmm6			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[1,1,3,3]			; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: pxor %xmm3, %xmm3			; SSE41-NEXT: pxor %xmm3, %xmm3
	; SSE41-NEXT: blendvpd %xmm0, %xmm5, %xmm3			; SSE41-NEXT: blendvpd %xmm0, %xmm6, %xmm3
	; SSE41-NEXT: packusdw %xmm2, %xmm3			; SSE41-NEXT: movapd %xmm5, %xmm0
	; SSE41-NEXT: packusdw %xmm3, %xmm1
	; SSE41-NEXT: movapd %xmm15, %xmm0
	; SSE41-NEXT: xorpd %xmm9, %xmm0			; SSE41-NEXT: xorpd %xmm9, %xmm0
	; SSE41-NEXT: movapd %xmm0, %xmm2			; SSE41-NEXT: movapd %xmm0, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm9, %xmm2			; SSE41-NEXT: pcmpgtd %xmm9, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm9, %xmm0			; SSE41-NEXT: pcmpeqd %xmm9, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm3, %xmm4			; SSE41-NEXT: pand %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]
	; SSE41-NEXT: por %xmm4, %xmm0			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: pxor %xmm2, %xmm2			; SSE41-NEXT: pxor %xmm4, %xmm4
	; SSE41-NEXT: blendvpd %xmm0, %xmm15, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm5, %xmm4
	; SSE41-NEXT: movapd %xmm14, %xmm0			; SSE41-NEXT: packusdw %xmm3, %xmm4
				; SSE41-NEXT: packusdw %xmm4, %xmm1
				; SSE41-NEXT: movapd %xmm15, %xmm0
	; SSE41-NEXT: xorpd %xmm9, %xmm0			; SSE41-NEXT: xorpd %xmm9, %xmm0
	; SSE41-NEXT: movapd %xmm0, %xmm3			; SSE41-NEXT: movapd %xmm0, %xmm3
	; SSE41-NEXT: pcmpgtd %xmm9, %xmm3			; SSE41-NEXT: pcmpgtd %xmm9, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm3[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm3[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm9, %xmm0			; SSE41-NEXT: pcmpeqd %xmm9, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm4, %xmm5			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[1,1,3,3]			; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: por %xmm5, %xmm0			; SSE41-NEXT: pxor %xmm4, %xmm4
				; SSE41-NEXT: blendvpd %xmm0, %xmm15, %xmm4
				; SSE41-NEXT: movapd %xmm14, %xmm0
				; SSE41-NEXT: xorpd %xmm9, %xmm0
				; SSE41-NEXT: movapd %xmm0, %xmm3
				; SSE41-NEXT: pcmpgtd %xmm9, %xmm3
				; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm3[0,0,2,2]
				; SSE41-NEXT: pcmpeqd %xmm9, %xmm0
				; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
				; SSE41-NEXT: pand %xmm5, %xmm0
				; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: pxor %xmm3, %xmm3			; SSE41-NEXT: pxor %xmm3, %xmm3
	; SSE41-NEXT: blendvpd %xmm0, %xmm14, %xmm3			; SSE41-NEXT: blendvpd %xmm0, %xmm14, %xmm3
	; SSE41-NEXT: packusdw %xmm2, %xmm3			; SSE41-NEXT: packusdw %xmm4, %xmm3
	; SSE41-NEXT: movapd %xmm13, %xmm0			; SSE41-NEXT: movapd %xmm13, %xmm0
	; SSE41-NEXT: xorpd %xmm9, %xmm0			; SSE41-NEXT: xorpd %xmm9, %xmm0
	; SSE41-NEXT: movapd %xmm0, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm9, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm9, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm4, %xmm5
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]
	; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: pxor %xmm2, %xmm2
	; SSE41-NEXT: blendvpd %xmm0, %xmm13, %xmm2
	; SSE41-NEXT: movapd %xmm10, %xmm0
	; SSE41-NEXT: xorpd %xmm9, %xmm0
	; SSE41-NEXT: movapd %xmm0, %xmm4			; SSE41-NEXT: movapd %xmm0, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm9, %xmm4			; SSE41-NEXT: pcmpgtd %xmm9, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm9, %xmm0			; SSE41-NEXT: pcmpeqd %xmm9, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm5, %xmm6			; SSE41-NEXT: pand %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0			; SSE41-NEXT: pxor %xmm4, %xmm4
	; SSE41-NEXT: blendvpd %xmm0, %xmm10, %xmm8			; SSE41-NEXT: blendvpd %xmm0, %xmm13, %xmm4
	; SSE41-NEXT: packusdw %xmm2, %xmm8			; SSE41-NEXT: movapd %xmm10, %xmm0
	; SSE41-NEXT: packusdw %xmm8, %xmm3			; SSE41-NEXT: xorpd %xmm9, %xmm0
				; SSE41-NEXT: movapd %xmm0, %xmm5
				; SSE41-NEXT: pcmpgtd %xmm9, %xmm5
				; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm5[0,0,2,2]
				; SSE41-NEXT: pcmpeqd %xmm9, %xmm0
				; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
				; SSE41-NEXT: pand %xmm6, %xmm0
				; SSE41-NEXT: por %xmm5, %xmm0
				; SSE41-NEXT: blendvpd %xmm0, %xmm10, %xmm2
				; SSE41-NEXT: packusdw %xmm4, %xmm2
				; SSE41-NEXT: packusdw %xmm2, %xmm3
	; SSE41-NEXT: packuswb %xmm3, %xmm1			; SSE41-NEXT: packuswb %xmm3, %xmm1
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: trunc_packus_v16i64_v16i8:			; AVX1-LABEL: trunc_packus_v16i64_v16i8:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vmovapd {{.*#+}} ymm4 = [255,255,255,255]			; AVX1-NEXT: vmovapd {{.*#+}} ymm4 = [255,255,255,255]
	; AVX1-NEXT: vextractf128 $1, %ymm3, %xmm5			; AVX1-NEXT: vextractf128 $1, %ymm3, %xmm5
	▲ Show 20 Lines • Show All 487 Lines • Show Last 20 Lines

llvm/trunk/test/CodeGen/X86/vector-trunc-ssat-widen.ll

	Show First 20 Lines • Show All 137 Lines • ▼ Show 20 Lines
	; SSSE3-NEXT: retq			; SSSE3-NEXT: retq
	;			;
	; SSE41-LABEL: trunc_ssat_v4i64_v4i32:			; SSE41-LABEL: trunc_ssat_v4i64_v4i32:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movdqa %xmm0, %xmm2			; SSE41-NEXT: movdqa %xmm0, %xmm2
	; SSE41-NEXT: movapd {{.*#+}} xmm4 = [2147483647,2147483647]			; SSE41-NEXT: movapd {{.*#+}} xmm4 = [2147483647,2147483647]
	; SSE41-NEXT: movdqa {{.*#+}} xmm3 = [2147483648,2147483648]			; SSE41-NEXT: movdqa {{.*#+}} xmm3 = [2147483648,2147483648]
	; SSE41-NEXT: pxor %xmm3, %xmm0			; SSE41-NEXT: pxor %xmm3, %xmm0
	; SSE41-NEXT: movdqa {{.*#+}} xmm8 = [4294967295,4294967295]			; SSE41-NEXT: movdqa {{.*#+}} xmm6 = [4294967295,4294967295]
	; SSE41-NEXT: movdqa %xmm8, %xmm5			; SSE41-NEXT: movdqa %xmm6, %xmm5
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm5			; SSE41-NEXT: pcmpgtd %xmm0, %xmm5
	; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm5[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm5[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm8, %xmm0			; SSE41-NEXT: pcmpeqd %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm7, %xmm6			; SSE41-NEXT: pand %xmm7, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm5[1,1,3,3]			; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: movapd %xmm4, %xmm5			; SSE41-NEXT: movapd %xmm4, %xmm5
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm5			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm5
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: pxor %xmm3, %xmm0			; SSE41-NEXT: pxor %xmm3, %xmm0
	; SSE41-NEXT: movdqa %xmm8, %xmm2			; SSE41-NEXT: movdqa %xmm6, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm2			; SSE41-NEXT: pcmpgtd %xmm0, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm8, %xmm0			; SSE41-NEXT: pcmpeqd %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm6, %xmm7			; SSE41-NEXT: pand %xmm7, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm7, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm4			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm4
	; SSE41-NEXT: movapd {{.*#+}} xmm1 = [18446744071562067968,18446744071562067968]			; SSE41-NEXT: movapd {{.*#+}} xmm1 = [18446744071562067968,18446744071562067968]
	; SSE41-NEXT: movapd %xmm4, %xmm0			; SSE41-NEXT: movapd %xmm4, %xmm0
	; SSE41-NEXT: xorpd %xmm3, %xmm0			; SSE41-NEXT: xorpd %xmm3, %xmm0
	; SSE41-NEXT: movdqa {{.*#+}} xmm8 = [18446744069414584320,18446744069414584320]			; SSE41-NEXT: movdqa {{.*#+}} xmm2 = [18446744069414584320,18446744069414584320]
	; SSE41-NEXT: movapd %xmm0, %xmm6			; SSE41-NEXT: movapd %xmm0, %xmm6
	; SSE41-NEXT: pcmpgtd %xmm8, %xmm6			; SSE41-NEXT: pcmpgtd %xmm2, %xmm6
	; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm6[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm6[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm8, %xmm0			; SSE41-NEXT: pcmpeqd %xmm2, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm7, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm6[1,1,3,3]
	; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: movapd %xmm1, %xmm2
	; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm2
	; SSE41-NEXT: xorpd %xmm5, %xmm3
	; SSE41-NEXT: movapd %xmm3, %xmm0
	; SSE41-NEXT: pcmpgtd %xmm8, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm0[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm8, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm3[1,1,3,3]
	; SSE41-NEXT: pand %xmm4, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: por %xmm3, %xmm0			; SSE41-NEXT: pand %xmm7, %xmm0
				; SSE41-NEXT: por %xmm6, %xmm0
				; SSE41-NEXT: movapd %xmm1, %xmm6
				; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm6
				; SSE41-NEXT: xorpd %xmm5, %xmm3
				; SSE41-NEXT: movapd %xmm3, %xmm4
				; SSE41-NEXT: pcmpgtd %xmm2, %xmm4
				; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm4[0,0,2,2]
				; SSE41-NEXT: pcmpeqd %xmm2, %xmm3
				; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[1,1,3,3]
				; SSE41-NEXT: pand %xmm7, %xmm0
				; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm5, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm5, %xmm1
	; SSE41-NEXT: shufps {{.*#+}} xmm1 = xmm1[0,2],xmm2[0,2]			; SSE41-NEXT: shufps {{.*#+}} xmm1 = xmm1[0,2],xmm6[0,2]
	; SSE41-NEXT: movaps %xmm1, %xmm0			; SSE41-NEXT: movaps %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: trunc_ssat_v4i64_v4i32:			; AVX1-LABEL: trunc_ssat_v4i64_v4i32:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vmovapd {{.*#+}} ymm1 = [2147483647,2147483647,2147483647,2147483647]			; AVX1-NEXT: vmovapd {{.*#+}} ymm1 = [2147483647,2147483647,2147483647,2147483647]
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm3 = [2147483647,2147483647]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm3 = [2147483647,2147483647]
	▲ Show 20 Lines • Show All 311 Lines • ▼ Show 20 Lines
	; SSSE3-NEXT: pand %xmm0, %xmm5			; SSSE3-NEXT: pand %xmm0, %xmm5
	; SSSE3-NEXT: pandn %xmm8, %xmm0			; SSSE3-NEXT: pandn %xmm8, %xmm0
	; SSSE3-NEXT: por %xmm5, %xmm0			; SSSE3-NEXT: por %xmm5, %xmm0
	; SSSE3-NEXT: shufps {{.*#+}} xmm0 = xmm0[0,2],xmm3[0,2]			; SSSE3-NEXT: shufps {{.*#+}} xmm0 = xmm0[0,2],xmm3[0,2]
	; SSSE3-NEXT: retq			; SSSE3-NEXT: retq
	;			;
	; SSE41-LABEL: trunc_ssat_v8i64_v8i32:			; SSE41-LABEL: trunc_ssat_v8i64_v8i32:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movdqa %xmm0, %xmm9			; SSE41-NEXT: movdqa %xmm0, %xmm4
	; SSE41-NEXT: movapd {{.*#+}} xmm7 = [2147483647,2147483647]			; SSE41-NEXT: movapd {{.*#+}} xmm7 = [2147483647,2147483647]
	; SSE41-NEXT: movdqa {{.*#+}} xmm5 = [2147483648,2147483648]			; SSE41-NEXT: movdqa {{.*#+}} xmm5 = [2147483648,2147483648]
	; SSE41-NEXT: pxor %xmm5, %xmm0			; SSE41-NEXT: pxor %xmm5, %xmm0
	; SSE41-NEXT: movdqa {{.*#+}} xmm10 = [4294967295,4294967295]			; SSE41-NEXT: movdqa {{.*#+}} xmm10 = [4294967295,4294967295]
	; SSE41-NEXT: movdqa %xmm10, %xmm6			; SSE41-NEXT: movdqa %xmm10, %xmm6
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm6			; SSE41-NEXT: pcmpgtd %xmm0, %xmm6
	; SSE41-NEXT: pshufd {{.*#+}} xmm8 = xmm6[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm8 = xmm6[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm10, %xmm0			; SSE41-NEXT: pcmpeqd %xmm10, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm8, %xmm4			; SSE41-NEXT: pand %xmm8, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm6[1,1,3,3]			; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: movapd %xmm7, %xmm8			; SSE41-NEXT: movapd %xmm7, %xmm8
	; SSE41-NEXT: blendvpd %xmm0, %xmm9, %xmm8			; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm8
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: pxor %xmm5, %xmm0			; SSE41-NEXT: pxor %xmm5, %xmm0
	; SSE41-NEXT: movdqa %xmm10, %xmm4			; SSE41-NEXT: movdqa %xmm10, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm4			; SSE41-NEXT: pcmpgtd %xmm0, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm9 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm10, %xmm0			; SSE41-NEXT: pcmpeqd %xmm10, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm9, %xmm6			; SSE41-NEXT: pand %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: movapd %xmm7, %xmm9			; SSE41-NEXT: movapd %xmm7, %xmm9
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm9			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm9
	; SSE41-NEXT: movdqa %xmm2, %xmm0			; SSE41-NEXT: movdqa %xmm2, %xmm0
	; SSE41-NEXT: pxor %xmm5, %xmm0			; SSE41-NEXT: pxor %xmm5, %xmm0
	; SSE41-NEXT: movdqa %xmm10, %xmm1			; SSE41-NEXT: movdqa %xmm10, %xmm1
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm1			; SSE41-NEXT: pcmpgtd %xmm0, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm1[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm1[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm10, %xmm0			; SSE41-NEXT: pcmpeqd %xmm10, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm4, %xmm6			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]			; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: movapd %xmm7, %xmm4			; SSE41-NEXT: movapd %xmm7, %xmm4
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm4			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm4
	; SSE41-NEXT: movdqa %xmm3, %xmm0			; SSE41-NEXT: movdqa %xmm3, %xmm0
	; SSE41-NEXT: pxor %xmm5, %xmm0			; SSE41-NEXT: pxor %xmm5, %xmm0
	; SSE41-NEXT: movdqa %xmm10, %xmm1			; SSE41-NEXT: movdqa %xmm10, %xmm1
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm1			; SSE41-NEXT: pcmpgtd %xmm0, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm1[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm1[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm10, %xmm0			; SSE41-NEXT: pcmpeqd %xmm10, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm2, %xmm6			; SSE41-NEXT: pand %xmm2, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]			; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm7			; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm7
	; SSE41-NEXT: movapd {{.*#+}} xmm2 = [18446744071562067968,18446744071562067968]			; SSE41-NEXT: movapd {{.*#+}} xmm2 = [18446744071562067968,18446744071562067968]
	; SSE41-NEXT: movapd %xmm7, %xmm0			; SSE41-NEXT: movapd %xmm7, %xmm0
	; SSE41-NEXT: xorpd %xmm5, %xmm0			; SSE41-NEXT: xorpd %xmm5, %xmm0
	; SSE41-NEXT: movdqa {{.*#+}} xmm10 = [18446744069414584320,18446744069414584320]			; SSE41-NEXT: movdqa {{.*#+}} xmm3 = [18446744069414584320,18446744069414584320]
	; SSE41-NEXT: movapd %xmm0, %xmm1			; SSE41-NEXT: movapd %xmm0, %xmm1
	; SSE41-NEXT: pcmpgtd %xmm10, %xmm1			; SSE41-NEXT: pcmpgtd %xmm3, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm1[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm1[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm10, %xmm0			; SSE41-NEXT: pcmpeqd %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm6, %xmm3			; SSE41-NEXT: pand %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]			; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: por %xmm3, %xmm0			; SSE41-NEXT: movapd %xmm2, %xmm6
	; SSE41-NEXT: movapd %xmm2, %xmm3			; SSE41-NEXT: blendvpd %xmm0, %xmm7, %xmm6
	; SSE41-NEXT: blendvpd %xmm0, %xmm7, %xmm3
	; SSE41-NEXT: movapd %xmm4, %xmm0			; SSE41-NEXT: movapd %xmm4, %xmm0
	; SSE41-NEXT: xorpd %xmm5, %xmm0			; SSE41-NEXT: xorpd %xmm5, %xmm0
	; SSE41-NEXT: movapd %xmm0, %xmm1			; SSE41-NEXT: movapd %xmm0, %xmm1
	; SSE41-NEXT: pcmpgtd %xmm10, %xmm1			; SSE41-NEXT: pcmpgtd %xmm3, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm1[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm1[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm10, %xmm0			; SSE41-NEXT: pcmpeqd %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm6, %xmm7			; SSE41-NEXT: pand %xmm7, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]			; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: por %xmm7, %xmm0
	; SSE41-NEXT: movapd %xmm2, %xmm1			; SSE41-NEXT: movapd %xmm2, %xmm1
	; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm1
	; SSE41-NEXT: shufps {{.*#+}} xmm1 = xmm1[0,2],xmm3[0,2]			; SSE41-NEXT: shufps {{.*#+}} xmm1 = xmm1[0,2],xmm6[0,2]
	; SSE41-NEXT: movapd %xmm9, %xmm0			; SSE41-NEXT: movapd %xmm9, %xmm0
	; SSE41-NEXT: xorpd %xmm5, %xmm0			; SSE41-NEXT: xorpd %xmm5, %xmm0
	; SSE41-NEXT: movapd %xmm0, %xmm3			; SSE41-NEXT: movapd %xmm0, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm10, %xmm3			; SSE41-NEXT: pcmpgtd %xmm3, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm3[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm10, %xmm0			; SSE41-NEXT: pcmpeqd %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm4, %xmm6
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[1,1,3,3]
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: movapd %xmm2, %xmm3
	; SSE41-NEXT: blendvpd %xmm0, %xmm9, %xmm3
	; SSE41-NEXT: xorpd %xmm8, %xmm5
	; SSE41-NEXT: movapd %xmm5, %xmm0
	; SSE41-NEXT: pcmpgtd %xmm10, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm0[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm10, %xmm5
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm5[1,1,3,3]
	; SSE41-NEXT: pand %xmm4, %xmm5
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: por %xmm5, %xmm0			; SSE41-NEXT: pand %xmm6, %xmm0
				; SSE41-NEXT: por %xmm4, %xmm0
				; SSE41-NEXT: movapd %xmm2, %xmm4
				; SSE41-NEXT: blendvpd %xmm0, %xmm9, %xmm4
				; SSE41-NEXT: xorpd %xmm8, %xmm5
				; SSE41-NEXT: movapd %xmm5, %xmm6
				; SSE41-NEXT: pcmpgtd %xmm3, %xmm6
				; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm6[0,0,2,2]
				; SSE41-NEXT: pcmpeqd %xmm3, %xmm5
				; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm5[1,1,3,3]
				; SSE41-NEXT: pand %xmm7, %xmm0
				; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm2
	; SSE41-NEXT: shufps {{.*#+}} xmm2 = xmm2[0,2],xmm3[0,2]			; SSE41-NEXT: shufps {{.*#+}} xmm2 = xmm2[0,2],xmm4[0,2]
	; SSE41-NEXT: movaps %xmm2, %xmm0			; SSE41-NEXT: movaps %xmm2, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: trunc_ssat_v8i64_v8i32:			; AVX1-LABEL: trunc_ssat_v8i64_v8i32:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vmovapd {{.*#+}} ymm2 = [2147483647,2147483647,2147483647,2147483647]			; AVX1-NEXT: vmovapd {{.*#+}} ymm2 = [2147483647,2147483647,2147483647,2147483647]
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3			; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [2147483647,2147483647]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [2147483647,2147483647]
	▲ Show 20 Lines • Show All 314 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: movdqa %xmm0, %xmm10			; SSE41-NEXT: movdqa %xmm0, %xmm10
	; SSE41-NEXT: movapd {{.*#+}} xmm7 = [32767,32767]			; SSE41-NEXT: movapd {{.*#+}} xmm7 = [32767,32767]
	; SSE41-NEXT: movdqa {{.*#+}} xmm5 = [2147483648,2147483648]			; SSE41-NEXT: movdqa {{.*#+}} xmm5 = [2147483648,2147483648]
	; SSE41-NEXT: movdqa %xmm2, %xmm0			; SSE41-NEXT: movdqa %xmm2, %xmm0
	; SSE41-NEXT: pxor %xmm5, %xmm0			; SSE41-NEXT: pxor %xmm5, %xmm0
	; SSE41-NEXT: movdqa {{.*#+}} xmm11 = [2147516415,2147516415]			; SSE41-NEXT: movdqa {{.*#+}} xmm11 = [2147516415,2147516415]
	; SSE41-NEXT: movdqa %xmm11, %xmm6			; SSE41-NEXT: movdqa %xmm11, %xmm6
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm6			; SSE41-NEXT: pcmpgtd %xmm0, %xmm6
	; SSE41-NEXT: pshufd {{.*#+}} xmm8 = xmm6[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm6[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm11, %xmm0			; SSE41-NEXT: pcmpeqd %xmm11, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm8, %xmm4			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm6[1,1,3,3]			; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: movapd %xmm7, %xmm8			; SSE41-NEXT: movapd %xmm7, %xmm8
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm8			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm8
	; SSE41-NEXT: movdqa %xmm3, %xmm0			; SSE41-NEXT: movdqa %xmm3, %xmm0
	; SSE41-NEXT: pxor %xmm5, %xmm0			; SSE41-NEXT: pxor %xmm5, %xmm0
	; SSE41-NEXT: movdqa %xmm11, %xmm2			; SSE41-NEXT: movdqa %xmm11, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm2			; SSE41-NEXT: pcmpgtd %xmm0, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm11, %xmm0			; SSE41-NEXT: pcmpeqd %xmm11, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm4, %xmm6			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: movapd %xmm7, %xmm9			; SSE41-NEXT: movapd %xmm7, %xmm9
	; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm9			; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm9
	; SSE41-NEXT: movdqa %xmm10, %xmm0			; SSE41-NEXT: movdqa %xmm10, %xmm0
	; SSE41-NEXT: pxor %xmm5, %xmm0			; SSE41-NEXT: pxor %xmm5, %xmm0
	; SSE41-NEXT: movdqa %xmm11, %xmm2			; SSE41-NEXT: movdqa %xmm11, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm2			; SSE41-NEXT: pcmpgtd %xmm0, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm11, %xmm0			; SSE41-NEXT: pcmpeqd %xmm11, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm3, %xmm4			; SSE41-NEXT: pand %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: movapd %xmm7, %xmm2			; SSE41-NEXT: movapd %xmm7, %xmm2
	; SSE41-NEXT: blendvpd %xmm0, %xmm10, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm10, %xmm2
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: pxor %xmm5, %xmm0			; SSE41-NEXT: pxor %xmm5, %xmm0
	; SSE41-NEXT: movdqa %xmm11, %xmm3			; SSE41-NEXT: movdqa %xmm11, %xmm3
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm3			; SSE41-NEXT: pcmpgtd %xmm0, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm3[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm3[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm11, %xmm0			; SSE41-NEXT: pcmpeqd %xmm11, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm4, %xmm6			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[1,1,3,3]			; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm7			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm7
	; SSE41-NEXT: movapd {{.*#+}} xmm3 = [18446744073709518848,18446744073709518848]			; SSE41-NEXT: movapd {{.*#+}} xmm3 = [18446744073709518848,18446744073709518848]
	; SSE41-NEXT: movapd %xmm7, %xmm0			; SSE41-NEXT: movapd %xmm7, %xmm0
	; SSE41-NEXT: xorpd %xmm5, %xmm0			; SSE41-NEXT: xorpd %xmm5, %xmm0
	; SSE41-NEXT: movdqa {{.*#+}} xmm10 = [18446744071562035200,18446744071562035200]			; SSE41-NEXT: movdqa {{.*#+}} xmm4 = [18446744071562035200,18446744071562035200]
	; SSE41-NEXT: movapd %xmm0, %xmm1			; SSE41-NEXT: movapd %xmm0, %xmm1
	; SSE41-NEXT: pcmpgtd %xmm10, %xmm1			; SSE41-NEXT: pcmpgtd %xmm4, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm1[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm1[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm10, %xmm0			; SSE41-NEXT: pcmpeqd %xmm4, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm6, %xmm4			; SSE41-NEXT: pand %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]			; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: por %xmm4, %xmm0			; SSE41-NEXT: movapd %xmm3, %xmm6
	; SSE41-NEXT: movapd %xmm3, %xmm4			; SSE41-NEXT: blendvpd %xmm0, %xmm7, %xmm6
	; SSE41-NEXT: blendvpd %xmm0, %xmm7, %xmm4
	; SSE41-NEXT: movapd %xmm2, %xmm0			; SSE41-NEXT: movapd %xmm2, %xmm0
	; SSE41-NEXT: xorpd %xmm5, %xmm0			; SSE41-NEXT: xorpd %xmm5, %xmm0
	; SSE41-NEXT: movapd %xmm0, %xmm1			; SSE41-NEXT: movapd %xmm0, %xmm1
	; SSE41-NEXT: pcmpgtd %xmm10, %xmm1			; SSE41-NEXT: pcmpgtd %xmm4, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm1[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm1[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm10, %xmm0			; SSE41-NEXT: pcmpeqd %xmm4, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm6, %xmm7			; SSE41-NEXT: pand %xmm7, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]			; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: por %xmm7, %xmm0
	; SSE41-NEXT: movapd %xmm3, %xmm1			; SSE41-NEXT: movapd %xmm3, %xmm1
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm1
	; SSE41-NEXT: packssdw %xmm4, %xmm1			; SSE41-NEXT: packssdw %xmm6, %xmm1
	; SSE41-NEXT: movapd %xmm9, %xmm0			; SSE41-NEXT: movapd %xmm9, %xmm0
	; SSE41-NEXT: xorpd %xmm5, %xmm0			; SSE41-NEXT: xorpd %xmm5, %xmm0
	; SSE41-NEXT: movapd %xmm0, %xmm2			; SSE41-NEXT: movapd %xmm0, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm10, %xmm2			; SSE41-NEXT: pcmpgtd %xmm4, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm10, %xmm0			; SSE41-NEXT: pcmpeqd %xmm4, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm4, %xmm6			; SSE41-NEXT: pand %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: movapd %xmm3, %xmm2			; SSE41-NEXT: movapd %xmm3, %xmm2
	; SSE41-NEXT: blendvpd %xmm0, %xmm9, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm9, %xmm2
	; SSE41-NEXT: xorpd %xmm8, %xmm5			; SSE41-NEXT: xorpd %xmm8, %xmm5
	; SSE41-NEXT: movapd %xmm5, %xmm0			; SSE41-NEXT: movapd %xmm5, %xmm6
	; SSE41-NEXT: pcmpgtd %xmm10, %xmm0			; SSE41-NEXT: pcmpgtd %xmm4, %xmm6
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm0[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm6[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm10, %xmm5			; SSE41-NEXT: pcmpeqd %xmm4, %xmm5
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm5[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm5[1,1,3,3]
	; SSE41-NEXT: pand %xmm4, %xmm5			; SSE41-NEXT: pand %xmm7, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]			; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm3			; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm3
	; SSE41-NEXT: packssdw %xmm2, %xmm3			; SSE41-NEXT: packssdw %xmm2, %xmm3
	; SSE41-NEXT: packssdw %xmm3, %xmm1			; SSE41-NEXT: packssdw %xmm3, %xmm1
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: trunc_ssat_v8i64_v8i16:			; AVX1-LABEL: trunc_ssat_v8i64_v8i16:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	▲ Show 20 Lines • Show All 409 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: movdqa %xmm0, %xmm8			; SSE41-NEXT: movdqa %xmm0, %xmm8
	; SSE41-NEXT: movapd {{.*#+}} xmm7 = [127,127]			; SSE41-NEXT: movapd {{.*#+}} xmm7 = [127,127]
	; SSE41-NEXT: movdqa {{.*#+}} xmm5 = [2147483648,2147483648]			; SSE41-NEXT: movdqa {{.*#+}} xmm5 = [2147483648,2147483648]
	; SSE41-NEXT: movdqa %xmm3, %xmm0			; SSE41-NEXT: movdqa %xmm3, %xmm0
	; SSE41-NEXT: pxor %xmm5, %xmm0			; SSE41-NEXT: pxor %xmm5, %xmm0
	; SSE41-NEXT: movdqa {{.*#+}} xmm10 = [2147483775,2147483775]			; SSE41-NEXT: movdqa {{.*#+}} xmm10 = [2147483775,2147483775]
	; SSE41-NEXT: movdqa %xmm10, %xmm6			; SSE41-NEXT: movdqa %xmm10, %xmm6
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm6			; SSE41-NEXT: pcmpgtd %xmm0, %xmm6
	; SSE41-NEXT: pshufd {{.*#+}} xmm9 = xmm6[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm6[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm10, %xmm0			; SSE41-NEXT: pcmpeqd %xmm10, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm9, %xmm4			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm6[1,1,3,3]			; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: movapd %xmm7, %xmm9			; SSE41-NEXT: movapd %xmm7, %xmm9
	; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm9			; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm9
	; SSE41-NEXT: movdqa %xmm2, %xmm0			; SSE41-NEXT: movdqa %xmm2, %xmm0
	; SSE41-NEXT: pxor %xmm5, %xmm0			; SSE41-NEXT: pxor %xmm5, %xmm0
	; SSE41-NEXT: movdqa %xmm10, %xmm3			; SSE41-NEXT: movdqa %xmm10, %xmm3
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm3			; SSE41-NEXT: pcmpgtd %xmm0, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm3[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm3[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm10, %xmm0			; SSE41-NEXT: pcmpeqd %xmm10, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm4, %xmm6			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[1,1,3,3]			; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: movapd %xmm7, %xmm11			; SSE41-NEXT: movapd %xmm7, %xmm11
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm11			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm11
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: pxor %xmm5, %xmm0			; SSE41-NEXT: pxor %xmm5, %xmm0
	; SSE41-NEXT: movdqa %xmm10, %xmm2			; SSE41-NEXT: movdqa %xmm10, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm2			; SSE41-NEXT: pcmpgtd %xmm0, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm10, %xmm0			; SSE41-NEXT: pcmpeqd %xmm10, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm4, %xmm6			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: movapd %xmm7, %xmm6			; SSE41-NEXT: movapd %xmm7, %xmm6
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm6			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm6
	; SSE41-NEXT: movdqa %xmm8, %xmm0			; SSE41-NEXT: movdqa %xmm8, %xmm0
	; SSE41-NEXT: pxor %xmm5, %xmm0			; SSE41-NEXT: pxor %xmm5, %xmm0
	; SSE41-NEXT: movdqa %xmm10, %xmm1			; SSE41-NEXT: movdqa %xmm10, %xmm1
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm1			; SSE41-NEXT: pcmpgtd %xmm0, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm1[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm1[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm10, %xmm0			; SSE41-NEXT: pcmpeqd %xmm10, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm2, %xmm4			; SSE41-NEXT: pand %xmm2, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]			; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm7			; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm7
	; SSE41-NEXT: movapd {{.*#+}} xmm2 = [18446744073709551488,18446744073709551488]			; SSE41-NEXT: movapd {{.*#+}} xmm2 = [18446744073709551488,18446744073709551488]
	; SSE41-NEXT: movapd %xmm7, %xmm0			; SSE41-NEXT: movapd %xmm7, %xmm0
	; SSE41-NEXT: xorpd %xmm5, %xmm0			; SSE41-NEXT: xorpd %xmm5, %xmm0
	; SSE41-NEXT: movdqa {{.*#+}} xmm8 = [18446744071562067840,18446744071562067840]			; SSE41-NEXT: movdqa {{.*#+}} xmm8 = [18446744071562067840,18446744071562067840]
	; SSE41-NEXT: movapd %xmm0, %xmm1			; SSE41-NEXT: movapd %xmm0, %xmm1
	; SSE41-NEXT: pcmpgtd %xmm8, %xmm1			; SSE41-NEXT: pcmpgtd %xmm8, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm1[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm1[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm8, %xmm0			; SSE41-NEXT: pcmpeqd %xmm8, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm3, %xmm4			; SSE41-NEXT: pand %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]			; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: movapd %xmm2, %xmm1			; SSE41-NEXT: movapd %xmm2, %xmm1
	; SSE41-NEXT: blendvpd %xmm0, %xmm7, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm7, %xmm1
	; SSE41-NEXT: movapd %xmm6, %xmm0			; SSE41-NEXT: movapd %xmm6, %xmm0
	; SSE41-NEXT: xorpd %xmm5, %xmm0			; SSE41-NEXT: xorpd %xmm5, %xmm0
	; SSE41-NEXT: movapd %xmm0, %xmm3			; SSE41-NEXT: movapd %xmm0, %xmm3
	; SSE41-NEXT: pcmpgtd %xmm8, %xmm3			; SSE41-NEXT: pcmpgtd %xmm8, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm3[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm3[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm8, %xmm0			; SSE41-NEXT: pcmpeqd %xmm8, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm4, %xmm7			; SSE41-NEXT: pand %xmm7, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[1,1,3,3]			; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: por %xmm7, %xmm0
	; SSE41-NEXT: movapd %xmm2, %xmm7			; SSE41-NEXT: movapd %xmm2, %xmm7
	; SSE41-NEXT: blendvpd %xmm0, %xmm6, %xmm7			; SSE41-NEXT: blendvpd %xmm0, %xmm6, %xmm7
	; SSE41-NEXT: movapd %xmm11, %xmm0			; SSE41-NEXT: movapd %xmm11, %xmm0
	; SSE41-NEXT: xorpd %xmm5, %xmm0			; SSE41-NEXT: xorpd %xmm5, %xmm0
	; SSE41-NEXT: movapd %xmm0, %xmm3			; SSE41-NEXT: movapd %xmm0, %xmm3
	; SSE41-NEXT: pcmpgtd %xmm8, %xmm3			; SSE41-NEXT: pcmpgtd %xmm8, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm3[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm3[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm8, %xmm0			; SSE41-NEXT: pcmpeqd %xmm8, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm4, %xmm6			; SSE41-NEXT: pand %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[1,1,3,3]			; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: movapd %xmm2, %xmm3			; SSE41-NEXT: movapd %xmm2, %xmm3
	; SSE41-NEXT: blendvpd %xmm0, %xmm11, %xmm3			; SSE41-NEXT: blendvpd %xmm0, %xmm11, %xmm3
	; SSE41-NEXT: xorpd %xmm9, %xmm5			; SSE41-NEXT: xorpd %xmm9, %xmm5
	; SSE41-NEXT: movapd %xmm5, %xmm0			; SSE41-NEXT: movapd %xmm5, %xmm6
	; SSE41-NEXT: pcmpgtd %xmm8, %xmm0			; SSE41-NEXT: pcmpgtd %xmm8, %xmm6
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm0[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm6[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm8, %xmm5			; SSE41-NEXT: pcmpeqd %xmm8, %xmm5
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm5[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm5[1,1,3,3]
	; SSE41-NEXT: pand %xmm4, %xmm5			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]			; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm9, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm9, %xmm2
	; SSE41-NEXT: movapd {{.*#+}} xmm0 = [255,0,0,0,0,0,0,0,255,0,0,0,0,0,0,0]			; SSE41-NEXT: movapd {{.*#+}} xmm0 = [255,0,0,0,0,0,0,0,255,0,0,0,0,0,0,0]
	; SSE41-NEXT: andpd %xmm0, %xmm2			; SSE41-NEXT: andpd %xmm0, %xmm2
	; SSE41-NEXT: andpd %xmm0, %xmm3			; SSE41-NEXT: andpd %xmm0, %xmm3
	; SSE41-NEXT: packusdw %xmm2, %xmm3			; SSE41-NEXT: packusdw %xmm2, %xmm3
	; SSE41-NEXT: andpd %xmm0, %xmm7			; SSE41-NEXT: andpd %xmm0, %xmm7
	; SSE41-NEXT: andpd %xmm0, %xmm1			; SSE41-NEXT: andpd %xmm0, %xmm1
	; SSE41-NEXT: packusdw %xmm7, %xmm1			; SSE41-NEXT: packusdw %xmm7, %xmm1
	▲ Show 20 Lines • Show All 334 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: movdqa %xmm0, %xmm8			; SSE41-NEXT: movdqa %xmm0, %xmm8
	; SSE41-NEXT: movapd {{.*#+}} xmm7 = [127,127]			; SSE41-NEXT: movapd {{.*#+}} xmm7 = [127,127]
	; SSE41-NEXT: movdqa {{.*#+}} xmm5 = [2147483648,2147483648]			; SSE41-NEXT: movdqa {{.*#+}} xmm5 = [2147483648,2147483648]
	; SSE41-NEXT: movdqa %xmm3, %xmm0			; SSE41-NEXT: movdqa %xmm3, %xmm0
	; SSE41-NEXT: pxor %xmm5, %xmm0			; SSE41-NEXT: pxor %xmm5, %xmm0
	; SSE41-NEXT: movdqa {{.*#+}} xmm10 = [2147483775,2147483775]			; SSE41-NEXT: movdqa {{.*#+}} xmm10 = [2147483775,2147483775]
	; SSE41-NEXT: movdqa %xmm10, %xmm6			; SSE41-NEXT: movdqa %xmm10, %xmm6
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm6			; SSE41-NEXT: pcmpgtd %xmm0, %xmm6
	; SSE41-NEXT: pshufd {{.*#+}} xmm9 = xmm6[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm6[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm10, %xmm0			; SSE41-NEXT: pcmpeqd %xmm10, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm9, %xmm4			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm6[1,1,3,3]			; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: movapd %xmm7, %xmm9			; SSE41-NEXT: movapd %xmm7, %xmm9
	; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm9			; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm9
	; SSE41-NEXT: movdqa %xmm2, %xmm0			; SSE41-NEXT: movdqa %xmm2, %xmm0
	; SSE41-NEXT: pxor %xmm5, %xmm0			; SSE41-NEXT: pxor %xmm5, %xmm0
	; SSE41-NEXT: movdqa %xmm10, %xmm3			; SSE41-NEXT: movdqa %xmm10, %xmm3
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm3			; SSE41-NEXT: pcmpgtd %xmm0, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm3[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm3[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm10, %xmm0			; SSE41-NEXT: pcmpeqd %xmm10, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm4, %xmm6			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[1,1,3,3]			; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: movapd %xmm7, %xmm11			; SSE41-NEXT: movapd %xmm7, %xmm11
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm11			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm11
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: pxor %xmm5, %xmm0			; SSE41-NEXT: pxor %xmm5, %xmm0
	; SSE41-NEXT: movdqa %xmm10, %xmm2			; SSE41-NEXT: movdqa %xmm10, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm2			; SSE41-NEXT: pcmpgtd %xmm0, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm10, %xmm0			; SSE41-NEXT: pcmpeqd %xmm10, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm4, %xmm6			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: movapd %xmm7, %xmm6			; SSE41-NEXT: movapd %xmm7, %xmm6
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm6			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm6
	; SSE41-NEXT: movdqa %xmm8, %xmm0			; SSE41-NEXT: movdqa %xmm8, %xmm0
	; SSE41-NEXT: pxor %xmm5, %xmm0			; SSE41-NEXT: pxor %xmm5, %xmm0
	; SSE41-NEXT: movdqa %xmm10, %xmm1			; SSE41-NEXT: movdqa %xmm10, %xmm1
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm1			; SSE41-NEXT: pcmpgtd %xmm0, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm1[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm1[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm10, %xmm0			; SSE41-NEXT: pcmpeqd %xmm10, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm2, %xmm4			; SSE41-NEXT: pand %xmm2, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]			; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm7			; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm7
	; SSE41-NEXT: movapd {{.*#+}} xmm1 = [18446744073709551488,18446744073709551488]			; SSE41-NEXT: movapd {{.*#+}} xmm1 = [18446744073709551488,18446744073709551488]
	; SSE41-NEXT: movapd %xmm7, %xmm0			; SSE41-NEXT: movapd %xmm7, %xmm0
	; SSE41-NEXT: xorpd %xmm5, %xmm0			; SSE41-NEXT: xorpd %xmm5, %xmm0
	; SSE41-NEXT: movdqa {{.*#+}} xmm8 = [18446744071562067840,18446744071562067840]			; SSE41-NEXT: movdqa {{.*#+}} xmm8 = [18446744071562067840,18446744071562067840]
	; SSE41-NEXT: movapd %xmm0, %xmm2			; SSE41-NEXT: movapd %xmm0, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm8, %xmm2			; SSE41-NEXT: pcmpgtd %xmm8, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm8, %xmm0			; SSE41-NEXT: pcmpeqd %xmm8, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm3, %xmm4			; SSE41-NEXT: pand %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: movapd %xmm1, %xmm2			; SSE41-NEXT: movapd %xmm1, %xmm2
	; SSE41-NEXT: blendvpd %xmm0, %xmm7, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm7, %xmm2
	; SSE41-NEXT: movapd %xmm6, %xmm0			; SSE41-NEXT: movapd %xmm6, %xmm0
	; SSE41-NEXT: xorpd %xmm5, %xmm0			; SSE41-NEXT: xorpd %xmm5, %xmm0
	; SSE41-NEXT: movapd %xmm0, %xmm3			; SSE41-NEXT: movapd %xmm0, %xmm3
	; SSE41-NEXT: pcmpgtd %xmm8, %xmm3			; SSE41-NEXT: pcmpgtd %xmm8, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm3[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm3[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm8, %xmm0			; SSE41-NEXT: pcmpeqd %xmm8, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm4, %xmm7			; SSE41-NEXT: pand %xmm7, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[1,1,3,3]			; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: por %xmm7, %xmm0
	; SSE41-NEXT: movapd %xmm1, %xmm7			; SSE41-NEXT: movapd %xmm1, %xmm7
	; SSE41-NEXT: blendvpd %xmm0, %xmm6, %xmm7			; SSE41-NEXT: blendvpd %xmm0, %xmm6, %xmm7
	; SSE41-NEXT: movapd %xmm11, %xmm0			; SSE41-NEXT: movapd %xmm11, %xmm0
	; SSE41-NEXT: xorpd %xmm5, %xmm0			; SSE41-NEXT: xorpd %xmm5, %xmm0
	; SSE41-NEXT: movapd %xmm0, %xmm3			; SSE41-NEXT: movapd %xmm0, %xmm3
	; SSE41-NEXT: pcmpgtd %xmm8, %xmm3			; SSE41-NEXT: pcmpgtd %xmm8, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm3[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm3[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm8, %xmm0			; SSE41-NEXT: pcmpeqd %xmm8, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm4, %xmm6			; SSE41-NEXT: pand %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[1,1,3,3]			; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: movapd %xmm1, %xmm3			; SSE41-NEXT: movapd %xmm1, %xmm3
	; SSE41-NEXT: blendvpd %xmm0, %xmm11, %xmm3			; SSE41-NEXT: blendvpd %xmm0, %xmm11, %xmm3
	; SSE41-NEXT: xorpd %xmm9, %xmm5			; SSE41-NEXT: xorpd %xmm9, %xmm5
	; SSE41-NEXT: movapd %xmm5, %xmm0			; SSE41-NEXT: movapd %xmm5, %xmm6
	; SSE41-NEXT: pcmpgtd %xmm8, %xmm0			; SSE41-NEXT: pcmpgtd %xmm8, %xmm6
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm0[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm6[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm8, %xmm5			; SSE41-NEXT: pcmpeqd %xmm8, %xmm5
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm5[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm5[1,1,3,3]
	; SSE41-NEXT: pand %xmm4, %xmm5			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]			; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm9, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm9, %xmm1
	; SSE41-NEXT: movapd {{.*#+}} xmm0 = [255,0,0,0,0,0,0,0,255,0,0,0,0,0,0,0]			; SSE41-NEXT: movapd {{.*#+}} xmm0 = [255,0,0,0,0,0,0,0,255,0,0,0,0,0,0,0]
	; SSE41-NEXT: andpd %xmm0, %xmm1			; SSE41-NEXT: andpd %xmm0, %xmm1
	; SSE41-NEXT: andpd %xmm0, %xmm3			; SSE41-NEXT: andpd %xmm0, %xmm3
	; SSE41-NEXT: packusdw %xmm1, %xmm3			; SSE41-NEXT: packusdw %xmm1, %xmm3
	; SSE41-NEXT: andpd %xmm0, %xmm7			; SSE41-NEXT: andpd %xmm0, %xmm7
	; SSE41-NEXT: andpd %xmm0, %xmm2			; SSE41-NEXT: andpd %xmm0, %xmm2
	; SSE41-NEXT: packusdw %xmm7, %xmm2			; SSE41-NEXT: packusdw %xmm7, %xmm2
	▲ Show 20 Lines • Show All 539 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: movdqa {{.*#+}} xmm9 = [2147483648,2147483648]			; SSE41-NEXT: movdqa {{.*#+}} xmm9 = [2147483648,2147483648]
	; SSE41-NEXT: movdqa %xmm6, %xmm0			; SSE41-NEXT: movdqa %xmm6, %xmm0
	; SSE41-NEXT: pxor %xmm9, %xmm0			; SSE41-NEXT: pxor %xmm9, %xmm0
	; SSE41-NEXT: movdqa {{.*#+}} xmm12 = [2147483775,2147483775]			; SSE41-NEXT: movdqa {{.*#+}} xmm12 = [2147483775,2147483775]
	; SSE41-NEXT: movdqa %xmm12, %xmm10			; SSE41-NEXT: movdqa %xmm12, %xmm10
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm10			; SSE41-NEXT: pcmpgtd %xmm0, %xmm10
	; SSE41-NEXT: pshufd {{.*#+}} xmm13 = xmm10[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm13 = xmm10[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm12, %xmm0			; SSE41-NEXT: pcmpeqd %xmm12, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm14 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm13, %xmm14			; SSE41-NEXT: pand %xmm13, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm10[1,1,3,3]			; SSE41-NEXT: por %xmm10, %xmm0
	; SSE41-NEXT: por %xmm14, %xmm0
	; SSE41-NEXT: movapd %xmm11, %xmm10			; SSE41-NEXT: movapd %xmm11, %xmm10
	; SSE41-NEXT: blendvpd %xmm0, %xmm6, %xmm10			; SSE41-NEXT: blendvpd %xmm0, %xmm6, %xmm10
	; SSE41-NEXT: movdqa %xmm7, %xmm0			; SSE41-NEXT: movdqa %xmm7, %xmm0
	; SSE41-NEXT: pxor %xmm9, %xmm0			; SSE41-NEXT: pxor %xmm9, %xmm0
	; SSE41-NEXT: movdqa %xmm12, %xmm6			; SSE41-NEXT: movdqa %xmm12, %xmm6
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm6			; SSE41-NEXT: pcmpgtd %xmm0, %xmm6
	; SSE41-NEXT: pshufd {{.*#+}} xmm13 = xmm6[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm13 = xmm6[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm12, %xmm0			; SSE41-NEXT: pcmpeqd %xmm12, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm14 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm13, %xmm14			; SSE41-NEXT: pand %xmm13, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm6[1,1,3,3]			; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: por %xmm14, %xmm0
	; SSE41-NEXT: movapd %xmm11, %xmm13			; SSE41-NEXT: movapd %xmm11, %xmm13
	; SSE41-NEXT: blendvpd %xmm0, %xmm7, %xmm13			; SSE41-NEXT: blendvpd %xmm0, %xmm7, %xmm13
	; SSE41-NEXT: movdqa %xmm4, %xmm0			; SSE41-NEXT: movdqa %xmm4, %xmm0
	; SSE41-NEXT: pxor %xmm9, %xmm0			; SSE41-NEXT: pxor %xmm9, %xmm0
	; SSE41-NEXT: movdqa %xmm12, %xmm6			; SSE41-NEXT: movdqa %xmm12, %xmm6
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm6			; SSE41-NEXT: pcmpgtd %xmm0, %xmm6
	; SSE41-NEXT: pshufd {{.*#+}} xmm14 = xmm6[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm6[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm12, %xmm0			; SSE41-NEXT: pcmpeqd %xmm12, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm14, %xmm7			; SSE41-NEXT: pand %xmm7, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm6[1,1,3,3]			; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: por %xmm7, %xmm0
	; SSE41-NEXT: movapd %xmm11, %xmm14			; SSE41-NEXT: movapd %xmm11, %xmm14
	; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm14			; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm14
	; SSE41-NEXT: movdqa %xmm5, %xmm0			; SSE41-NEXT: movdqa %xmm5, %xmm0
	; SSE41-NEXT: pxor %xmm9, %xmm0			; SSE41-NEXT: pxor %xmm9, %xmm0
	; SSE41-NEXT: movdqa %xmm12, %xmm4			; SSE41-NEXT: movdqa %xmm12, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm4			; SSE41-NEXT: pcmpgtd %xmm0, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm12, %xmm0			; SSE41-NEXT: pcmpeqd %xmm12, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm6, %xmm7			; SSE41-NEXT: pand %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm7, %xmm0
	; SSE41-NEXT: movapd %xmm11, %xmm15			; SSE41-NEXT: movapd %xmm11, %xmm15
	; SSE41-NEXT: blendvpd %xmm0, %xmm5, %xmm15			; SSE41-NEXT: blendvpd %xmm0, %xmm5, %xmm15
	; SSE41-NEXT: movdqa %xmm2, %xmm0			; SSE41-NEXT: movdqa %xmm2, %xmm0
	; SSE41-NEXT: pxor %xmm9, %xmm0			; SSE41-NEXT: pxor %xmm9, %xmm0
	; SSE41-NEXT: movdqa %xmm12, %xmm5			; SSE41-NEXT: movdqa %xmm12, %xmm5
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm5			; SSE41-NEXT: pcmpgtd %xmm0, %xmm5
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm5[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm5[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm12, %xmm0			; SSE41-NEXT: pcmpeqd %xmm12, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm6, %xmm7			; SSE41-NEXT: pand %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm5[1,1,3,3]			; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: por %xmm7, %xmm0
	; SSE41-NEXT: movapd %xmm11, %xmm5			; SSE41-NEXT: movapd %xmm11, %xmm5
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm5			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm5
	; SSE41-NEXT: movdqa %xmm3, %xmm0			; SSE41-NEXT: movdqa %xmm3, %xmm0
	; SSE41-NEXT: pxor %xmm9, %xmm0			; SSE41-NEXT: pxor %xmm9, %xmm0
	; SSE41-NEXT: movdqa %xmm12, %xmm2			; SSE41-NEXT: movdqa %xmm12, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm2			; SSE41-NEXT: pcmpgtd %xmm0, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm12, %xmm0			; SSE41-NEXT: pcmpeqd %xmm12, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm6, %xmm7			; SSE41-NEXT: pand %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm7, %xmm0
	; SSE41-NEXT: movapd %xmm11, %xmm6			; SSE41-NEXT: movapd %xmm11, %xmm6
	; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm6			; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm6
	; SSE41-NEXT: movdqa %xmm8, %xmm0			; SSE41-NEXT: movdqa %xmm8, %xmm0
	; SSE41-NEXT: pxor %xmm9, %xmm0			; SSE41-NEXT: pxor %xmm9, %xmm0
	; SSE41-NEXT: movdqa %xmm12, %xmm2			; SSE41-NEXT: movdqa %xmm12, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm2			; SSE41-NEXT: pcmpgtd %xmm0, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm12, %xmm0			; SSE41-NEXT: pcmpeqd %xmm12, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm3, %xmm7			; SSE41-NEXT: pand %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm7, %xmm0
	; SSE41-NEXT: movapd %xmm11, %xmm7			; SSE41-NEXT: movapd %xmm11, %xmm7
	; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm7			; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm7
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: pxor %xmm9, %xmm0			; SSE41-NEXT: pxor %xmm9, %xmm0
	; SSE41-NEXT: movdqa %xmm12, %xmm2			; SSE41-NEXT: movdqa %xmm12, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm2			; SSE41-NEXT: pcmpgtd %xmm0, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm12, %xmm0			; SSE41-NEXT: pcmpeqd %xmm12, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm3, %xmm4			; SSE41-NEXT: pand %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm11			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm11
	; SSE41-NEXT: movapd {{.*#+}} xmm2 = [18446744073709551488,18446744073709551488]			; SSE41-NEXT: movapd {{.*#+}} xmm2 = [18446744073709551488,18446744073709551488]
	; SSE41-NEXT: movapd %xmm11, %xmm0			; SSE41-NEXT: movapd %xmm11, %xmm0
	; SSE41-NEXT: xorpd %xmm9, %xmm0			; SSE41-NEXT: xorpd %xmm9, %xmm0
	; SSE41-NEXT: movdqa {{.*#+}} xmm8 = [18446744071562067840,18446744071562067840]			; SSE41-NEXT: movdqa {{.*#+}} xmm8 = [18446744071562067840,18446744071562067840]
	; SSE41-NEXT: movapd %xmm0, %xmm1			; SSE41-NEXT: movapd %xmm0, %xmm1
	; SSE41-NEXT: pcmpgtd %xmm8, %xmm1			; SSE41-NEXT: pcmpgtd %xmm8, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm1[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm1[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm8, %xmm0			; SSE41-NEXT: pcmpeqd %xmm8, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm4, %xmm3			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]			; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: por %xmm3, %xmm0			; SSE41-NEXT: movapd %xmm2, %xmm4
	; SSE41-NEXT: movapd %xmm2, %xmm3			; SSE41-NEXT: blendvpd %xmm0, %xmm11, %xmm4
	; SSE41-NEXT: blendvpd %xmm0, %xmm11, %xmm3
	; SSE41-NEXT: movapd %xmm7, %xmm0			; SSE41-NEXT: movapd %xmm7, %xmm0
	; SSE41-NEXT: xorpd %xmm9, %xmm0			; SSE41-NEXT: xorpd %xmm9, %xmm0
	; SSE41-NEXT: movapd %xmm0, %xmm1			; SSE41-NEXT: movapd %xmm0, %xmm1
	; SSE41-NEXT: pcmpgtd %xmm8, %xmm1			; SSE41-NEXT: pcmpgtd %xmm8, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm11 = xmm1[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm1[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm8, %xmm0			; SSE41-NEXT: pcmpeqd %xmm8, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm11, %xmm4			; SSE41-NEXT: pand %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]			; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: movapd %xmm2, %xmm1			; SSE41-NEXT: movapd %xmm2, %xmm1
	; SSE41-NEXT: blendvpd %xmm0, %xmm7, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm7, %xmm1
	; SSE41-NEXT: packssdw %xmm3, %xmm1			; SSE41-NEXT: packssdw %xmm4, %xmm1
	; SSE41-NEXT: movapd %xmm6, %xmm0			; SSE41-NEXT: movapd %xmm6, %xmm0
	; SSE41-NEXT: xorpd %xmm9, %xmm0			; SSE41-NEXT: xorpd %xmm9, %xmm0
	; SSE41-NEXT: movapd %xmm0, %xmm3			; SSE41-NEXT: movapd %xmm0, %xmm3
	; SSE41-NEXT: pcmpgtd %xmm8, %xmm3			; SSE41-NEXT: pcmpgtd %xmm8, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm3[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm3[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm8, %xmm0			; SSE41-NEXT: pcmpeqd %xmm8, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm4, %xmm7			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[1,1,3,3]			; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: por %xmm7, %xmm0
	; SSE41-NEXT: movapd %xmm2, %xmm3			; SSE41-NEXT: movapd %xmm2, %xmm3
	; SSE41-NEXT: blendvpd %xmm0, %xmm6, %xmm3			; SSE41-NEXT: blendvpd %xmm0, %xmm6, %xmm3
	; SSE41-NEXT: movapd %xmm5, %xmm0			; SSE41-NEXT: movapd %xmm5, %xmm0
	; SSE41-NEXT: xorpd %xmm9, %xmm0			; SSE41-NEXT: xorpd %xmm9, %xmm0
	; SSE41-NEXT: movapd %xmm0, %xmm4			; SSE41-NEXT: movapd %xmm0, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm8, %xmm4			; SSE41-NEXT: pcmpgtd %xmm8, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm8, %xmm0			; SSE41-NEXT: pcmpeqd %xmm8, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm6, %xmm7			; SSE41-NEXT: pand %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm7, %xmm0
	; SSE41-NEXT: movapd %xmm2, %xmm4			; SSE41-NEXT: movapd %xmm2, %xmm4
	; SSE41-NEXT: blendvpd %xmm0, %xmm5, %xmm4			; SSE41-NEXT: blendvpd %xmm0, %xmm5, %xmm4
	; SSE41-NEXT: packssdw %xmm3, %xmm4			; SSE41-NEXT: packssdw %xmm3, %xmm4
	; SSE41-NEXT: packssdw %xmm4, %xmm1			; SSE41-NEXT: packssdw %xmm4, %xmm1
	; SSE41-NEXT: movapd %xmm15, %xmm0			; SSE41-NEXT: movapd %xmm15, %xmm0
	; SSE41-NEXT: xorpd %xmm9, %xmm0			; SSE41-NEXT: xorpd %xmm9, %xmm0
	; SSE41-NEXT: movapd %xmm0, %xmm3			; SSE41-NEXT: movapd %xmm0, %xmm3
	; SSE41-NEXT: pcmpgtd %xmm8, %xmm3			; SSE41-NEXT: pcmpgtd %xmm8, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm3[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm3[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm8, %xmm0			; SSE41-NEXT: pcmpeqd %xmm8, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm4, %xmm5			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[1,1,3,3]			; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: movapd %xmm2, %xmm3			; SSE41-NEXT: movapd %xmm2, %xmm3
	; SSE41-NEXT: blendvpd %xmm0, %xmm15, %xmm3			; SSE41-NEXT: blendvpd %xmm0, %xmm15, %xmm3
	; SSE41-NEXT: movapd %xmm14, %xmm0			; SSE41-NEXT: movapd %xmm14, %xmm0
	; SSE41-NEXT: xorpd %xmm9, %xmm0			; SSE41-NEXT: xorpd %xmm9, %xmm0
	; SSE41-NEXT: movapd %xmm0, %xmm4			; SSE41-NEXT: movapd %xmm0, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm8, %xmm4			; SSE41-NEXT: pcmpgtd %xmm8, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm8, %xmm0			; SSE41-NEXT: pcmpeqd %xmm8, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm5, %xmm6			; SSE41-NEXT: pand %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: movapd %xmm2, %xmm4			; SSE41-NEXT: movapd %xmm2, %xmm4
	; SSE41-NEXT: blendvpd %xmm0, %xmm14, %xmm4			; SSE41-NEXT: blendvpd %xmm0, %xmm14, %xmm4
	; SSE41-NEXT: packssdw %xmm3, %xmm4			; SSE41-NEXT: packssdw %xmm3, %xmm4
	; SSE41-NEXT: movapd %xmm13, %xmm0			; SSE41-NEXT: movapd %xmm13, %xmm0
	; SSE41-NEXT: xorpd %xmm9, %xmm0			; SSE41-NEXT: xorpd %xmm9, %xmm0
	; SSE41-NEXT: movapd %xmm0, %xmm3			; SSE41-NEXT: movapd %xmm0, %xmm3
	; SSE41-NEXT: pcmpgtd %xmm8, %xmm3			; SSE41-NEXT: pcmpgtd %xmm8, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm3[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm3[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm8, %xmm0			; SSE41-NEXT: pcmpeqd %xmm8, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm5, %xmm6			; SSE41-NEXT: pand %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[1,1,3,3]			; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: movapd %xmm2, %xmm3			; SSE41-NEXT: movapd %xmm2, %xmm3
	; SSE41-NEXT: blendvpd %xmm0, %xmm13, %xmm3			; SSE41-NEXT: blendvpd %xmm0, %xmm13, %xmm3
	; SSE41-NEXT: xorpd %xmm10, %xmm9			; SSE41-NEXT: xorpd %xmm10, %xmm9
	; SSE41-NEXT: movapd %xmm9, %xmm0			; SSE41-NEXT: movapd %xmm9, %xmm5
	; SSE41-NEXT: pcmpgtd %xmm8, %xmm0			; SSE41-NEXT: pcmpgtd %xmm8, %xmm5
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm0[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm5[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm8, %xmm9			; SSE41-NEXT: pcmpeqd %xmm8, %xmm9
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm9[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm9[1,1,3,3]
	; SSE41-NEXT: pand %xmm5, %xmm6			; SSE41-NEXT: pand %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]			; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm10, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm10, %xmm2
	; SSE41-NEXT: packssdw %xmm3, %xmm2			; SSE41-NEXT: packssdw %xmm3, %xmm2
	; SSE41-NEXT: packssdw %xmm2, %xmm4			; SSE41-NEXT: packssdw %xmm2, %xmm4
	; SSE41-NEXT: packsswb %xmm4, %xmm1			; SSE41-NEXT: packsswb %xmm4, %xmm1
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: trunc_ssat_v16i64_v16i8:			; AVX1-LABEL: trunc_ssat_v16i64_v16i8:
	▲ Show 20 Lines • Show All 415 Lines • Show Last 20 Lines

llvm/trunk/test/CodeGen/X86/vector-trunc-ssat.ll

	Show First 20 Lines • Show All 137 Lines • ▼ Show 20 Lines
	; SSSE3-NEXT: retq			; SSSE3-NEXT: retq
	;			;
	; SSE41-LABEL: trunc_ssat_v4i64_v4i32:			; SSE41-LABEL: trunc_ssat_v4i64_v4i32:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movdqa %xmm0, %xmm2			; SSE41-NEXT: movdqa %xmm0, %xmm2
	; SSE41-NEXT: movapd {{.*#+}} xmm4 = [2147483647,2147483647]			; SSE41-NEXT: movapd {{.*#+}} xmm4 = [2147483647,2147483647]
	; SSE41-NEXT: movdqa {{.*#+}} xmm3 = [2147483648,2147483648]			; SSE41-NEXT: movdqa {{.*#+}} xmm3 = [2147483648,2147483648]
	; SSE41-NEXT: pxor %xmm3, %xmm0			; SSE41-NEXT: pxor %xmm3, %xmm0
	; SSE41-NEXT: movdqa {{.*#+}} xmm8 = [4294967295,4294967295]			; SSE41-NEXT: movdqa {{.*#+}} xmm6 = [4294967295,4294967295]
	; SSE41-NEXT: movdqa %xmm8, %xmm5			; SSE41-NEXT: movdqa %xmm6, %xmm5
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm5			; SSE41-NEXT: pcmpgtd %xmm0, %xmm5
	; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm5[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm5[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm8, %xmm0			; SSE41-NEXT: pcmpeqd %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm7, %xmm6			; SSE41-NEXT: pand %xmm7, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm5[1,1,3,3]			; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: movapd %xmm4, %xmm5			; SSE41-NEXT: movapd %xmm4, %xmm5
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm5			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm5
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: pxor %xmm3, %xmm0			; SSE41-NEXT: pxor %xmm3, %xmm0
	; SSE41-NEXT: movdqa %xmm8, %xmm2			; SSE41-NEXT: movdqa %xmm6, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm2			; SSE41-NEXT: pcmpgtd %xmm0, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm8, %xmm0			; SSE41-NEXT: pcmpeqd %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm6, %xmm7			; SSE41-NEXT: pand %xmm7, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm7, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm4			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm4
	; SSE41-NEXT: movapd {{.*#+}} xmm1 = [18446744071562067968,18446744071562067968]			; SSE41-NEXT: movapd {{.*#+}} xmm1 = [18446744071562067968,18446744071562067968]
	; SSE41-NEXT: movapd %xmm4, %xmm0			; SSE41-NEXT: movapd %xmm4, %xmm0
	; SSE41-NEXT: xorpd %xmm3, %xmm0			; SSE41-NEXT: xorpd %xmm3, %xmm0
	; SSE41-NEXT: movdqa {{.*#+}} xmm8 = [18446744069414584320,18446744069414584320]			; SSE41-NEXT: movdqa {{.*#+}} xmm2 = [18446744069414584320,18446744069414584320]
	; SSE41-NEXT: movapd %xmm0, %xmm6			; SSE41-NEXT: movapd %xmm0, %xmm6
	; SSE41-NEXT: pcmpgtd %xmm8, %xmm6			; SSE41-NEXT: pcmpgtd %xmm2, %xmm6
	; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm6[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm6[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm8, %xmm0			; SSE41-NEXT: pcmpeqd %xmm2, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm7, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm6[1,1,3,3]
	; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: movapd %xmm1, %xmm2
	; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm2
	; SSE41-NEXT: xorpd %xmm5, %xmm3
	; SSE41-NEXT: movapd %xmm3, %xmm0
	; SSE41-NEXT: pcmpgtd %xmm8, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm0[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm8, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm3[1,1,3,3]
	; SSE41-NEXT: pand %xmm4, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: por %xmm3, %xmm0			; SSE41-NEXT: pand %xmm7, %xmm0
				; SSE41-NEXT: por %xmm6, %xmm0
				; SSE41-NEXT: movapd %xmm1, %xmm6
				; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm6
				; SSE41-NEXT: xorpd %xmm5, %xmm3
				; SSE41-NEXT: movapd %xmm3, %xmm4
				; SSE41-NEXT: pcmpgtd %xmm2, %xmm4
				; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm4[0,0,2,2]
				; SSE41-NEXT: pcmpeqd %xmm2, %xmm3
				; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[1,1,3,3]
				; SSE41-NEXT: pand %xmm7, %xmm0
				; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm5, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm5, %xmm1
	; SSE41-NEXT: shufps {{.*#+}} xmm1 = xmm1[0,2],xmm2[0,2]			; SSE41-NEXT: shufps {{.*#+}} xmm1 = xmm1[0,2],xmm6[0,2]
	; SSE41-NEXT: movaps %xmm1, %xmm0			; SSE41-NEXT: movaps %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: trunc_ssat_v4i64_v4i32:			; AVX1-LABEL: trunc_ssat_v4i64_v4i32:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vmovapd {{.*#+}} ymm1 = [2147483647,2147483647,2147483647,2147483647]			; AVX1-NEXT: vmovapd {{.*#+}} ymm1 = [2147483647,2147483647,2147483647,2147483647]
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm3 = [2147483647,2147483647]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm3 = [2147483647,2147483647]
	▲ Show 20 Lines • Show All 311 Lines • ▼ Show 20 Lines
	; SSSE3-NEXT: pand %xmm0, %xmm5			; SSSE3-NEXT: pand %xmm0, %xmm5
	; SSSE3-NEXT: pandn %xmm8, %xmm0			; SSSE3-NEXT: pandn %xmm8, %xmm0
	; SSSE3-NEXT: por %xmm5, %xmm0			; SSSE3-NEXT: por %xmm5, %xmm0
	; SSSE3-NEXT: shufps {{.*#+}} xmm0 = xmm0[0,2],xmm3[0,2]			; SSSE3-NEXT: shufps {{.*#+}} xmm0 = xmm0[0,2],xmm3[0,2]
	; SSSE3-NEXT: retq			; SSSE3-NEXT: retq
	;			;
	; SSE41-LABEL: trunc_ssat_v8i64_v8i32:			; SSE41-LABEL: trunc_ssat_v8i64_v8i32:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movdqa %xmm0, %xmm9			; SSE41-NEXT: movdqa %xmm0, %xmm4
	; SSE41-NEXT: movapd {{.*#+}} xmm7 = [2147483647,2147483647]			; SSE41-NEXT: movapd {{.*#+}} xmm7 = [2147483647,2147483647]
	; SSE41-NEXT: movdqa {{.*#+}} xmm5 = [2147483648,2147483648]			; SSE41-NEXT: movdqa {{.*#+}} xmm5 = [2147483648,2147483648]
	; SSE41-NEXT: pxor %xmm5, %xmm0			; SSE41-NEXT: pxor %xmm5, %xmm0
	; SSE41-NEXT: movdqa {{.*#+}} xmm10 = [4294967295,4294967295]			; SSE41-NEXT: movdqa {{.*#+}} xmm10 = [4294967295,4294967295]
	; SSE41-NEXT: movdqa %xmm10, %xmm6			; SSE41-NEXT: movdqa %xmm10, %xmm6
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm6			; SSE41-NEXT: pcmpgtd %xmm0, %xmm6
	; SSE41-NEXT: pshufd {{.*#+}} xmm8 = xmm6[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm8 = xmm6[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm10, %xmm0			; SSE41-NEXT: pcmpeqd %xmm10, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm8, %xmm4			; SSE41-NEXT: pand %xmm8, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm6[1,1,3,3]			; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: movapd %xmm7, %xmm8			; SSE41-NEXT: movapd %xmm7, %xmm8
	; SSE41-NEXT: blendvpd %xmm0, %xmm9, %xmm8			; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm8
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: pxor %xmm5, %xmm0			; SSE41-NEXT: pxor %xmm5, %xmm0
	; SSE41-NEXT: movdqa %xmm10, %xmm4			; SSE41-NEXT: movdqa %xmm10, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm4			; SSE41-NEXT: pcmpgtd %xmm0, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm9 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm10, %xmm0			; SSE41-NEXT: pcmpeqd %xmm10, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm9, %xmm6			; SSE41-NEXT: pand %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: movapd %xmm7, %xmm9			; SSE41-NEXT: movapd %xmm7, %xmm9
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm9			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm9
	; SSE41-NEXT: movdqa %xmm2, %xmm0			; SSE41-NEXT: movdqa %xmm2, %xmm0
	; SSE41-NEXT: pxor %xmm5, %xmm0			; SSE41-NEXT: pxor %xmm5, %xmm0
	; SSE41-NEXT: movdqa %xmm10, %xmm1			; SSE41-NEXT: movdqa %xmm10, %xmm1
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm1			; SSE41-NEXT: pcmpgtd %xmm0, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm1[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm1[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm10, %xmm0			; SSE41-NEXT: pcmpeqd %xmm10, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm4, %xmm6			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]			; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: movapd %xmm7, %xmm4			; SSE41-NEXT: movapd %xmm7, %xmm4
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm4			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm4
	; SSE41-NEXT: movdqa %xmm3, %xmm0			; SSE41-NEXT: movdqa %xmm3, %xmm0
	; SSE41-NEXT: pxor %xmm5, %xmm0			; SSE41-NEXT: pxor %xmm5, %xmm0
	; SSE41-NEXT: movdqa %xmm10, %xmm1			; SSE41-NEXT: movdqa %xmm10, %xmm1
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm1			; SSE41-NEXT: pcmpgtd %xmm0, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm1[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm1[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm10, %xmm0			; SSE41-NEXT: pcmpeqd %xmm10, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm2, %xmm6			; SSE41-NEXT: pand %xmm2, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]			; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm7			; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm7
	; SSE41-NEXT: movapd {{.*#+}} xmm2 = [18446744071562067968,18446744071562067968]			; SSE41-NEXT: movapd {{.*#+}} xmm2 = [18446744071562067968,18446744071562067968]
	; SSE41-NEXT: movapd %xmm7, %xmm0			; SSE41-NEXT: movapd %xmm7, %xmm0
	; SSE41-NEXT: xorpd %xmm5, %xmm0			; SSE41-NEXT: xorpd %xmm5, %xmm0
	; SSE41-NEXT: movdqa {{.*#+}} xmm10 = [18446744069414584320,18446744069414584320]			; SSE41-NEXT: movdqa {{.*#+}} xmm3 = [18446744069414584320,18446744069414584320]
	; SSE41-NEXT: movapd %xmm0, %xmm1			; SSE41-NEXT: movapd %xmm0, %xmm1
	; SSE41-NEXT: pcmpgtd %xmm10, %xmm1			; SSE41-NEXT: pcmpgtd %xmm3, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm1[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm1[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm10, %xmm0			; SSE41-NEXT: pcmpeqd %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm6, %xmm3			; SSE41-NEXT: pand %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]			; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: por %xmm3, %xmm0			; SSE41-NEXT: movapd %xmm2, %xmm6
	; SSE41-NEXT: movapd %xmm2, %xmm3			; SSE41-NEXT: blendvpd %xmm0, %xmm7, %xmm6
	; SSE41-NEXT: blendvpd %xmm0, %xmm7, %xmm3
	; SSE41-NEXT: movapd %xmm4, %xmm0			; SSE41-NEXT: movapd %xmm4, %xmm0
	; SSE41-NEXT: xorpd %xmm5, %xmm0			; SSE41-NEXT: xorpd %xmm5, %xmm0
	; SSE41-NEXT: movapd %xmm0, %xmm1			; SSE41-NEXT: movapd %xmm0, %xmm1
	; SSE41-NEXT: pcmpgtd %xmm10, %xmm1			; SSE41-NEXT: pcmpgtd %xmm3, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm1[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm1[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm10, %xmm0			; SSE41-NEXT: pcmpeqd %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm6, %xmm7			; SSE41-NEXT: pand %xmm7, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]			; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: por %xmm7, %xmm0
	; SSE41-NEXT: movapd %xmm2, %xmm1			; SSE41-NEXT: movapd %xmm2, %xmm1
	; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm1
	; SSE41-NEXT: shufps {{.*#+}} xmm1 = xmm1[0,2],xmm3[0,2]			; SSE41-NEXT: shufps {{.*#+}} xmm1 = xmm1[0,2],xmm6[0,2]
	; SSE41-NEXT: movapd %xmm9, %xmm0			; SSE41-NEXT: movapd %xmm9, %xmm0
	; SSE41-NEXT: xorpd %xmm5, %xmm0			; SSE41-NEXT: xorpd %xmm5, %xmm0
	; SSE41-NEXT: movapd %xmm0, %xmm3			; SSE41-NEXT: movapd %xmm0, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm10, %xmm3			; SSE41-NEXT: pcmpgtd %xmm3, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm3[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm10, %xmm0			; SSE41-NEXT: pcmpeqd %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm4, %xmm6
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[1,1,3,3]
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: movapd %xmm2, %xmm3
	; SSE41-NEXT: blendvpd %xmm0, %xmm9, %xmm3
	; SSE41-NEXT: xorpd %xmm8, %xmm5
	; SSE41-NEXT: movapd %xmm5, %xmm0
	; SSE41-NEXT: pcmpgtd %xmm10, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm0[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm10, %xmm5
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm5[1,1,3,3]
	; SSE41-NEXT: pand %xmm4, %xmm5
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: por %xmm5, %xmm0			; SSE41-NEXT: pand %xmm6, %xmm0
				; SSE41-NEXT: por %xmm4, %xmm0
				; SSE41-NEXT: movapd %xmm2, %xmm4
				; SSE41-NEXT: blendvpd %xmm0, %xmm9, %xmm4
				; SSE41-NEXT: xorpd %xmm8, %xmm5
				; SSE41-NEXT: movapd %xmm5, %xmm6
				; SSE41-NEXT: pcmpgtd %xmm3, %xmm6
				; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm6[0,0,2,2]
				; SSE41-NEXT: pcmpeqd %xmm3, %xmm5
				; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm5[1,1,3,3]
				; SSE41-NEXT: pand %xmm7, %xmm0
				; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm2
	; SSE41-NEXT: shufps {{.*#+}} xmm2 = xmm2[0,2],xmm3[0,2]			; SSE41-NEXT: shufps {{.*#+}} xmm2 = xmm2[0,2],xmm4[0,2]
	; SSE41-NEXT: movaps %xmm2, %xmm0			; SSE41-NEXT: movaps %xmm2, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: trunc_ssat_v8i64_v8i32:			; AVX1-LABEL: trunc_ssat_v8i64_v8i32:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vmovapd {{.*#+}} ymm2 = [2147483647,2147483647,2147483647,2147483647]			; AVX1-NEXT: vmovapd {{.*#+}} ymm2 = [2147483647,2147483647,2147483647,2147483647]
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3			; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [2147483647,2147483647]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [2147483647,2147483647]
	▲ Show 20 Lines • Show All 314 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: movdqa %xmm0, %xmm10			; SSE41-NEXT: movdqa %xmm0, %xmm10
	; SSE41-NEXT: movapd {{.*#+}} xmm7 = [32767,32767]			; SSE41-NEXT: movapd {{.*#+}} xmm7 = [32767,32767]
	; SSE41-NEXT: movdqa {{.*#+}} xmm5 = [2147483648,2147483648]			; SSE41-NEXT: movdqa {{.*#+}} xmm5 = [2147483648,2147483648]
	; SSE41-NEXT: movdqa %xmm2, %xmm0			; SSE41-NEXT: movdqa %xmm2, %xmm0
	; SSE41-NEXT: pxor %xmm5, %xmm0			; SSE41-NEXT: pxor %xmm5, %xmm0
	; SSE41-NEXT: movdqa {{.*#+}} xmm11 = [2147516415,2147516415]			; SSE41-NEXT: movdqa {{.*#+}} xmm11 = [2147516415,2147516415]
	; SSE41-NEXT: movdqa %xmm11, %xmm6			; SSE41-NEXT: movdqa %xmm11, %xmm6
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm6			; SSE41-NEXT: pcmpgtd %xmm0, %xmm6
	; SSE41-NEXT: pshufd {{.*#+}} xmm8 = xmm6[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm6[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm11, %xmm0			; SSE41-NEXT: pcmpeqd %xmm11, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm8, %xmm4			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm6[1,1,3,3]			; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: movapd %xmm7, %xmm8			; SSE41-NEXT: movapd %xmm7, %xmm8
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm8			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm8
	; SSE41-NEXT: movdqa %xmm3, %xmm0			; SSE41-NEXT: movdqa %xmm3, %xmm0
	; SSE41-NEXT: pxor %xmm5, %xmm0			; SSE41-NEXT: pxor %xmm5, %xmm0
	; SSE41-NEXT: movdqa %xmm11, %xmm2			; SSE41-NEXT: movdqa %xmm11, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm2			; SSE41-NEXT: pcmpgtd %xmm0, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm11, %xmm0			; SSE41-NEXT: pcmpeqd %xmm11, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm4, %xmm6			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: movapd %xmm7, %xmm9			; SSE41-NEXT: movapd %xmm7, %xmm9
	; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm9			; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm9
	; SSE41-NEXT: movdqa %xmm10, %xmm0			; SSE41-NEXT: movdqa %xmm10, %xmm0
	; SSE41-NEXT: pxor %xmm5, %xmm0			; SSE41-NEXT: pxor %xmm5, %xmm0
	; SSE41-NEXT: movdqa %xmm11, %xmm2			; SSE41-NEXT: movdqa %xmm11, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm2			; SSE41-NEXT: pcmpgtd %xmm0, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm11, %xmm0			; SSE41-NEXT: pcmpeqd %xmm11, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm3, %xmm4			; SSE41-NEXT: pand %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: movapd %xmm7, %xmm2			; SSE41-NEXT: movapd %xmm7, %xmm2
	; SSE41-NEXT: blendvpd %xmm0, %xmm10, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm10, %xmm2
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: pxor %xmm5, %xmm0			; SSE41-NEXT: pxor %xmm5, %xmm0
	; SSE41-NEXT: movdqa %xmm11, %xmm3			; SSE41-NEXT: movdqa %xmm11, %xmm3
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm3			; SSE41-NEXT: pcmpgtd %xmm0, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm3[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm3[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm11, %xmm0			; SSE41-NEXT: pcmpeqd %xmm11, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm4, %xmm6			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[1,1,3,3]			; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm7			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm7
	; SSE41-NEXT: movapd {{.*#+}} xmm3 = [18446744073709518848,18446744073709518848]			; SSE41-NEXT: movapd {{.*#+}} xmm3 = [18446744073709518848,18446744073709518848]
	; SSE41-NEXT: movapd %xmm7, %xmm0			; SSE41-NEXT: movapd %xmm7, %xmm0
	; SSE41-NEXT: xorpd %xmm5, %xmm0			; SSE41-NEXT: xorpd %xmm5, %xmm0
	; SSE41-NEXT: movdqa {{.*#+}} xmm10 = [18446744071562035200,18446744071562035200]			; SSE41-NEXT: movdqa {{.*#+}} xmm4 = [18446744071562035200,18446744071562035200]
	; SSE41-NEXT: movapd %xmm0, %xmm1			; SSE41-NEXT: movapd %xmm0, %xmm1
	; SSE41-NEXT: pcmpgtd %xmm10, %xmm1			; SSE41-NEXT: pcmpgtd %xmm4, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm1[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm1[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm10, %xmm0			; SSE41-NEXT: pcmpeqd %xmm4, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm6, %xmm4			; SSE41-NEXT: pand %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]			; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: por %xmm4, %xmm0			; SSE41-NEXT: movapd %xmm3, %xmm6
	; SSE41-NEXT: movapd %xmm3, %xmm4			; SSE41-NEXT: blendvpd %xmm0, %xmm7, %xmm6
	; SSE41-NEXT: blendvpd %xmm0, %xmm7, %xmm4
	; SSE41-NEXT: movapd %xmm2, %xmm0			; SSE41-NEXT: movapd %xmm2, %xmm0
	; SSE41-NEXT: xorpd %xmm5, %xmm0			; SSE41-NEXT: xorpd %xmm5, %xmm0
	; SSE41-NEXT: movapd %xmm0, %xmm1			; SSE41-NEXT: movapd %xmm0, %xmm1
	; SSE41-NEXT: pcmpgtd %xmm10, %xmm1			; SSE41-NEXT: pcmpgtd %xmm4, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm1[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm1[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm10, %xmm0			; SSE41-NEXT: pcmpeqd %xmm4, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm6, %xmm7			; SSE41-NEXT: pand %xmm7, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]			; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: por %xmm7, %xmm0
	; SSE41-NEXT: movapd %xmm3, %xmm1			; SSE41-NEXT: movapd %xmm3, %xmm1
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm1
	; SSE41-NEXT: packssdw %xmm4, %xmm1			; SSE41-NEXT: packssdw %xmm6, %xmm1
	; SSE41-NEXT: movapd %xmm9, %xmm0			; SSE41-NEXT: movapd %xmm9, %xmm0
	; SSE41-NEXT: xorpd %xmm5, %xmm0			; SSE41-NEXT: xorpd %xmm5, %xmm0
	; SSE41-NEXT: movapd %xmm0, %xmm2			; SSE41-NEXT: movapd %xmm0, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm10, %xmm2			; SSE41-NEXT: pcmpgtd %xmm4, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm10, %xmm0			; SSE41-NEXT: pcmpeqd %xmm4, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm4, %xmm6			; SSE41-NEXT: pand %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: movapd %xmm3, %xmm2			; SSE41-NEXT: movapd %xmm3, %xmm2
	; SSE41-NEXT: blendvpd %xmm0, %xmm9, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm9, %xmm2
	; SSE41-NEXT: xorpd %xmm8, %xmm5			; SSE41-NEXT: xorpd %xmm8, %xmm5
	; SSE41-NEXT: movapd %xmm5, %xmm0			; SSE41-NEXT: movapd %xmm5, %xmm6
	; SSE41-NEXT: pcmpgtd %xmm10, %xmm0			; SSE41-NEXT: pcmpgtd %xmm4, %xmm6
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm0[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm6[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm10, %xmm5			; SSE41-NEXT: pcmpeqd %xmm4, %xmm5
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm5[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm5[1,1,3,3]
	; SSE41-NEXT: pand %xmm4, %xmm5			; SSE41-NEXT: pand %xmm7, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]			; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm3			; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm3
	; SSE41-NEXT: packssdw %xmm2, %xmm3			; SSE41-NEXT: packssdw %xmm2, %xmm3
	; SSE41-NEXT: packssdw %xmm3, %xmm1			; SSE41-NEXT: packssdw %xmm3, %xmm1
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: trunc_ssat_v8i64_v8i16:			; AVX1-LABEL: trunc_ssat_v8i64_v8i16:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	▲ Show 20 Lines • Show All 397 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: movdqa %xmm0, %xmm10			; SSE41-NEXT: movdqa %xmm0, %xmm10
	; SSE41-NEXT: movapd {{.*#+}} xmm7 = [127,127]			; SSE41-NEXT: movapd {{.*#+}} xmm7 = [127,127]
	; SSE41-NEXT: movdqa {{.*#+}} xmm5 = [2147483648,2147483648]			; SSE41-NEXT: movdqa {{.*#+}} xmm5 = [2147483648,2147483648]
	; SSE41-NEXT: movdqa %xmm2, %xmm0			; SSE41-NEXT: movdqa %xmm2, %xmm0
	; SSE41-NEXT: pxor %xmm5, %xmm0			; SSE41-NEXT: pxor %xmm5, %xmm0
	; SSE41-NEXT: movdqa {{.*#+}} xmm11 = [2147483775,2147483775]			; SSE41-NEXT: movdqa {{.*#+}} xmm11 = [2147483775,2147483775]
	; SSE41-NEXT: movdqa %xmm11, %xmm6			; SSE41-NEXT: movdqa %xmm11, %xmm6
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm6			; SSE41-NEXT: pcmpgtd %xmm0, %xmm6
	; SSE41-NEXT: pshufd {{.*#+}} xmm8 = xmm6[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm6[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm11, %xmm0			; SSE41-NEXT: pcmpeqd %xmm11, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm8, %xmm4			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm6[1,1,3,3]			; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: movapd %xmm7, %xmm8			; SSE41-NEXT: movapd %xmm7, %xmm8
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm8			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm8
	; SSE41-NEXT: movdqa %xmm3, %xmm0			; SSE41-NEXT: movdqa %xmm3, %xmm0
	; SSE41-NEXT: pxor %xmm5, %xmm0			; SSE41-NEXT: pxor %xmm5, %xmm0
	; SSE41-NEXT: movdqa %xmm11, %xmm2			; SSE41-NEXT: movdqa %xmm11, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm2			; SSE41-NEXT: pcmpgtd %xmm0, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm11, %xmm0			; SSE41-NEXT: pcmpeqd %xmm11, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm4, %xmm6			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: movapd %xmm7, %xmm9			; SSE41-NEXT: movapd %xmm7, %xmm9
	; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm9			; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm9
	; SSE41-NEXT: movdqa %xmm10, %xmm0			; SSE41-NEXT: movdqa %xmm10, %xmm0
	; SSE41-NEXT: pxor %xmm5, %xmm0			; SSE41-NEXT: pxor %xmm5, %xmm0
	; SSE41-NEXT: movdqa %xmm11, %xmm2			; SSE41-NEXT: movdqa %xmm11, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm2			; SSE41-NEXT: pcmpgtd %xmm0, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm11, %xmm0			; SSE41-NEXT: pcmpeqd %xmm11, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm3, %xmm4			; SSE41-NEXT: pand %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: movapd %xmm7, %xmm2			; SSE41-NEXT: movapd %xmm7, %xmm2
	; SSE41-NEXT: blendvpd %xmm0, %xmm10, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm10, %xmm2
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: pxor %xmm5, %xmm0			; SSE41-NEXT: pxor %xmm5, %xmm0
	; SSE41-NEXT: movdqa %xmm11, %xmm3			; SSE41-NEXT: movdqa %xmm11, %xmm3
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm3			; SSE41-NEXT: pcmpgtd %xmm0, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm3[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm3[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm11, %xmm0			; SSE41-NEXT: pcmpeqd %xmm11, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm4, %xmm6			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[1,1,3,3]			; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm7			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm7
	; SSE41-NEXT: movapd {{.*#+}} xmm3 = [18446744073709551488,18446744073709551488]			; SSE41-NEXT: movapd {{.*#+}} xmm3 = [18446744073709551488,18446744073709551488]
	; SSE41-NEXT: movapd %xmm7, %xmm0			; SSE41-NEXT: movapd %xmm7, %xmm0
	; SSE41-NEXT: xorpd %xmm5, %xmm0			; SSE41-NEXT: xorpd %xmm5, %xmm0
	; SSE41-NEXT: movdqa {{.*#+}} xmm10 = [18446744071562067840,18446744071562067840]			; SSE41-NEXT: movdqa {{.*#+}} xmm4 = [18446744071562067840,18446744071562067840]
	; SSE41-NEXT: movapd %xmm0, %xmm1			; SSE41-NEXT: movapd %xmm0, %xmm1
	; SSE41-NEXT: pcmpgtd %xmm10, %xmm1			; SSE41-NEXT: pcmpgtd %xmm4, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm1[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm1[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm10, %xmm0			; SSE41-NEXT: pcmpeqd %xmm4, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm6, %xmm4			; SSE41-NEXT: pand %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]			; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: por %xmm4, %xmm0			; SSE41-NEXT: movapd %xmm3, %xmm6
	; SSE41-NEXT: movapd %xmm3, %xmm4			; SSE41-NEXT: blendvpd %xmm0, %xmm7, %xmm6
	; SSE41-NEXT: blendvpd %xmm0, %xmm7, %xmm4
	; SSE41-NEXT: movapd %xmm2, %xmm0			; SSE41-NEXT: movapd %xmm2, %xmm0
	; SSE41-NEXT: xorpd %xmm5, %xmm0			; SSE41-NEXT: xorpd %xmm5, %xmm0
	; SSE41-NEXT: movapd %xmm0, %xmm1			; SSE41-NEXT: movapd %xmm0, %xmm1
	; SSE41-NEXT: pcmpgtd %xmm10, %xmm1			; SSE41-NEXT: pcmpgtd %xmm4, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm1[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm1[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm10, %xmm0			; SSE41-NEXT: pcmpeqd %xmm4, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm6, %xmm7			; SSE41-NEXT: pand %xmm7, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]			; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: por %xmm7, %xmm0
	; SSE41-NEXT: movapd %xmm3, %xmm1			; SSE41-NEXT: movapd %xmm3, %xmm1
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm1
	; SSE41-NEXT: packssdw %xmm4, %xmm1			; SSE41-NEXT: packssdw %xmm6, %xmm1
	; SSE41-NEXT: movapd %xmm9, %xmm0			; SSE41-NEXT: movapd %xmm9, %xmm0
	; SSE41-NEXT: xorpd %xmm5, %xmm0			; SSE41-NEXT: xorpd %xmm5, %xmm0
	; SSE41-NEXT: movapd %xmm0, %xmm2			; SSE41-NEXT: movapd %xmm0, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm10, %xmm2			; SSE41-NEXT: pcmpgtd %xmm4, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm10, %xmm0			; SSE41-NEXT: pcmpeqd %xmm4, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm4, %xmm6			; SSE41-NEXT: pand %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: movapd %xmm3, %xmm2			; SSE41-NEXT: movapd %xmm3, %xmm2
	; SSE41-NEXT: blendvpd %xmm0, %xmm9, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm9, %xmm2
	; SSE41-NEXT: xorpd %xmm8, %xmm5			; SSE41-NEXT: xorpd %xmm8, %xmm5
	; SSE41-NEXT: movapd %xmm5, %xmm0			; SSE41-NEXT: movapd %xmm5, %xmm6
	; SSE41-NEXT: pcmpgtd %xmm10, %xmm0			; SSE41-NEXT: pcmpgtd %xmm4, %xmm6
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm0[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm6[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm10, %xmm5			; SSE41-NEXT: pcmpeqd %xmm4, %xmm5
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm5[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm5[1,1,3,3]
	; SSE41-NEXT: pand %xmm4, %xmm5			; SSE41-NEXT: pand %xmm7, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]			; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm3			; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm3
	; SSE41-NEXT: packssdw %xmm2, %xmm3			; SSE41-NEXT: packssdw %xmm2, %xmm3
	; SSE41-NEXT: packssdw %xmm3, %xmm1			; SSE41-NEXT: packssdw %xmm3, %xmm1
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: trunc_ssat_v8i64_v8i8:			; AVX1-LABEL: trunc_ssat_v8i64_v8i8:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	▲ Show 20 Lines • Show All 313 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: movdqa %xmm0, %xmm8			; SSE41-NEXT: movdqa %xmm0, %xmm8
	; SSE41-NEXT: movapd {{.*#+}} xmm7 = [127,127]			; SSE41-NEXT: movapd {{.*#+}} xmm7 = [127,127]
	; SSE41-NEXT: movdqa {{.*#+}} xmm5 = [2147483648,2147483648]			; SSE41-NEXT: movdqa {{.*#+}} xmm5 = [2147483648,2147483648]
	; SSE41-NEXT: movdqa %xmm3, %xmm0			; SSE41-NEXT: movdqa %xmm3, %xmm0
	; SSE41-NEXT: pxor %xmm5, %xmm0			; SSE41-NEXT: pxor %xmm5, %xmm0
	; SSE41-NEXT: movdqa {{.*#+}} xmm10 = [2147483775,2147483775]			; SSE41-NEXT: movdqa {{.*#+}} xmm10 = [2147483775,2147483775]
	; SSE41-NEXT: movdqa %xmm10, %xmm6			; SSE41-NEXT: movdqa %xmm10, %xmm6
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm6			; SSE41-NEXT: pcmpgtd %xmm0, %xmm6
	; SSE41-NEXT: pshufd {{.*#+}} xmm9 = xmm6[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm6[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm10, %xmm0			; SSE41-NEXT: pcmpeqd %xmm10, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm9, %xmm4			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm6[1,1,3,3]			; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: movapd %xmm7, %xmm9			; SSE41-NEXT: movapd %xmm7, %xmm9
	; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm9			; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm9
	; SSE41-NEXT: movdqa %xmm2, %xmm0			; SSE41-NEXT: movdqa %xmm2, %xmm0
	; SSE41-NEXT: pxor %xmm5, %xmm0			; SSE41-NEXT: pxor %xmm5, %xmm0
	; SSE41-NEXT: movdqa %xmm10, %xmm3			; SSE41-NEXT: movdqa %xmm10, %xmm3
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm3			; SSE41-NEXT: pcmpgtd %xmm0, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm3[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm3[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm10, %xmm0			; SSE41-NEXT: pcmpeqd %xmm10, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm4, %xmm6			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[1,1,3,3]			; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: movapd %xmm7, %xmm11			; SSE41-NEXT: movapd %xmm7, %xmm11
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm11			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm11
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: pxor %xmm5, %xmm0			; SSE41-NEXT: pxor %xmm5, %xmm0
	; SSE41-NEXT: movdqa %xmm10, %xmm2			; SSE41-NEXT: movdqa %xmm10, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm2			; SSE41-NEXT: pcmpgtd %xmm0, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm10, %xmm0			; SSE41-NEXT: pcmpeqd %xmm10, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm4, %xmm6			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: movapd %xmm7, %xmm6			; SSE41-NEXT: movapd %xmm7, %xmm6
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm6			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm6
	; SSE41-NEXT: movdqa %xmm8, %xmm0			; SSE41-NEXT: movdqa %xmm8, %xmm0
	; SSE41-NEXT: pxor %xmm5, %xmm0			; SSE41-NEXT: pxor %xmm5, %xmm0
	; SSE41-NEXT: movdqa %xmm10, %xmm1			; SSE41-NEXT: movdqa %xmm10, %xmm1
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm1			; SSE41-NEXT: pcmpgtd %xmm0, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm1[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm1[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm10, %xmm0			; SSE41-NEXT: pcmpeqd %xmm10, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm2, %xmm4			; SSE41-NEXT: pand %xmm2, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]			; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm7			; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm7
	; SSE41-NEXT: movapd {{.*#+}} xmm1 = [18446744073709551488,18446744073709551488]			; SSE41-NEXT: movapd {{.*#+}} xmm1 = [18446744073709551488,18446744073709551488]
	; SSE41-NEXT: movapd %xmm7, %xmm0			; SSE41-NEXT: movapd %xmm7, %xmm0
	; SSE41-NEXT: xorpd %xmm5, %xmm0			; SSE41-NEXT: xorpd %xmm5, %xmm0
	; SSE41-NEXT: movdqa {{.*#+}} xmm8 = [18446744071562067840,18446744071562067840]			; SSE41-NEXT: movdqa {{.*#+}} xmm8 = [18446744071562067840,18446744071562067840]
	; SSE41-NEXT: movapd %xmm0, %xmm2			; SSE41-NEXT: movapd %xmm0, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm8, %xmm2			; SSE41-NEXT: pcmpgtd %xmm8, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm8, %xmm0			; SSE41-NEXT: pcmpeqd %xmm8, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm3, %xmm4			; SSE41-NEXT: pand %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: movapd %xmm1, %xmm2			; SSE41-NEXT: movapd %xmm1, %xmm2
	; SSE41-NEXT: blendvpd %xmm0, %xmm7, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm7, %xmm2
	; SSE41-NEXT: movapd %xmm6, %xmm0			; SSE41-NEXT: movapd %xmm6, %xmm0
	; SSE41-NEXT: xorpd %xmm5, %xmm0			; SSE41-NEXT: xorpd %xmm5, %xmm0
	; SSE41-NEXT: movapd %xmm0, %xmm3			; SSE41-NEXT: movapd %xmm0, %xmm3
	; SSE41-NEXT: pcmpgtd %xmm8, %xmm3			; SSE41-NEXT: pcmpgtd %xmm8, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm3[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm3[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm8, %xmm0			; SSE41-NEXT: pcmpeqd %xmm8, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm4, %xmm7			; SSE41-NEXT: pand %xmm7, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[1,1,3,3]			; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: por %xmm7, %xmm0
	; SSE41-NEXT: movapd %xmm1, %xmm7			; SSE41-NEXT: movapd %xmm1, %xmm7
	; SSE41-NEXT: blendvpd %xmm0, %xmm6, %xmm7			; SSE41-NEXT: blendvpd %xmm0, %xmm6, %xmm7
	; SSE41-NEXT: movapd %xmm11, %xmm0			; SSE41-NEXT: movapd %xmm11, %xmm0
	; SSE41-NEXT: xorpd %xmm5, %xmm0			; SSE41-NEXT: xorpd %xmm5, %xmm0
	; SSE41-NEXT: movapd %xmm0, %xmm3			; SSE41-NEXT: movapd %xmm0, %xmm3
	; SSE41-NEXT: pcmpgtd %xmm8, %xmm3			; SSE41-NEXT: pcmpgtd %xmm8, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm3[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm3[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm8, %xmm0			; SSE41-NEXT: pcmpeqd %xmm8, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm4, %xmm6			; SSE41-NEXT: pand %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[1,1,3,3]			; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: movapd %xmm1, %xmm3			; SSE41-NEXT: movapd %xmm1, %xmm3
	; SSE41-NEXT: blendvpd %xmm0, %xmm11, %xmm3			; SSE41-NEXT: blendvpd %xmm0, %xmm11, %xmm3
	; SSE41-NEXT: xorpd %xmm9, %xmm5			; SSE41-NEXT: xorpd %xmm9, %xmm5
	; SSE41-NEXT: movapd %xmm5, %xmm0			; SSE41-NEXT: movapd %xmm5, %xmm6
	; SSE41-NEXT: pcmpgtd %xmm8, %xmm0			; SSE41-NEXT: pcmpgtd %xmm8, %xmm6
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm0[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm6[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm8, %xmm5			; SSE41-NEXT: pcmpeqd %xmm8, %xmm5
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm5[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm5[1,1,3,3]
	; SSE41-NEXT: pand %xmm4, %xmm5			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]			; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm9, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm9, %xmm1
	; SSE41-NEXT: movapd {{.*#+}} xmm0 = [255,0,0,0,0,0,0,0,255,0,0,0,0,0,0,0]			; SSE41-NEXT: movapd {{.*#+}} xmm0 = [255,0,0,0,0,0,0,0,255,0,0,0,0,0,0,0]
	; SSE41-NEXT: andpd %xmm0, %xmm1			; SSE41-NEXT: andpd %xmm0, %xmm1
	; SSE41-NEXT: andpd %xmm0, %xmm3			; SSE41-NEXT: andpd %xmm0, %xmm3
	; SSE41-NEXT: packusdw %xmm1, %xmm3			; SSE41-NEXT: packusdw %xmm1, %xmm3
	; SSE41-NEXT: andpd %xmm0, %xmm7			; SSE41-NEXT: andpd %xmm0, %xmm7
	; SSE41-NEXT: andpd %xmm0, %xmm2			; SSE41-NEXT: andpd %xmm0, %xmm2
	; SSE41-NEXT: packusdw %xmm7, %xmm2			; SSE41-NEXT: packusdw %xmm7, %xmm2
	▲ Show 20 Lines • Show All 537 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: movdqa {{.*#+}} xmm9 = [2147483648,2147483648]			; SSE41-NEXT: movdqa {{.*#+}} xmm9 = [2147483648,2147483648]
	; SSE41-NEXT: movdqa %xmm6, %xmm0			; SSE41-NEXT: movdqa %xmm6, %xmm0
	; SSE41-NEXT: pxor %xmm9, %xmm0			; SSE41-NEXT: pxor %xmm9, %xmm0
	; SSE41-NEXT: movdqa {{.*#+}} xmm12 = [2147483775,2147483775]			; SSE41-NEXT: movdqa {{.*#+}} xmm12 = [2147483775,2147483775]
	; SSE41-NEXT: movdqa %xmm12, %xmm10			; SSE41-NEXT: movdqa %xmm12, %xmm10
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm10			; SSE41-NEXT: pcmpgtd %xmm0, %xmm10
	; SSE41-NEXT: pshufd {{.*#+}} xmm13 = xmm10[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm13 = xmm10[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm12, %xmm0			; SSE41-NEXT: pcmpeqd %xmm12, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm14 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm13, %xmm14			; SSE41-NEXT: pand %xmm13, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm10[1,1,3,3]			; SSE41-NEXT: por %xmm10, %xmm0
	; SSE41-NEXT: por %xmm14, %xmm0
	; SSE41-NEXT: movapd %xmm11, %xmm10			; SSE41-NEXT: movapd %xmm11, %xmm10
	; SSE41-NEXT: blendvpd %xmm0, %xmm6, %xmm10			; SSE41-NEXT: blendvpd %xmm0, %xmm6, %xmm10
	; SSE41-NEXT: movdqa %xmm7, %xmm0			; SSE41-NEXT: movdqa %xmm7, %xmm0
	; SSE41-NEXT: pxor %xmm9, %xmm0			; SSE41-NEXT: pxor %xmm9, %xmm0
	; SSE41-NEXT: movdqa %xmm12, %xmm6			; SSE41-NEXT: movdqa %xmm12, %xmm6
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm6			; SSE41-NEXT: pcmpgtd %xmm0, %xmm6
	; SSE41-NEXT: pshufd {{.*#+}} xmm13 = xmm6[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm13 = xmm6[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm12, %xmm0			; SSE41-NEXT: pcmpeqd %xmm12, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm14 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm13, %xmm14			; SSE41-NEXT: pand %xmm13, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm6[1,1,3,3]			; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: por %xmm14, %xmm0
	; SSE41-NEXT: movapd %xmm11, %xmm13			; SSE41-NEXT: movapd %xmm11, %xmm13
	; SSE41-NEXT: blendvpd %xmm0, %xmm7, %xmm13			; SSE41-NEXT: blendvpd %xmm0, %xmm7, %xmm13
	; SSE41-NEXT: movdqa %xmm4, %xmm0			; SSE41-NEXT: movdqa %xmm4, %xmm0
	; SSE41-NEXT: pxor %xmm9, %xmm0			; SSE41-NEXT: pxor %xmm9, %xmm0
	; SSE41-NEXT: movdqa %xmm12, %xmm6			; SSE41-NEXT: movdqa %xmm12, %xmm6
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm6			; SSE41-NEXT: pcmpgtd %xmm0, %xmm6
	; SSE41-NEXT: pshufd {{.*#+}} xmm14 = xmm6[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm6[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm12, %xmm0			; SSE41-NEXT: pcmpeqd %xmm12, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm14, %xmm7			; SSE41-NEXT: pand %xmm7, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm6[1,1,3,3]			; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: por %xmm7, %xmm0
	; SSE41-NEXT: movapd %xmm11, %xmm14			; SSE41-NEXT: movapd %xmm11, %xmm14
	; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm14			; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm14
	; SSE41-NEXT: movdqa %xmm5, %xmm0			; SSE41-NEXT: movdqa %xmm5, %xmm0
	; SSE41-NEXT: pxor %xmm9, %xmm0			; SSE41-NEXT: pxor %xmm9, %xmm0
	; SSE41-NEXT: movdqa %xmm12, %xmm4			; SSE41-NEXT: movdqa %xmm12, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm4			; SSE41-NEXT: pcmpgtd %xmm0, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm12, %xmm0			; SSE41-NEXT: pcmpeqd %xmm12, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm6, %xmm7			; SSE41-NEXT: pand %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm7, %xmm0
	; SSE41-NEXT: movapd %xmm11, %xmm15			; SSE41-NEXT: movapd %xmm11, %xmm15
	; SSE41-NEXT: blendvpd %xmm0, %xmm5, %xmm15			; SSE41-NEXT: blendvpd %xmm0, %xmm5, %xmm15
	; SSE41-NEXT: movdqa %xmm2, %xmm0			; SSE41-NEXT: movdqa %xmm2, %xmm0
	; SSE41-NEXT: pxor %xmm9, %xmm0			; SSE41-NEXT: pxor %xmm9, %xmm0
	; SSE41-NEXT: movdqa %xmm12, %xmm5			; SSE41-NEXT: movdqa %xmm12, %xmm5
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm5			; SSE41-NEXT: pcmpgtd %xmm0, %xmm5
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm5[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm5[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm12, %xmm0			; SSE41-NEXT: pcmpeqd %xmm12, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm6, %xmm7			; SSE41-NEXT: pand %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm5[1,1,3,3]			; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: por %xmm7, %xmm0
	; SSE41-NEXT: movapd %xmm11, %xmm5			; SSE41-NEXT: movapd %xmm11, %xmm5
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm5			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm5
	; SSE41-NEXT: movdqa %xmm3, %xmm0			; SSE41-NEXT: movdqa %xmm3, %xmm0
	; SSE41-NEXT: pxor %xmm9, %xmm0			; SSE41-NEXT: pxor %xmm9, %xmm0
	; SSE41-NEXT: movdqa %xmm12, %xmm2			; SSE41-NEXT: movdqa %xmm12, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm2			; SSE41-NEXT: pcmpgtd %xmm0, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm12, %xmm0			; SSE41-NEXT: pcmpeqd %xmm12, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm6, %xmm7			; SSE41-NEXT: pand %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm7, %xmm0
	; SSE41-NEXT: movapd %xmm11, %xmm6			; SSE41-NEXT: movapd %xmm11, %xmm6
	; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm6			; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm6
	; SSE41-NEXT: movdqa %xmm8, %xmm0			; SSE41-NEXT: movdqa %xmm8, %xmm0
	; SSE41-NEXT: pxor %xmm9, %xmm0			; SSE41-NEXT: pxor %xmm9, %xmm0
	; SSE41-NEXT: movdqa %xmm12, %xmm2			; SSE41-NEXT: movdqa %xmm12, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm2			; SSE41-NEXT: pcmpgtd %xmm0, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm12, %xmm0			; SSE41-NEXT: pcmpeqd %xmm12, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm3, %xmm7			; SSE41-NEXT: pand %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm7, %xmm0
	; SSE41-NEXT: movapd %xmm11, %xmm7			; SSE41-NEXT: movapd %xmm11, %xmm7
	; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm7			; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm7
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: pxor %xmm9, %xmm0			; SSE41-NEXT: pxor %xmm9, %xmm0
	; SSE41-NEXT: movdqa %xmm12, %xmm2			; SSE41-NEXT: movdqa %xmm12, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm2			; SSE41-NEXT: pcmpgtd %xmm0, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm12, %xmm0			; SSE41-NEXT: pcmpeqd %xmm12, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm3, %xmm4			; SSE41-NEXT: pand %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm11			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm11
	; SSE41-NEXT: movapd {{.*#+}} xmm2 = [18446744073709551488,18446744073709551488]			; SSE41-NEXT: movapd {{.*#+}} xmm2 = [18446744073709551488,18446744073709551488]
	; SSE41-NEXT: movapd %xmm11, %xmm0			; SSE41-NEXT: movapd %xmm11, %xmm0
	; SSE41-NEXT: xorpd %xmm9, %xmm0			; SSE41-NEXT: xorpd %xmm9, %xmm0
	; SSE41-NEXT: movdqa {{.*#+}} xmm8 = [18446744071562067840,18446744071562067840]			; SSE41-NEXT: movdqa {{.*#+}} xmm8 = [18446744071562067840,18446744071562067840]
	; SSE41-NEXT: movapd %xmm0, %xmm1			; SSE41-NEXT: movapd %xmm0, %xmm1
	; SSE41-NEXT: pcmpgtd %xmm8, %xmm1			; SSE41-NEXT: pcmpgtd %xmm8, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm1[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm1[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm8, %xmm0			; SSE41-NEXT: pcmpeqd %xmm8, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm4, %xmm3			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]			; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: por %xmm3, %xmm0			; SSE41-NEXT: movapd %xmm2, %xmm4
	; SSE41-NEXT: movapd %xmm2, %xmm3			; SSE41-NEXT: blendvpd %xmm0, %xmm11, %xmm4
	; SSE41-NEXT: blendvpd %xmm0, %xmm11, %xmm3
	; SSE41-NEXT: movapd %xmm7, %xmm0			; SSE41-NEXT: movapd %xmm7, %xmm0
	; SSE41-NEXT: xorpd %xmm9, %xmm0			; SSE41-NEXT: xorpd %xmm9, %xmm0
	; SSE41-NEXT: movapd %xmm0, %xmm1			; SSE41-NEXT: movapd %xmm0, %xmm1
	; SSE41-NEXT: pcmpgtd %xmm8, %xmm1			; SSE41-NEXT: pcmpgtd %xmm8, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm11 = xmm1[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm1[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm8, %xmm0			; SSE41-NEXT: pcmpeqd %xmm8, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm11, %xmm4			; SSE41-NEXT: pand %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]			; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: movapd %xmm2, %xmm1			; SSE41-NEXT: movapd %xmm2, %xmm1
	; SSE41-NEXT: blendvpd %xmm0, %xmm7, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm7, %xmm1
	; SSE41-NEXT: packssdw %xmm3, %xmm1			; SSE41-NEXT: packssdw %xmm4, %xmm1
	; SSE41-NEXT: movapd %xmm6, %xmm0			; SSE41-NEXT: movapd %xmm6, %xmm0
	; SSE41-NEXT: xorpd %xmm9, %xmm0			; SSE41-NEXT: xorpd %xmm9, %xmm0
	; SSE41-NEXT: movapd %xmm0, %xmm3			; SSE41-NEXT: movapd %xmm0, %xmm3
	; SSE41-NEXT: pcmpgtd %xmm8, %xmm3			; SSE41-NEXT: pcmpgtd %xmm8, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm3[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm3[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm8, %xmm0			; SSE41-NEXT: pcmpeqd %xmm8, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm4, %xmm7			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[1,1,3,3]			; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: por %xmm7, %xmm0
	; SSE41-NEXT: movapd %xmm2, %xmm3			; SSE41-NEXT: movapd %xmm2, %xmm3
	; SSE41-NEXT: blendvpd %xmm0, %xmm6, %xmm3			; SSE41-NEXT: blendvpd %xmm0, %xmm6, %xmm3
	; SSE41-NEXT: movapd %xmm5, %xmm0			; SSE41-NEXT: movapd %xmm5, %xmm0
	; SSE41-NEXT: xorpd %xmm9, %xmm0			; SSE41-NEXT: xorpd %xmm9, %xmm0
	; SSE41-NEXT: movapd %xmm0, %xmm4			; SSE41-NEXT: movapd %xmm0, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm8, %xmm4			; SSE41-NEXT: pcmpgtd %xmm8, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm8, %xmm0			; SSE41-NEXT: pcmpeqd %xmm8, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm6, %xmm7			; SSE41-NEXT: pand %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm7, %xmm0
	; SSE41-NEXT: movapd %xmm2, %xmm4			; SSE41-NEXT: movapd %xmm2, %xmm4
	; SSE41-NEXT: blendvpd %xmm0, %xmm5, %xmm4			; SSE41-NEXT: blendvpd %xmm0, %xmm5, %xmm4
	; SSE41-NEXT: packssdw %xmm3, %xmm4			; SSE41-NEXT: packssdw %xmm3, %xmm4
	; SSE41-NEXT: packssdw %xmm4, %xmm1			; SSE41-NEXT: packssdw %xmm4, %xmm1
	; SSE41-NEXT: movapd %xmm15, %xmm0			; SSE41-NEXT: movapd %xmm15, %xmm0
	; SSE41-NEXT: xorpd %xmm9, %xmm0			; SSE41-NEXT: xorpd %xmm9, %xmm0
	; SSE41-NEXT: movapd %xmm0, %xmm3			; SSE41-NEXT: movapd %xmm0, %xmm3
	; SSE41-NEXT: pcmpgtd %xmm8, %xmm3			; SSE41-NEXT: pcmpgtd %xmm8, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm3[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm3[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm8, %xmm0			; SSE41-NEXT: pcmpeqd %xmm8, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm4, %xmm5			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[1,1,3,3]			; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: movapd %xmm2, %xmm3			; SSE41-NEXT: movapd %xmm2, %xmm3
	; SSE41-NEXT: blendvpd %xmm0, %xmm15, %xmm3			; SSE41-NEXT: blendvpd %xmm0, %xmm15, %xmm3
	; SSE41-NEXT: movapd %xmm14, %xmm0			; SSE41-NEXT: movapd %xmm14, %xmm0
	; SSE41-NEXT: xorpd %xmm9, %xmm0			; SSE41-NEXT: xorpd %xmm9, %xmm0
	; SSE41-NEXT: movapd %xmm0, %xmm4			; SSE41-NEXT: movapd %xmm0, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm8, %xmm4			; SSE41-NEXT: pcmpgtd %xmm8, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm8, %xmm0			; SSE41-NEXT: pcmpeqd %xmm8, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm5, %xmm6			; SSE41-NEXT: pand %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: movapd %xmm2, %xmm4			; SSE41-NEXT: movapd %xmm2, %xmm4
	; SSE41-NEXT: blendvpd %xmm0, %xmm14, %xmm4			; SSE41-NEXT: blendvpd %xmm0, %xmm14, %xmm4
	; SSE41-NEXT: packssdw %xmm3, %xmm4			; SSE41-NEXT: packssdw %xmm3, %xmm4
	; SSE41-NEXT: movapd %xmm13, %xmm0			; SSE41-NEXT: movapd %xmm13, %xmm0
	; SSE41-NEXT: xorpd %xmm9, %xmm0			; SSE41-NEXT: xorpd %xmm9, %xmm0
	; SSE41-NEXT: movapd %xmm0, %xmm3			; SSE41-NEXT: movapd %xmm0, %xmm3
	; SSE41-NEXT: pcmpgtd %xmm8, %xmm3			; SSE41-NEXT: pcmpgtd %xmm8, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm3[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm3[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm8, %xmm0			; SSE41-NEXT: pcmpeqd %xmm8, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm5, %xmm6			; SSE41-NEXT: pand %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[1,1,3,3]			; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: movapd %xmm2, %xmm3			; SSE41-NEXT: movapd %xmm2, %xmm3
	; SSE41-NEXT: blendvpd %xmm0, %xmm13, %xmm3			; SSE41-NEXT: blendvpd %xmm0, %xmm13, %xmm3
	; SSE41-NEXT: xorpd %xmm10, %xmm9			; SSE41-NEXT: xorpd %xmm10, %xmm9
	; SSE41-NEXT: movapd %xmm9, %xmm0			; SSE41-NEXT: movapd %xmm9, %xmm5
	; SSE41-NEXT: pcmpgtd %xmm8, %xmm0			; SSE41-NEXT: pcmpgtd %xmm8, %xmm5
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm0[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm5[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm8, %xmm9			; SSE41-NEXT: pcmpeqd %xmm8, %xmm9
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm9[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm9[1,1,3,3]
	; SSE41-NEXT: pand %xmm5, %xmm6			; SSE41-NEXT: pand %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]			; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm10, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm10, %xmm2
	; SSE41-NEXT: packssdw %xmm3, %xmm2			; SSE41-NEXT: packssdw %xmm3, %xmm2
	; SSE41-NEXT: packssdw %xmm2, %xmm4			; SSE41-NEXT: packssdw %xmm2, %xmm4
	; SSE41-NEXT: packsswb %xmm4, %xmm1			; SSE41-NEXT: packsswb %xmm4, %xmm1
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: trunc_ssat_v16i64_v16i8:			; AVX1-LABEL: trunc_ssat_v16i64_v16i8:
	▲ Show 20 Lines • Show All 486 Lines • Show Last 20 Lines

llvm/trunk/test/CodeGen/X86/vector-trunc-usat-widen.ll

	Show First 20 Lines • Show All 84 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: movdqa {{.*#+}} xmm0 = [9223372039002259456,9223372039002259456]			; SSE41-NEXT: movdqa {{.*#+}} xmm0 = [9223372039002259456,9223372039002259456]
	; SSE41-NEXT: movdqa %xmm2, %xmm3			; SSE41-NEXT: movdqa %xmm2, %xmm3
	; SSE41-NEXT: pxor %xmm0, %xmm3			; SSE41-NEXT: pxor %xmm0, %xmm3
	; SSE41-NEXT: movdqa {{.*#+}} xmm4 = [9223372039002259455,9223372039002259455]			; SSE41-NEXT: movdqa {{.*#+}} xmm4 = [9223372039002259455,9223372039002259455]
	; SSE41-NEXT: movdqa %xmm4, %xmm5			; SSE41-NEXT: movdqa %xmm4, %xmm5
	; SSE41-NEXT: pcmpgtd %xmm3, %xmm5			; SSE41-NEXT: pcmpgtd %xmm3, %xmm5
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm5[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm5[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm4, %xmm3			; SSE41-NEXT: pcmpeqd %xmm4, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm3[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm3[1,1,3,3]
	; SSE41-NEXT: pand %xmm6, %xmm7			; SSE41-NEXT: pand %xmm6, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm5[1,1,3,3]			; SSE41-NEXT: por %xmm5, %xmm3
	; SSE41-NEXT: por %xmm7, %xmm3
	; SSE41-NEXT: pxor %xmm1, %xmm0			; SSE41-NEXT: pxor %xmm1, %xmm0
	; SSE41-NEXT: movdqa %xmm4, %xmm5			; SSE41-NEXT: movdqa %xmm4, %xmm5
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm5			; SSE41-NEXT: pcmpgtd %xmm0, %xmm5
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm5[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm5[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm4, %xmm0			; SSE41-NEXT: pcmpeqd %xmm4, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm6, %xmm4			; SSE41-NEXT: pand %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm5[1,1,3,3]			; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: movapd {{.*#+}} xmm4 = [4294967295,4294967295]			; SSE41-NEXT: movapd {{.*#+}} xmm4 = [4294967295,4294967295]
	; SSE41-NEXT: movapd {{.*#+}} xmm5 = [4294967295,429496729]			; SSE41-NEXT: movapd {{.*#+}} xmm5 = [4294967295,429496729]
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm5			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm5
	; SSE41-NEXT: movdqa %xmm3, %xmm0			; SSE41-NEXT: movdqa %xmm3, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm4			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm4
	; SSE41-NEXT: shufps {{.*#+}} xmm4 = xmm4[0,2],xmm5[0,2]			; SSE41-NEXT: shufps {{.*#+}} xmm4 = xmm4[0,2],xmm5[0,2]
	; SSE41-NEXT: movaps %xmm4, %xmm0			; SSE41-NEXT: movaps %xmm4, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	▲ Show 20 Lines • Show All 218 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: movdqa %xmm0, %xmm8			; SSE41-NEXT: movdqa %xmm0, %xmm8
	; SSE41-NEXT: movapd {{.*#+}} xmm6 = [4294967295,4294967295]			; SSE41-NEXT: movapd {{.*#+}} xmm6 = [4294967295,4294967295]
	; SSE41-NEXT: movdqa {{.*#+}} xmm7 = [9223372039002259456,9223372039002259456]			; SSE41-NEXT: movdqa {{.*#+}} xmm7 = [9223372039002259456,9223372039002259456]
	; SSE41-NEXT: movdqa %xmm3, %xmm0			; SSE41-NEXT: movdqa %xmm3, %xmm0
	; SSE41-NEXT: pxor %xmm7, %xmm0			; SSE41-NEXT: pxor %xmm7, %xmm0
	; SSE41-NEXT: movdqa {{.*#+}} xmm9 = [9223372039002259455,9223372039002259455]			; SSE41-NEXT: movdqa {{.*#+}} xmm9 = [9223372039002259455,9223372039002259455]
	; SSE41-NEXT: movdqa %xmm9, %xmm4			; SSE41-NEXT: movdqa %xmm9, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm4			; SSE41-NEXT: pcmpgtd %xmm0, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm10 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm9, %xmm0			; SSE41-NEXT: pcmpeqd %xmm9, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm10, %xmm5			; SSE41-NEXT: pand %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: movapd %xmm6, %xmm5			; SSE41-NEXT: movapd %xmm6, %xmm5
	; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm5			; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm5
	; SSE41-NEXT: movdqa %xmm2, %xmm0			; SSE41-NEXT: movdqa %xmm2, %xmm0
	; SSE41-NEXT: pxor %xmm7, %xmm0			; SSE41-NEXT: pxor %xmm7, %xmm0
	; SSE41-NEXT: movdqa %xmm9, %xmm3			; SSE41-NEXT: movdqa %xmm9, %xmm3
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm3			; SSE41-NEXT: pcmpgtd %xmm0, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm10 = xmm3[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm3[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm9, %xmm0			; SSE41-NEXT: pcmpeqd %xmm9, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm10, %xmm4			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[1,1,3,3]			; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: movapd %xmm6, %xmm4			; SSE41-NEXT: movapd %xmm6, %xmm4
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm4			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm4
	; SSE41-NEXT: shufps {{.*#+}} xmm4 = xmm4[0,2],xmm5[0,2]			; SSE41-NEXT: shufps {{.*#+}} xmm4 = xmm4[0,2],xmm5[0,2]
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: pxor %xmm7, %xmm0			; SSE41-NEXT: pxor %xmm7, %xmm0
	; SSE41-NEXT: movdqa %xmm9, %xmm2			; SSE41-NEXT: movdqa %xmm9, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm2			; SSE41-NEXT: pcmpgtd %xmm0, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm9, %xmm0			; SSE41-NEXT: pcmpeqd %xmm9, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm3, %xmm5			; SSE41-NEXT: pand %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: movapd %xmm6, %xmm2			; SSE41-NEXT: movapd %xmm6, %xmm2
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm2
	; SSE41-NEXT: pxor %xmm8, %xmm7			; SSE41-NEXT: pxor %xmm8, %xmm7
	; SSE41-NEXT: movdqa %xmm9, %xmm0			; SSE41-NEXT: movdqa %xmm9, %xmm1
	; SSE41-NEXT: pcmpgtd %xmm7, %xmm0			; SSE41-NEXT: pcmpgtd %xmm7, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm0[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm1[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm9, %xmm7			; SSE41-NEXT: pcmpeqd %xmm9, %xmm7
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm7[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm7[1,1,3,3]
	; SSE41-NEXT: pand %xmm1, %xmm3			; SSE41-NEXT: pand %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]			; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm6			; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm6
	; SSE41-NEXT: shufps {{.*#+}} xmm6 = xmm6[0,2],xmm2[0,2]			; SSE41-NEXT: shufps {{.*#+}} xmm6 = xmm6[0,2],xmm2[0,2]
	; SSE41-NEXT: movaps %xmm6, %xmm0			; SSE41-NEXT: movaps %xmm6, %xmm0
	; SSE41-NEXT: movaps %xmm4, %xmm1			; SSE41-NEXT: movaps %xmm4, %xmm1
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: trunc_usat_v8i64_v8i32:			; AVX1-LABEL: trunc_usat_v8i64_v8i32:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	▲ Show 20 Lines • Show All 214 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: movdqa %xmm0, %xmm8			; SSE41-NEXT: movdqa %xmm0, %xmm8
	; SSE41-NEXT: movapd {{.*#+}} xmm5 = [65535,65535]			; SSE41-NEXT: movapd {{.*#+}} xmm5 = [65535,65535]
	; SSE41-NEXT: movdqa {{.*#+}} xmm6 = [9223372039002259456,9223372039002259456]			; SSE41-NEXT: movdqa {{.*#+}} xmm6 = [9223372039002259456,9223372039002259456]
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: pxor %xmm6, %xmm0			; SSE41-NEXT: pxor %xmm6, %xmm0
	; SSE41-NEXT: movdqa {{.*#+}} xmm9 = [9223372039002324991,9223372039002324991]			; SSE41-NEXT: movdqa {{.*#+}} xmm9 = [9223372039002324991,9223372039002324991]
	; SSE41-NEXT: movdqa %xmm9, %xmm7			; SSE41-NEXT: movdqa %xmm9, %xmm7
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm7			; SSE41-NEXT: pcmpgtd %xmm0, %xmm7
	; SSE41-NEXT: pshufd {{.*#+}} xmm10 = xmm7[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm7[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm9, %xmm0			; SSE41-NEXT: pcmpeqd %xmm9, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm10, %xmm4			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm7[1,1,3,3]			; SSE41-NEXT: por %xmm7, %xmm0
	; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: movapd %xmm5, %xmm4			; SSE41-NEXT: movapd %xmm5, %xmm4
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm4			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm4
	; SSE41-NEXT: movdqa %xmm8, %xmm0			; SSE41-NEXT: movdqa %xmm8, %xmm0
	; SSE41-NEXT: pxor %xmm6, %xmm0			; SSE41-NEXT: pxor %xmm6, %xmm0
	; SSE41-NEXT: movdqa %xmm9, %xmm1			; SSE41-NEXT: movdqa %xmm9, %xmm1
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm1			; SSE41-NEXT: pcmpgtd %xmm0, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm10 = xmm1[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm1[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm9, %xmm0			; SSE41-NEXT: pcmpeqd %xmm9, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm10, %xmm7			; SSE41-NEXT: pand %xmm7, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]			; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: por %xmm7, %xmm0
	; SSE41-NEXT: movapd %xmm5, %xmm1			; SSE41-NEXT: movapd %xmm5, %xmm1
	; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm1
	; SSE41-NEXT: packusdw %xmm4, %xmm1			; SSE41-NEXT: packusdw %xmm4, %xmm1
	; SSE41-NEXT: movdqa %xmm3, %xmm0			; SSE41-NEXT: movdqa %xmm3, %xmm0
	; SSE41-NEXT: pxor %xmm6, %xmm0			; SSE41-NEXT: pxor %xmm6, %xmm0
	; SSE41-NEXT: movdqa %xmm9, %xmm4			; SSE41-NEXT: movdqa %xmm9, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm4			; SSE41-NEXT: pcmpgtd %xmm0, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm8 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm9, %xmm0			; SSE41-NEXT: pcmpeqd %xmm9, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm8, %xmm7			; SSE41-NEXT: pand %xmm7, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm7, %xmm0
	; SSE41-NEXT: movapd %xmm5, %xmm4			; SSE41-NEXT: movapd %xmm5, %xmm4
	; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm4			; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm4
	; SSE41-NEXT: pxor %xmm2, %xmm6			; SSE41-NEXT: pxor %xmm2, %xmm6
	; SSE41-NEXT: movdqa %xmm9, %xmm0			; SSE41-NEXT: movdqa %xmm9, %xmm3
	; SSE41-NEXT: pcmpgtd %xmm6, %xmm0			; SSE41-NEXT: pcmpgtd %xmm6, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm0[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm3[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm9, %xmm6			; SSE41-NEXT: pcmpeqd %xmm9, %xmm6
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm6[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm6[1,1,3,3]
	; SSE41-NEXT: pand %xmm3, %xmm6			; SSE41-NEXT: pand %xmm7, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]			; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm5			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm5
	; SSE41-NEXT: packusdw %xmm4, %xmm5			; SSE41-NEXT: packusdw %xmm4, %xmm5
	; SSE41-NEXT: packusdw %xmm5, %xmm1			; SSE41-NEXT: packusdw %xmm5, %xmm1
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: trunc_usat_v8i64_v8i16:			; AVX1-LABEL: trunc_usat_v8i64_v8i16:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	▲ Show 20 Lines • Show All 436 Lines • ▼ Show 20 Lines
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movdqa %xmm0, %xmm5			; SSE41-NEXT: movdqa %xmm0, %xmm5
	; SSE41-NEXT: movapd {{.*#+}} xmm8 = [255,255]			; SSE41-NEXT: movapd {{.*#+}} xmm8 = [255,255]
	; SSE41-NEXT: movdqa {{.*#+}} xmm7 = [9223372039002259456,9223372039002259456]			; SSE41-NEXT: movdqa {{.*#+}} xmm7 = [9223372039002259456,9223372039002259456]
	; SSE41-NEXT: pxor %xmm7, %xmm0			; SSE41-NEXT: pxor %xmm7, %xmm0
	; SSE41-NEXT: movdqa {{.*#+}} xmm9 = [9223372039002259711,9223372039002259711]			; SSE41-NEXT: movdqa {{.*#+}} xmm9 = [9223372039002259711,9223372039002259711]
	; SSE41-NEXT: movdqa %xmm9, %xmm4			; SSE41-NEXT: movdqa %xmm9, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm4			; SSE41-NEXT: pcmpgtd %xmm0, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm10 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm9, %xmm0			; SSE41-NEXT: pcmpeqd %xmm9, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm10, %xmm6			; SSE41-NEXT: pand %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: movapd %xmm8, %xmm4			; SSE41-NEXT: movapd %xmm8, %xmm4
	; SSE41-NEXT: blendvpd %xmm0, %xmm5, %xmm4			; SSE41-NEXT: blendvpd %xmm0, %xmm5, %xmm4
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: pxor %xmm7, %xmm0			; SSE41-NEXT: pxor %xmm7, %xmm0
	; SSE41-NEXT: movdqa %xmm9, %xmm5			; SSE41-NEXT: movdqa %xmm9, %xmm5
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm5			; SSE41-NEXT: pcmpgtd %xmm0, %xmm5
	; SSE41-NEXT: pshufd {{.*#+}} xmm10 = xmm5[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm5[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm9, %xmm0			; SSE41-NEXT: pcmpeqd %xmm9, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm10, %xmm6			; SSE41-NEXT: pand %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm5[1,1,3,3]			; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: movapd %xmm8, %xmm5			; SSE41-NEXT: movapd %xmm8, %xmm5
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm5			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm5
	; SSE41-NEXT: movdqa %xmm2, %xmm0			; SSE41-NEXT: movdqa %xmm2, %xmm0
	; SSE41-NEXT: pxor %xmm7, %xmm0			; SSE41-NEXT: pxor %xmm7, %xmm0
	; SSE41-NEXT: movdqa %xmm9, %xmm1			; SSE41-NEXT: movdqa %xmm9, %xmm1
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm1			; SSE41-NEXT: pcmpgtd %xmm0, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm10 = xmm1[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm1[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm9, %xmm0			; SSE41-NEXT: pcmpeqd %xmm9, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm10, %xmm6			; SSE41-NEXT: pand %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]			; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: movapd %xmm8, %xmm1			; SSE41-NEXT: movapd %xmm8, %xmm1
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm1
	; SSE41-NEXT: pxor %xmm3, %xmm7			; SSE41-NEXT: pxor %xmm3, %xmm7
	; SSE41-NEXT: movdqa %xmm9, %xmm0			; SSE41-NEXT: movdqa %xmm9, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm7, %xmm0			; SSE41-NEXT: pcmpgtd %xmm7, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm0[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm9, %xmm7			; SSE41-NEXT: pcmpeqd %xmm9, %xmm7
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm7[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm7[1,1,3,3]
	; SSE41-NEXT: pand %xmm2, %xmm6			; SSE41-NEXT: pand %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: movapd %xmm8, %xmm2			; SSE41-NEXT: movapd %xmm8, %xmm2
	; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm2
	; SSE41-NEXT: andpd %xmm8, %xmm2			; SSE41-NEXT: andpd %xmm8, %xmm2
	; SSE41-NEXT: andpd %xmm8, %xmm1			; SSE41-NEXT: andpd %xmm8, %xmm1
	; SSE41-NEXT: packusdw %xmm2, %xmm1			; SSE41-NEXT: packusdw %xmm2, %xmm1
	; SSE41-NEXT: andpd %xmm8, %xmm5			; SSE41-NEXT: andpd %xmm8, %xmm5
	; SSE41-NEXT: andpd %xmm8, %xmm4			; SSE41-NEXT: andpd %xmm8, %xmm4
	; SSE41-NEXT: packusdw %xmm5, %xmm4			; SSE41-NEXT: packusdw %xmm5, %xmm4
	▲ Show 20 Lines • Show All 212 Lines • ▼ Show 20 Lines
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movdqa %xmm0, %xmm4			; SSE41-NEXT: movdqa %xmm0, %xmm4
	; SSE41-NEXT: movapd {{.*#+}} xmm8 = [255,255]			; SSE41-NEXT: movapd {{.*#+}} xmm8 = [255,255]
	; SSE41-NEXT: movdqa {{.*#+}} xmm7 = [9223372039002259456,9223372039002259456]			; SSE41-NEXT: movdqa {{.*#+}} xmm7 = [9223372039002259456,9223372039002259456]
	; SSE41-NEXT: pxor %xmm7, %xmm0			; SSE41-NEXT: pxor %xmm7, %xmm0
	; SSE41-NEXT: movdqa {{.*#+}} xmm9 = [9223372039002259711,9223372039002259711]			; SSE41-NEXT: movdqa {{.*#+}} xmm9 = [9223372039002259711,9223372039002259711]
	; SSE41-NEXT: movdqa %xmm9, %xmm6			; SSE41-NEXT: movdqa %xmm9, %xmm6
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm6			; SSE41-NEXT: pcmpgtd %xmm0, %xmm6
	; SSE41-NEXT: pshufd {{.*#+}} xmm10 = xmm6[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm6[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm9, %xmm0			; SSE41-NEXT: pcmpeqd %xmm9, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm10, %xmm5			; SSE41-NEXT: pand %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm6[1,1,3,3]			; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: movapd %xmm8, %xmm6			; SSE41-NEXT: movapd %xmm8, %xmm6
	; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm6			; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm6
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: pxor %xmm7, %xmm0			; SSE41-NEXT: pxor %xmm7, %xmm0
	; SSE41-NEXT: movdqa %xmm9, %xmm4			; SSE41-NEXT: movdqa %xmm9, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm4			; SSE41-NEXT: pcmpgtd %xmm0, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm10 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm9, %xmm0			; SSE41-NEXT: pcmpeqd %xmm9, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm10, %xmm5			; SSE41-NEXT: pand %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: movapd %xmm8, %xmm4			; SSE41-NEXT: movapd %xmm8, %xmm4
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm4			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm4
	; SSE41-NEXT: movdqa %xmm2, %xmm0			; SSE41-NEXT: movdqa %xmm2, %xmm0
	; SSE41-NEXT: pxor %xmm7, %xmm0			; SSE41-NEXT: pxor %xmm7, %xmm0
	; SSE41-NEXT: movdqa %xmm9, %xmm1			; SSE41-NEXT: movdqa %xmm9, %xmm1
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm1			; SSE41-NEXT: pcmpgtd %xmm0, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm10 = xmm1[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm1[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm9, %xmm0			; SSE41-NEXT: pcmpeqd %xmm9, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm10, %xmm5			; SSE41-NEXT: pand %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]			; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: movapd %xmm8, %xmm1			; SSE41-NEXT: movapd %xmm8, %xmm1
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm1
	; SSE41-NEXT: pxor %xmm3, %xmm7			; SSE41-NEXT: pxor %xmm3, %xmm7
	; SSE41-NEXT: movdqa %xmm9, %xmm0			; SSE41-NEXT: movdqa %xmm9, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm7, %xmm0			; SSE41-NEXT: pcmpgtd %xmm7, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm0[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm9, %xmm7			; SSE41-NEXT: pcmpeqd %xmm9, %xmm7
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm7[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm7[1,1,3,3]
	; SSE41-NEXT: pand %xmm2, %xmm5			; SSE41-NEXT: pand %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: movapd %xmm8, %xmm2			; SSE41-NEXT: movapd %xmm8, %xmm2
	; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm2
	; SSE41-NEXT: andpd %xmm8, %xmm2			; SSE41-NEXT: andpd %xmm8, %xmm2
	; SSE41-NEXT: andpd %xmm8, %xmm1			; SSE41-NEXT: andpd %xmm8, %xmm1
	; SSE41-NEXT: packusdw %xmm2, %xmm1			; SSE41-NEXT: packusdw %xmm2, %xmm1
	; SSE41-NEXT: andpd %xmm8, %xmm4			; SSE41-NEXT: andpd %xmm8, %xmm4
	; SSE41-NEXT: andpd %xmm8, %xmm6			; SSE41-NEXT: andpd %xmm8, %xmm6
	; SSE41-NEXT: packusdw %xmm4, %xmm6			; SSE41-NEXT: packusdw %xmm4, %xmm6
	▲ Show 20 Lines • Show All 317 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: movdqa {{.*#+}} xmm10 = [9223372039002259456,9223372039002259456]			; SSE41-NEXT: movdqa {{.*#+}} xmm10 = [9223372039002259456,9223372039002259456]
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: pxor %xmm10, %xmm0			; SSE41-NEXT: pxor %xmm10, %xmm0
	; SSE41-NEXT: movdqa {{.*#+}} xmm11 = [9223372039002259711,9223372039002259711]			; SSE41-NEXT: movdqa {{.*#+}} xmm11 = [9223372039002259711,9223372039002259711]
	; SSE41-NEXT: movdqa %xmm11, %xmm12			; SSE41-NEXT: movdqa %xmm11, %xmm12
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm12			; SSE41-NEXT: pcmpgtd %xmm0, %xmm12
	; SSE41-NEXT: pshufd {{.*#+}} xmm13 = xmm12[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm13 = xmm12[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm11, %xmm0			; SSE41-NEXT: pcmpeqd %xmm11, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm14 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm13, %xmm14			; SSE41-NEXT: pand %xmm13, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm12[1,1,3,3]			; SSE41-NEXT: por %xmm12, %xmm0
	; SSE41-NEXT: por %xmm14, %xmm0
	; SSE41-NEXT: movapd %xmm9, %xmm12			; SSE41-NEXT: movapd %xmm9, %xmm12
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm12			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm12
	; SSE41-NEXT: movdqa %xmm8, %xmm0			; SSE41-NEXT: movdqa %xmm8, %xmm0
	; SSE41-NEXT: pxor %xmm10, %xmm0			; SSE41-NEXT: pxor %xmm10, %xmm0
	; SSE41-NEXT: movdqa %xmm11, %xmm1			; SSE41-NEXT: movdqa %xmm11, %xmm1
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm1			; SSE41-NEXT: pcmpgtd %xmm0, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm13 = xmm1[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm13 = xmm1[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm11, %xmm0			; SSE41-NEXT: pcmpeqd %xmm11, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm14 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm13, %xmm14			; SSE41-NEXT: pand %xmm13, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]			; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: por %xmm14, %xmm0
	; SSE41-NEXT: movapd %xmm9, %xmm13			; SSE41-NEXT: movapd %xmm9, %xmm13
	; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm13			; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm13
	; SSE41-NEXT: packusdw %xmm12, %xmm13			; SSE41-NEXT: packusdw %xmm12, %xmm13
	; SSE41-NEXT: movdqa %xmm3, %xmm0			; SSE41-NEXT: movdqa %xmm3, %xmm0
	; SSE41-NEXT: pxor %xmm10, %xmm0			; SSE41-NEXT: pxor %xmm10, %xmm0
	; SSE41-NEXT: movdqa %xmm11, %xmm1			; SSE41-NEXT: movdqa %xmm11, %xmm1
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm1			; SSE41-NEXT: pcmpgtd %xmm0, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm8 = xmm1[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm8 = xmm1[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm11, %xmm0			; SSE41-NEXT: pcmpeqd %xmm11, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm12 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm8, %xmm12			; SSE41-NEXT: pand %xmm8, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]			; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: por %xmm12, %xmm0			; SSE41-NEXT: movapd %xmm9, %xmm1
	; SSE41-NEXT: movapd %xmm9, %xmm12			; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm1
	; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm12
	; SSE41-NEXT: movdqa %xmm2, %xmm0			; SSE41-NEXT: movdqa %xmm2, %xmm0
	; SSE41-NEXT: pxor %xmm10, %xmm0			; SSE41-NEXT: pxor %xmm10, %xmm0
	; SSE41-NEXT: movdqa %xmm11, %xmm3			; SSE41-NEXT: movdqa %xmm11, %xmm3
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm3			; SSE41-NEXT: pcmpgtd %xmm0, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm8 = xmm3[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm8 = xmm3[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm11, %xmm0			; SSE41-NEXT: pcmpeqd %xmm11, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm8, %xmm1			; SSE41-NEXT: pand %xmm8, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[1,1,3,3]			; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: por %xmm1, %xmm0			; SSE41-NEXT: movapd %xmm9, %xmm3
	; SSE41-NEXT: movapd %xmm9, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm3
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm1			; SSE41-NEXT: packusdw %xmm1, %xmm3
	; SSE41-NEXT: packusdw %xmm12, %xmm1			; SSE41-NEXT: packusdw %xmm3, %xmm13
	; SSE41-NEXT: packusdw %xmm1, %xmm13
	; SSE41-NEXT: movdqa %xmm5, %xmm0			; SSE41-NEXT: movdqa %xmm5, %xmm0
	; SSE41-NEXT: pxor %xmm10, %xmm0			; SSE41-NEXT: pxor %xmm10, %xmm0
	; SSE41-NEXT: movdqa %xmm11, %xmm1			; SSE41-NEXT: movdqa %xmm11, %xmm1
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm1			; SSE41-NEXT: pcmpgtd %xmm0, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm1[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm1[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm11, %xmm0			; SSE41-NEXT: pcmpeqd %xmm11, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm2, %xmm3			; SSE41-NEXT: pand %xmm2, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]			; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: movapd %xmm9, %xmm1			; SSE41-NEXT: movapd %xmm9, %xmm1
	; SSE41-NEXT: blendvpd %xmm0, %xmm5, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm5, %xmm1
	; SSE41-NEXT: movdqa %xmm4, %xmm0			; SSE41-NEXT: movdqa %xmm4, %xmm0
	; SSE41-NEXT: pxor %xmm10, %xmm0			; SSE41-NEXT: pxor %xmm10, %xmm0
	; SSE41-NEXT: movdqa %xmm11, %xmm2			; SSE41-NEXT: movdqa %xmm11, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm2			; SSE41-NEXT: pcmpgtd %xmm0, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm11, %xmm0			; SSE41-NEXT: pcmpeqd %xmm11, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm3, %xmm5			; SSE41-NEXT: pand %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: movapd %xmm9, %xmm2			; SSE41-NEXT: movapd %xmm9, %xmm2
	; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm2
	; SSE41-NEXT: packusdw %xmm1, %xmm2			; SSE41-NEXT: packusdw %xmm1, %xmm2
	; SSE41-NEXT: movdqa %xmm7, %xmm0			; SSE41-NEXT: movdqa %xmm7, %xmm0
	; SSE41-NEXT: pxor %xmm10, %xmm0			; SSE41-NEXT: pxor %xmm10, %xmm0
	; SSE41-NEXT: movdqa %xmm11, %xmm1			; SSE41-NEXT: movdqa %xmm11, %xmm1
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm1			; SSE41-NEXT: pcmpgtd %xmm0, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm1[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm1[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm11, %xmm0			; SSE41-NEXT: pcmpeqd %xmm11, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm3, %xmm4			; SSE41-NEXT: pand %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]			; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: movapd %xmm9, %xmm1			; SSE41-NEXT: movapd %xmm9, %xmm1
	; SSE41-NEXT: blendvpd %xmm0, %xmm7, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm7, %xmm1
	; SSE41-NEXT: pxor %xmm6, %xmm10			; SSE41-NEXT: pxor %xmm6, %xmm10
	; SSE41-NEXT: movdqa %xmm11, %xmm0			; SSE41-NEXT: movdqa %xmm11, %xmm3
	; SSE41-NEXT: pcmpgtd %xmm10, %xmm0			; SSE41-NEXT: pcmpgtd %xmm10, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm0[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm3[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm11, %xmm10			; SSE41-NEXT: pcmpeqd %xmm11, %xmm10
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm10[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm10[1,1,3,3]
	; SSE41-NEXT: pand %xmm3, %xmm4			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]			; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm6, %xmm9			; SSE41-NEXT: blendvpd %xmm0, %xmm6, %xmm9
	; SSE41-NEXT: packusdw %xmm1, %xmm9			; SSE41-NEXT: packusdw %xmm1, %xmm9
	; SSE41-NEXT: packusdw %xmm9, %xmm2			; SSE41-NEXT: packusdw %xmm9, %xmm2
	; SSE41-NEXT: packuswb %xmm2, %xmm13			; SSE41-NEXT: packuswb %xmm2, %xmm13
	; SSE41-NEXT: movdqa %xmm13, %xmm0			; SSE41-NEXT: movdqa %xmm13, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: trunc_usat_v16i64_v16i8:			; AVX1-LABEL: trunc_usat_v16i64_v16i8:
	▲ Show 20 Lines • Show All 661 Lines • Show Last 20 Lines

llvm/trunk/test/CodeGen/X86/vector-trunc-usat.ll

	Show First 20 Lines • Show All 84 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: movdqa {{.*#+}} xmm0 = [9223372039002259456,9223372039002259456]			; SSE41-NEXT: movdqa {{.*#+}} xmm0 = [9223372039002259456,9223372039002259456]
	; SSE41-NEXT: movdqa %xmm2, %xmm3			; SSE41-NEXT: movdqa %xmm2, %xmm3
	; SSE41-NEXT: pxor %xmm0, %xmm3			; SSE41-NEXT: pxor %xmm0, %xmm3
	; SSE41-NEXT: movdqa {{.*#+}} xmm4 = [9223372039002259455,9223372039002259455]			; SSE41-NEXT: movdqa {{.*#+}} xmm4 = [9223372039002259455,9223372039002259455]
	; SSE41-NEXT: movdqa %xmm4, %xmm5			; SSE41-NEXT: movdqa %xmm4, %xmm5
	; SSE41-NEXT: pcmpgtd %xmm3, %xmm5			; SSE41-NEXT: pcmpgtd %xmm3, %xmm5
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm5[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm5[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm4, %xmm3			; SSE41-NEXT: pcmpeqd %xmm4, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm3[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm3[1,1,3,3]
	; SSE41-NEXT: pand %xmm6, %xmm7			; SSE41-NEXT: pand %xmm6, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm5[1,1,3,3]			; SSE41-NEXT: por %xmm5, %xmm3
	; SSE41-NEXT: por %xmm7, %xmm3
	; SSE41-NEXT: pxor %xmm1, %xmm0			; SSE41-NEXT: pxor %xmm1, %xmm0
	; SSE41-NEXT: movdqa %xmm4, %xmm5			; SSE41-NEXT: movdqa %xmm4, %xmm5
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm5			; SSE41-NEXT: pcmpgtd %xmm0, %xmm5
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm5[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm5[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm4, %xmm0			; SSE41-NEXT: pcmpeqd %xmm4, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm6, %xmm4			; SSE41-NEXT: pand %xmm6, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm5[1,1,3,3]			; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: movapd {{.*#+}} xmm4 = [4294967295,4294967295]			; SSE41-NEXT: movapd {{.*#+}} xmm4 = [4294967295,4294967295]
	; SSE41-NEXT: movapd {{.*#+}} xmm5 = [4294967295,429496729]			; SSE41-NEXT: movapd {{.*#+}} xmm5 = [4294967295,429496729]
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm5			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm5
	; SSE41-NEXT: movdqa %xmm3, %xmm0			; SSE41-NEXT: movdqa %xmm3, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm4			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm4
	; SSE41-NEXT: shufps {{.*#+}} xmm4 = xmm4[0,2],xmm5[0,2]			; SSE41-NEXT: shufps {{.*#+}} xmm4 = xmm4[0,2],xmm5[0,2]
	; SSE41-NEXT: movaps %xmm4, %xmm0			; SSE41-NEXT: movaps %xmm4, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	▲ Show 20 Lines • Show All 218 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: movdqa %xmm0, %xmm8			; SSE41-NEXT: movdqa %xmm0, %xmm8
	; SSE41-NEXT: movapd {{.*#+}} xmm6 = [4294967295,4294967295]			; SSE41-NEXT: movapd {{.*#+}} xmm6 = [4294967295,4294967295]
	; SSE41-NEXT: movdqa {{.*#+}} xmm7 = [9223372039002259456,9223372039002259456]			; SSE41-NEXT: movdqa {{.*#+}} xmm7 = [9223372039002259456,9223372039002259456]
	; SSE41-NEXT: movdqa %xmm3, %xmm0			; SSE41-NEXT: movdqa %xmm3, %xmm0
	; SSE41-NEXT: pxor %xmm7, %xmm0			; SSE41-NEXT: pxor %xmm7, %xmm0
	; SSE41-NEXT: movdqa {{.*#+}} xmm9 = [9223372039002259455,9223372039002259455]			; SSE41-NEXT: movdqa {{.*#+}} xmm9 = [9223372039002259455,9223372039002259455]
	; SSE41-NEXT: movdqa %xmm9, %xmm4			; SSE41-NEXT: movdqa %xmm9, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm4			; SSE41-NEXT: pcmpgtd %xmm0, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm10 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm9, %xmm0			; SSE41-NEXT: pcmpeqd %xmm9, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm10, %xmm5			; SSE41-NEXT: pand %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: movapd %xmm6, %xmm5			; SSE41-NEXT: movapd %xmm6, %xmm5
	; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm5			; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm5
	; SSE41-NEXT: movdqa %xmm2, %xmm0			; SSE41-NEXT: movdqa %xmm2, %xmm0
	; SSE41-NEXT: pxor %xmm7, %xmm0			; SSE41-NEXT: pxor %xmm7, %xmm0
	; SSE41-NEXT: movdqa %xmm9, %xmm3			; SSE41-NEXT: movdqa %xmm9, %xmm3
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm3			; SSE41-NEXT: pcmpgtd %xmm0, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm10 = xmm3[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm3[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm9, %xmm0			; SSE41-NEXT: pcmpeqd %xmm9, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm10, %xmm4			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[1,1,3,3]			; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: movapd %xmm6, %xmm4			; SSE41-NEXT: movapd %xmm6, %xmm4
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm4			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm4
	; SSE41-NEXT: shufps {{.*#+}} xmm4 = xmm4[0,2],xmm5[0,2]			; SSE41-NEXT: shufps {{.*#+}} xmm4 = xmm4[0,2],xmm5[0,2]
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: pxor %xmm7, %xmm0			; SSE41-NEXT: pxor %xmm7, %xmm0
	; SSE41-NEXT: movdqa %xmm9, %xmm2			; SSE41-NEXT: movdqa %xmm9, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm2			; SSE41-NEXT: pcmpgtd %xmm0, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm9, %xmm0			; SSE41-NEXT: pcmpeqd %xmm9, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm3, %xmm5			; SSE41-NEXT: pand %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: movapd %xmm6, %xmm2			; SSE41-NEXT: movapd %xmm6, %xmm2
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm2
	; SSE41-NEXT: pxor %xmm8, %xmm7			; SSE41-NEXT: pxor %xmm8, %xmm7
	; SSE41-NEXT: movdqa %xmm9, %xmm0			; SSE41-NEXT: movdqa %xmm9, %xmm1
	; SSE41-NEXT: pcmpgtd %xmm7, %xmm0			; SSE41-NEXT: pcmpgtd %xmm7, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm0[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm1[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm9, %xmm7			; SSE41-NEXT: pcmpeqd %xmm9, %xmm7
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm7[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm7[1,1,3,3]
	; SSE41-NEXT: pand %xmm1, %xmm3			; SSE41-NEXT: pand %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]			; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm6			; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm6
	; SSE41-NEXT: shufps {{.*#+}} xmm6 = xmm6[0,2],xmm2[0,2]			; SSE41-NEXT: shufps {{.*#+}} xmm6 = xmm6[0,2],xmm2[0,2]
	; SSE41-NEXT: movaps %xmm6, %xmm0			; SSE41-NEXT: movaps %xmm6, %xmm0
	; SSE41-NEXT: movaps %xmm4, %xmm1			; SSE41-NEXT: movaps %xmm4, %xmm1
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: trunc_usat_v8i64_v8i32:			; AVX1-LABEL: trunc_usat_v8i64_v8i32:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	▲ Show 20 Lines • Show All 214 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: movdqa %xmm0, %xmm8			; SSE41-NEXT: movdqa %xmm0, %xmm8
	; SSE41-NEXT: movapd {{.*#+}} xmm5 = [65535,65535]			; SSE41-NEXT: movapd {{.*#+}} xmm5 = [65535,65535]
	; SSE41-NEXT: movdqa {{.*#+}} xmm6 = [9223372039002259456,9223372039002259456]			; SSE41-NEXT: movdqa {{.*#+}} xmm6 = [9223372039002259456,9223372039002259456]
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: pxor %xmm6, %xmm0			; SSE41-NEXT: pxor %xmm6, %xmm0
	; SSE41-NEXT: movdqa {{.*#+}} xmm9 = [9223372039002324991,9223372039002324991]			; SSE41-NEXT: movdqa {{.*#+}} xmm9 = [9223372039002324991,9223372039002324991]
	; SSE41-NEXT: movdqa %xmm9, %xmm7			; SSE41-NEXT: movdqa %xmm9, %xmm7
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm7			; SSE41-NEXT: pcmpgtd %xmm0, %xmm7
	; SSE41-NEXT: pshufd {{.*#+}} xmm10 = xmm7[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm7[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm9, %xmm0			; SSE41-NEXT: pcmpeqd %xmm9, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm10, %xmm4			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm7[1,1,3,3]			; SSE41-NEXT: por %xmm7, %xmm0
	; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: movapd %xmm5, %xmm4			; SSE41-NEXT: movapd %xmm5, %xmm4
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm4			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm4
	; SSE41-NEXT: movdqa %xmm8, %xmm0			; SSE41-NEXT: movdqa %xmm8, %xmm0
	; SSE41-NEXT: pxor %xmm6, %xmm0			; SSE41-NEXT: pxor %xmm6, %xmm0
	; SSE41-NEXT: movdqa %xmm9, %xmm1			; SSE41-NEXT: movdqa %xmm9, %xmm1
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm1			; SSE41-NEXT: pcmpgtd %xmm0, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm10 = xmm1[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm1[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm9, %xmm0			; SSE41-NEXT: pcmpeqd %xmm9, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm10, %xmm7			; SSE41-NEXT: pand %xmm7, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]			; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: por %xmm7, %xmm0
	; SSE41-NEXT: movapd %xmm5, %xmm1			; SSE41-NEXT: movapd %xmm5, %xmm1
	; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm1
	; SSE41-NEXT: packusdw %xmm4, %xmm1			; SSE41-NEXT: packusdw %xmm4, %xmm1
	; SSE41-NEXT: movdqa %xmm3, %xmm0			; SSE41-NEXT: movdqa %xmm3, %xmm0
	; SSE41-NEXT: pxor %xmm6, %xmm0			; SSE41-NEXT: pxor %xmm6, %xmm0
	; SSE41-NEXT: movdqa %xmm9, %xmm4			; SSE41-NEXT: movdqa %xmm9, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm4			; SSE41-NEXT: pcmpgtd %xmm0, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm8 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm9, %xmm0			; SSE41-NEXT: pcmpeqd %xmm9, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm8, %xmm7			; SSE41-NEXT: pand %xmm7, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm7, %xmm0
	; SSE41-NEXT: movapd %xmm5, %xmm4			; SSE41-NEXT: movapd %xmm5, %xmm4
	; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm4			; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm4
	; SSE41-NEXT: pxor %xmm2, %xmm6			; SSE41-NEXT: pxor %xmm2, %xmm6
	; SSE41-NEXT: movdqa %xmm9, %xmm0			; SSE41-NEXT: movdqa %xmm9, %xmm3
	; SSE41-NEXT: pcmpgtd %xmm6, %xmm0			; SSE41-NEXT: pcmpgtd %xmm6, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm0[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm3[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm9, %xmm6			; SSE41-NEXT: pcmpeqd %xmm9, %xmm6
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm6[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm6[1,1,3,3]
	; SSE41-NEXT: pand %xmm3, %xmm6			; SSE41-NEXT: pand %xmm7, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]			; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm5			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm5
	; SSE41-NEXT: packusdw %xmm4, %xmm5			; SSE41-NEXT: packusdw %xmm4, %xmm5
	; SSE41-NEXT: packusdw %xmm5, %xmm1			; SSE41-NEXT: packusdw %xmm5, %xmm1
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: trunc_usat_v8i64_v8i16:			; AVX1-LABEL: trunc_usat_v8i64_v8i16:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	▲ Show 20 Lines • Show All 427 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: movdqa %xmm0, %xmm8			; SSE41-NEXT: movdqa %xmm0, %xmm8
	; SSE41-NEXT: movapd {{.*#+}} xmm5 = [255,255]			; SSE41-NEXT: movapd {{.*#+}} xmm5 = [255,255]
	; SSE41-NEXT: movdqa {{.*#+}} xmm6 = [9223372039002259456,9223372039002259456]			; SSE41-NEXT: movdqa {{.*#+}} xmm6 = [9223372039002259456,9223372039002259456]
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: pxor %xmm6, %xmm0			; SSE41-NEXT: pxor %xmm6, %xmm0
	; SSE41-NEXT: movdqa {{.*#+}} xmm9 = [9223372039002259711,9223372039002259711]			; SSE41-NEXT: movdqa {{.*#+}} xmm9 = [9223372039002259711,9223372039002259711]
	; SSE41-NEXT: movdqa %xmm9, %xmm7			; SSE41-NEXT: movdqa %xmm9, %xmm7
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm7			; SSE41-NEXT: pcmpgtd %xmm0, %xmm7
	; SSE41-NEXT: pshufd {{.*#+}} xmm10 = xmm7[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm7[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm9, %xmm0			; SSE41-NEXT: pcmpeqd %xmm9, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm10, %xmm4			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm7[1,1,3,3]			; SSE41-NEXT: por %xmm7, %xmm0
	; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: movapd %xmm5, %xmm4			; SSE41-NEXT: movapd %xmm5, %xmm4
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm4			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm4
	; SSE41-NEXT: movdqa %xmm8, %xmm0			; SSE41-NEXT: movdqa %xmm8, %xmm0
	; SSE41-NEXT: pxor %xmm6, %xmm0			; SSE41-NEXT: pxor %xmm6, %xmm0
	; SSE41-NEXT: movdqa %xmm9, %xmm1			; SSE41-NEXT: movdqa %xmm9, %xmm1
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm1			; SSE41-NEXT: pcmpgtd %xmm0, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm10 = xmm1[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm1[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm9, %xmm0			; SSE41-NEXT: pcmpeqd %xmm9, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm10, %xmm7			; SSE41-NEXT: pand %xmm7, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]			; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: por %xmm7, %xmm0
	; SSE41-NEXT: movapd %xmm5, %xmm1			; SSE41-NEXT: movapd %xmm5, %xmm1
	; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm1
	; SSE41-NEXT: packusdw %xmm4, %xmm1			; SSE41-NEXT: packusdw %xmm4, %xmm1
	; SSE41-NEXT: movdqa %xmm3, %xmm0			; SSE41-NEXT: movdqa %xmm3, %xmm0
	; SSE41-NEXT: pxor %xmm6, %xmm0			; SSE41-NEXT: pxor %xmm6, %xmm0
	; SSE41-NEXT: movdqa %xmm9, %xmm4			; SSE41-NEXT: movdqa %xmm9, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm4			; SSE41-NEXT: pcmpgtd %xmm0, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm8 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm9, %xmm0			; SSE41-NEXT: pcmpeqd %xmm9, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm8, %xmm7			; SSE41-NEXT: pand %xmm7, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm7, %xmm0
	; SSE41-NEXT: movapd %xmm5, %xmm4			; SSE41-NEXT: movapd %xmm5, %xmm4
	; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm4			; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm4
	; SSE41-NEXT: pxor %xmm2, %xmm6			; SSE41-NEXT: pxor %xmm2, %xmm6
	; SSE41-NEXT: movdqa %xmm9, %xmm0			; SSE41-NEXT: movdqa %xmm9, %xmm3
	; SSE41-NEXT: pcmpgtd %xmm6, %xmm0			; SSE41-NEXT: pcmpgtd %xmm6, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm0[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm3[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm9, %xmm6			; SSE41-NEXT: pcmpeqd %xmm9, %xmm6
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm6[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm6[1,1,3,3]
	; SSE41-NEXT: pand %xmm3, %xmm6			; SSE41-NEXT: pand %xmm7, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]			; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm5			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm5
	; SSE41-NEXT: packusdw %xmm4, %xmm5			; SSE41-NEXT: packusdw %xmm4, %xmm5
	; SSE41-NEXT: packusdw %xmm5, %xmm1			; SSE41-NEXT: packusdw %xmm5, %xmm1
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: trunc_usat_v8i64_v8i8:			; AVX1-LABEL: trunc_usat_v8i64_v8i8:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	▲ Show 20 Lines • Show All 191 Lines • ▼ Show 20 Lines
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movdqa %xmm0, %xmm4			; SSE41-NEXT: movdqa %xmm0, %xmm4
	; SSE41-NEXT: movapd {{.*#+}} xmm8 = [255,255]			; SSE41-NEXT: movapd {{.*#+}} xmm8 = [255,255]
	; SSE41-NEXT: movdqa {{.*#+}} xmm7 = [9223372039002259456,9223372039002259456]			; SSE41-NEXT: movdqa {{.*#+}} xmm7 = [9223372039002259456,9223372039002259456]
	; SSE41-NEXT: pxor %xmm7, %xmm0			; SSE41-NEXT: pxor %xmm7, %xmm0
	; SSE41-NEXT: movdqa {{.*#+}} xmm9 = [9223372039002259711,9223372039002259711]			; SSE41-NEXT: movdqa {{.*#+}} xmm9 = [9223372039002259711,9223372039002259711]
	; SSE41-NEXT: movdqa %xmm9, %xmm6			; SSE41-NEXT: movdqa %xmm9, %xmm6
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm6			; SSE41-NEXT: pcmpgtd %xmm0, %xmm6
	; SSE41-NEXT: pshufd {{.*#+}} xmm10 = xmm6[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm6[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm9, %xmm0			; SSE41-NEXT: pcmpeqd %xmm9, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm10, %xmm5			; SSE41-NEXT: pand %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm6[1,1,3,3]			; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: movapd %xmm8, %xmm6			; SSE41-NEXT: movapd %xmm8, %xmm6
	; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm6			; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm6
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: pxor %xmm7, %xmm0			; SSE41-NEXT: pxor %xmm7, %xmm0
	; SSE41-NEXT: movdqa %xmm9, %xmm4			; SSE41-NEXT: movdqa %xmm9, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm4			; SSE41-NEXT: pcmpgtd %xmm0, %xmm4
	; SSE41-NEXT: pshufd {{.*#+}} xmm10 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm9, %xmm0			; SSE41-NEXT: pcmpeqd %xmm9, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm10, %xmm5			; SSE41-NEXT: pand %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[1,1,3,3]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: movapd %xmm8, %xmm4			; SSE41-NEXT: movapd %xmm8, %xmm4
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm4			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm4
	; SSE41-NEXT: movdqa %xmm2, %xmm0			; SSE41-NEXT: movdqa %xmm2, %xmm0
	; SSE41-NEXT: pxor %xmm7, %xmm0			; SSE41-NEXT: pxor %xmm7, %xmm0
	; SSE41-NEXT: movdqa %xmm9, %xmm1			; SSE41-NEXT: movdqa %xmm9, %xmm1
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm1			; SSE41-NEXT: pcmpgtd %xmm0, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm10 = xmm1[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm1[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm9, %xmm0			; SSE41-NEXT: pcmpeqd %xmm9, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm10, %xmm5			; SSE41-NEXT: pand %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]			; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: movapd %xmm8, %xmm1			; SSE41-NEXT: movapd %xmm8, %xmm1
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm1
	; SSE41-NEXT: pxor %xmm3, %xmm7			; SSE41-NEXT: pxor %xmm3, %xmm7
	; SSE41-NEXT: movdqa %xmm9, %xmm0			; SSE41-NEXT: movdqa %xmm9, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm7, %xmm0			; SSE41-NEXT: pcmpgtd %xmm7, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm0[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm9, %xmm7			; SSE41-NEXT: pcmpeqd %xmm9, %xmm7
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm7[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm7[1,1,3,3]
	; SSE41-NEXT: pand %xmm2, %xmm5			; SSE41-NEXT: pand %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: movapd %xmm8, %xmm2			; SSE41-NEXT: movapd %xmm8, %xmm2
	; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm2
	; SSE41-NEXT: andpd %xmm8, %xmm2			; SSE41-NEXT: andpd %xmm8, %xmm2
	; SSE41-NEXT: andpd %xmm8, %xmm1			; SSE41-NEXT: andpd %xmm8, %xmm1
	; SSE41-NEXT: packusdw %xmm2, %xmm1			; SSE41-NEXT: packusdw %xmm2, %xmm1
	; SSE41-NEXT: andpd %xmm8, %xmm4			; SSE41-NEXT: andpd %xmm8, %xmm4
	; SSE41-NEXT: andpd %xmm8, %xmm6			; SSE41-NEXT: andpd %xmm8, %xmm6
	; SSE41-NEXT: packusdw %xmm4, %xmm6			; SSE41-NEXT: packusdw %xmm4, %xmm6
	▲ Show 20 Lines • Show All 315 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: movdqa {{.*#+}} xmm10 = [9223372039002259456,9223372039002259456]			; SSE41-NEXT: movdqa {{.*#+}} xmm10 = [9223372039002259456,9223372039002259456]
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: pxor %xmm10, %xmm0			; SSE41-NEXT: pxor %xmm10, %xmm0
	; SSE41-NEXT: movdqa {{.*#+}} xmm11 = [9223372039002259711,9223372039002259711]			; SSE41-NEXT: movdqa {{.*#+}} xmm11 = [9223372039002259711,9223372039002259711]
	; SSE41-NEXT: movdqa %xmm11, %xmm12			; SSE41-NEXT: movdqa %xmm11, %xmm12
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm12			; SSE41-NEXT: pcmpgtd %xmm0, %xmm12
	; SSE41-NEXT: pshufd {{.*#+}} xmm13 = xmm12[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm13 = xmm12[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm11, %xmm0			; SSE41-NEXT: pcmpeqd %xmm11, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm14 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm13, %xmm14			; SSE41-NEXT: pand %xmm13, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm12[1,1,3,3]			; SSE41-NEXT: por %xmm12, %xmm0
	; SSE41-NEXT: por %xmm14, %xmm0
	; SSE41-NEXT: movapd %xmm9, %xmm12			; SSE41-NEXT: movapd %xmm9, %xmm12
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm12			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm12
	; SSE41-NEXT: movdqa %xmm8, %xmm0			; SSE41-NEXT: movdqa %xmm8, %xmm0
	; SSE41-NEXT: pxor %xmm10, %xmm0			; SSE41-NEXT: pxor %xmm10, %xmm0
	; SSE41-NEXT: movdqa %xmm11, %xmm1			; SSE41-NEXT: movdqa %xmm11, %xmm1
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm1			; SSE41-NEXT: pcmpgtd %xmm0, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm13 = xmm1[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm13 = xmm1[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm11, %xmm0			; SSE41-NEXT: pcmpeqd %xmm11, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm14 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm13, %xmm14			; SSE41-NEXT: pand %xmm13, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]			; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: por %xmm14, %xmm0
	; SSE41-NEXT: movapd %xmm9, %xmm13			; SSE41-NEXT: movapd %xmm9, %xmm13
	; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm13			; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm13
	; SSE41-NEXT: packusdw %xmm12, %xmm13			; SSE41-NEXT: packusdw %xmm12, %xmm13
	; SSE41-NEXT: movdqa %xmm3, %xmm0			; SSE41-NEXT: movdqa %xmm3, %xmm0
	; SSE41-NEXT: pxor %xmm10, %xmm0			; SSE41-NEXT: pxor %xmm10, %xmm0
	; SSE41-NEXT: movdqa %xmm11, %xmm1			; SSE41-NEXT: movdqa %xmm11, %xmm1
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm1			; SSE41-NEXT: pcmpgtd %xmm0, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm8 = xmm1[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm8 = xmm1[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm11, %xmm0			; SSE41-NEXT: pcmpeqd %xmm11, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm12 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm8, %xmm12			; SSE41-NEXT: pand %xmm8, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]			; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: por %xmm12, %xmm0			; SSE41-NEXT: movapd %xmm9, %xmm1
	; SSE41-NEXT: movapd %xmm9, %xmm12			; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm1
	; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm12
	; SSE41-NEXT: movdqa %xmm2, %xmm0			; SSE41-NEXT: movdqa %xmm2, %xmm0
	; SSE41-NEXT: pxor %xmm10, %xmm0			; SSE41-NEXT: pxor %xmm10, %xmm0
	; SSE41-NEXT: movdqa %xmm11, %xmm3			; SSE41-NEXT: movdqa %xmm11, %xmm3
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm3			; SSE41-NEXT: pcmpgtd %xmm0, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm8 = xmm3[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm8 = xmm3[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm11, %xmm0			; SSE41-NEXT: pcmpeqd %xmm11, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm8, %xmm1			; SSE41-NEXT: pand %xmm8, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[1,1,3,3]			; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: por %xmm1, %xmm0			; SSE41-NEXT: movapd %xmm9, %xmm3
	; SSE41-NEXT: movapd %xmm9, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm3
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm1			; SSE41-NEXT: packusdw %xmm1, %xmm3
	; SSE41-NEXT: packusdw %xmm12, %xmm1			; SSE41-NEXT: packusdw %xmm3, %xmm13
	; SSE41-NEXT: packusdw %xmm1, %xmm13
	; SSE41-NEXT: movdqa %xmm5, %xmm0			; SSE41-NEXT: movdqa %xmm5, %xmm0
	; SSE41-NEXT: pxor %xmm10, %xmm0			; SSE41-NEXT: pxor %xmm10, %xmm0
	; SSE41-NEXT: movdqa %xmm11, %xmm1			; SSE41-NEXT: movdqa %xmm11, %xmm1
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm1			; SSE41-NEXT: pcmpgtd %xmm0, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm1[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm1[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm11, %xmm0			; SSE41-NEXT: pcmpeqd %xmm11, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm2, %xmm3			; SSE41-NEXT: pand %xmm2, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]			; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: movapd %xmm9, %xmm1			; SSE41-NEXT: movapd %xmm9, %xmm1
	; SSE41-NEXT: blendvpd %xmm0, %xmm5, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm5, %xmm1
	; SSE41-NEXT: movdqa %xmm4, %xmm0			; SSE41-NEXT: movdqa %xmm4, %xmm0
	; SSE41-NEXT: pxor %xmm10, %xmm0			; SSE41-NEXT: pxor %xmm10, %xmm0
	; SSE41-NEXT: movdqa %xmm11, %xmm2			; SSE41-NEXT: movdqa %xmm11, %xmm2
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm2			; SSE41-NEXT: pcmpgtd %xmm0, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm11, %xmm0			; SSE41-NEXT: pcmpeqd %xmm11, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm3, %xmm5			; SSE41-NEXT: pand %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm2[1,1,3,3]			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: movapd %xmm9, %xmm2			; SSE41-NEXT: movapd %xmm9, %xmm2
	; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm2
	; SSE41-NEXT: packusdw %xmm1, %xmm2			; SSE41-NEXT: packusdw %xmm1, %xmm2
	; SSE41-NEXT: movdqa %xmm7, %xmm0			; SSE41-NEXT: movdqa %xmm7, %xmm0
	; SSE41-NEXT: pxor %xmm10, %xmm0			; SSE41-NEXT: pxor %xmm10, %xmm0
	; SSE41-NEXT: movdqa %xmm11, %xmm1			; SSE41-NEXT: movdqa %xmm11, %xmm1
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm1			; SSE41-NEXT: pcmpgtd %xmm0, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm1[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm1[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm11, %xmm0			; SSE41-NEXT: pcmpeqd %xmm11, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; SSE41-NEXT: pand %xmm3, %xmm4			; SSE41-NEXT: pand %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]			; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: movapd %xmm9, %xmm1			; SSE41-NEXT: movapd %xmm9, %xmm1
	; SSE41-NEXT: blendvpd %xmm0, %xmm7, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm7, %xmm1
	; SSE41-NEXT: pxor %xmm6, %xmm10			; SSE41-NEXT: pxor %xmm6, %xmm10
	; SSE41-NEXT: movdqa %xmm11, %xmm0			; SSE41-NEXT: movdqa %xmm11, %xmm3
	; SSE41-NEXT: pcmpgtd %xmm10, %xmm0			; SSE41-NEXT: pcmpgtd %xmm10, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm0[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm3[0,0,2,2]
	; SSE41-NEXT: pcmpeqd %xmm11, %xmm10			; SSE41-NEXT: pcmpeqd %xmm11, %xmm10
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm10[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm10[1,1,3,3]
	; SSE41-NEXT: pand %xmm3, %xmm4			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]			; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm6, %xmm9			; SSE41-NEXT: blendvpd %xmm0, %xmm6, %xmm9
	; SSE41-NEXT: packusdw %xmm1, %xmm9			; SSE41-NEXT: packusdw %xmm1, %xmm9
	; SSE41-NEXT: packusdw %xmm9, %xmm2			; SSE41-NEXT: packusdw %xmm9, %xmm2
	; SSE41-NEXT: packuswb %xmm2, %xmm13			; SSE41-NEXT: packuswb %xmm2, %xmm13
	; SSE41-NEXT: movdqa %xmm13, %xmm0			; SSE41-NEXT: movdqa %xmm13, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: trunc_usat_v16i64_v16i8:			; AVX1-LABEL: trunc_usat_v16i64_v16i8:
	▲ Show 20 Lines • Show All 644 Lines • Show Last 20 Lines